ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

震撼!华大LUSH基因序列比对加速工具集再次突破计算极限!

时间:2022-01-21 22:02:56来源:互联网编辑:星辉

2017年5月,19岁的世界围棋第一人柯洁九段在和AlphaGo的围棋终极人机大战以0:3完败,这也是人类顶尖高手与这台机器之间的最后一次较量,同年10月 《Nature》杂志发表了超过它所有之前版本的AlphaGo Zero。这一成就向世界展示了建立系统来自学完成复杂任务的可能性,而其背后所代表的是运算能力,是计算机科学的分支领域--高性能计算(High Performance Computing),其实际应用不仅成为了国家综合实力的体现,更给人们的日常生活带来了改变,目前该技术已在航空航天、核试验模拟、天气预报、生命科学、高新制造(汽车、微电子)等领域取得了广泛应用。

以生命科学领域举例,随着生命遗传密码(基因组)的不断破解,人的生老病死这一复杂事情可以用数字化的方式具体呈现,以期实现疾病的精准预测、诊断和治疗,让人们远离传感染疾病、防控出生缺陷、肿瘤和心脑血管疾病,提升人均预期寿命,并大幅度降低社会卫生总负担。

近二十年来,个人全基因组测序的成本以“超摩尔定律”的速度下降,而高性能计算在测序数据分析方向的应用也发生了翻天覆地的变化。目前全球主流的基因组测序数据分析工具是Broad Institute开发的免费开源工具集GATK(Genome Analysis Toolkit),该项生命科学领域公认的最佳工作流程完成一个人的全基因组(Whole Genome Sequencing,WGS)30X数据分析需要1800分钟。深耕于基因组学20多年的华大基因在基因组高性能计算领域再获突破性进展,于近日成功实现6分钟完成30X WGS全流程的分析任务,相较于GATK标准计算时长提速300倍。

image.png

根据NIH公布的最新资料,随着测序技术的发展,测序成本以超摩尔定律下

https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data

6分钟完成30X WGS任务是由华大基因自主研发的LUSH工具集实现的,打破了该软件在2020年1月创造的15分钟极限速度。其中的黑科技正是采用了全新的底层架构设计,提供了基于中央处理器和图形处理器相结合进行基因数据分析的高性能加速方案,在降低集群计算资源消耗、提高检出速度的同时,实现了全程自动化、信息化,有记录可回溯,可以更好地用于精准医学的应用场景。

image.png

LUSH工具集加速的全新底层架构逻辑

LUSH工具集提供了一种“CPU+GPU”的高并行软硬件解决方案,基于经典流程中的软件模块BWA、SAMTOOLS和GATK,利用GPU的通用运算技术,通过计算引擎和加速引擎的全新架构设计,实现算法优化和并行化处理,并结合华大自主研发的超高通量测序仪,完成碱基数据流的超高速分析,最终获得准确的分析结果。

LUSH工具集加速流程示意图

正是因为生命数字化进程需要严谨的科学精神,而其应用场景主要体现在精准医疗、健康管理等与人类健康有着息息相关的领域,因此不同于其他高性能计算领域,基因组数据分析对精度有极高的要求。而实际上高性能和准确性并不能完全兼得,数据范围、分布和浮点精度、峰值性能和内存都会影响算法的选择,尤其涉及到唯一最优解和近似解的算法可能大相径庭。LUSH工具集正是通过在经典流程算法的基础上利用了其全新设计的底层架构进一步减少了中间结果的读写,并利用CPU实现基因分析任务的智能分发,利用GPU数千计算核心实现百万任务的极速并行处理,同时解决了经典流程计算密度较高、频繁地存储器访问等问题,经过测试其标准品的准确性结果与经典流程一致,高达99.86%,使得其可以在计算结果的准确性与极速性上得以平衡。

更优越的性能、更低的成本和更高效的检出是所有高性能计算应用领域的研发追求目标。对加速组件的持续研发源自对速度无止境的追求,正如手机芯片行业的发展是随着移动端需求的旺盛,技术才得以不断地迭代和进步。从基因组学基础研究到临床研究及应用,实现测序工具的自主可控的同时也需要实现数学方法上的自主研发,而不只是追求芯片的底层下潜开发。对后者是无止境的追求,而只有前者的完全可控才能实现从跟随模仿到真正超越的可能,从核心算法的研发上助力我国精准医疗自主可控的发展进程。

更多热门内容
贝壳董事会主席拟捐赠股票投入居住领域并长期运营
4月17日,贝壳最新公告显示,贝壳董事会主席、首席执行官及控股股东彭永东拟捐赠9,000,000股A类贝壳普通股。在承担相应的纳税义务后,此次捐赠股票将50%税后资金用于居住行业服务者及其家庭成员的医疗健康福利、50%税后资金用于应届毕业生等租客群体的租房帮扶。据悉,

2025-04-17

心所想AI所向,2025凯度品牌日暨春季新品发布会盛大举行
面对厨电行业智能化、品质化升级趋势。4月16日,凯度成功举办了以“心所想·AI所向”为主题的2025凯度品牌日暨春季新品发布会。凯度CEO柯漫、董事长傅平及明星生活家王真儿依次登场,通过理念分享、技术解读、场景演绎,全面诠释“高端新厨电”;重磅推出首个AI数字生命体“

2025-04-17

FF为股民而战:五大举措启动“非法做空阻击战”,打赢梦想实现战
4月17日,Faraday Future(简称“FF”)今日宣布,为捍卫股东价值与信心,公司正式启动五大核心举措,标志着“梦想实现战之潜在非法做空反击战”的正式打响。在公司昨日提交Form D文件后,市场上迅速传播出一系列谣言——包括错误声称Form D表明高管正在出售股份;股价跌破

2025-04-17

Mureka火爆海外,今日正式开放国内登陆入口和API
2024年4月,昆仑万维发布了第一代音乐生成模型Mureka V1(SkyMusic)。2024年8月14日,昆仑万维推出AI音乐商用创作平台Mureka。2025年3月26日,正式发布Mureka O1模型与Mureka V6模型。自Mureka上线以来,在海内外获得了非常好的市场反响,成为全球AI音乐界现象级产品。

2025-04-16

问界M8正式发布:车载小艺一路聊,随时随地问问小艺
4月16日,家庭智慧旗舰SUV鸿蒙智行问界M8正式发布上市,据悉其搭载的鸿蒙座舱重塑家庭出行交互新范式,车载智慧助手小艺能力再升级,展现出卓越的语音交互能力,有问题随时随地都可以问问小艺。全新的小艺搜歌功能,仅需告诉小艺歌词与背景信息,即可“搜”听到想听的歌

2025-04-16

掘金AI千亿赛道 金山云获战略股东持续增持
2025年4月16日,金山云(NASDAQ:KC,HKEX:3896)宣布,将公开发行18,500,000股美国存托股(ADS),每ADS代表该公司15股普通股。同时,金山云还授予ADS承销商购买额外美国存托股的30天选择权。并且,为了方便港美股两地投资者认购,投资者可以选择在此次发行中以普通股代替AD

2025-04-16

昂瑞微客户到底是谁,招股说明书闪烁其词
2025年3月28日,北京昂瑞微电子技术股份有限公司(下称“昂瑞微”)科创板IPO申请获受理,成为今年首家未盈利企业申报案例。作为射频前端芯片领域的“国产替代先锋”之一,昂瑞微凭借20.67亿元募资计划、50.88%的营收复合增长率引发市场关注。然而,对于其招股书中客户信

2025-04-16

昂瑞微靠低端产品增收,5G增长乏力,上市之路能走多远?
3月28日,北京昂瑞微电子技术股份有限公司(以下简称“昂瑞微”)向上交所递交IPO申请。作为主营射频前端芯片、射频SoC芯片的集成电路设计企业,其招股书披露的财务数据看似亮眼:2022-2024年累计营收47.19亿元,复合增长率达50.88%。但穿透数据表象可见,公司增长动能过

2025-04-16

小刀电动车怎么样?以科技、美学重构时尚标杆,三登“Ray时尚”TOP榜
凭借卓越的综合实力与对市场需求的精准洞察,近日,小刀电动车产品再次登上“Ray时尚”电动自行车TOP榜,以及“Ray时尚”可持续时尚企业。这是小刀电动车连续三年(2023-2025年)斩获殊荣。这一成就不仅体现了其产品在设计、性能、品质上的持续突破,更印证了品牌“科技

2025-04-15

京东新品成长“百千亿”计划:2025年将打造600款销售亿级新品
4月15日,2025京东新品年度盛典在北京举行,正式推出京东新品成长“百千亿”计划,即在2025年加码百亿流量和百亿资金,并围绕营销能力与数字能力全面升级,实现60000款新品年销售破百万、6000款新品年销售破千万、600款新品年销售破亿。在此次盛典活动上,京东宣布“京

2025-04-15