ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

震撼!华大LUSH基因序列比对加速工具集再次突破计算极限!

时间:2022-01-21 22:02:56来源:互联网编辑:星辉

2017年5月,19岁的世界围棋第一人柯洁九段在和AlphaGo的围棋终极人机大战以0:3完败,这也是人类顶尖高手与这台机器之间的最后一次较量,同年10月 《Nature》杂志发表了超过它所有之前版本的AlphaGo Zero。这一成就向世界展示了建立系统来自学完成复杂任务的可能性,而其背后所代表的是运算能力,是计算机科学的分支领域--高性能计算(High Performance Computing),其实际应用不仅成为了国家综合实力的体现,更给人们的日常生活带来了改变,目前该技术已在航空航天、核试验模拟、天气预报、生命科学、高新制造(汽车、微电子)等领域取得了广泛应用。

以生命科学领域举例,随着生命遗传密码(基因组)的不断破解,人的生老病死这一复杂事情可以用数字化的方式具体呈现,以期实现疾病的精准预测、诊断和治疗,让人们远离传感染疾病、防控出生缺陷、肿瘤和心脑血管疾病,提升人均预期寿命,并大幅度降低社会卫生总负担。

近二十年来,个人全基因组测序的成本以“超摩尔定律”的速度下降,而高性能计算在测序数据分析方向的应用也发生了翻天覆地的变化。目前全球主流的基因组测序数据分析工具是Broad Institute开发的免费开源工具集GATK(Genome Analysis Toolkit),该项生命科学领域公认的最佳工作流程完成一个人的全基因组(Whole Genome Sequencing,WGS)30X数据分析需要1800分钟。深耕于基因组学20多年的华大基因在基因组高性能计算领域再获突破性进展,于近日成功实现6分钟完成30X WGS全流程的分析任务,相较于GATK标准计算时长提速300倍。

image.png

根据NIH公布的最新资料,随着测序技术的发展,测序成本以超摩尔定律下

https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data

6分钟完成30X WGS任务是由华大基因自主研发的LUSH工具集实现的,打破了该软件在2020年1月创造的15分钟极限速度。其中的黑科技正是采用了全新的底层架构设计,提供了基于中央处理器和图形处理器相结合进行基因数据分析的高性能加速方案,在降低集群计算资源消耗、提高检出速度的同时,实现了全程自动化、信息化,有记录可回溯,可以更好地用于精准医学的应用场景。

image.png

LUSH工具集加速的全新底层架构逻辑

LUSH工具集提供了一种“CPU+GPU”的高并行软硬件解决方案,基于经典流程中的软件模块BWA、SAMTOOLS和GATK,利用GPU的通用运算技术,通过计算引擎和加速引擎的全新架构设计,实现算法优化和并行化处理,并结合华大自主研发的超高通量测序仪,完成碱基数据流的超高速分析,最终获得准确的分析结果。

LUSH工具集加速流程示意图

正是因为生命数字化进程需要严谨的科学精神,而其应用场景主要体现在精准医疗、健康管理等与人类健康有着息息相关的领域,因此不同于其他高性能计算领域,基因组数据分析对精度有极高的要求。而实际上高性能和准确性并不能完全兼得,数据范围、分布和浮点精度、峰值性能和内存都会影响算法的选择,尤其涉及到唯一最优解和近似解的算法可能大相径庭。LUSH工具集正是通过在经典流程算法的基础上利用了其全新设计的底层架构进一步减少了中间结果的读写,并利用CPU实现基因分析任务的智能分发,利用GPU数千计算核心实现百万任务的极速并行处理,同时解决了经典流程计算密度较高、频繁地存储器访问等问题,经过测试其标准品的准确性结果与经典流程一致,高达99.86%,使得其可以在计算结果的准确性与极速性上得以平衡。

更优越的性能、更低的成本和更高效的检出是所有高性能计算应用领域的研发追求目标。对加速组件的持续研发源自对速度无止境的追求,正如手机芯片行业的发展是随着移动端需求的旺盛,技术才得以不断地迭代和进步。从基因组学基础研究到临床研究及应用,实现测序工具的自主可控的同时也需要实现数学方法上的自主研发,而不只是追求芯片的底层下潜开发。对后者是无止境的追求,而只有前者的完全可控才能实现从跟随模仿到真正超越的可能,从核心算法的研发上助力我国精准医疗自主可控的发展进程。

更多热门内容
亚信科技联合清华AIR等发布全球首部 AI-RAN商业展望白皮书
2025年9月12日,亚信科技联合英特尔、清华大学智能产业研究院(AIR)、香港理工大学人工智能高等研究院、IEEE,正式发布《AI-RAN面向垂直行业的商业展望白皮书》(以下简称“白皮书”)中英文版!该白皮书已被学术网站arXiv收录。作为全球首部系统梳理 Private AI-RAN 商业可

2025-09-12

聚焦万亿GDP 城市存量改造:蜜蜂公司十周年官宣BEEPLUS等多品牌战略
9月10日,“拾光筑梦·向远而行——蜜蜂公司十周年成长礼”在深圳盛大启幕。活动现场汇聚了众多重要嘉宾,包括中国企业家协会俱乐部主席、招商银行原行长马蔚华,香港浸会大学第三任校长、北师香港浸会大学BNBU创校校长吴清辉教授,北师香港浸会大学校长陈致教授,广东

2025-09-12

三星Galaxy Tab S10 Lite:为你开启多彩校园「星」生活!
随着日历翻开下一篇章,新学期就像一本空白的画卷,等待我们书写属于自己的故事。粉笔的洁白、书页的墨香、教室外的绿荫……校园的每一处风景,都是青春调色盘上的一笔斑斓;课堂与笔记,更是描绘未来的底色。在这样一个梦想重新启航的时刻,你更需要一个像三星Galaxy Ta

2025-09-12

开放合作 共创未来 2025服贸会开放合作主题论坛举行
9月10日,全球服务贸易领域规模最大的综合性展会——2025中国国际服务贸易交易会开幕。10日下午,2025服贸会开放合作主题论坛在石景山首钢园盛大开启。本次论坛以“开放合作 共创未来”为主题,以先进科技服务会议全流程,来自澳大利亚、瑞士、新西兰、法国、芬兰、韩国

2025-09-12

6支科研团队荣获第五届 “奥林帕斯奖”,百万奖金落定!
9月12日,在2025全球数据存储教授论坛上,第五届“奥林帕斯奖”获奖名单正式揭晓。来自国内外的6支顶尖科研团队,凭借其在数据存储领域的技术突破,分别斩获1项奥林帕斯奖与5项奥林帕斯先锋奖。其中,清华大学武永卫教授团队因创新性提出“以存换算”技术方案,解决大模

2025-09-12

终于知道国补为什么抢不到了!国补政策9月13日最新消息:国补重启后恢复继续,最新国补领取方法入口操作教程
2025 年国家补贴政策(简称 “国补”)已全面落地,以 “推动以旧换新、促进绿色消费” 为核心,覆盖家电、手机数码、汽车三大主流消费领域,成为提振消费信心的重要抓手。据悉,此次国补全年安排资金 3000 亿元,通过超长期特别国债分批次下达,目前第三批 690 亿元已于

2025-09-12

JDG Paraboy伞兵携iPhone 17专属福利空降京东 24小时预约破500万
9月10日,Apple正式发布了AirPods Pro 3、三款Apple Watch以及全新的iPhone 17系列,引发了一众果粉的期待。此前被Apple官方邀请参与发布会的JDG Paraboy伞兵(朱伯丞)终于解锁了新身份——京东Apple产品福利官,并给果粉们带来了空投福利:买iPhone 17系列可享至高2100

2025-09-12

攀升国产打印机:高清打印+双面节能更实用
攀升腾龙 BL2236 Pro 黑白激光多功能打印机集打印、复印、扫描于一体,基于龙芯自主芯片开发,从硬件到软件实现全国产化,安全稳定且安全可控。它专为对信息安全要求极高的党政、金融、能源等领域设计,也适用于教育、医疗等行业,专为国产化替代而生;同时全面适配国产

2025-09-12

从RE+ 2025看未来,海辰储能AIDC储能解决方案打破“能耗焦虑”
9月8日-11日,全球可再生能源领域的年度盛会——RE+ 2025在美国拉斯维加斯举行。海辰储能携全场景产品矩阵与创新解决方案重磅登场,并发布了面向AI数据中心(AIDC)的储能解决方案:由∞Power 6.25MWh 8h锂电长时储能系统、∞Power N2.28MWh 1h钠电储能系统和AIDC储能系统

2025-09-12

让AI深度融入6G,高通钱堃:携手产业伙伴参与推动国际标准的制定
在移动通信技术飞速发展的今天,5G等标准正在快速演进。去年6月,5G-Advanced首个标准版本Rel-18正式完成,按照计划,Rel-19预计将于今年晚些时候完成。而5G-Advanced作为5G技术发展的全新阶段,也将为6G发展奠定基础。在近日举办的第十四届中国知识产权年会上,高通公

2025-09-12