ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

谷歌发布DiffusionGemma文本扩散模型:本地推理提速 性能与开源优势并存

时间:2026-06-11 14:53:25来源:快讯编辑:快讯

谷歌近日发布了一款名为DiffusionGemma的全新开放AI模型,该模型基于文本扩散机制构建,在本地推理速度上实现了显著突破,较传统自回归模型提升达4倍。这一成果标志着扩散架构在大语言模型领域的应用迈出重要一步,为低带宽计算环境下的高效推理提供了新方案。

传统自回归模型(如GPT、Gemini)采用从左到右逐个生成Tokens的方式,在云端批处理场景中效率较高,但在本地设备上受内存带宽限制,常出现计算资源浪费问题。DiffusionGemma则通过扩散机制实现并行处理——模型从噪声中逐步去噪,同时优化所有Tokens的生成质量,这种设计使其在本地低带宽环境下展现出显著优势。

性能测试数据显示,DiffusionGemma在代码生成任务中表现亮眼:LiveCodeBench得分30.9%,BigCodeBench达45.4%,Humaneval更是高达89.6%,与Gemini 2.0 Flash-Lite形成有力竞争。数学推理能力尤为突出,在AIME 2025基准测试中取得23.3%的成绩,超越对比模型3.3个百分点,验证了扩散架构在复杂推理任务中的潜力。

该模型在生成效率方面同样表现卓越。采样速度达每秒1479个Tokens,开销仅0.84秒,且支持迭代优化功能,可在生成过程中主动修正错误,确保输出结果的稳定性与一致性。开源方面,DiffusionGemma采用Apache 2.0许可证,用户可通过Hugging Face平台下载模型权重,其能力与Gemma 4系列模型相当,但推理效率显著更高。

不过测试也暴露出部分短板:在科学推理GPQA Diamond基准中仅得40.4%,明显低于对比模型的56.5%;推理能力BIG-Bench Extra Hard测试得分15.0%,同样落后于21.0%的行业水平。这表明模型在特定领域的优化仍有提升空间。

英伟达官方测试进一步证实了硬件协同优势:在单块H100 GPU上,DiffusionGemma实现每秒1000个Tokens的生成速度;DGX Spark平台达每秒150个Tokens;DGX Station更突破至每秒2000个Tokens,约为同等条件下自回归模型的4倍。这种性能提升主要得益于扩散设计对Tensor Core并行计算能力的充分释放,为AI模型在边缘设备上的部署开辟了新路径。

更多热门内容
雷军6月13日将直播小米YU7八项测试挑战 慰问盐城测试场工程师
6月11日,小米创办人,董事长兼CEO雷军发文宣布,6月13日上午9点将直播小米YU7八项测试挑战。 雷军介绍,最近准备去盐城出差,慰问一下在盐城测试场工作的小米工程师们。还有一些项目是工程师额外加的,很有挑…

2026-06-11

2026年5月新机评测:红魔骁龙新芯领跑性能,OPPO ColorOS流畅度再封王
性能榜上,骁龙凭借更激进的“领先版”芯片与游戏手机的极致散热设计,成功收复失地;流畅榜则带来了新的启示:谁能利用软件更高效地调动硬件资源,谁就能在用户体验上赢得先机;而AI榜再次表明骁龙平台在NPU上的领先优…

2026-06-11

鲁大师5月新机榜单揭晓:红魔骁龙领先版称霸性能,流畅AI格局初定
紧接着流畅榜第四名vivo S60,硬件尽管是骁龙前代次旗舰芯片8s Gen3,不过在OriginOS6软件加持下,也取得了219.99的流畅分。 小米17 Max以362676分位列5月AI榜第三,同样…

2026-06-11

一加15T深度评测:小屏旗舰新标杆,iPhone用户无缝切换的理想之选
为了适配这颗顶级芯片的澎湃性能,一加15T配备了面积高达5150mm²的VC均热板,这是小屏旗舰史上的最大VC面积,配合2100W/(m·K)的超高导热石墨和双层3D立体双通道设计,组成了“冰河散热系统”。…

2026-06-11

雷军6月13日盐城直播实测小米YU7及GT版 八大测试环节引期待
【CNMO科技消息】小米汽车宣布,6月13日上午9点,雷军将在盐城试验场开启一场围绕小米YU7的实测直播。根据官方公布的信息,本次直播将采用“一镜到底”形式进行,涵盖8大测试环节,参与测试的车型包括小米YU7…

2026-06-11

鲁大师2026年5月安卓新机榜单揭晓:OPPO Reno 16 Pro流畅度夺冠 红魔系列AI性能抢眼
AI性能榜单头部席位仍被红魔系列机型占据,红魔11S Pro+拿下AI算力榜单第一名,红魔11S Pro、小米17Max分列榜单二三位。OPPO Reno16 Pro、OPPO Reno16跻身AI榜前五…

2026-06-11