ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

国产大模型“闪电”追平GPT-4o,只用2000张GPU?

时间:2024-10-18 15:31:33来源:ITBEAR编辑:瑞雪

【ITBEAR】在AI大模型领域,一场关于预训练成本的较量正悄然上演。近期,国内知名大模型公司零一万物发布了其最新的预训练旗舰模型——Yi-Lightning,号称“闪电”,在国际权威榜单LMSYS上一举超越了OpenAI今年5月发布的GPT-4o和Anthropic的Claude 3.5 Sonnet,排名世界第六,中国第一。

这一成就标志着中国大模型在全球竞争中取得了突破性进展,零一万物紧随OpenAI、Google之后,跻身全球前三大模型企业行列。

Yi-Lightning不仅在性能上有所提升,其推理速度也实现了质的飞跃。相比上半年发布的Yi-Large,首包时间减少了一半,最高生成速度提升了近四成,堪称“极速”。同时,该模型的推理成本也大幅降低,每百万token仅需0.99元,接近行业最低价。

Yi-Lightning的出色表现得益于零一万物在多个维度上的扎实储备,包括芯片人才、推理人才、基础架构人才和算法人才等。这使得零一万物在面对大模型预训练的高门槛时,依然能够坚持“模基共建”的战略,不断推动模型性能的优化和推理成本的降低。

在LMSYS Chatbot Arena总榜上,Yi-Lightning的成绩同样出众。它超越了国内外多个优质模型,包括xAI发布的Grok-2-08-13、智谱发布的GLM-4-Plus等,在中文分榜上与世界第二名的模型并列。在多轮对话、数学能力、代码能力等多个分榜上,Yi-Lightning也取得了世界前列的优异成绩。

零一万物之所以能够在短时间内取得如此显著的进步,与其独特的混合专家模型架构(MoE)和一系列技术创新密不可分。例如,Yi-Lightning采用了混合注意力机制(Hybrid Attention),旨在平衡模型在处理长序列数据时的性能和计算资源消耗。同时,动态Top-P路由机制的引入也使得Yi-Lightning能够更加智能地适应各种任务需求,实现“极速推理”。

随着Yi-Lightning的发布,零一万物在AI大模型领域的应用探索也进一步扩展。其最新推出的AI 2.0数字人产品已接入Yi-Lightning,在零售和电商等场景中展现出强大的实时互动能力和话术生成能力。某酒旅企业在接入该数字人直播后,GMV较此前上升了170%。

Yi-Lightning的推出不仅彰显了中国在大模型领域的强大技术实力,也为中国大模型公司的发展提供了新的思路。即坚持“模型+AI Infra+应用”三位一体的全栈式布局,以国际领先的基座模型为基础,积极探索企业级解决方案,推动整个大模型行业形成健康的生态。

目前,Yi-Lightning已上线Yi大模型开放平台(https://platform.lingyiwanwu.com/),每百万token仅需0.99元,支持开发者与企业客户轻松实现SOTA大模型自由。这一举措无疑将进一步推动大模型技术的普及和应用。

零一万物的成功也引发了对中国大模型行业未来发展的深入思考。在算力受限的情况下,中国基座模型的研发能力如何追赶国外顶尖大模型?零一万物的实践表明,通过技术创新和全栈式布局,中国大模型公司有望在全球竞争中脱颖而出,打造新质生产力。

展望未来,随着大模型技术的不断发展和普及,其应用场景也将更加广泛。零一万物将继续坚持“模基共建”的战略,不断探索大模型在各个领域的应用潜力,为推动人工智能技术的发展和应用贡献自己的力量。

更多热门内容
科大讯飞股价上涨5.0%,46.62元/股,后市如何?
10月18日,科大讯飞盘中上涨5.0%,截至14:34,报46.62元/股,成交42.69亿元,换手率4.35%,总市值1077.73亿元。 资料显示,科大讯飞股份有限公司位于合肥市高新开发区望江西路666号…

2024-10-18

百度再出手,申请大模型样本生成专利,目标样本批量造?
金融界2024年10月18日消息,国家知识产权局信息显示,北京百度网讯科技有限公司申请一项名为“基于大模型的样本生成方法、模型训练方法、排序方法、装置及设备”的专利,公开号CN 118779691 A,申请…

2024-10-18

百度集团-SW股价攀升,92.7元/股,投资者怎么看?
10月18日,百度集团-SW(09888)盘中上涨2.09%,截至13:45,报92.7元/股,成交3.52亿元。 百度集团股份有限公司是一家以人工智能和互联网搜索服务为主营业务的公司,拥有完整的人工智能技术…

2024-10-18

百度新专利来袭,数据处理效率要起飞?
金融界2024年10月18日消息,国家知识产权局信息显示,北京百度网讯科技有限公司申请一项名为“数据处理方法、装置、电子设备以及存储介质”的专利,公开号CN 118780400 A,申请日期为2024年6月…

2024-10-18

Arm全面设计助力生态,可持续AI数据中心怎么建?
三星晶圆代工厂的 2nm GAA 工艺专为满足严格的 HPC 和 AI 设计要求而设计,我们很高兴能够利用 Arm CSS 的灵活性和 Arm全面设计的优势来打造 AI CPU 芯粒平台,进一步推动超大规模…

2024-10-18

AI概念早盘走强,工业富联涨停在即,什么情况?
今日早盘,AI算力板块集体走高,龙头工业富联放量冲击涨停,午间涨超8%,市值重回5000亿上方。 消息面上,英伟达昨夜盘中一度刷新历史新高,带动美股芯片股普遍走高。据媒体报道称,英伟达未来一年的Blackwe…

2024-10-18