ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

前线直击!这些新媒体趋势,你抓住了吗?

时间:2024-10-16 21:40:41来源:ITBEAR编辑:瑞雪

【ITBEAR】在AI领域,一场关于预训练的坚定承诺引发了广泛关注。2024年10月16日,零一万物公司的创始人兼CEO李开复公开表示,公司将坚持预训练的道路,绝不轻言放弃。同日,零一万物发布了其最新的MoE架构旗舰大模型——Yi-Lightning,这是该公司五个月来首次更新模型动态。

据李开复介绍,Yi-Lightning的训练成本极低,仅使用了2000张GPU,耗时一个半月,总成本约300多万美元,这仅是埃隆·马斯克的xAI成本的1%至2%。尽管成本低廉,但Yi-Lightning在性能上并未妥协。在加州大学伯克利分校LMSYS团队的Chatbot Arena总榜单上,Yi-Lightning与xAI的Grok-2-08-13模型并列第六,并超越了OpenAI的GPT-4o-2024-05-13。

在特定能力上,Yi-Lightning也展现出了强劲的实力。在中文能力上,它与OpenAI的最新模型o1-mini版本并列第二;在数学能力上,Yi-Lightning与Gemini-1.5-Pro-002并列第三,仅次于在数学和逻辑推理方面表现突出的o1。

在定价策略上,Yi-Lightning也创下了零一万物模型的最低定价:0.99元/百万Token,这一价格策略无疑将增强其在市场上的竞争力。

在发布会上,零一万物展示了Yi-Lightning在实用性方面的显著提升。与2024年5月发布的Yi-Large相比,Yi-Lightning的首包时间缩短了一半,最高生成速度提升了近四倍。在翻译场景中,Yi-Lightning的表现尤为突出,其翻译速度更快,且翻译结果更加准确、流畅。

李开复还揭秘了Yi-Lightning的训练策略,包括独特的混合注意力机制、动态Top-P路由机制以及多阶段训练等,这些策略共同提升了模型的性能和推理效率。

除了C端的生产力产品“万知”外,零一万物在B端商业化方面也取得了新的进展。他们推出了聚焦零售和电商等场景的AI 2.0数字人,该数字人背后是多模态协同训练的大模型,包括电商话术大模型、角色大模型和直播声音大模型。目前,AI 2.0数字人已经接入了Yi-Lightning,用户只需输入商品信息、声音性别和语调,即可生成相应的数字人形象。

面对大模型发展的深水区,李开复表示,尽管预训练的成本较高,但中国的六家大模型公司只要有足够的人才和决心,融资和芯片都不会是问题。他们将继续在预训练的道路上坚定前行。

更多热门内容
百度新专利出炉,目标代码查看与处理效率要起飞?
金融界2024年10月17日消息,国家知识产权局信息显示,北京百度网讯科技有限公司申请一项名为“目标代码查看以及接口代码处理方法和装置”的专利,公开号CN118778993 A,申请日期为2024年6月。 …

2024-10-17

讯飞星火医疗大模型:效能评估表现如何?结果亮了!
中证网讯(记者 王可)近日,中国信通院对包括GPT-4Turbo、GPT-4O等国际通用大模型,文心一言、通义千问、混元和智谱清言ChatGLM等国内通用大模型,以及灵医Bot、夸克健康助手、讯飞星火医疗大模…

2024-10-17

英伟达悄推新AI模型,能否与OpenAI GPT4一较高下?
Nvidia 采取了一项引人注目的举措,悄然推出了一种新的 AI 模型,该模型超越了现有的顶级 AI 模型,包括 OpenAI 的 GPT-4和 Anthropic 的 Claude 3.5 Sonnet…

2024-10-17