ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

阶跃星辰生态开放日:多模态推理与AI Agent成新焦点

时间:2025-02-21 21:14:41来源:ITBEAR编辑:快讯团队

在人工智能领域,一场关于技术革新与生态构建的盛宴于近日拉开帷幕。在这场备受瞩目的生态开放日上,阶跃星辰,一家被业界誉为“AI六小虎”的成员,以其独特的姿态和前瞻性的布局,成为了全场焦点。

回顾2024年,阶跃星辰无疑是模型层竞争中的佼佼者。这家起步较晚的公司,却以惊人的速度发布了涵盖语言、语音、视觉、推理等多个模态的11款模型,展现了其在多模态技术上的深厚积累。

阶跃星辰的模型矩阵,如同一颗颗璀璨的星辰,照亮了AI探索的征途。

阶跃星辰的CEO姜大昕曾透露,公司自成立之初便明确了AGI(通用人工智能)的发展路径:从单模态到多模态,再到多模态理解和生成的统一,最终迈向世界模型和AGI。而2024年,正是阶跃星辰迈向多模态关键节点的一年。

然而,在阶跃星辰开启“多模态理解和生成的统一”探索之前,一条名为DeepSeek的“鲶鱼”搅动了整个大模型赛道。DeepSeek不仅通过API价格战将大模型价格拉低至1元/百万tokens,还开源了推理模型R1,引发了业界对Scaling Law暴力美学的深刻反思。

DeepSeek的崛起,对阶跃星辰等六小虎构成了不小的挑战。R1等高性能模型的开源,让闭源模型的商业化之路变得更加艰难。同时,R1采用的低投入强化学习训练范式,也让六小虎的高估值和烧钱模式受到了质疑。

面对DeepSeek的冲击,阶跃星辰选择了以开源作为回应。在R1发布后不久,阶跃星辰便开源了两款多模态模型,这一举动被视为其捍卫技术地位的无声宣言。这两款模型,一款是参数量达到300亿的图生视频模型Step-Video-T2V,另一款则是1300亿参数的语音交互模型Step-Audio,它们与DeepSeek注重的文本模型形成了鲜明对比。

阶跃星辰开源的多模态模型,无疑为行业注入了新的活力。

在探索AGI的征途中,阶跃星辰将多模态推理视为模型发展的重要方向。这一观点在行业内得到了广泛认同。百度集团执行副总裁沈抖就曾预测,行业的重心将从训练转移到推理,多模态将成为主流需求。

阶跃星辰在多模态推理模型上的进展令人瞩目。在生态开放日上,阶跃星辰宣布与清华大学联合研发的Open-Reasoner-Zero,这是首个从预训练模型直接进行大规模强化学习的开源推理模型,其效率是DeepSeek-R1-Zero的25倍。阶跃星辰还在推进一项内部项目——视觉推理模型,该模型能够实现视觉空间下的慢思考,能够理解和解答复杂的视觉问题。

阶跃星辰在多模态推理模型上的突破,为AI的发展开辟了新的道路。

在模型落地方向,阶跃星辰看好AI Agent的潜力。姜大昕认为,2025年将是Agent的爆发年。他提到,影响Agent发展的两个关键因素——多模态和慢思考,在2024年都取得了显著进展。阶跃星辰将Agent分为垂类Agent和智能终端Agent两大类,并积极与下游客户进行生态共创。

阶跃星辰的Agent合作生态,展现了其在智能终端和垂类领域的广泛布局。

在生态开放日的圆桌论坛上,旷视科技创始人印奇以自动驾驶公司“千里科技”董事长的身份亮相。他认为,目前最成功的AI产品仍是特斯拉和抖音,但大模型将为应用带来更大的市场空间。印奇的出席,无疑为这场生态开放日增添了更多看点。

更多热门内容