阶跃星辰生态开放日：多模态推理与AI Agent成新焦点-智能汽车-ITBear科技资讯

在人工智能领域，一场关于技术革新与生态构建的盛宴于近日拉开帷幕。在这场备受瞩目的生态开放日上，阶跃星辰，一家被业界誉为“AI六小虎”的成员，以其独特的姿态和前瞻性的布局，成为了全场焦点。

回顾2024年，阶跃星辰无疑是模型层竞争中的佼佼者。这家起步较晚的公司，却以惊人的速度发布了涵盖语言、语音、视觉、推理等多个模态的11款模型，展现了其在多模态技术上的深厚积累。

阶跃星辰的模型矩阵，如同一颗颗璀璨的星辰，照亮了AI探索的征途。

阶跃星辰的CEO姜大昕曾透露，公司自成立之初便明确了AGI（通用人工智能）的发展路径：从单模态到多模态，再到多模态理解和生成的统一，最终迈向世界模型和AGI。而2024年，正是阶跃星辰迈向多模态关键节点的一年。

然而，在阶跃星辰开启“多模态理解和生成的统一”探索之前，一条名为DeepSeek的“鲶鱼”搅动了整个大模型赛道。DeepSeek不仅通过API价格战将大模型价格拉低至1元/百万tokens，还开源了推理模型R1，引发了业界对Scaling Law暴力美学的深刻反思。

DeepSeek的崛起，对阶跃星辰等六小虎构成了不小的挑战。R1等高性能模型的开源，让闭源模型的商业化之路变得更加艰难。同时，R1采用的低投入强化学习训练范式，也让六小虎的高估值和烧钱模式受到了质疑。

面对DeepSeek的冲击，阶跃星辰选择了以开源作为回应。在R1发布后不久，阶跃星辰便开源了两款多模态模型，这一举动被视为其捍卫技术地位的无声宣言。这两款模型，一款是参数量达到300亿的图生视频模型Step-Video-T2V，另一款则是1300亿参数的语音交互模型Step-Audio，它们与DeepSeek注重的文本模型形成了鲜明对比。

阶跃星辰开源的多模态模型，无疑为行业注入了新的活力。

在探索AGI的征途中，阶跃星辰将多模态推理视为模型发展的重要方向。这一观点在行业内得到了广泛认同。百度集团执行副总裁沈抖就曾预测，行业的重心将从训练转移到推理，多模态将成为主流需求。

阶跃星辰在多模态推理模型上的进展令人瞩目。在生态开放日上，阶跃星辰宣布与清华大学联合研发的Open-Reasoner-Zero，这是首个从预训练模型直接进行大规模强化学习的开源推理模型，其效率是DeepSeek-R1-Zero的25倍。阶跃星辰还在推进一项内部项目——视觉推理模型，该模型能够实现视觉空间下的慢思考，能够理解和解答复杂的视觉问题。

阶跃星辰在多模态推理模型上的突破，为AI的发展开辟了新的道路。

在模型落地方向，阶跃星辰看好AI Agent的潜力。姜大昕认为，2025年将是Agent的爆发年。他提到，影响Agent发展的两个关键因素——多模态和慢思考，在2024年都取得了显著进展。阶跃星辰将Agent分为垂类Agent和智能终端Agent两大类，并积极与下游客户进行生态共创。

阶跃星辰的Agent合作生态，展现了其在智能终端和垂类领域的广泛布局。

在生态开放日的圆桌论坛上，旷视科技创始人印奇以自动驾驶公司“千里科技”董事长的身份亮相。他认为，目前最成功的AI产品仍是特斯拉和抖音，但大模型将为应用带来更大的市场空间。印奇的出席，无疑为这场生态开放日增添了更多看点。