在2025年世界人工智能大会WAIC的盛会上,商汤科技惊艳亮相,发布了一系列创新成果,其中包括“日日新SenseNova V6.5”大模型体系、“悟能”具身智能平台,以及对旗下明星产品商汤小浣熊的智能体升级。
日日新V6.5是此次发布会的重头戏,该版本在强推理、高效率以及智能体三大核心能力上实现了显著提升。尤为引人注目的是,它率先突破了图文交错思维链技术,这一技术突破使得模型能够像人类一样,在思考过程中结合图像与文字,大大增强了理解和推理能力。通过改进多模态模型的融合架构,V6.5相比前代V6.0在性价比上有了显著提升,其文本推理和多模态推理能力已经超越了Gemini 2.5 Pro和Claude-4 Sonnet,多模态交互能力也优于Gemini 2.5 Flash和GPT-4o。
对于为何选择发布V6.5而非直接跳到V7版本,商汤科技董事长兼CEO徐立给出了解释。他提到,多模态思维链构造数据还有巨大的扩充空间,利用商汤在视觉感知领域的优势,结合视觉与文本关系的建立,可以进一步提升基模型的核心能力。
基于日日新V6.5的多模态数据分析能力,商汤小浣熊也迎来了全面升级。新版本的小浣熊支持多模态复杂输入、深度融合分析及多模态结果输出,在数据分析和智能体领域的表现已达到国际标杆Claude 4 Opus的水平,远超OpenAI o3等模型。商汤还推出了针对教育和金融领域的定制版本,以满足不同行业的需求。
在教育领域,商汤小浣熊教育版能够智能分析学生的学习表现、课程效果及行为模式,已覆盖500余所院校,惠及数十万师生。通过精准的数据分析,它帮助学生提升了学习效率,降低了学业焦虑,并显著提高了课堂参与度和资源利用效率。在金融领域,小浣熊金融版则提供了知识助手、智能问数以及多模态智能理赔解决方案,为金融行业带来了“人机协同”的智能决策新范式。
“悟能”具身智能平台是商汤科技的另一项重要发布。该平台以商汤的具身世界模型为核心,结合强大的端侧和云侧算力支持,能够为机器人和各种智能设备提供感知、视觉导航及多模态交互能力。在展会上,一个能够生动讲解PPT的人形机器人成为了全场焦点,它不仅能够自动翻页,还能回答观众的各种问题,展现了“悟能”平台的强大实力。
该平台还能够生成多视角视频,确保良好的时间一致性和空间一致性,使机器能够理解、生成和编辑真实世界。“悟能”平台还能构建面向人、物、场的4D真实世界,用户只需输入简单的提示词,模型就能自主进行位姿、动作骨架和指令的生成,展现了商汤在具身智能领域的深厚积累。
在商汤科技的展台上,各类基于日日新V6.5多模态大模型的智能硬件产品琳琅满目,包括能够与人类对弈的AI下棋机器人、给孩子讲解知识的随身学伴、宠物喂养AI毛绒玩具等,这些产品展现了AI在生活和学习中的广泛应用,为参观者带来了全新的体验。
商汤科技还展示了其AI基础设施——商汤大装置,以及“开悟”世界模型等各类AI原生应用。面向商业、文旅、智慧城市等领域的创新成果也悉数亮相,展示了商汤科技在推动AI技术进步和应用落地方面的强大实力。
徐立在发布会上表示,商汤科技始终致力于探寻人工智能的本质,以技术创新激发最大智能,推动AI从“工具”向“人”的跃迁,成为真正的生产力。此次发布的系列成果,正是商汤科技在这一道路上的又一重要里程碑。