ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

商汤发布日日新V6大模型,对标OpenAI,解锁10分钟视频全帧率解析

时间:2025-04-11 09:26:10来源:ITBEAR编辑:快讯团队

商汤科技在近期举办的2025技术交流日活动中,震撼发布了其全新迭代的大模型体系——“日日新SenseNova V6”(简称:日日新V6)。据商汤科技透露,该体系通过多模态长思维链训练、全局记忆技术和强化学习的革新性突破,成功构建了业界领先的多模态推理能力,并有效降低了成本。

日日新V6的多模态训练效率与语言训练相当,均达到了业内的最优水平,推理成本亦是如此。尤为其推出的轻量级全模态交互模型SenseNova V6 Omni,在国内多模态交互领域树立了新的标杆。日日新V6还涵盖了国内首个能够深度解析10分钟中长视频的大模型,其性能与Gemini 2.5 Turbo不相上下,堪称同类最强。

商汤科技董事长兼首席执行官徐立表示:“AI的价值,在于其在日常生活中的广泛应用。商汤的日日新V6将跨越多模态的界限,探索推理与智能的无限潜能。”

在复杂的文档处理场景中,日日新V6凭借其强大的多模态推理能力,为用户提供了高效的解决方案。以保险理赔为例,该模型能够迅速分析理赔材料,判断其是否符合要求,并准确识别出材料缺失、乱开药或乱检查等问题。

对于小额理赔而言,尽管金额不大,但处理流程往往繁琐且耗时(3-7天)。而日日新V6则能够自主检测风险提示,进行交叉验证,最终为用户提供详尽、多维的结论,从而实现了从模型到客户使用的无缝对接。

商汤科技在多模态强化学习方面取得了重大突破,构建了面向多种图文任务的混合增强学习框架。该框架基于不同难度分级和多奖励模型的强化学习训练,极大地提升了模型的性能。

凭借“全局记忆”技术,日日新V6打破了传统模型对短视频的限制,能够支持10分钟级视频的全帧率解析。用户不仅可以获得视频的精彩内容智能剪辑,还能保留住珍贵的瞬间。

对于游戏玩家而言,日日新V6同样具备强大的吸引力。它能够理解游戏录屏中的精彩内容和值得记录的时刻,并剪辑出高光时刻。同时,用户还可以自定义生成解说文案,分享游玩经验和精彩操作。

商汤科技自研的技术能够将视觉、听觉和语言信息以及时间轴逻辑进行对齐,形成多模态统一时序表征。通过细粒度级联信息压缩和内容敏感的动态过滤,实现了长视频的高比例压缩,10分钟视频可以压缩到16K tokens,同时保留关键语义。

随着日日新SenseNova V6的发布,商汤科技的实时交互融合大模型也升级至SenseNova V6 Omni。该模型在角色扮演、翻译点读、文旅导游、讲解绘本、数学讲解等多个场景下进行了深度优化。以翻译点读为例,SenseNova V6 Omni能够让用户通过手指实现精准的空间交互,并理解局部与全局信息的关系。

SenseNova V6 Omni拥有更加人性化的感知和表达能力,以及情感理解能力,已在具身智能等多个领域实现了多行业、多场景的落地应用。整合日日新SenseNova V6的全部能力,商汤科技还推出了全新的商量APP。用户只需通过一个入口,即可享受文字、图像、视频等多种模态的流式交互体验。

更多热门内容