ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

豆包大模型1.6-vision亮相,视觉深度思考能力再升级

时间:2025-09-30 16:31:58来源:互联网编辑:快讯

火山引擎近日宣布,豆包大模型家族迎来重要更新——豆包大模型1.6-vision正式上线。这一版本是该系列中首个具备工具调用能力的视觉深度思考模型,标志着多模态技术实现新突破。

据技术团队介绍,1.6-vision版本在通用多模态理解与推理能力上显著提升。该模型不仅支持更复杂的视觉场景解析,还能通过Responses API实现与外部工具的深度交互,为智能系统开发提供更灵活的解决方案。

回顾今年6月的FORCE原动力大会,火山引擎曾集中发布多项技术成果。当时同步推出的豆包大模型1.6版本,已展现出强大的文本处理能力。而此次发布的视觉专项升级,则进一步补全了多模态技术矩阵。

同期亮相的还有豆包·视频生成模型Seedance 1.0 pro,该模型在动态画面生成领域取得突破。豆包·语音播客模型与实时语音模型也完成全量上线,形成覆盖文本、视觉、语音的完整AI技术体系。

技术专家指出,1.6-vision版本的核心优势在于其深度思考机制。通过构建视觉-语言联合推理框架,模型能够模拟人类分析问题的逻辑链条,在医疗影像诊断、工业质检等场景中展现应用潜力。

更多热门内容
蚂蚁集团开源Ring-1T-preview大模型,AIME等多测试中表现亮眼
在 AIME 25 测试中,Ring-1T-preview 获得 92.6 分,超越了所有已知开源模型及 Gemini 2.5 Pro,并且接近GPT-5(无工具使用)的 94.6 分。 蚂蚁百灵团队表示,…

2025-09-30

蚂蚁集团开源Ring-1T-preview:预览版性能卓越,正式版训练正酣
在 AIME 25 测试中,Ring-1T-preview 获得 92.6 分,超越了所有已知开源模型及 Gemini 2.5 Pro,并且接近GPT-5(无工具使用)的 94.6 分。 蚂蚁百灵团队表示,…

2025-09-30