ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

百度智能云千帆开源Qianfan-VL视觉模型,多尺寸适配,全自研芯片赋能高效计算

时间:2025-09-23 03:25:42来源:小AI编辑:快讯

百度智能云千帆平台近日宣布,其自主研发的全新视觉理解大模型Qianfan-VL正式开源,并同步推出3B、8B、70B三个参数规模的版本。该系列模型专为企业级多模态应用场景设计,在基础通用能力的基础上,针对OCR识别、教育垂直领域等高频需求进行了深度优化,旨在为不同规模的企业和开发者提供更高效的视觉理解解决方案。

Qianfan-VL系列模型的开发依托于百度自研的昆仑芯P800芯片,该芯片为模型提供了强大的算力支持,能够高效处理海量数据与复杂算法。模型研发团队基于开源模型进行二次开发,并在昆仑芯P800上完成了全流程计算任务。这一技术组合不仅优化了计算效率,还使模型在通用和垂类任务评测中达到了行业领先水平。

在模型设计上,Qianfan-VL采用了先进的多模态架构,并通过持续预训练和三大技术创新实现了领域增强的通用视觉-语言能力。其核心训练方案包括创新的四阶段策略,在保持通用能力的同时,显著提升了领域特定任务的表现。团队构建了面向多模态任务的大规模数据合成管线,覆盖文档识别、数学解题、图表理解等核心任务,为模型训练提供了高质量的数据支持。

Qianfan-VL系列模型具有三大显著特点。首先,多尺寸版本设计满足了不同场景的需求,3B、8B、70B三种规格可适配从轻量级到企业级的各类应用。其次,8B和70B模型支持通过特殊token激活思维链能力,能够处理复杂图表理解、视觉推理、数学解题等任务。最后,模型在OCR全场景识别和复杂版面文档理解方面表现突出,可精准识别手写体、数学公式、自然场景文字,并实现文档智能问答与结构化解析。

在性能评测中,Qianfan-VL系列模型展现了卓越的实力。通用能力基准测试显示,随着参数规模的增加,模型在视觉理解、专业领域问答等任务中的表现显著提升,尤其在ScienceQA等专业问答测试中表现突出。在OCR与文档理解领域,模型在OCRBench等基准测试中成绩优异,能够自动分析版面元素,精准解析表格和图表。数学解题方面,8B和70B模型在MathVista-mini、MathVision等测试中表现亮眼,可实现几何推理、公式识别和分步求解。

实际应用案例进一步验证了Qianfan-VL的实用性。在OCR识别场景中,模型可精准提取卡证票据信息并完成结构化处理;在数学推理场景中,能够从复杂图表中提取关键信息并进行数据分析;在文档理解场景中,可自动解析表格和图表,实现智能问答。模型还可应用于图表分析、视频理解等领域,展现出广泛的适应性。

目前,Qianfan-VL系列模型已全面开源。即日起至10月10日,用户可在百度智能云千帆平台免费体验8B和70B版本。模型的相关资源包括Blog、GitHub主页、Hugging Face页面以及技术报告,用户可通过登录平台选择Qianfan-VL-8B或70B进行在线测试,或访问GitHub获取详细技术文档。

更多热门内容
人工智能投资新视角:大模型进阶智能体,场景化应用前景展望
今天分享的是:人工智能专题:从大模型到智能体——人工智能+场景的投资展望 报告共计:31页 《人工智能专题:从大模型到智能体——人工智能+场景的投资展望》报告首先探讨“什么是真正的人工智能”,指出大语言模型如…

2025-09-23

京东王竞凡:智能机器人高速发展,中国机器人市场2028年或达千亿
来源:睿见Economy 9月16日-17日,聚合智能产业发展大会(2025)在武汉市举行,主题为“协同融合创新链产业链推动聚合智能产业发展”。 王竞凡指出,目前智能机器人处于一个前所未有的高速发展道路,智…

2025-09-23

上海创智学院周年庆发布模速空间AI工作站 助力教育大模型终端化应用
会上,学院正式发布标杆成果——模速空间AI工作站,该设备搭载上海“启创·InnoSpark”人工智能教育大模型,以“端侧算力+教育大模型+场景化应用”三位一体架构,为教育领域注入智能新动能。该工作站由英和智临…

2025-09-23

国内AI大模型迈向“用起来”阶段,央(国)企集约共享大模型前景与挑战并存
通信世界网消息(CWW)目前,国内AI大模型产业正从“百模大战”的“建起来”阶段,向“行业爆发”的“用起来”阶段过渡。权威机构发布的数据显示,2025年一季度国内大模型市场规模预计突破495亿元人民币,但AI…

2025-09-23

百度智能云开源Qianfan-VL视觉模型,多尺寸适配+自研芯片助力多场景应用
在 ScienceQA 等专业问答测试中,精准度表现突出;多模态任务如 RefCOCO 等,物体识别与关联能力优异;同时,在各类通用基准测试里,相较主流模型,整体表现也颇为亮眼,充分彰显出在视觉理解通用能力上…

2025-09-23

工业互联网浪潮涌动 中国电信云网融合赋能工业智能化升级
长期以来,中国电信立足自身优势,坚持以云网融合为核心抓手,在持续夯实工业智能底座、筑牢产业数字化根基的同时,不断加大科技创新力度,通过技术突破与模式创新,为工业企业提供全链条智能化解决方案,有效赋能工业生产全…

2025-09-23

微店24参会华为全联接大会2025,借昇腾之力赋能实体零售智慧升级
本次大会以“跃升行业智能化”为主题,聚焦人工智能技术与产业融合的创新实践,为实体零售行业的数字化转型提供新动能。华为作为全面智能化战略的倡导者和实践者,致力于通过领先的产品与解决方案,携手伙伴共建健康生态。 …

2025-09-23