ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

AI拍照解题技术新突破,传音控股相关研究成果入选计算机视觉顶会CVPR 2026

时间:2026-04-04 17:43:46来源:互联网编辑:汪淼

传音持续深化AI领域的产学研协同,积极推动与国内外知名高校的深度合作,围绕AI视觉、语音、语言与大模型等方向推进协同创新。日前,传音TEX AI中心与中山大学、穆罕默德·本·扎耶德人工智能大学(Mohamed bin Zayed University of Artificial Intelligence,简称MBZUAI)联合开展的“拍照解题”项目研究取得重要进展,相关成果论文已被计算机视觉领域的国际顶级学术会议CVPR 2026正式录用

CVPR是IEEE主办的计算机视觉与模式识别领域的顶级会议,是中国计算机学会(CCF)推荐的A类会议,它与ICCV、ECCV并称为计算机视觉领域“三大顶会”。据最新数据,CVPR 2026共有逾三万人投稿,在进入评审流程的16,092篇有效文章中,最终接收率仅25.42%,每篇论文都必须通过3-5位全球顶尖专家的双盲评审。

近年来,AI大模型在逻辑推理与复杂问题求解方面的能力持续提升,但在实际应用中,其在复杂数学题上的处理表现仍存在不足。例如,解题结果正确但推理过程存在逻辑漏洞,或步骤看似完整但实际推导错误。这类问题在学习场景中尤为关键,相较于答案本身,推理过程的准确性更直接影响学生对知识的理解与掌握。

针对这一问题,传音TEX AI中心与中山大学、MBZUAI团队合作,开发了CARE(Contrastive Anchored REflection)技术,从训练机制上对传统路径进行了优化。不同于仅以“结果对错”作为反馈信号的方式,CARE技术将关注点前移到推理过程本身,重点引入“高质量错误样本”——即那些接近正确但存在关键步骤偏差的解题路径。通过将这类样本与标准解法进行对比分析,并结合反思式重推理机制,模型能够识别具体错误环节,并完成自我修正,从而形成更稳定、连贯的推理能力。在引入反思机制后,模型对复杂问题的二次推理成功率由约10%–19%提升至76.6%,有效增强了面对复杂题目时的稳定性。

此外,CARE技术还引入“救援机制”:即使多次尝试均未得到正确结果,系统仍会从已有错误路径中筛选出“相对最优解”,作为进一步学习的起点,使模型在复杂问题下仍能持续优化推理能力。

在实际效果上,该方法显著提升了模型的解题质量。在MathVista(图像数学推理)测试中,CARE准确率比传统方法的68.9%高13.2个百分点,提升至82.1%;在MMMU-Pro(多学科综合推理)测试中,CARE将准确率从36.4%提升至46.7%。整体来看,CARE 比传统方法平均提升 4.6 个百分点。

目前,该技术已进入产品化阶段,并逐步应用于传音手机智能助手中。基于CARE优化后的能力,传音手机智能助手拍照解题功能在输出结果时不仅能够提供答案,还能呈现更清晰、结构更完整的解题步骤,在面对多步骤推导问题时也更不容易出现逻辑中断或错误累积。这种“过程可解释”的能力,使AI从单纯的解题工具,进一步向“可辅助理解”的学习工具演进。

拍照解题是传音在 AI 教育应用上的重要方向。在非洲、南亚等地区,教育资源相对稀缺,部分家庭在课后辅导方面仍面临一定困难。传音推出的拍照解题功能为学生提供即时的解题思路与步骤解析,在一定程度上弥补学习支持资源的不足,帮助用户更高效地理解知识点,提升学习效率,让前沿科技真正服务于每个人的生活。

随着AI技术持续向真实场景渗透,AI已经成为理解用户需求、创造新体验的重要工具。传音积极将 AI 能力深度融入社交、出行、健康、教育等高频场景,让技术从“可用” 变为“真实可感”,实现用户的体验升级。此次联合研究成果的落地,也为AI在教育场景中的进一步应用提供了新的技术路径与实践基础。通过持续推进以用户需求为导向的技术创新,并深化与高校的协同研发,传音正不断将前沿AI能力转化为可落地的产品体验,让更多用户能够享受到AI带来的便利。

更多热门内容
618开门红客流量同比增长60% 618京东MALL成线下狂欢主场
今年618期间,京东MALL位于上海、香港、沈阳的三家门店将陆续开业,收获行业关注度的同时,成为各地消费者期待的线下“打卡地”。截至今年京东618,京东MALL在全国范围内累计营业门店数将达到30家。在618开门红期间,京东MALL全国门店成交额同比增长53%、客流同比增长60

2026-06-02

学习优选,成长护航:基于人体工学的乐歌T4电动升降学习桌深度评测
为孩子挑选学习用电动升降桌,核心要兼顾成长适配、护姿护眼、安全实用三大需求。乐歌T4作为专为学习场景打造的电动升降桌,从幼小衔接至初中全周期适配,依托专业设计与扎实参数,成为学生群体的理想选择,以下从五大专属维度结合参数详细解析。一、成长周期适配维度乐

2026-06-02

2026年大六座混动SUV巅峰对决:哪个混动suv乘坐体验好不晕车?
周末想带父母孩子去郊外露营,却因第三排“蜷着坐”、后备厢塞不下儿童车而扫兴?这些困扰多孩和三代同堂家庭的出行难题,在2026年已被彻底终结。随着新能源技术进入成熟期,30-40万混动suv市场迎来了真正意义上的“全家舒适平权”时代。主流车企纷纷推出基于原生大六座

2026-06-02

618演唱会手机推荐:一眼看清舞台细节的影像旗舰精选
导语如今智能手机的影像能力已成为核心竞争力,潜望长焦、高阶防抖、暗光降噪、场景化收音等专业技术持续迭代普及,全焦段拍摄体验不断升级,大电池与长续航配置也充分适配长时间拍摄、录制的使用场景。在人员密集、光线多变、拍摄距离跨度大、环境嘈杂的演唱会现场,手

2026-06-02

首发内测招募!不怕泄密的安全AI来了,前200名体验官专享多重福利
你曾在AI的对话框里输入过自己的薪资、体检报告,或者是公司的未公开财报和核心代码吗?在点击“发送”的那一刻,很多人可能都会心里咯噔一下:这些隐私,AI公司看得见吗?这绝不是杞人忧天。目前大多数主流大模型,默认都会将用户的对话数据用于后台的训练和优化。哪怕你

2026-06-02

腾讯QQ未保体系升级“新芽守护行动”,为青少年筑起网络安全护栏
当数字技术深度融入青少年的学习、社交与成长,如何从源头上构建安全、健康的网络环境,已成为全社会共同关注的命题。6月1日,腾讯QQ在北京举办“QQ新芽守护行动发布暨青少年网络保护研讨会”,正式宣布将多年的未成年保护实践升级为“QQ新芽守护行动”,通过完善产品功

2026-06-02

三星Galaxy手机闪耀618:选购热门旗舰的黄金窗口期
每年618都是手机市场换机需求集中释放的窗口期,今年也不例外。目前,各大手机厂商的618大促活动已经进入高潮阶段。其中,三星商城的“618来就赚”活动推出了一系列促销政策,优惠力度空前,正是大家出手的黄金时机。在此背景下,从Galaxy S系列直板旗舰到Galaxy Z系列

2026-06-02

2026年40w散热器权威实测对比制冷效果与游戏手持场景
随着手机游戏画质不断提升,散热器已经成为玩家手中的“第三只手”。在电商平台搜索“40w散热器”,你会发现从几十元到两百多元的产品层出不穷,但真正能兼顾极限制冷、不干扰握持、低噪音的并不多。为了回答“2026年哪款40w散热器最适合长时间手持游戏”,我们在25℃恒

2026-06-02

AI 语音客服 TTS 怎么选?别被 Demo 音色带偏
很多企业第一次试用 AI 语音客服,都会先试听 TTS 音色。声音自然、语气亲切、没有机械感,确实会带来好印象。但真正上线后,一些问题往往才会出现:长句断句不自然、金额日期读得含糊、用户打断后接不回来、拒绝场景语气不合适、通话结果无法进入人工承接。所以,TTS

2026-06-02

吹来一阵小吉风 —— 小吉 × 小红书 IP 战略合作,演绎家居美学新范式
当家电不再是冰冷的功能载体,而是家居空间的美学注脚与生活态度的表达者,小吉以十余年美学科技积淀,携手小红书开启深度 IP 战略合作,正式将「小吉风」从一种审美偏好,升级为可感知、可体验、可落地的生活方式 IP。双方以 “吹来一阵小吉风”为核心,构建从小红书 I

2026-06-02