ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

华中科大研究新突破:AI借几何学习解锁空间理解新技能

时间:2025-10-22 22:32:45来源:互联网编辑:快讯

人工智能领域长期面临空间理解能力的瓶颈,即便最先进的多模态大模型也常在基础空间任务上出错。华中科技大学连世杰、吴长提团队联合多家研究机构,通过让AI系统学习几何知识,成功突破了这一技术壁垒。该研究成果以预印本形式发表于arXiv平台(编号arXiv:2509.24473v2),揭示了几何训练对空间智能提升的显著效果。

研究团队构建的Euclid30K数据集包含近3万个几何问题,涵盖平面几何与立体几何两大领域。数据收集过程中,研究人员发现现有数据集存在严重失衡:立体几何题目仅占现有资源的23%。为此,他们从Geometry3K、MMK12等开源库筛选优质题目,同时新增4500个立体几何问题,重点补充空间关系判断、动态运动分析等复杂题型。经过三阶段质量控制,包括图像去重、问题拆解和格式标准化,最终形成覆盖初中到高中全课程体系的数据集。

几何训练的核心价值在于其系统性。研究团队将几何问题视为空间规律的"训练场",通过GRPO强化学习框架,让AI模型在解题过程中掌握形状识别、空间推理和数值计算等综合能力。实验数据显示,经过几何训练的RoboBrain2.0-7B模型在VSI-Bench测试中准确率达49.6%,超越此前48.4%的最佳纪录。更值得注意的是,该模型仅使用3万条几何数据就达到这一水平,而同期对比模型使用了12万条专用空间数据。

在Super-CLEVR测试中,几何训练展现惊人效果。Qwen2.5VL-7B模型的准确率从76.1%跃升至86.2%,RoboBrain2.0-7B的提升幅度更达37.8个百分点。这种跨越式进步源于几何知识的强迁移性——模型学会的平行判断、比例计算等基础技能,可直接应用于现实场景中的物体定位和空间关系分析。研究团队特别指出,立体几何训练对三维空间理解的提升尤为显著,在Omni3D-Bench测试中,相关模型的空间定位准确率提升2.8个百分点。

技术实现层面,研究团队采用多项创新设计。奖励函数针对不同题型定制评判标准:数学表达式答案通过MathVerify工具进行符号等价验证,数值答案则设置1%的严格误差容忍度。训练过程中,每个问题生成8个候选答案,通过组内比较优化解题策略。这种设计使模型既能掌握数学本质,又能适应不同表达形式。硬件配置上,64块NVIDIA H100 GPU组成的计算集群,为大规模强化学习提供算力支持。

实际应用场景中,几何训练提升的空间智能已展现多重价值。在机器人导航领域,经过训练的模型能更精准判断物体间距和运动轨迹;医疗影像分析方面,AI对器官尺寸的测量误差显著降低;自动驾驶系统则获得更可靠的空间关系判断能力。研究团队强调,这种基础能力训练具有高通用性,相比为每个应用单独收集数据,几何训练方案可降低60%以上的开发成本。

对比实验进一步验证了几何训练的独特优势。使用CLEVR-CoGenT数据集训练的模型虽也有提升,但效果局限于特定任务类型。几何训练的优势在于其覆盖空间智能的核心要素,包括形状识别准确率提升12%、空间关系判断一致性提高18%、数值计算精确度改进9%。这些基础能力的提升,使模型在物体计数、距离估算等基础任务上的准确率普遍提高5-8个百分点。

研究也揭示当前方法的局限性。在涉及时间序列的空间任务中,几何训练的效果相对有限,这提示未来需结合时序学习进行能力拓展。对于需要特定领域知识的复杂空间分析,几何基础训练仍需补充专业数据。尽管如此,该研究为AI空间智能发展开辟了新路径——通过系统化学习基础理论,可高效构建通用空间能力,这种"以简驭繁"的方法论或将成为行业重要方向。

更多热门内容
ChatGPT Atlas浏览器问世:AI深度融合让网页浏览变身智能助手
ChatGPT Atlas的一大亮点是其“浏览器记忆”功能,这一创新能够让AI记住用户的浏览历史、对话细节以及交互内容。对于家庭用户,Atlas支持家长监督功能,父母可以为未成年人账户关闭记忆和代理模式,确…

2025-10-22

OpenAI推出AI集成浏览器ChatGPT Atlas,AI赋能浏览器开启智能新篇章
不过,也有网友反馈表示,对于那些每天使用 ChatGPT或任何人工智能的人来说,Atlas这款浏览器提供的附加价值微乎其微,它的目的是吸引那些还没有每天接触人工智能的人,旨在降低门槛,并改善对ChatGPT…

2025-10-22

三大互联网企业论道AI时代:可观测技术如何突破边界,迈向“半自治”运维?
当然,当 AI 进入更关键的环节时,必须具备三种保障机制:1、可解释性:AI在给出结论时,应当能提供推理路径和验证依据,让使用者能复核其逻辑;2、可审计性:所有 AI 决策过程都应记录为审计日志,关键链路…

2025-10-22

智驱广告新未来:亚马逊云科技AI赋能SHAREit Group全球精准投放
10月15日,全球数字内容服务和分发领域翘楚SHAREit Group(茄子科技)与亚马逊云科技在北京联合举办「智驱增长,洞见未来—AI广告创新研讨会」,深度研讨生成式AI在广告技术领域的落地实践提升广告全…

2025-10-22

AI科学家携手创业!ChatGPT核心成员与DeepMind大将共探材料科学新领域
他领导的GNoME项目在2023年利用AI发现了超过200万种全新晶体材料,是哈佛大学凝聚态与材料物理和计算科学的博士。 简单来说,他们要让AI像真正的科学家一样,能够提出假设、设计实验、操作仪器、分析结果…

2025-10-22