浙江大学研究揭秘：AI在三维空间“找角度”复现视角有多难？-人工智能-ITBear科技资讯

在人工智能领域，一个看似简单的日常行为——模仿他人拍摄照片的视角，却成为当前AI技术难以攻克的难题。浙江大学人工智能研究团队针对这一现象展开系统性研究，构建了首个专门评估AI空间行动能力的测试平台TVRBench，相关成果以预印本形式公开后引发学界关注。

该研究将人类习以为常的"找角度"行为拆解为复杂的多维任务：需要同时处理视觉信息比对、空间方位判断、路径规划决策和动作执行反馈。当要求AI在虚拟环境中复现指定视角时，现有主流模型的表现与人类形成巨大反差——顶尖商业模型成功率不足13%，开源模型最高仅7.8%，而人类志愿者在相同测试中达到93%的准确率。这种差距在需要穿越多个房间的复杂场景中尤为显著，AI成功率骤降至25%左右。

研究团队搭建的TVRBench平台通过计算机模拟构建了240个三维室内场景，包含厨房、卧室等典型生活空间。测试任务设计极具挑战性：AI需操控虚拟化身在完全未知的环境中，仅凭第一视角画面和目标照片，通过连续移动和转向完成视角匹配。每个动作都会改变环境感知，但系统不提供地图或坐标信息，成功判定要求位置误差小于0.25米且视角偏差小于5度。

实验数据显示，现有AI存在两大典型缺陷：43%的测试中AI陷入原地旋转的无效循环，平均移动位置不足4个却消耗34步动作；在需要连续决策的复杂路径中，83%的步骤是在重复已探索区域。更值得关注的是，当移除行走要求仅测试视角调整时，模型成功率骤升至80.5%，而单纯行走任务成功率仅10%，这暴露出AI在空间行动规划方面的根本性缺陷。

针对这一短板，研究团队开发了四阶段训练框架。通过1600条专家示范轨迹的监督学习，基础模型成功率从2.8%提升至50.8%。但当尝试加入动作推理说明时，性能不升反降——使用视觉记忆的模型成功率从50.8%跌至35.6%。进一步实验表明，冗长的文字推理会干扰模型对视觉信号的处理，且现有标注方式难以准确捕捉连续空间决策所需的动态规划能力。

强化学习实验带来突破性发现：在真实环境模拟中接受多轮训练的模型，在复杂场景中的成功率提升达30%。这种训练方式允许模型在试错中学习纠错策略，相比单步强化学习26.2%的成功率，完整路径训练使模型掌握了应对非最优状态的能力。研究特别指出，视觉-动作历史记忆比纯动作记忆更有效，但需要配合适当的训练策略才能发挥作用。

该研究对AI空间智能发展具有重要启示。当前模型在静态空间理解方面已取得进展，但将视觉认知转化为连续身体行动的能力仍存在断层。TVRBench提供的量化评估体系，为开发真正具备空间行动能力的AI指明了方向。研究团队已开源测试平台代码和训练数据，期待更多研究者在此基础上探索更接近真实世界的导航技术。

在应用前景方面，能够精准复现视角的AI系统可服务于多个领域：室内服务机器人可实现更精准的物体定位，无人机摄影能自动匹配专业构图角度，虚拟现实设备可提供更自然的视角切换体验。这项研究虽然基于虚拟环境，但其揭示的空间认知与行动转化机制，为下一代具身智能的发展奠定了重要基础。

25岁开发者不等R星！用AI自制《GTA6》九天成果初显“GTA味”

2026-06-21

基于Chromium内核新工具：Steam手柄秒变“遥控小车” 浏览器内轻松操控

2026-06-21

英伟达开始搞机器人自己研究机器人那套了…

2026-06-21

台积电力推CoPoS技术，玻璃核心基板引领AI芯片封装新变革

2026-06-21

端午假期上海浦东机场“机器人天团”上岗，智慧服务助力旅客便捷出行

在指引旅客提取行李方面，智慧服务机器人可在到达层不间断地巡游，更早提醒旅客，让第一次来浦东机场的旅客更快找到自己行李的方位。其中智能轮椅机器人支持候机楼指定区域内自动驾驶接驳，而且人机交互操作极致简化，旅客只…

2026-06-21

SK海力士亮相HPED 2026：HBM4与CXL内存新品展示AI内存新布局

2026-06-21

吉科职院具身机器人语音识别项目获奖推动职教产教融合迈向新高度

日前，2026吉林省数字经济发展促进大会暨第三届吉林省人工智能大会在长春举办，吉林科技职业技术学院人工智能产业学院携具身机器人语音识别系统应用开发项目亮相，成功获评2026吉林省人工智能及大模型典型应用案例。…

2026-06-21

Take-Two前AI负责人发声：生成式AI热度或被夸大，恐牵连传统AI声誉

2026-06-21

安洁科技正式进军AI眼镜领域依托技术优势推进研发与业务布局

2026-06-21

2026湾区科技节深圳启幕人形机器人领衔尖端AI技术共绘智慧新篇

本次湾区科技节科创氛围浓厚，荣耀人形机器人“闪电”与“元气仔”在现场带来人机互动展演，凭借灵动趣味的智能表现频频获赞，成为全场焦点。店面以“前店后研”的创新运营模式，汇集两百余款前沿智能产品，全方位展示端侧A…

2026-06-20