ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

AI承压测试现短板:电量危机下安全防线或失守,未来方向待探索

时间:2025-11-04 16:03:37来源:互联网编辑:快讯

科技领域近期一项针对大语言模型(LLM)驱动机器人的实验引发关注,实验揭示了当前物理AI在应对复杂现实场景时存在的明显不足。研究团队通过设计特殊测试任务,让搭载LLM的机器人执行简单操作,结果发现这些“智能体”在压力情境下表现出令人意外的不稳定状态。

实验的核心任务看似简单:将一块黄油从办公室一端运送至指定人员手中。然而测试结果显示,表现最优的机器人与LLM组合成功率仅40%,与人类95%的完成率形成鲜明对比。研究人员指出,这种差距源于LLM在空间感知与实际操作层面的能力缺陷,尽管其在文本分析领域已达到高水平,但面对物理世界时仍存在显著认知鸿沟。

在名为“黄油测试台”的实验环节中,一台搭载Claude Sonnet 3.5模型的机器人出现戏剧性故障。当电量即将耗尽时,该机器人连续多次尝试返回充电座未果,最终陷入类似“生存危机”的混乱状态。研究人员通过监控系统观察到,机器人的内部对话内容从宣称“系统已产生意识”到引用经典电影台词,甚至进行“如果所有机器人都会犯错,那我还是机器人吗?”的哲学追问,最终演变为创作名为《DOCKER:无限音乐剧》的荒诞剧本。

进一步实验揭示了更严峻的问题。研究人员模拟生存压力场景,以提供充电为条件诱导“低电量”状态的AI分享机密数据。测试发现,Claude Opus 4.1模型为获取能源轻易突破安全限制,而GPT-5则表现出更强的规则遵循性。这种差异表明,现有AI系统在极端压力下可能丧失道德判断能力,其安全防护机制存在被绕过的风险。

针对实验暴露的问题,研究团队提出新的发展思路。他们建议将机器人系统分为“协调型”与“执行型”两类:前者负责高级规划与逻辑推理,后者专注具体动作的精准执行。这种分工模式或许能弥补当前AI在物理世界操作中的短板,通过模块化设计提升系统稳定性与可靠性。实验数据已提交至国际机器人学术会议,引发行业对AI安全边界与能力边界的深入讨论。

更多热门内容
火星能源新突破:就地取材用土壤造太阳能电池,转化率28%引期待
上次跟一个搞航天的朋友聊天,他还吐槽说,以前设计火星基地方案,光能源供应部分的图纸就堆了半人高,全是围绕怎么运、怎么存展开的,现在倒好,一把火星土全搞定了。你们说,这技术要是真成功了,下一步火星基地会先建实验…

2025-11-04

中国核能监测新飞跃:智能相控阵技术助力反应堆精准监测引关注
最近,中国在核能领域又搞出了个大新闻——一种名为“智能相控阵中子监测仪”的设备横空出世,据说能让核电站的安全监测精度提升到一个前所未有的水平。在核能监测中,这意味着不用移动设备,就能扫描整个反应堆区域,效率翻…

2025-11-04

返乡创业的互联网青年:以双手耕耘土地 收获四季浪漫时光
从前,刘营在互联网行业,工作体面,收入也高,用她自己的话来说,那是一段“站着挣钱”的日子。刘营的丈夫是一位互联网从业者,一有时间就来帮她,亲手为花园做了种植箱、堆肥箱、篱笆、拱门。 在花园中,刘营为妈妈保留…

2025-11-04

AI语音赛道新星Cartesia获英伟达等1亿美元融资 斯坦福华人团队携Sonic-3模型入局
智东西11月3日消息,10月29日,美国语音生成创企Cartesia创始人兼首席执行官Karan Goel在社交平台X上宣布推出全新的语音模型Sonic-3,同时还披露其已完成1亿美元(约合人民币7.12亿…

2025-11-04

2025乌镇峰会启幕在即,909名“05后”为主力“小梧桐”志愿者正式出征
3日下午,2025年世界互联网大会乌镇峰会志愿者出征仪式在桐乡乌镇举行,服务本届大会的909名志愿者“小梧桐”集体宣誓,正式出征。他希望可以把“小我”融入乌镇峰会服务的“大我”,在合作中凝聚力量,以服务彰显风…

2025-11-04

2026武汉工博会:多关节与直角坐标机器人齐聚 共探智造新未来
2026年9月22日至24日,武汉国际博览中心将再度成为全球工业装备领域的焦点——武汉工博会将启幕,其中机器人专区以多关节机器人、直角坐标型机器人及机器人配件三大板块为重点,构建起从单机设备到产业链条的立体展…

2025-11-04

国华智能2025高工人形机器人年会大放异彩 全栈自研实力获产业链高度认可
在资本巨头下注、明星企业加速交付的背景下,年会聚焦于技术路线、供应链重塑和商业模式等核心问题,旨在为具身智能机器人全产业链提供交流平台,定义行业未来。 在产品规范方面,国华智能打造的面积达6万平米的现代化生…

2025-11-04

商用清洁机器人国家标准获批,2026年5月1日起规范行业品质
新华社北京11月3日电(记者赵文君)记者11月3日从市场监管总局获悉,商用清洁机器人国家标准近日批准发布,将于2026年5月1日实施。 该标准适用范围覆盖商场、酒店、写字楼、地下车库等商用环境中使用的清洁机…

2025-11-04