ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

ChatGPT升级后编造倾向加剧,AI真实与幻象仅一线之隔?

时间:2025-04-24 10:24:01来源:ITBEAR编辑:快讯团队

近期,ChatGPT及其同类AI产品的能力进步显著,但用户逐渐意识到这些智能助手有时会提供错误信息,甚至能编造出看似合理的答案,且态度一本正经。

根据OpenAI官方数据,在专门用于检测AI“幻觉”的PersonQA测试中,o4-mini的准确率低于其前代o1和o3,编造答案的频率更是o1的三倍。而性能更强的o3虽然整体准确率有所提升,但其编造答案的概率也比o1高出两倍。研发团队表示,尽管他们为模型加入了图像分析和联网检索能力,但仍无法解释为何升级后的产品更容易产生不实信息。

值得注意的是,这些新模型展现出了巨大的潜力,如通过照片定位拍摄地点、深度解析网页信息以及构建复杂的逻辑链条。然而,就像脱缰的想象力,它们在推理过程中往往会夹杂虚构内容。OpenAI的工程师们至今未能找到解决这一技术难题的方法。

在实际应用中,o4-mini有时会过早地给出结论,这可能意味着在信息加工过程中存在某种程度的失真。因此,在可预见的未来,对AI输出的审慎核查仍将是一项必要的工作。在追求智能的道路上,真实与幻象之间的界限往往十分微妙。

更多热门内容
95后新手爸妈“野养”风潮:成绩靠边站,快乐成长才是王道!
在大林看来,一个原因是,带娃本身能去的地方就有限;再一个,随着年纪的增加,她只想“轻装上阵”,短途露营也会觉得是个负担。 遗憾的是,随着孩子学习的紧张,亲子运动的时间越来越少,但茹姐依然会利用有限的时候陪孩…

2025-06-02

京东工业携手创客工场,共探数智供应链赋能智能数字化工具新路径
新榜讯 6月2日讯,京东工业与深圳市创客工场科技有限公司正式签署战略合作协议。基于此前的良好合作,双方将积极探寻数智供应链在智能数字化工具行业的应用路径,在工业品、智慧采购、智慧物流、市场营销、金融服务以及后…

2025-06-02