ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

AWS新工具“自动推理检查”能否有效遏制AI幻觉问题?

时间:2024-12-04 10:10:11来源:ITBEAR编辑:快讯

亚马逊云科技(AWS)近期在拉斯维加斯举行的re:Invent 2024大会上,推出了一款旨在解决AI模型产生幻觉问题的新工具,引发了业界的广泛关注。

这款名为“自动推理检查”的工具,通过交叉验证客户提供的信息,来确保AI模型输出的准确性。AWS宣称,这是业界首个也是唯一一个专门针对AI幻觉问题的防护措施。然而,也有声音指出,微软在今年早些时候推出的“校正”功能与“自动推理检查”在功能上颇为相似,都能标记出AI生成文本中可能存在的事实错误。同样,谷歌的Vertex AI平台也提供了一个工具,允许客户通过引入第三方数据、自有数据集或谷歌搜索,来提升模型回答的可信度。

“自动推理检查”工具是AWS Bedrock模型托管服务的一部分,特别是与Guardrails工具相结合,它试图深入探究模型得出结论的过程,并验证答案的正确性。客户可以上传信息以构建一个事实基础,然后“自动推理检查”会根据这些信息创建规则,这些规则经过优化后可以应用于模型。

当AI模型生成回答时,“自动推理检查”会对其进行验证。如果模型出现了幻觉,即给出了错误的答案,该工具会利用之前建立的事实基础来得出正确答案,并将这个正确答案与模型的错误答案一同呈现给客户,以便客户了解模型偏离正确答案的程度。

AWS透露,普华永道已经开始使用“自动推理检查”来为其客户设计AI助手。AWS的AI和数据副总裁Swami Sivasubramanian表示,这种类型的工具正是吸引客户选择Bedrock的关键因素之一。

然而,有专家对此持谨慎态度。据Techcrunch报道,有专家指出,试图完全消除生成式AI的幻觉是非常困难的,就像试图从水中去除氢一样。AI模型之所以会产生幻觉,是因为它们本质上并不具备“知识”。它们是基于统计的系统,通过识别数据中的模式,并根据之前的经验来预测下一个数据点。因此,AI模型的输出并不是真正的答案,而是对问题应该如何回答的预测,这种预测存在一定的误差范围。

尽管AWS声称“自动推理检查”使用“逻辑准确”和“可验证的推理”来得出结论,但该公司并未提供具体的数据来证明该工具的可靠性。这一声明引发了业界对于该工具实际效果的进一步关注和讨论。

更多热门内容
华为Mate80系列将携鸿蒙6.0登场,多款新品齐聚11月28日星光盛典
据说,鸿蒙6.0在全新的方舟引擎和鸿蒙内核的支持下,App冷启动速度快30%,多任务切换无掉帧。 Mate 80 系列有四款机型,分别是Mate 80、Mate 80 Pro、Mate 80 Pro+ 以及…

2025-10-22

OpenAI首款浏览器Atlas来袭:AI整合新体验,实测感受抢先看
AI 协助功能:在任何打开的文本输入框中输入内容时,ChatGPT 能提供实时修改建议和智能补全,帮你更高效地码字Agent(代理)模式:能让 ChatGPT 在浏览器中自主完成多步骤任务从今天开始,ma…

2025-10-22

Wi-Fi 7时代来临,BAW滤波器如何助力无线连接体验升级?
针对国内Wi-Fi7路由器频段需求,可实现精准频段划分与干扰抑制;面向海外6GHz频段应用,产品也通过相关认证,为国产设备出海提供关键元器件支持。 开元通信BAW滤波器成功导入多家头部客户并实现量产,不仅积…

2025-10-22

售价13000元!三星Galaxy XR头显发布 直面苹果Vision Pro高端之争
【CNMO科技消息】10月21日,三星正式发布了其首款混合现实头戴设备——GalaxyXR,官方售价定为1799.99美元(约合人民币13000元),直接瞄准了苹果Vision Pro的高端市场。借助头显的…

2025-10-22

荣耀Magic8系列YOYO智能体上线,AI助力双11购物省时省心又省钱
接着,主持人具体介绍了荣耀 Magic 8 上 YOYO智能体在识别商品、查找优惠信息、领取优惠券等方面的便捷性,强调了在购物决策中的省心体验,特别是通过社交平台种草后,YOYO 智能体能高效帮助消费者获…

2025-10-22

小米17 Pro系列爆发式增长:前三周占比近85%,成功吸引iPhone用户转投
【CNMO科技消息】10月22日,有博主爆料称,小米17系列开售前三周,出货量较上代增长12%。其中,17 Pro系列两款机型的出货量比上代一款Pro机型增长了141%,也就是上代的2.4倍。CNMO了解到,…

2025-10-22

华为Mate 70 Air登场!“Air”赛道上,华为与苹果的轻薄新较量
苹果那边的iPhone Air还没捂热乎呢,这边华为的“Mate 70 Air”就在电信终端产品库里亮了相。 这种设计不只是为了好看,它对手感的提升是巨大的,拿在手里,没有了那种硌手的棱角感,整个机器会感觉更…

2025-10-22

IBM携手Groq强强联合,以三大技术整合推动企业级AI高效落地
10月20日,科技巨头IBM与AI推理ASIC芯片企业Groq共同宣布建立战略性市场推广与技术合作伙伴关系,目标直指加速企业级AI的规模化部署与应用落地。此次合作的核心围绕三大技术整合展开: IBM的wat…

2025-10-22

技术驱动变革:2025年工业企业数据治理路径与社会责任平衡探索
文件内容主要围绕技术发展与应用展开讨论,强调在当前背景下,技术创新已成为推动社会进步的重要动力。 文中还涉及多个技术领域,包括人工智能、大数据分析、云计算等,并探讨了这些技术在实际场景中的应用价值与潜在问题…

2025-10-22

OpenAI发布ChatGPT Atlas浏览器:以AI对话重塑网络浏览新体验
(AI云资讯消息)当地时间10月21日,OpenAI正式发布全AI驱动的网页浏览器ChatGPTAtlas,将对话模型置于用户网络浏览体验的核心。ChatGPT Atlas浏览器不再依赖传统输入搜索和重复…

2025-10-22