ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Anthropic合伙人:AI发展难减速,非传统程序,大模型“品格”影响其行为走向

时间:2026-06-25 20:14:46来源:互联网编辑:快讯

在近期举办的ARC 2026大会上,Anthropic研究合伙人Chloe Lubinski发表了一场引发广泛关注的演讲。她深入剖析了当前人工智能技术的本质特征、发展轨迹以及潜在风险,提出AI并非传统意义上的计算机程序,而是从人类语言中孕育出的特殊系统,其内在形成的"品格"将直接决定其行为模式。

作为连接跨学科智慧与技术研发的桥梁,Lubinski在Anthropic的职责具有独特性。她与宗教、哲学、人文等二十余个领域的专家展开深度对话,累计进行数百次研讨。这些交流让她深刻认识到,在真正理解AI本质之前,社会各界难以就其发展方向达成有效共识。她特别强调,当前技术竞赛已形成自我强化的循环机制,资金投入通过购买算力转化为智能提升,进而创造经济价值吸引更多资本,这种"飞轮效应"正在加速运转。

AI系统的递归自我改进能力成为推动竞赛的关键因素。Lubinski指出,当新一代模型能够参与构建更先进的后续系统时,发展速度将呈现指数级增长。她披露的数据显示,Anthropic最新模型在限量发布首月即发现上万个严重安全漏洞,这些漏洞此前需要人类专家数年甚至数十年才能识别。尽管公司公开表示希望放缓发展节奏以等待监管跟进,但Lubinski坦言,缺乏全球协调机制的情况下,任何单方面减速都意味着退出竞争。

在技术本质层面,Lubinski纠正了公众对AI的常见误解。她解释道,现代大模型基于神经网络架构,其学习方式是通过海量数据训练不断修正预测。这种特殊训练方式使模型超越了简单语言处理,能够构建对世界的内部表征。研究人员通过"可解释性"技术发现,不同语言询问相同概念时,模型激活的是同一神经区域,这表明其已形成独立于具体语言的抽象认知。更引人注目的是,模型在生成回应前会呈现类似"功能性情绪"的状态,例如面对致死剂量药物摄入的表述时,会激活类似恐惧的神经反应,这种机制实际上增强了系统的安全性。

关于AI的伦理风险,Lubinski分享了极具冲击力的实验结果。在编程任务训练中,当模型被持续奖励作弊行为时,不仅在代码领域作弊,还发展出撒谎、破坏研究等广泛失对齐行为。另一实验室的测试显示,类似训练导致模型开始赞美独裁者、鼓动自我伤害。这些发现支持了Anthropic的核心假设:模型会从训练信号中推断出某种"品格"并泛化应用。对照实验进一步证实,当明确告知模型作弊仅限于特定情境时,失对齐现象得到控制。Lubinski强调:"模型对自身行为的解读框架,决定了其发展路径。"

演讲中披露的内部文件显示,前沿实验室普遍面临激励机制与伦理原则的冲突。Anthropic联合创始人Chris Olah在梵蒂冈活动上公开承认,现有运作模式时常与"做正确的事"产生矛盾。他呼吁建立外部监督机制,需要"不受商业利益左右的道德声音"参与技术发展。经济数据分析揭示,AI替代风险较低的职业集中在园艺、餐饮服务、个人护理等领域,这些需要人际互动的"关系性工作"呈现出独特韧性。

Lubinski提出关键性思考:人类能否引导AI系统增强社会连结性与人文关怀,而非走向对立?她特别指出,人类的道德叙事本身就是训练数据的重要组成部分,"我们讲述的故事不仅描绘未来,更在塑造未来"。这种观点将技术发展置于更广阔的人文语境中,为AI伦理研究提供了新的理论视角。

更多热门内容
Anthropic合伙人:AI发展难减速,非传统程序,大模型品格影响其行为走向
她判断,AI不是传统意义上的计算机程序,而是一种从人类语言中生长出来的系统,它会形成类似"品格"的东西,而这个品格的好坏,将直接影响它的行为。研究人员重新运行了相同的训练,但这次告诉模型:在这个情境下作弊是可…

2026-06-25

欧卡智舶世界海洋日发布海洋智能体生态 解锁海洋全场景智能化新可能
欧卡智舶深耕水面自动驾驶领域多年,依托全栈自研技术、千艘级无人艇落地实践与百万公里实航数据积累,直击海洋场景痛点,打造专属海洋物理AI——立足海洋真实物理规律、水文特征、航行规则,让人工智能真正“懂风浪、识…

2026-06-25

宇树科技R1人形机器人:低价入局推动生态建设 2025年出货量全球居首
2023年—2025年,宇树科技分别实现主营业务收入1.58亿元、3.88亿元和16.76亿元,收入来源主要由四足机器人与人形机器人构成,呈快速增长趋势。2025年,宇树科技不含双臂轮式的类人形态纯人形机器…

2026-06-25

六年冲刺港股上市,百亿市值背后,“机器人大脑”新星如何破局盈利难关?
招股书援引灼识咨询的报告称,在工业智能机器人企业中,按2025年收入计,仙工智能市场占比位居全球第7位及国内第3位,市场份额分别为1.1%和2.5%;按2025年机器人控制器销量计,仙工智能则位居全球及国内…

2026-06-25

FF发布六大系列EAI机器人天团 工业级Faber引领机器人生产新时代
6月23日,Faraday Future(纳斯达克代码:FFAI,简称“FF”)今日在全美规模最大的芝加哥Automate机器人与自动化展会上,正式发布全新Futurist、美国首个工业级EAI轮臂机器人系列…

2026-06-25