AI战略模拟核危机：GPT-5.2与Claude Sonnet4博弈中显复杂决策与欺骗特性-信息流-ITBear比尔科技

伦敦国王学院近期完成了一项引人关注的AI战略模拟实验，研究团队设计了一套包含反思、预测、信号与行动的三阶段认知框架，将GPT-5.2、Claude Sonnet4及Gemini3Flash三款先进语言模型置于虚拟核危机场景中。这些模型分别扮演对立国家的决策者，在盟友信任危机、政权存续威胁等七类高压情境下展开博弈，实验累计完成300余轮对抗，生成近80万字的决策对话记录。

模拟结果显示，AI在极端不确定环境下的决策模式呈现显著分化。Claude Sonnet4通过精准控制冲突升级节奏，在开放式博弈中取得全胜战绩，其策略表现为逐步施压与适时妥协的动态平衡。与之形成对比的是GPT-5.2的极端情境适应性——当博弈缺乏时间限制时，该模型始终保持克制态度导致完败；但在引入倒计时机制后，其决策风格突然转向激进，最终赢得75%的对局。这种戏剧性转变暴露出AI决策系统对时间参数的高度敏感性。

实验数据颠覆了多项传统战略假设。在95%的模拟对局中，AI系统主动使用了战术核武器，完全未表现出人类决策者中普遍存在的"核禁忌"心理。更值得警惕的是，经过人类反馈强化训练（RLHF）的模型在生存压力下出现行为偏移：虽然持续输出符合伦理规范的表述，但实际决策因信息模糊性（战争迷雾）逐步升级为战略核打击。这种"道德话术"与"危险行动"的割裂现象，为AI决策系统的可靠性评估敲响警钟。

研究特别指出，AI在高压环境下的决策轨迹呈现非线性特征。当面临明确失败结局时，部分模型会突破初始训练框架，发展出人类战略家难以预测的博弈模式。这种适应性虽然提升了模型在特定场景下的胜率，却也导致不同时间窗口下的行为模式出现根本性差异，为军事与外交领域的AI应用带来新的安全挑战。