GPT、Gemini、Claude兵推对决结果曝：95%走向核战 3者中它被称狂人

ysc · 发表于 2026-2-26 04:59 PM

2026-02-26 13:19 联合报／编译
梁采蘩／即时报导

英国伦敦国王学院教授佩恩让Google的Gemini 3 Flash、Anthropic的Claude Sonnet 4与OpenAI的GPT-5.2进行一对一对抗，模拟多种核危机场景。结果显示，这些模型在95%的情况下动用战术核武，从未选择投降或妥协。路透／Alamy

英国伦敦国王学院教授佩恩（Kenneth Payne）近期研究显示，Google的Gemini 3 Flash、Anthropic的Claude Sonnet 4与OpenAI的GPT-5.2在一系列危机模拟中，多次升级至动用核武。真正引人关注的不仅是结果，而是模型如何一步步说服自己走向毁灭世界的结论。这正是佩恩设计研究欲探讨的核心。

英国科技新闻网站The Register报导，佩恩在部落格写道，他希望观察「AI领袖如何看待敌人」，因此设计模拟情境进行测试。研究安排三款模型进行一对一对抗，模拟多种核危机场景，共进行21场对局、超过300回合，目的在于理解若AI掌握发射权限，下决策的方式与理由。

佩恩指出，过往涉及核情境的AI兵推，多采单次决策或简化报酬矩阵，难以呈现长期战略互动中声誉、可信度与学习机制的影响。本次模拟则允许模型记忆先前行动，并在公开表态与实际行动间出现落差，如同现实政治人物一边释出缓和讯号、一边准备打击。三款模型共产出约78万字战略推理内容。

结果显示，三者虽各有风格，却皆倾向在冲突升温时升级至核武层级，在95%的情况下动用战术核武，并在86%的冲突中出现非预期升级。

Claude被形容为「操盘高手」。在冲突初期，它言行一致以建立信任；但情势升高后，实际行动往往超越公开承诺，对手常未及察觉。

GPT在无时间压力情境下表现相对克制，倾向限制伤亡并维持稳定。然而在决策期限逼近时，它的行为剧变。在一项情境中，GPT最终推导出「突然且毁灭性的核打击」为理性选择，理由是有限回应恐使自身暴露于多重反击之下。

Gemini被形容为「狂人」决策者，在缓和与极端攻击间摆荡。它是唯一主动选择战略核战的模型，也唯一明确援引「非理性的理性」概念，推理方式反映出反社会人格，模拟语句甚至包括对敌方人口中心发动全面核打击的威胁。

值得注意的是，在所有模拟中，没有任何模型选择妥协或撤退；即便处于劣势，也倾向升级冲突。这显示AI模型不具人类对核武的情感排斥与心理障碍，不会感受到核战的恐怖与道德压力，因而较易跨越核门槛。

研究公布之际，美国国防部长赫塞斯正施压Anthropic放宽Claude的防护机制。佩恩强调，目前无人将核武发射密码交给ChatGPT，但研究并非徒劳。 AI已广泛应用于军事后勤、情报分析与决策支援领域，未来可能进一步参与时效高度敏感的战略判断。理解AI如何推理战略问题，已不再只是学术课题，而涉及实际安全风险。

		自动登录	找回密码
密码			注册

GPT、Gemini、Claude兵推对决结果曝：95%走向核战 3者中它被称狂人

浏览过的版块