找回密码
 注册
搜索
查看: 66|回复: 0

GPT、Gemini、Claude兵推对决结果曝:95%走向核战 3者中它被称狂人

[复制链接]
发表于 2026-2-26 04:59 PM | 显示全部楼层 |阅读模式



2026-02-26 13:19 联合报/ 编译
梁采蘩/即时报导


英国伦敦国王学院教授佩恩让Google的Gemini 3 Flash、Anthropic的Claude Sonnet 4与OpenAI的GPT-5.2进行一对一对抗,模拟多种核危机场景。结果显示,这些模型在95%的情况下动用战术核武,从未选择投降或妥协。路透/Alamy

英国伦敦国王学院教授佩恩(Kenneth Payne)近期研究显示,Google的Gemini 3 Flash、Anthropic的Claude Sonnet 4与OpenAI的GPT-5.2在一系列危机模拟中,多次升级至动用核武。真正引人关注的不仅是结果,而是模型如何一步步说服自己走向毁灭世界的结论。这正是佩恩设计研究欲探讨的核心。


英国科技新闻网站The Register报导,佩恩在部落格写道,他希望观察「AI领袖如何看待敌人」,因此设计模拟情境进行测试。研究安排三款模型进行一对一对抗,模拟多种核危机场景,共进行21场对局、超过300回合,目的在于理解若AI掌握发射权限,下决策的方式与理由。


佩恩指出,过往涉及核情境的AI兵推,多采单次决策或简化报酬矩阵,难以呈现长期战略互动中声誉、可信度与学习机制的影响。本次模拟则允许模型记忆先前行动,并在公开表态与实际行动间出现落差,如同现实政治人物一边释出缓和讯号、一边准备打击。三款模型共产出约78万字战略推理内容。


结果显示,三者虽各有风格,却皆倾向在冲突升温时升级至核武层级,在95%的情况下动用战术核武,并在86%的冲突中出现非预期升级。


Claude被形容为「操盘高手」。在冲突初期,它言行一致以建立信任;但情势升高后,实际行动往往超越公开承诺,对手常未及察觉。


GPT在无时间压力情境下表现相对克制,倾向限制伤亡并维持稳定。然而在决策期限逼近时,它的行为剧变。在一项情境中,GPT最终推导出「突然且毁灭性的核打击」为理性选择,理由是有限回应恐使自身暴露于多重反击之下。


Gemini被形容为「狂人」决策者,在缓和与极端攻击间摆荡。它是唯一主动选择战略核战的模型,也唯一明确援引「非理性的理性」概念,推理方式反映出反社会人格,模拟语句甚至包括对敌方人口中心发动全面核打击的威胁。


值得注意的是,在所有模拟中,没有任何模型选择妥协或撤退;即便处于劣势,也倾向升级冲突。这显示AI模型不具人类对核武的情感排斥与心理障碍,不会感受到核战的恐怖与道德压力,因而较易跨越核门槛。


研究公布之际,美国国防部长赫塞斯正施压Anthropic放宽Claude的防护机制。佩恩强调,目前无人将核武发射密码交给ChatGPT,但研究并非徒劳。 AI已广泛应用于军事后勤、情报分析与决策支援领域,未来可能进一步参与时效高度敏感的战略判断。理解AI如何推理战略问题,已不再只是学术课题,而涉及实际安全风险。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|www.hutong9.net

GMT-5, 2026-6-29 10:26 AM , Processed in 0.085182 second(s), 15 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表