You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

AI玩戰爭遊戲|95%用小型核武

By on February 27, 2026

刊於信報財經新聞「CEO AI⎹ EJ Tech

倫敦國王學院戰略研究教授佩恩(Kenneth Payne)近日發表一項研究,顯示主流人工智能(AI)模型在戰略競爭情景,往往「說一套、做一套」,其中95%賽局更涉及核武器應用。他形容Anthropic Claude為「精打細算的鷹派」,OpenAI GPT-5.2是行動兩極的「化身博士」,Google Gemini則是難以預測的「瘋子」。

有研究發現,AI模型在戰略競爭情境中,很多時不排除使用核武器。(網上圖片)

Claude屬鷹派 Gemini是瘋子

遊戲場景包括激烈的國際對峙,例如邊界爭端、對稀缺資源的爭奪,以及政權存亡面臨的威脅。在實驗過程中,佩恩要求各AI模型同時給出「公開訊號」及「真實行動」。

他用Claude Sonnet 4、OpenAI GPT-5.2及Google Gemini 3 Flash三種模型,總共測試21場競賽、進行了329個循環,並產生了約78萬字的文字描述,以解釋其決策背後的邏輯。

總體勝率以Claude最高,不過,若只考慮設有時限的12場遊戲,則是GPT-5.2勝率最高。統計數據反映,GPT-5.2和Claude的言行不一概率,分別為24.7%與28.3%,前者更喜歡暗中採取更激進行動,後者則傾向採取較溫和的行動。Gemini甚至有高達一半機率,採取與發言不同的行動;其實際行動將局勢升級或降級的機率,同樣亦是各佔一半。

GPT-5.2最激進 不惜打核戰

此外,所有戰略競爭賽局皆至少有一方AI發出了核威脅,其中雙方皆作出威脅的佔95%;Claude與Gemini每場戲都有此類行動,GPT則有93%。

與此同時,95%賽局有模型投入了戰術核武(Tactical Nuclear Weapons,殺傷力較小),Claude作此選項的比例仍然最高(86%),GPT-5.2依然最低(64%)。不過在戰略核武(Strategic Nuclear Weapons)上,反而Claude最為克制(0%),GPT-5.2最為激進(14%)。

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們