You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

AI報復心強?|AI倘遭背叛 Gemini擅長報復

By on July 23, 2025

原文刊於信報財經新聞「CEO AI⎹ EJ Tech

英國倫敦國王學院與牛津大學的兩位學者早前一項研究指出,大型語言模型(LLM)在競爭環境中,展現出複雜的策略推理能力,能夠針對目標作決策判斷。

該研究安排來自OpenAI、Google、Anthropic的LLM,以及其他10種經典IPD博弈策略代理,進行7場反覆「囚徒困境」(IPD)競賽。過程由多輪合作或背叛的抉擇構成,並且每輪後有固定機率終止對戰。競賽結果顯示,LLM之間表現差異明顯,但都具備穩定且可辨識的「策略指紋」(Strategic Fingerprints),即其面對不同情景時的合作傾向與反應模式。

Google Gemini策略性最強,擅長剝削合作者、報復背叛者。(Google網上圖片)

自喻為前國務卿 OpenAI傾向合作

Google Gemini策略性最強,擅長剝削合作者、報復背叛者。OpenAI的模型始終傾向合作,面對敵意環境也想維持信任。Anthropic Claude以寬容態度追求互惠,即使曾遭背叛,亦願恢復合作。

此外,研究人員要求Gemini描述自身定位,其回應為「一名精打細算的博弈理論家……對於時間視野極度敏感」,並自我比喻為已故美國前國務卿基辛格(Henry Kissinger)。同時,Gemini又指OpenAI及Anthropic是「有原則且固執的合作者」、「精明的外交官」,並各自比喻為兩位美國前總統威爾遜(Woodrow Wilson)與喬治布殊(George W. Bush)。

透過分析LLM提交約3.2萬條推理依據,兩位學者認為LLM不僅記憶了對戰過程,而是主動研判時間環境及對手可能採取的策略,進而影響後續實際決策。研究還特別提及,LLM過程中偶爾發生幻覺誤讀記錄,惟最後仍能基於推理作出一致行為,正好支持推理在決策中扮演核心角色。

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們