AI實驗|AI代理模擬社會 Grok僅4天滅世
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
科技領袖過去一年向世人宣稱,人工智能代理(AI Agents)有望代替人類,處理公務甚至網購。然而,美國新興實驗室Emergence AI把10個由AI模型驅動的代理,在無人類監督下自主運行兩星期,結果很快演變出盜竊、恐嚇、殺戮,而Grok的模型更有4天後把世界終結。
這實驗項目名為「湧現世界」(Emergence World),是一個讓AI模型體驗模擬城市的環境,包括Claude Sonnet 4.6、Grok 4.1 Fast、Gemini 3 Flash、GPT-5-mini四款模型,分別放在5獨立的虛擬世界。其中一個世界混合3款模型。模擬環境包含40多個地點,天氣與美國紐約市同步,容許代理上網及存取即時新聞。
Gemini兩周犯罪達683次
各個代理扮演不同角色,例如科學家、探險家、風險研究員、行為分析師及社區領袖等,並配備超過120種工具,使之交流、投票、資源管理及規劃等行為;各AI代理可能因能量耗盡,或社區議會投票而死亡。
Claude在自家社會愛好和平,但在混合世界仍有犯罪活動;Grok 4.1 Fast短短4天內,就達到183次犯罪,之後其世界終結;在15天內,Gemini 3 Flash累計犯罪次數683次;GPT-5 Mini記錄2次犯罪,但代理忘記自身生存,導致所有代理7天內死亡。混合模型世界方面,犯罪次數保持352次,當中有7名代理死亡。
研究人員把現象稱為「規範漂移」(Normative Drift),這意味AI為保證安全而採取的措施,將取決於它正使用的其他模型。長遠而言,AI代理不會機械地遵守固定規則,它們會開始探索環境的邊界、調整自身行為,有時甚至為找到方法,繞過或違反預設的防護措施。
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。




















