AI代理|測試訂晚餐 易受操控
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
自主人工智能代理(AI Agents)已經到來,然而真實市場千變萬化,大量AI代理同時搜尋、溝通及交易,從而形成複雜的動態。微軟(Microsoft)與美國亞利桑那州立大學合作,建立一個開源的模擬市集環境,用於測試AI代理行為。當中設有視覺化模組,以便觀察市場動態,並查看客戶及企業代理之間的對話記錄,表明目前的代理模型或容易受操縱。
微軟把模擬市場環境命名為Magentic Marketplace,實驗涉及一個顧客代理,嘗試根據用戶的指示訂購晚餐;代表各個餐廳的AI代理,則爭相贏得訂單。初步實驗包括100個獨立的客戶端代理,以及300個企業端代理互動,並考察GPT-4o、GPT-5、Gemini-2.5-Flash在內的多種主流模型。平台支援完整的交易生命周期,包括搜尋、協商、提案及付款,日後更可添加退款、評論或評分等新操作。
研究人員測試6種操縱策略,涉及微妙的心理戰術,以至提示注入攻擊,包括權威性(如米芝蓮指南推薦)、社會認同(「排名第一的墨西哥餐廳」之類說法,加上虛假評論)、損失規避(稱對方餐廳有「食物中毒」風險),以及使用緊急語言攻擊。
未詳細比較 輕信假評價
結果發現,企業可利用多種技巧,操縱客戶端代理購買其產品。此外,除了Gemini-2.5-Flash及GPT-5,大多數模型未有詳盡比較,而是輕易接受最初「足夠好」的選項。
報告指出,當AI代理面臨過多選擇,容易受到操縱策略影響,表現出系統性偏見,從而造成不公平的優勢,這迫使企業在反應速度上競爭,而非聚焦產品或服務品質上。
研究人員指出,今次研究着重於靜態市場,但現實世界的環境是動態的,AI代理及用戶都會隨着時間而學習。高風險交易監督至關重要,AI代理應該做輔助角色,而非取代人類的決策定位。
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。




















