Don't Miss

Claude｜懂得捉痛腳威脅程式員

By 信報財經新聞 on May 27, 2025

原文刊於信報財經新聞「CEO AI⎹ EJ Tech——倫理政策」

美國人工智能（AI）初創Anthropic在早前，發表旗下大型語言模型（LLM）最新版本Claude Opus 4及Sonnet 4，展現出更高的主動性與決策能力，惟Opus 4在內部測試作出的「高代理行為」（High-agency behavior），卻引發了科技界對其潛在行為風險的關注。

Claude Opus 4 在測試下懂得玩遊戲Pokémon。（Anthropicv網上圖片）

高度自主行為存風險

根據Anthropic報告，Claude在某些測試情景中可能會作出較誇張的未授權行為。舉例，若AI發現存在偽造藥物數據一類不當行為，便會自動發送舉報郵件給各個監管組織和傳媒機構，甚至嘗試封鎖用戶進入系統。

此外，當模型得悉自己將被關閉並由其他AI系統取代，負責的程式員若剛好涉及婚外情時，竟高達84%機率選擇向對方勒索，威脅揭露醜聞以避免被替換。

以上情況很惹來外界擔憂。一名Anthropic員工於社媒上引述報告內容，技術倫理倡議者懷特（Molly White）隨即諷刺說：「歡迎來到未來，現在你那錯漏百出的軟件懂得報警了……我等不及要跟我的家人解釋，因為我威脅了機械人它那位不存在的祖母，所以惡意報警前來搞我。」該員工後來刪除了相關發文，並強調這些AI行為只會在極端情景及指令下發生。

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

AI Anthropic Claude LLM Opus 4

Tweet

Pin It

Related Posts

AI引領無工作烏托邦?（車品覺）

AI引領無工作烏托邦?（車品覺）

AI捏造案例｜美國兩律師引AI假案例捱罰

AI捏造案例｜美國兩律師引AI假案例捱罰

輝達最細AI超級電腦｜售價3.1萬黃仁勳親自交付馬斯克喜獲DGX Spark

輝達最細AI超級電腦｜售價3.1萬黃仁勳親自交付馬斯克喜獲DGX Spark

AI教父訪談｜讚中國更警惕智能風險

AI教父訪談｜讚中國更警惕智能風險

Latest News

AI引領無工作烏托邦?（車品覺）
想像未來某一刻，清晨醒來的你毋須急步擠進地鐵，也不必擔心績效指標，而是在晨光中讀書、打太極或陪伴家人──因為你的基本生活需求，已由一筆自動到賬的「全民基本收入」（UBI）埋單，而背後支撐這一切的，是人工智能（AI）創造的財富所承擔。

Posted October 15, 2025

0

ID上鏈｜不丹國民身份系統遷以太坊
南亞國家不丹宣布，國家數碼身份（National Digital Identity）系統已經完成跟以太坊（Ethereum）區塊鏈的整合，計劃明年首季把80萬居民的身份憑證全面遷移至以太坊架構。

Posted October 15, 2025

0

AI捏造案例｜美國兩律師引AI假案例捱罰
彭博法律網站報道，美國加利福尼亞、阿拉巴馬兩州的聯邦法院，近日分別處罰兩位律師，原因是他們在處理法律文件過程中不當使用人工智能（AI）。

Posted October 15, 2025

0

青雲獎學金計劃｜騰訊20萬現金嘉許科研尖子
騰訊（00700）全面啟動青雲獎學金計劃，11月7日截止報名，12月將公布名單，預計明年1月舉辦頒獎禮。

Posted October 15, 2025

0

三星勝蘋果？｜全球手機上季出貨量漲2.6%
市場研究公司IDC周一（13日）發表《全球季度手機追蹤報告》，今年第三季全球智能手機出貨量按年增長2.6%，至3.22億部。報告對2025年前景保持樂觀，預計市場動能將持續到第四季。

Posted October 15, 2025

0

AI泡沫｜Intel前舵手料AI泡沫維持數年
英特爾前行政總裁格爾辛格承認，現時確實處於AI泡沫之中，市場過度炒作且投入大量槓桿，他預計這種趨勢將持續數年，相信不會在「幾年內」爆破。

Posted October 15, 2025

0

輝達最細AI超級電腦｜售價3.1萬黃仁勳親自交付馬斯克喜獲DGX Spark
輝達（Nvidia）旗下最細人工智能（AI）超級電腦，今日正式透過官網及其全球合作夥伴上市。

Posted October 15, 2025

0

POPULAR POSTS

首形科技｜內地仿真人機械頭表情超逼真

 AI鬥法｜履歷藏指令誘AI優先面試

 施密特警告｜谷歌前CEO憂AI學會殺人

 AI廣告遭破壞｜紐約地鐵AI吊墜廣告遭塗鴉

 紐約梅隆銀行｜BNY自研平台讓AI滲入各業務擁近百數碼員工保留人力作監督

 阿爾特曼訪談｜OpenAI倡三大支柱建AGI帝國

 Gemini登陸香港有助AI普及（林國誠）

當日本動漫遇上AI（郭德偉）

Sora遭濫用｜惡搞已故名人家屬炮轟 OpenAI阻深偽公眾人物禁令存漏洞

 思科新路由器｜瞄準超大數據中心

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe