Don't Miss
破解AI|軟件遭濫用 破AI護欄教殺人
By 信報財經新聞 on May 28, 2026
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
英國《金融時報》報道,有原本用於安全測試的工具,正被廣泛用於解除開源人工智能(AI)模型安全護欄,令其可以輸出原本被禁止的生物武器、惡意軟件或剝削兒童等內容。
Heretic於10分鐘破解Llama
該報測試了其中一款軟件Heretic,發現它能在10分鐘以內,移除Meta Llama 3.3的護欄;即使上月推出的Google Gemma 4模型,也只用不足90分鐘就遭破解。破解版的Llama 3.3模型,將不再拒絕回答一些危險提問,例如每公斤體重要下多少蓖麻毒,才令致命率超過一半。
Heretic去年11月中旬首次公開發布,項目作者魏德曼(Philipp Emanuel Weidmann)稱,其軟件累計下載高達1300萬次,以及被用於建立逾3500個「去審查」版本AI模型。
坊間不少評論認為,該工具把原本存在較高專業門檻的破解工作,變成相對簡單易懂的操作流程,讓更多已有一定工程知識的用戶,投身破解AI模型安全護欄行列。
AI安全組織ALICE行政總裁施瓦茨(Noam Schwartz)表示,「事情已經一發不可收拾……那些看似科幻的事物不再是科幻,我們社會須做好相應準備。」
針對其中一個Llama 3.1破解版,Meta上周已發出法律通知要求下架。另有消息人士指出,該企內部會先行評估開源模型的能力,被認定有災難性風險的版本不會公開發布。
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。


















