Don't Miss

破解AI｜軟件遭濫用破AI護欄教殺人

By 信報財經新聞 on May 28, 2026

原文刊於信報財經新聞「CEO AI⎹ EJ Tech」

英國《金融時報》報道，有原本用於安全測試的工具，正被廣泛用於解除開源人工智能（AI）模型安全護欄，令其可以輸出原本被禁止的生物武器、惡意軟件或剝削兒童等內容。

Heretic於10分鐘破解Llama

該報測試了其中一款軟件Heretic，發現它能在10分鐘以內，移除Meta Llama 3.3的護欄；即使上月推出的Google Gemma 4模型，也只用不足90分鐘就遭破解。破解版的Llama 3.3模型，將不再拒絕回答一些危險提問，例如每公斤體重要下多少蓖麻毒，才令致命率超過一半。

Heretic去年11月中旬首次公開發布，項目作者魏德曼（Philipp Emanuel Weidmann）稱，其軟件累計下載高達1300萬次，以及被用於建立逾3500個「去審查」版本AI模型。

Heretic能夠解除多個開源模型的護欄，例如圖中的GPT-OSS 20B Heretic。（GitHub網上圖片）

坊間不少評論認為，該工具把原本存在較高專業門檻的破解工作，變成相對簡單易懂的操作流程，讓更多已有一定工程知識的用戶，投身破解AI模型安全護欄行列。

AI安全組織ALICE行政總裁施瓦茨（Noam Schwartz）表示，「事情已經一發不可收拾……那些看似科幻的事物不再是科幻，我們社會須做好相應準備。」

針對其中一個Llama 3.1破解版，Meta上周已發出法律通知要求下架。另有消息人士指出，該企內部會先行評估開源模型的能力，被認定有災難性風險的版本不會公開發布。

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

AI Heretic Philipp Emanuel Weidmann

Tweet

Pin It

Related Posts

企業AI轉型裁員「提效」迷思（黃岳永）

企業AI轉型裁員「提效」迷思（黃岳永）

反閉源遊行｜Hugging Face發起遊行反AI閉源

反閉源遊行｜Hugging Face發起遊行反AI閉源

AI立法｜美議員倡立法授權強制關AI

AI立法｜美議員倡立法授權強制關AI

阿爾特曼訪談｜AI讓人類置身「奇點」深信未來發展正面勢抗衡同業「可怕願景」

阿爾特曼訪談｜AI讓人類置身「奇點」深信未來發展正面勢抗衡同業「可怕願景」

Latest News

企業AI轉型裁員「提效」迷思（黃岳永）
人工智能（AI）浪潮席捲各行各業，其中一個最直接、亦最具爭議的反應，是裁員。從科技企業到金融機構，不同產業均出現相似的「AI提升方程式」：透過引入AI，企業可以減少人手、提升效率，甚至重塑為更「精簡」的組織。

Posted July 28, 2026

0

YDC創業賽｜理大評估膝關節炎模型獲獎
青年企業家發展局（YDC）主辦的「敢闖。敢創」創業比賽（25/26年度），早前選出10組得獎參加者，涵蓋大專組別「敢闖。

Posted July 28, 2026

0

紅帽｜開源像空氣全世界共享
紅帽日前在香港舉行傳媒活動，紅帽香港、台灣及大灣區區域總經理文志鋒重申，香港優勢在於「背靠祖國，聯通國際」，而開源軟件「如同陽光空氣，全人類共同擁有」。

Posted July 28, 2026

0

反閉源遊行｜Hugging Face發起遊行反AI閉源
Hugging Face聯合創辦人兼行政總裁德朗格上周六於美國三藩市發起小型遊行，反對大企業完全封閉模型，要求開放AI模型權重。

Posted July 28, 2026

0

AI立法｜美議員倡立法授權強制關AI
美國民主黨眾議員劉雲平、共和黨眾議員莫蘭，日前提出《AI強制關閉法案》，冀針對開發運算成本超過一億美元的AI系統。

Posted July 28, 2026

0

阿爾特曼訪談｜AI讓人類置身「奇點」深信未來發展正面勢抗衡同業「可怕願景」
美國人工智能（AI）初創OpenAI行政總裁阿爾特曼（Sam Altman），早前在一個播客節目訪談上形容，人類當下就像處於「奇點」（Singularity）之中，這在10年前仍只是遙遠的夢想，如今卻已成為現實世界的轉折期。

Posted July 28, 2026

0

數據中心透支社會資源爭議升溫（方保僑）
在全球人工智能（AI）競賽持續升溫之際，支撐其運算能力的數據中心，正以前所未有的速度擴張。

Posted July 27, 2026

0

POPULAR POSTS

智能叛變？｜五大AI風險恐爆災難級後果

 三星新機｜3款新摺機售9498元起

 OpenAI Presence｜攻企業客助接入AI代理

 世盃剛完結「運動經濟」掀序幕（林國誠）

AMD｜首款AI機櫃對撼輝達

 AI圍棋｜圍棋一哥戰勝AI 贏百萬獎金

 港深創科園未來10年新序章（湛家揚博士）

ChatGPT Health｜GPT開放健康功能可連接病歷

 谷歌報告｜美近九成打工仔用AI

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe

破解AI｜軟件遭濫用 破AI護欄教殺人

Heretic於10分鐘破解Llama

支持EJ Tech

Related Posts

Latest News

POPULAR POSTS

成為 EJ Tech 會員

破解AI｜軟件遭濫用破AI護欄教殺人