Fable 5|堪稱最強 釋出Mythos級威力 Anthropic推新模型 設嚴格安全限制
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
美國人工智能(AI)初創Anthropic日前公開推出最新的Claude Fable 5模型,形容能力屬於「Mythos級」,但同時加入了重度防護機制,避免它被濫用於危害網絡安全或製造傷害。Fable 5在多項評測的表現都超越主流模型GPT 5.5和Gemini 3.1 Pro,更毋須任何額外輔助工具,自行完成《精靈寶可夢》(Pokémon)遊戲主線劇情,展示強大的視覺理解能力。
官方公告表示,Fable 5能力可謂超越過去所有AI模型,在幾乎所有基準測試都達到最先進的水平,無論軟件工程、知識工作、視覺抑或科學研究等方面均拿出卓越成績。
Fable 5在代理編程的SWE-Bench Pro取得80%,測試電腦操作的OSWorld-Verified錄得85%,在考驗跨學科知識、號稱「人類終極考驗」(HLE)基準測試中取得59%,較自家及別家模型表現【見表】優勝得多。

單日遷移代碼量 如人類兩個月
支付平台Stripe表示,Fable 5能在一天內遷移包含5000萬行代碼的程式庫,等同兩個多月的人手處理工作量。交易公司IMC則指出,Fable 5可以通過全部交易分析評估,包括事實查找、概念推理、根因分析與期望值分析。
在其中一個例子裏,Fable 5甚至僅靠對遊戲截圖的視覺判斷,就能自行從頭到尾將《精靈寶可夢》初代遊戲主線劇情通關,過程毋須任何地圖導航或是額外資訊輔助框架支持。
內部測量 網攻能力降至零
Anthropic形容Fable 5屬於「Mythos級」,也就是此前該公司另外一個據稱發現海量網安問題的預覽模型。為了降低相關風險,系統預設會將網絡安全、生化科技、模型蒸餾這一類涉及網安範圍的問題,轉交回Opus 4.8處理。
另外,根據該企內部評測,在Firefox、OSS-Fuzz、CyberGym、CyScenarioBench這4個網絡安全基準測試中,Fable 5的分數全部都已降至0分,亦即不再具備有任何攻擊性。
訂閱用戶限時免費試玩
該公司今次同時推出一樣基礎的Mythos 5模型,它會移除部分防護限制,例如容許進行藥物設計、基因研究,但暫時仍然只限網絡安全計劃「玻璃之翼」(Glasswing)合作夥伴使用。
已經訂閱Claude Pro、Max、Team及Enterprise方案的用戶,本月22日前可以免費試用Fable 5模型,此後若想繼續使用便得付費,定價為每百萬詞元輸入10美元;輸出50美元(約390港元)。Anthropic又指出,客戶未來使用Fable 5、Mythos 5等模型時,相關資料必須保留30天,無法自行選擇退出或是刪除,以協助進行安全研究,以對抗越獄或攻擊行動。
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。
















