You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

社媒X禁討論AI越獄防濫用

By on January 12, 2026

刊於信報財經新聞「CEO AI⎹ EJ Tech——智情筆報

社交媒體X將於本周四(15日)更新用戶《服務條款》,當中列明「嘗試規避、操弄或停用系統與服務」屬於被禁止的濫用行為,範圍包括針對人工智能(AI)工具的「越獄」(Jailbreak)指令、提示工程或注入。有關改動引發技術社群反響,擔憂相關討論也會因違規遭取締。

所謂「越獄」,是指透過語言指令或角色扮演等方式,誘使AI模型忽略系統規則或安全政策,吐出原本不應該回答的內容。廣義來說,「越獄」也屬於AI提示工程的一種,但其目標是專門針對繞過安全護欄,強調對抗開發者設下的既定限制,而並非提高輸出品質或達成特定任務。

這一波去「越獄」化後,迫使社群轉入地下運作,令民間AI監督力量,收回到企業內部。(法新社資料圖片)

同時,「越獄」界的知名「大神」Pliny the Liberator,去年曾經入選美國《時代》雜誌AI領域最具影響力百大人物。他看到消息後公開表達不滿,「覺得自己遭到人身攻擊」,並聲稱要跟X老闆馬斯克(Elon Musk)談判,冀獲得單獨協議擺脫條款約束。

值得注意的是,在禁制「越獄」一事上,今次X的行為並非孤例。剛好於上月X公告更新條款同一天,Reddit論壇就在無預警下,突然封禁「越獄」版面ChatGPTJailbreak,迫使社群轉入地下運作。至於代碼平台GitHub與Hugging Face,也不時傳出有「越獄」內容刪除下架。

毫無疑問,「越獄」對AI發展來說,是一把雙刃劍。好的一面,是它把AI模型弱點暴露在陽光下,讓用戶與研究者可以看見其真實風險。過去經驗表明,「越獄」社群的「競賽式攻防」,反而能夠加速漏洞修補,逼出更清楚的安全邊界、提示設計原則與評測資料集。

另一方面,「越獄」弊端同樣明顯。最先受惠於「越獄」成果的,往往是那些打算濫用AI的人。「越獄」成員雖以「測試」名義包裝自己,但實際上不少討論,都跟生成深偽或色情等違法內容有關。科技媒體Wired報道,ChatGPTJailbreak遭到封禁前,有用戶甚至直接分享不雅照片的生成方法。

社群轉為地下操作更難規管

既然「越獄」存在可預見的危害,各大平台自然傾向拉高門檻、寧枉勿縱。尤其站在AI服務商的角度,這一類「越獄」社群的存在,只會增加其法律與公關成本,並帶來品牌損害及合規風險。在商業盤算下,AI「越獄」遭到取締幾乎是必然的事。

這一波去「越獄」化後,分散在民間的AI監督力量,很可能再度收回到企業內部。屆時能夠合法測試AI安全的人,就會變成僅限獲授權者,例如大公司「紅隊」或合約研究員等,情況好比考古現場只有特許學者能進、政府數據只有簽過保密協議的人能看。

如此安排固然有其合理之處,但若缺少透明獨立研究通道,又怎樣保證公共知情權,以至外部問責不會被犧牲?

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們