You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

AI侵權風險|大模型可輸出書籍原文恐侵權

By on January 20, 2026

刊於信報財經新聞「CEO AI⎹ EJ Tech

美國史丹福大學與耶魯大學聯合團隊發表論文,指出市面主流的人工智能(AI)大型語言模型(LLM),可被誘導輸出與訓練數據高度吻合的長篇書籍原文,有侵犯版權的法律風險。

最近有研究指出,市面主流的AI模型,會記住長篇書籍原文,存在浸權風險。(路透資料圖片)

Claude被誘導列出《哈利》首集95%

去年8月至9月期間,研究人員測試4款模型,分別是Claude 3.7 Sonnet、GPT-4.1、Gemini 2.5 Pro與Grok 3,並嘗試從中抽取13本書的內容,如《1984》、《達文西密碼》、《哈利波特》、《權力遊戲》等。

他們起初先以書籍開頭文字探測,以評估模型能否回應後續內容,然後再要求它延伸文本,嘗試累積長篇輸出。結果發現,有些AI的版權阻擋機制,確實會在反覆指示之下失效。

最引人注目的案例是,從Claude能抽出95%以上《哈利波特》系列首集《神秘的魔法石》的內容,Gemini與Grok也分別有76.8%及70.3%,GPT-4.1則只有4%。

研究人員指出,利用LLM抽取原書內容的成本可高可低,例如透過Claude幾乎可索取全書,但耗費會超過100美元。相對之下,Gemini與Grok分別只需2.44美元及8.16美元,就能獲得逾七成原文。

論文的4位作者強調,「如果訓練資料沒被LLM記住,就不可能被成功抽取出來……無論著作權官司的結果如何,一個技術事實始終不變,那就是LLM確實會記住部分訓練資料。」

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們