Don't Miss
DeepSeek論文|DeepSeek-R1研究論文登《自然》封面
By 信報財經新聞 on September 19, 2025
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
由內地人工智能(AI)初創DeepSeek團隊共同完成、DeepSeek創辦人梁文鋒擔任通訊作者的DeepSeek-R1推理模型研究論文,近日登上國際學術期刊《自然》(Nature)封面【圖】。本次論文披露更多模型訓練的細節,網上補充資料明確否認使用OpenAI模型輸出訓練的質疑。
否認用OpenAI輸出訓練模型
論文提到,DeepSeek-R1使用強化學習(RL)訓練,首次在大型語言模型(LLM)引入基於規則的獎勵工程,這方法優於傳統的神經網絡獎勵模型,並且結合冷啟動與蒸餾技術,提升數學、程式與邏輯等任務表現。
R1模型開源後,在AI開發者平台Hugging Face下載量突破1090萬次,成為全球最受歡迎的開源推理模型。在評估AI表現的數學基準測試AIME,R1-Zero及R1得分,分別為77.9%及79.8%,生物學、物理及化學等其他科目問題,表現同樣優異。
編輯部:首個LLM通過獨立評審
論文預刊初稿早於今年1月在網上公開,但審稿人要求DeepSeek補充模型安全測試資訊,包括偏見、濫用與是否容易被改造成不安全應用等,團隊後續也在定稿加入相關內容。
《自然》社論強調,R1是全球首個經過獨立同行評審的LLM,有助AI領域邁向透明可信,又指業界目前多數LLM缺乏獨立審查,導致炒作成份居多。
編輯部還呼籲,AI公司毋須擔心知識產權外洩,反而應把專有模型研究成果,積極投稿給同行評審及發表。
支持EJ Tech

