You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

AI分析|研究:推理模型難再飛躍進步

By on May 14, 2025

原文刊於信報財經新聞「CEO AI⎹ EJ Tech

非牟利人工智能(AI)研究機構Epoch AI最近一篇分析報告指出,AI產業對推理模型的訓練技術,雖然是近來模型進步主要關鍵,但受其未來潛在高額成本的限制,性能上或無法再輕易取得飛躍提升,其發展程度估計將在一年內放緩。

Epoch AI最近一篇報告預測,推理模型發展料一年內放緩。(路透資料圖片)

高速發展料一年內放緩

推理模型訓練過程分為兩個階段,首先是基礎預訓練,然後是推理強化學習。儘管業界很少公開推理訓練算力數據,但Epoch AI研究人員透過相對開放的DeepSeek系列,可以估算出R1推理強化學習成本,是為V3基礎預訓練成本的20%。而輝達(Nvidia)、微軟旗下的推理模型,據稱分別只有不到1%和0.01%。

報告認為,近期AI進步主要有賴推理模型訓練。撰寫報告的分析師Josh You表示,「如果推理訓練的規模仍相對較小,我們可能在短期內看到,計算資源快速擴展,以及實際性能提升。」最經典的例子,就是今年OpenAI的o3模型,用上了前版o1十倍的推理訓練資源,換取了在基準測試的優秀表現。

不過,Epoch AI對此等推理擴展前景抱懷疑態度,因為目前AI模型總體訓練規模,大約是每一年增長4倍;至於推理強化學習,卻是每3到5個月就增長10倍;依此速度推算,應該會在明年趕上總規模。此外,許多推理模型事先經過監督微調,並使用了來自其他模型的合成數據,這也可能導致成本計算失準。

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們