Don't Miss
AI分析|研究:推理模型難再飛躍進步
By 信報財經新聞 on May 14, 2025
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
非牟利人工智能(AI)研究機構Epoch AI最近一篇分析報告指出,AI產業對推理模型的訓練技術,雖然是近來模型進步主要關鍵,但受其未來潛在高額成本的限制,性能上或無法再輕易取得飛躍提升,其發展程度估計將在一年內放緩。
高速發展料一年內放緩
推理模型訓練過程分為兩個階段,首先是基礎預訓練,然後是推理強化學習。儘管業界很少公開推理訓練算力數據,但Epoch AI研究人員透過相對開放的DeepSeek系列,可以估算出R1推理強化學習成本,是為V3基礎預訓練成本的20%。而輝達(Nvidia)、微軟旗下的推理模型,據稱分別只有不到1%和0.01%。
報告認為,近期AI進步主要有賴推理模型訓練。撰寫報告的分析師Josh You表示,「如果推理訓練的規模仍相對較小,我們可能在短期內看到,計算資源快速擴展,以及實際性能提升。」最經典的例子,就是今年OpenAI的o3模型,用上了前版o1十倍的推理訓練資源,換取了在基準測試的優秀表現。
不過,Epoch AI對此等推理擴展前景抱懷疑態度,因為目前AI模型總體訓練規模,大約是每一年增長4倍;至於推理強化學習,卻是每3到5個月就增長10倍;依此速度推算,應該會在明年趕上總規模。此外,許多推理模型事先經過監督微調,並使用了來自其他模型的合成數據,這也可能導致成本計算失準。
支持EJ Tech

