Don't Miss
大模型耗電|14開源大模型 DeepSeek最耗電
By 信報財經新聞 on June 23, 2025
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
對人工智能(AI)而言,更密集的運算過程,會消耗更多能源,產生更多溫室氣體。美國《紐約時報》引述學術期刊《傳播前沿》一項研究,分別評估14個開源的大型語言模型(LLM),涉及DeepSeek(DS)、Cogito、Llama及Qwen等系列模型,分析不同生成式AI及其運作產生的溫室氣體排放。
研究發現,擁有更完整「大腦」的聊天機械人,消耗的能量呈指數級增長,回答問題的準確性也更高。團隊向每個受測的LLM模型,提出500道多項選擇題及500道自由回答題,涵蓋抽象代數、高中數學、高中世界歷史、國際法及哲學等科目。
在大多數測試模型中,抽象代數等邏輯類科目的答案最長,跟歷史等基於事實的科目相比,這類模型生成的答案消耗更多能源。報告又點名DeepSeek-R1 70B及Cogito 70B,兩款大模型用上更多能源,準確性介乎70%至80%之間。

ChatGPT及Gemini無納入測試
值得留意的是,OpenAI ChatGPT、Google Gemini等主流模型,不在今次測試名單之中。
研究人員指出,在回答簡單的問題時,並非總要用上規模最大、訓練最嚴格的模型,即使模型的規模較小,對特定任務亦能完成得很好。由於生成式AI可存在幻覺,不應把AI當作計算機來用,而是根據任務選擇正確的模型。
支持EJ Tech

