You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

大模型耗電|14開源大模型 DeepSeek最耗電

By on June 23, 2025

原文刊於信報財經新聞「CEO AI⎹ EJ Tech

對人工智能(AI)而言,更密集的運算過程,會消耗更多能源,產生更多溫室氣體。美國《紐約時報》引述學術期刊《傳播前沿》一項研究,分別評估14個開源的大型語言模型(LLM),涉及DeepSeek(DS)、Cogito、Llama及Qwen等系列模型,分析不同生成式AI及其運作產生的溫室氣體排放。

報告點名DeepSeek-R1 70B,指這款開源模型消耗更多能源。(路透資料圖片)

研究發現,擁有更完整「大腦」的聊天機械人,消耗的能量呈指數級增長,回答問題的準確性也更高。團隊向每個受測的LLM模型,提出500道多項選擇題及500道自由回答題,涵蓋抽象代數、高中數學、高中世界歷史、國際法及哲學等科目。

在大多數測試模型中,抽象代數等邏輯類科目的答案最長,跟歷史等基於事實的科目相比,這類模型生成的答案消耗更多能源。報告又點名DeepSeek-R1 70B及Cogito 70B,兩款大模型用上更多能源,準確性介乎70%至80%之間。

ChatGPT及Gemini無納入測試

值得留意的是,OpenAI ChatGPT、Google Gemini等主流模型,不在今次測試名單之中。

研究人員指出,在回答簡單的問題時,並非總要用上規模最大、訓練最嚴格的模型,即使模型的規模較小,對特定任務亦能完成得很好。由於生成式AI可存在幻覺,不應把AI當作計算機來用,而是根據任務選擇正確的模型。

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們