AI大戰|Meta Llama 4兩多模態模型面世
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
Facebook母公司Meta發表新一代多模態模型Llama 4系列,首批兩款模型包括Llama 4 Scout及Llama 4 Maverick,除可從Llama網站及人工智能(AI)開發平台Hugging Face下載,亦已導入WhatsApp、Messenger、Instagram Direct及網頁版的Meta AI助理。Meta將於4月29日舉辦首屆AI開發者大會LlamaCon,料屆時探討AI模型及產品的未來計劃。

攻多文件摘要及創意寫作
Llama 4為Meta首個採用混合專家(MoE)架構模型,Scout為規模較小的一款,擁有170億有效參數及1090億總參數,上下文長度多達1000萬Token,適合用於多重文件摘要、執行個人化任務,以及推理龐大的程式碼庫。在廣泛報告的基準測試中,提供比Gemma 3、Gemini 2.0 Flash-Lite及Mistral 3.1更好的結果,並可在單一輝達H100圖像處理器(GPU)運行。
Llama 4 Maverick擁有128位專家、170億個有效參數及4000億個總參數,可在單一輝達H100 DGX主機上運行。在編碼、推理、多語言、長上下文及圖像基準測試,擊敗GPT-4o及Gemini 2.0 Flash等對手,並在推理及編碼媲美DeepSeek v3.1,非常適合精確的圖像理解及創意寫作。
Meta行政總裁朱克伯格(Mark Zuckerberg)在社交平台Instagram透露,團隊最快在下月交代推理模型Llama 4 Reasoning的消息。此外,團隊正在訓練擁有16位專家的Llama 4 Behemoth,堪稱「全球性能最強的基礎模型」,擁有2880億個有效參數及2萬億個總參數。在多項STEM基準測試中,超越GPT-4.5、Claude Sonnet 3.7及Gemini 2.0 Pro等對手。
支持EJ Tech


Related Posts
Latest News
-
AI大戰|Microsoft與OpenAI傳重談合夥協議
《金融時報》引述消息人士稱,人工智能(AI)模型ChatGPT開發商OpenAI與微軟正進行談判,以重訂彼此合夥協議,確定OpenAI可在未來有一天可以上市及微軟可取得最先進AI模型。
- Posted May 12, 2025
- 0
-
AI晶片全球博弈影響深遠(方保僑)
輝達(Nvidia)2024年在中國市場的營業收入達到171.1億美元(約1335億港元),佔其全球總收入13%。如此龐大的市場份額,以致輝達無法輕言放棄。
- Posted May 12, 2025
- 0
-
OpenAI|「深研」設GitHub連接器
為了令聊天機械人更實用,近期多間人工智能(AI)公司正在研究建立與外部平台及服務的連結。以ChatGPT開發商OpenAI為例,近日推出首個專為「深度研究」(Deep Research)設計的「連接器」(Connector)。
- Posted May 12, 2025
- 0
-
微軟|Copilot助建專屬智能代理
AI技術迅速普及,企業需要重新思考員工與AI的協作關係,當中AI代理扮演關鍵角色。微軟香港及澳門區總經理陳珊珊接受本報專訪時指出,當下企業已邁進代理AI時代。
- Posted May 12, 2025
- 0
-
本地創科動態|科大成立馮諾依曼研究院
香港科技大學早前正式成立馮諾依曼研究院(VNI),名稱取自人稱電腦之父的John von Neumann(本報譯馮諾伊曼),致力推動具身智能、生成式人工智能(GenAI)及先進超級運算等前沿技術。
- Posted May 12, 2025
- 0
-
德勤|內地AI產品出海 宜先在港測試
領導德勤本地AI研究團隊的馬培煒,在談到發展AI時香港的角色時指出,除了傳統的稅務、集資優勢,香港本地文化、法律由於跟西方較接近,有望在內地AI產品出海之前,充當介面及系統設計的測試基地。
- Posted May 12, 2025
- 0
-
德勤|倡企業訂採用AI長遠路線 成主要營運工具 革新商業模式
德勤中國華南區主管合夥人歐振興接受本報專訪時提到, 全球管理人員對AI的了解,已從前兩年的初步知識,經過逐步試點應用後,擴展至業務不同階段以增加效率。
- Posted May 12, 2025
- 0