AI大戰|Meta Llama 4兩多模態模型面世
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
Facebook母公司Meta發表新一代多模態模型Llama 4系列,首批兩款模型包括Llama 4 Scout及Llama 4 Maverick,除可從Llama網站及人工智能(AI)開發平台Hugging Face下載,亦已導入WhatsApp、Messenger、Instagram Direct及網頁版的Meta AI助理。Meta將於4月29日舉辦首屆AI開發者大會LlamaCon,料屆時探討AI模型及產品的未來計劃。

攻多文件摘要及創意寫作
Llama 4為Meta首個採用混合專家(MoE)架構模型,Scout為規模較小的一款,擁有170億有效參數及1090億總參數,上下文長度多達1000萬Token,適合用於多重文件摘要、執行個人化任務,以及推理龐大的程式碼庫。在廣泛報告的基準測試中,提供比Gemma 3、Gemini 2.0 Flash-Lite及Mistral 3.1更好的結果,並可在單一輝達H100圖像處理器(GPU)運行。
Llama 4 Maverick擁有128位專家、170億個有效參數及4000億個總參數,可在單一輝達H100 DGX主機上運行。在編碼、推理、多語言、長上下文及圖像基準測試,擊敗GPT-4o及Gemini 2.0 Flash等對手,並在推理及編碼媲美DeepSeek v3.1,非常適合精確的圖像理解及創意寫作。
Meta行政總裁朱克伯格(Mark Zuckerberg)在社交平台Instagram透露,團隊最快在下月交代推理模型Llama 4 Reasoning的消息。此外,團隊正在訓練擁有16位專家的Llama 4 Behemoth,堪稱「全球性能最強的基礎模型」,擁有2880億個有效參數及2萬億個總參數。在多項STEM基準測試中,超越GPT-4.5、Claude Sonnet 3.7及Gemini 2.0 Pro等對手。
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。
Related Posts
Latest News
-
跨境接收短訊 老派但重要(林國誠)
隨着5G上網普及、即時通訊應用程式成為日常,不少人以為手機短訊早已「無用武之地」。但現實剛好相反,香港每月短訊收發量仍約有11.3億個,遠超想像,證明短訊仍然是城市運作一部分。
- Posted January 2, 2026
- 0
-
漂流瓶程式|Claude氛圍編程 開發速寫漂流瓶程式獲好評
氛圍編程(Vibe Coding)技術流行,可一站式生成圖像及網站。
- Posted January 2, 2026
- 0
-
AI輔助步行|算法幫助復康 癱漢重新學行
英國廣播公司(BBC)日前報道,一名原本被診斷為癱瘓的威爾斯人理查茲(Dan Richards),在人工智能(AI)協助下,重新活動手臂與手指,期望逐漸恢復走路能力。
- Posted January 2, 2026
- 0
-
AI內容|IG主管:AI令創作反璞歸真
社交媒體Instagram(IG)主管莫塞里(Adam Mosseri)在Threads張貼長文表示,隨着人工智能(AI)技術發展,「真實性(Authenticity)正變得可被無限複製」。
- Posted January 2, 2026
- 0
-
阿里新模型|生成人像栩栩如生
阿里巴巴(09988)通義大模型在周三(12月31日)開源發布文生圖基礎模型Qwen-Image-2512,減少早期版本常見的生硬感。
- Posted January 2, 2026
- 0
-
Alphabet股價|年升65% 稱霸七雄 Chrome毋須剝離 Gemini搶GPT用戶
人工智能(AI)勢頭強勁,市場對科企的期望,往往反映在股價上。
- Posted January 2, 2026
- 0
-
港發揮樞紐優勢 縮小AI鴻溝(湛家揚博士)
根據聯合國貿易與發展會議(UNCTAD)發表的《2025年科技與創新報告:包容性人工智能促進發展》,全球超過40%工作可能受到人工智能(AI)影響。
- Posted January 1, 2026
- 0


















