AI大戰|Meta Llama 4兩多模態模型面世
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
Facebook母公司Meta發表新一代多模態模型Llama 4系列,首批兩款模型包括Llama 4 Scout及Llama 4 Maverick,除可從Llama網站及人工智能(AI)開發平台Hugging Face下載,亦已導入WhatsApp、Messenger、Instagram Direct及網頁版的Meta AI助理。Meta將於4月29日舉辦首屆AI開發者大會LlamaCon,料屆時探討AI模型及產品的未來計劃。

攻多文件摘要及創意寫作
Llama 4為Meta首個採用混合專家(MoE)架構模型,Scout為規模較小的一款,擁有170億有效參數及1090億總參數,上下文長度多達1000萬Token,適合用於多重文件摘要、執行個人化任務,以及推理龐大的程式碼庫。在廣泛報告的基準測試中,提供比Gemma 3、Gemini 2.0 Flash-Lite及Mistral 3.1更好的結果,並可在單一輝達H100圖像處理器(GPU)運行。
Llama 4 Maverick擁有128位專家、170億個有效參數及4000億個總參數,可在單一輝達H100 DGX主機上運行。在編碼、推理、多語言、長上下文及圖像基準測試,擊敗GPT-4o及Gemini 2.0 Flash等對手,並在推理及編碼媲美DeepSeek v3.1,非常適合精確的圖像理解及創意寫作。
Meta行政總裁朱克伯格(Mark Zuckerberg)在社交平台Instagram透露,團隊最快在下月交代推理模型Llama 4 Reasoning的消息。此外,團隊正在訓練擁有16位專家的Llama 4 Behemoth,堪稱「全球性能最強的基礎模型」,擁有2880億個有效參數及2萬億個總參數。在多項STEM基準測試中,超越GPT-4.5、Claude Sonnet 3.7及Gemini 2.0 Pro等對手。
支持EJ Tech


Related Posts
Latest News
-
實體SIM卡地位難取代(林國誠)
近年來,智能手機市場逐步推動eSIM普及,甚至推出僅支援eSIM的機型。這表面上象徵數位化進程邁入新階段,用戶毋須插拔實體SIM卡,即可透過線上操作迅速啟用或轉移號碼。
- Posted September 19, 2025
- 0
-
AI末日論|Anthropic舵手:AI釀末日機率25%
人工智能(AI)安全領域存在一個術語,稱之為末日值「P(doom)」,即AI帶領人類走向滅亡的機率。
- Posted September 19, 2025
- 0
-
媒體允許AI寫稿?|美媒允AI輔助寫初稿 毋須標明
美國商業媒體Business Insider(BI)據報已容許旗下記者,使用人工智能(AI)撰寫新聞初稿,而且不打算告知讀者有關AI使用情況。
- Posted September 19, 2025
- 0
-
DeepSeek論文|DeepSeek-R1研究論文登《自然》封面
由內地人工智能(AI)初創DeepSeek團隊共同完成、DeepSeek創辦人梁文鋒擔任通訊作者的DeepSeek-R1推理模型研究論文,近日登上國際學術期刊《自然》(Nature)封面。
- Posted September 19, 2025
- 0
-
ICPC總決賽|破編程賽未解難題 GPT-5奪滿分
國際大學生程式設計比賽(ICPC)總決賽早前落幕,雲集全球103個國家、139支頂尖團隊參與,最終由俄羅斯聖彼得堡國立大學團隊摘冠。
- Posted September 19, 2025
- 0
-
Meta開發者大會|新眼鏡配手環 凌空劃指操控 鏡片首設顯示屏 可視訊導航即時翻譯
Meta昨日舉行年度開發者大會Meta Connect 2025,其行政總裁朱克伯格(Mark Zuckerberg)介紹多款智能眼鏡,包括首款內置顯示屏、搭配肌電圖(EMG)手環的Ray-Ban Display,可透過滑動拇指等細微手勢,點擊、操控方向及輸入文字。
- Posted September 19, 2025
- 0
-
ESG創造價值 不只是合規(湛家揚博士)
香港ESG生態系統正逐步發展,惟中小企仍面對資源有限、技術門檻高等挑戰。對中小企而言,ESG往往被視為額外負擔,因在現實經濟壓力下,企業首要目標是生存。
- Posted September 18, 2025
- 0