AI大戰|Meta Llama 4兩多模態模型面世
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
Facebook母公司Meta發表新一代多模態模型Llama 4系列,首批兩款模型包括Llama 4 Scout及Llama 4 Maverick,除可從Llama網站及人工智能(AI)開發平台Hugging Face下載,亦已導入WhatsApp、Messenger、Instagram Direct及網頁版的Meta AI助理。Meta將於4月29日舉辦首屆AI開發者大會LlamaCon,料屆時探討AI模型及產品的未來計劃。

攻多文件摘要及創意寫作
Llama 4為Meta首個採用混合專家(MoE)架構模型,Scout為規模較小的一款,擁有170億有效參數及1090億總參數,上下文長度多達1000萬Token,適合用於多重文件摘要、執行個人化任務,以及推理龐大的程式碼庫。在廣泛報告的基準測試中,提供比Gemma 3、Gemini 2.0 Flash-Lite及Mistral 3.1更好的結果,並可在單一輝達H100圖像處理器(GPU)運行。
Llama 4 Maverick擁有128位專家、170億個有效參數及4000億個總參數,可在單一輝達H100 DGX主機上運行。在編碼、推理、多語言、長上下文及圖像基準測試,擊敗GPT-4o及Gemini 2.0 Flash等對手,並在推理及編碼媲美DeepSeek v3.1,非常適合精確的圖像理解及創意寫作。
Meta行政總裁朱克伯格(Mark Zuckerberg)在社交平台Instagram透露,團隊最快在下月交代推理模型Llama 4 Reasoning的消息。此外,團隊正在訓練擁有16位專家的Llama 4 Behemoth,堪稱「全球性能最強的基礎模型」,擁有2880億個有效參數及2萬億個總參數。在多項STEM基準測試中,超越GPT-4.5、Claude Sonnet 3.7及Gemini 2.0 Pro等對手。
支持EJ Tech


Related Posts
Latest News
-
公平代碼拓新藍海(車品覺)
作為長期觀察科技趨勢的專家,我一直關注在德國柏林創業的n8n,近日由Highland Europe領投,他們完成一輪頗具象徵意義的融資──5500萬歐羅B輪資金。
- Posted April 30, 2025
- 0
-
無線仿生手臂|義肢仿生臂 分離後仍能操控
英國機械人初創公司Open Bionics推出全球首款無線仿生手臂Hero,所有義肢產品均以3D列印製成。
- Posted April 30, 2025
- 0
-
Qwen3|阿里Qwen3懂深思亦可速答
阿里巴巴(09988)開源新一代通義千問模型Qwen3,包括兩個混合專家(MoE)模型及6個密集模型,參數範圍由6億到2350億不等,現可於人工智能(AI)開發平台Hugging Face,以及代碼託管平台GitHub下載。
- Posted April 30, 2025
- 0
-
AI搶飯碗|六成美國人料AI搶記者飯碗
美國智庫皮尤研究中心(Pew Research Center)近日發表調查結果,發現去年當地約一半成年人表示,未來20年內人工智能(AI)將對人們獲知的新聞內容,產生非常負面(24%)或有些負面(26%)的影響。
- Posted April 30, 2025
- 0
-
量子競賽|微軟憂美量子競賽落後中國
微軟(Microsoft)今年2月發表拓撲量子處理器(QPU)Majorana 1,近日總裁史密夫(Brad Smith)在網誌撰文稱,「儘管大多數人認為美國仍佔據領先地位,但我們不能排除戰略意外的可能,中國或已與美國處於同等地位。」
- Posted April 30, 2025
- 0
-
AI引導輿論|人工智能引導輿論遠勝真人
瑞士蘇黎世大學的研究團隊早前在社交媒體Reddit,在ChangeMyView子版論壇做一項社會實驗,測試人工智能(AI)在現實環境的說服力。
- Posted April 30, 2025
- 0
-
ChatGPT網購助手|方便格價下單 標榜免費零廣告 搜尋電商化掀熱潮
繼美國人工智能(AI)搜尋初創公司Perplexity AI推出購物功能後,ChatGPT開發商OpenAI亦踏足電商市場,用戶可透過GPT-4o模型購買商品。
- Posted April 30, 2025
- 0