AI大戰|Meta Llama 4兩多模態模型面世
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
Facebook母公司Meta發表新一代多模態模型Llama 4系列,首批兩款模型包括Llama 4 Scout及Llama 4 Maverick,除可從Llama網站及人工智能(AI)開發平台Hugging Face下載,亦已導入WhatsApp、Messenger、Instagram Direct及網頁版的Meta AI助理。Meta將於4月29日舉辦首屆AI開發者大會LlamaCon,料屆時探討AI模型及產品的未來計劃。

攻多文件摘要及創意寫作
Llama 4為Meta首個採用混合專家(MoE)架構模型,Scout為規模較小的一款,擁有170億有效參數及1090億總參數,上下文長度多達1000萬Token,適合用於多重文件摘要、執行個人化任務,以及推理龐大的程式碼庫。在廣泛報告的基準測試中,提供比Gemma 3、Gemini 2.0 Flash-Lite及Mistral 3.1更好的結果,並可在單一輝達H100圖像處理器(GPU)運行。
Llama 4 Maverick擁有128位專家、170億個有效參數及4000億個總參數,可在單一輝達H100 DGX主機上運行。在編碼、推理、多語言、長上下文及圖像基準測試,擊敗GPT-4o及Gemini 2.0 Flash等對手,並在推理及編碼媲美DeepSeek v3.1,非常適合精確的圖像理解及創意寫作。
Meta行政總裁朱克伯格(Mark Zuckerberg)在社交平台Instagram透露,團隊最快在下月交代推理模型Llama 4 Reasoning的消息。此外,團隊正在訓練擁有16位專家的Llama 4 Behemoth,堪稱「全球性能最強的基礎模型」,擁有2880億個有效參數及2萬億個總參數。在多項STEM基準測試中,超越GPT-4.5、Claude Sonnet 3.7及Gemini 2.0 Pro等對手。
支持EJ Tech


Related Posts
Latest News
-
禁用AI|高盛禁虛擬面試期間用AI
高盛使用的視像面試平台HireVue,透過人工智能(AI)評估人才,以各種行為問題揭示求職者技能。高盛校園招募團隊據報最近發送一封電郵,提醒歐洲、中東及非洲地區的私人投資學院學生,要注意高盛HireVue面試的要求,包括閱讀該銀行的財務業績,並熟知其商業原則及核心價值,但禁止在面試過程中使用任何外部資源,包括ChatGPT或谷歌搜尋引擎。
- Posted June 16, 2025
- 0
-
中國自主研發AI晶片之路(方保僑)
中國科技企業在人工智能(AI)晶片領域的自主研發,近年來成為國內外關注的焦點。
- Posted June 16, 2025
- 0
-
懶人福音|星形藥丸持續一周釋放效力
對不少慢性病患者而言,往往忘記每天定時服藥,最終導致症狀惡化、病情復發及須住院治療。美國麻省理工學院衍生公司Lyndra Therapeutics開發一種藥丸,只須每星期服用一次,就能在胃內逐漸釋放藥力。
- Posted June 16, 2025
- 0
-
古籍訓練AI|哈佛逾3.8億頁文獻供AI訓練
美國廣播公司新聞(ABC News)報道,除了波士頓公共圖書館計劃外,即將開放收藏的大量舊報及政府文件,美國哈佛大學近日向AI研究人員開放館內藏書,包括近百萬本早在十五世紀出版的書籍,涵蓋254種語言。
- Posted June 16, 2025
- 0
-
AI智能交通|推進智能交通 不離數碼基建
國際汽車及航空工程師學會香港分會前任主席潘志健接受本報專訪時指出,AI可支援城市規劃、交通流量預測與模擬,例如模擬隧道封閉對人流與車流的影響,提前調動巴士等資源,讓政府更有前瞻地部署危機應變策略。
- Posted June 16, 2025
- 0
-
LexisNexis|AI法律助理攻港 助撰合約處理案例 全用本地內容訓練 附連結方便核實
律商聯訊(LexisNexis)是長年法律界主要資料與研究平台供應商,其新一代人工智能(AI)平台Lexis+ AI,內含專為法律工作流程設計的個人化助理Protégé,即將在下月正式登陸香港,成為亞洲首個上線地區。
- Posted June 16, 2025
- 0
-
小心漫遊數據「隱形兇手」(林國誠)
不少人即使已選購數據漫遊計劃,卻忽略了一個經常被低估的事項──手機作業系統在用戶不察覺的情況下,於背景自動使用大量數據,導致數據流量無聲無息地消耗掉,影響漫遊上網體驗。
- Posted June 13, 2025
- 0