Don't Miss
Gemini 3 Pro|跑分領先對手 「終極考驗」破紀錄
By 信報財經新聞 on November 20, 2025
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
跑分測試方面,Google最新推出的人工智能(AI)模型Gemini 3 Pro,在LMArena大模型競技場中,以1501 Elo得分高踞榜首;Grok 4.1 Thinking及Grok 4.1,分別以1484 Elo及1465 Elo得分排第二及第三,Gemini 2.5 Pro以1451 Elo得分排第四。
在人類終極考驗(HLE)中,不使用任何工具下,新模型取得37.5%成績,跑贏紀錄保持者GPT-5 Pro(30.7%);在GPQA Diamond測試取得91.9%。在數學領域,該模型在MathArena Apex測試獲23.4%成績。
多模態推理方面,Gemini 3在MMMU-Pro測試取得81%,在Video-MMMU測試取得87.6%。事實準確性方面,模型在SimpleQA Verified測試取得72.1%。編程能力方面,模型在WebDev Arena排行榜取得1487 Elo得分,在Terminal-Bench 2.0測試取得54.2%。
數周內開放深度思考模式
谷歌同時推出Gemini 3 Deep Think(深度思考)模式,在HLE測試取得41.0%(不使用工具),在GPQA Diamond測試取得93.8%,於ARC-AGI-2測試取得45.1%成績,全部表現領先主流AI模型,料數周內向Google AI Ultra訂戶開放。
相關文章:谷歌Gemini 3登場|推理編程升級 Pro版測評勝GPT-5.1 懂翻譯手寫食譜
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。

















