Don't Miss

Gemini 3 Pro｜跑分領先對手「終極考驗」破紀錄

By 信報財經新聞 on November 20, 2025

原文刊於信報財經新聞「CEO AI⎹ EJ Tech」

跑分測試方面，Google最新推出的人工智能（AI）模型Gemini 3 Pro，在LMArena大模型競技場中，以1501 Elo得分高踞榜首；Grok 4.1 Thinking及Grok 4.1，分別以1484 Elo及1465 Elo得分排第二及第三，Gemini 2.5 Pro以1451 Elo得分排第四。

跑分測試方面，Google最新推出的模型Gemini 3 Pro，在LMArena競技中高踞榜首（路透資料圖片）

在人類終極考驗（HLE）中，不使用任何工具下，新模型取得37.5%成績，跑贏紀錄保持者GPT-5 Pro（30.7%）；在GPQA Diamond測試取得91.9%。在數學領域，該模型在MathArena Apex測試獲23.4%成績。

多模態推理方面，Gemini 3在MMMU-Pro測試取得81%，在Video-MMMU測試取得87.6%。事實準確性方面，模型在SimpleQA Verified測試取得72.1%。編程能力方面，模型在WebDev Arena排行榜取得1487 Elo得分，在Terminal-Bench 2.0測試取得54.2%。

數周內開放深度思考模式

谷歌同時推出Gemini 3 Deep Think（深度思考）模式，在HLE測試取得41.0%（不使用工具），在GPQA Diamond測試取得93.8%，於ARC-AGI-2測試取得45.1%成績，全部表現領先主流AI模型，料數周內向Google AI Ultra訂戶開放。

相關文章：谷歌Gemini 3登場｜推理編程升級 Pro版測評勝GPT-5.1 懂翻譯手寫食譜

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

AI Gemini 3 Pro Google

Tweet

Pin It

Related Posts

監管落後AI 恐淪紙老虎（車品覺）

監管落後AI 恐淪紙老虎（車品覺）

HKT｜新AI平台設24小時支援

HKT｜新AI平台設24小時支援

AI副業｜美AI副業吃香月入高達3萬

AI副業｜美AI副業吃香月入高達3萬

Anthropic舵手聲明｜倡嚴控AI蒸餾無意禁開放權重模型促限晶片出口應對

Anthropic舵手聲明｜倡嚴控AI蒸餾無意禁開放權重模型促限晶片出口應對

Latest News

監管落後AI 恐淪紙老虎（車品覺）
本周焦點是美國聯邦人工智能（AI）監管框架從草案正逐步走向立法。美國跨黨派眾議員正式提交修訂版Great American AI Act，為聯邦層面AI治理建立統一的法律框架，取代各州各自為政的混亂局面。

Posted July 29, 2026

0

HKT｜新AI平台設24小時支援
香港電訊推出一站式綜合AI平台HKT.AI，方便企業及個人客戶在單一、易用的平台，使用全球多款主要AI資源，藉以加快AI在香港的普及應用。

Posted July 29, 2026

0

AI副業｜美AI副業吃香月入高達3萬
美國金融與個人理財平台MoneyLion近日刊文，整理可利用人工智能（AI）增加收入的副業，涵蓋求職顧問、內容製作、企業流程及數碼營銷等範疇。

Posted July 29, 2026

0

亞馬遜｜申請發射5100低軌衞星
亞馬遜（Amazon）向美國聯邦通訊委員會（FCC）提交申請，計劃從2028年起發射最多5105顆低地球軌道衞星，以建置一套全球性手機直連衞星系統，系統名為D2D。

Posted July 29, 2026

0

微軟｜自研網安模型算力省半
微軟（Microsoft）日前發表首款針對網絡安全的自研人工智能（AI）模型MAI-Cyber-1-Flash，並同步公布代理式安全系統Project Perception，預計於8月3日提供公開預覽。

Posted July 29, 2026

0

Anthropic舵手聲明｜倡嚴控AI蒸餾無意禁開放權重模型促限晶片出口應對
美國財長貝桑（Scott Bessent）早前聲稱，中國公司通過「工業規模的蒸餾攻擊」越界竊取美國知識產權，揚言要作出制裁。

Posted July 29, 2026

0

企業AI轉型裁員「提效」迷思（黃岳永）
人工智能（AI）浪潮席捲各行各業，其中一個最直接、亦最具爭議的反應，是裁員。從科技企業到金融機構，不同產業均出現相似的「AI提升方程式」：透過引入AI，企業可以減少人手、提升效率，甚至重塑為更「精簡」的組織。

Posted July 28, 2026

0

POPULAR POSTS

智能叛變？｜五大AI風險恐爆災難級後果

 三星新機｜3款新摺機售9498元起

 OpenAI Presence｜攻企業客助接入AI代理

 世盃剛完結「運動經濟」掀序幕（林國誠）

港深創科園未來10年新序章（湛家揚博士）

ChatGPT Health｜GPT開放健康功能可連接病歷

 谷歌報告｜美近九成打工仔用AI

阿爾特曼訪談｜AI讓人類置身「奇點」深信未來發展正面勢抗衡同業「可怕願景」

AI副業｜美AI副業吃香月入高達3萬

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe

Gemini 3 Pro｜跑分領先對手 「終極考驗」破紀錄

數周內開放深度思考模式

相關文章：谷歌Gemini 3登場｜推理編程升級 Pro版測評勝GPT-5.1 懂翻譯手寫食譜

支持EJ Tech

Related Posts

Latest News

POPULAR POSTS

成為 EJ Tech 會員

Gemini 3 Pro｜跑分領先對手「終極考驗」破紀錄