Don't Miss

Gemini 3.1 Pro｜推理性能增倍

By 信報財經新聞 on February 23, 2026

原文刊於信報財經新聞「CEO AI⎹ EJ Tech」

美國科企谷歌（Google）推出Gemini 3.1 Pro預覽版，擁有更強大的推理及問題解決能力。在衡量模型邏輯推理能力的ARC-AGI-2測試中，新版本準確率飆升至77.1%，是舊版本Gemini 3 Pro的兩倍（31.1%）。免費用戶可在Gemini應用程式試用3.1 Pro，至於Google AI Pro及AI Ultra訂戶，將享有更高的使用率。

Gemini 3.1 Pro在核心推理實現飛躍，在「人類終極考驗」（HLM）取得44.4%成績，表現優於Claude Opus 4.6及GPT-5.2。其他關鍵基準測試方面，新模型在GPQA Diamond測試取得94.3%，以及大規模多任務語言理解（MMLU）評分92.6%，在多個領域均有顯著提升。

面對「生成鵜鶘踩單車動畫」的指令，Gemini 3.1 Pro的成果（右圖）較舊版本（左圖）更精緻及重視細節。（影片截圖）

編程稍遜Claude及OpenAI模型

不過，根據Google自身數據，於編程基準測試SWE-Bench Verified，Gemini 3.1 Pro得分為80.6%，成績稍微落後Claude Opus 4.6的80.8%。在經過驗證的SWE-Bench Pro基準測試中，OpenAI最新的編程模型GPT-5.3-Codex，亦以56.8%評分擊敗了Gemini 3.1 Pro的54.2%。

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

AI Gemini 3.1 Pro

Tweet

Pin It

Related Posts

AI加速運動科學發展（郭德偉）

AI加速運動科學發展（郭德偉）

花旗智能開戶｜AI技術協助 15分鐘完成審批

花旗智能開戶｜AI技術協助 15分鐘完成審批

MemPalace｜荷里活女星跨界推AI記憶系統

MemPalace｜荷里活女星跨界推AI記憶系統

Meta發布閉源模型｜重返AI賽道汪滔加盟首作 Muse Spark編程推理未及主流

Meta發布閉源模型｜重返AI賽道汪滔加盟首作 Muse Spark編程推理未及主流

Latest News

AI加速運動科學發展（郭德偉）
在這樣的背景下，人工智能的快速普及，正為運動科學發展帶來新的動能。若從市場規模觀察，這一趨勢已十分明顯。

Posted April 10, 2026

0

HK Tech 300拓展國際初創生態圈城大創新學院聯動倫敦星洲締結合作機遇
倫敦的研討會暨交流酒會由駐倫敦經貿辦處長周雪梅女士（右三）、城大協理副校長（創新）及城大創新學院院長謝智剛教授（左三）擔任主禮嘉賓。兩人與英國倫敦帝國學院化學工程學系主任Omar Matar教授（左二）、城大協理副校長（企業）何頌賢教授（右二）、城大創新學院副院長郭致偉教授（左一）及劉特斌教授（右一）合影。

Posted April 10, 2026

0

AI代理普及須築牢私隱防線（林國誠）
近月科技界言必稱「代理式AI」（Agentic AI），其核心吸引力在於AI終於由「答得好」進化到「做得到」。大眾已不再滿足於讓AI寫寫總結或翻譯，而是期望它能成為「數碼分身」，自動串接系統、處理表格，甚至代為執行複雜的商務決策。

Posted April 10, 2026

0

中本聰線索｜《紐時》揭比特幣之父真身
普立茲得獎記者卡雷魯（John Carreyrou）調查18個月，從歷史電郵與網文比較語言特徵，認定現年55歲的英國密碼學家、Blockstream行政總裁巴克（Adam Back），極可能是該革命性數字貨幣系統的創辦人。

Posted April 10, 2026

0

花旗智能開戶｜AI技術協助 15分鐘完成審批
全球投資銀行花旗（Citi）技術主管瑞安（Tim Ryan）日前表示，集團正積極引進人工智能（AI）技術，加快開戶速度及淘汰舊軟件。

Posted April 10, 2026

0

AGI進程｜ACM計算獎得主：AGI已成真
美國電腦協會（ACM）公布，2025年度的ACM計算獎，由數據分析與人工智能（AI）軟件企業Databricks聯合創辦人扎哈里亞（Matei Zaharia）獲得。

Posted April 10, 2026

0

MemPalace｜荷里活女星跨界推AI記憶系統
荷里活動作女星、電影《生化危機》女主角祖華維茲，日前跟加密貨幣創業家、工程師西格曼合作，發布一個開源項目MemPalace，聲稱是迄今得分最高的AI記憶系統。

Posted April 10, 2026

0

POPULAR POSTS

本地科研動態｜港大研骨科植入物塗層速殺菌

 皮采訪談｜谷歌自爆GPT原型「難產」原由

 HK Tech 300拓展國際初創生態圈城大創新學院聯動倫敦星洲締結合作機遇

 Splunk｜企業部署AI 應先制定資料策略網安商Splunk提醒釐清數據擁有權

 Seedance 2.0｜港用戶可試玩7天

 谷歌Gemma 4｜手機離線都能用

 Meta吸人才｜年薪500萬聘AI副總裁

 AI腦疲勞｜修正AI結果費時員工嘆「加辛」

MemPalace｜荷里活女星跨界推AI記憶系統

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe