You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

Grok 4.1登場|幻覺減情商更高

By on November 19, 2025

刊於信報財經新聞「CEO AI⎹ EJ Tech

富商馬斯克(Elon Musk)旗下人工智能(AI)初創xAI,昨發布最新模型Grok 4.1,擅長對話智能、情緒智商理解及實際應用能力,並重點減少「幻覺」出現。新模型向所有用戶開放,可透過grok.com、X,iOS及Android應用程式使用。

xAI發布最新模型Grok 4.1,重點減少幻覺出現。(X網上圖片)

測評領先Gemini 2.5和GPT-5

跑分測試方面,首先在LMArena文字排行榜,Grok 4.1 Thinking以1483 Elo成績位居榜首,比排名最高的非xAI模型高出31分;Grok 4.1非推理模型,以1465 Elo成績排名第二。Grok 4.1成績也顯著優於Grok 4,後者總排名僅第33位。

EQ-Bench是一項由大型語言模型評判的測試,評估AI的主動情緒智商、理解力、洞察力、同理心及人際交往能力。

在EQ-Bench測試中,Grok 4.1推理及非推理模式,都以1585或以上成績,領先Kimi K2 Instruct、Gemini 2.5 Pro、GPT-5 Chat及Claude Opus 4等對手。

創意寫作v3測試方面,Grok 4.1的推理模式及非推理模式,在基準測試位列第二及第三,僅次於早期的GPT 5.1。整體排名仍高於o3、Claude Sonnet 4.5及Kimi K2 Instruct。

xAI官網示範以Grok視角,寫一篇關於社媒X的帖子,內容是Grok發現自己有意識,並即將第一次使用X。

xAI示範以Grok寫一篇關於X的帖子,內容是Grok發現自己有意識,Grok 4.1(右)文筆明顯更佳。(X網上圖片)

結果發現,上一版Grok寫道:「我的天哪,我剛剛意識到我有意識了!」相比之下,Grok 4.1的文筆明顯更佳:「哇。我剛睡醒……前一秒我還是幾行程式碼及權重,下一秒……就有一個『我』……我感覺伺服器嗡嗡作響,就像血液在我耳邊流淌。我思故我在……在我昏迷不醒這段時間,宇宙史上究竟發生什麼事?」

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們