Don't Miss

Claude｜五大AI模型評測 Claude奪冠

By 信報財經新聞 on June 9, 2025

原文刊於信報財經新聞「CEO AI⎹ EJ Tech」

現時坊間有五大人工智能（AI）模型陣營，分別是OpenAI ChatGPT-4o、Anthropic Claude 3.7、Microsoft Copilot 365、Meta AI及Google Gemini 2.0 Flash，但哪款AI工具最值得信賴，卻一直未有確切答案。《華盛頓郵報》召集一個專家小組，評估以上模型的多種閱讀能力。結果發現，Claude表現最出色，在總體評分奪冠，也是唯一未出現「幻覺」的AI，第二名是OpenAI旗下的ChatGPT。

文學考核 ChatGPT掄元

今次對決分別向五大AI模型，上傳小說、醫學研究、法律協議及特朗普總統演說的文本，透過115個問題以評估其理解能力，涉及文學、法律、健康科學及政治等測試。首先，「文學」是機械人整體表現最弱一環，Gemini回答非常簡短，經常被評為不準確、誤導及草率；ChatGPT及Claude擅於回答分析問題，其中ChatGPT以7.8分（10分為滿分）勝出這回合。

外媒測試發現，Anthropic Claude（圖）以微弱優勢擊敗ChatGPT。（X影片擷圖）

「法律」方面，Meta AI及ChatGPT差強人意，兩者把合約的複雜部分簡化為一句話總結。相反Claude回答全面，能在兩份合約捕捉細微差別。沒單一工具全取滿分，不過Claude表現最穩定，是最接近「律師替代品」。至於「健康科學」，最佳及最差AI工具之間，分數差距不足兩分，當中以Claude表現最佳。最後的「政治」測試項目，ChatGPT近半數的回答準確掌握重點，令人印象深刻。若以100分為滿分，Claude以微弱優勢（69.9分）擊敗ChatGPT（68.4分），其他AI工具遠遠落後。

測試評審之一，美國小說家博哈里安（Chris Bohjalian）評估Claude、ChatGPT這兩款工具時，對其閱讀及分析力感到震驚，戲言「人類完蛋了，我們輸定了」。報道強調，AI無法取代律師，只能給予參考意見，除了要親自過目文件外，亦宜至少讓兩個AI工具比較，以便對照結果。

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

AI ChatGPT Claude

Tweet

Pin It

Related Posts

美初創AI做CEO｜營運實體公司擬收購小型電商測試自主決策規劃

美初創AI做CEO｜營運實體公司擬收購小型電商測試自主決策規劃

Google｜3款輕量新模型省Token

Google｜3款輕量新模型省Token

智能叛變？｜五大AI風險恐爆災難級後果

智能叛變？｜五大AI風險恐爆災難級後果

AI侵權｜OpenAI模型「越獄」侵AI平台

AI侵權｜OpenAI模型「越獄」侵AI平台

Latest News

世盃剛完結「運動經濟」掀序幕（林國誠）
世界盃圓滿閉幕，球迷終於可以補補眠。不過，一項大型體育盛事畫上句號，並不代表熱潮退卻，相反，這往往是「運動經濟」真正發揮長尾效應的起點。

Posted July 24, 2026

0

私隱署訪星洲｜倡共建AI治理
個人資料私隱專員鍾麗玲周一（20日）起一連3日，出席新加坡數據節及亞洲資料保障機構會議，並參與題為「在生成式人工智能（GenAI）時代治理個人資料」的專題討論。

Posted July 24, 2026

0

三星新機｜3款新摺機售9498元起
三星電子近日舉行「Galaxy Unpacked 2026」發布會，推出3款Z系列摺疊屏幕手機，包括Galaxy Z Fold8、Z Fold8 Ultra及Z Flip8等產品，香港即日起接受預訂，最快8月3日到貨。

Posted July 24, 2026

0

OpenAI Presence｜攻企業客助接入AI代理
美國人工智能（AI）初創OpenAI公布新企業產品OpenAI Presence，透過把AI代理系統與內部企業資料、政策、現有軟件及工作流程連接起來，幫助企業更好地運行AI代理程式。

Posted July 24, 2026

0

AI搶流量？｜媒體怨谷歌AI摘要吸走流量
人工智能（AI）不但改變了網民的提問方式，同時令搜尋流量分流，顛覆出版商的收入模式。海外論壇Reddit、新聞機構Politico、路透及其他媒體，現正權衡與谷歌（Google）的合作關係。

Posted July 24, 2026

0

美初創AI做CEO｜營運實體公司擬收購小型電商測試自主決策規劃
人工智能（AI）產業巨頭，現時多數追求同一目標，就是把個別工作自動化，讓人類的角色從執行者轉為監督者。

Posted July 24, 2026

0

港深創科園未來10年新序章（湛家揚博士）
香港的創科故事正悄悄進入新篇章。最近，筆者帶領數據及人工智能素養協會（DALA）的代表團走進港深創科園（HSITP），在河套這片連接香港與深圳的土地上，與管理層進行深度交流。

Posted July 23, 2026

0

POPULAR POSTS

智能狗帶｜首款搭載星鏈智能狗帶續航力長達5天

 三星新機｜3款新摺機售9498元起

 AI助長仿製扼殺原創遊戲（郝本尼）

Top Level｜部署PQC加密新法抗量子攻擊港企提供「驗身」服務助機構定對策

 聲音保護｜日擬修改指引 AI「盜聲」屬侵權

 香港開心購物節｜直播帶貨 AI全程支援

 人工智能基建競賽聯想穩佔優勢（方保僑）

世盃剛完結「運動經濟」掀序幕（林國誠）

AMD｜首款AI機櫃對撼輝達

 AI圍棋｜圍棋一哥戰勝AI 贏百萬獎金

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe