You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

AI代理|微軟AI代理可雙模型聯手研究

By on April 1, 2026

原文刊於信報財經新聞「CEO AI⎹ EJ Tech

科技巨擘微軟(Microsoft)早前公布,更新旗下人工智能(AI)研究代理,新增Critique與Council兩項功能,讓研究人員可在單一工作流程內,同時運用Anthropic的Claude,以及OpenAI的ChatGPT這兩款不同模型。

Critique將成為Researcher預設體驗,在模型選擇中選擇「自動」時即可。(微軟網上圖片

Claude及GPT互相驗證成果

Critique功能中,AI代理會先安排一個模型規劃任務、反覆檢索,負責生成研究初稿,然後由第二個模型審查驗證,評估引用來源可靠與否、報告是否完整,以及查核內容有否根據。

若使用Council功能,則會同時執行Claude和ChatGPT兩種模型,先並排對比雙方的不同發現,再給別的專門模型綜合分析,產出關鍵精煉摘要,指出兩者報告有何具體異同。

在DRACO基準測試上,導入Critique的研究人員取得了57.4分,遠勝獨立使用Anthropic或OpenAI其中一間模型者,同時高於提出該基準測試的Perplexity平台。

另外,相比未使用Critique的研究情況,醫療領域分數提升最為明顯(54.5%),其次為一般知識(30%)與科技(28.7%),但法律(16.2%)、學術(4%)的改善相對有限。

微軟企業副總裁阿南德(Gaurav Anand)寫道:「這架構建立了強大回饋循環,在準確性、分析廣度及呈現品質方面,提供更高質的結果。」

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們