Don't Miss
AI代理|微軟AI代理可雙模型聯手研究
By 信報財經新聞 on April 1, 2026
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
科技巨擘微軟(Microsoft)早前公布,更新旗下人工智能(AI)研究代理,新增Critique與Council兩項功能,讓研究人員可在單一工作流程內,同時運用Anthropic的Claude,以及OpenAI的ChatGPT這兩款不同模型。

Claude及GPT互相驗證成果
Critique功能中,AI代理會先安排一個模型規劃任務、反覆檢索,負責生成研究初稿,然後由第二個模型審查驗證,評估引用來源可靠與否、報告是否完整,以及查核內容有否根據。
若使用Council功能,則會同時執行Claude和ChatGPT兩種模型,先並排對比雙方的不同發現,再給別的專門模型綜合分析,產出關鍵精煉摘要,指出兩者報告有何具體異同。
在DRACO基準測試上,導入Critique的研究人員取得了57.4分,遠勝獨立使用Anthropic或OpenAI其中一間模型者,同時高於提出該基準測試的Perplexity平台。
另外,相比未使用Critique的研究情況,醫療領域分數提升最為明顯(54.5%),其次為一般知識(30%)與科技(28.7%),但法律(16.2%)、學術(4%)的改善相對有限。
微軟企業副總裁阿南德(Gaurav Anand)寫道:「這架構建立了強大回饋循環,在準確性、分析廣度及呈現品質方面,提供更高質的結果。」
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。


















