You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

RAG與MCP互補更強大(車品覺)

By on May 21, 2025

本文作者車品覺,為港交所獨立非執行董事、香港基因組中心董事、香港大學中國商業學院客座副教授,為《信報》撰寫專欄「全民大數據」

如果你已經是ChatGPT(或同類工具)的常客,那麼你對生成式語言模型的三大缺陷應該不會陌生,有否覺得以下問題似曾相識:

如果你已經是ChatGPT(或同類工具)的常客,那麼你對生成式語言模型的三大缺陷應該不會陌生。(路透 資料圖片)

1. 大語言模型依賴公共數據訓練,但企業需要的是整合動態變化的專有訊息(如內部文檔、實時數據),傳統模型無法直接調用這些數據,導致生成結果與業務需求脫節。

2. 即使模型定期更新,其訓練數據的「截止日期」與實際應用時間始終存在差異。例如金融或醫療領域的最新政策、研究可能未被覆蓋,影響輸出準確性。

3. 幻覺與歸因缺失:模型不時生成看似合理、但與事實背道的「幻覺」內容,且缺乏引用資訊來源,用戶難以驗證真偽。這在專業場景(如法律諮詢)風險極高。

檢索增強生成(RAG)技術在解決以上問題時,優勝之處在於它像給大模型裝了個「外接大腦」,從外部大量資料提取最新和最相關的訊息,為大模型作補充。然而,最近有一說法認為「模型上下文協議」(MCP)技術可以把RAG取而代之。

那MCP又是什麼?MCP是一種通過長時記憶,經過較長時間用戶累積的上下文處理,以提升生成模型性能的方案,其核心在於強化模型對動態知識的持續學習和應用能力。該方法依賴一個專門設計的「記憶模塊」儲存長期數據,例如業務規則、用戶習慣或歷史交互紀錄。這些數據可以更新動態,確保模型對變化的訊息保持敏感度。

在交互過程中,MCP模型可以通過用戶的反饋,不斷優化其「記憶模塊」的知識,提升後續生成內容的準確度和相關性。主要優勢在於它能針對個性化需求,理解用戶的具體需要,特別適合應用於客戶服務或個性化推薦等場景。此外,由於「記憶模塊」能夠實時更新,MCP在處理長期用戶交互時表現尤為出色。

可是MCP也有一定局限性。首先,如果「記憶模塊」的數據不夠全面或存在偏差,可能導致生成內容失真。其次,MCP的優勢主要體現在需要長期交互和持續知識累積的場景中,對於那些需要快速檢索最新訊息的場景,它的適用性相對低。

筆者比較相信RAG與MCP兩種方向並不是對立,也可結合使用通過儲存長時記憶的能力,再配合快速檢索新動態的優勢,可產生更強大的大模型系統。

(編者按:車品覺著作《覺悟.大數據》現已發售)

歡迎訂購:實體書、電子書

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們