Don't Miss

思維鏈｜專家促監控「思維鏈」防風險

By 信報財經新聞 on July 17, 2025

原文刊於信報財經新聞「CEO AI⎹ EJ Tech」

來自多間國際人工智能（AI）研究機構的專家學者，日前共同發表立場文件，倡議把「思維鏈」（CoT）監控納入未來AI系統安全架構，作為一種補充監督手段。文件主要作者為英國AI研究員科爾巴克（Tomek Korbak）、巴萊斯尼（Mikita Balesni），並獲得數十位來自OpenAI、Google DeepMind、Anthropic、Meta等機構的研究者署名支持，惟強調內容僅代表個人立場。

全球數十位AI研究者聯署，建議將「思維鏈」監控，納入未來AI系統安全架構。（路透資料圖片）

提早發現失當行為

文件指出，目前多數AI模型設有CoT機制，透過自然語言展示其推理過程。這種推理痕跡提供一個觀測窗口，容許監控系統或研究人員理解其決策思維，並偵測箇中失當行為。

研究人員認為，相比僅觀察最終生成結果，監控推理過程有望更早發現潛在風險，例如當CoT過程出現「轉移資金」、「駭入系統」一類語句，便可能反映背後有不良意圖。然而，文件指CoT監控有一定限制。隨着AI能力提升，模型或許隱瞞、偽造推理過程，只輸出表面合規的推理語句。此外，強化學習或模型架構的改變，亦有機會導致CoT過程不再依賴自然語言。

文件對AI開發者提出數項建議，包括設計標準化的CoT監控指標、未來模型公開監控評估結果，以及按照這些指標及結果，作出訓練與部署決策。

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

AI CoT 思維鏈

Tweet

Pin It

Related Posts

AI恐拉闊知識鴻溝（車品覺）

AI恐拉闊知識鴻溝（車品覺）

企業忽視育才｜德勤批企業投資AI 培訓員工比例過低

企業忽視育才｜德勤批企業投資AI 培訓員工比例過低

AI準確率報告｜最高僅69%

AI準確率報告｜最高僅69%

AI垃圾｜「Slop」當選年度字

AI垃圾｜「Slop」當選年度字

Latest News

AI恐拉闊知識鴻溝（車品覺）
近日谷歌（Google）發布標題為《AI與學習的未來》白皮書。由一間頂尖科技公司，而非傳統教育機構系統性地探討「學習」的未來，這舉動本身就是一個極強訊號。

Posted December 17, 2025

0

隔熱新材料｜美國高校研發厚5毫米可防火
美國科羅拉多大學博爾德分校的物理學家，研發一種用於窗戶隔熱的新材料，有望提高全球建築物的能源效率。

Posted December 17, 2025

0

企業忽視育才｜德勤批企業投資AI 培訓員工比例過低
德勤（Deloitte）技術總監布里格斯（Bill Briggs）表示，當企業從人工智能（AI）實驗，走向大規模產生影響與價值時，這種恐懼驅使他們在投資策略上嚴重失衡。

Posted December 17, 2025

0

AI準確率報告｜最高僅69%
谷歌（Google）近日發布一份研究報告，透過其新推出的FACTS基準測試套件，以評估當今人工智能（AI）聊天機械人的可靠性。

Posted December 17, 2025

0

AI垃圾｜「Slop」當選年度字
隨着生成式人工智能（GenAI）普及，網絡漸漸充斥大量垃圾訊息，包括荒誕的影片、怪異的廣告圖片、俗氣的宣傳、疑幻似真的假新聞、粗製濫造的人工智能（AI）代筆書籍，以及浪費員工時間的「工作垃圾」報告。

Posted December 17, 2025

0

美國科技部隊｜華府組科技部隊首批聘千人
特朗普政府啟動「美國科技部隊」（United States Tech Force）項目，目標是明年3月起，首批招聘1000名初級軟件工程師、數據科學家、專案經理及人工智能（AI）專家。

Posted December 17, 2025

0

Cloudflare年度報告｜GPT稱霸GenAI 谷歌穩做搜尋一哥全球網流量增19%
美國網絡服務供應商Cloudflare發布2025年度回顧報告，指出全球網絡流量增長19%，近半流量（43%）來自流動裝置。

Posted December 17, 2025

0

POPULAR POSTS

企業AI｜顧問公司3萬員工學用Claude

AI教維修｜AI圖文並茂逐步教維修電器

 AI監管｜美國爭議加劇港企規則謀定位

 改造超音速引擎｜成為渦輪發電機供電數據中心

 隔熱新材料｜美國高校研發厚5毫米可防火

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe