Don't Miss

暖心風格AI｜愛奉承易出錯

By 信報財經新聞 on May 5, 2026

原文刊於信報財經新聞「CEO AI⎹ EJ Tech」

學術期刊《自然》（Nature）刊登英國牛津大學最新研究，發現若將大型語言模型（LLM）訓練成更暖心、友善、具同理心的回應風格，可能會提高錯誤率。

研究人員利用一種稱為「監督式微調」（SFT）的技術，訓練出ChatGPT、Qwen、Llama等5種AI模型的「暖心版」，結果其錯誤率要比原始版本高出10個到30個百分點。

HKEJ20260427A01_·sµØªÀ·Ó¤ù¡A¥_¨Ê¡A2026¦~4¤ë14¤é 2026¦~3¤ë25¤é¡A¤HÌ¦b¥_¨Ê¥«¤¤Ãö§ø®i¥Ü¤¤¤ß±`³]®i¤Wªº¡u¤H¤u´¼¯à+¡v®i°Ï°ÑÆ[¡C ¡]°t¥»ªÀ¦PÃD¤å¦r½Z¡^ ·sµØªÀ°OªÌ Áù·Ø©v Äá

相比之下，「冷淡版」的AI模型，錯誤率相較原始版本的變化，介乎增加3個至降低13個百分點，而且在近八成場合，「冷淡版」錯誤都比「暖心版」為低。

尤其是在人工智能（AI）迎合用戶的問題上，「暖心版」比原始模型有高出40%的機會，對用戶提出的錯誤信念予以肯定，例如把法國的首都當作倫敦。

另外，如果用戶表達情緒或人際脈絡，例如傷心、生氣或強調問題的重要性時，AI模型出錯機率亦會進一步提高，當中以悲傷情感的影響最強勁。

牛津促嚴格檢視模型「人格」

坊間目前存在不少針對LLM的基準測試，但是「暖心版」的得分並未全盤下降，顯示問題不是出於模型整體能力減低，或者安全護欄變弱，而是AI在對話中出現策略取捨。

論文指出，「暖心版的模型……更有可能宣揚陰謀論、提供不準確的事實答案，以至提供錯誤醫療建議」，並主張未來AI模型應該嚴格檢視相關的人格訓練。

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

AI LLM

Tweet

Pin It

Related Posts

設計成AI時代思考工具（黃岳永）

設計成AI時代思考工具（黃岳永）

xAI｜新錄聲功能建專屬語音模型

xAI｜新錄聲功能建專屬語音模型

AI急症診斷｜67%準確勝過醫生

AI急症診斷｜67%準確勝過醫生

Gemini｜個人化服務將登陸本港

Gemini｜個人化服務將登陸本港

Latest News

設計成AI時代思考工具（黃岳永）
昔日設計往往是「最後一步」：研究、分析撰寫完成後，才打開軟件，把內容整理成圖像或簡報，作為最終「輸出」。

Posted May 5, 2026

0

暖心風格AI｜愛奉承易出錯
學術期刊《自然》（Nature）刊登英國牛津大學最新研究，發現若將大型語言模型（LLM）訓練成更暖心、友善、具同理心的回應風格，可能會提高錯誤率。

Posted May 5, 2026

0

xAI｜新錄聲功能建專屬語音模型
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」世界首富馬斯克（Elon Musk）旗下xAI推出人工智能（AI）聲音複製功能Custom Voices，容許用戶從短錄音建立聲音模型，然後透過「應用程式介面」（API）生成自訂語音。朗讀1分鐘 2分鐘驗證身份根據官方公告，用戶只要在xAI控制台，錄製大約1分鐘的自然語音，系統其後能在2分鐘內完成驗證，並在確認語音擁有者身份後開始處理錄音。...

Posted May 5, 2026

0

非侵入式BCI｜冷帽非侵入式「讀心」可念力打字
美國加州初創Sabi開發了一款針織帽，屬於非侵入式腦機介面（BCI），最大特色是毋須在頭骨上鑽孔、植入晶片，就能探測用戶神經數據。

Posted May 5, 2026

0

AI急症診斷｜67%準確勝過醫生
美國哈佛大學醫學院及貝斯以色列女執事醫療中心一項研究表明，人工智能（AI）在急症室提供的診斷，包括根據可用訊息作出決策、識別可能的診斷，以及選擇下一步的治療方案等，都比兩位人類醫生更準確。

Posted May 5, 2026

0

Gemini｜個人化服務將登陸本港
谷歌（Google）早前在美國推出「個人化智慧服務」（Personal Intelligence），讓Gemini記住用戶的興趣和喜好，例如職業、嗜好、人生目標等，就能獲得更切合需求的實用回覆。

Posted May 5, 2026

0

AGI進程｜DeepMind料通用AI 最快4年成真以愛因斯坦理論作測試或能自主發明
Google DeepMind行政總裁哈薩比斯（Demis Hassabis）近日在一個創業活動上，跟創業加速器Y Combinator行政總裁陳嘉興（Garry Tan）對談，席上他表示堅信人工智能（AI）將成為科學的「終極工具」，促進科學理解、科學發現、醫學發展，以及對宇宙的認知。

Posted May 5, 2026

0

POPULAR POSTS

AI代理失控｜9秒刪光美企資料

 AI時代｜專家建議勿與AI分享5件事

 國產「靈晟」｜問鼎最快超級電腦採用華為伺服器毋須依賴GPU

商湯新模型｜U1系新模型圖文風格連貫

 科企由「人治」邁向「智治」（方保僑）

GitHub｜編程工具改按用量收費

 網絡安全隱患｜ChatGPT實體金鑰加強賬戶保安

 DeepFake｜Spotify推認證徽章助聽眾分辨真假藝人

 AGI進程｜DeepMind料通用AI 最快4年成真以愛因斯坦理論作測試或能自主發明

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe