You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

新圖靈測驗|電腦揪出AI對話

By on November 13, 2025

刊於信報財經新聞「CEO AI⎹ EJ Tech

瑞士蘇黎世大學、荷蘭阿姆斯特丹大學、美國杜克大學與紐約大學的跨學科聯合研究團隊,日前提出一套新的「電腦版圖靈測試」,旨在判斷人工智能(AI)模型說出的話像不像人。

檢測9開源模型 判別八成準

傳統圖靈測試是由人類判斷文字是否出自真人,但這次研究人員收集了社媒X、Bluesky與Reddit三個社交平台的真人對話,再讓AI模型模仿回覆之後,最後由機器學習模型判斷內容是否像由真人寫作。接受測試的有Llama、DeepSeek、Qwen、Mistral等9個不同版本開源模型。結果顯示,判別準確率高達70%到80%,代表AI文字雖然愈來愈自然,但當中仍存在可偵測的痕跡。

研究人員收集X、Bluesky與Reddit等平台的真人對話,再讓9款開源模型模仿回覆後,再用機器學習模型,判斷內容是否像由真人寫作。(arXiv網上圖片)

最明顯區別特徵在於情緒表達,AI文字通常較為中性、冷靜,很少帶有真正情感色彩,相反人類會開玩笑、生氣、諷刺、調侃,這些表達方式即使AI模仿起來也會顯得刻意。

另一差別在於主題表現,真人語言傾向展現社交互動、情感、權力或政治意識等面向,AI傾向保持中立、禮貌,鮮少有強烈情緒與立場。

真人語言擅於表達情感,AI傾向保持中立、禮貌,鮮少有強烈情緒與立場。(法新社資料圖片)

參數愈多 不代表更懂說人話

研究團隊更加發現,模型變大、參數變多,不一定會讓AI文字更像真人。此外,結合風格範例、背景檢索,雖然能讓AI的文字更像真人,但回答準確度反而下降。

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們