Don't Miss
新圖靈測驗|電腦揪出AI對話
By 信報財經新聞 on November 13, 2025
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
瑞士蘇黎世大學、荷蘭阿姆斯特丹大學、美國杜克大學與紐約大學的跨學科聯合研究團隊,日前提出一套新的「電腦版圖靈測試」,旨在判斷人工智能(AI)模型說出的話像不像人。
檢測9開源模型 判別八成準
傳統圖靈測試是由人類判斷文字是否出自真人,但這次研究人員收集了社媒X、Bluesky與Reddit三個社交平台的真人對話,再讓AI模型模仿回覆之後,最後由機器學習模型判斷內容是否像由真人寫作。接受測試的有Llama、DeepSeek、Qwen、Mistral等9個不同版本開源模型。結果顯示,判別準確率高達70%到80%,代表AI文字雖然愈來愈自然,但當中仍存在可偵測的痕跡。
最明顯區別特徵在於情緒表達,AI文字通常較為中性、冷靜,很少帶有真正情感色彩,相反人類會開玩笑、生氣、諷刺、調侃,這些表達方式即使AI模仿起來也會顯得刻意。
另一差別在於主題表現,真人語言傾向展現社交互動、情感、權力或政治意識等面向,AI傾向保持中立、禮貌,鮮少有強烈情緒與立場。
參數愈多 不代表更懂說人話
研究團隊更加發現,模型變大、參數變多,不一定會讓AI文字更像真人。此外,結合風格範例、背景檢索,雖然能讓AI的文字更像真人,但回答準確度反而下降。
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。

















