Don't Miss
遙距勞動指數|AI代理遙距工作 近半成品差
By 信報財經新聞 on November 7, 2025
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
美國非牟利機構人工智能安全中心(CAIS)與科技公司Scale AI聯合團隊,早前發表「遙距勞動指數」報告,分析AI代理模型在現實遙距工作任務的能力。
報告指出,目前AI代理雖在部分任務展現生產力,但整體被市場接受的成功率仍偏低,與大眾對自動化勞動的期待明顯存在落差。報告分析了AI交付成果被拒的情況,其中17.6%屬於檔案損壞,35.7%為工作不完整,45.6%為成果品質低劣,14.8%為內容不一致。代表性的失敗案例包括:要製作8分鐘的影片時,卻僅提交8秒,在繪圖任務中輸出孩童塗鴉般的作品,以及產生機械化、不自然或重複的旁白語音。
研究人員測試了GPT-5、Manus、Gemini等多個AI代理,結果表現最佳的Manus自動化率也僅有2.5%,Grok 4與Sonnet 4.5以2.1%並列其後。
若按金額計算,在240項測試任務中,最大可能賺取報酬為143991美元(約112.3萬港元),涵蓋遊戲開發、產品設計、架構、資料分析及動畫等領域。Manus從中僅可獲1720美元,Sonnet 4.5與GPT-5分別有1280美元及1180美元,佔比同樣極低。
影音任務水平媲美人類
此外,有少數案例顯示AI交付成果符合或高於人類水平,這些任務多屬跟音訊、圖像相關的工作,以及撰寫報告、檢索數據、爬取網頁。報告表示,「即使某個AI在『遙距勞動指數』達到100%的自動化率,它仍可能在未評估的工作類型上表現不如人類……電腦操作測試上的進步,與實際執行高價值工作之間,存在明顯落差。」
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。


















