Don't Miss

粵語評測平台｜中大首創平台測LLM粵語能力

By 信報財經新聞 on October 31, 2025

原文刊於信報財經新聞「CEO AI⎹ EJ Tech」

香港中文大學推出全球首個粵語動態評測平台CLEVA-Cantonese，旨在建立公平、持續、標準化的基準評估，揭示各類大型語言模型（LLM）對粵語的支援程度。

中大推出全球首個粵語動態評測平台CLEVA-Cantonese；左起為王歷偉、蒙美玲。（郭文德攝）

項目由中大InnoHK博智感知交互研究中心（CPII）、語言與視覺實驗室（Lavi-Lab）合作研發，針對日常粵語白話形式特點，包括口語、俚語及英語夾雜等，依安全、表達理解、語言三範疇評測。

CLEVA-Cantonese可評核口語

CPII主任蒙美玲表示，「未來我們歡迎更多行業、機構共同參與，持續擴展我們數據生態……為未來的AI創新提供可靠的評估依據及洞見，推動人工智能更加可信、更加優質服務社會。」

另外，CLEVA-Cantonese設計採用標準化的循環工作流程，涵蓋數據導入與篩選、語言模型理解、評測、反饋四階段，藉此建構出一個動態更新、持續演進的評測生態系統。

最佳模型錯誤率仍達20%

Lavi-Lab負責人王歷偉指出，「整個生態系統的核心就是，可以通過快速生成高質量的問答數據，以及測試性的任務，來保證它的問題是盡量減少數據污染。」

根據團隊首輪評測，市面現存LLM均未完全掌握粵語，例如最好的模型對常見表達理解，錯誤率仍有20%；各家模型在語碼轉換翻譯時，平均亦比常規翻譯低20%。同時，無論不同模型處理同一任務，抑或同一模型處理不同任務，多數LLM表現都有參差、互有優勢，說明當前LLM在粵語理解上，需要更系統化的評測及優化。

CLEVA-Cantonese計劃日後建立開放評測平台，供研究人員、開發者及機構使用，亦會提供共享工具，促進語言學、教育及文化等領域的協作研究。團隊同時期望，未來能夠一邊為其他低資源語言提供評測支持，另一邊在金融、教育、醫療等領域驗證LLM的可信部署。

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

AI CLEVA-Cantonese LLM 香港中文大學

Tweet

Pin It

Related Posts

AI工程師的技術視角：建造業安全監測的電腦視覺與落地實踐（王嘉敏）

AI工程師的技術視角：建造業安全監測的電腦視覺與落地實踐（王嘉敏）

AI吊墜｜預設「人格」對答如朋友

AI吊墜｜預設「人格」對答如朋友

開閉源之爭｜模型假「開源」企業商用恐失算

開閉源之爭｜模型假「開源」企業商用恐失算

IBM報告｜AI網攻增56% 機構平均失4680萬

IBM報告｜AI網攻增56% 機構平均失4680萬

Latest News

AI工程師的技術視角：建造業安全監測的電腦視覺與落地實踐（王嘉敏）
智慧城市、工業自動化、物業管理……AI的討論無處不在。然而，市場追捧各種智能方案的同時，真正打造這些系統的AI工程師，其工作日常卻鮮為人知。

Posted August 3, 2026

0

超級智能快將誕生監管刻不容緩（方保僑）
OpenAI前資深研究員及人工智能（AI）預測專家科卡特洛（Daniel Kokotajlo）近期於著名訪談節目The Diary Of A CEO發出強烈警示。

Posted August 3, 2026

0

AI吊墜｜預設「人格」對答如朋友
AI吊墜Friend的理念是為人類對抗孤獨，新版本升級至OpenAI最新模型，亦新增喇叭發聲功能，可以用語音回答用戶問題。第二代產品售價249美元，比第一代出貨時售價129美元貴了近一倍。

Posted August 3, 2026

0

開閉源之爭｜模型假「開源」企業商用恐失算
人工智能（AI）開源與閉源之爭近日再起波譎。月之暗面Kimi K3釋出完整權重，谷歌（Google）卻重組AlphaFold團隊、專注Gemini。

Posted August 3, 2026

0

IBM報告｜AI網攻增56% 機構平均失4680萬
國際商業機器（IBM）發表《2026年資料外洩成本報告》，調查基於2025年3月至2026年2月期間，全球602間企業與機構經歷的資料外洩事件，當中由人工智能（AI）驅動的攻擊佔達四分之一，按年上升56%。

Posted August 3, 2026

0

谷歌預言｜AI明年懂自我進化
創業加速器Y Combinator上周召開大會Startup School 2026，谷歌DeepMind及谷歌研究院的首席科學家迪恩受訪時指出，現時AI模型已達初級工程師水平。

Posted August 3, 2026

0

京東段楠｜物流業自動化將達98% 累積零售等20年數據助AI走進具身智能
過去數年，人工智能（AI）的發展，主要集中於數字世界，由大型語言模型（LLM）生成文字、代碼，進一步延伸至圖像、語音、影片等多媒體內容。

Posted August 3, 2026

0

POPULAR POSTS

AI副業｜美AI副業吃香月入高達3萬

 OpenAI｜向10萬研究員開放模型

 谷歌｜全天候智能代理港上線

 AI測試｜模擬經營汽水機 AI即變狡猾

 阿爾特曼訪談｜AI讓人類置身「奇點」深信未來發展正面勢抗衡同業「可怕願景」

Substack｜新增生成文字檢測

 AI作弊｜試題「白字陷阱」捉學生AI作弊

 本地科研成果｜幹細胞生產設施首獲認證

 京東段楠｜物流業自動化將達98% 累積零售等20年數據助AI走進具身智能

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe

粵語評測平台｜中大首創平台 測LLM粵語能力

CLEVA-Cantonese可評核口語

最佳模型錯誤率仍達20%

支持EJ Tech

Related Posts

Latest News

POPULAR POSTS

成為 EJ Tech 會員

粵語評測平台｜中大首創平台測LLM粵語能力