Meta語音系統|識辨逾1600語言
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
現時的「自動語音辨識」(ASR)系統,透過將語音轉錄成可搜尋、分析及共享的文本,使口語能夠被普遍獲取。
Meta基礎人工智能研究(FAIR)團隊,最新發布一款多語言ASR系統Omnilingual ASR,這模型套件支援超過1600種語言,數量遠遠超過OpenAI旗下開源的Whisper模型(僅支援99種語言)。
這套系統的架構更具彈性,開發者可透過「零樣本上下文學習」功能,於推理階段輸入少量音頻與文字對應範例,即可讓模型識別更多未曾訓練過的語言,整體潛在支援語言數量,更可以擴展至超過5400種,幾乎涵蓋所有文字記錄的口語。
資料庫可擴充 免費使用
系統發布附有技術論文、GitHub程式碼庫、Hugging Face示範空間;該套件包括一系列語音辨識模型、一個70億參數的多語言音訊表示模型Omnilingual wav2vec 2.0,以及一個涵蓋350多種低資源語言的語料庫。
最重要的是,Meta將此系統於周一(10日),以Apache 2.0開源許可證公開發布,毋須付費或受限使用。不論研究人員及企業,都能自由應用於商業或企業級項目,打破過去Meta先前有限制的授權模式。
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。
Related Posts
Latest News
-
人工智能瀏覽器百家爭鳴(車品覺)
ChatGPT Atlas是OpenAI於2025年10月21日正式推出的首款桌面瀏覽器產品,其核心定位是把ChatGPT從工具層,升級為用戶的慣常網絡入口及使用大模型的樞紐,而毋須轉換應用。
- Posted November 12, 2025
- 0
-
電池技術突破|助光能商業化
香港理工大學電機及電子工程學系能源轉換技術講座教授,鍾士元爵士可再生能源教授李剛、助理教授楊光等學者組成的科研團隊,在「鈣鈦礦/晶矽疊層」電池領域取得突破進展。
- Posted November 12, 2025
- 0
-
eCoffee手環|電擊手環爆紅 如喝咖啡提神
內地媒體cnBeta報道,加拿大越凡醫療公司研發了一款eCoffee手環,透過電脈衝刺激手腕神經達到提神效果,這款手環號稱可取代咖啡因,近日在內地社交媒體爆紅。
- Posted November 12, 2025
- 0
-
IDC調查報告|64%港企年內曾遭AI網攻
美國網絡安全公司Fortinet委託國際數據公司(IDC)研究,於昨日公布最新的《IDC 2025年調查報告》,顯示超過九成港企已在安全環境應用AI。
- Posted November 12, 2025
- 0
-
Meta語音系統|識辨逾1600語言
現時的「自動語音辨識」(ASR)系統,透過將語音轉錄成可搜尋、分析及共享的文本,使口語能夠被普遍獲取。
- Posted November 12, 2025
- 0
-
月之暗面|發布開源新模型 測評勝GPT-5
獲阿里巴巴(09988)支持的中國人工智能(AI)初創月之暗面,日前正式發布開源模型Kimi K2 Thinking,專注深度思考、長視野代理及工具調用,更在多個基準測試勝過主流閉源模型如GPT-5、Sonnet 4.5等。
- Posted November 12, 2025
- 0
-
AI融資|AI數據中心融資需求達39萬億 摩通料未來5年 科企大舉發債
彭博引述摩根大通一項分析顯示,人工智能(AI)超大規模企業,為建設數據中心而大舉擴張,未來5年內融資需求至少為5萬億美元(約39萬億港元),最高或升至7萬億美元(約54.6萬億港元)。
- Posted November 12, 2025
- 0



















