Meta語音系統|識辨逾1600語言
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
現時的「自動語音辨識」(ASR)系統,透過將語音轉錄成可搜尋、分析及共享的文本,使口語能夠被普遍獲取。
Meta基礎人工智能研究(FAIR)團隊,最新發布一款多語言ASR系統Omnilingual ASR,這模型套件支援超過1600種語言,數量遠遠超過OpenAI旗下開源的Whisper模型(僅支援99種語言)。
這套系統的架構更具彈性,開發者可透過「零樣本上下文學習」功能,於推理階段輸入少量音頻與文字對應範例,即可讓模型識別更多未曾訓練過的語言,整體潛在支援語言數量,更可以擴展至超過5400種,幾乎涵蓋所有文字記錄的口語。
資料庫可擴充 免費使用
系統發布附有技術論文、GitHub程式碼庫、Hugging Face示範空間;該套件包括一系列語音辨識模型、一個70億參數的多語言音訊表示模型Omnilingual wav2vec 2.0,以及一個涵蓋350多種低資源語言的語料庫。
最重要的是,Meta將此系統於周一(10日),以Apache 2.0開源許可證公開發布,毋須付費或受限使用。不論研究人員及企業,都能自由應用於商業或企業級項目,打破過去Meta先前有限制的授權模式。
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。
Related Posts
Latest News
-
港首創AI裁決平台 速解建築業糾紛
建築業界不時發生合約爭議,連帶引致工期緊張、成本高昂。本地初創快好省雲台(FHS Solutions)為協助業界解決有關問題,日前介紹全港首個人工智能(AI)建築業糾紛裁決服務平台「商贏站」(Win-Win Hub),期望協助各界達致共贏。
- Posted June 1, 2026
- 0
-
城大發布「未來城市指數 2025」 聚焦全球百大城市在教育科技人才金融的長遠競爭力
香港城市大學(城大)近日發布「未來城市指數2025」(城大FCI指數),為全球首份以「城市層級」為基準的評估報告,聚焦全球百大城市在促進教育、科技、人才及金融等方面的長遠競爭力。
- Posted May 29, 2026
- 0
-
非法機頂盒 引爆網安危機(林國誠)
每逢大型賽事當前,不法分子往往瞄準這股世界盃熱潮,在市場上大量滲透了各種來歷不明的播放裝置,並且以「一次付費、長期免費」作招徠。
- Posted May 29, 2026
- 0
-
Itera|首款液態金屬電路板 可供修改
美國一間科技初創Itera稱,已完成種子輪融資1200萬美元(約9360萬港元),並且展示自研的全球首款液態金屬電路板原型,讓硬件工程師可以即時修改、測試與驗證電路設計。
- Posted May 29, 2026
- 0
-
機械狗巡邏|康樂園引進機械狗 24小時巡邏
位於新界大埔的低密度豪宅康樂園,外圍巡邏徑長達3.8公里,地勢起伏及夜間光線欠佳,保安工作一直是重大挑戰。
- Posted May 29, 2026
- 0
-
Meta|推聊天AI訂閱 月費62元起
Meta產品總監格萊特(Naomi Gleit)拍片介紹,首次向消費者推出Meta AI聊天機械人訂閱服務。
- Posted May 29, 2026
- 0
-
Sana|自助代理Sana登陸微軟Copilot
美國人力資源軟件平台Workday昨召開年會Workday Elevate,為本港中型企業引入企業級人工智能(AI)方案,Sana自助代理已登陸Microsoft 365 Copilot。
- Posted May 29, 2026
- 0



















