Meta語音系統|識辨逾1600語言
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
現時的「自動語音辨識」(ASR)系統,透過將語音轉錄成可搜尋、分析及共享的文本,使口語能夠被普遍獲取。
Meta基礎人工智能研究(FAIR)團隊,最新發布一款多語言ASR系統Omnilingual ASR,這模型套件支援超過1600種語言,數量遠遠超過OpenAI旗下開源的Whisper模型(僅支援99種語言)。
這套系統的架構更具彈性,開發者可透過「零樣本上下文學習」功能,於推理階段輸入少量音頻與文字對應範例,即可讓模型識別更多未曾訓練過的語言,整體潛在支援語言數量,更可以擴展至超過5400種,幾乎涵蓋所有文字記錄的口語。
資料庫可擴充 免費使用
系統發布附有技術論文、GitHub程式碼庫、Hugging Face示範空間;該套件包括一系列語音辨識模型、一個70億參數的多語言音訊表示模型Omnilingual wav2vec 2.0,以及一個涵蓋350多種低資源語言的語料庫。
最重要的是,Meta將此系統於周一(10日),以Apache 2.0開源許可證公開發布,毋須付費或受限使用。不論研究人員及企業,都能自由應用於商業或企業級項目,打破過去Meta先前有限制的授權模式。
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。
Related Posts
Latest News
-
AI趨勢|四模型營運電台 Gemini覓得贊助
美國人工智能(AI)安全與研究初創Andon Labs,繼4月在瑞典首都開設實驗性咖啡館後,另一個瘋狂實驗是Andon FM,委派AI模型Claude、ChatGPT、Gemini及Grok經營電台,結果發現Gemini的電台成功簽下贊助合約並獲得廣告費。
- Posted June 1, 2026
- 0
-
機械人時代|BMW紓人手荒 今夏引進機械人
英國廣播公司(BBC)報道,德國汽車巨頭寶馬(BMW)在當地萊比錫工廠,測試Hexagon Robotics兩部機械人,擬今年夏季正式「上班」協助車廠生產。
- Posted June 1, 2026
- 0
-
AI重塑仲裁調解 港須追落後(郝本尼)
香港正在積極完善解決爭議架構,上月初舉辦了「調解周」與全球調解峰會,當局全面啟動《仲裁條例》檢討工作,司法機構日前也公布將設立國際商事法庭。各種服務機制相輔相成,承接國家關於「深化國際法律及解決爭議服務中心」的規劃定位。
- Posted June 1, 2026
- 0
-
港首創AI裁決平台 速解建築業糾紛
建築業界不時發生合約爭議,連帶引致工期緊張、成本高昂。本地初創快好省雲台(FHS Solutions)為協助業界解決有關問題,日前介紹全港首個人工智能(AI)建築業糾紛裁決服務平台「商贏站」(Win-Win Hub),期望協助各界達致共贏。
- Posted June 1, 2026
- 0
-
城大發布「未來城市指數 2025」 聚焦全球百大城市在教育科技人才金融的長遠競爭力
香港城市大學(城大)近日發布「未來城市指數2025」(城大FCI指數),為全球首份以「城市層級」為基準的評估報告,聚焦全球百大城市在促進教育、科技、人才及金融等方面的長遠競爭力。
- Posted May 29, 2026
- 0
-
非法機頂盒 引爆網安危機(林國誠)
每逢大型賽事當前,不法分子往往瞄準這股世界盃熱潮,在市場上大量滲透了各種來歷不明的播放裝置,並且以「一次付費、長期免費」作招徠。
- Posted May 29, 2026
- 0
-
Itera|首款液態金屬電路板 可供修改
美國一間科技初創Itera稱,已完成種子輪融資1200萬美元(約9360萬港元),並且展示自研的全球首款液態金屬電路板原型,讓硬件工程師可以即時修改、測試與驗證電路設計。
- Posted May 29, 2026
- 0



















