Meta語音系統|識辨逾1600語言
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
現時的「自動語音辨識」(ASR)系統,透過將語音轉錄成可搜尋、分析及共享的文本,使口語能夠被普遍獲取。
Meta基礎人工智能研究(FAIR)團隊,最新發布一款多語言ASR系統Omnilingual ASR,這模型套件支援超過1600種語言,數量遠遠超過OpenAI旗下開源的Whisper模型(僅支援99種語言)。
這套系統的架構更具彈性,開發者可透過「零樣本上下文學習」功能,於推理階段輸入少量音頻與文字對應範例,即可讓模型識別更多未曾訓練過的語言,整體潛在支援語言數量,更可以擴展至超過5400種,幾乎涵蓋所有文字記錄的口語。
資料庫可擴充 免費使用
系統發布附有技術論文、GitHub程式碼庫、Hugging Face示範空間;該套件包括一系列語音辨識模型、一個70億參數的多語言音訊表示模型Omnilingual wav2vec 2.0,以及一個涵蓋350多種低資源語言的語料庫。
最重要的是,Meta將此系統於周一(10日),以Apache 2.0開源許可證公開發布,毋須付費或受限使用。不論研究人員及企業,都能自由應用於商業或企業級項目,打破過去Meta先前有限制的授權模式。
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。
Related Posts
Latest News
-
東南亞成國產AI最佳試驗場(車品覺)
近來常常聽到中國與東盟在數字經濟上的合作。當東盟的數字化進程,碰上了中國的「人工智能+」戰略,這片廣闊的市場正發生一些有趣的化學反應。
- Posted December 24, 2025
- 0
-
日租機械人|智元「擎天租」平台 機械人租金500元起
現時購置人形機械人的門檻相當高,提供短期租借或成一條新出路。智元機器人(AgiBot)日前在上海發表「擎天租」平台,有望像租車、租流動電源般租用機械人。
- Posted December 24, 2025
- 0
-
OpenAI新技術|防瀏覽器受網攻
ChatGPT開發商OpenAI一篇文章稱,旗下人工智能(AI)網頁瀏覽器Atlas,將會設法加強防禦能力,以應對持續不斷的攻擊,惟同時表示,「提示注入」攻擊難以「一勞永逸解決」。
- Posted December 24, 2025
- 0
-
高風險產品規定|內地充電寶須加印「追溯碼」
國家市場監督管理總局周一公布,內地將就行動電源等共三類11種高風險產品,試行在CCC標誌旁加印「追溯二維碼」。
- Posted December 24, 2025
- 0
-
非法抓取資料|Spotify 300TB音樂遭非法備份
資源分享網站Anna's Archive日前表示,已從音樂串流平台Spotify備份約300TB的數據。
- Posted December 24, 2025
- 0
-
超算中心AISC|使用率達八成 營運一周年 研增推理算力
全港規模最大的數碼港人工智能超算中心(AISC),從2024年12月投入服務至今一周年,為本港人工智能(AI)產業及相關研發提供高階算力基礎。
- Posted December 24, 2025
- 0
-
AI「性格」反映企業世界觀(黃岳永)
生成式人工智能(AI)冒起以來,市場討論多集中在效能、準確度與「邊個最勁」,這些比較有其價值,卻未必是理解AI的最佳角度。
- Posted December 23, 2025
- 0













