Meta語音系統|識辨逾1600語言
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
現時的「自動語音辨識」(ASR)系統,透過將語音轉錄成可搜尋、分析及共享的文本,使口語能夠被普遍獲取。
Meta基礎人工智能研究(FAIR)團隊,最新發布一款多語言ASR系統Omnilingual ASR,這模型套件支援超過1600種語言,數量遠遠超過OpenAI旗下開源的Whisper模型(僅支援99種語言)。
這套系統的架構更具彈性,開發者可透過「零樣本上下文學習」功能,於推理階段輸入少量音頻與文字對應範例,即可讓模型識別更多未曾訓練過的語言,整體潛在支援語言數量,更可以擴展至超過5400種,幾乎涵蓋所有文字記錄的口語。
資料庫可擴充 免費使用
系統發布附有技術論文、GitHub程式碼庫、Hugging Face示範空間;該套件包括一系列語音辨識模型、一個70億參數的多語言音訊表示模型Omnilingual wav2vec 2.0,以及一個涵蓋350多種低資源語言的語料庫。
最重要的是,Meta將此系統於周一(10日),以Apache 2.0開源許可證公開發布,毋須付費或受限使用。不論研究人員及企業,都能自由應用於商業或企業級項目,打破過去Meta先前有限制的授權模式。
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。
Related Posts
Latest News
-
「龍蝦」網安風險啟示(鄧淑明博士)
早前拜讀《信報》高天佑專欄〈龍蝦搭雞棚 泛濫釀成災〉一文,其中提到「現時很多熱烈『養龍蝦』的民眾,全情投入趕潮流,卻未必具備足夠的專業知識及保安意識」,筆者對此深有同感,更認為這正是個災難預警。
- Posted April 2, 2026
- 0
-
AI眼鏡|Meta推AI近視眼鏡 3892元起
Facebook母公司Meta推出首款有近視度數的人工智能(AI)智能眼鏡,名為Ray-Ban Meta Blayzer Optics(Gen 2)及Ray-Ban Meta Scriber Optics(Gen 2),現已在網站開放預購,入場價499美元(約3892港元)起。
- Posted April 2, 2026
- 0
-
Gmail改名|谷歌准美Gmail用戶改賬號
谷歌(Google)電郵服務Gmail面世22周年,相信不少人在註冊時錯用名稱,即使後悔莫及,卻不得繼續不使用。
- Posted April 2, 2026
- 0
-
OpenClaw|內地預警「龍蝦」代申專利風險
國家知識產權局的政務微信公眾賬號,日前發布《關於使用OpenClaw等智能體撰寫專利申請文件的風險提示》,指出人工智能代理(AI Agent,或稱智能體)工具容易引發的嚴重安全風險。
- Posted April 2, 2026
- 0
-
量子危機|量子電腦9分鐘破解虛幣鑰匙
美國科技巨擘谷歌(Google)日前發布技術白皮書,探討量子技術進展如何威脅加密貨幣安全。
- Posted April 2, 2026
- 0
-
Claude Code洩代碼|核心功能遭「換殼」 難以究責
Claude Code內部程式碼意外洩出,整個開發者圈子徹底沸騰。Claude開發商Anthropic試圖透過美國《數碼千禧年版權法》投訴,希望封死所有外洩的Claude源碼倉庫。
- Posted April 2, 2026
- 0
-
Claude Code洩代碼|自爆運作細節 未發布模型曝光 Anthropic上市前重創
美國人工智能(AI)科企Anthropic在愚人節前夕爆出人為失誤,洩漏終端機代理工具Claude Code的內部AI程式碼。
- Posted April 2, 2026
- 0















