Meta語音系統|識辨逾1600語言
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
現時的「自動語音辨識」(ASR)系統,透過將語音轉錄成可搜尋、分析及共享的文本,使口語能夠被普遍獲取。
Meta基礎人工智能研究(FAIR)團隊,最新發布一款多語言ASR系統Omnilingual ASR,這模型套件支援超過1600種語言,數量遠遠超過OpenAI旗下開源的Whisper模型(僅支援99種語言)。
這套系統的架構更具彈性,開發者可透過「零樣本上下文學習」功能,於推理階段輸入少量音頻與文字對應範例,即可讓模型識別更多未曾訓練過的語言,整體潛在支援語言數量,更可以擴展至超過5400種,幾乎涵蓋所有文字記錄的口語。
資料庫可擴充 免費使用
系統發布附有技術論文、GitHub程式碼庫、Hugging Face示範空間;該套件包括一系列語音辨識模型、一個70億參數的多語言音訊表示模型Omnilingual wav2vec 2.0,以及一個涵蓋350多種低資源語言的語料庫。
最重要的是,Meta將此系統於周一(10日),以Apache 2.0開源許可證公開發布,毋須付費或受限使用。不論研究人員及企業,都能自由應用於商業或企業級項目,打破過去Meta先前有限制的授權模式。
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。
Related Posts
Latest News
-
OpenAI王者地位不保?(方保僑)
在生成式人工智能(GenAI)領域,OpenAI曾一度獨領風騷。自2022年ChatGPT橫空出世,短短數月便震撼全球,谷歌緊急動員、微軟豪擲百億,矽谷掀起「OpenAI熱」。
- Posted December 15, 2025
- 0
-
改造超音速引擎|成為渦輪發電機 供電數據中心
人工智能(AI)數據中心如雨後春筍湧現,但無論其運作或冷卻都極為耗電,部分科企更為此重啟已退役的核電站。
- Posted December 15, 2025
- 0
-
香港電商調查|91%電商嘆無形成本蠶食一成收入
新加坡一站式金融平台Aspire夥拍支付服務供應商Stripe,近日發布《2025年度香港電商表現調查》,在11月收集共100間本港電商企業的意見,受訪者年收入大多介乎100萬至1000萬港元。
- Posted December 15, 2025
- 0
-
AI監管|美國爭議加劇 港企規則謀定位
美國聯邦與地方政府圍繞人工智能(AI)監管的爭議,近日再度升溫。
- Posted December 15, 2025
- 0
-
羅兵咸永道|三年斥78億拓AI培訓 30萬員工獲基礎指導 助前線改革
羅兵咸永道(PwC)全球人工智能(AI)總監阿特金森(Joe Atkinson)早前來港出席活動,並接受本報專訪,探討全球大型企業如何推動AI應用落地,以及對港企與員工的建議。
- Posted December 15, 2025
- 0
-
聖誕「黃金漫遊」攻略(林國誠)
行程是否順利,很多時候不在於坐什麼機艙、酒店住什麼級數,而是在陌生地方落機之後,手機能否立即穩定上網:地圖導航、翻譯、訂餐廳、叫車、網上Check-in、向家人報平安,全都要靠連線支援。
- Posted December 12, 2025
- 0
-
GPT接入Adobe|指引用戶執相
美國軟件開發商Adobe宣布,把Express、Photoshop和Acrobat的部分功能,添加到聊天機械人ChatGPT中,用戶毋須切換應用程式,即可編輯圖像、設計圖形及管理PDF。
- Posted December 12, 2025
- 0












