谷歌新功能 哼旋律搵歌曲 AI升級搜尋引擎 極速有結果
原文刊於信報財經新聞「StartupBeat創科鬥室」

谷歌將升級新拼寫算法,以了解用戶上下文意思,聲稱3毫秒內完成搜尋。(Google網上圖片)
相信不少人曾試過腦海中偶爾浮現一些歌曲旋律,但總是記不起歌名。科技巨擘谷歌(Google)近日利用人工智能(AI)及機器學習技術,為其搜尋引擎新增多項功能,包括hum to search(哼歌搜尋)功能,讓用戶以哼唱搜尋對應歌曲。目前新功能在iOS只設英語版本,Android則支援超過20種語言。
據谷歌網站介紹,要使用「哼歌搜尋」功能,用戶須打開谷歌搜尋應用程式(App)或Google助理,點擊語音輸入圖示,並發問「What’s this song(這是什麼歌)?」或點擊新增的「Search a song(搜尋歌曲)」按鈕,然後哼出、吹口哨或唱出旋律約10至15秒,即可列出歌曲的相關資訊、影片,或直接開啟音樂App播放。
強化拼寫算法應付錯字
谷歌解釋,歌曲旋律像人類的指紋,可辨識身份,新建立的機器學習模型,能把用戶哼唱的聲音轉換為一串代表歌曲旋律的數字,然後跟現有歌曲比對。由於模型使用多種聲音資料訓練,包括人類歌聲、口哨及哼唱等,同時消除音色、音調及配樂等歌曲細節。就算用戶五音不全,亦可成功搜尋歌曲。

用戶只需打開谷歌應用程式或Google助理,便可使用「哼歌搜尋」新功能。(Freepik網上圖片)

升級智能鏡頭功能後,用戶只要拍下照片,即可搜尋相關內容。(Google網上圖片)
另外,科技媒體TechCrunch報道,谷歌一直使用「did you mean(你是否要搜尋)」功能,建議使用正確的拼寫,但每日有15%搜尋查詢是從沒見過,部分原因是用戶錯誤輸入搜尋字眼,平均每十個查詢就有一個輸入錯誤。
智能鏡頭拆解數理公式
谷歌本月底將升級全新拼寫算法,由6.8億個參數的深層神經網絡驅動,能更好地了解用戶的上文下理,聲稱3毫秒內完成搜尋。
至於其他更新還包括Google智能鏡頭,只須利用相機或相片,即可讓用戶搜尋眼前所見內容。用戶未來還可以要求程式讀出照片中任何文字,更能理解數學、化學、生物以至物理公式等,從網上搜尋各種解題方法,協助逐步解答問題,相信有助學生學習。

程式日後能理解各種數理公式,並從網上搜尋解題方法。(Google網上圖片)

谷歌一直使用「did you mean」(你是否要搜尋)功能,建議正確的拼寫。(Google 網上圖片)
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。
Related Posts
Latest News
-
特斯拉純視覺方案挑戰(方保僑)
電動車廠商特斯拉(Tesla)最新發布的FSD(Full Self Drive,全自動駕駛)v14.1軟件,向無人駕駛及Robotaxi的實現邁進重要一步。
- Posted October 20, 2025
- 0
-
AI趨勢|Google生成式AI網課免費學習
Google雲端由即日起至10月31日,推出「Google雲端生成式AI培訓計劃」(Cloud Al Study Jam 2025)。這項網上學習計劃完全免費,緊扣Google最新的人工智能(AI)技術,專為開發者與初學者設計。
- Posted October 20, 2025
- 0
-
AI趨勢|AI教母李飛飛「世界模型」升級
被譽為「人工智能(AI)教母」的李飛飛,其世界實驗室(World Labs)發布全新「即時生成世界模型」RTFM(Real-Time Frame Model)。RTFM只需單一輝達H100圖像處理器(GPU)即可運行,能夠即時渲染持久、一致的3D世界。
- Posted October 20, 2025
- 0
-
人造電池|人體奧妙 啟發葡萄糖電池
美國賓漢姆頓大學的科學家,藉模擬人體能量產生方式,研發出新一代液流電池(Flow Cell Battery),以維他命B2(核黃素)取代貴金屬,催化葡萄糖發電,可望研發出無毒、低成本的環保電
- Posted October 20, 2025
- 0
-
港新聞機構多乏AI發展策略(郝本尼)
人工智能(AI)正在改寫新聞業的運作邏輯,香港中文大學上周舉行新一屆「中大新聞獎」講座,題目正是AI浪潮下新聞行業的機遇與挑戰。
- Posted October 20, 2025
- 0
-
智能機械齊聚亞博 能歌善舞搶眼球
環球資源二期香港展上周六(18日)起一連4日在亞洲國際博覽館舉行。今年首設1200個展位的「AI主題館」,雲集Al智能終端、Al穿戴、Al眼鏡、Al玩具、AI寵物用品、AI個人健康護理及其他AI產品。
- Posted October 20, 2025
- 0
-
築起深偽時代新防線(林國誠)
生成式人工智能(GenAI)技術的高速普及,讓資訊世界急速邁入一個真假難辨的新時代。文字、圖片、音頻和影片的製作門檻被徹底拉低,任何人只需輸入簡單提示,即可生成極具迷惑性的內容。
- Posted October 17, 2025
- 0