You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

演算法|Google壓縮演算法 記憶體慳83%

By on March 27, 2026

原文刊於信報財經新聞「CEO AI⎹ EJ Tech

美國谷歌(Google)近日推出三種壓縮演算法,分別是TurboQuantPolarQuant及量化Johnson-Lindenstrauss(QJL),標榜高效壓縮緩存之餘,卻不降低模型輸出品質。受消息影響,記憶體生產商閃迪(Sandisk),周三股價挫9.2%,美光(Micron)最多曾跌6.3%。

成本銳減 儲存器廠商股即瀉

以全新內存壓縮技術演算法TurboQuant為例,能夠把大型語言模型的鍵值快取(KV Caches),大幅壓縮至僅剩三位元(3 bits)。在輝達H100圖像處理器(GPU)基準測試中,這種壓縮演算法使AI推理速度提升8倍,同時記憶體使用量縮減至原本的六分之一,即節省了83%,從而降低AI訓練的整體成本。另一種演算法PolarQuant,在「大海撈針」檢索任務中,表現近乎無失真。

Google Gemini推出 Lyria 3 Pro,讓AI模型創作長達3分鐘歌曲。(Google網上圖片

Gemini新模型 上傳圖片作歌

本地市場方面,繼早前擴展Gemini網絡應用程式體驗,谷歌正將Gemini流動應用程式(App)體驗,擴展至全港所有用戶。Google香港銷售及營運總經理余名德提到,「Gemini已準備就緒,成為你的個人AI助理,提升創造力與生產力。」並延續企業、開發者、教育工作者、學生等本地社群,實踐「一齊為香港創新可能」目標。

另外,谷歌Gemini推出Lyria 3 Pro,訂戶毋須提供歌詞,只要描述歌曲氛圍及節奏,或上傳一張參考圖片,讓模型創作長達3分鐘歌曲,並設有SynthID標記表明AI製作。

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們