谷歌開發者大會|發布三大媒體創作神器 推旗艦級訂閱方案 月費1950元
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
美國網絡巨頭Alphabet旗下谷歌(Google),昨召開年度開發者大會Google I/O 2025,展示人工智能(AI)如何融入其產品生態系統。現場介紹3款生成式媒體創作工具,包括全新圖像生成模型Imagen 4、影片生成模型Veo3,以及針對電影製作的Flow。
谷歌同時公布旗艦級訂閱方案Google AI Ultra,月費250美元(約1950港元),提供最高級別的AI應用訪問。
Imagen 4是全新圖像生成模型,適用於寫實和抽象風格,支援最高2K解像度,擅長渲染布料、水滴、動物毛髮等細節,生成速度快過上代10倍。至於影片生成模型Veo 3,支援原生音效、背景噪音,甚至生成對話,例如炮製煎洋葱影片時,同時附上爆油配音,令人食指大動。另一款AI工具為Flow,當中結合Veo、Imagen及Gemini的能力,可根據自然語言提示,生成場景、角色等內容,供Google AI Pro及Ultra等美國訂戶使用。
用戶聊天即可指派任務
為降低深度偽造的風險,由Veo 3模型生成的影片,將加入數碼水印SynthID,當中嵌入隱形的標記。
公眾可透過SynthID Detector工具,上傳要掃描的圖像、視訊、音訊及文字,以辨識內容是否由AI工具生成。谷歌提到,自2023年推出以來,SynthID已為超過100億張圖片、視訊、音訊檔案及文字添加水印。谷歌在網誌表示,除美國外,將向日本、巴西、印尼及英國的大學生,提供為期一年的Google AI Pro免費使用權。
AI模型方面,Gemini 2.5 Pro將加入增強推理模式Deep Think,讓模型回應前考慮多種假設,提升數學、程式設計、多模態任務的表現,現僅限Google AI Ultra訂戶試用。
谷歌亦推出實驗性AI代理Project Mariner,用戶只需與AI代理聊天,系統就會自動訪問網站,例如上網格價買飛,或代購食材,更可綁定Google Pay錢包,執行任務後直接付款。
此外,AI模式(AI Mode)搜尋功能正式在美國推出,可以利用Gmail等個人資料,提供更個人化的搜尋體驗。其中虛擬試穿效果逼真,用戶上傳一張全身照後,衣服剪裁更符合身形。
實時拍攝問AI解難
谷歌又推出AI搜尋功能Gemini Live,並免費開放予Android及iOS用戶,支援語音對話、相機及熒幕分享。用戶可打開手機鏡頭,分享實時的拍攝畫面,直接詢問AI面前情況(例如怎樣維修單車),日後將與Google Maps、Google Calendar等應用程式深度整合。
科技媒體TechCrunch提到,谷歌正在與三星、Gentle Monster、Xreal及Warby Parker合作,開發Android XR智能眼鏡,並透過Gemini模型提供AI輔助。
谷歌共同創辦人布林(Sergey Brin)在大會受訪時指出,他在智能眼鏡Google Glass犯下不少錯誤,坦言「對消費電子供應鏈一無所知」,也不知道以合理價格製造智能眼鏡有多難。不過布林強調:「任何電腦科學家都不應該現在退休,他們應該致力於人工智能研究。」
支持EJ Tech

