Don't Miss
Google Genie 3|世界模型Genie 3能追溯記憶
By 信報財經新聞 on August 7, 2025
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
谷歌母公司Alphabet旗下人工智能(AI)部門Google DeepMind,日前發布最新的基礎世界模型Genie 3。
用戶以自然語言提示,即可生成3D虛擬世界,足以互動數分鐘。環境在幾分鐘內基本一致,除了每秒24幀及720p解像度外,更能呈現出光影及物理效果。除了教育、娛樂等用途,亦可以用作訓練機械人及自駕車,使它們與倉庫等逼真環境互動,為實現「通用人工智能」(AGI)鋪路。
懂自學物理運作
DeepMind表示,Genie 3模型可以長期推理,並記憶已生成的內容,自學世界如何運作,例如物體怎樣移動、下跌及互動,恍如在電子遊戲世界,藉鍵盤上下左右實時移動。用戶可隨時加入各種提示,改變虛擬世界的天氣、調整鏡頭角度,或者在環境插入物件。視覺記憶方面,甚至可追溯到1分鐘前,例如把視線從世界中的某個物體移開,再轉回原位,牆上的油漆或黑板字跡,仍會保留在原處。
示範影片可見,在河畔踱步的畫面中,輸入提示即時追加角色,例如身穿母雞公仔衫的跑步男,河道飛馳的水上電單車,或者從天而降的緋紅飛龍等,相當考驗用戶想像力。Genie 3以有限研究預覽版發布,為一小部分學者和創作者,提供早期試用機會。Genie 3目前的限制是,除了文字渲染,行動空間及時長有限外,亦無法模擬真實世界的地理位置。
支持EJ Tech

