You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

Google Genie 3|世界模型Genie 3能追溯記憶

By on August 7, 2025

原文刊於信報財經新聞「CEO AI⎹ EJ Tech

谷歌母公司Alphabet旗下人工智能(AI)部門Google DeepMind,日前發布最新的基礎世界模型Genie 3

用戶以自然語言提示,即可生成3D虛擬世界,足以互動數分鐘。環境在幾分鐘內基本一致,除了每秒24幀及720p解像度外,更能呈現出光影及物理效果。除了教育、娛樂等用途,亦可以用作訓練機械人及自駕車,使它們與倉庫等逼真環境互動,為實現「通用人工智能」(AGI)鋪路。

只要在Genie 3輸入提示,即可模擬3D虛擬世界,例如騎馬、在河畔散步、跳傘等,當中符合物理特性。(Google DeepMind網上圖片)

懂自學物理運作

DeepMind表示,Genie 3模型可以長期推理,並記憶已生成的內容,自學世界如何運作,例如物體怎樣移動、下跌及互動,恍如在電子遊戲世界,藉鍵盤上下左右實時移動。用戶可隨時加入各種提示,改變虛擬世界的天氣、調整鏡頭角度,或者在環境插入物件。視覺記憶方面,甚至可追溯到1分鐘前,例如把視線從世界中的某個物體移開,再轉回原位,牆上的油漆或黑板字跡,仍會保留在原處。

AI生成室內的髹油畫面,視覺記憶追溯到一分鐘前,油漆仍會保留在原處。(YouTube影片擷圖)

示範影片可見,在河畔踱步的畫面中,輸入提示即時追加角色,例如身穿母雞公仔衫的跑步男,河道飛馳的水上電單車,或者從天而降的緋紅飛龍等,相當考驗用戶想像力。Genie 3以有限研究預覽版發布,為一小部分學者和創作者,提供早期試用機會。Genie 3目前的限制是,除了文字渲染,行動空間及時長有限外,亦無法模擬真實世界的地理位置。

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們