You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

OpenAI新功能|新影像模型生成快4倍

By on December 18, 2025

刊於信報財經新聞「CEO AI⎹ EJ Tech

人工智能(AI)影像生成模型,過去一年不斷取得進步。美企OpenAI推出最新影像產生器GPT-Image Model 1.5,圖像生成速度最高比上一代快4倍,能更好執行指令精確編輯,例如新增特定物件、更改物件樣式、試穿特定服裝及移除元素,效果媲美Google Nano Banana Pro。

用戶可上傳團體合照,全部人改穿特定服裝。(OpenAI網上圖片)

GPT-Image Model 1.5已對全球ChatGPT用戶開放,同時透過API(應用程式介面)方式提供,圖像輸入及輸出成本方面,比GPT Image 1降低20%。OpenAI定價文件顯示,GPT-Image Model 1.5定價為每百萬個輸入影像詞元(Image Token)8美元,以及每百萬個輸出影像詞元32美元。

OpenAI示範把兩個人及一隻狗,結合到同一張相中。(OpenAI網上圖片)

現時在ChatGPT應用程式及瀏覽器新增專門的Images標籤頁,工作方式更像創意工作室。全新的影像檢視及編輯介面,讓用戶輕鬆創建影像,或從熱門提示及預設濾鏡汲取靈感。

現時在ChatGPT應用程式及瀏覽器,新增專門的Images標籤頁。(Substack網上圖片)

多張照片組合至同一場景

OpenAI示範把多個人物及一隻狗,從多張照片組合到同一場景,例如在小朋友的生日派對中,流露悶悶不樂的表情。同時,OpenAI惡搞行政總裁阿爾特曼(Sam Altman),為他裝扮為K-Pop偶像風、八十年代VHS健身教練、梳打汽水廣告代言人,甚至化身十七世紀名畫《戴珍珠耳環的少女》。

阿爾特曼化身17世紀名畫《戴珍珠耳環的少女》。(OpenAI網上圖片)

另一方面,OpenAI發布AI基準測試FrontierScience,包含700多道文字問題,涵蓋物理、化學、生物學等領域,並設有奧林匹克題型(用於衡量奧林匹克式的科學推理能力),以及研究題型(用於衡量現實世界的科學研究能力)兩種題型。結果顯示,GPT-5.2表現最佳,兩者得分為77%及25%,領先其他前沿模型。

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們