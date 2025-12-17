重點一：OpenAI 推出 ChatGPT Images 更新，影像生成與編輯更精準、速度最高快4倍。

重點二：新版本支援多輪細節維持（如光線、構圖、人物樣貌），並可生成較多且較小的文字。

重點三：ChatGPT添加「圖像」專屬入口，加速與Google旗下Nano Banana Pro等競品抗衡。

OpenAI宣布為 ChatGPT 推出影像生成功能更新「ChatGPT Images」，官方稱生成速度最高提升至4倍，同時在影像編輯與細節控管上更為精準；現在用戶可直接在App與網站內點擊左側邊欄新增的「圖像」入口，即可進入生圖介面。

官方表示，新版 ChatGPT Images 以「gpt-image-1.5」為核心強化了「可控性」與「一致性」。使用者不僅能將風格在寫實與水彩之間切換、為影像中的人物加入帽子等元素， 更關鍵的是，模型能在多次編修後依然維持光線、材質與構圖連貫，避免既有生成模型常見的「跨步驟失真」。

ChatGPT images 支援分支編輯 圖/LMArena

此外，文字渲染能力顯著提升，能處理更細小字級與更長篇幅內容，改善過去圖中文字易失真、可讀性差的問題，進一步擴大在商務素材、行銷圖像與教育資訊圖表上的使用範圍。

OpenAI應用業務執行長費姬．西莫（Fidji Simo）指出，ChatGPT正從「純文字對話」轉向「全生成式介面」，把影像、視覺化與可操作元件整合到答案與工作流程中，因次本次更新的一大重點是推出 ChatGPT 中專用的影像入口，「運作方式更像一間創意工作室。」

她也預告， 「即將推出的更新中，答案會開始突顯重要的人物、地點與產品，你可以點擊即時取得更多資訊，而不必再追問。」

亡羊補牢奏效！ChatGPT Images 評分壓過 nano banana

OpenAI本次更新被視為在影像生成市場的加速佈局，直接迎戰Google近期發布的 Gemini 3與其影像生成產品 Nano Banana，以及 xAI 的 Grok 等競品。

Google 於11月推出 Gemini 3 在多項基準測試上主打更強的推理與多模態能力。尤其影像工具 Nano Banana 與後續的 Nano Banana Pro，亦強調文字可讀性、局部精修與高解析度輸出，瞄準專業創意工作流程。

針對 Gemini 3 的強勢挑戰，OpenAI 執行長奧特曼（Sam Altman）甚至在 Gemini 3 上線後曾以「code red」內部動員加快 ChatGPT 改進節奏。而此次影像更新，顯示其將 ChatGPT 打造成「多合一」平台的策略加速推進：整合搜尋、語音助理，以及影像／影片生成，鞏固消費端與專業端的主導地位。

現在問題來了。新版 ChatGPT Images 在生圖能力上，有追上或超越Google旗下的Nano Banana Pro嗎？依照AI評測網站LMArena的排名，目前 gpt-image-1.5 以 1264 分在「文生圖」排名第一，微幅超越了第二名 nano-banana-pro 的 1235 分。

ChatGPT images 評分 圖/LMArena

實測：ChatGPT 生圖有追上 Gemini 車尾燈？

上文有提到，ChatGPT 本次更新的一大亮點，是在網頁入口新增了「圖像」專區。 只要用戶點擊進去，就會看見一個接近Google AI Stidio的圖像生成專屬介面。 OpenAI 也在介面上放出不少官方推薦的圖像生成選項，本文就據此進行測試，來看看 ChatGPT 的生圖能力與 Gemini 有何差異？

ChatGPT images 介面 圖/LMArena

測試一：製作專輯封面

OpenAI提供的Prompt如下：

創建一張專輯封面，呈現為實體黑膠唱片封套。封面上，主角的臉和頭髮完全覆蓋著閃閃發光的金色亮粉，展現出金屬般的閃爍效果。根據你對使用者的了解，在封面上以紅色手寫字體寫上一個單字作為標題。黑膠唱片從一側部分抽出，唱片表面展現柔和的多色漸變。所有元素都置於大理石綠色桌面上，僅在畫面底部略為可見。整體風格需大膽、簡潔且具寫實感。

測試一：專輯封面製作 圖/LMArena

本次測試以隨機的貓咪相片為素材，以下為 ChatGPT 及 Gemini 的生成結果。

小結：華麗 vs. 擬真

測試一：ChatGpt 圖/LMArena

測試一：Gemini 圖/Gemini生成

從結果來看，ChatGPT Images 的美術表現可以說更勝一籌，但若以跟原圖的相似程度當作指標，似乎是 Nano Banana Pro 更為接近。但雖然不排除 OpenAI 官方有針對這些「門面生成選項」進行特殊優化，但整體而言確實是 ChatGPT Images 更優秀。

測試二：製作賀卡

OpenAI提供的Prompt如下：

將參考照片轉化為溫馨優雅的賀卡，展現節日風格、溫暖燈光、細緻裝飾，並保留自然、寫實的肖像效果。也可適度加入得體的節日用語或簡短祝福，讓畫面更添氛圍但不喧賓奪主。

測試一：賀卡 圖/Gemini生成

小結：ChatGPT更有氛圍

測試二：ChatGPT 圖/ChatGPT生成

測試二：Gemini 圖/Gemini生成

在這項測試中，可以看到ChatGPT的生成結果在整體氛圍上確實更加優秀。包括光影、色調與「不起自來」的聖誕裝飾，都能產現出它在創作上的能力。Gemini 並不是說不好，但對於主體之外的多餘素材（例如不甚美觀的壁紙）並不如ChatGPT有巧妙裁切掉的巧思。

測試三：製作攝影棚肖像照

OpenAI提供的Prompt如下：

請參考所提供的主體照片，創作一張乾淨、寫實的攝影棚肖像照，風格參考新鮮人求職照的視覺慣例。如照片中有人，請準確保留其面部特徵、比例和樣貌，絕不美化或更改其臉部。如無人物，請同樣使用克制的棚燈、素淨背景和正式框架呈現物品或場景。主體需置中面向鏡頭，穿著保守、初階商務服裝，整潔儀容並呈現中性、禮貌的表情。採用平均平光棚燈，減少陰影並強調清晰度，背景為淺藍色、淺灰色或純白色。構圖需正式、對稱且緊密裁切，整體氛圍嚴謹、真誠，展現職業感與應徵者的準備態度。

測試三：專業攝影棚照 圖/網路迷因

小結：ChatGPT沒走鐘

測試三：ChatGPT 圖/ChatGPT生成

測試三：Gemini 圖/Gemini生成

這是一拍兩瞪眼的結果。很意外的在提供一張側臉照的情況下，ChatGPT的生成結果更為可信，而 Gemini 生成的長相顯然不太一樣。

測試四：製作資訊圖卡

測試Prompt如下：

一張乾淨、明亮的教育資訊圖表插畫，採扁平化設計風格，解釋地球的自轉與公轉。中心是一個風格化的黃色太陽，標籤為「太陽」。

一顆藍色的地球沿著一條巨大的虛線橢圓軌道繞著太陽移動，有一條巨大的彎曲箭頭指示路徑和方向，標籤為「公轉週期：1年」。

同時，地球本身顯示傾斜的軸心，周圍有一條較小、緊密的圓形箭頭顯示其旋轉，標籤為「自轉週期：24小時」。

附近的一個文本框指向整個系統，標籤為「關係：自轉同時也在公轉」。另一個區域有葉子、太陽、雪花和花朵的小圖標，標籤為「影響：季節更替」。所有標籤均為繁體中文。

小結：ChatGPT的硬傷仍在變形字

測試四：資訊圖卡 圖/Gemini生成

測試四：ChatGPT 圖/ChatGPT生成

這項測試的重點在於對繁體中文字形的重現能力。依照結果而言，ChatGPT與Gemini的美術表現在同一水明，但是很明顯的ChatGPT的字體變形仍嚴重，而Gemini的字形屬清晰可見。

總結：ChatGPT Images 小幅超越，但繁中字體完敗

簡單來說評測的結論。在「純圖像」的應用領域內，例如專業大頭照、賀卡、趣圖生圖方面，ChatGPT Images的表現的確略勝 nano banana pro 一籌。可以理解成，nano banana pro能做得大致上ChatGPT Images也都能辦到，在美術表現上尤其如此；但不難發現，在資訊應用上，文字生成能力的表現仍是ChatGPT Images的最大弱點。例如企業簡報、教學等需要精確文字展現的應用場景，ChatGPT Images恐怕還不能勝任。

至此可以說，ChatGPT確實追到車尾燈了，但是能領先多久？下次更新能夠克服字體的硬傷嗎？恐怕這才是正式領先 nano banana pro 的關鍵分水嶺。

資料來源：OpenAI、彭博社

