2026-05-12
22457a2c 0906 41b3 9369 D69b1d6b1037

OpenAI 於近日推出全新升級的 ChatGPT 圖像引擎,標榜在排版、網路存取與推理能力上都有顯著提升。圖片來源:Axios

此版圖像模型分為「標準」與「思考」兩種模式,前者對所有使用者開放,後者則僅限付費訂閱者使用。思考模式加入內建推理機制,允許使用者以文字描述更複雜的需求,系統會先分析指令再產出圖像。雖然這讓生成過程更具彈性,但同時也延長了渲染時間,使用者需要提前規劃好工作流程。

在實測過程中,筆者給予模型多樣化的任務,包括為已故寵物製作慰問卡、將婚禮相片重新排版成復古相冊、以及設計虛構的「Mike Allen 造型比賽」海報等。每項需求的成果都相當符合預期,特別是將兩張婚禮照片合成為舊式相簿頁面時,圖像的邊角與光影處理相當細緻,彷彿真實的紙質相冊。除此之外,模型還能將日常雜亂的臥室照片「清理」成整潔空間的視覺預覽,展示了 AI 在室內設計概念驗證上的潛力。

然而,測試也發現一些限制。當要求模型生成虛構報紙「Smart Brevity Times」時,首次產出仍使用舊有新聞資料,未能即時抓取最新頭條。第二次嘗試雖能拉到當天新聞,但排版仍顯得像是草圖而非完成品。另一個例子是生成麻將作弊表,內容正確卻缺乏視覺美感,說明在高度專業化的圖形設計上仍有提升空間。這些情況凸顯了即使加入推理,圖像生成仍受到訓練資料與演算法精細度的雙重限制。

總結而言,ChatGPT 圖像引擎 2.0 已在多項日常與商務應用場景展現出顯著的實用價值,特別是結合文字描述的即時編輯功能,為設計師、行銷人員與普通使用者提供了全新的創作工具。未來若能進一步縮短生成時間、提升高階排版品質,將有望突破過去圖像生成工具在企業級應用上的瓶頸。欲了解更多原始報導,請參考Hands-on with ChatGPT’s powerful new image engine

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *