2025年11月20日,Google正式發佈其最新影像生成模型——Nano Banana Pro,這是繼之前版本Nano Banana後的一項重大升級。此次升級旨在將影像創建和編輯的精細度提升到新的高度,並引入高畫質、強大的文本渲染功能,可以更高效地滿足專業創作者和行業需求。
Nano Banana Pro 建立在 Google 最新的語言模型 Gemini 3 之上,該模型不僅能生成更為細緻的圖像,還能以不同樣式、字體和語言生成文本。隨著用戶需求的多樣化,這款模型特別契合了專業的創意工作流,讓用戶能夠更全面地掌控影像的各個方面,包括攝影角度、場景燈光、景深、焦點和顏色等。
舉個例子,Nano Banana Pro 不僅限於生成靜態圖像,其更強的網路搜尋能力意味著用戶可以要求它查詢食譜,並生成相應的學習卡片。與 Nano Banana 的1024 x 1024像素限制不同,Nano Banana Pro 能夠生成2K或4K的高畫質圖像,這進一步提升了其在市場上的競爭力。
不過,隨著解析度的提高,使用該模型的成本也明顯上升;據文獻顯示,每生成一張1080p或2K圖像需花費$0.139,生成每張4K圖像的費用更是達到$0.24,對於大量工作的企業來說,這些成本無疑是一個需要仔細考慮的因素。
此外,Nano Banana Pro 還支持用戶在編輯過程中保持多達五個人的相似度。為了讓用戶親身體驗這些強大功能,Google 也發布了一個演示應用,讓用戶可以在其中試用這些功能。該模型將會在 Google 的多款現有AI工具中進行整合,並綜合利用 Gemini 應用進行默認的圖像生成。
隨著此技術的投入使用,Adobe 等公司也已經確認將Nano Banana Pro整合進其Creative Cloud應用,比如Photoshop和Firefly,這顯示出Google在專業影像生成領域的更積極競爭姿態。整體來說,Nano Banana Pro 無疑是對影像創作經歷的一次革命性提升,提升了圖像的生成質量及編輯控制,然而,它也引發了對於影像真實性和道德使用的深思。
總體而言,Google的這一新產品標誌著影像生成AI技術向更專業化的方向發展,其未來的廣泛應用將是值得關注的焦點。