cd ../back to blog
$Review//June 4, 2026//7 min read

三大影像生成模型對決:Nano Banana Pro、Flux 2 Pro 與 Seedream V4

60 道提示實測三大 1K 影像生成模型:文字渲染、寫實感、插畫各有勝負,附 Brievio 上的真實每張成本。

市面上最強的三個 1K 影像生成模型 — Google 的 Nano Banana Pro、Black Forest Labs 的 Flux 2 Pro,以及位元組跳動的 Seedream V4 — 三者各有明顯不同的個性。我們把 60 道 提示分別丟給每一個模型跑過之後,以下整理出我們會在什麼情境下選哪一個, 以及在 Brievio 上實際的成本會落在哪裡。

參賽者

  • Nano Banana Pro — Google 的旗艦影像生成模型。文字渲染(招牌、標籤、UI 設計稿)是同級裡最強的。寫實感很強,但在細節上略顯柔軟。
  • Flux 2 Pro — Black Forest Labs 的最新作。這組裡寫實感最銳利的,尤其是膚質與 布料。文字較不可靠。風格化處理上偏保守。
  • Seedream V4 — 位元組跳動偏美感取向的模型。在插畫、編輯設計、風格化作品上表現 出色。傾向把提示浪漫化 — 會自己加上提示沒要求的暖調與層次。

三者都在 Brievio 上,定價都明顯低於各供應商的官方參考價 — 按誠實的 張數計費。OpenAI API 介面完全相同 — 只需更換模型代號:

shootout.py
# 同一個 client。同一種程式碼結構。只換模型。
# 三個模型都會回傳一個可供你下載的臨時 URL。
from openai import OpenAI

client = OpenAI(
    api_key="sk-brievio-...",
    base_url="https://api.brievio.com/v1",
)

prompts = [
    "a glass-walled tea house at the edge of a misty forest, golden hour, "
    "cinematic, 50mm lens, shallow depth of field",
    "a vintage Italian espresso machine on a marble counter, soft window "
    "light, food magazine photography",
    "a stylized cityscape map of Tokyo, isometric, pastel colors, "
    "labeled districts in elegant serif",
]

for prompt in prompts:
    for model in ["nano-banana-pro", "flux-2-pro", "seedream-v4"]:
        resp = client.images.generate(
            model=model,
            prompt=prompt,
            size="1024x1024",
        )
        print(model, resp.data[0].url)

各個項目

寫實感(產品、食物、人像)

勝出:Flux 2 Pro。尤其是產品特寫攝影 — 那道濃縮咖啡機的提示,Flux 2 生出的影像簡直像是直接從 Williams Sonoma 型錄裡抽出來的。Nano Banana Pro 表現穩健,但在鍍鉻反光上略顯柔軟。 Seedream 把色調加暖,結果看起來更像 Vogue 編輯大片而不是產品照 — 有時這正是你要的,有時則不是。

  • 銳利的寫實感:Flux 2 Pro
  • 編輯/生活風攝影:Seedream V4
  • 帶層次的電影感:Nano Banana Pro(它的散景是真正的電影感)

文字與標籤(UI 設計稿、海報、招牌)

勝出:Nano Banana Pro,毫無懸念。Google 這個模型在這裡是另一個檔次。多行文字、各種字重變化、品牌風格的一致性, 全都一次到位。Flux 2 Pro 生出的是看起來煞有其事的亂碼;Seedream 會試著做,但只要超過 3 個字,拼字通常就會被它搞砸。

只要你的使用情境裡有任何要渲染的文字 — Twitter 卡片設計稿、產品包裝、 資訊圖海報、App Store 截圖 — 都從 Nano Banana Pro 開始,只有在美感 不合的時候,才去考慮其他兩個。

插畫與風格化作品

勝出:Seedream V4。那道等距視角的東京地圖提示,Seedream 生出的影像帶著那種講究的配色與構圖平衡,你會在《紐約客》的單格插畫裡 看到那種水準。Flux 2 走的是寫實再加上一點風格化,看起來像是會錯了意。 Nano Banana Pro 則落在一個稱職的中間地帶。

Seedream 會回報那些對美感描述得很細的提示。給它一個參考風格 (「in the style of mid-century Japanese woodblock prints, muted indigo and ochre」)它就會順勢發揮。Flux 2 是個照字面走的直譯者;Nano Banana Pro 則介於兩者之間。

又長又複雜的提示(多元素場景)

各有勝負。三者都能把三個元素的場景處理得很好。一旦來到 四個以上、還帶有特定空間關係的元素(「cat on the left, lamp on the right, window in the back, book on the floor」),三者就都會掉漆 — 通常會有某個元素被漏掉或被複製。

在我們這組 60 道提示裡,Nano Banana Pro 的空間準確度最好;Flux 2 Pro 跨元素的光線一致性最好;Seedream V4 即使構圖失敗,單一元素的渲染也最 漂亮。

成本(每張 1K 影像,在 Brievio 上)

三者都按張計費,不按權杖計費。 /pricing 上的每次呼叫標價是:

  • Nano Banana Pro:1K 約 $0.07、2K 約 $0.14(三者裡 最貴的,但在對的使用情境下,它的文字品質值這個價)
  • Flux 2 Pro:1K 約 $0.05、2K 約 $0.07(寫實感的 CP 值很高)
  • Seedream V4:1K 約 $0.03(三者裡最便宜;本來就是 CP 值之選,而比參考價再低約 5% 的定價更是如此)

失敗的呼叫不計費 — 如果你把模型代號拼錯,或上游拒絕了你的提示,你的 荷包分毫無損。完整規則請見 /docs/billing

你該從哪一個開始?

  • 要做 UI 設計稿工具、行銷素材產生器,或任何影像裡帶文字的 東西?選 Nano Banana Pro。別從其他兩個開始。
  • 要做產品型錄產生器、房地產視覺化,或食物/人像攝影 流水線?選 Flux 2 Pro。每一塊錢換到的寫實感非常出色。
  • 要做插畫工具、編輯封面產生器、風格化圖示庫?選 Seedream V4。即使它對提示的遵循略為寬鬆,它的美感也值得拿來實驗看看。
  • 要做一個通用型工具,需要把上面這些全都應付下來? 預設用 Nano Banana Pro,讓使用者在純照片流程改用 Flux 2、在插畫流程改用 Seedream。一個預設搭兩個逃生口的使用體驗, 勝過逼著每一位使用者自己去挑。

影像編輯 — 另一個問題

三者都有用於圖生圖的 -edit 版本:Nano Banana Edit、Flux 2 Pro Edit、Seedream V4 Edit。相對的排序也類似:Nano Banana Edit 最擅長替換文字,Flux 2 Edit 最能保留寫實感,Seedream V4 Edit 最會重新做風格化。用的是同一個 /v1/images/edits 端點,只要多帶一個 image_url 即可。

自己動手試試

完整型錄都在 /models,可依類別篩選。最快的 比較方式,就是 領取 $2 免費額度,拿你自己的 5 道提示 把上面那段程式碼跑一遍,再用你的眼睛來挑。影像的品味很個人 — 我們這場 shootout 反映的是我們跑完 60 道提示後實際採用的結果,但你的 美感也許會在我們選 Flux 的地方偏好 Seedream,反之亦然。真正算數的那場 shootout,是你用自己的提示跑出來的那一場。