// compare

Brievio vs AI/ML API

在所有被拿來和我們對比的網關裡,AI/ML API 離得最近:一個 OpenAI 相容的入口,通文字、影像、影片,在按需付費的底座上疊了月度訂閱檔位,模型數量數以百計。這點我們直說。兩者真正分岔的地方在於來源和定價形態。Brievio 走一級雲廠商通道接入正版一手模型,按模型實際返回的計數收費,每次調用背後的真實上游都擺給你看,並把整個目錄定在一個公示價上 —— 大約比各家掛牌價低 15%,每個帳戶一視同仁,不必往上爬檔位。

$ cat ./tldr.md
  • 兩邊都是 OpenAI 協議,且都覆蓋文字、影像、影片 —— 任一方向遷移都只是換個 base_url。
  • AI/ML API 的模式是月度檔位加一份會重置的額度;Brievio 只對你實際調用的部分收費,儲值餘額永不過期,也沒有最低消費門檻。
  • Brievio 的折扣是一個統一數字 —— 每個模型、每個帳戶都約比掛牌價低 15% —— 儲值贈送還把實際折扣拉到接近 21%。AI/ML API 的實際費率會隨檔位和命中的模型浮動。
  • Brievio 的文字模型是從 AWS Bedrock、Google Vertex 一手取得的真正 Claude、Gemini 與 GPT;按模型自身計數收費,失敗的調用不花錢。
  • 每個每 1M token 的費率都公示在 /pricing,每次請求背後的上游可稽核,新帳戶還有 2 美元額度可以先試。
$ diff

選 Brievio 還是 AI/ML API?

能力+ Brievio- AI/ML API
Works with the OpenAI SDK as-is
支援支援
Text, image and video in one API
支援支援
Total model count
Curated setHundreds
First-hand cloud sourcing for chat models
Claude and Gemini pulled straight from AWS Bedrock and Google Vertex — traceable, not a gray-market pool.
支援部分
Models arrive as the real thing
Genuine Claude / Gemini / GPT — full context window, native tools, no quiet downgrade.
支援部分
Native Anthropic endpoint (/v1/messages)
Point the Anthropic SDK at us untouched — cache_control and extended thinking carry over.
支援不支援
How you pay
Brievio: top up and spend as you go. AI/ML API: a monthly tier with an included allowance.
Pay-as-you-goMonthly tiers
Catalog price vs each provider's list
One published number for everyone; top-up bonuses push it to about 21%.
~15% under (uniform)Varies by tier/model
What the balance does over time
Topped-up Brievio credit stays put; tier allowances reset each cycle.
Never expiresResets monthly
Tokens billed on the model's own counts
Usage numbers come back from the model itself — no padding from hidden system prompts.
支援部分
See the actual upstream per call
The model you ask for is the model you get; routing is auditable.
支援部分
Reroutes when a backend wobbles
Failover kicks in the moment an upstream slows or errors.
支援部分
Failed calls are not charged
支援部分
Prompt caching passed through (Claude)
Where the model supports it, cache hits land on your bill as real savings.
支援部分
Free credit to start
$2 on signup不支援

AI/ML API 的適用場景

有兩點讓 AI/ML API 成為合理之選。其一是可預測的帳單:固定月度檔位 + 內含額度,意味著財務在月初就知道數字 —— 對許多團隊來說,這比單價差幾個百分點更重要。其二是純粹的廣度 —— 一把密鑰背後數百個模型,包括精選目錄(如 Brievio)有意省去的長尾與實驗性型號。如果你這一週要試遍十幾個冷門模型,或者你寧願付固定費用也不想盯著計量器跳動,那這種形態就合適。Brievio 則刻意收窄目錄,改為按調用計費。

Brievio 的強項

歸根結底就三件事:來源、帳單的形態,以及上游出狀況時會發生什麼。來源上:對話模型是貨真價實的正版 —— Claude(Opus、Sonnet、Haiku)與 Gemini 經一級雲通道 AWS Bedrock、Google Vertex 一手取得,從你的請求到模型這條路徑是可追溯的,而非灰色資源池。完整上下文窗口、原生工具與快取都原樣保留,你請求什麼就跑什麼。(影像與影片 —— Nano Banana、Nano Banana Pro、GPT-Image、Veo 3 —— 經聚合渠道接入,這點我們如實說明。)帳單上:每個每 1M token 的費率都公示在 /pricing,整個目錄統一比各家掛牌價低約 15%,對每個帳戶都是同一套算法,儲值贈送把實際費率拉到約 21%,餘額就靜靜等你去花 —— 無訂閱、無月度最低消費,起步還送 2 美元額度。出狀況時:用量按模型自身的 token 計數計量,失敗調用永不收費,模型支援時 prompt 緩存照常生效,後端一變慢即刻改路。Anthropic Messages API 也原生提供在 /v1/messages,因此基於 Anthropic SDK 的程式碼可以直接遷過來,無需改寫成 OpenAI 格式。

如何選

先問自己一個問題:你想付固定月費,還是只為用量付費?如果固定訂閱契合你的預算、你能接受會重置的額度,並且看重能夠觸及數以百計的模型 —— AI/ML API 更順手。如果你更願意從一筆永不過期的餘額裡按調用扣費、要正版且一手取得的 Claude 與 Gemini、想看見每次請求背後的真實上游、並支付和所有人相同的約低於掛牌價 15% 的價格而無需解鎖檔位 —— Brievio 正是為此而造。2 美元的起步額度足夠你發幾個真實請求、自己判斷。

$ brievio init --production

改一行 base_url,呼叫正版模型。

如果你已經在用 AI/ML API,遷移到 Brievio 只需改一行 base_url —— 現有 OpenAI SDK 程式碼原樣可用。按需付費,價格低於官方掛牌價約 5%,無訂閱。