// compare

Brievio vs AI/ML API

比較対象に挙がるゲートウェイの中で、AI/ML API はいちばん近い存在です。テキスト・画像・動画への OpenAI 互換の入り口で、従量課金の土台に月額サブスクの階層を重ね、モデル数は数百に及びます。そこは率直に認めます。二つが本当に分かれるのは、調達経路と価格の形です。Brievio は一次プロバイダーの本物のモデルをティア1のクラウド経路で通し、モデルが実際に返した数でトークンを課金し、各呼び出しの裏側にある本当のアップストリームを開示し、カタログ全体を一つの公開価格に揃えます —— 各社のリストよりおよそ15%低く、どのアカウントでも同じ、上る階層はありません。

$ cat ./tldr.md
  • 両者とも OpenAI 形式で、テキスト・画像・動画をカバー —— どちら向きの移行も base_url を差し替えるだけ。
  • AI/ML API はリセットされるクレジット枠を伴う月額階層方式。Brievio は呼び出した分だけ課金し、チャージ残高は失効せず、最低契約もありません。
  • Brievio の割引は一つのフラットな数字 —— どのモデルでもどのアカウントでもリストより約15%安く —— チャージ特典で実効レートは21%近くまで下がります。AI/ML API の実効レートは階層と当たるモデルで動きます。
  • Brievio のテキストモデルは AWS Bedrock と Google Vertex から一次取得した本物の Claude・Gemini・GPT。課金はモデル自身の計数に基づき、失敗した呼び出しは無料です。
  • 100万トークンあたりの単価はすべて /pricing に掲載され、各リクエストの裏のアップストリームは監査可能、新規アカウントには試用の2ドルクレジットが付きます。
$ diff

Brievio か AI/ML API か?

機能+ Brievio- AI/ML API
Works with the OpenAI SDK as-is
対応対応
Text, image and video in one API
対応対応
Total model count
Curated setHundreds
First-hand cloud sourcing for chat models
Claude and Gemini pulled straight from AWS Bedrock and Google Vertex — traceable, not a gray-market pool.
対応一部
Models arrive as the real thing
Genuine Claude / Gemini / GPT — full context window, native tools, no quiet downgrade.
対応一部
Native Anthropic endpoint (/v1/messages)
Point the Anthropic SDK at us untouched — cache_control and extended thinking carry over.
対応未対応
How you pay
Brievio: top up and spend as you go. AI/ML API: a monthly tier with an included allowance.
Pay-as-you-goMonthly tiers
Catalog price vs each provider's list
One published number for everyone; top-up bonuses push it to about 21%.
~15% under (uniform)Varies by tier/model
What the balance does over time
Topped-up Brievio credit stays put; tier allowances reset each cycle.
Never expiresResets monthly
Tokens billed on the model's own counts
Usage numbers come back from the model itself — no padding from hidden system prompts.
対応一部
See the actual upstream per call
The model you ask for is the model you get; routing is auditable.
対応一部
Reroutes when a backend wobbles
Failover kicks in the moment an upstream slows or errors.
対応一部
Failed calls are not charged
対応一部
Prompt caching passed through (Claude)
Where the model supports it, cache hits land on your bill as real savings.
対応一部
Free credit to start
$2 on signup未対応

AI/ML API が合うところ

AI/ML API が筋の通った選択になる理由は二つ。一つは見通せる請求額です。額度を内包した固定の月額階層なら、月が始まる前に経理が金額を把握できる —— 多くのチームにとって、これは単価が数%違うことより重みがあります。もう一つは純粋な広さ —— 一つのキーの背後に数百のモデルがあり、Brievio のような精選カタログがあえて外すロングテールや実験的なものも含みます。今週マイナーなモデルを十数個試すつもりなら、あるいはメーターが刻むのを見るより定額を払いたいなら、その形が合います。Brievio はあえてカタログを絞り、代わりに呼び出し単位で課金します。

Brievio の強み

突き詰めると、調達経路、請求の形、そしてアップストリームの調子が悪い日に何が起きるか、の三点です。調達経路について:チャットモデルは正真正銘の本物 —— Claude(Opus、Sonnet、Haiku)と Gemini を、ティア1のクラウド経路である AWS Bedrock と Google Vertex から一次取得しているため、あなたのリクエストからモデルまでの経路はグレーマーケットのプールではなく追跡可能です。フルコンテキスト窓、ネイティブツール、キャッシュはそのまま届き、依頼したものがそのまま動きます。(画像と動画 —— Nano Banana、Nano Banana Pro、GPT-Image、Veo 3 —— はアグリゲーター経由で、その点は率直にお伝えします。)請求について:100万トークンあたりの単価はすべて /pricing に掲載され、カタログは各社のリストより一律約15%低く、どのアカウントでも同じ計算、チャージ特典で実効レートは約21%まで下がり、残高は使うまでただ待つだけ —— サブスクなし、月額最低なし、開始時に2ドルのクレジット付き。調子が悪い日について:使用量はモデル自身のトークン計数で計られ、失敗した呼び出しは課金されず、モデルが対応していればプロンプトキャッシュは有効で、バックエンドが遅くなった瞬間に経路を切り替えます。Anthropic Messages API も /v1/messages でネイティブ提供されるため、Anthropic SDK のコードベースは OpenAI 形式に作り変えずにそのまま移せます。

選び方

まず一つ問いを立てましょう。固定の月額を払いたいのか、それとも使った分だけ払いたいのか。定額サブスクが予算に合い、リセットされる枠でも構わず、数百に及ぶモデル数に手が届くことを重視するなら、AI/ML API のほうがすっきり合います。失効しない残高から呼び出し単位で払い、一次取得した本物の Claude と Gemini を使い、各リクエストの裏にある本当のアップストリームを見て、階層の解放なしに誰もが払うのと同じ「リストより約15%安い」価格で払いたいなら、Brievio はそのために作られています。2ドルのスターター・クレジットがあれば、実際のリクエストをいくつか送って自分で判断するのに十分です。

$ brievio init --production

base_url を1行変えて、本物のモデルを。

すでに AI/ML API を使っているなら、Brievio への乗り換えは base_url の1行変更だけ —— 既存の OpenAI SDK コードはそのまま動きます。従量課金、公式リスト価格より約5%安く、サブスクなし。