// compare

Brievio vs AI/ML API

Von allen Gateways, mit denen man uns vergleicht, steht AI/ML API am nächsten: eine OpenAI-kompatible Eingangstür zu Text, Bild und Video, mit monatlichen Abo-Stufen über einer Pay-as-you-go-Basis und einer Modellzahl im dreistelligen Bereich. Wir sagen es offen. Wo die beiden auseinandergehen, sind Bezugsquelle und Preisform. Brievio leitet die echten First-Party-Modelle über Tier-1-Cloud-Kanäle, rechnet Tokens nach den Zählungen ab, die das Modell tatsächlich zurückgibt, legt den realen Upstream hinter jedem Call offen und setzt den gesamten Katalog auf eine veröffentlichte Zahl — etwa 15 % unter der Liste jedes Anbieters, für jedes Konto gleich, ohne aufzusteigende Stufe.

$ cat ./tldr.md
  • Beide nutzen das OpenAI-Format und decken Text, Bild und Video ab — die Migration ist in beide Richtungen ein base_url-Tausch.
  • AI/ML API arbeitet mit monatlicher Stufe plus zurückgesetztem Credit-Kontingent; Brievio berechnet nur, was du aufrufst, dein Aufladeguthaben verfällt nie und es gibt kein Minimum.
  • Brievios Rabatt ist eine einzige flache Zahl — rund 15 % unter Liste für jedes Modell und jedes Konto — und Aufladeboni bringen den Effektivsatz näher an 21 %. Der Effektivsatz von AI/ML API bewegt sich mit Stufe und getroffenem Modell.
  • Brievios Textmodelle sind das echte Claude, Gemini und GPT, erstanbieterseitig aus AWS Bedrock und Google Vertex; Tokens werden nach den eigenen Zählungen des Modells berechnet, fehlgeschlagene Calls kosten nichts.
  • Jeder Pro-1-M-Token-Satz steht auf /pricing, der Upstream hinter jeder Anfrage ist prüfbar, und neue Konten starten mit 2 $ Guthaben zum Ausprobieren.
$ diff

Brievio oder AI/ML API?

Fähigkeit+ Brievio- AI/ML API
Works with the OpenAI SDK as-is
JaJa
Text, image and video in one API
JaJa
Total model count
Curated setHundreds
First-hand cloud sourcing for chat models
Claude and Gemini pulled straight from AWS Bedrock and Google Vertex — traceable, not a gray-market pool.
JaTeilweise
Models arrive as the real thing
Genuine Claude / Gemini / GPT — full context window, native tools, no quiet downgrade.
JaTeilweise
Native Anthropic endpoint (/v1/messages)
Point the Anthropic SDK at us untouched — cache_control and extended thinking carry over.
JaNein
How you pay
Brievio: top up and spend as you go. AI/ML API: a monthly tier with an included allowance.
Pay-as-you-goMonthly tiers
Catalog price vs each provider's list
One published number for everyone; top-up bonuses push it to about 21%.
~15% under (uniform)Varies by tier/model
What the balance does over time
Topped-up Brievio credit stays put; tier allowances reset each cycle.
Never expiresResets monthly
Tokens billed on the model's own counts
Usage numbers come back from the model itself — no padding from hidden system prompts.
JaTeilweise
See the actual upstream per call
The model you ask for is the model you get; routing is auditable.
JaTeilweise
Reroutes when a backend wobbles
Failover kicks in the moment an upstream slows or errors.
JaTeilweise
Failed calls are not charged
JaTeilweise
Prompt caching passed through (Claude)
Where the model supports it, cache hits land on your bill as real savings.
JaTeilweise
Free credit to start
$2 on signupNein

Wo AI/ML API passt

Zwei Dinge machen AI/ML API zur sinnvollen Wahl. Das erste ist die planbare Rechnung: eine feste monatliche Stufe mit eingebautem Kontingent bedeutet, dass die Finanzabteilung die Zahl kennt, bevor der Monat beginnt — für viele Teams zählt das mehr als ein paar Prozent Stückpreis. Das zweite ist die schiere Breite — Hunderte Modelle hinter einem Key, darunter Long-Tail- und experimentelle, die ein kuratierter Katalog wie der von Brievio bewusst weglässt. Wenn deine Woche darin besteht, ein Dutzend obskure Modelle vorzuhören, oder du lieber eine Pauschale zahlst, als einen Zähler ticken zu sehen, passt diese Form. Brievio engt den Katalog absichtlich ein und rechnet stattdessen pro Call ab.

Wo Brievio gewinnt

Es läuft auf Herkunft, die Form der Rechnung und das hinaus, was passiert, wenn ein Upstream einen schlechten Tag hat. Zur Herkunft: Die Chat-Modelle sind das Original — Claude (Opus, Sonnet, Haiku) und Gemini erstanbieterseitig über Tier-1-Cloud-Kanäle bezogen, AWS Bedrock und Google Vertex, sodass der Weg von deiner Anfrage zum Modell nachvollziehbar ist statt ein Graumarkt-Pool. Volle Kontextfenster, native Tools und Caching kommen intakt an, und was du anforderst, läuft auch. (Bild und Video — Nano Banana, Nano Banana Pro, GPT-Image, Veo 3 — laufen über einen Aggregator, und das sagen wir klar.) Zur Rechnung: Jeder Pro-1-M-Token-Satz steht auf /pricing, der Katalog liegt einheitlich rund 15 % unter der Liste jedes Anbieters, mit derselben Rechnung für jedes Konto, Aufladeboni bringen den Effektivsatz auf etwa 21 %, und dein Guthaben wartet einfach, bis du es ausgibst — kein Abo, kein monatliches Minimum, 2 $ Startguthaben. An schlechten Tagen: Verbrauch wird nach den eigenen Token-Zählungen des Modells gemessen, fehlgeschlagene Calls werden nie berechnet, Prompt-Caching wird honoriert, wo das Modell es unterstützt, und Failover leitet um, sobald ein Backend langsamer wird. Die Anthropic Messages API wird zudem nativ unter /v1/messages bereitgestellt, sodass eine Anthropic-SDK-Codebasis übernommen werden kann, ohne in die OpenAI-Form umgebaut zu werden.

Wie wählen

Beginne mit einer Frage: Willst du eine feste Monatsgebühr zahlen oder nur das, was du nutzt? Wenn ein pauschales Abo zu deiner Budgetierung passt und du mit einem zurückgesetzten Kontingent leben kannst — und Wert darauf legst, eine Modellzahl im dreistelligen Bereich zu erreichen —, ist AI/ML API der sauberere Fit. Wenn du lieber pro Call gegen ein nie verfallendes Guthaben zahlst, das echte First-Party-Claude und -Gemini erstanbieterseitig bezogen bekommst, den realen Upstream hinter jeder Anfrage siehst und denselben Preis von rund 15 % unter Liste zahlst, den alle zahlen, ohne eine Stufe freizuschalten, ist Brievio dafür gebaut. Das 2-$-Startguthaben reicht, um ein paar echte Anfragen zu senden und selbst zu urteilen.

$ brievio init --production

Eine base_url. Die echten Modelle.

Wenn du bereits AI/ML API nutzt, ist der Wechsel zu Brievio eine einzeilige base_url-Änderung — dein OpenAI-SDK-Code bleibt gleich. Pay-as-you-go, rund 5 % unter offizieller Liste, keine Abos.