// compare

Brievio vs AI/ML API

De toutes les passerelles auxquelles on nous compare, AI/ML API est la plus proche : une porte d'entrée compatible OpenAI vers le texte, l'image et la vidéo, avec des paliers d'abonnement mensuel empilés sur une base pay-as-you-go et un nombre de modèles qui se compte en centaines. Soyons francs là-dessus. Là où les deux divergent, c'est la provenance et la forme du prix. Brievio achemine les modèles authentiques de première main via des canaux cloud de premier rang, facture les tokens sur les comptes que le modèle renvoie réellement, expose l'upstream réel derrière chaque appel, et fixe tout le catalogue sur un seul prix publié — environ 15 % sous la liste de chaque fournisseur, identique pour chaque compte, sans palier à gravir.

$ cat ./tldr.md
  • Format OpenAI des deux côtés, et tous deux couvrent texte, image et vidéo — la migration n'est qu'un changement de base_url dans un sens comme dans l'autre.
  • AI/ML API fonctionne par palier mensuel plus une allocation de crédits qui se réinitialise ; Brievio ne facture que ce que tu appelles, ton solde de recharge n'expire jamais et il n'y a aucun minimum.
  • Le rabais de Brievio est un seul chiffre uniforme — environ 15 % sous la liste pour chaque modèle et chaque compte — et les bonus de recharge rapprochent le taux effectif de 21 %. Le taux effectif d'AI/ML API bouge selon le palier et le modèle visé.
  • Les modèles texte de Brievio sont le vrai Claude, Gemini et GPT obtenus de première main depuis AWS Bedrock et Google Vertex ; les tokens sont facturés sur les propres comptes du modèle et les appels échoués ne coûtent rien.
  • Chaque tarif par million de tokens est affiché sur /pricing, l'upstream derrière chaque requête est auditable, et les nouveaux comptes démarrent avec 2 $ de crédit pour essayer.
$ diff

Brievio ou AI/ML API ?

Fonctionnalité+ Brievio- AI/ML API
Works with the OpenAI SDK as-is
OuiOui
Text, image and video in one API
OuiOui
Total model count
Curated setHundreds
First-hand cloud sourcing for chat models
Claude and Gemini pulled straight from AWS Bedrock and Google Vertex — traceable, not a gray-market pool.
OuiPartiel
Models arrive as the real thing
Genuine Claude / Gemini / GPT — full context window, native tools, no quiet downgrade.
OuiPartiel
Native Anthropic endpoint (/v1/messages)
Point the Anthropic SDK at us untouched — cache_control and extended thinking carry over.
OuiNon
How you pay
Brievio: top up and spend as you go. AI/ML API: a monthly tier with an included allowance.
Pay-as-you-goMonthly tiers
Catalog price vs each provider's list
One published number for everyone; top-up bonuses push it to about 21%.
~15% under (uniform)Varies by tier/model
What the balance does over time
Topped-up Brievio credit stays put; tier allowances reset each cycle.
Never expiresResets monthly
Tokens billed on the model's own counts
Usage numbers come back from the model itself — no padding from hidden system prompts.
OuiPartiel
See the actual upstream per call
The model you ask for is the model you get; routing is auditable.
OuiPartiel
Reroutes when a backend wobbles
Failover kicks in the moment an upstream slows or errors.
OuiPartiel
Failed calls are not charged
OuiPartiel
Prompt caching passed through (Claude)
Where the model supports it, cache hits land on your bill as real savings.
OuiPartiel
Free credit to start
$2 on signupNon

Là où AI/ML API convient

Deux choses font d'AI/ML API un choix sensé. La première est la facture prévisible : un palier mensuel fixe avec une allocation incluse signifie que la finance connaît le chiffre avant le début du mois — pour bien des équipes, cela pèse plus que quelques pourcents de prix unitaire. La seconde est l'ampleur pure — des centaines de modèles derrière une seule clé, y compris des modèles de longue traîne et expérimentaux qu'un catalogue curé comme celui de Brievio écarte volontairement. Si ta semaine consiste à auditionner une douzaine de modèles obscurs, ou que tu préfères payer un forfait plutôt que regarder un compteur défiler, c'est la forme qui convient. Brievio resserre le catalogue à dessein et facture plutôt à l'appel.

Là où Brievio gagne

Tout se ramène à la provenance, à la forme de la facture, et à ce qui se passe quand un upstream a une mauvaise journée. Sur la provenance : les modèles de chat sont l'original — Claude (Opus, Sonnet, Haiku) et Gemini obtenus de première main via des canaux cloud de premier rang, AWS Bedrock et Google Vertex, de sorte que le chemin de ta requête au modèle est traçable plutôt qu'un pool de marché gris. Fenêtres de contexte complètes, outils natifs et caching arrivent intacts, et ce que tu demandes est ce qui tourne. (Image et vidéo — Nano Banana, Nano Banana Pro, GPT-Image, Veo 3 — passent par un agrégateur, et nous le disons franchement.) Sur la facture : chaque tarif par million de tokens est publié sur /pricing, le catalogue est uniformément à environ 15 % sous la liste de chaque fournisseur, avec le même calcul pour chaque compte, les bonus de recharge portent le taux effectif à environ 21 %, et ton solde attend simplement que tu le dépenses — sans abonnement, sans minimum mensuel, avec 2 $ de crédit au départ. Les mauvais jours : la consommation est mesurée sur les propres comptes de tokens du modèle, les appels échoués ne sont jamais facturés, le prompt caching est honoré là où le modèle le permet, et le failover réachemine dès qu'un backend ralentit. L'API Messages d'Anthropic est aussi servie nativement sur /v1/messages, donc une base de code en SDK Anthropic se transfère sans être remodelée au format OpenAI.

Comment choisir

Commence par une question : veux-tu payer un forfait mensuel fixe, ou seulement ce que tu consommes ? Si un abonnement forfaitaire convient à ta gestion budgétaire et que tu peux vivre avec une allocation qui se réinitialise — et que tu tiens à atteindre un nombre de modèles qui se compte en centaines —, AI/ML API est le choix le plus net. Si tu préfères payer à l'appel sur un solde qui n'expire jamais, obtenir le vrai Claude et Gemini de première main, voir l'upstream réel derrière chaque requête, et payer le même prix d'environ 15 % sous la liste que tout le monde sans palier à débloquer, Brievio est conçu pour ça. Le crédit de démarrage de 2 $ suffit à envoyer quelques vraies requêtes et à juger par toi-même.

$ brievio init --production

Une base_url. Les modèles authentiques.

Si vous utilisez déjà AI/ML API, passer à Brievio est un changement d'une ligne de base_url — votre code SDK OpenAI reste identique. Paiement à l'usage, environ 5 % sous le tarif officiel, sans abonnement.