Aujourd’hui, nous lançons Brievio — une seule API compatible OpenAI pour les vrais modèles de pointe, conçue pour les équipes qui mettent l’IA en production et ont besoin d’un endpoint qui reste debout, facture honnêtement et renvoie le vrai modèle.

L’argument tient en une phrase : une seule base URL, un seul bearer token, le vrai Claude, Gemini et les meilleurs modèles d’image et de vidéo — sur une infrastructure de niveau entreprise, à un tarif juste en dessous du catalogue officiel. Texte, image, vidéo, le tout derrière une facture unique et auditable.

Pourquoi encore une passerelle ?

Nous avons livré assez de fonctionnalités d’IA pour savoir que la douleur n’est pas le SDK — c’est tout ce qui l’entoure. Un contrat par fournisseur. Une facturation par modèle dans des tableaux de bord différents. Des blocages mystérieux de 90 secondes un week-end de production. Et une vague de passerelles « moins chères » qui ré-emballent discrètement les modèles, gonflent les décomptes de tokens ou revendent de la capacité de marché gris qui s’évapore du jour au lendemain. Brievio répond à chacun de ces points, sans détour.

Les modèles authentiques, rien de ré-emballé. Chaque modèle est le vrai, sur des backends de niveau first-party — contexte complet, outils natifs, vision et caching. Pas de proxys à gabarit, pas de rétrogradations silencieuses, pas de contexte tronqué. Change une seule base_url.
Une fiabilité sur laquelle bâtir. Les requêtes aboutissent vite — ou échouent franchement et vite, pour que tes retries fonctionnent. Pas de mur de rate-limit silencieux. Dès qu’un upstream se dégrade, nous re-routons, en général avant même que ta boucle de retry ne se déclenche.
Une facture que tu peux auditer. Les vrais décomptes de tokens, directement issus du modèle, jamais gonflés par des prompts système cachés. Chaque requête est journalisée avec ses vrais tokens d’entrée/sortie et son coût. Les requêtes échouées sont gratuites.
Un prix juste, pas une braderie. Environ 15 % en dessous du tarif catalogue officiel de chaque fournisseur, modèle par modèle — publié en clair sur /pricing. Nous ne sommes délibérément pas la passerelle la moins chère en ligne ; celles à -80 % ne vendent pas ce qu’elles prétendent.
Un paiement nativement Stripe. Cartes, Apple Pay, Google Pay, ACH, SEPA, Alipay, WeChat Pay — tout ce que Stripe prend en charge. 2 $ de crédit offerts à l’inscription, recharge minimale de 5 $, sans abonnement, solde sans expiration.

Ce que tu obtiens dès le premier jour

Le catalogue authentique en ligne — Claude Opus 4.7, Sonnet 4.6 et Haiku 4.5, Gemini 2.5 Pro et Flash, GPT-Image-2, Veo 3, Nano Banana — liste complète sur /models.
L’API Messages native d’Anthropic aux côtés de l’endpoint chat completions d’OpenAI, pour que les utilisateurs de Claude gardent eux aussi leur SDK.
Le prompt caching honoré là où le fournisseur le prend en charge, avec un routeur à affinité qui garde ton cache au chaud — de vrais hits de cache, de vraies économies sur les prompts répétés.
Un tableau de bord en self-service pour les clés, l’usage et la facturation, plus un flux d’appels admin qui chronomètre chaque requête et montre l’upstream exact qui l’a servie.

Trois minutes jusqu’à ton premier appel

first_call.py

from openai import OpenAI

client = OpenAI(
    api_key="sk-brievio-...",
    base_url="https://api.brievio.com/v1",  # ne change que cette ligne
)

# Le même SDK. Le modèle authentique.
resp = client.chat.completions.create(
    model="claude-sonnet-4-6",
    messages=[{"role": "user", "content": "Hello, Brievio"}],
)
print(resp.choices[0].message.content)

Inscris-toi sur brievio.com/app/signup — tu reçois 2 $ de crédits, de quoi mettre chaque modalité à l’épreuve.

La suite

Au programme des deux prochains mois : un assistant de migration intégré au produit depuis OpenAI, Anthropic et OpenRouter ; un batching de tokens conscient des embeddings ; et des comptes d’équipe avec budgets par clé et journaux d’audit par environnement. Nous publierons chaque livraison dans /changelog.

Les bugs et retours produit atterrissent dans notre boîte à contact@brievio.com. Nous répondons à chaque e-mail.

Brievio est lancé : une API compatible OpenAI pour les vrais modèles de pointe

Pourquoi encore une passerelle ?

Ce que tu obtiens dès le premier jour

Trois minutes jusqu’à ton premier appel

La suite

$ ls ./related

Brievio 正式发布——一个兼容 OpenAI 的统一 API，直连货真价实的一线模型，价格略低于官方标价

Brievio 正式推出：一個與 OpenAI 相容、回傳真正模型的 AI 閘道

Brievio 提供開始 — 本物のフロンティアモデルを 1 つの OpenAI 互換 API で

Brievio startet: eine OpenAI-kompatible API für die echten Frontier-Modelle