// compare

Brievio vs AI/ML API

De todas las pasarelas con las que nos comparan, AI/ML API es la más cercana: una puerta de entrada compatible con OpenAI a texto, imagen y vídeo, con niveles de suscripción mensual apilados sobre una base de pago por uso y un recuento de modelos que llega a los cientos. Seamos claros al respecto. Donde ambas divergen es en el origen y en la forma del precio. Brievio enruta los modelos auténticos de primera mano por canales cloud de primer nivel, factura los tokens según los recuentos que el modelo devuelve de verdad, deja a la vista el upstream real detrás de cada llamada, y fija todo el catálogo en un único precio publicado — alrededor de un 15% por debajo de la lista de cada proveedor, igual para cada cuenta, sin nivel que escalar.

$ cat ./tldr.md
  • Formato OpenAI en ambos lados, y los dos abarcan texto, imagen y vídeo — migrar es un cambio de base_url en cualquier dirección.
  • AI/ML API funciona por nivel mensual más una asignación de créditos que se reinicia; Brievio cobra solo lo que llamas, tu saldo de recarga no expira nunca y no hay mínimo que comprometer.
  • El descuento de Brievio es una única cifra plana — alrededor de un 15% bajo lista para cada modelo y cada cuenta — y los bonos de recarga acercan la tasa efectiva al 21%. La tasa efectiva de AI/ML API varía según el nivel y el modelo que toques.
  • Los modelos de texto de Brievio son el Claude, Gemini y GPT reales obtenidos de primera mano desde AWS Bedrock y Google Vertex; los tokens se facturan según los propios recuentos del modelo y las llamadas fallidas no cuestan nada.
  • Cada tarifa por millón de tokens está publicada en /pricing, el upstream detrás de cada petición es auditable, y las cuentas nuevas empiezan con 2 $ de crédito para probar.
$ diff

¿Brievio o AI/ML API?

Capacidad+ Brievio- AI/ML API
Works with the OpenAI SDK as-is
Text, image and video in one API
Total model count
Curated setHundreds
First-hand cloud sourcing for chat models
Claude and Gemini pulled straight from AWS Bedrock and Google Vertex — traceable, not a gray-market pool.
Parcial
Models arrive as the real thing
Genuine Claude / Gemini / GPT — full context window, native tools, no quiet downgrade.
Parcial
Native Anthropic endpoint (/v1/messages)
Point the Anthropic SDK at us untouched — cache_control and extended thinking carry over.
No
How you pay
Brievio: top up and spend as you go. AI/ML API: a monthly tier with an included allowance.
Pay-as-you-goMonthly tiers
Catalog price vs each provider's list
One published number for everyone; top-up bonuses push it to about 21%.
~15% under (uniform)Varies by tier/model
What the balance does over time
Topped-up Brievio credit stays put; tier allowances reset each cycle.
Never expiresResets monthly
Tokens billed on the model's own counts
Usage numbers come back from the model itself — no padding from hidden system prompts.
Parcial
See the actual upstream per call
The model you ask for is the model you get; routing is auditable.
Parcial
Reroutes when a backend wobbles
Failover kicks in the moment an upstream slows or errors.
Parcial
Failed calls are not charged
Parcial
Prompt caching passed through (Claude)
Where the model supports it, cache hits land on your bill as real savings.
Parcial
Free credit to start
$2 on signupNo

Dónde encaja AI/ML API

Dos cosas hacen de AI/ML API una elección sensata. La primera es la factura que puedes prever: un nivel mensual fijo con una asignación incluida significa que finanzas conoce la cifra antes de que empiece el mes — para muchos equipos eso pesa más que unos puntos de precio unitario. La segunda es la pura amplitud — cientos de modelos tras una sola clave, incluidos los de cola larga y experimentales que un catálogo curado como el de Brievio deja fuera a propósito. Si tu semana consiste en probar una docena de modelos oscuros, o prefieres pagar una tarifa plana antes que ver un contador avanzar, esa es la forma que encaja. Brievio estrecha el catálogo a propósito y factura por llamada en su lugar.

Dónde gana Brievio

Todo se reduce a la procedencia, a la forma de la factura y a lo que ocurre cuando un upstream tiene un mal día. Sobre la procedencia: los modelos de chat son el artículo genuino — Claude (Opus, Sonnet, Haiku) y Gemini obtenidos de primera mano por canales cloud de primer nivel, AWS Bedrock y Google Vertex, de modo que el camino de tu petición al modelo es trazable y no un pool de mercado gris. Las ventanas de contexto completas, las herramientas nativas y el caching llegan intactos, y lo que pides es lo que se ejecuta. (Imagen y vídeo — Nano Banana, Nano Banana Pro, GPT-Image, Veo 3 — llegan vía un agregador, y lo decimos sin rodeos.) Sobre la factura: cada tarifa por millón de tokens se publica en /pricing, el catálogo está uniformemente alrededor de un 15 % bajo la lista de cada proveedor, con la misma cuenta para cada cuenta, los bonos de recarga llevan la tasa efectiva a cerca del 21 %, y tu saldo simplemente espera a que lo gastes — sin suscripción, sin mínimo mensual, con 2 $ de crédito para empezar. En los malos días: el consumo se mide según los propios recuentos de tokens del modelo, las llamadas fallidas no se facturan nunca, el prompt caching se respeta donde el modelo lo admite, y el failover reenruta en cuanto un backend se ralentiza. La API Messages de Anthropic también se sirve de forma nativa en /v1/messages, así que una base de código con el SDK de Anthropic se traslada sin reformarse al formato OpenAI.

Cómo elegir

Empieza por una pregunta: ¿quieres pagar una tarifa mensual fija, o solo por lo que usas? Si una suscripción plana encaja en tu presupuesto y puedes vivir con una asignación que se reinicia — y valoras llegar a un recuento de modelos que se cuenta por cientos —, AI/ML API es el ajuste más limpio. Si prefieres pagar por llamada contra un saldo que no expira nunca, obtener el Claude y Gemini auténticos de primera mano, ver el upstream real detrás de cada petición, y pagar el mismo precio de alrededor de un 15 % bajo lista que paga todo el mundo sin nivel que desbloquear, Brievio está hecho para eso. El crédito inicial de 2 $ basta para enviar unas cuantas peticiones reales y juzgar por ti mismo.

$ brievio init --production

Una base_url. Los modelos auténticos.

Si ya usas AI/ML API, migrar a Brievio es un cambio de una línea en base_url — tu código de SDK OpenAI sigue igual. Pago por uso, ~5 % bajo el precio oficial, sin suscripciones.