Hoy lanzamos Brievio: una API compatible con OpenAI para los modelos frontera genuinos, pensada para equipos que ponen la IA en producción y necesitan que el endpoint siga en pie, facture con honestidad y devuelva el modelo de verdad.
La propuesta es breve: una sola URL base, un solo bearer token, el Claude, el Gemini y los mejores modelos de imagen y vídeo de verdad — sobre infraestructura de nivel empresarial y a un precio justo por debajo de la tarifa oficial. Texto, imagen y vídeo, todo tras una única factura auditable.
¿Por qué otro gateway?
Hemos lanzado suficientes funciones de IA como para saber que el dolor no está en el SDK, sino en todo lo que lo rodea. Un contrato por proveedor. Facturación por modelo repartida en paneles distintos. Bloqueos misteriosos de 90 segundos un fin de semana en producción. Y una oleada de gateways «más baratos» que en silencio reenvuelven modelos, inflan los conteos de tokens o revenden capacidad de mercado gris que desaparece de un día para otro. Brievio responde a cada uno de esos puntos de frente.
- Los modelos genuinos, nada reenvuelto. Cada modelo es el auténtico sobre backends de nivel first-party: contexto completo, herramientas nativas, visión y caché. Sin proxies de plantilla, sin degradaciones silenciosas, sin contexto truncado. Cambia un solo
base_url. - Una fiabilidad sobre la que construir. Las peticiones se completan rápido, o fallan fuerte y rápido para que tus reintentos funcionen. Sin muros de límite silenciosos. En cuanto un upstream se degrada, reenrutamos, normalmente antes de que tu bucle de reintento siquiera se dispare.
- Una facturación que puedes auditar. Conteos de tokens reales directos del modelo, nunca inflados por system prompts ocultos. Cada petición se registra con los tokens reales de input y output y su coste. Las peticiones fallidas son gratis.
- Un precio justo, no una liquidación. Alrededor de un 15 % por debajo de la tarifa oficial de cada proveedor, por modelo, publicado en texto plano en /pricing. A propósito no somos el gateway más barato de internet; los que rebajan un 80 % no están vendiendo lo que dicen vender.
- Checkout nativo de Stripe. Tarjetas, Apple Pay, Google Pay, ACH, SEPA, Alipay, WeChat Pay: cualquier cosa que Stripe admita. 2 $ de crédito gratis al registrarte, recarga mínima de 5 $, sin suscripción y con un saldo que nunca caduca.
Lo que tienes desde el primer día
- El catálogo genuino en vivo: Claude Opus 4.7, Sonnet 4.6 y Haiku 4.5, Gemini 2.5 Pro y Flash, GPT-Image-2, Veo 3, Nano Banana; la lista completa en /models.
- La Messages API nativa de Anthropic junto al endpoint de chat completions de OpenAI, para que quienes usan Claude también puedan conservar su SDK.
- Caché de prompts respetada allí donde el proveedor la soporta, con un router de afinidad que mantiene tu caché caliente: aciertos de caché reales, ahorros reales en prompts repetidos.
- Un panel autogestionado para claves, uso y facturación, además de un flujo de llamadas de administración que cronometra cada petición y muestra el upstream exacto que la atendió.
Tres minutos hasta tu primera llamada
from openai import OpenAI
client = OpenAI(
api_key="sk-brievio-...",
base_url="https://api.brievio.com/v1", # cambia solo esta línea
)
# El mismo SDK. El modelo genuino.
resp = client.chat.completions.create(
model="claude-sonnet-4-6",
messages=[{"role": "user", "content": "Hola, Brievio"}],
)
print(resp.choices[0].message.content)Regístrate en brievio.com/app/signup: recibes 2 $ en créditos, suficiente para poner a prueba cada modalidad.
Qué viene a continuación
En la hoja de ruta para los próximos dos meses: un asistente de migración integrado en el producto desde OpenAI, Anthropic y OpenRouter; agrupación de tokens consciente de los embeddings; y cuentas de equipo con presupuestos por clave y registros de auditoría por entorno. Publicaremos cada lanzamiento en /changelog.
Los errores y el feedback de producto llegan a nuestra bandeja en contact@brievio.com. Respondemos a todos los correos.