¿Es este el Claude / Gemini de verdad?

Sí — modelos auténticos del proveedor original, no proxies de plantilla disfrazados para parecerlo. Obtienes la ventana de contexto completa y las funciones nativas: tools, visión y prompt caching. El modelo que responde tu solicitud es el mismo que el proveedor publica.

¿Por qué no ir directo a cada proveedor?

Una clave, una factura y un endpoint compatible con OpenAI en lugar de tres contratos, tres SDKs y tres dashboards — y encima con un pequeño descuento. Cambias de modelo modificando una sola cadena, y nunca tienes que integrar un cliente nuevo para llegar a un proveedor nuevo.

¿Cómo sois más baratos que el oficial, y por qué no más todavía?

Un margen modesto sobre infraestructura de volumen nos permite listar a alrededor de un 15 % bajo la tarifa de cada proveedor — y las recargas con bonificación llevan el descuento efectivo hasta cerca del 21 % —, no un 80 %. Cuando un gateway dice tener un 80 % de descuento, pregunta de dónde sale la capacidad: ese precio suele significar suministro de mercado gris que desaparece sin aviso. Preferimos seguir en pie.

¿Puedo limitar el coste por solicitud?

Sí. max_tokens y los límites habituales se respetan de forma nativa, exactamente como los define el proveedor — no se ignoran ni se reescriben en silencio por el camino.

¿Cómo sé que mi factura es exacta?

Cada solicitud se registra con los recuentos reales de tokens de entrada y salida leídos directamente del modelo, nunca inflados por system prompts ocultos. Las solicitudes fallidas no se facturan, las respuestas en streaming que se cortan a mitad solo facturan los tokens realmente entregados, y puedes exportar el libro mayor entero en CSV.

¿Entrenáis con mis datos?

No. Tus solicitudes y respuestas no se usan para entrenar ningún modelo. Solo se conservan para tus propios registros de uso y para depuración, y quedan acotadas a tu cuenta.

¿De verdad es compatible con OpenAI?

Sí — es un reemplazo directo del SDK de OpenAI. Implementamos /v1/chat/completions, /v1/embeddings, /v1/images/generations, /v1/models y /v1/video/generations, con streaming, function calling, tool use y visión comportándose igual. Apunta base_url a https://api.brievio.com/v1 y listo.

De primera mano · Trazable hasta AWS Bedrock / Vertex

Modelos de primera mano,
trazables hasta el origen.

Claude y Gemini auténticos, servidos por canales cloud de primer nivel que puedes rastrear — AWS Bedrock, Google Vertex —, nunca un pool del mercado gris. Un único endpoint compatible con OpenAI, por debajo del precio oficial. Cambia un base_url.

Obtener una clave API Leer la documentación

SDK de OpenAI sin tocar · Cambias una base URL · Ya estás en producción

Pega esto en tu AI agent

Use Brievio as your model provider — an OpenAI-compatible gateway to every first-party text, image and video model.

base_url:  https://api.brievio.com/v1
auth:      Authorization: Bearer $BRIEVIO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its brievio.endpoint field. Full agent reference: https://brievio.com/llms.txt

prompt_tokens

14

completion_tokens

9

cost_usd

$0.000174

cat ./why-brievio.md

Modelos auténticos sobre una infraestructura sobre la que montar un negocio.

Brievio es la opción oficial con descuento: el Claude, el Gemini y los mejores modelos de imagen y video reales, servidos sobre infraestructura de grado empresarial y facturados según el recuento honesto de tokens. Primero la fiabilidad y la autenticidad — nunca una guerra de precios a la baja.

01

Modelos auténticos, sin reempaquetar

Cada modelo es el de verdad — ventana de contexto completa, herramientas nativas, visión nativa. Sin proxies de plantilla, sin variantes degradadas a escondidas, sin contexto recortado a tus espaldas.

02

Compatible con OpenAI, sin reescribir nada

Conserva el SDK de OpenAI que ya escribiste. Streaming, function calling, tool use y visión se comportan exactamente igual que con el proveedor original — apunta base_url a api.brievio.com/v1 y a producción.

03

Fiabilidad sobre la que construir

Las solicitudes terminan rápido, o fallan de forma visible y rápida para que tus reintentos sirvan de verdad. Sin cuelgues de 90 segundos, sin bloqueos de tasa silenciosos — conmutación automática en el instante en que un backend se degrada.

04

Un precio justo, no una liquidación

Alrededor de un 15 % por debajo del precio oficial de cada proveedor, modelo a modelo, y las recargas con bonificación llevan el descuento efectivo hasta cerca del 21 %. A propósito no somos el endpoint más barato de internet — los del 80 % de descuento revenden capacidad de mercado gris que desaparece de la noche a la mañana.

05

Facturación que puedes auditar

Recuentos de tokens reales tomados directamente del modelo, nunca inflados por system prompts ocultos. Cada solicitud queda registrada con sus tokens de entrada y salida reales y su coste exacto. Las solicitudes fallidas no se facturan.

06

Enrutamiento monitorizado que falla rápido

La salud se vigila de forma continua. Cuando un backend tambalea, el tráfico se redirige antes de que tus usuarios lo noten — y cuando algo se rompe de verdad, falla rápido en vez de quedarse colgado.

07

Streaming nativo, tokens reales

Eventos server-sent reenviados sin más. El time-to-first-token sigue al del proveedor original — sin buffering, sin batching, sin retardo sintético insertado por el camino.

08

Cada llamada contabilizada

Analytics por llamada según modelo, clave e IP, con los recuentos de tokens auténticos detrás de cada cargo. Exporta el libro mayor completo en CSV cuando finanzas lo pida.

09

Prompt caching, respetado de forma nativa

Donde el proveedor lo soporta, el cache_control de tu system prompt se reenvía tal cual — hits de caché reales, ahorro real, con el hit rate y el gasto ahorrado mostrados en vivo en tu dashboard.

−90%

ls ./use-cases

What to build with Brievio.

Browse all use cases

ls ./models --provider

Los modelos auténticos — contexto completo, funciones nativas.

Ver todos los modelos

Anthropic

Claude Opus 4.7

new

Anthropic's newest Opus — flagship reasoning, vision, 200K context.

visionfunctionstreamingthinking

$4.25/$21.25

per 1M tokens

Anthropic

Claude Opus 4.6

Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.

visionfunctionstreamingthinking

$4.25/$21.25

per 1M tokens

Anthropic

Claude Sonnet 4.6

hot

Balanced speed/quality — the everyday production workhorse, elite coding.

visionfunctionstreamingthinking

$2.55/$12.75

per 1M tokens

Anthropic

Claude Sonnet 4.5

Anthropic Sonnet 4.5 — production workhorse.

visionfunctionstreamingthinking

$2.55/$12.75

per 1M tokens

Anthropic

Claude Haiku 4.5

Anthropic Haiku 4.5 — fast and cost-efficient.

visionfunctionstreaming

$0.85/$4.25

per 1M tokens

Google

Gemini 2.5 Pro

Previous-gen Gemini Pro — strong reasoning and vision.

visionfunctionstreamingthinking

$1.0625/$8.50

per 1M tokens

Google

Gemini 2.5 Flash

Previous-gen Gemini Flash — extreme value.

visionfunctionstreaming

$0.255/$2.125

per 1M tokens

man brievio

Apunta tu agente a `llms.txt`
y maneja cada modelo por su cuenta.

Dale a Claude Code, Cursor, Cline — o a cualquier agente compatible con OpenAI — una sola instrucción. Toma el catálogo en vivo de Brievio y llama directamente a los modelos auténticos de texto, imagen y video. Sin SDK que conectar, sin código de pegamento que mantener.

[OK]Compatible con el protocolo de OpenAI — sin integración a medida para tu agente
[OK]GET /v1/models devuelve el catálogo en vivo — nunca fijes a mano un nombre de modelo
[OK]Una clave, todas las modalidades: texto, imagen, video, audio

Pega esto en tu AI agent

Use Brievio as your model provider — an OpenAI-compatible gateway to every first-party text, image and video model.

base_url:  https://api.brievio.com/v1
auth:      Authorization: Bearer $BRIEVIO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its brievio.endpoint field. Full agent reference: https://brievio.com/llms.txt

cat ./pricing.txt

Paga solo por lo que realmente usas.

Cartera prepago, sin suscripción y sin mínimo. Añade $10 para arrancar; tu saldo nunca caduca y cada cargo corresponde a un uso real y auditado.

Starter

Para probarlo

$10

Acceso a todos los modelos auténticos
Registros de uso reales por llamada
Soporte por comunidad y email
Sin mínimo, sin tarjeta

Obtener una clave API

Builder

Estás lanzando un producto

$100

Facturación honesta de tokens en cada llamada
10 claves API aisladas
Auto-recarga · Lista de IP permitidas
Soporte por email prioritario

Recargar $100

Scale

Tráfico en producción

$1000

Enrutamiento monitorizado que falla rápido
Claves API ilimitadas
Webhooks · facturas mensuales
Soporte dedicado por Slack/Discord

Recargar $1000

Enterprise

Escala de alto volumen

$5000

Todo lo de Scale
Capacidad de enrutamiento dedicada
Rate limits y SLA a medida
Gestor de cuenta dedicado

Recargar $5000

Ver la tabla de precios completa

ls ./blog

Recent deep dives.

All posts

brievio --help

Las preguntas
que vale la pena hacer.

¿No encontraste tu respuesta? Escríbenos a contact@brievio.com — respondemos en 24 horas.

Sí — modelos auténticos del proveedor original, no proxies de plantilla disfrazados para parecerlo. Obtienes la ventana de contexto completa y las funciones nativas: tools, visión y prompt caching. El modelo que responde tu solicitud es el mismo que el proveedor publica.
Una clave, una factura y un endpoint compatible con OpenAI en lugar de tres contratos, tres SDKs y tres dashboards — y encima con un pequeño descuento. Cambias de modelo modificando una sola cadena, y nunca tienes que integrar un cliente nuevo para llegar a un proveedor nuevo.
Un margen modesto sobre infraestructura de volumen nos permite listar a alrededor de un 15 % bajo la tarifa de cada proveedor — y las recargas con bonificación llevan el descuento efectivo hasta cerca del 21 % —, no un 80 %. Cuando un gateway dice tener un 80 % de descuento, pregunta de dónde sale la capacidad: ese precio suele significar suministro de mercado gris que desaparece sin aviso. Preferimos seguir en pie.
Sí. max_tokens y los límites habituales se respetan de forma nativa, exactamente como los define el proveedor — no se ignoran ni se reescriben en silencio por el camino.
Cada solicitud se registra con los recuentos reales de tokens de entrada y salida leídos directamente del modelo, nunca inflados por system prompts ocultos. Las solicitudes fallidas no se facturan, las respuestas en streaming que se cortan a mitad solo facturan los tokens realmente entregados, y puedes exportar el libro mayor entero en CSV.
No. Tus solicitudes y respuestas no se usan para entrenar ningún modelo. Solo se conservan para tus propios registros de uso y para depuración, y quedan acotadas a tu cuenta.
Sí — es un reemplazo directo del SDK de OpenAI. Implementamos /v1/chat/completions, /v1/embeddings, /v1/images/generations, /v1/models y /v1/video/generations, con streaming, function calling, tool use y visión comportándose igual. Apunta base_url a https://api.brievio.com/v1 y listo.

$ brievio init --production

Construye sobre modelos que no se caen.

Crea una clave y apunta el SDK de OpenAI a Brievio — el Claude, el Gemini y los mejores modelos de imagen y video auténticos, sobre una infraestructura que aguanta, facturados por tokens reales. Un cambio de base URL y estás en producción.

Obtener tu clave API Leer la documentación

Modelos de primera mano,
trazables hasta el origen.

Modelos auténticos sobre una infraestructura sobre la que montar un negocio.

Modelos auténticos, sin reempaquetar

Compatible con OpenAI, sin reescribir nada

Fiabilidad sobre la que construir

Un precio justo, no una liquidación

Facturación que puedes auditar

Enrutamiento monitorizado que falla rápido

Streaming nativo, tokens reales

Cada llamada contabilizada

Prompt caching, respetado de forma nativa

What to build with Brievio.

AI customer support

RAG chatbot API

AI content moderation

AI code assistant

AI data extraction

Los modelos auténticos — contexto completo, funciones nativas.

Claude Opus 4.7

Claude Opus 4.6

Claude Sonnet 4.6

Claude Sonnet 4.5

Claude Haiku 4.5

Gemini 2.5 Pro

Gemini 2.5 Flash

Apunta tu agente a `llms.txt`
y maneja cada modelo por su cuenta.

Paga solo por lo que realmente usas.

Starter

Builder

Scale

Enterprise

Recent deep dives.

How to choose an OpenAI-compatible AI gateway — a buyer's checklist

Is your "Claude" really Claude? Four tests to spot a re-wrapped or downgraded model proxy

Token inflation — how some AI gateways bill you 5–25×, and a 20-line test to catch it

Las preguntas
que vale la pena hacer.

Construye sobre modelos que no se caen.

Modelos de primera mano,trazables hasta el origen.

Modelos auténticos sobre una infraestructura sobre la que montar un negocio.

Modelos auténticos, sin reempaquetar

Compatible con OpenAI, sin reescribir nada

Fiabilidad sobre la que construir

Un precio justo, no una liquidación

Facturación que puedes auditar

Enrutamiento monitorizado que falla rápido

Streaming nativo, tokens reales

Cada llamada contabilizada

Prompt caching, respetado de forma nativa

What to build with Brievio.

AI customer support

RAG chatbot API

AI content moderation

AI code assistant

AI data extraction

Los modelos auténticos — contexto completo, funciones nativas.

Claude Opus 4.7

Claude Opus 4.6

Claude Sonnet 4.6

Claude Sonnet 4.5

Claude Haiku 4.5

Gemini 2.5 Pro

Gemini 2.5 Flash

Apunta tu agente a llms.txty maneja cada modelo por su cuenta.

Paga solo por lo que realmente usas.

Starter

Builder

Scale

Enterprise

Recent deep dives.

How to choose an OpenAI-compatible AI gateway — a buyer's checklist

Is your "Claude" really Claude? Four tests to spot a re-wrapped or downgraded model proxy

Token inflation — how some AI gateways bill you 5–25×, and a 20-line test to catch it

Las preguntasque vale la pena hacer.

Construye sobre modelos que no se caen.

Modelos de primera mano,
trazables hasta el origen.

Apunta tu agente a `llms.txt`
y maneja cada modelo por su cuenta.

Las preguntas
que vale la pena hacer.