De primera mano · Trazable hasta AWS Bedrock / Vertex

Modelos de primera mano,
trazables hasta el origen.

Claude y Gemini auténticos, servidos por canales cloud de primer nivel que puedes rastrear — AWS Bedrock, Google Vertex —, nunca un pool del mercado gris. Un único endpoint compatible con OpenAI, por debajo del precio oficial. Cambia un base_url.

SDK de OpenAI sin tocar · Cambias una base URL · Ya estás en producción

Pega esto en tu AI agent
Use Brievio as your model provider — an OpenAI-compatible gateway to every first-party text, image and video model.

base_url:  https://api.brievio.com/v1
auth:      Authorization: Bearer $BRIEVIO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its brievio.endpoint field. Full agent reference: https://brievio.com/llms.txt
prompt_tokens
14
completion_tokens
9
cost_usd
$0.000174

$Sobre infraestructura de grado proveedor original

  • 16+Modelos en el catálogo
  • 7Modelos de chat de primera mano
  • ~15 %Por debajo del oficial
  • 99,95 %Disponibilidad medida
  • HonestaFacturación de tokens
  • Sin cambiosSDK de OpenAI
cat ./why-brievio.md

Modelos auténticos sobre una infraestructura sobre la que montar un negocio.

Brievio es la opción oficial con descuento: el Claude, el Gemini y los mejores modelos de imagen y video reales, servidos sobre infraestructura de grado empresarial y facturados según el recuento honesto de tokens. Primero la fiabilidad y la autenticidad — nunca una guerra de precios a la baja.

01

Modelos auténticos, sin reempaquetar

Cada modelo es el de verdad — ventana de contexto completa, herramientas nativas, visión nativa. Sin proxies de plantilla, sin variantes degradadas a escondidas, sin contexto recortado a tus espaldas.

02

Compatible con OpenAI, sin reescribir nada

Conserva el SDK de OpenAI que ya escribiste. Streaming, function calling, tool use y visión se comportan exactamente igual que con el proveedor original — apunta base_url a api.brievio.com/v1 y a producción.

03

Fiabilidad sobre la que construir

Las solicitudes terminan rápido, o fallan de forma visible y rápida para que tus reintentos sirvan de verdad. Sin cuelgues de 90 segundos, sin bloqueos de tasa silenciosos — conmutación automática en el instante en que un backend se degrada.

04

Un precio justo, no una liquidación

Alrededor de un 15 % por debajo del precio oficial de cada proveedor, modelo a modelo, y las recargas con bonificación llevan el descuento efectivo hasta cerca del 21 %. A propósito no somos el endpoint más barato de internet — los del 80 % de descuento revenden capacidad de mercado gris que desaparece de la noche a la mañana.

05

Facturación que puedes auditar

Recuentos de tokens reales tomados directamente del modelo, nunca inflados por system prompts ocultos. Cada solicitud queda registrada con sus tokens de entrada y salida reales y su coste exacto. Las solicitudes fallidas no se facturan.

06

Enrutamiento monitorizado que falla rápido

La salud se vigila de forma continua. Cuando un backend tambalea, el tráfico se redirige antes de que tus usuarios lo noten — y cuando algo se rompe de verdad, falla rápido en vez de quedarse colgado.

07

Streaming nativo, tokens reales

Eventos server-sent reenviados sin más. El time-to-first-token sigue al del proveedor original — sin buffering, sin batching, sin retardo sintético insertado por el camino.

08

Cada llamada contabilizada

Analytics por llamada según modelo, clave e IP, con los recuentos de tokens auténticos detrás de cada cargo. Exporta el libro mayor completo en CSV cuando finanzas lo pida.

09

Prompt caching, respetado de forma nativa

Donde el proveedor lo soporta, el cache_control de tu system prompt se reenvía tal cual — hits de caché reales, ahorro real, con el hit rate y el gasto ahorrado mostrados en vivo en tu dashboard.

man brievio

Apunta tu agente a llms.txt
y maneja cada modelo por su cuenta.

Dale a Claude Code, Cursor, Cline — o a cualquier agente compatible con OpenAI — una sola instrucción. Toma el catálogo en vivo de Brievio y llama directamente a los modelos auténticos de texto, imagen y video. Sin SDK que conectar, sin código de pegamento que mantener.

  • [OK]Compatible con el protocolo de OpenAI — sin integración a medida para tu agente
  • [OK]GET /v1/models devuelve el catálogo en vivo — nunca fijes a mano un nombre de modelo
  • [OK]Una clave, todas las modalidades: texto, imagen, video, audio
Pega esto en tu AI agent
Use Brievio as your model provider — an OpenAI-compatible gateway to every first-party text, image and video model.

base_url:  https://api.brievio.com/v1
auth:      Authorization: Bearer $BRIEVIO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its brievio.endpoint field. Full agent reference: https://brievio.com/llms.txt
cat ./pricing.txt

Paga solo por lo que realmente usas.

Cartera prepago, sin suscripción y sin mínimo. Añade $10 para arrancar; tu saldo nunca caduca y cada cargo corresponde a un uso real y auditado.

Starter

Para probarlo

$10
  • Acceso a todos los modelos auténticos
  • Registros de uso reales por llamada
  • Soporte por comunidad y email
  • Sin mínimo, sin tarjeta
Obtener una clave API
Most popular

Builder

Estás lanzando un producto

$100
  • Facturación honesta de tokens en cada llamada
  • 10 claves API aisladas
  • Auto-recarga · Lista de IP permitidas
  • Soporte por email prioritario
Recargar $100

Scale

Tráfico en producción

$1000
  • Enrutamiento monitorizado que falla rápido
  • Claves API ilimitadas
  • Webhooks · facturas mensuales
  • Soporte dedicado por Slack/Discord
Recargar $1000

Enterprise

Escala de alto volumen

$5000
  • Todo lo de Scale
  • Capacidad de enrutamiento dedicada
  • Rate limits y SLA a medida
  • Gestor de cuenta dedicado
Recargar $5000
brievio --help

Las preguntas
que vale la pena hacer.

¿No encontraste tu respuesta? Escríbenos a contact@brievio.com — respondemos en 24 horas.

  • Sí — modelos auténticos del proveedor original, no proxies de plantilla disfrazados para parecerlo. Obtienes la ventana de contexto completa y las funciones nativas: tools, visión y prompt caching. El modelo que responde tu solicitud es el mismo que el proveedor publica.

  • Una clave, una factura y un endpoint compatible con OpenAI en lugar de tres contratos, tres SDKs y tres dashboards — y encima con un pequeño descuento. Cambias de modelo modificando una sola cadena, y nunca tienes que integrar un cliente nuevo para llegar a un proveedor nuevo.

  • Un margen modesto sobre infraestructura de volumen nos permite listar a alrededor de un 15 % bajo la tarifa de cada proveedor — y las recargas con bonificación llevan el descuento efectivo hasta cerca del 21 % —, no un 80 %. Cuando un gateway dice tener un 80 % de descuento, pregunta de dónde sale la capacidad: ese precio suele significar suministro de mercado gris que desaparece sin aviso. Preferimos seguir en pie.

  • Sí. max_tokens y los límites habituales se respetan de forma nativa, exactamente como los define el proveedor — no se ignoran ni se reescriben en silencio por el camino.

  • Cada solicitud se registra con los recuentos reales de tokens de entrada y salida leídos directamente del modelo, nunca inflados por system prompts ocultos. Las solicitudes fallidas no se facturan, las respuestas en streaming que se cortan a mitad solo facturan los tokens realmente entregados, y puedes exportar el libro mayor entero en CSV.

  • No. Tus solicitudes y respuestas no se usan para entrenar ningún modelo. Solo se conservan para tus propios registros de uso y para depuración, y quedan acotadas a tu cuenta.

  • Sí — es un reemplazo directo del SDK de OpenAI. Implementamos /v1/chat/completions, /v1/embeddings, /v1/images/generations, /v1/models y /v1/video/generations, con streaming, function calling, tool use y visión comportándose igual. Apunta base_url a https://api.brievio.com/v1 y listo.

$ brievio init --production

Construye sobre modelos que no se caen.

Crea una clave y apunta el SDK de OpenAI a Brievio — el Claude, el Gemini y los mejores modelos de imagen y video auténticos, sobre una infraestructura que aguanta, facturados por tokens reales. Un cambio de base URL y estás en producción.