这真的是原版 Claude / Gemini 吗？

是的 —— 货真价实的一手原版模型，不是装扮得像它们的套壳代理。你拿到的是完整上下文窗口，以及工具、视觉与 Prompt 缓存等原生能力。响应你请求的，就是供应商发布的那个模型本尊。

为什么不直接去找每家供应商？

一把 Key、一张账单、一个兼容 OpenAI 的端点，胜过三份合同、三套 SDK 与三个控制台 —— 而且价格上还略有让利。换模型只需改一个字符串，再也不必为接入某家新供应商而重新对接一个客户端。

你们凭什么比官方便宜，又为什么不更便宜？

在规模化基础设施上取一份不高的差价，让我们能把标价定在各家约 85 折，叠加充值赠送后实付最高可再低至官方约 79 折(~21% off)—— 而不是打两折。当某个网关号称打两折，请追问算力从哪来：那种定价通常意味着随时会无预警消失的灰色市场供给。我们宁可让服务稳稳在线。

我能限制每次请求的费用上限吗？

可以。max_tokens 以及常见的各项限制都被原生遵循，与供应商的定义完全一致 —— 它们不会在透传途中被无声忽略或改写。

我怎么确认账单是准确的？

每次请求都记录直接读自模型的真实输入与输出 token 数，绝不被隐藏的系统提示注水。失败请求不计费，中途断开的流式响应只按实际送达的 token 计费，整本流水还可导出为 CSV。

你们会拿我的数据去训练吗？

不会。你的请求与响应不会被用于训练任何模型。它们仅为你自己的用量日志与排障而保留，并且只归属于你的账户。

它真的兼容 OpenAI 吗？

是的 —— 对 OpenAI SDK 而言拿来即用。我们实现了 /v1/chat/completions、/v1/embeddings、/v1/images/generations、/v1/models 与 /v1/video/generations，流式、function calling、tool use 与视觉的表现完全一致。把 base_url 指向 https://api.brievio.com/v1 就大功告成。

一手直供 · 可溯源到 AWS Bedrock / Vertex

大厂一手货源,
链路可溯源。

真·Claude 与 Gemini,经可溯源的一级云通道(AWS Bedrock、Google Vertex)直供,绝非灰产池子。统一收进一个 OpenAI 兼容端点,价格低于官方。只改一行 base_url。

获取 API Key 阅读文档

直接套用 OpenAI SDK · 改一处 base URL · 立即上线

粘贴给你的 AI Agent

Use Brievio as your model provider — an OpenAI-compatible gateway to every first-party text, image and video model.

base_url:  https://api.brievio.com/v1
auth:      Authorization: Bearer $BRIEVIO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its brievio.endpoint field. Full agent reference: https://brievio.com/llms.txt

prompt_tokens

14

completion_tokens

9

cost_usd

$0.000174

cat ./why-brievio.md

原版模型，跑在足以撑起一门生意的基础设施上。

Brievio 是「官方折扣」这一档：原版的 Claude、Gemini 与顶级图像/视频模型，部署在企业级后端，按如实的 token 数计费。我们把可靠与真实放在第一位，绝不为压价而牺牲质量。

01

原版模型，绝无二次包装

每个模型都是原版本尊 —— 完整上下文窗口、原生工具、原生视觉。没有套壳代理，没有偷偷降级的变体，也不会在你背后悄悄截短上下文。

02

兼容 OpenAI，拿来即用

继续用你已经写好的 OpenAI SDK。流式、function calling、tool use 与视觉的表现与上游一模一样 —— 把 base_url 指向 api.brievio.com/v1 即可发布。

03

可以放心依赖的稳定性

请求要么快速完成，要么干脆利落地立即报错，好让你的重试真正生效。没有 90 秒的卡死，没有无声的限流墙 —— 后端一旦劣化即刻自动切换。

04

公道的价格，而非清仓甩卖

逐个模型计算，约为各家官方标价的 85 折，充值赠送后实付最高再低至官方约 79 折(~21% off)。我们刻意不做全网最便宜的端点 —— 那些打两折的，转售的是一夜之间就会蒸发的灰色市场算力。

05

经得起核对的账单

直接来自模型的真实 token 数，绝不被隐藏的系统提示注水。每次请求都记录真实的输入/输出 token 与精确成本。失败请求一律不计费。

06

持续监控、快速失败的路由

健康状态全程被盯着。某个上游一抖动，流量就在你的用户察觉之前完成改道 —— 真出问题时也是快速失败，而非长时间挂起。

07

原生流式，真实 token

Server-Sent Events 原样透传。首字 token 时延与上游供应商保持一致 —— 不缓冲、不批处理，中途不插入任何人为延迟。

08

每一次调用都有据可查

按模型、Key 与 IP 维度的调用级分析，每笔扣费背后都附上真实的 token 数。财务要看账时，整本流水随时可导出为 CSV。

09

原生支持 Prompt 缓存

只要供应商支持，你 system prompt 上的 cache_control 就被原样透传 —— 真实的缓存命中、真实的省钱，命中率与节省金额在控制台实时呈现。

−90%

ls ./use-cases

What to build with Brievio.

Browse all use cases

ls ./models --provider

原版模型 —— 完整上下文，原生能力。

浏览全部模型

Anthropic

Claude Opus 4.7

new

Anthropic's newest Opus — flagship reasoning, vision, 200K context.

visionfunctionstreamingthinking

$4.25/$21.25

per 1M tokens

Anthropic

Claude Opus 4.6

Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.

visionfunctionstreamingthinking

$4.25/$21.25

per 1M tokens

Anthropic

Claude Sonnet 4.6

hot

Balanced speed/quality — the everyday production workhorse, elite coding.

visionfunctionstreamingthinking

$2.55/$12.75

per 1M tokens

Anthropic

Claude Sonnet 4.5

Anthropic Sonnet 4.5 — production workhorse.

visionfunctionstreamingthinking

$2.55/$12.75

per 1M tokens

Anthropic

Claude Haiku 4.5

Anthropic Haiku 4.5 — fast and cost-efficient.

visionfunctionstreaming

$0.85/$4.25

per 1M tokens

Google

Gemini 2.5 Pro

Previous-gen Gemini Pro — strong reasoning and vision.

visionfunctionstreamingthinking

$1.0625/$8.50

per 1M tokens

Google

Gemini 2.5 Flash

Previous-gen Gemini Flash — extreme value.

visionfunctionstreaming

$0.255/$2.125

per 1M tokens

man brievio

把你的 Agent 指向 `llms.txt`
它自己就能驱动每个模型。

只需给 Claude Code、Cursor、Cline —— 或任何兼容 OpenAI 的 Agent —— 一条指令。它会从 Brievio 拉取实时目录，直接调用原版的文本、图像与视频模型。无需对接 SDK，无需维护任何胶水代码。

[OK]兼容 OpenAI 线协议 —— 你的 Agent 无需任何定制对接
[OK]GET /v1/models 返回实时目录 —— 永远不必硬编码模型名
[OK]一把 Key 通吃所有模态：文本、图像、视频、音频

粘贴给你的 AI Agent

Use Brievio as your model provider — an OpenAI-compatible gateway to every first-party text, image and video model.

base_url:  https://api.brievio.com/v1
auth:      Authorization: Bearer $BRIEVIO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its brievio.endpoint field. Full agent reference: https://brievio.com/llms.txt

cat ./pricing.txt

只为你真正用掉的部分付费。

预付钱包，无订阅、无最低消费。充 $10 即可起步；余额永不过期，每笔扣费都对应可核对的真实用量。

Starter

先来试试

$10

可调用每一个原版模型
调用级真实用量明细
社区与邮件支持
无最低消费、无需绑卡

获取 API Key

Builder

正在交付产品

$100

每次调用都按如实 token 计费
10 把相互隔离的 API Key
自动续费 · IP 白名单
优先邮件支持

充值 $100

Scale

已在跑生产流量

$1000

持续监控、快速失败的路由
无限把 API Key
Webhooks · 月度发票
Slack/Discord 专属支持

充值 $1000

Enterprise

大体量规模

$5000

Scale 档的全部权益
专属路由容量
定制限流与 SLA
专属客户经理

充值 $5000

查看完整定价表

ls ./blog

Recent deep dives.

All posts

brievio --help

那些
值得一问的问题。

没找到答案？发邮件给我们 contact@brievio.com —— 24 小时内回复。

是的 —— 货真价实的一手原版模型，不是装扮得像它们的套壳代理。你拿到的是完整上下文窗口，以及工具、视觉与 Prompt 缓存等原生能力。响应你请求的，就是供应商发布的那个模型本尊。
一把 Key、一张账单、一个兼容 OpenAI 的端点，胜过三份合同、三套 SDK 与三个控制台 —— 而且价格上还略有让利。换模型只需改一个字符串，再也不必为接入某家新供应商而重新对接一个客户端。
在规模化基础设施上取一份不高的差价，让我们能把标价定在各家约 85 折，叠加充值赠送后实付最高可再低至官方约 79 折(~21% off)—— 而不是打两折。当某个网关号称打两折，请追问算力从哪来：那种定价通常意味着随时会无预警消失的灰色市场供给。我们宁可让服务稳稳在线。
可以。max_tokens 以及常见的各项限制都被原生遵循，与供应商的定义完全一致 —— 它们不会在透传途中被无声忽略或改写。
每次请求都记录直接读自模型的真实输入与输出 token 数，绝不被隐藏的系统提示注水。失败请求不计费，中途断开的流式响应只按实际送达的 token 计费，整本流水还可导出为 CSV。
不会。你的请求与响应不会被用于训练任何模型。它们仅为你自己的用量日志与排障而保留，并且只归属于你的账户。
是的 —— 对 OpenAI SDK 而言拿来即用。我们实现了 /v1/chat/completions、/v1/embeddings、/v1/images/generations、/v1/models 与 /v1/video/generations，流式、function calling、tool use 与视觉的表现完全一致。把 base_url 指向 https://api.brievio.com/v1 就大功告成。

$ brievio init --production

把应用建在稳定在线的模型之上。

创建一把 Key，把 OpenAI SDK 指向 Brievio —— 原版的 Claude、Gemini 与顶级图像/视频模型，跑在撑得住的基础设施上，按真实 token 计费。改一处 base URL，你就上线了。

获取你的 API Key 阅读文档

大厂一手货源,
链路可溯源。

原版模型，跑在足以撑起一门生意的基础设施上。

原版模型，绝无二次包装

兼容 OpenAI，拿来即用

可以放心依赖的稳定性

公道的价格，而非清仓甩卖

经得起核对的账单

持续监控、快速失败的路由

原生流式，真实 token

每一次调用都有据可查

原生支持 Prompt 缓存

What to build with Brievio.

AI customer support

RAG chatbot API

AI content moderation

AI code assistant

AI data extraction

原版模型 —— 完整上下文，原生能力。

Claude Opus 4.7

Claude Opus 4.6

Claude Sonnet 4.6

Claude Sonnet 4.5

Claude Haiku 4.5

Gemini 2.5 Pro

Gemini 2.5 Flash

把你的 Agent 指向 `llms.txt`
它自己就能驱动每个模型。

只为你真正用掉的部分付费。

Starter

Builder

Scale

Enterprise

Recent deep dives.

How to choose an OpenAI-compatible AI gateway — a buyer's checklist

Is your "Claude" really Claude? Four tests to spot a re-wrapped or downgraded model proxy

Token inflation — how some AI gateways bill you 5–25×, and a 20-line test to catch it

那些
值得一问的问题。

把应用建在稳定在线的模型之上。

大厂一手货源,链路可溯源。

原版模型，跑在足以撑起一门生意的基础设施上。

原版模型，绝无二次包装

兼容 OpenAI，拿来即用

可以放心依赖的稳定性

公道的价格，而非清仓甩卖

经得起核对的账单

持续监控、快速失败的路由

原生流式，真实 token

每一次调用都有据可查

原生支持 Prompt 缓存

What to build with Brievio.

AI customer support

RAG chatbot API

AI content moderation

AI code assistant

AI data extraction

原版模型 —— 完整上下文，原生能力。

Claude Opus 4.7

Claude Opus 4.6

Claude Sonnet 4.6

Claude Sonnet 4.5

Claude Haiku 4.5

Gemini 2.5 Pro

Gemini 2.5 Flash

把你的 Agent 指向 llms.txt它自己就能驱动每个模型。

只为你真正用掉的部分付费。

Starter

Builder

Scale

Enterprise

Recent deep dives.

How to choose an OpenAI-compatible AI gateway — a buyer's checklist

Is your "Claude" really Claude? Four tests to spot a re-wrapped or downgraded model proxy

Token inflation — how some AI gateways bill you 5–25×, and a 20-line test to catch it

那些值得一问的问题。

把应用建在 稳定在线的模型之上。

大厂一手货源,
链路可溯源。

把你的 Agent 指向 `llms.txt`
它自己就能驱动每个模型。

那些
值得一问的问题。

把应用建在稳定在线的模型之上。