這是真正的 Claude／Gemini 嗎？

是的——貨真價實的原廠模型，不是裝扮成它們模樣的套殼代理。你拿到完整的上下文視窗與原生功能：工具、視覺與 Prompt 快取。回應你請求的，就是供應商發布的同一個模型。

為什麼不直接接各家供應商？

一把金鑰、一張帳單、一個相容 OpenAI 的端點，取代三份合約、三套 SDK 與三個控制檯——還額外附帶一點折扣。換模型只需改一個字串，永遠不必為了接上新供應商而整合一個新客戶端。

你們怎麼做到比官方便宜，又為何不更便宜？

在大宗基礎設施上取一點點利潤，足以讓我們的掛牌大約比各供應商低 15%（官方 85 折，儲值最高約 79 折）——而不是低八成。當某個閘道器宣稱打到兩折，先問問產能從哪來：那種定價通常意味著灰色供給，會毫無預警地消失。我們寧可不掉線。

我能限制每次請求的成本上限嗎？

可以。max_tokens 與常見的各項限制都按供應商定義原生支援——不會在傳遞途中被悄悄忽略或改寫。

我怎麼確認帳單是準的？

每一筆請求都記錄直接取自模型的真實輸入與輸出 token 數，絕不靠隱藏的系統提示詞灌水。失敗的請求不收費，中途斷掉的串流回應只按實際送達的 token 計費，而且你可以把整本帳本匯出成 CSV。

你們會拿我的資料去訓練嗎？

不會。你的請求與回應不會被用於訓練任何模型。它們只為你自己的用量日誌與除錯而保留，並僅限於你的帳號範圍。

它真的相容 OpenAI 嗎？

是的——它能直接替換 OpenAI SDK。我們實作了 /v1/chat/completions、/v1/embeddings、/v1/images/generations、/v1/models 與 /v1/video/generations，串流、function calling、tool use 與視覺的行為完全一致。把 base_url 指向 https://api.brievio.com/v1，就大功告成。

一手直供 · 可溯源至 AWS Bedrock / Vertex

大廠一手貨源,
鏈路可溯源。

真·Claude 與 Gemini,經可溯源的一級雲通道(AWS Bedrock、Google Vertex)直供,絕非灰產池子。統一收進一個 OpenAI 相容端點,價格低於官方。只改一行 base_url。

取得 API 金鑰閱讀文件

直接沿用 OpenAI SDK · 只改一個 base URL · 立即上線

貼上給你的 AI Agent

Use Brievio as your model provider — an OpenAI-compatible gateway to every first-party text, image and video model.

base_url:  https://api.brievio.com/v1
auth:      Authorization: Bearer $BRIEVIO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its brievio.endpoint field. Full agent reference: https://brievio.com/llms.txt

prompt_tokens

14

completion_tokens

9

cost_usd

$0.000174

cat ./why-brievio.md

貨真價實的模型，跑在足以承載生意的基礎設施上。

Brievio 是「折扣官方」這一檔：真正的 Claude、Gemini 與頂尖影像／影片模型，部署在企業級後端，按如實的 token 數計費。我們把可靠與真實放在首位——絕不打價格戰、絕不流血削價。

01

原廠模型，不做任何二次包裝

每一個模型都是貨真價實的本尊——完整的上下文視窗、原生工具、原生視覺。沒有套殼代理、沒有偷偷降級的版本、更不會在你不知情時截斷上下文。

02

相容 OpenAI，可直接替換

繼續用你已經寫好的 OpenAI SDK。串流、function calling、tool use 與視覺的行為都與上游完全一致——把 base_url 指向 api.brievio.com/v1 即可發布。

03

可靠到足以放心構築

請求要嘛快速完成，要嘛立刻明確報錯，好讓你的重試真正派上用場。沒有卡死 90 秒的情況、沒有悄無聲息的限流牆——後端一旦劣化即刻自動切換。

04

公道的價格，不是甩賣

按模型逐一計，大約比各供應商的官方掛牌低 15%（官方 85 折），儲值最高可達 ~21% off（官方約 79 折）。我們刻意不做全網最便宜的端點——那些打到兩折的，轉售的是一夜之間就會蒸發的灰色產能。

05

可逐筆稽核的帳單

token 數直接取自模型本身，絕不靠隱藏的系統提示詞灌水。每一筆請求都記錄真實的輸入／輸出 token 與精確費用。失敗的請求永不收費。

06

持續監控、快速失敗的路由

健康狀態被全天候盯著。某個上游一抖動，流量會在你的使用者察覺之前就被改道——而萬一真的出問題，它會立刻失敗，而不是吊著不動。

07

原生串流，真實 token

伺服器推送事件原樣直通。首字 token 時間緊跟上游供應商——不緩衝、不批次、不在中間插入任何人為延遲。

08

每一次呼叫都有帳可查

按模型、金鑰與 IP 的呼叫級分析，每筆費用背後都附上真實的 token 數。財務一開口，就能把完整帳本匯出成 CSV。

09

Prompt 快取，原生支援

在供應商支援的前提下，系統提示詞上的 cache_control 會原樣直通——真實的快取命中、真實的省錢，命中率與已節省的花費都在控制檯即時呈現。

−90%

ls ./use-cases

What to build with Brievio.

Browse all use cases

ls ./models --provider

貨真價實的模型——完整上下文、原生功能。

瀏覽全部模型

Anthropic

Claude Opus 4.7

new

Anthropic's newest Opus — flagship reasoning, vision, 200K context.

visionfunctionstreamingthinking

$4.25/$21.25

per 1M tokens

Anthropic

Claude Opus 4.6

Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.

visionfunctionstreamingthinking

$4.25/$21.25

per 1M tokens

Anthropic

Claude Sonnet 4.6

hot

Balanced speed/quality — the everyday production workhorse, elite coding.

visionfunctionstreamingthinking

$2.55/$12.75

per 1M tokens

Anthropic

Claude Sonnet 4.5

Anthropic Sonnet 4.5 — production workhorse.

visionfunctionstreamingthinking

$2.55/$12.75

per 1M tokens

Anthropic

Claude Haiku 4.5

Anthropic Haiku 4.5 — fast and cost-efficient.

visionfunctionstreaming

$0.85/$4.25

per 1M tokens

Google

Gemini 2.5 Pro

Previous-gen Gemini Pro — strong reasoning and vision.

visionfunctionstreamingthinking

$1.0625/$8.50

per 1M tokens

Google

Gemini 2.5 Flash

Previous-gen Gemini Flash — extreme value.

visionfunctionstreaming

$0.255/$2.125

per 1M tokens

man brievio

把你的 Agent 指向 `llms.txt`
它就能自行驅動每一個模型。

給 Claude Code、Cursor、Cline——或任何相容 OpenAI 的 Agent——一條指令就好。它會從 Brievio 拉取即時目錄，直接呼叫貨真價實的文字、影像與影片模型。無需接線 SDK，也沒有黏合程式碼要維護。

[OK]相容 OpenAI 線協議——你的 Agent 無需任何客製接入
[OK]GET /v1/models 回傳即時目錄——永遠不必硬寫模型名稱
[OK]一把金鑰，貫通全部模態：文字、影像、影片、音訊

貼上給你的 AI Agent

Use Brievio as your model provider — an OpenAI-compatible gateway to every first-party text, image and video model.

base_url:  https://api.brievio.com/v1
auth:      Authorization: Bearer $BRIEVIO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its brievio.endpoint field. Full agent reference: https://brievio.com/llms.txt

cat ./pricing.txt

只為你真正用掉的部分付費。

預付錢包，無訂閱、無門檻。充值 $10 即可上手；餘額永不過期，每一筆扣費都對應到真實、可稽核的用量。

Starter

先試試看

$10

可用每一個原廠模型
真實的呼叫級用量日誌
社群與郵件支援
無門檻、無需信用卡

取得 API 金鑰

Builder

正在發布產品

$100

每筆呼叫都如實計 token
10 把互相隔離的 API 金鑰
自動續儲 · IP 允許清單
優先郵件支援

充值 $100

Scale

承載正式流量

$1000

監控式、快速失敗的路由
無限 API 金鑰
Webhooks · 月度發票
專屬 Slack／Discord 支援

充值 $1000

Enterprise

高流量規模

$5000

包含 Scale 的全部內容
專屬路由產能
客製限流與 SLA
專屬客戶經理

充值 $5000

查看完整定價表

ls ./blog

Recent deep dives.

All posts

brievio --help

值得一問的
那些問題。

沒找到你的答案？來信 contact@brievio.com —— 我們 24 小時內回覆。

是的——貨真價實的原廠模型，不是裝扮成它們模樣的套殼代理。你拿到完整的上下文視窗與原生功能：工具、視覺與 Prompt 快取。回應你請求的，就是供應商發布的同一個模型。
一把金鑰、一張帳單、一個相容 OpenAI 的端點，取代三份合約、三套 SDK 與三個控制檯——還額外附帶一點折扣。換模型只需改一個字串，永遠不必為了接上新供應商而整合一個新客戶端。
在大宗基礎設施上取一點點利潤，足以讓我們的掛牌大約比各供應商低 15%（官方 85 折，儲值最高約 79 折）——而不是低八成。當某個閘道器宣稱打到兩折，先問問產能從哪來：那種定價通常意味著灰色供給，會毫無預警地消失。我們寧可不掉線。
可以。max_tokens 與常見的各項限制都按供應商定義原生支援——不會在傳遞途中被悄悄忽略或改寫。
每一筆請求都記錄直接取自模型的真實輸入與輸出 token 數，絕不靠隱藏的系統提示詞灌水。失敗的請求不收費，中途斷掉的串流回應只按實際送達的 token 計費，而且你可以把整本帳本匯出成 CSV。
不會。你的請求與回應不會被用於訓練任何模型。它們只為你自己的用量日誌與除錯而保留，並僅限於你的帳號範圍。
是的——它能直接替換 OpenAI SDK。我們實作了 /v1/chat/completions、/v1/embeddings、/v1/images/generations、/v1/models 與 /v1/video/generations，串流、function calling、tool use 與視覺的行為完全一致。把 base_url 指向 https://api.brievio.com/v1，就大功告成。

$ brievio init --production

把產品建在不掉線的模型上。

建立一把金鑰，把 OpenAI SDK 指向 Brievio——貨真價實的 Claude、Gemini 與頂尖影像／影片模型，跑在撐得住的基礎設施上，按真實 token 計費。改一個 base URL，你就上線了。

取得你的 API 金鑰閱讀文件

大廠一手貨源,
鏈路可溯源。

貨真價實的模型，跑在足以承載生意的基礎設施上。

原廠模型，不做任何二次包裝

相容 OpenAI，可直接替換

可靠到足以放心構築

公道的價格，不是甩賣

可逐筆稽核的帳單

持續監控、快速失敗的路由

原生串流，真實 token

每一次呼叫都有帳可查

Prompt 快取，原生支援

What to build with Brievio.

AI customer support

RAG chatbot API

AI content moderation

AI code assistant

AI data extraction

貨真價實的模型——完整上下文、原生功能。

Claude Opus 4.7

Claude Opus 4.6

Claude Sonnet 4.6

Claude Sonnet 4.5

Claude Haiku 4.5

Gemini 2.5 Pro

Gemini 2.5 Flash

把你的 Agent 指向 `llms.txt`
它就能自行驅動每一個模型。

只為你真正用掉的部分付費。

Starter

Builder

Scale

Enterprise

Recent deep dives.

How to choose an OpenAI-compatible AI gateway — a buyer's checklist

Is your "Claude" really Claude? Four tests to spot a re-wrapped or downgraded model proxy

Token inflation — how some AI gateways bill you 5–25×, and a 20-line test to catch it

值得一問的
那些問題。

把產品建在不掉線的模型上。

大廠一手貨源,鏈路可溯源。

貨真價實的模型，跑在足以承載生意的基礎設施上。

原廠模型，不做任何二次包裝

相容 OpenAI，可直接替換

可靠到足以放心構築

公道的價格，不是甩賣

可逐筆稽核的帳單

持續監控、快速失敗的路由

原生串流，真實 token

每一次呼叫都有帳可查

Prompt 快取，原生支援

What to build with Brievio.

AI customer support

RAG chatbot API

AI content moderation

AI code assistant

AI data extraction

貨真價實的模型——完整上下文、原生功能。

Claude Opus 4.7

Claude Opus 4.6

Claude Sonnet 4.6

Claude Sonnet 4.5

Claude Haiku 4.5

Gemini 2.5 Pro

Gemini 2.5 Flash

把你的 Agent 指向 llms.txt它就能自行驅動每一個模型。

只為你真正用掉的部分付費。

Starter

Builder

Scale

Enterprise

Recent deep dives.

How to choose an OpenAI-compatible AI gateway — a buyer's checklist

Is your "Claude" really Claude? Four tests to spot a re-wrapped or downgraded model proxy

Token inflation — how some AI gateways bill you 5–25×, and a 20-line test to catch it

值得一問的那些問題。

把產品建在 不掉線的模型上。

大廠一手貨源,
鏈路可溯源。

把你的 Agent 指向 `llms.txt`
它就能自行驅動每一個模型。

值得一問的
那些問題。

把產品建在不掉線的模型上。