これは本物の Claude / Gemini ですか?

はい — 一次プロバイダー直送の本物のモデルです。それらしく装ったテンプレートプロキシではありません。フルのコンテキストウィンドウと、ツール・ビジョン・プロンプトキャッシュといったネイティブ機能がそのまま使えます。あなたのリクエストに答えるのは、プロバイダーが出荷しているのと同じモデルです。

なぜ各プロバイダーに直接契約しないのですか?

3 つの契約・3 つの SDK・3 つのダッシュボードの代わりに、キーひとつ・請求書ひとつ・OpenAI 互換エンドポイントひとつ。しかも公式より着実に安く。モデルの切り替えは文字列を 1 つ変えるだけで、新しいプロバイダーに届けるために新しいクライアントを統合する必要はありません。

どうして公式より安いのに、もっと安くはしないのですか?

大規模なインフラ基盤だからこそ成り立つ薄いマージンによって、各プロバイダーのレートからおおよそ 15% 下に設定できます。さらにチャージ特典を合わせれば、実質で最大 21% ほど下がります — それでも 8 割引ではありません。あるゲートウェイが 8 割引をうたうなら、その在庫の出どころを問うべきです。そうした価格はたいてい、予告なく消えるグレーマーケットの供給を意味します。私たちは止まらないことを選びます。

リクエストごとのコスト上限を設けられますか?

はい。max_tokens をはじめとする通常の制限は、プロバイダーの定義どおりネイティブに尊重されます — 途中で勝手に無視されたり書き換えられたりすることはありません。

請求が正確だと、どう確認できますか?

すべてのリクエストは、モデルから直接読み取った本物の入出力トークン数とともに記録され、隠れたシステムプロンプトで水増しされることはありません。失敗したリクエストには課金されず、途中で切れたストリーミング応答は実際に届いたトークン分だけ課金されます。全台帳は CSV で書き出せます。

私のデータで学習しますか?

いいえ。あなたのリクエストと応答が、いかなるモデルの学習にも使われることはありません。あくまであなた自身の利用ログとデバッグのためだけに保持され、あなたのアカウントに限定されます。

本当に OpenAI 互換ですか?

はい — OpenAI SDK にそのまま差し込めます。/v1/chat/completions、/v1/embeddings、/v1/images/generations、/v1/models、/v1/video/generations を実装し、ストリーミング・関数呼び出し・ツール利用・ビジョンはすべて同一の挙動です。base_url を https://api.brievio.com/v1 に向ければ完了です。

一次ソース · AWS Bedrock / Vertex まで追跡可能

一次ソースのモデル、
出どころまで追跡可能。

本物の Claude と Gemini を、追跡可能な一次クラウド経路(AWS Bedrock、Google Vertex)から直接お届け——グレーマーケットのプールではありません。一つの OpenAI 互換エンドポイントに集約し、公式より安い価格で。base_url を一行変えるだけ。

API キーを取得ドキュメントを見る

OpenAI SDK にそのまま差し込み · base URL を 1 つ変えるだけ · すぐ稼働

お使いの AI エージェントに貼り付け

Use Brievio as your model provider — an OpenAI-compatible gateway to every first-party text, image and video model.

base_url:  https://api.brievio.com/v1
auth:      Authorization: Bearer $BRIEVIO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its brievio.endpoint field. Full agent reference: https://brievio.com/llms.txt

prompt_tokens

14

completion_tokens

9

cost_usd

$0.000174

cat ./why-brievio.md

本物のモデルを、事業の土台にできる基盤の上で。

Brievio は、公式より着実に安い「正規割引」の立ち位置です。本物の Claude、Gemini、一流の画像・動画モデルをエンタープライズ級のバックエンドで提供し、偽りのないトークン数で課金します。最優先は信頼性と本物であること — 価格の底辺競争には決して加わりません。

01

本物のモデルだけ、包み直しは一切なし

どのモデルも正真正銘の本物です。コンテキストウィンドウもフル、ツールもビジョンもネイティブ。テンプレート製のプロキシも、こっそり性能を落とした派生版も、裏で切り詰められたコンテキストもありません。

02

OpenAI 互換、そのまま差し込める

すでに書いた OpenAI SDK のコードをそのまま使えます。ストリーミング、関数呼び出し、ツール利用、ビジョン — すべて上流とまったく同じ挙動。base_url を api.brievio.com/v1 に向けて出荷するだけです。

03

事業の土台にできる信頼性

リクエストは速く完了するか、あるいは速やかに明示的に失敗します。だからリトライがきちんと機能します。90 秒のハングも、静かなレート遮断もありません。バックエンドが劣化した瞬間に自動でフェイルオーバーします。

04

投げ売りではなく、適正価格

各プロバイダーの公式定価から、モデルごとにおおよそ 15% 下。チャージ特典を合わせれば実質で最大 21% ほど下がります。私たちはあえてネット最安のエンドポイントを目指しません。8 割引のような価格は、一夜で消えるグレーマーケットの在庫を転売しているからです。

05

監査できる課金

課金の根拠は、モデルから直接得た本物のトークン数だけ。隠れたシステムプロンプトで水増しすることはありません。すべてのリクエストは実際の入出力トークンと正確なコストとともに記録され、失敗したリクエストには一切課金しません。

06

常時監視・即時フェイルのルーティング

稼働状態は絶え間なく監視しています。上流が揺らげば、ユーザーが気づく前にトラフィックを再ルーティング。そして実際に何かが壊れたときは、ハングせず素早く失敗します。

07

ネイティブストリーミング、本物のトークン

Server-Sent Events をそのまま素通しします。最初のトークンまでの時間は上流プロバイダーに追従。途中にバッファリングもバッチングも人工的な遅延も挟みません。

08

すべてのコールを把握

モデル別・キー別・IP 別のコール単位アナリティクス。各請求の裏にある本物のトークン数まで確認できます。経理が必要とすればいつでも、全台帳を CSV で書き出せます。

09

プロンプトキャッシュをネイティブに尊重

プロバイダーが対応していれば、システムプロンプトの cache_control をそのまま素通し。本物のキャッシュヒットで本物の節約が生まれ、ヒット率と削減額はダッシュボードでリアルタイムに表示されます。

−90%

ls ./use-cases

What to build with Brievio.

Browse all use cases

ls ./models --provider

本物のモデルを — フルコンテキスト、ネイティブ機能のまま。

すべてのモデルを見る

Anthropic

Claude Opus 4.7

new

Anthropic's newest Opus — flagship reasoning, vision, 200K context.

visionfunctionstreamingthinking

$4.25/$21.25

per 1M tokens

Anthropic

Claude Opus 4.6

Anthropic Opus 4.6 — deep reasoning, exceptional agentic ability.

visionfunctionstreamingthinking

$4.25/$21.25

per 1M tokens

Anthropic

Claude Sonnet 4.6

hot

Balanced speed/quality — the everyday production workhorse, elite coding.

visionfunctionstreamingthinking

$2.55/$12.75

per 1M tokens

Anthropic

Claude Sonnet 4.5

Anthropic Sonnet 4.5 — production workhorse.

visionfunctionstreamingthinking

$2.55/$12.75

per 1M tokens

Anthropic

Claude Haiku 4.5

Anthropic Haiku 4.5 — fast and cost-efficient.

visionfunctionstreaming

$0.85/$4.25

per 1M tokens

Google

Gemini 2.5 Pro

Previous-gen Gemini Pro — strong reasoning and vision.

visionfunctionstreamingthinking

$1.0625/$8.50

per 1M tokens

Google

Gemini 2.5 Flash

Previous-gen Gemini Flash — extreme value.

visionfunctionstreaming

$0.255/$2.125

per 1M tokens

man brievio

エージェントに `llms.txt`
を渡せば、あとは自走。

Claude Code、Cursor、Cline — あるいは任意の OpenAI 互換エージェントに、指示を 1 行渡すだけ。Brievio から最新のカタログを取得し、本物のテキスト・画像・動画モデルを直接呼び出します。配線する SDK も、保守し続けるグルーコードもありません。

[OK]OpenAI ワイヤー互換 — エージェント側に独自実装は不要
[OK]GET /v1/models が最新カタログを返す — モデル名のハードコードは不要
[OK]キーひとつであらゆるモダリティ: テキスト、画像、動画、音声

お使いの AI エージェントに貼り付け

Use Brievio as your model provider — an OpenAI-compatible gateway to every first-party text, image and video model.

base_url:  https://api.brievio.com/v1
auth:      Authorization: Bearer $BRIEVIO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its brievio.endpoint field. Full agent reference: https://brievio.com/llms.txt

cat ./pricing.txt

実際に使った分だけ、お支払い。

プリペイド式のウォレット。サブスクも最低額もありません。まずは $10 から。残高は失効せず、すべての請求は監査可能な実利用に紐づきます。

Starter

まず試してみたい方へ

$10

本物のモデルすべてにアクセス
コール単位の実利用ログ
コミュニティ・メールサポート
最低額なし、カード不要

API キーを取得

Builder

プロダクトを出荷中の方へ

$100

全コールで正直なトークン課金
独立した API キー 10 本
自動チャージ · IP 許可リスト
優先メールサポート

$100 を入金

Scale

本番トラフィックを運用中の方へ

$1000

監視付き・即時フェイルのルーティング
API キー無制限
Webhook · 月次請求書
専用 Slack/Discord サポート

$1000 を入金

Enterprise

大量トラフィック規模の方へ

$5000

Scale のすべて
専用ルーティングキャパシティ
カスタムレート制限と SLA
専任アカウントマネージャー

$5000 を入金

料金表の全体を見る

ls ./blog

Recent deep dives.

All posts

brievio --help

問う価値のある、
その質問に。

答えが見つかりませんでしたか? contact@brievio.com までメールください — 24 時間以内に返信します。

はい — 一次プロバイダー直送の本物のモデルです。それらしく装ったテンプレートプロキシではありません。フルのコンテキストウィンドウと、ツール・ビジョン・プロンプトキャッシュといったネイティブ機能がそのまま使えます。あなたのリクエストに答えるのは、プロバイダーが出荷しているのと同じモデルです。
3 つの契約・3 つの SDK・3 つのダッシュボードの代わりに、キーひとつ・請求書ひとつ・OpenAI 互換エンドポイントひとつ。しかも公式より着実に安く。モデルの切り替えは文字列を 1 つ変えるだけで、新しいプロバイダーに届けるために新しいクライアントを統合する必要はありません。
大規模なインフラ基盤だからこそ成り立つ薄いマージンによって、各プロバイダーのレートからおおよそ 15% 下に設定できます。さらにチャージ特典を合わせれば、実質で最大 21% ほど下がります — それでも 8 割引ではありません。あるゲートウェイが 8 割引をうたうなら、その在庫の出どころを問うべきです。そうした価格はたいてい、予告なく消えるグレーマーケットの供給を意味します。私たちは止まらないことを選びます。
はい。max_tokens をはじめとする通常の制限は、プロバイダーの定義どおりネイティブに尊重されます — 途中で勝手に無視されたり書き換えられたりすることはありません。
すべてのリクエストは、モデルから直接読み取った本物の入出力トークン数とともに記録され、隠れたシステムプロンプトで水増しされることはありません。失敗したリクエストには課金されず、途中で切れたストリーミング応答は実際に届いたトークン分だけ課金されます。全台帳は CSV で書き出せます。
いいえ。あなたのリクエストと応答が、いかなるモデルの学習にも使われることはありません。あくまであなた自身の利用ログとデバッグのためだけに保持され、あなたのアカウントに限定されます。
はい — OpenAI SDK にそのまま差し込めます。/v1/chat/completions、/v1/embeddings、/v1/images/generations、/v1/models、/v1/video/generations を実装し、ストリーミング・関数呼び出し・ツール利用・ビジョンはすべて同一の挙動です。base_url を https://api.brievio.com/v1 に向ければ完了です。

$ brievio init --production

止まらないモデルの上に、築こう。

キーを発行し、OpenAI SDK を Brievio に向けるだけ — 本物の Claude、Gemini、一流の画像・動画モデルを、持ちこたえる基盤の上で、本物のトークンに基づいて課金。base URL を 1 つ変えれば稼働します。

API キーを取得ドキュメントを見る

一次ソースのモデル、
出どころまで追跡可能。

本物のモデルを、事業の土台にできる基盤の上で。

本物のモデルだけ、包み直しは一切なし

OpenAI 互換、そのまま差し込める

事業の土台にできる信頼性

投げ売りではなく、適正価格

監査できる課金

常時監視・即時フェイルのルーティング

ネイティブストリーミング、本物のトークン

すべてのコールを把握

プロンプトキャッシュをネイティブに尊重

What to build with Brievio.

AI customer support

RAG chatbot API

AI content moderation

AI code assistant

AI data extraction

本物のモデルを — フルコンテキスト、ネイティブ機能のまま。

Claude Opus 4.7

Claude Opus 4.6

Claude Sonnet 4.6

Claude Sonnet 4.5

Claude Haiku 4.5

Gemini 2.5 Pro

Gemini 2.5 Flash

エージェントに `llms.txt`
を渡せば、あとは自走。

実際に使った分だけ、お支払い。

Starter

Builder

Scale

Enterprise

Recent deep dives.

How to choose an OpenAI-compatible AI gateway — a buyer's checklist

Is your "Claude" really Claude? Four tests to spot a re-wrapped or downgraded model proxy

Token inflation — how some AI gateways bill you 5–25×, and a 20-line test to catch it

問う価値のある、
その質問に。

止まらないモデルの上に、築こう。

一次ソースのモデル、出どころまで追跡可能。

本物のモデルを、事業の土台にできる基盤の上で。

本物のモデルだけ、包み直しは一切なし

OpenAI 互換、そのまま差し込める

事業の土台にできる信頼性

投げ売りではなく、適正価格

監査できる課金

常時監視・即時フェイルのルーティング

ネイティブストリーミング、本物のトークン

すべてのコールを把握

プロンプトキャッシュをネイティブに尊重

What to build with Brievio.

AI customer support

RAG chatbot API

AI content moderation

AI code assistant

AI data extraction

本物のモデルを — フルコンテキスト、ネイティブ機能のまま。

Claude Opus 4.7

Claude Opus 4.6

Claude Sonnet 4.6

Claude Sonnet 4.5

Claude Haiku 4.5

Gemini 2.5 Pro

Gemini 2.5 Flash

エージェントに llms.txtを渡せば、あとは自走。

実際に使った分だけ、お支払い。

Starter

Builder

Scale

Enterprise

Recent deep dives.

How to choose an OpenAI-compatible AI gateway — a buyer's checklist

Is your "Claude" really Claude? Four tests to spot a re-wrapped or downgraded model proxy

Token inflation — how some AI gateways bill you 5–25×, and a 20-line test to catch it

問う価値のある、その質問に。

止まらないモデルの上に、 築こう。

一次ソースのモデル、
出どころまで追跡可能。

エージェントに `llms.txt`
を渡せば、あとは自走。

問う価値のある、
その質問に。

止まらないモデルの上に、築こう。