一次ソース · AWS Bedrock / Vertex まで追跡可能

一次ソースのモデル、
出どころまで追跡可能。

本物の Claude と Gemini を、追跡可能な一次クラウド経路(AWS Bedrock、Google Vertex)から直接お届け——グレーマーケットのプールではありません。一つの OpenAI 互換エンドポイントに集約し、公式より安い価格で。base_url を一行変えるだけ。

OpenAI SDK にそのまま差し込み · base URL を 1 つ変えるだけ · すぐ稼働

お使いの AI エージェントに貼り付け
Use Brievio as your model provider — an OpenAI-compatible gateway to every first-party text, image and video model.

base_url:  https://api.brievio.com/v1
auth:      Authorization: Bearer $BRIEVIO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its brievio.endpoint field. Full agent reference: https://brievio.com/llms.txt
prompt_tokens
14
completion_tokens
9
cost_usd
$0.000174

$一次プロバイダー級のインフラ基盤の上に構築

  • 16+カタログ掲載モデル数
  • 7本物のチャットモデル
  • 約15%安公式定価との差
  • 99.95%実測稼働率
  • 正直トークン課金
  • そのままOpenAI SDK
cat ./why-brievio.md

本物のモデルを、事業の土台にできる基盤の上で。

Brievio は、公式より着実に安い「正規割引」の立ち位置です。本物の Claude、Gemini、一流の画像・動画モデルをエンタープライズ級のバックエンドで提供し、偽りのないトークン数で課金します。最優先は信頼性と本物であること — 価格の底辺競争には決して加わりません。

01

本物のモデルだけ、包み直しは一切なし

どのモデルも正真正銘の本物です。コンテキストウィンドウもフル、ツールもビジョンもネイティブ。テンプレート製のプロキシも、こっそり性能を落とした派生版も、裏で切り詰められたコンテキストもありません。

02

OpenAI 互換、そのまま差し込める

すでに書いた OpenAI SDK のコードをそのまま使えます。ストリーミング、関数呼び出し、ツール利用、ビジョン — すべて上流とまったく同じ挙動。base_url を api.brievio.com/v1 に向けて出荷するだけです。

03

事業の土台にできる信頼性

リクエストは速く完了するか、あるいは速やかに明示的に失敗します。だからリトライがきちんと機能します。90 秒のハングも、静かなレート遮断もありません。バックエンドが劣化した瞬間に自動でフェイルオーバーします。

04

投げ売りではなく、適正価格

各プロバイダーの公式定価から、モデルごとにおおよそ 15% 下。チャージ特典を合わせれば実質で最大 21% ほど下がります。私たちはあえてネット最安のエンドポイントを目指しません。8 割引のような価格は、一夜で消えるグレーマーケットの在庫を転売しているからです。

05

監査できる課金

課金の根拠は、モデルから直接得た本物のトークン数だけ。隠れたシステムプロンプトで水増しすることはありません。すべてのリクエストは実際の入出力トークンと正確なコストとともに記録され、失敗したリクエストには一切課金しません。

06

常時監視・即時フェイルのルーティング

稼働状態は絶え間なく監視しています。上流が揺らげば、ユーザーが気づく前にトラフィックを再ルーティング。そして実際に何かが壊れたときは、ハングせず素早く失敗します。

07

ネイティブストリーミング、本物のトークン

Server-Sent Events をそのまま素通しします。最初のトークンまでの時間は上流プロバイダーに追従。途中にバッファリングもバッチングも人工的な遅延も挟みません。

08

すべてのコールを把握

モデル別・キー別・IP 別のコール単位アナリティクス。各請求の裏にある本物のトークン数まで確認できます。経理が必要とすればいつでも、全台帳を CSV で書き出せます。

09

プロンプトキャッシュをネイティブに尊重

プロバイダーが対応していれば、システムプロンプトの cache_control をそのまま素通し。本物のキャッシュヒットで本物の節約が生まれ、ヒット率と削減額はダッシュボードでリアルタイムに表示されます。

man brievio

エージェントに llms.txt
を渡せば、あとは自走。

Claude Code、Cursor、Cline — あるいは任意の OpenAI 互換エージェントに、指示を 1 行渡すだけ。Brievio から最新のカタログを取得し、本物のテキスト・画像・動画モデルを直接呼び出します。配線する SDK も、保守し続けるグルーコードもありません。

  • [OK]OpenAI ワイヤー互換 — エージェント側に独自実装は不要
  • [OK]GET /v1/models が最新カタログを返す — モデル名のハードコードは不要
  • [OK]キーひとつであらゆるモダリティ: テキスト、画像、動画、音声
お使いの AI エージェントに貼り付け
Use Brievio as your model provider — an OpenAI-compatible gateway to every first-party text, image and video model.

base_url:  https://api.brievio.com/v1
auth:      Authorization: Bearer $BRIEVIO_API_KEY

To use a model, call GET /v1/models for the live catalog, then route each model by its brievio.endpoint field. Full agent reference: https://brievio.com/llms.txt
cat ./pricing.txt

実際に使った分だけ、お支払い。

プリペイド式のウォレット。サブスクも最低額もありません。まずは $10 から。残高は失効せず、すべての請求は監査可能な実利用に紐づきます。

Starter

まず試してみたい方へ

$10
  • 本物のモデルすべてにアクセス
  • コール単位の実利用ログ
  • コミュニティ・メールサポート
  • 最低額なし、カード不要
API キーを取得
Most popular

Builder

プロダクトを出荷中の方へ

$100
  • 全コールで正直なトークン課金
  • 独立した API キー 10 本
  • 自動チャージ · IP 許可リスト
  • 優先メールサポート
$100 を入金

Scale

本番トラフィックを運用中の方へ

$1000
  • 監視付き・即時フェイルのルーティング
  • API キー無制限
  • Webhook · 月次請求書
  • 専用 Slack/Discord サポート
$1000 を入金

Enterprise

大量トラフィック規模の方へ

$5000
  • Scale のすべて
  • 専用ルーティングキャパシティ
  • カスタムレート制限と SLA
  • 専任アカウントマネージャー
$5000 を入金
brievio --help

問う価値のある、
その質問に。

答えが見つかりませんでしたか? contact@brievio.com までメールください — 24 時間以内に返信します。

  • はい — 一次プロバイダー直送の本物のモデルです。それらしく装ったテンプレートプロキシではありません。フルのコンテキストウィンドウと、ツール・ビジョン・プロンプトキャッシュといったネイティブ機能がそのまま使えます。あなたのリクエストに答えるのは、プロバイダーが出荷しているのと同じモデルです。

  • 3 つの契約・3 つの SDK・3 つのダッシュボードの代わりに、キーひとつ・請求書ひとつ・OpenAI 互換エンドポイントひとつ。しかも公式より着実に安く。モデルの切り替えは文字列を 1 つ変えるだけで、新しいプロバイダーに届けるために新しいクライアントを統合する必要はありません。

  • 大規模なインフラ基盤だからこそ成り立つ薄いマージンによって、各プロバイダーのレートからおおよそ 15% 下に設定できます。さらにチャージ特典を合わせれば、実質で最大 21% ほど下がります — それでも 8 割引ではありません。あるゲートウェイが 8 割引をうたうなら、その在庫の出どころを問うべきです。そうした価格はたいてい、予告なく消えるグレーマーケットの供給を意味します。私たちは止まらないことを選びます。

  • はい。max_tokens をはじめとする通常の制限は、プロバイダーの定義どおりネイティブに尊重されます — 途中で勝手に無視されたり書き換えられたりすることはありません。

  • すべてのリクエストは、モデルから直接読み取った本物の入出力トークン数とともに記録され、隠れたシステムプロンプトで水増しされることはありません。失敗したリクエストには課金されず、途中で切れたストリーミング応答は実際に届いたトークン分だけ課金されます。全台帳は CSV で書き出せます。

  • いいえ。あなたのリクエストと応答が、いかなるモデルの学習にも使われることはありません。あくまであなた自身の利用ログとデバッグのためだけに保持され、あなたのアカウントに限定されます。

  • はい — OpenAI SDK にそのまま差し込めます。/v1/chat/completions、/v1/embeddings、/v1/images/generations、/v1/models、/v1/video/generations を実装し、ストリーミング・関数呼び出し・ツール利用・ビジョンはすべて同一の挙動です。base_url を https://api.brievio.com/v1 に向ければ完了です。

$ brievio init --production

止まらないモデルの上に、 築こう。

キーを発行し、OpenAI SDK を Brievio に向けるだけ — 本物の Claude、Gemini、一流の画像・動画モデルを、持ちこたえる基盤の上で、本物のトークンに基づいて課金。base URL を 1 つ変えれば稼働します。