// compare

Brievio vs AI/ML API

在所有被拿来和我们对比的网关里,AI/ML API 离得最近:一个 OpenAI 兼容的入口,通文本、图像、视频,在按需付费的底座上叠了月度订阅档位,模型数量数以百计。这点我们直说。两者真正分岔的地方在于来源和定价形态。Brievio 走一级云厂商通道接入正版一手模型,按模型实际返回的计数收费,每次调用背后的真实上游都摆给你看,并把整个目录定在一个公示价上 —— 大约比各家挂牌价低 15%,每个账户一视同仁,不必往上爬档位。

$ cat ./tldr.md
  • 两边都是 OpenAI 协议,且都覆盖文本、图像、视频 —— 任一方向迁移都只是换个 base_url。
  • AI/ML API 的模式是月度档位加一份会重置的额度;Brievio 只对你实际调用的部分收费,充值余额永不过期,也没有最低消费门槛。
  • Brievio 的折扣是一个统一数字 —— 每个模型、每个账户都约比挂牌价低 15% —— 充值赠送还把实际折扣拉到接近 21%。AI/ML API 的实际费率会随档位和命中的模型浮动。
  • Brievio 的文本模型是从 AWS Bedrock、Google Vertex 一手取得的真正 Claude、Gemini 与 GPT;按模型自身计数收费,失败的调用不花钱。
  • 每个每 1M token 的费率都公示在 /pricing,每次请求背后的上游可审计,新账户还有 2 美元额度可以先试。
$ diff

选 Brievio 还是 AI/ML API?

能力+ Brievio- AI/ML API
沿用现有 OpenAI SDK
支持支持
文本、图像、视频同一 API
支持支持
模型总数
Curated setHundreds
对话模型走一手云通道
Claude、Gemini 直接来自 AWS Bedrock 与 Google Vertex —— 可追溯,非灰色资源池。
支持部分
模型即原版交付
正版 Claude / Gemini / GPT —— 完整上下文窗口、原生工具、无暗中降级。
支持部分
原生 Anthropic 端点(/v1/messages)
Anthropic SDK 原样指过来 —— cache_control 与扩展思考都保留。
支持不支持
付费方式
Brievio:充值后即用即扣。AI/ML API:含额度的月度档位。
Pay-as-you-goMonthly tiers
目录价对各家挂牌价
对所有人一个公示价;充值赠送可达约 21%。
~15% under (uniform)Varies by tier/model
余额随时间如何变化
Brievio 充值额度保持不变;档位额度每个周期重置。
Never expiresResets monthly
按模型自身计数计费
用量数字由模型本身返回 —— 不被隐藏系统 prompt 加塞。
支持部分
逐次可见真实上游
你请求哪个模型就得到哪个;路由可审计。
支持部分
后端抖动即改路
上游变慢或报错的瞬间触发故障转移。
支持部分
失败调用不收费
支持部分
Prompt 缓存透传(Claude)
模型支持时,缓存命中会以真实省钱体现在账单上。
支持部分
起步赠送额度
$2 on signup不支持

AI/ML API 的适用场景

有两点让 AI/ML API 成为合理之选。其一是可预测的账单:固定月度档位 + 内含额度,意味着财务在月初就知道数字 —— 对许多团队来说,这比单价差几个百分点更重要。其二是纯粹的广度 —— 一把密钥背后数百个模型,包括精选目录(如 Brievio)有意省去的长尾与实验性型号。如果你这一周要试遍十几个冷门模型,或者你宁愿付固定费用也不想盯着计量器跳动,那这种形态就合适。Brievio 则刻意收窄目录,改为按调用计费。

Brievio 的强项

归根结底就三件事:来源、账单的形态,以及上游出状况时会发生什么。来源上:对话模型是货真价实的正版 —— Claude(Opus、Sonnet、Haiku)与 Gemini 经一级云通道 AWS Bedrock、Google Vertex 一手取得,从你的请求到模型这条路径是可追溯的,而非灰色资源池。完整上下文窗口、原生工具与缓存都原样保留,你请求什么就跑什么。(图像与视频 —— Nano Banana、Nano Banana Pro、GPT-Image、Veo 3 —— 经聚合渠道接入,这点我们如实说明。)账单上:每个每 1M token 的费率都公示在 /pricing,整个目录统一比各家挂牌价低约 15%,对每个账户都是同一套算法,充值赠送把实际费率拉到约 21%,余额就静静等你去花 —— 无订阅、无月度最低消费,起步还送 2 美元额度。出状况时:用量按模型自身的 token 计数计量,失败调用永不收费,模型支持时 prompt 缓存照常生效,后端一变慢即刻改路。Anthropic Messages API 也原生提供在 /v1/messages,因此基于 Anthropic SDK 的代码可以直接迁过来,无需改写成 OpenAI 格式。

如何选

先问自己一个问题:你想付固定月费,还是只为用量付费?如果固定订阅契合你的预算、你能接受会重置的额度,并且看重能够触及数以百计的模型 —— AI/ML API 更顺手。如果你更愿意从一笔永不过期的余额里按调用扣费、要正版且一手取得的 Claude 与 Gemini、想看见每次请求背后的真实上游、并支付和所有人相同的约低于挂牌价 15% 的价格而无需解锁档位 —— Brievio 正是为此而造。2 美元的起步额度足够你发几个真实请求、自己判断。

$ brievio init --production

改一行 base_url,调用正版模型。

如果你已经在用 AI/ML API,迁移到 Brievio 只需改一行 base_url —— 现有 OpenAI SDK 代码原样可用。按需付费,价格低于官方挂牌价约 5%,无订阅。