定价

模型倍率、缓存命中与 API 首购

模型定价说明

我们按 1 亿 Tokens 为单位计费:1 倍率 40 元,100 万 Tokens 仅 0.4 元。购买和充值统一为 10、20、40、80、200、400 元六档;大于 400 元请联系客服。

老用户入口已有 API Key,直接去充值台补量充值、查单、确认到账都走这里;新套餐折合低至 26.67 元 / 1 亿 Tokens。立即前往充值台
计费

计费规则说明

我们采用按 1 亿 Tokens 为单位的计费方式。倍率只是不同模型成本差异的映射,一个 Key 通用全模型,不用频繁换 Key。

核心换算先把基准价格看明白
1 亿 Tokens40 元

1 倍率基础价

100 万 Tokens0.4 元

按 1 倍率换算

1 刀等价¥0.2

NewAPI $2 / 1M 对应 1 倍率标准

100 万 Tokens 仅需 0.4 元,我们的 1 刀等价 0.2 元。NewAPI 模型广场里 $2 / 1M,对应我们的 1 倍率标准。

一个 Key 通用全模型,倍率只是不同模型的成本差异映射,让你不用换 Key、不用手算复杂价格,直接按业务场景选模型就行。

基础计费标准倍率速查表
倍率1 亿 Tokens100 万 Tokens
0.1 倍率4 元0.04 元
0.5 倍率20 元0.2 元
1 倍率40 元0.4 元
2 倍率80 元0.8 元
2.5 倍率100 元1 元
3 倍率120 元1.2 元
4 倍率160 元1.6 元
5 倍率200 元2 元
6 倍率240 元2.4 元
7.5 倍率300 元3 元
8 倍率320 元3.2 元
10 倍率400 元4 元
15 倍率600 元6 元
接入 URL优先用带 /v1 的地址
推荐 Base URLhttps://gpt-agent.cc/v1

大多数客户端先用这个;如果报错,再切备用地址。

备用 Base URLhttps://gpt-agent.cc

不同 API 转发平台对 Base URL 校验不一样,换模型或换客户端时建议自己实际测一遍。

统一额度一个 Key 通用全模型
  • 倍率只是不同模型成本差异的映射,计费逻辑始终统一。
  • 不用为不同模型反复换 Key,切模型时直接按倍率估算即可。
  • 额度不限时、不清零,适合长周期调试和稳定业务使用。
缓存

缓存命中说明

当请求里有一部分内容和之前处理过的内容相同,系统就可以复用之前的计算结果,不必重新完整计算。

什么是缓存命中重复上下文会被直接复用

这样做的好处是响应更快、消耗更低、计费更省。尤其在多轮对话、连续追问、工作流调用、代码补全这些场景里,实际消耗通常会比你想象得更低。

  • 正常输入:按模型对应倍率计费。
  • 重复且命中的缓存部分:按 0.1 倍率计费。
  • 高成本模型在波动时期,缓存可能升到 0.2 倍,极端情况下可能暂时不开缓存。
举个简单例子

如果你连续多轮对话时反复带上大量相同上下文,重复且命中的那部分就会按更低倍率扣费,所以长对话、连续追问和工作流调用会更省额度。

缓存命中按 0.1 倍率

命中的缓存部分仅按普通输入成本的 10% 计费。

长对话更省

连续追问、工作流调用、代码补全等场景更容易把重复上下文复用起来。

高成本模型会随波动调整

成本高且波动大的时期,缓存倍率可能调整,极端情况下也可能暂时不开缓存。

注:是否产生缓存命中,取决于请求内容是否满足系统缓存复用条件。

定价

模型价格参考

同一页直接看清倍率、折算单价和推荐上下文,方便你挑模型和估成本。

按最新飞书清单更新当前模型折算单价与倍率

按当前平台倍率整理,便于在购买前先看明白各模型的大致成本区间。

假设 max_tokens=8192
1 倍率 = 40 元 / 1 亿 Tokens0.1 倍率低至 0.04 元 / 100 万 Tokens15 倍率高阶模型 = 6 元 / 100 万 Tokens最高 1M 上下文
厂家模型名称倍率举例:2 倍,等于用 1 亿 Tokens,扣费 2 亿100 万 Tokens价格(换算价格)推荐上下文 context Window假设 max_tokens=8192是否支持识别图片
国产聚合模型(高并发推荐)
claude-sonnet-4-6快速响应
1 倍率0.4 元1M
MiniMax
MiniMax-M3
1 倍率0.4 元1M
MiniMax
image-01
一张2毛
MiniMax
image-01-live
一秒2 元
阶跃星辰
step-3.7-flash快速响应
1 倍率0.4 元256k
字节跳动
doubao-seed-2.0-code
2 倍率0.8 元200k
字节跳动
doubao-seed-2.0-pro
2 倍率0.8 元128k
小米
mimo-v2.5-pro
1 倍率0.4 元1M
小米
mimo-v2.5
0.5 倍率0.2 元1M
深度求索
deepseek-v4-pro
7.5 倍率3 元1M
深度求索
deepseek-v4-flash
2.5 倍率1 元1M
Kimi
kimi-k2.6
2 倍率0.8 元256K
Kimi
kimi-k2.7
4 倍率1.6 元256K
智谱
glm-5.1
5 倍率2 元256K
智谱
glm-5.2
8 倍率3.2 元1M
海外(OpenAI)
gpt-5.4
2 倍率0.8 元1M
海外(OpenAI)
gpt-5.5
4 倍率1.6 元256k
海外(OpenAI)
gpt-5.3-codex-spark
4 倍率1.6 元128k
海外(OpenAI)
gpt-image-2
一张0.5-1 毛4k 出图
海外(Anthropic)
claude-haiku-4-5-20251001
1 倍率0.4 元256K
海外(Anthropic)
claude-opus-4-6
15 倍率6 元1M
海外(Anthropic)
claude-opus-4-7
15 倍率6 元1M
海外(Anthropic)
claude-opus-4-8
15 倍率6 元1M
海外(Google)
gemini-3.1-pro
10 倍率4 元1M
海外(Google)
gemini-3.5-flash
6 倍率2.4 元1M
国产聚合模型推荐上下文 1M
(高并发推荐)claude-sonnet-4-6快速响应
倍率1 倍率
100 万 Tokens0.4 元
context window1M
识别图片
MiniMax推荐上下文 1M
MiniMax-M3
倍率1 倍率
100 万 Tokens0.4 元
context window1M
识别图片
MiniMax
image-01
倍率一张
100 万 Tokens2毛
MiniMax
image-01-live
倍率一秒
100 万 Tokens2 元
阶跃星辰推荐上下文 256k
step-3.7-flash快速响应
倍率1 倍率
100 万 Tokens0.4 元
context window256k
识别图片
字节跳动推荐上下文 200k
doubao-seed-2.0-code
倍率2 倍率
100 万 Tokens0.8 元
context window200k
识别图片
字节跳动推荐上下文 128k
doubao-seed-2.0-pro
倍率2 倍率
100 万 Tokens0.8 元
context window128k
识别图片
小米推荐上下文 1M
mimo-v2.5-pro
倍率1 倍率
100 万 Tokens0.4 元
context window1M
识别图片
小米推荐上下文 1M
mimo-v2.5
倍率0.5 倍率
100 万 Tokens0.2 元
context window1M
识别图片
深度求索推荐上下文 1M
deepseek-v4-pro
倍率7.5 倍率
100 万 Tokens3 元
context window1M
深度求索推荐上下文 1M
deepseek-v4-flash
倍率2.5 倍率
100 万 Tokens1 元
context window1M
Kimi推荐上下文 256K
kimi-k2.6
倍率2 倍率
100 万 Tokens0.8 元
context window256K
识别图片
Kimi推荐上下文 256K
kimi-k2.7
倍率4 倍率
100 万 Tokens1.6 元
context window256K
识别图片
智谱推荐上下文 256K
glm-5.1
倍率5 倍率
100 万 Tokens2 元
context window256K
识别图片
智谱推荐上下文 1M
glm-5.2
倍率8 倍率
100 万 Tokens3.2 元
context window1M
识别图片
海外(OpenAI)推荐上下文 1M
gpt-5.4
倍率2 倍率
100 万 Tokens0.8 元
context window1M
识别图片
海外(OpenAI)推荐上下文 256k
gpt-5.5
倍率4 倍率
100 万 Tokens1.6 元
context window256k
识别图片
海外(OpenAI)推荐上下文 128k
gpt-5.3-codex-spark
倍率4 倍率
100 万 Tokens1.6 元
context window128k
海外(OpenAI)推荐上下文 4k 出图
gpt-image-2
倍率一张
100 万 Tokens0.5-1 毛
context window4k 出图
海外(Anthropic)推荐上下文 256K
claude-haiku-4-5-20251001
倍率1 倍率
100 万 Tokens0.4 元
context window256K
识别图片
海外(Anthropic)推荐上下文 1M
claude-opus-4-6
倍率15 倍率
100 万 Tokens6 元
context window1M
识别图片
海外(Anthropic)推荐上下文 1M
claude-opus-4-7
倍率15 倍率
100 万 Tokens6 元
context window1M
识别图片
海外(Anthropic)推荐上下文 1M
claude-opus-4-8
倍率15 倍率
100 万 Tokens6 元
context window1M
识别图片
海外(Google)推荐上下文 1M
gemini-3.1-pro
倍率10 倍率
100 万 Tokens4 元
context window1M
识别图片
海外(Google)推荐上下文 1M
gemini-3.5-flash
倍率6 倍率
100 万 Tokens2.4 元
context window1M
识别图片

以上为按倍率换算后的参考价;图片模型按张或秒计费。实际扣费以平台模型倍率和请求消耗为准,✅ 表示支持识别图片。

下一步

定价看清楚后,再去独立购买页下单

定价页只负责把倍率、缓存命中和模型成本讲清楚,不把解释和首购表单揉在一起。新用户去独立购买页下单,老用户直接去充值台补量。