定价

模型倍率、缓存命中与 API 首购

模型定价说明

我们按 1 亿 Tokens 为单位计费：1 倍率 40 元，100 万 Tokens 仅 0.4 元。购买和充值统一为 10、20、40、80、200、400 元六档；大于 400 元请联系客服。

进入购买页已有 API Key？前往充值台查看接入文档

老用户入口已有 API Key，直接去充值台补量充值、查单、确认到账都走这里；新套餐折合低至 26.67 元 / 1 亿 Tokens。立即前往充值台

计费

计费规则说明

我们采用按 1 亿 Tokens 为单位的计费方式。倍率只是不同模型成本差异的映射，一个 Key 通用全模型，不用频繁换 Key。

核心换算先把基准价格看明白

1 亿 Tokens40 元

1 倍率基础价

100 万 Tokens0.4 元

按 1 倍率换算

1 刀等价¥0.2

NewAPI $2 / 1M 对应 1 倍率标准

100 万 Tokens 仅需 0.4 元，我们的 1 刀等价 0.2 元。NewAPI 模型广场里 $2 / 1M，对应我们的 1 倍率标准。

一个 Key 通用全模型，倍率只是不同模型的成本差异映射，让你不用换 Key、不用手算复杂价格，直接按业务场景选模型就行。

基础计费标准倍率速查表

倍率	1 亿 Tokens	100 万 Tokens
0.1 倍率	4 元	0.04 元
0.5 倍率	20 元	0.2 元
1 倍率	40 元	0.4 元
2 倍率	80 元	0.8 元
2.5 倍率	100 元	1 元
3 倍率	120 元	1.2 元
4 倍率	160 元	1.6 元
5 倍率	200 元	2 元
6 倍率	240 元	2.4 元
7.5 倍率	300 元	3 元
8 倍率	320 元	3.2 元
10 倍率	400 元	4 元
15 倍率	600 元	6 元

接入 URL优先用带 /v1 的地址

推荐 Base URLhttps://gpt-agent.cc/v1

大多数客户端先用这个；如果报错，再切备用地址。

备用 Base URLhttps://gpt-agent.cc

不同 API 转发平台对 Base URL 校验不一样，换模型或换客户端时建议自己实际测一遍。

统一额度一个 Key 通用全模型

倍率只是不同模型成本差异的映射，计费逻辑始终统一。
不用为不同模型反复换 Key，切模型时直接按倍率估算即可。
额度不限时、不清零，适合长周期调试和稳定业务使用。

缓存

缓存命中说明

当请求里有一部分内容和之前处理过的内容相同，系统就可以复用之前的计算结果，不必重新完整计算。

什么是缓存命中重复上下文会被直接复用

这样做的好处是响应更快、消耗更低、计费更省。尤其在多轮对话、连续追问、工作流调用、代码补全这些场景里，实际消耗通常会比你想象得更低。

正常输入：按模型对应倍率计费。
重复且命中的缓存部分：按 0.1 倍率计费。
高成本模型在波动时期，缓存可能升到 0.2 倍，极端情况下可能暂时不开缓存。

举个简单例子

如果你连续多轮对话时反复带上大量相同上下文，重复且命中的那部分就会按更低倍率扣费，所以长对话、连续追问和工作流调用会更省额度。

缓存命中按 0.1 倍率

命中的缓存部分仅按普通输入成本的 10% 计费。

长对话更省

连续追问、工作流调用、代码补全等场景更容易把重复上下文复用起来。

高成本模型会随波动调整

成本高且波动大的时期，缓存倍率可能调整，极端情况下也可能暂时不开缓存。

注：是否产生缓存命中，取决于请求内容是否满足系统缓存复用条件。

定价

模型价格参考

同一页直接看清倍率、折算单价和推荐上下文，方便你挑模型和估成本。

按最新飞书清单更新当前模型折算单价与倍率

按当前平台倍率整理，便于在购买前先看明白各模型的大致成本区间。

假设 max_tokens=8192

1 倍率 = 40 元 / 1 亿 Tokens0.1 倍率低至 0.04 元 / 100 万 Tokens15 倍率高阶模型 = 6 元 / 100 万 Tokens最高 1M 上下文

厂家	模型名称	倍率举例：2 倍，等于用 1 亿 Tokens，扣费 2 亿	100 万 Tokens价格（换算价格）	推荐上下文 context Window假设 max_tokens=8192	是否支持识别图片
国产聚合模型（高并发推荐）	claude-sonnet-4-6快速响应	1 倍率	0.4 元	1M	✅
MiniMax	MiniMax-M3	1 倍率	0.4 元	1M	✅
MiniMax	image-01	一张	2毛
MiniMax	image-01-live	一秒	2 元
阶跃星辰	step-3.7-flash快速响应	1 倍率	0.4 元	256k	✅
字节跳动	doubao-seed-2.0-code	2 倍率	0.8 元	200k	✅
字节跳动	doubao-seed-2.0-pro	2 倍率	0.8 元	128k	✅
小米	mimo-v2.5-pro	1 倍率	0.4 元	1M	✅
小米	mimo-v2.5	0.5 倍率	0.2 元	1M	✅
深度求索	deepseek-v4-pro	7.5 倍率	3 元	1M
深度求索	deepseek-v4-flash	2.5 倍率	1 元	1M
Kimi	kimi-k2.6	2 倍率	0.8 元	256K	✅
Kimi	kimi-k2.7	4 倍率	1.6 元	256K	✅
智谱	glm-5.1	5 倍率	2 元	256K	✅
智谱	glm-5.2	8 倍率	3.2 元	1M	✅
海外（OpenAI）	gpt-5.4	2 倍率	0.8 元	1M	✅
海外（OpenAI）	gpt-5.5	4 倍率	1.6 元	256k	✅
海外（OpenAI）	gpt-5.3-codex-spark	4 倍率	1.6 元	128k
海外（OpenAI）	gpt-image-2	一张	0.5-1 毛	4k 出图
海外（Anthropic）	claude-haiku-4-5-20251001	1 倍率	0.4 元	256K	✅
海外（Anthropic）	claude-opus-4-6	15 倍率	6 元	1M	✅
海外（Anthropic）	claude-opus-4-7	15 倍率	6 元	1M	✅
海外（Anthropic）	claude-opus-4-8	15 倍率	6 元	1M	✅
海外（Google）	gemini-3.1-pro	10 倍率	4 元	1M	✅
海外（Google）	gemini-3.5-flash	6 倍率	2.4 元	1M	✅

国产聚合模型推荐上下文 1M

（高并发推荐）claude-sonnet-4-6快速响应

倍率1 倍率

100 万 Tokens0.4 元

context window1M

识别图片✅

MiniMax推荐上下文 1M

MiniMax-M3

倍率1 倍率

100 万 Tokens0.4 元

context window1M

识别图片✅

MiniMax

image-01

倍率一张

100 万 Tokens2毛

MiniMax

image-01-live

倍率一秒

100 万 Tokens2 元

阶跃星辰推荐上下文 256k

step-3.7-flash快速响应

倍率1 倍率

100 万 Tokens0.4 元

context window256k

识别图片✅

字节跳动推荐上下文 200k

doubao-seed-2.0-code

倍率2 倍率

100 万 Tokens0.8 元

context window200k

识别图片✅

字节跳动推荐上下文 128k

doubao-seed-2.0-pro

倍率2 倍率

100 万 Tokens0.8 元

context window128k

识别图片✅

小米推荐上下文 1M

mimo-v2.5-pro

倍率1 倍率

100 万 Tokens0.4 元

context window1M

识别图片✅

小米推荐上下文 1M

mimo-v2.5

倍率0.5 倍率

100 万 Tokens0.2 元

context window1M

识别图片✅

深度求索推荐上下文 1M

deepseek-v4-pro

倍率7.5 倍率

100 万 Tokens3 元

context window1M

深度求索推荐上下文 1M

deepseek-v4-flash

倍率2.5 倍率

100 万 Tokens1 元

context window1M

Kimi推荐上下文 256K

kimi-k2.6

倍率2 倍率

100 万 Tokens0.8 元

context window256K

识别图片✅

Kimi推荐上下文 256K

kimi-k2.7

倍率4 倍率

100 万 Tokens1.6 元

context window256K

识别图片✅

智谱推荐上下文 256K

glm-5.1

倍率5 倍率

100 万 Tokens2 元

context window256K

识别图片✅

智谱推荐上下文 1M

glm-5.2

倍率8 倍率

100 万 Tokens3.2 元

context window1M

识别图片✅

海外（OpenAI）推荐上下文 1M

gpt-5.4

倍率2 倍率

100 万 Tokens0.8 元

context window1M

识别图片✅

海外（OpenAI）推荐上下文 256k

gpt-5.5

倍率4 倍率

100 万 Tokens1.6 元

context window256k

识别图片✅

海外（OpenAI）推荐上下文 128k

gpt-5.3-codex-spark

倍率4 倍率

100 万 Tokens1.6 元

context window128k

海外（OpenAI）推荐上下文 4k 出图

gpt-image-2

倍率一张

100 万 Tokens0.5-1 毛

context window4k 出图

海外（Anthropic）推荐上下文 256K

claude-haiku-4-5-20251001

倍率1 倍率

100 万 Tokens0.4 元

context window256K

识别图片✅

海外（Anthropic）推荐上下文 1M

claude-opus-4-6

倍率15 倍率

100 万 Tokens6 元

context window1M

识别图片✅

海外（Anthropic）推荐上下文 1M

claude-opus-4-7

倍率15 倍率

100 万 Tokens6 元

context window1M

识别图片✅

海外（Anthropic）推荐上下文 1M

claude-opus-4-8

倍率15 倍率

100 万 Tokens6 元

context window1M

识别图片✅

海外（Google）推荐上下文 1M

gemini-3.1-pro

倍率10 倍率

100 万 Tokens4 元

context window1M

识别图片✅

海外（Google）推荐上下文 1M

gemini-3.5-flash

倍率6 倍率

100 万 Tokens2.4 元

context window1M

识别图片✅

以上为按倍率换算后的参考价；图片模型按张或秒计费。实际扣费以平台模型倍率和请求消耗为准，✅ 表示支持识别图片。

下一步

定价看清楚后，再去独立购买页下单

定价页只负责把倍率、缓存命中和模型成本讲清楚，不把解释和首购表单揉在一起。新用户去独立购买页下单，老用户直接去充值台补量。

进入购买页查看接入文档已有 Key 去充值