标准兼容 · 鉴权 · 流式输出
开发者文档
集中说明 Base URL、鉴权、聊天补全、流式输出、错误码和限流。已有 API Key 时可以直接按示例接入。
快速开始
确认端点、配置密钥、接入客户端,然后发起首个请求。
选择接入端点
根据你的客户端类型选择合适的 API 端点。支持 Chat Completions、Responses 和 Messages 等标准兼容接口。
Base URL: https://gpt-agent.cc/v1准备 API Key
使用已经开通的 API Key,并只放在服务端环境变量中,避免暴露到浏览器代码。
Authorization: Bearer sk-your-api-key集成客户端
使用兼容客户端或直接调用 REST API,配置 base_url 后即可快速接入。
base_url = 'https://gpt-agent.cc/v1'开始调用
发送请求获取 AI 响应,支持流式输出以获得更好的用户体验。
POST /v1/chat/completions身份认证
所有 API 请求都需要在 HTTP Header 中携带 API Key 进行身份认证。
认证格式
在每个请求的 Authorization header 中添加你的 API Key。
POST
/v1/chat/completions带认证的请求示例
请求示例
json
curl https://gpt-agent.cc/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer sk-your-api-key" \
-d '{
"model": "deepseek-r1",
"messages": [{"role": "user", "content": "Hello!"}]
}'响应示例
json
{
"id": "chatcmpl_123",
"object": "chat.completion",
"choices": [{
"message": {
"role": "assistant",
"content": "Hello! How can I help you today?"
}
}]
}推荐 Base URL
https://gpt-agent.cc/v1大部分客户端使用此地址备用 Base URL
https://gpt-agent.cc客户端验证失败时使用Chat Completions 兼容接口
/v1/chat/completions标准聊天补全协议Responses 兼容接口
/v1/responses支持 Responses 格式的客户端优先使用Messages 兼容接口
/v1/messagesMessages-compatible 客户端优先使用聊天补全 API
Chat Completions 兼容接口,支持多种模型能力。
curl
curl https://gpt-agent.cc/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer sk-your-api-key" \
-d '{
"model": "deepseek-r1",
"messages": [
{ "role": "system", "content": "你是一个简洁的助手。" },
{ "role": "user", "content": "用一句话介绍你自己。" }
]
}'请求参数
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
model | string | 是 | 模型 ID,如 deepseek-r1 |
messages | array | 是 | 聊天消息数组 |
temperature | number | 否 | 采样温度,0-2,默认 1 |
max_tokens | integer | 否 | 生成 token 上限 |
stream | boolean | 否 | 是否启用流式输出 |
top_p | number | 否 | 核采样,默认 1 |
响应字段
| 字段 | 类型 | 说明 |
|---|---|---|
id | string | 响应唯一标识 |
object | string | 对象类型,固定为 chat.completion |
created | integer | 创建时间戳 |
model | string | 使用的模型 ID |
choices | array | 生成的回复选项 |
usage | object | token 使用统计 |
流式输出
启用流式输出可以实时接收生成的 token,显著降低用户感知延迟。
流式输出的优势
- 降低感知延迟 - 用户无需等待完整响应,可以立即看到内容
- 更好的长文本体验 - 内容像人类打字一样逐步显示
- 成本相同 - 与同步输出成本完全一致,只是传输方式不同
curl
curl https://gpt-agent.cc/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer sk-your-api-key" \
-d '{
"model": "deepseek-r1",
"messages": [
{ "role": "system", "content": "你是一个简洁的助手。" },
{ "role": "user", "content": "用一句话介绍你自己。" }
],
"stream": true
}'
# 响应将是 SSE (Server-Sent Events) 流式数据错误码
API 可能返回的错误码及其处理建议。
| HTTP 状态码 | 错误名称 | 说明 | 处理建议 |
|---|---|---|---|
400 | INVALID_REQUEST | 请求格式错误或参数无效 | 检查请求体格式和参数 |
401 | UNAUTHORIZED | API Key 无效或已过期 | 检查 API Key 是否正确 |
429 | RATE_LIMIT | 请求频率超限 | 使用指数退避策略重试 |
500 | INTERNAL_ERROR | 服务内部错误 | 稍后重试 |
503 | SERVICE_UNAVAILABLE | 服务暂时不可用 | 稍后重试 |
限流说明
为了保证服务稳定性,我们对 API 请求进行频率限制。
限流规则
- 每个 API Key 有独立的请求频率限制
- 收到 429 响应时请使用指数退避策略重试
- 流式和非流式请求共享相同的限流配额
- 实际上限以当前 Key 的配置为准