API 文档
OpenAI 100% 兼容
一个 endpoint 同时调用 Claude 与 GPT。把 base_url 指过来、换上你的 sk- 密钥即可,现有 OpenAI SDK 无需改动。
快速开始
base_url https://api.xdro.net/v1
鉴权 请求头
Authorization: Bearer <你的 sk- 密钥>计费 按 token 用量,每个 Key 有配额上限
# 最小示例:把 $KEY 换成你的密钥
curl https://api.xdro.net/v1/chat/completions \
-H "Authorization: Bearer $KEY" \
-H "Content-Type: application/json" \
-d '{"model":"claude-sonnet-4-6","messages":[{"role":"user","content":"你好"}]}'完全兼容 OpenAI SDK —— Python / Node 只改 base_url 与 api_key 即可。
可用模型
| 模型 ID | 厂商 | 档位 | 说明 |
|---|---|---|---|
| claude-opus-4-8 | Anthropic | 旗舰 | 最强推理 / 深度分析(不支持 temperature) |
| claude-sonnet-4-6 | Anthropic | 标准 | 均衡首选,性价比最高 |
| claude-haiku-4-5-20251001 | Anthropic | 经济 | 快、便宜,低延迟 |
| gpt-4o | OpenAI | 标准 | 多模态,代码 / 推理 / 视觉均衡 |
| gpt-4o-mini | OpenAI | 经济 | 轻量、大批量低成本 |
| gpt-5 | OpenAI | 旗舰 | 推理模型,用 max_completion_tokens |
| gpt-5-mini | OpenAI | 标准 | 推理模型,用 max_completion_tokens |
| gpt-5.5 | OpenAI | 旗舰 | 最新旗舰;推理模型,用 max_completion_tokens |
| gpt-5.4 | OpenAI | 旗舰 | 高性能;推理模型,用 max_completion_tokens |
| gpt-5.4-mini | OpenAI | 标准 | 高性价比;推理模型,用 max_completion_tokens |
| gpt-5.4-nano | OpenAI | 经济 | 最省、大批量;推理模型,用 max_completion_tokens |
| gemini-2.5-pro | 旗舰 | 1M 上下文,长文 / 检索 / 推理;思考型,max_tokens 给足(≥4096) | |
| gemini-2.5-flash | 标准 | 高速,1M 上下文 | |
| gemini-2.5-flash-lite | 经济 | 最省、大批量,1M 上下文 |
POST/v1/chat/completions发送对话 → 获取回复
| 参数 | 类型 | 说明 |
|---|---|---|
| model * | string | 模型 ID(见上表) |
| messages * | array | 对话历史,元素含 role(system/user/assistant/tool)+ content |
| stream | boolean | true 时按 SSE(data: {...})逐块返回 |
| max_tokens | integer | 输出长度(Claude / GPT-4o 系列) |
| max_completion_tokens | integer | 输出长度(GPT-5 系列专用) |
| temperature / top_p | number | 采样;⚠️ opus-4-8 不支持,传入报 400 |
| tools / tool_choice | array | 函数 / 工具调用(OpenAI tools 格式) |
| response_format | object | 结构化输出,如 {"type":"json_object"} |
请求示例
# 流式
curl -N https://api.xdro.net/v1/chat/completions -H "Authorization: Bearer $KEY" \
-H "Content-Type: application/json" \
-d '{"model":"claude-sonnet-4-6","stream":true,"messages":[{"role":"user","content":"写个快排"}]}'
# 工具调用
-d '{"model":"claude-opus-4-8","messages":[{"role":"user","content":"北京天气?"}],
"tools":[{"type":"function","function":{"name":"get_weather",
"parameters":{"type":"object","properties":{"city":{"type":"string"}},"required":["city"]}}}]}'
# GPT-5(注意 max_completion_tokens)
-d '{"model":"gpt-5","messages":[{"role":"user","content":"你好"}],"max_completion_tokens":256}'响应(stream:false)
{"id":"...","object":"chat.completion","model":"claude-sonnet-4-6",
"choices":[{"index":0,"finish_reason":"stop",
"message":{"role":"assistant","content":"..."}}],
"usage":{"prompt_tokens":12,"completion_tokens":34,"total_tokens":46}}GET/v1/models列出可用模型
curl https://api.xdro.net/v1/models -H "Authorization: Bearer $KEY"
# → {"object":"list","data":[{"id":"claude-sonnet-4-6","object":"model",...}, ...]}注意事项 & 错误码
- • temperature:opus-4-8 不支持(传入 400);sonnet / haiku / GPT 正常支持。
- • GPT-5 系列(gpt-5 / 5-mini / 5.4 / 5.4-mini / 5.4-nano / 5.5):限制输出用
max_completion_tokens(不是max_tokens,否则 400),且建议给足额度(过小会返回空)。 - • Gemini 2.5 Pro:思考型模型,用
max_tokens限制输出时要给足额度(建议 ≥4096,否则思考耗尽预算返回空)。 - • embeddings、图像生成、语音(TTS / STT)等独有端点当前不提供。
| 状态码 | 含义 |
|---|---|
| 401 | 鉴权失败(Key 错误或缺失) |
| 429 | 限流或超出配额 |
| 5XX | 模型服务临时故障(建议自动重试;网关也已配置重试) |