API 文档

OpenAI 100% 兼容

一个 endpoint 同时调用 Claude 与 GPT。把 base_url 指过来、换上你的 sk- 密钥即可,现有 OpenAI SDK 无需改动。

快速开始

base_url https://api.xdro.net/v1

鉴权请求头 Authorization: Bearer <你的 sk- 密钥>

计费按 token 用量,每个 Key 有配额上限

# 最小示例:把 $KEY 换成你的密钥
curl https://api.xdro.net/v1/chat/completions \
  -H "Authorization: Bearer $KEY" \
  -H "Content-Type: application/json" \
  -d '{"model":"claude-sonnet-4-6","messages":[{"role":"user","content":"你好"}]}'

完全兼容 OpenAI SDK —— Python / Node 只改 base_url 与 api_key 即可。

可用模型

模型 ID	厂商	档位	说明
claude-opus-4-8	Anthropic	旗舰	最强推理 / 深度分析(不支持 temperature)
claude-sonnet-4-6	Anthropic	标准	均衡首选,性价比最高
claude-haiku-4-5-20251001	Anthropic	经济	快、便宜,低延迟
gpt-4o	OpenAI	标准	多模态,代码 / 推理 / 视觉均衡
gpt-4o-mini	OpenAI	经济	轻量、大批量低成本
gpt-5	OpenAI	旗舰	推理模型,用 max_completion_tokens
gpt-5-mini	OpenAI	标准	推理模型,用 max_completion_tokens
gpt-5.5	OpenAI	旗舰	最新旗舰;推理模型,用 max_completion_tokens
gpt-5.4	OpenAI	旗舰	高性能;推理模型,用 max_completion_tokens
gpt-5.4-mini	OpenAI	标准	高性价比;推理模型,用 max_completion_tokens
gpt-5.4-nano	OpenAI	经济	最省、大批量;推理模型,用 max_completion_tokens
gemini-2.5-pro	Google	旗舰	1M 上下文,长文 / 检索 / 推理;思考型,max_tokens 给足(≥4096)
gemini-2.5-flash	Google	标准	高速,1M 上下文
gemini-2.5-flash-lite	Google	经济	最省、大批量,1M 上下文

POST/v1/chat/completions发送对话 → 获取回复

参数	类型	说明
model *	string	模型 ID(见上表)
messages *	array	对话历史,元素含 role(system/user/assistant/tool)+ content
stream	boolean	true 时按 SSE(data: {...})逐块返回
max_tokens	integer	输出长度(Claude / GPT-4o 系列)
max_completion_tokens	integer	输出长度(GPT-5 系列专用)
temperature / top_p	number	采样;⚠️ opus-4-8 不支持,传入报 400
tools / tool_choice	array	函数 / 工具调用(OpenAI tools 格式)
response_format	object	结构化输出,如 {"type":"json_object"}

请求示例

# 流式
curl -N https://api.xdro.net/v1/chat/completions -H "Authorization: Bearer $KEY" \
 -H "Content-Type: application/json" \
 -d '{"model":"claude-sonnet-4-6","stream":true,"messages":[{"role":"user","content":"写个快排"}]}'

# 工具调用
-d '{"model":"claude-opus-4-8","messages":[{"role":"user","content":"北京天气?"}],
     "tools":[{"type":"function","function":{"name":"get_weather",
       "parameters":{"type":"object","properties":{"city":{"type":"string"}},"required":["city"]}}}]}'

# GPT-5(注意 max_completion_tokens)
-d '{"model":"gpt-5","messages":[{"role":"user","content":"你好"}],"max_completion_tokens":256}'

响应(stream:false)

{"id":"...","object":"chat.completion","model":"claude-sonnet-4-6",
 "choices":[{"index":0,"finish_reason":"stop",
   "message":{"role":"assistant","content":"..."}}],
 "usage":{"prompt_tokens":12,"completion_tokens":34,"total_tokens":46}}

GET/v1/models列出可用模型

curl https://api.xdro.net/v1/models -H "Authorization: Bearer $KEY"
# → {"object":"list","data":[{"id":"claude-sonnet-4-6","object":"model",...}, ...]}

注意事项 & 错误码

• temperature:opus-4-8 不支持(传入 400);sonnet / haiku / GPT 正常支持。
• GPT-5 系列(gpt-5 / 5-mini / 5.4 / 5.4-mini / 5.4-nano / 5.5):限制输出用 max_completion_tokens(不是 max_tokens,否则 400),且建议给足额度(过小会返回空)。
• Gemini 2.5 Pro:思考型模型,用 max_tokens 限制输出时要给足额度(建议 ≥4096,否则思考耗尽预算返回空)。
• embeddings、图像生成、语音(TTS / STT)等独有端点当前不提供。

状态码	含义
401	鉴权失败(Key 错误或缺失)
429	限流或超出配额
5XX	模型服务临时故障(建议自动重试;网关也已配置重试)