API 文档

OpenAI 100% 兼容

一个 endpoint 同时调用 Claude 与 GPT。把 base_url 指过来、换上你的 sk- 密钥即可,现有 OpenAI SDK 无需改动。

快速开始

base_url https://api.xdro.net/v1
鉴权 请求头 Authorization: Bearer <你的 sk- 密钥>
计费 按 token 用量,每个 Key 有配额上限
# 最小示例:把 $KEY 换成你的密钥
curl https://api.xdro.net/v1/chat/completions \
  -H "Authorization: Bearer $KEY" \
  -H "Content-Type: application/json" \
  -d '{"model":"claude-sonnet-4-6","messages":[{"role":"user","content":"你好"}]}'

完全兼容 OpenAI SDK —— Python / Node 只改 base_urlapi_key 即可。

可用模型

模型 ID厂商档位说明
claude-opus-4-8Anthropic旗舰最强推理 / 深度分析(不支持 temperature)
claude-sonnet-4-6Anthropic标准均衡首选,性价比最高
claude-haiku-4-5-20251001Anthropic经济快、便宜,低延迟
gpt-4oOpenAI标准多模态,代码 / 推理 / 视觉均衡
gpt-4o-miniOpenAI经济轻量、大批量低成本
gpt-5OpenAI旗舰推理模型,用 max_completion_tokens
gpt-5-miniOpenAI标准推理模型,用 max_completion_tokens
gpt-5.5OpenAI旗舰最新旗舰;推理模型,用 max_completion_tokens
gpt-5.4OpenAI旗舰高性能;推理模型,用 max_completion_tokens
gpt-5.4-miniOpenAI标准高性价比;推理模型,用 max_completion_tokens
gpt-5.4-nanoOpenAI经济最省、大批量;推理模型,用 max_completion_tokens
gemini-2.5-proGoogle旗舰1M 上下文,长文 / 检索 / 推理;思考型,max_tokens 给足(≥4096)
gemini-2.5-flashGoogle标准高速,1M 上下文
gemini-2.5-flash-liteGoogle经济最省、大批量,1M 上下文

POST/v1/chat/completions发送对话 → 获取回复

参数类型说明
model *string模型 ID(见上表)
messages *array对话历史,元素含 role(system/user/assistant/tool)+ content
streambooleantrue 时按 SSE(data: {...})逐块返回
max_tokensinteger输出长度(Claude / GPT-4o 系列)
max_completion_tokensinteger输出长度(GPT-5 系列专用)
temperature / top_pnumber采样;⚠️ opus-4-8 不支持,传入报 400
tools / tool_choicearray函数 / 工具调用(OpenAI tools 格式)
response_formatobject结构化输出,如 {"type":"json_object"}
请求示例
# 流式
curl -N https://api.xdro.net/v1/chat/completions -H "Authorization: Bearer $KEY" \
 -H "Content-Type: application/json" \
 -d '{"model":"claude-sonnet-4-6","stream":true,"messages":[{"role":"user","content":"写个快排"}]}'

# 工具调用
-d '{"model":"claude-opus-4-8","messages":[{"role":"user","content":"北京天气?"}],
     "tools":[{"type":"function","function":{"name":"get_weather",
       "parameters":{"type":"object","properties":{"city":{"type":"string"}},"required":["city"]}}}]}'

# GPT-5(注意 max_completion_tokens)
-d '{"model":"gpt-5","messages":[{"role":"user","content":"你好"}],"max_completion_tokens":256}'
响应(stream:false)
{"id":"...","object":"chat.completion","model":"claude-sonnet-4-6",
 "choices":[{"index":0,"finish_reason":"stop",
   "message":{"role":"assistant","content":"..."}}],
 "usage":{"prompt_tokens":12,"completion_tokens":34,"total_tokens":46}}

GET/v1/models列出可用模型

curl https://api.xdro.net/v1/models -H "Authorization: Bearer $KEY"
# → {"object":"list","data":[{"id":"claude-sonnet-4-6","object":"model",...}, ...]}

注意事项 & 错误码

  • temperature:opus-4-8 不支持(传入 400);sonnet / haiku / GPT 正常支持。
  • GPT-5 系列(gpt-5 / 5-mini / 5.4 / 5.4-mini / 5.4-nano / 5.5):限制输出用 max_completion_tokens(不是 max_tokens,否则 400),且建议给足额度(过小会返回空)。
  • Gemini 2.5 Pro:思考型模型,用 max_tokens 限制输出时要给足额度(建议 ≥4096,否则思考耗尽预算返回空)。
  • • embeddings、图像生成、语音(TTS / STT)等独有端点当前不提供
状态码含义
401鉴权失败(Key 错误或缺失)
429限流或超出配额
5XX模型服务临时故障(建议自动重试;网关也已配置重试)