计费说明

按 Token 用量计费

人民币结算,用多少算多少。输入与输出分别计价,余额实时扣减、用尽即停 —— 不会产生欠费。

1 · 计费单位:Token

所有模型按 token 计费。Token 是模型处理文本的最小单位,输入(你发送的 prompt)输出(模型生成的内容) 分别按各自单价计算。

粗略换算:1K(1000)tokens ≈ 700–750 个汉字 / 约 750 个英文单词(随模型与语言略有差异)。每次调用的实际 token 数, 以接口返回的 usage 字段为准。

2 · 计算公式

单次费用 = 输入 tokens ÷ 1,000,000 × 输入单价
+ 输出 tokens ÷ 1,000,000 × 输出单价

各模型的输入 / 输出单价(元 / 百万 tokens)见 价格表。 不同模型单价不同;同一次对话里切换模型,会分别按各自单价计费。

3 · 计费示例

以 Claude Sonnet 4.6(输入 ¥32 / 百万、输出 ¥159.8 / 百万)为例,一次问答用了 2,000 输入 + 1,000 输出 tokens:

输入:2,000 ÷ 1,000,000 × ¥32 = ¥0.064
输出:1,000 ÷ 1,000,000 × ¥159.8 = ¥0.1598
合计 ≈ ¥0.224

说明:示例仅用于演示算法,实际以接口返回的 token 数与当时单价为准。

4 · 余额与扣减

  • 账户为预付额度制,每次调用结束后从余额实时扣减对应费用。
  • 余额耗尽时,新的调用会被拒绝并返回 401(密钥停用),不会欠费、不会产生意外账单
  • 可在控制台 总览 查看实时余额;余额偏低时页面会提示。
  • 需要补充额度或调整上限,直接联系我们即可,无需在线充值。

5 · 用量查询

三种方式随时核对用量与花费:

  • 控制台:用量统计 按模型 / 时间查看 token 与费用明细。
  • 接口返回:每次响应的 usage 字段含 prompt_tokens / completion_tokens / total_tokens
  • 编程查询:/v1/dashboard 系列接口可拉取额度与用量,便于自建监控。

6 · 限速与并发

为保障稳定性,密钥可设置速率与并发上限。触发限流时接口返回 429,建议客户端按指数退避(exponential backoff)重试。 需要更高配额请联系我们调整。

7 · 计费相关错误码

HTTP含义处理建议
401密钥无效 / 缺失,或余额耗尽后密钥停用检查 Authorization 与 sk- 密钥;余额不足请补充额度
429触发限速 / 并发上限退避后重试,或申请提高配额
5XX上游模型临时故障自动重试(网关也已配置重试)

完整错误码与字段说明见 API 文档

8 · 对账与发票

用量明细可在控制台导出用于对账。需要发票或正式结算单,请通过 470786558zyf@gmail.com 联系我们。

还有疑问?

查看常见问题,或直接看各模型单价。