计费说明

按 Token 用量计费

人民币结算,用多少算多少。输入与输出分别计价,余额实时扣减、用尽即停 —— 不会产生欠费。

1 · 计费单位:Token

所有模型按 token 计费。Token 是模型处理文本的最小单位,输入(你发送的 prompt) 与输出(模型生成的内容) 分别按各自单价计算。

粗略换算:1K(1000)tokens ≈ 700–750 个汉字 / 约 750 个英文单词(随模型与语言略有差异)。每次调用的实际 token 数, 以接口返回的 usage 字段为准。

单次费用 = 输入 tokens ÷ 1,000,000 × 输入单价
+ 输出 tokens ÷ 1,000,000 × 输出单价

各模型的输入 / 输出单价(元 / 百万 tokens)见价格表。不同模型单价不同;同一次对话里切换模型,会分别按各自单价计费。

以 Claude Sonnet 4.6(输入 ¥32 / 百万、输出 ¥159.8 / 百万)为例,一次问答用了 2,000 输入 + 1,000 输出 tokens:

输入:2,000 ÷ 1,000,000 × ¥32 = ¥0.064
输出:1,000 ÷ 1,000,000 × ¥159.8 = ¥0.1598
合计 ≈ ¥0.224

说明:示例仅用于演示算法,实际以接口返回的 token 数与当时单价为准。

三种方式随时核对用量与花费:

控制台:用量统计按模型 / 时间查看 token 与费用明细。
接口返回:每次响应的 usage 字段含 prompt_tokens / completion_tokens / total_tokens。
编程查询:/v1/dashboard 系列接口可拉取额度与用量,便于自建监控。

为保障稳定性,密钥可设置速率与并发上限。触发限流时接口返回 429,建议客户端按指数退避(exponential backoff)重试。需要更高配额请联系我们调整。

HTTP	含义	处理建议
401	密钥无效 / 缺失,或余额耗尽后密钥停用	检查 Authorization 与 sk- 密钥;余额不足请补充额度
429	触发限速 / 并发上限	退避后重试,或申请提高配额
5XX	上游模型临时故障	自动重试(网关也已配置重试)

完整错误码与字段说明见 API 文档。

用量明细可在控制台导出用于对账。需要发票或正式结算单,请通过 470786558zyf@gmail.com 联系我们。

查看常见问题,或直接看各模型单价。