计费说明
按 Token 用量计费
人民币结算,用多少算多少。输入与输出分别计价,余额实时扣减、用尽即停 —— 不会产生欠费。
1 · 计费单位:Token
所有模型按 token 计费。Token 是模型处理文本的最小单位,输入(你发送的 prompt) 与输出(模型生成的内容) 分别按各自单价计算。
粗略换算:1K(1000)tokens ≈ 700–750 个汉字 / 约 750 个英文单词(随模型与语言略有差异)。每次调用的实际 token 数, 以接口返回的 usage 字段为准。
2 · 计算公式
单次费用 = 输入 tokens ÷ 1,000,000 × 输入单价
+ 输出 tokens ÷ 1,000,000 × 输出单价
+ 输出 tokens ÷ 1,000,000 × 输出单价
各模型的输入 / 输出单价(元 / 百万 tokens)见 价格表。 不同模型单价不同;同一次对话里切换模型,会分别按各自单价计费。
3 · 计费示例
以 Claude Sonnet 4.6(输入 ¥32 / 百万、输出 ¥159.8 / 百万)为例,一次问答用了 2,000 输入 + 1,000 输出 tokens:
输入:2,000 ÷ 1,000,000 × ¥32 = ¥0.064
输出:1,000 ÷ 1,000,000 × ¥159.8 = ¥0.1598
合计 ≈ ¥0.224
输出:1,000 ÷ 1,000,000 × ¥159.8 = ¥0.1598
合计 ≈ ¥0.224
说明:示例仅用于演示算法,实际以接口返回的 token 数与当时单价为准。
4 · 余额与扣减
- 账户为预付额度制,每次调用结束后从余额实时扣减对应费用。
- 余额耗尽时,新的调用会被拒绝并返回
401(密钥停用),不会欠费、不会产生意外账单。 - 可在控制台 总览 查看实时余额;余额偏低时页面会提示。
- 需要补充额度或调整上限,直接联系我们即可,无需在线充值。
5 · 用量查询
三种方式随时核对用量与花费:
- 控制台:用量统计 按模型 / 时间查看 token 与费用明细。
- 接口返回:每次响应的
usage字段含prompt_tokens/completion_tokens/total_tokens。 - 编程查询:
/v1/dashboard系列接口可拉取额度与用量,便于自建监控。
6 · 限速与并发
为保障稳定性,密钥可设置速率与并发上限。触发限流时接口返回 429,建议客户端按指数退避(exponential backoff)重试。 需要更高配额请联系我们调整。
7 · 计费相关错误码
| HTTP | 含义 | 处理建议 |
|---|---|---|
| 401 | 密钥无效 / 缺失,或余额耗尽后密钥停用 | 检查 Authorization 与 sk- 密钥;余额不足请补充额度 |
| 429 | 触发限速 / 并发上限 | 退避后重试,或申请提高配额 |
| 5XX | 上游模型临时故障 | 自动重试(网关也已配置重试) |
完整错误码与字段说明见 API 文档。
8 · 对账与发票
用量明细可在控制台导出用于对账。需要发票或正式结算单,请通过 470786558zyf@gmail.com 联系我们。