Skip to content

五、注意事项

使用前请务必阅读。

🚫 合规红线

以下内容一经发现,立即永久封号且余额不退

  • 色情、软色情内容生成或传播
  • 暴力、血腥、恐怖内容
  • 网络诈骗、钓鱼、木马相关
  • 政治敏感、危害国家安全
  • 侵犯他人知识产权
  • 针对未成年人的不当内容
  • 使用本站接口攻击其他系统

"酒馆"、角色扮演、NSFW 等场景尤其注意,平台会做输入输出双向审核。

💰 计费规则

按 token 计费

  • 输入 token:你发给模型的 prompt(包括系统提示词、历史对话、文档内容)
  • 输出 token:模型返回的文本

每次请求完整扣费,流式中途断开也按已生成部分扣

推理模型特殊计费

对于 claude-opus-4-7 这类支持扩展思考(thinking)的模型:

  • 思考过程 token 按输出价计费,即使你设置了 include_thoughts=false 不返回思考内容
  • 控制台 usage 字段会显示 thinking_tokens

缓存折扣

Anthropic Prompt Caching 命中的 token:

  • 缓存写入:1.25x 正常输入价
  • 缓存命中读取:0.1x 正常输入价(省 90%

⚠️ 常见坑

1. 上下文越长越贵

聊天历史会越累越长。建议:

  • 长对话定期总结后开新会话
  • max_tokens 限制单次输出
  • 用 Prompt Caching 复用系统提示词

2. 流式断连

网络抖动/客户端超时导致 SSE 断开:

  • 本站重试会重新扣费(上游已生成)
  • 建议客户端超时 ≥ 60 秒
  • Claude Opus 慢请求可能需要 > 5 分钟,注意别设过短

3. 模型别名

别名(如 gpt-4)会映射到最新版本(gpt-4o),可能随时变动。生产环境建议写死版本号。

4. Key 泄漏

如果 key 出现在公开仓库/日志,几分钟内就会被扫到盗刷:

  • 立即在控制台重置该 key
  • 设置 key 的额度上限,限制损失
  • 生产环境用环境变量,别硬编码

🔧 限流

层级限制
单 Key RPM默认 600,高级用户可申请提升
单 Key 并发默认 20
单次请求输入 + 输出 ≤ 模型上下文窗口

触发限流返回 429等 1-5 秒重试即可,不要猛重试(雪崩)。

📜 服务条款要点

  • 服务可用性承诺 99.5%(年度),低于此值按比例补偿
  • 禁止转售(非代理商身份)
  • 用户数据不做训练,不共享给第三方
  • 审计日志保留 30 天,可在个人设置关闭(关闭后无法追溯问题)
  • 账户 180 天无活动自动冻结,余额保留

🆘 求助

场景渠道
技术故障、报错控制台右下角工单系统
账户/充值问题邮件 support@tokenallin.com
紧急情况(被攻击/盗号)邮件 security@tokenallin.com
商务合作邮件 partner@tokenallin.com

看完以上内容 → 回到首页开始使用

Powered by VitePress