Appearance
五、注意事项
使用前请务必阅读。
🚫 合规红线
以下内容一经发现,立即永久封号且余额不退:
- 色情、软色情内容生成或传播
- 暴力、血腥、恐怖内容
- 网络诈骗、钓鱼、木马相关
- 政治敏感、危害国家安全
- 侵犯他人知识产权
- 针对未成年人的不当内容
- 使用本站接口攻击其他系统
"酒馆"、角色扮演、NSFW 等场景尤其注意,平台会做输入输出双向审核。
💰 计费规则
按 token 计费
- 输入 token:你发给模型的 prompt(包括系统提示词、历史对话、文档内容)
- 输出 token:模型返回的文本
每次请求完整扣费,流式中途断开也按已生成部分扣。
推理模型特殊计费
对于 claude-opus-4-7 这类支持扩展思考(thinking)的模型:
- 思考过程 token 按输出价计费,即使你设置了
include_thoughts=false不返回思考内容 - 控制台
usage字段会显示thinking_tokens
缓存折扣
Anthropic Prompt Caching 命中的 token:
- 缓存写入:1.25x 正常输入价
- 缓存命中读取:0.1x 正常输入价(省 90%)
⚠️ 常见坑
1. 上下文越长越贵
聊天历史会越累越长。建议:
- 长对话定期总结后开新会话
- 用
max_tokens限制单次输出 - 用 Prompt Caching 复用系统提示词
2. 流式断连
网络抖动/客户端超时导致 SSE 断开:
- 本站重试会重新扣费(上游已生成)
- 建议客户端超时 ≥ 60 秒
- Claude Opus 慢请求可能需要 > 5 分钟,注意别设过短
3. 模型别名
别名(如 gpt-4)会映射到最新版本(gpt-4o),可能随时变动。生产环境建议写死版本号。
4. Key 泄漏
如果 key 出现在公开仓库/日志,几分钟内就会被扫到盗刷:
- 立即在控制台重置该 key
- 设置 key 的额度上限,限制损失
- 生产环境用环境变量,别硬编码
🔧 限流
| 层级 | 限制 |
|---|---|
| 单 Key RPM | 默认 600,高级用户可申请提升 |
| 单 Key 并发 | 默认 20 |
| 单次请求 | 输入 + 输出 ≤ 模型上下文窗口 |
触发限流返回 429,等 1-5 秒重试即可,不要猛重试(雪崩)。
📜 服务条款要点
- 服务可用性承诺 99.5%(年度),低于此值按比例补偿
- 禁止转售(非代理商身份)
- 用户数据不做训练,不共享给第三方
- 审计日志保留 30 天,可在个人设置关闭(关闭后无法追溯问题)
- 账户 180 天无活动自动冻结,余额保留
🆘 求助
| 场景 | 渠道 |
|---|---|
| 技术故障、报错 | 控制台右下角工单系统 |
| 账户/充值问题 | 邮件 support@tokenallin.com |
| 紧急情况(被攻击/盗号) | 邮件 security@tokenallin.com |
| 商务合作 | 邮件 partner@tokenallin.com |