五、注意事项

使用前请务必阅读。

🚫 合规红线

以下内容一经发现，立即永久封号且余额不退：

色情、软色情内容生成或传播
暴力、血腥、恐怖内容
网络诈骗、钓鱼、木马相关
政治敏感、危害国家安全
侵犯他人知识产权
针对未成年人的不当内容
使用本站接口攻击其他系统

"酒馆"、角色扮演、NSFW 等场景尤其注意，平台会做输入输出双向审核。

💰 计费规则

按 token 计费

输入 token：你发给模型的 prompt（包括系统提示词、历史对话、文档内容）
输出 token：模型返回的文本

每次请求完整扣费，流式中途断开也按已生成部分扣。

推理模型特殊计费

对于 claude-opus-4-7 这类支持扩展思考（thinking）的模型：

思考过程 token 按输出价计费，即使你设置了 include_thoughts=false 不返回思考内容
控制台 usage 字段会显示 thinking_tokens

缓存折扣

Anthropic Prompt Caching 命中的 token：

缓存写入：1.25x 正常输入价
缓存命中读取：0.1x 正常输入价（省 90%）

⚠️ 常见坑

1. 上下文越长越贵

聊天历史会越累越长。建议：

长对话定期总结后开新会话
用 max_tokens 限制单次输出
用 Prompt Caching 复用系统提示词

2. 流式断连

网络抖动/客户端超时导致 SSE 断开：

本站重试会重新扣费（上游已生成）
建议客户端超时 ≥ 60 秒
Claude Opus 慢请求可能需要 > 5 分钟，注意别设过短

3. 模型别名

别名（如 gpt-4）会映射到最新版本（gpt-4o），可能随时变动。生产环境建议写死版本号。

4. Key 泄漏

如果 key 出现在公开仓库/日志，几分钟内就会被扫到盗刷：

立即在控制台重置该 key
设置 key 的额度上限，限制损失
生产环境用环境变量，别硬编码

🔧 限流

层级	限制
单 Key RPM	默认 600，高级用户可申请提升
单 Key 并发	默认 20
单次请求	输入 + 输出 ≤ 模型上下文窗口

触发限流返回 429，等 1-5 秒重试即可，不要猛重试（雪崩）。

📜 服务条款要点

服务可用性承诺 99.5%（年度），低于此值按比例补偿
禁止转售（非代理商身份）
用户数据不做训练，不共享给第三方
审计日志保留 30 天，可在个人设置关闭（关闭后无法追溯问题）
账户 180 天无活动自动冻结，余额保留

🆘 求助

场景	渠道
技术故障、报错	控制台右下角工单系统
账户/充值问题	邮件 `support@tokenallin.com`
紧急情况（被攻击/盗号）	邮件 `security@tokenallin.com`
商务合作	邮件 `partner@tokenallin.com`

看完以上内容 → 回到首页或开始使用

五、注意事项 ​

🚫 合规红线 ​

💰 计费规则 ​

按 token 计费 ​

推理模型特殊计费 ​

缓存折扣 ​

⚠️ 常见坑 ​

1. 上下文越长越贵 ​

2. 流式断连 ​

3. 模型别名 ​

4. Key 泄漏 ​

🔧 限流 ​

📜 服务条款要点 ​

🆘 求助 ​