常见问题
按主题分组的 FAQ。问题在你预期之外的话先看 快速开始 与 错误码与重试,或走 工单。
接入与协议
Q: 我的 SDK 该用哪个 base URL?
| SDK | base URL |
|---|---|
| OpenAI(Chat / Responses / Embeddings / Images) | https://api.ttttt.ai/v1 |
| Anthropic Messages | https://api.ttttt.ai(SDK 自己会拼 /v1/messages) |
| 自写 fetch | 直接拼完整路径 https://api.ttttt.ai/v1/... |
详见 快速开始。
Q: 必须改我的代码才能接吗?
不用——只改两项配置(base_url + api_key)。请求体、响应体、流式格式与上游官方完全一致。SDK 层级也无需替换。
Q: 同时支持 OpenAI 和 Anthropic 协议是什么意思?
ttttt.ai 是协议代理网关——你给什么协议,我们就走什么协议到匹配的上游。/v1/chat/completions 走 OpenAI,/v1/messages 走 Anthropic,背后可能命中同一个上游模型,也可能不同。详见 API 参考。
Q: 我能在浏览器里直接调用吗?
不能。CORS 关闭是有意设计——避免密钥从前端泄露。在你自己的服务端做一层 Proxy(鉴权 + 限流)再转发到 ttttt.ai。
Q: 网关支持 WebSocket 吗?
当前不支持。SSE 流式(HTTP/1.1 + text/event-stream)已经覆盖了主流模型的实时输出场景。Realtime API(语音双工)等新接口在路上。
计费与余额
Q: 一次调用扣多少?
单次扣费 = 单价(model) × 实际 token 数实时单价见控制台 账单 → 模型价格。详细机制(缓存 / 流式 / 失败请求)见 计费模型。
Q: 失败的请求会扣费吗?
通常不会——4xx / 5xx 全部不扣。429 限速也不扣。流式断流按已估算 output 部分扣。
Q: 余额有有效期吗?
- 充值 (topup) :永久有效
- 赠金 (gift):有有效期(活动赠金通常 30 / 60 天,到期被回收)
- 奖励 (bonus) :永久有效(除非活动另有约定)
扣费按 gift → bonus → topup 优先级,让赠金先被消耗。详见 计费模型 → Credit 桶。
Q: 怎么开发票?
控制台 账单 → 发票管理 提交申请,详见 充值与发票。
Q: 充错金额能退款吗?
7 天内可申请原路退回,详见 充值与发票 → 退款。
Q: 价格会涨吗?
可能 —— 上游成本变化时我们会跟进。至少提前 7 天在控制台公告 + 邮件通知 admin / owner,不会突然调价。
配额与限速
Q: 默认有 RPM / TPM 限制吗?
新建密钥默认不限速。你可以在密钥设置里主动设。详见 API 密钥 → 限速。
Q: 触发了限速怎么办?
返回 429 + Retry-After 头部。客户端按指数退避重试即可(OpenAI / Anthropic SDK 默认就支持)。详见 错误码与重试。
Q: 上游限速也算到我账上吗?
会以 429 形式回给你,但不扣费。如果频繁撞上游限速可以联系工单评估升级渠道。
Q: 我用上游模型 claude-opus-4-7 总是 403?
测试期 ttttt.ai 公开模型是 gpt-5.5 / gpt-5.4。Claude 系列在协议层完成兼容测试,尚未开放。详见 模型清单。
性能与网络
Q: 首 token 延迟一般多少?
国内 IP 调用 gpt-5.5 流式,首 token 通常在 300-800ms(取决于 prompt 长度与上游负载)。
构成:客户端→网关 (5-30ms) + 网关→上游+模型推理 (250ms-数秒) + 上游→客户端 (透传,约 10ms)。 详见 流式响应 → 首 token 延迟。
Q: 网关会做缓存吗?
不会。每次请求都直接转发到上游。但上游的 prompt cache(Anthropic / OpenAI 都支持)我们透传——你的 cache_control 字段、prompt_tokens_details.cached_tokens 字段都会按真实数据透传与计费。详见 计费模型 → 缓存计费。
Q: 上游故障时会怎样?
ttttt.ai 网关自带渠道降级:
- 上游
5xx/ 超时 → 自动切到同模型的备用渠道再试一次 - 全部备用都失败才把
5xx透传给你
可以在 错误码与重试 看完整策略。
Q: 我能指定走某个具体上游吗?
对外接口只暴露 model 字段——背后路由由平台调度,外部不可指定。这是为了让对外接口稳定(不依赖某条上游线路)+ 自动降级生效。
安全与隐私
Q: 我的请求体会被存吗?
不会。网关只记录 metadata(模型、耗时、token 数、状态码、客户端、请求 ID),不持久化任何 prompt 或 completion 内容。
详细机制:所有请求经 TLS 直连转发到上游;上游响应原样透传给你。日志里只有 metadata。
Q: 上游会拿我的请求训练模型吗?
ttttt.ai 网关本身不训练任何模型。是否被上游用于训练取决于上游条款:
- OpenAI:API 调用默认不用于训练
- Anthropic:API 调用默认不用于训练
- 其他厂商按其条款
ttttt.ai 不会主动开启上游的 opt-in 训练同意。
Q: 我能查”我的密钥具体被谁用了”吗?
可以。控制台 用量 → 请求日志 按密钥过滤,能看到每条请求的时间、客户端、IP(如可用)、token 消耗。详见 用量分析 → 请求日志。
Q: 数据存储在哪?
- 控制面(账户 / 余额 / 用量元数据):HK 数据中心,PostgreSQL 主库 + 异地备份
- 网关推理流量:实时透传,不落盘
- 备份保留 30 天,按 GDPR 标准加密
详细问题(合规 / 数据驻留 / 跨境传输)请走 工单 商务侧。
Q: 密钥泄露了怎么办?
立即在控制台 API 密钥 列表 → 操作菜单 → 停用。不要先尝试”轮换”。然后核对 usage 记录有没有非自己 IP 的调用,必要时联系工单申请扣款回滚。详见 API 密钥 → 防泄漏。
Q: 团队成员能看到彼此的密钥吗?
member 看不到任何其他人的密钥;admin / owner 能看到列表(不含明文)+ 应急撤销功能。详见 团队管理。
控制台
Q: 我在多家公司都要用 ttttt.ai,账号怎么管?
一个邮箱 = 一个 ttttt.ai 账号 = 可以加入 / 创建多个组织。在控制台顶栏组织切换器之间切换,余额、密钥、用量都按组织独立。详见 组织与成员。
Q: 控制台支持英文吗?
支持。Web 应用做了完整 i18n(zh / en),右上角语言切换器可换。本文档(docs)暂时只有中文版,后续会出英文。
Q: 我能 API 化操作控制台吗(创建密钥 / 查用量)?
当前控制台 API 主要服务于 web 前端,未公开为客户 API。未来会提供 admin API 用于运维自动化。
排错
Q: 调用直接超时(无响应)
curl https://api.ttttt.ai/v1/models -H "Authorization: Bearer owo-..."测最小连通性- 如果 curl 也超时 —— 网络问题(防火墙 / DNS / 代理)
- 如果 curl OK 但 SDK 超时 —— SDK 配置(baseURL / 超时设置 / proxy)
Q: 流式响应总是中途断
- 检查客户端 / Proxy 的 read timeout 是否够长(建议 > 5 分钟)
- nginx / cloudflare 等中间层可能 buffer 流式响应——关闭
proxy_buffering - 拿
X-Request-ID走工单,附上”中断时间点”
Q: 用量页面跟我的应用日志对不上
把每个请求的 X-Request-ID 存到你应用日志里,去用量页面按 ID 精确比对。常见原因:客户端重试导致同一业务请求生成多条 usage 记录、流式中断估算入账。
Q: 我的客户端被识别成 unknown,怎么让它显示正确名字?
在请求里加 User-Agent 头部,命名 your-app/版本,控制台会优先使用。例如:
User-Agent: my-rag-bot/1.2.0详见 用量分析 → 按客户端拆分。
联系我们
没找到你想问的?