常见问题

按主题分组的 FAQ。问题在你预期之外的话先看快速开始与错误码与重试，或走工单。

接入与协议

Q: 我的 SDK 该用哪个 base URL？

SDK	base URL
OpenAI（Chat / Responses / Embeddings / Images）	`https://api.ttttt.ai/v1`
Anthropic Messages	`https://api.ttttt.ai`（SDK 自己会拼 `/v1/messages`）
自写 fetch	直接拼完整路径 `https://api.ttttt.ai/v1/...`

详见快速开始。

Q: 必须改我的代码才能接吗？

不用——只改两项配置（base_url + api_key）。请求体、响应体、流式格式与上游官方完全一致。SDK 层级也无需替换。

Q: 同时支持 OpenAI 和 Anthropic 协议是什么意思？

ttttt.ai 是协议代理网关——你给什么协议，我们就走什么协议到匹配的上游。/v1/chat/completions 走 OpenAI，/v1/messages 走 Anthropic，背后可能命中同一个上游模型，也可能不同。详见 API 参考。

Q: 我能在浏览器里直接调用吗？

不能。CORS 关闭是有意设计——避免密钥从前端泄露。在你自己的服务端做一层 Proxy（鉴权 + 限流）再转发到 ttttt.ai。

Q: 网关支持 WebSocket 吗？

当前不支持。SSE 流式（HTTP/1.1 + text/event-stream）已经覆盖了主流模型的实时输出场景。Realtime API（语音双工）等新接口在路上。

计费与余额

Q: 一次调用扣多少？


单次扣费 = 单价(model) × 实际 token 数

实时单价见控制台 账单 → 模型价格。详细机制（缓存 / 流式 / 失败请求）见计费模型。

Q: 失败的请求会扣费吗？

通常不会——4xx / 5xx 全部不扣。429 限速也不扣。流式断流按已估算 output 部分扣。

Q: 余额有有效期吗？

充值 (topup) ：永久有效
赠金 (gift)：有有效期（活动赠金通常 30 / 60 天，到期被回收）
奖励 (bonus) ：永久有效（除非活动另有约定）

扣费按 gift → bonus → topup 优先级，让赠金先被消耗。详见计费模型 → Credit 桶。

Q: 怎么开发票？

控制台 账单 → 发票管理 提交申请，详见充值与发票。

Q: 充错金额能退款吗？

7 天内可申请原路退回，详见充值与发票 → 退款。

Q: 价格会涨吗？

可能 —— 上游成本变化时我们会跟进。至少提前 7 天在控制台公告 + 邮件通知 admin / owner，不会突然调价。

配额与限速

Q: 默认有 RPM / TPM 限制吗？

新建密钥默认不限速。你可以在密钥设置里主动设。详见 API 密钥 → 限速。

Q: 触发了限速怎么办？

返回 429 + Retry-After 头部。客户端按指数退避重试即可（OpenAI / Anthropic SDK 默认就支持）。详见错误码与重试。

Q: 上游限速也算到我账上吗？

会以 429 形式回给你，但不扣费。如果频繁撞上游限速可以联系工单评估升级渠道。

Q: 我用上游模型 `claude-opus-4-7` 总是 403？

测试期 ttttt.ai 公开模型是 gpt-5.5 / gpt-5.4。Claude 系列在协议层完成兼容测试，尚未开放。详见模型清单。

性能与网络

Q: 首 token 延迟一般多少？

国内 IP 调用 gpt-5.5 流式，首 token 通常在 300-800ms（取决于 prompt 长度与上游负载）。

构成：客户端→网关 (5-30ms) + 网关→上游+模型推理 (250ms-数秒) + 上游→客户端 (透传，约 10ms)。详见流式响应 → 首 token 延迟。

Q: 网关会做缓存吗？

不会。每次请求都直接转发到上游。但上游的 prompt cache（Anthropic / OpenAI 都支持）我们透传——你的 cache_control 字段、prompt_tokens_details.cached_tokens 字段都会按真实数据透传与计费。详见计费模型 → 缓存计费。

Q: 上游故障时会怎样？

ttttt.ai 网关自带渠道降级：

上游 5xx / 超时 → 自动切到同模型的备用渠道再试一次
全部备用都失败才把 5xx 透传给你

可以在错误码与重试看完整策略。

Q: 我能指定走某个具体上游吗？

对外接口只暴露 model 字段——背后路由由平台调度，外部不可指定。这是为了让对外接口稳定（不依赖某条上游线路）+ 自动降级生效。

安全与隐私

Q: 我的请求体会被存吗？

不会。网关只记录 metadata（模型、耗时、token 数、状态码、客户端、请求 ID），不持久化任何 prompt 或 completion 内容。

详细机制：所有请求经 TLS 直连转发到上游；上游响应原样透传给你。日志里只有 metadata。

Q: 上游会拿我的请求训练模型吗？

ttttt.ai 网关本身不训练任何模型。是否被上游用于训练取决于上游条款：

OpenAI：API 调用默认不用于训练
Anthropic：API 调用默认不用于训练
其他厂商按其条款

ttttt.ai 不会主动开启上游的 opt-in 训练同意。

Q: 我能查”我的密钥具体被谁用了”吗？

可以。控制台 用量 → 请求日志 按密钥过滤，能看到每条请求的时间、客户端、IP（如可用）、token 消耗。详见用量分析 → 请求日志。

Q: 数据存储在哪？

控制面（账户 / 余额 / 用量元数据）：HK 数据中心，PostgreSQL 主库 + 异地备份
网关推理流量：实时透传，不落盘
备份保留 30 天，按 GDPR 标准加密

详细问题（合规 / 数据驻留 / 跨境传输）请走工单商务侧。

Q: 密钥泄露了怎么办？

立即在控制台 API 密钥 列表 → 操作菜单 → 停用。不要先尝试”轮换”。然后核对 usage 记录有没有非自己 IP 的调用，必要时联系工单申请扣款回滚。详见 API 密钥 → 防泄漏。

Q: 团队成员能看到彼此的密钥吗？

member 看不到任何其他人的密钥；admin / owner 能看到列表（不含明文）+ 应急撤销功能。详见团队管理。

控制台

Q: 我在多家公司都要用 ttttt.ai，账号怎么管？

一个邮箱 = 一个 ttttt.ai 账号 = 可以加入 / 创建多个组织。在控制台顶栏组织切换器之间切换，余额、密钥、用量都按组织独立。详见组织与成员。

Q: 控制台支持英文吗？

支持。Web 应用做了完整 i18n（zh / en），右上角语言切换器可换。本文档（docs）暂时只有中文版，后续会出英文。

Q: 我能 API 化操作控制台吗（创建密钥 / 查用量）？

当前控制台 API 主要服务于 web 前端，未公开为客户 API。未来会提供 admin API 用于运维自动化。

排错

Q: 调用直接超时（无响应）

curl https://api.ttttt.ai/v1/models -H "Authorization: Bearer owo-..." 测最小连通性
如果 curl 也超时 —— 网络问题（防火墙 / DNS / 代理）
如果 curl OK 但 SDK 超时 —— SDK 配置（baseURL / 超时设置 / proxy）

Q: 流式响应总是中途断

检查客户端 / Proxy 的 read timeout 是否够长（建议 > 5 分钟）
nginx / cloudflare 等中间层可能 buffer 流式响应——关闭 proxy_buffering
拿 X-Request-ID 走工单，附上”中断时间点”

Q: 用量页面跟我的应用日志对不上

把每个请求的 X-Request-ID 存到你应用日志里，去用量页面按 ID 精确比对。常见原因：客户端重试导致同一业务请求生成多条 usage 记录、流式中断估算入账。

Q: 我的客户端被识别成 `unknown`，怎么让它显示正确名字？

在请求里加 User-Agent 头部，命名 your-app/版本，控制台会优先使用。例如：


User-Agent: my-rag-bot/1.2.0

详见用量分析 → 按客户端拆分。

联系我们

没找到你想问的？

控制台 → 帮助与联系 → 提交工单
商务合作：见支持页