模型清单

ttttt.ai 处于测试阶段。为了保证稳定性，我们只公开下面两款模型，让调用方和定价侧的反馈先收敛，再逐步开放更多厂商。

当前公开模型

模型 ID	所属协议	推荐用途
`gpt-5.5`	OpenAI Chat Completions / Responses	通用对话、代码、Agent 主力
`gpt-5.4`	OpenAI Chat Completions / Responses	轻量任务、批量生成、成本敏感场景

调用方式就是常规的 OpenAI 格式，把 model 字段填上对应 ID 即可：


curl https://api.ttttt.ai/v1/chat/completions \
  -H "Authorization: Bearer owo-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"gpt-5.5","messages":[{"role":"user","content":"hi"}]}'

实时价格、上下文窗口、能力支持矩阵：ttttt.ai/models 公开页面 + 控制台 账单 → 模型价格。

计费维度

每个模型按这些维度计价（具体单价见模型清单页）：

维度	单位
`inputPer1M`	USD / 100 万 input token
`outputPer1M`	USD / 100 万 output token
`cacheReadPer1M`	USD / 100 万 cache 命中 token
`cacheWritePer1M`	USD / 100 万 cache 写入 token
`webSearchPerCall`	USD / 次 web search 工具调用
`imagePerImage`	USD / 张图

详见计费模型。

计费与限额

计费单位：input_tokens + output_tokens，按模型定价乘以实际 token 数
最新定价见控制台 账单 → 模型价格 页，避免本页与真实价格漂移
组织月度预算与告警在余额告警配置
价格变更至少提前 7 天在控制台公告 + 邮件通知 admin / owner

路由与回退

每个 model 在后端都会按 Channel 优先级 路由到具体上游供应商
上游 5xx 触发自动重试 + 降级到同型号的其他 Channel；对外接口稳定
Streaming (SSE) 全链路透传，不做 Buffer 聚合 —— 首 token 延迟接近原厂
用量记录里保留实际命中的 channel ID，便于运营分析线路质量

测试期限制说明

公开模型仅 gpt-5.5 / gpt-5.4 —— 这两款已通过定价与稳定性双重验证
embedding / 文生图 协议层就绪但未开放公开模型
claude- 系列* 协议层完成兼容测试，将随测试阶段结束陆续开放

什么时候开放更多模型？

测试阶段结束后会陆续开放：

Anthropic Claude 系列（claude-sonnet-4-6 / claude-opus-4-7 已在 API 层完成兼容测试）
Google Gemini 2.x
DeepSeek 与国产模型
OpenAI embedding / 文生图

具体开放时间与兼容情况会随产品更新在控制台公告里同步。如果你有特定模型的提前试用需求，请通过支持留言说明使用场景。

选择建议

场景	推荐
通用 Agent 主力（Cursor / Claude Code / Cline）	`gpt-5.5`
高频轻量调用（自动补全 / 翻译 / 摘要）	`gpt-5.4`
长 system prompt 复用	启用 prompt cache（Claude 系列开放后切 Anthropic 协议）
大批量生成（数据增强 / 离线任务）	`gpt-5.4` + 并发限速控制
严苛 SLA 业务	备用渠道保障 + 低余额告警提前预警