模型清单
ttttt.ai 处于测试阶段。为了保证稳定性,我们只公开下面两款模型,让调用方和定价侧的反馈先收敛,再逐步开放更多厂商。
当前公开模型
| 模型 ID | 所属协议 | 推荐用途 |
|---|---|---|
gpt-5.5 | OpenAI Chat Completions / Responses | 通用对话、代码、Agent 主力 |
gpt-5.4 | OpenAI Chat Completions / Responses | 轻量任务、批量生成、成本敏感场景 |
调用方式就是常规的 OpenAI 格式,把 model 字段填上对应 ID 即可:
curl https://api.ttttt.ai/v1/chat/completions \
-H "Authorization: Bearer owo-..." \
-H "Content-Type: application/json" \
-d '{"model":"gpt-5.5","messages":[{"role":"user","content":"hi"}]}'实时价格、上下文窗口、能力支持矩阵:ttttt.ai/models 公开页面 + 控制台 账单 → 模型价格。
计费维度
每个模型按这些维度计价(具体单价见模型清单页):
| 维度 | 单位 |
|---|---|
inputPer1M | USD / 100 万 input token |
outputPer1M | USD / 100 万 output token |
cacheReadPer1M | USD / 100 万 cache 命中 token |
cacheWritePer1M | USD / 100 万 cache 写入 token |
webSearchPerCall | USD / 次 web search 工具调用 |
imagePerImage | USD / 张图 |
详见 计费模型。
计费与限额
- 计费单位:
input_tokens+output_tokens,按模型定价乘以实际 token 数 - 最新定价见控制台 账单 → 模型价格 页,避免本页与真实价格漂移
- 组织月度预算与告警在 余额告警 配置
- 价格变更至少提前 7 天在控制台公告 + 邮件通知 admin / owner
路由与回退
- 每个
model在后端都会按 Channel 优先级 路由到具体上游供应商 - 上游
5xx触发自动重试 + 降级到同型号的其他 Channel;对外接口稳定 - Streaming (SSE) 全链路透传,不做 Buffer 聚合 —— 首 token 延迟接近原厂
- 用量记录里保留实际命中的 channel ID,便于运营分析线路质量
测试期限制说明
- 公开模型仅
gpt-5.5/gpt-5.4—— 这两款已通过定价与稳定性双重验证 - embedding / 文生图 协议层就绪但未开放公开模型
- claude- 系列* 协议层完成兼容测试,将随测试阶段结束陆续开放
什么时候开放更多模型?
测试阶段结束后会陆续开放:
- Anthropic Claude 系列(
claude-sonnet-4-6/claude-opus-4-7已在 API 层完成兼容测试) - Google Gemini 2.x
- DeepSeek 与国产模型
- OpenAI embedding / 文生图
具体开放时间与兼容情况会随产品更新在控制台公告里同步。 如果你有特定模型的提前试用需求,请通过 支持 留言说明使用场景。
选择建议
| 场景 | 推荐 |
|---|---|
| 通用 Agent 主力(Cursor / Claude Code / Cline) | gpt-5.5 |
| 高频轻量调用(自动补全 / 翻译 / 摘要) | gpt-5.4 |
| 长 system prompt 复用 | 启用 prompt cache(Claude 系列开放后切 Anthropic 协议) |
| 大批量生成(数据增强 / 离线任务) | gpt-5.4 + 并发限速控制 |
| 严苛 SLA 业务 | 备用渠道保障 + 低余额告警提前预警 |
相关文档
- API 参考 → Chat Completions — 完整请求 / 响应字段
- API 参考 → Messages — Anthropic 协议(Claude 系列开放后用)
- API 参考 → Streaming — 流式格式与解析
- 计费模型 — 三桶扣费、缓存计费、流式计费规则
Last updated on