Responses

/v1/responses 是 OpenAI 新一代统一接口，支持单轮、多轮、function call、computer use 等场景的单一入口。Codex CLI 默认走这个端点。


POST https://api.ttttt.ai/v1/responses
Authorization: Bearer owo-...
Content-Type: application/json

协议字段对齐 OpenAI 官方 Responses API 规范。

与 Chat Completions 的关系

/v1/responses 比 /v1/chat/completions 更”现代”：

维度	Chat Completions	Responses
协议年龄	2023 起	2025 起
多步 tool 使用	需要客户端手工拼 history	服务端持久化 `previous_response_id`
内置工具（web_search, file_search, computer_use）	不支持	✅
Stream 事件类型	单一 `chat.completion.chunk`	细分 `response.output_text.delta` 等

如果你的工具/SDK 支持 Responses，优先用它——后续模型新功能（agent loop、structured tool use）会率先在这个端点上出。

最小请求


curl https://api.ttttt.ai/v1/responses \
  -H "Authorization: Bearer owo-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.5",
    "input": "用一句话解释 transformer。"
  }'

input 既支持简单字符串，也支持结构化数组（多轮 / 多模态）：


{
  "model": "gpt-5.5",
  "input": [
    { "role": "system", "content": "你是简洁的中文助手。" },
    { "role": "user", "content": "上海今天多少度？" }
  ]
}

响应


{
  "id": "resp_018ff3a2",
  "object": "response",
  "created_at": 1718640000,
  "model": "gpt-5.5",
  "output": [
    {
      "type": "message",
      "role": "assistant",
      "content": [
        { "type": "output_text", "text": "Transformer 是一种基于注意力机制的序列模型。" }
      ]
    }
  ],
  "usage": {
    "input_tokens": 18,
    "output_tokens": 14,
    "total_tokens": 32
  }
}

多轮对话：`previous_response_id`

Responses 把对话历史留在服务端，下一次请求只需引用上一轮的 id：


{
  "model": "gpt-5.5",
  "previous_response_id": "resp_018ff3a2",
  "input": "继续推导一下。"
}

平台原样透传 previous_response_id——历史会话保留在上游侧，ttttt.ai 不持久化任何请求 / 响应内容。

Tool 使用

Responses 内建多种工具，按需在 tools 字段开启：


{
  "model": "gpt-5.5",
  "input": "搜索昨天关于 GPT-6 的新闻并汇总",
  "tools": [
    { "type": "web_search" }
  ]
}

每次内置工具调用按模型清单里的 webSearchPerCall 单价额外计费——见计费模型。

流式


{ "model": "gpt-5.5", "input": "...", "stream": true }

事件分多种类型：


event: response.created
data: {...}

event: response.output_text.delta
data: {"delta": "你好"}

event: response.output_text.delta
data: {"delta": "，"}

event: response.completed
data: {"response": {...}}

完整事件清单见 OpenAI 官方文档。

计费字段


usage.input_tokens  → input_tokens
usage.output_tokens → output_tokens

如果开了 web_search / file_search 等内置工具，平台从 output[].type 与 output[].tool_call_count 推算工具调用次数并按 webSearchPerCall 单独计费。

何时用 `/v1/responses` 而不是 `/v1/chat/completions`？

你在用 Codex CLI（默认走 /responses）
你需要 previous_response_id 的服务端会话持久化
你需要 OpenAI 新内置工具（web_search / file_search / computer_use）
你在写新代码、可以选 SDK——优先 Responses

如果你在维护已有的 Chat Completions 集成，没必要为切换而切换。