Skip to Content
API 参考Responses

Responses

/v1/responses 是 OpenAI 新一代统一接口,支持单轮、多轮、function call、computer use 等场景的单一入口。Codex CLI 默认走这个端点。

POST https://api.ttttt.ai/v1/responses Authorization: Bearer owo-... Content-Type: application/json

协议字段对齐 OpenAI 官方 Responses API  规范。

与 Chat Completions 的关系

/v1/responses/v1/chat/completions 更”现代”:

维度Chat CompletionsResponses
协议年龄2023 起2025 起
多步 tool 使用需要客户端手工拼 history服务端持久化 previous_response_id
内置工具(web_search, file_search, computer_use)不支持
Stream 事件类型单一 chat.completion.chunk细分 response.output_text.delta

如果你的工具/SDK 支持 Responses,优先用它——后续模型新功能(agent loop、structured tool use)会率先在这个端点上出。

最小请求

curl https://api.ttttt.ai/v1/responses \ -H "Authorization: Bearer owo-..." \ -H "Content-Type: application/json" \ -d '{ "model": "gpt-5.5", "input": "用一句话解释 transformer。" }'

input 既支持简单字符串,也支持结构化数组(多轮 / 多模态):

{ "model": "gpt-5.5", "input": [ { "role": "system", "content": "你是简洁的中文助手。" }, { "role": "user", "content": "上海今天多少度?" } ] }

响应

{ "id": "resp_018ff3a2", "object": "response", "created_at": 1718640000, "model": "gpt-5.5", "output": [ { "type": "message", "role": "assistant", "content": [ { "type": "output_text", "text": "Transformer 是一种基于注意力机制的序列模型。" } ] } ], "usage": { "input_tokens": 18, "output_tokens": 14, "total_tokens": 32 } }

多轮对话:previous_response_id

Responses 把对话历史留在服务端,下一次请求只需引用上一轮的 id

{ "model": "gpt-5.5", "previous_response_id": "resp_018ff3a2", "input": "继续推导一下。" }

平台原样透传 previous_response_id——历史会话保留在上游侧,ttttt.ai 不持久化任何请求 / 响应内容

Tool 使用

Responses 内建多种工具,按需在 tools 字段开启:

{ "model": "gpt-5.5", "input": "搜索昨天关于 GPT-6 的新闻并汇总", "tools": [ { "type": "web_search" } ] }

每次内置工具调用按模型清单里的 webSearchPerCall 单价额外计费——见 计费模型

流式

{ "model": "gpt-5.5", "input": "...", "stream": true }

事件分多种类型:

event: response.created data: {...} event: response.output_text.delta data: {"delta": "你好"} event: response.output_text.delta data: {"delta": ","} event: response.completed data: {"response": {...}}

完整事件清单见 OpenAI 官方文档。

计费字段

usage.input_tokens → input_tokens usage.output_tokens → output_tokens

如果开了 web_search / file_search 等内置工具,平台从 output[].typeoutput[].tool_call_count 推算工具调用次数并按 webSearchPerCall 单独计费。

何时用 /v1/responses 而不是 /v1/chat/completions

  • 你在用 Codex CLI(默认走 /responses
  • 你需要 previous_response_id 的服务端会话持久化
  • 你需要 OpenAI 新内置工具(web_search / file_search / computer_use
  • 你在写新代码、可以选 SDK——优先 Responses

如果你在维护已有的 Chat Completions 集成,没必要为切换而切换。

Last updated on