Responses
/v1/responses 是 OpenAI 新一代统一接口,支持单轮、多轮、function call、computer use 等场景的单一入口。Codex CLI 默认走这个端点。
POST https://api.ttttt.ai/v1/responses
Authorization: Bearer owo-...
Content-Type: application/json协议字段对齐 OpenAI 官方 Responses API 规范。
与 Chat Completions 的关系
/v1/responses 比 /v1/chat/completions 更”现代”:
| 维度 | Chat Completions | Responses |
|---|---|---|
| 协议年龄 | 2023 起 | 2025 起 |
| 多步 tool 使用 | 需要客户端手工拼 history | 服务端持久化 previous_response_id |
| 内置工具(web_search, file_search, computer_use) | 不支持 | ✅ |
| Stream 事件类型 | 单一 chat.completion.chunk | 细分 response.output_text.delta 等 |
如果你的工具/SDK 支持 Responses,优先用它——后续模型新功能(agent loop、structured tool use)会率先在这个端点上出。
最小请求
curl https://api.ttttt.ai/v1/responses \
-H "Authorization: Bearer owo-..." \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-5.5",
"input": "用一句话解释 transformer。"
}'input 既支持简单字符串,也支持结构化数组(多轮 / 多模态):
{
"model": "gpt-5.5",
"input": [
{ "role": "system", "content": "你是简洁的中文助手。" },
{ "role": "user", "content": "上海今天多少度?" }
]
}响应
{
"id": "resp_018ff3a2",
"object": "response",
"created_at": 1718640000,
"model": "gpt-5.5",
"output": [
{
"type": "message",
"role": "assistant",
"content": [
{ "type": "output_text", "text": "Transformer 是一种基于注意力机制的序列模型。" }
]
}
],
"usage": {
"input_tokens": 18,
"output_tokens": 14,
"total_tokens": 32
}
}多轮对话:previous_response_id
Responses 把对话历史留在服务端,下一次请求只需引用上一轮的 id:
{
"model": "gpt-5.5",
"previous_response_id": "resp_018ff3a2",
"input": "继续推导一下。"
}平台原样透传
previous_response_id——历史会话保留在上游侧,ttttt.ai 不持久化任何请求 / 响应内容。
Tool 使用
Responses 内建多种工具,按需在 tools 字段开启:
{
"model": "gpt-5.5",
"input": "搜索昨天关于 GPT-6 的新闻并汇总",
"tools": [
{ "type": "web_search" }
]
}每次内置工具调用按模型清单里的 webSearchPerCall 单价额外计费——见 计费模型。
流式
{ "model": "gpt-5.5", "input": "...", "stream": true }事件分多种类型:
event: response.created
data: {...}
event: response.output_text.delta
data: {"delta": "你好"}
event: response.output_text.delta
data: {"delta": ","}
event: response.completed
data: {"response": {...}}完整事件清单见 OpenAI 官方文档。
计费字段
usage.input_tokens → input_tokens
usage.output_tokens → output_tokens如果开了 web_search / file_search 等内置工具,平台从 output[].type 与 output[].tool_call_count 推算工具调用次数并按 webSearchPerCall 单独计费。
何时用 /v1/responses 而不是 /v1/chat/completions?
- 你在用 Codex CLI(默认走
/responses) - 你需要
previous_response_id的服务端会话持久化 - 你需要 OpenAI 新内置工具(
web_search/file_search/computer_use) - 你在写新代码、可以选 SDK——优先 Responses
如果你在维护已有的 Chat Completions 集成,没必要为切换而切换。
Last updated on