Embeddings

把文本转成定长向量，用于语义检索、RAG、聚类、相似度匹配。


POST https://api.ttttt.ai/v1/embeddings
Authorization: Bearer owo-...
Content-Type: application/json

协议对齐 OpenAI 官方 Embeddings 。

请求


curl https://api.ttttt.ai/v1/embeddings \
  -H "Authorization: Bearer owo-..." \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-embedding-3-large",
    "input": "ttttt.ai 是统一的 AI API 网关。"
  }'

input 支持：

单条字符串
字符串数组（一次最多取决于上游模型限制，通常 100–2048 条）
token 数组（高级用法）

可选字段：

字段	说明
`dimensions`	截断维度（仅部分新模型支持，例如 `text-embedding-3-*`）
`encoding_format`	`float`（默认）或 `base64`
`user`	上游审计标记

响应


{
  "object": "list",
  "data": [
    {
      "object": "embedding",
      "index": 0,
      "embedding": [0.0123, -0.0456, ...]
    }
  ],
  "model": "text-embedding-3-large",
  "usage": {
    "prompt_tokens": 14,
    "total_tokens": 14
  }
}

计费

只按 input_tokens 算钱（embedding 没有 output token 概念）：


单次扣费 = inputPer1M × prompt_tokens / 1_000_000

详见模型清单。

批量化

把多段文本一次发出去比一条条发更便宜——上游按总 token 数计价，但减少了往返开销，吞吐显著高：


{
  "model": "text-embedding-3-large",
  "input": [
    "段落 1",
    "段落 2",
    "段落 3"
  ]
}

返回的 data[] 顺序与 input[] 一一对应。

RAG 工程提示

选模型时关注维度与多语言能力，不只看价格。
入库前做去重 + 清洗——重复文本浪费向量库存储 + 召回噪音。
长文本 chunk 大小推荐 256–1024 tokens，重叠 10–20%。
检索阈值（cosine similarity）通常 0.75–0.85 之间是经验起点。

测试期注意

当前 ttttt.ai 测试阶段公开 gpt-5.5 / gpt-5.4 两款模型，embedding 类目尚未开放公共测试。Embeddings 协议层已就绪，将随测试期推进开放具体模型。