Skip to Content
API 参考Embeddings

Embeddings

把文本转成定长向量,用于语义检索、RAG、聚类、相似度匹配。

POST https://api.ttttt.ai/v1/embeddings Authorization: Bearer owo-... Content-Type: application/json

协议对齐 OpenAI 官方 Embeddings 

请求

curl https://api.ttttt.ai/v1/embeddings \ -H "Authorization: Bearer owo-..." \ -H "Content-Type: application/json" \ -d '{ "model": "text-embedding-3-large", "input": "ttttt.ai 是统一的 AI API 网关。" }'

input 支持:

  • 单条字符串
  • 字符串数组(一次最多取决于上游模型限制,通常 100–2048 条)
  • token 数组(高级用法)

可选字段:

字段说明
dimensions截断维度(仅部分新模型支持,例如 text-embedding-3-*
encoding_formatfloat(默认)或 base64
user上游审计标记

响应

{ "object": "list", "data": [ { "object": "embedding", "index": 0, "embedding": [0.0123, -0.0456, ...] } ], "model": "text-embedding-3-large", "usage": { "prompt_tokens": 14, "total_tokens": 14 } }

计费

只按 input_tokens 算钱(embedding 没有 output token 概念):

单次扣费 = inputPer1M × prompt_tokens / 1_000_000

详见 模型清单

批量化

把多段文本一次发出去比一条条发更便宜——上游按总 token 数计价,但减少了往返开销,吞吐显著高:

{ "model": "text-embedding-3-large", "input": [ "段落 1", "段落 2", "段落 3" ] }

返回的 data[] 顺序与 input[] 一一对应。

RAG 工程提示

  • 选模型时关注维度多语言能力,不只看价格。
  • 入库前做去重 + 清洗——重复文本浪费向量库存储 + 召回噪音。
  • 长文本 chunk 大小推荐 256–1024 tokens,重叠 10–20%。
  • 检索阈值(cosine similarity)通常 0.75–0.85 之间是经验起点。

测试期注意

当前 ttttt.ai 测试阶段公开 gpt-5.5 / gpt-5.4 两款模型,embedding 类目尚未开放公共测试。Embeddings 协议层已就绪,将随测试期推进开放具体模型。

Last updated on