Embeddings
把文本转成定长向量,用于语义检索、RAG、聚类、相似度匹配。
POST https://api.ttttt.ai/v1/embeddings
Authorization: Bearer owo-...
Content-Type: application/json协议对齐 OpenAI 官方 Embeddings 。
请求
curl https://api.ttttt.ai/v1/embeddings \
-H "Authorization: Bearer owo-..." \
-H "Content-Type: application/json" \
-d '{
"model": "text-embedding-3-large",
"input": "ttttt.ai 是统一的 AI API 网关。"
}'input 支持:
- 单条字符串
- 字符串数组(一次最多取决于上游模型限制,通常 100–2048 条)
- token 数组(高级用法)
可选字段:
| 字段 | 说明 |
|---|---|
dimensions | 截断维度(仅部分新模型支持,例如 text-embedding-3-*) |
encoding_format | float(默认)或 base64 |
user | 上游审计标记 |
响应
{
"object": "list",
"data": [
{
"object": "embedding",
"index": 0,
"embedding": [0.0123, -0.0456, ...]
}
],
"model": "text-embedding-3-large",
"usage": {
"prompt_tokens": 14,
"total_tokens": 14
}
}计费
只按 input_tokens 算钱(embedding 没有 output token 概念):
单次扣费 = inputPer1M × prompt_tokens / 1_000_000详见 模型清单。
批量化
把多段文本一次发出去比一条条发更便宜——上游按总 token 数计价,但减少了往返开销,吞吐显著高:
{
"model": "text-embedding-3-large",
"input": [
"段落 1",
"段落 2",
"段落 3"
]
}返回的 data[] 顺序与 input[] 一一对应。
RAG 工程提示
- 选模型时关注维度与多语言能力,不只看价格。
- 入库前做去重 + 清洗——重复文本浪费向量库存储 + 召回噪音。
- 长文本 chunk 大小推荐 256–1024 tokens,重叠 10–20%。
- 检索阈值(cosine similarity)通常 0.75–0.85 之间是经验起点。
测试期注意
当前 ttttt.ai 测试阶段公开
gpt-5.5/gpt-5.4两款模型,embedding 类目尚未开放公共测试。Embeddings 协议层已就绪,将随测试期推进开放具体模型。
Last updated on