Rerank
POST /v1/rerank
對候選文件列表依據與查詢的相關性重新排序。常用於 RAG Pipeline 的精排步驟。
Rerank 是什麼? 在 RAG 中,第一步通常用向量搜尋找出 Top-N 候選文件,但向量相似度不總是能精準反映相關性。Rerank 模型會更仔細地評估每個文件與查詢的相關程度,重新排序後只把最相關的幾篇送給 LLM。
請求
POST /v1/rerank
Authorization: Bearer sk-your-api-key
Content-Type: application/json
{
"model": "baai/bge-reranker-v2-m3",
"query": "OAuth 2.0 認證流程",
"documents": [
"OAuth 2.0 使用 Authorization Code Flow...",
"今天天氣不錯,適合出門",
"Bearer Token 在 Authorization Header 中..."
],
"top_n": 2
}
請求欄位
| 欄位 | 類型 | 必填 | 說明 |
|---|---|---|---|
model | string | ✓ | Rerank 模型 ID |
query | string | ✓ | 搜尋查詢 |
documents | string[] | ✓ | 候選文件列表 |
top_n | number | 回傳排名前 N 筆,不填則回傳全部 |
回應
{
"results": [
{
"index": 0,
"document": "OAuth 2.0 使用 Authorization Code Flow...",
"relevance_score": 0.9832
},
{
"index": 2,
"document": "Bearer Token 在 Authorization Header 中...",
"relevance_score": 0.8741
}
],
"model": "baai/bge-reranker-v2-m3",
"usage": {
"total_tokens": 87
}
}
回應欄位
| 欄位 | 類型 | 說明 |
|---|---|---|
results[].index | number | 原始陣列的索引 |
results[].document | string | 文件內容 |
results[].relevance_score | number | 相關性分數,0.0 – 1.0 |
結果已按 relevance_score 由高到低排列。
可用的 Rerank 模型
| 模型 ID | 說明 |
|---|---|
baai/bge-reranker-v2-m3 | 多語言,中英文效果佳 |
cohere/rerank-v3.5 | 高精度,適合英文為主的場景 |
完整模型列表請參考 GET /v1/models?type=rerank。