跳至主要内容

Rerank

POST /v1/rerank

對候選文件列表依據與查詢的相關性重新排序。常用於 RAG Pipeline 的精排步驟。

Rerank 是什麼? 在 RAG 中,第一步通常用向量搜尋找出 Top-N 候選文件,但向量相似度不總是能精準反映相關性。Rerank 模型會更仔細地評估每個文件與查詢的相關程度,重新排序後只把最相關的幾篇送給 LLM。

請求

POST /v1/rerank
Authorization: Bearer sk-your-api-key
Content-Type: application/json
{
"model": "baai/bge-reranker-v2-m3",
"query": "OAuth 2.0 認證流程",
"documents": [
"OAuth 2.0 使用 Authorization Code Flow...",
"今天天氣不錯,適合出門",
"Bearer Token 在 Authorization Header 中..."
],
"top_n": 2
}

請求欄位

欄位類型必填說明
modelstringRerank 模型 ID
querystring搜尋查詢
documentsstring[]候選文件列表
top_nnumber回傳排名前 N 筆,不填則回傳全部

回應

{
"results": [
{
"index": 0,
"document": "OAuth 2.0 使用 Authorization Code Flow...",
"relevance_score": 0.9832
},
{
"index": 2,
"document": "Bearer Token 在 Authorization Header 中...",
"relevance_score": 0.8741
}
],
"model": "baai/bge-reranker-v2-m3",
"usage": {
"total_tokens": 87
}
}

回應欄位

欄位類型說明
results[].indexnumber原始陣列的索引
results[].documentstring文件內容
results[].relevance_scorenumber相關性分數,0.0 – 1.0

結果已按 relevance_score 由高到低排列。

可用的 Rerank 模型

模型 ID說明
baai/bge-reranker-v2-m3多語言,中英文效果佳
cohere/rerank-v3.5高精度,適合英文為主的場景

完整模型列表請參考 GET /v1/models?type=rerank