基于102个医疗来源 + 1000万篇PubMed论文训练:
您的应用使用嵌入或BM25检索100个文档
Persly Rerank联合分析查询-文档对(不像嵌入那样独立分析)
返回分数0-1的前top_k个最相关文档
与嵌入(分别编码)不同,交叉注意力将查询+文档一起编码,捕获细粒度的语义关系。这对于包含复杂术语的医疗查询至关重要。
curl https://api.persly.ai/v1/rerank \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"query": "What are the side effects of metformin for diabetes?",
"documents": [
"Metformin is a first-line medication for type 2 diabetes...",
"Common side effects include nausea, diarrhea, and stomach upset...",
"SGLT2 inhibitors are an alternative class of diabetes medications..."
],
"top_k": 6
}'| 模型 | NDCG@10 | Recall@10 | 延迟 (p95) |
|---|---|---|---|
| Persly Rerank | 0.68 | 91% | 185ms |
| Cohere Rerank 4 | 0.63 | 86% | 195ms |
| Jina Reranker v3 | 0.61 | 84% | 210ms |
| Vertex AI Ranking | 0.59 | 79% | 240ms |
* 基于医疗QA数据集内部测试的基准。详细方法论和数据集请联系我们。
通过精准文档选择将RAG准确性提升40%+
重排序BM25/嵌入结果以获得最大相关性
找到回答医疗问题的精确段落
根据与特定主题的相关性对医疗文档进行分类
当精度比速度重要时,在嵌入后使用Rerank。它可以将NDCG@10提高约15%,但增加约50ms延迟。
每个请求最多1,000个文档。为获得最佳性能,从初始搜索中重排序前100-200个。
是的。支持100+语言,具有跨语言匹配功能(如:韩语查询→英语文档)。
分数范围从0到1,表示文档与查询相关的概率。越高越好。
让我们探讨我们的API如何助力您的医疗产品