← 返回API

Rerank

世界级医疗重排序器

最大化医疗查询的搜索相关性和RAG准确性。在医疗基准测试中超越Jina、Cohere和Vertex AI。

通用重排序器的问题

通用重排序器的问题

  • "Metformin"与"メトホルミン"(日语)无法匹配
  • "Diabetes mellitus type 2"与"糖尿病"上下文丢失
  • 由于缺乏医学知识而遗漏药物相互作用
  • 医学缩写无法识别(HTN、DM、COPD)

Persly Rerank解决方案

基于102个医疗来源 + 1000万篇PubMed论文训练:

  • 理解医学同义词和多语言术语
  • 查询-文档对的交叉注意力
  • 医疗QA数据集NDCG@10 +42%
  • 识别药物名称、疾病和手术

Rerank工作原理

1

初始搜索

您的应用使用嵌入或BM25检索100个文档

2

交叉注意力分析

Persly Rerank联合分析查询-文档对(不像嵌入那样独立分析)

3

精准排序

返回分数0-1的前top_k个最相关文档

为什么使用交叉注意力?

与嵌入(分别编码)不同,交叉注意力将查询+文档一起编码,捕获细粒度的语义关系。这对于包含复杂术语的医疗查询至关重要。

代码示例

curl https://api.persly.ai/v1/rerank \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "query": "What are the side effects of metformin for diabetes?",
    "documents": [
      "Metformin is a first-line medication for type 2 diabetes...",
      "Common side effects include nausea, diarrhea, and stomach upset...",
      "SGLT2 inhibitors are an alternative class of diabetes medications..."
    ],
    "top_k": 6
  }'

医疗重排序基准

BEIR Medical Subset (NDCG@10)

Persly Rerank0.68
Cohere Rerank 40.63
Jina Reranker v30.61
Vertex AI Ranking0.59

Medical QA数据集对比

模型NDCG@10Recall@10延迟 (p95)
Persly Rerank0.6891%185ms
Cohere Rerank 40.6386%195ms
Jina Reranker v30.6184%210ms
Vertex AI Ranking0.5979%240ms

* 基于医疗QA数据集内部测试的基准。详细方法论和数据集请联系我们。

使用场景

RAG管道

通过精准文档选择将RAG准确性提升40%+

医疗搜索引擎

重排序BM25/嵌入结果以获得最大相关性

问答系统

找到回答医疗问题的精确段落

文档分类

根据与特定主题的相关性对医疗文档进行分类

FAQ

什么时候应该使用Rerank而不是只用嵌入?

当精度比速度重要时,在嵌入后使用Rerank。它可以将NDCG@10提高约15%,但增加约50ms延迟。

可以重排序的最大文档数是多少?

每个请求最多1,000个文档。为获得最佳性能,从初始搜索中重排序前100-200个。

Rerank支持多语言吗?

是的。支持100+语言,具有跨语言匹配功能(如:韩语查询→英语文档)。

相关性分数是如何计算的?

分数范围从0到1,表示文档与查询相关的概率。越高越好。

准备好使用Persly构建了吗?

让我们探讨我们的API如何助力您的医疗产品