세계 최고 수준의 의료 리랭커
헬스케어 쿼리의 검색 관련성과 RAG 정확도를 극대화합니다. 의료 벤치마크에서 Jina, Cohere, Vertex AI를 능가합니다.
102개 헬스케어 소스 + 1,000만 건 PubMed 논문으로 학습:
앱이 임베딩 또는 BM25를 사용하여 100개 문서 검색
Persly Rerank가 쿼리-문서 쌍을 함께 분석 (임베딩처럼 독립적이지 않음)
0-1 점수와 함께 상위 top_k개 가장 관련성 높은 문서 반환
임베딩(별도로 인코딩)과 달리, 교차 어텐션은 쿼리 + 문서를 함께 인코딩하여 세밀한 의미 관계를 포착합니다. 이는 복잡한 용어가 포함된 의료 쿼리에 필수적입니다.
curl https://api.persly.ai/v1/rerank \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"query": "What are the side effects of metformin for diabetes?",
"documents": [
"Metformin is a first-line medication for type 2 diabetes...",
"Common side effects include nausea, diarrhea, and stomach upset...",
"SGLT2 inhibitors are an alternative class of diabetes medications..."
],
"top_k": 6
}'| 모델 | NDCG@10 | Recall@10 | 지연 시간 (p95) |
|---|---|---|---|
| Persly Rerank | 0.68 | 91% | 185ms |
| Cohere Rerank 4 | 0.63 | 86% | 195ms |
| Jina Reranker v3 | 0.61 | 84% | 210ms |
| Vertex AI Ranking | 0.59 | 79% | 240ms |
* 헬스케어 QA 데이터셋에 대한 내부 테스트 결과. 자세한 방법론과 데이터셋은 문의해 주세요.
정밀한 문서 선택으로 RAG 정확도 40% 이상 향상
BM25/임베딩 결과를 리랭킹하여 최대 관련성 확보
의료 질문에 답하는 정확한 문단 찾기
특정 주제와의 관련성으로 의료 문서 분류
속도보다 정밀도가 중요할 때 임베딩 후 Rerank를 사용하세요. NDCG@10을 약 15% 향상시키지만 약 50ms의 지연이 추가됩니다.
요청당 최대 1,000개 문서입니다. 최상의 성능을 위해 초기 검색에서 상위 100-200개를 리랭킹하세요.
네. 100개 이상의 언어를 지원하며 교차 언어 매칭(예: 한국어 쿼리 → 영어 문서)이 가능합니다.
점수는 0에서 1 사이로, 문서가 쿼리에 관련될 확률을 나타냅니다. 높을수록 좋습니다.
헬스케어 API가 어떻게 도움이 될 수 있는지 함께 이야기해요