Reranker Médico de Clase Mundial
Maximiza la relevancia de búsqueda y la precisión de RAG para consultas médicas. Supera a Jina, Cohere y Vertex AI en benchmarks médicos.
Entrenado con 102 fuentes de salud + 10M de artículos de PubMed:
Tu app recupera 100 documentos usando embeddings o BM25
Persly Rerank analiza pares consulta-documento conjuntamente (no independientemente como embeddings)
Devuelve los top_k documentos más relevantes con puntuaciones 0-1
A diferencia de embeddings (codifican por separado), cross-attention codifica consulta + documento juntos, capturando relaciones semánticas detalladas. Esto es crucial para consultas médicas con terminología compleja.
curl https://api.persly.ai/v1/rerank \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"query": "What are the side effects of metformin for diabetes?",
"documents": [
"Metformin is a first-line medication for type 2 diabetes...",
"Common side effects include nausea, diarrhea, and stomach upset...",
"SGLT2 inhibitors are an alternative class of diabetes medications..."
],
"top_k": 6
}'| Modelo | NDCG@10 | Recall@10 | Latencia (p95) |
|---|---|---|---|
| Persly Rerank | 0.68 | 91% | 185ms |
| Cohere Rerank 4 | 0.63 | 86% | 195ms |
| Jina Reranker v3 | 0.61 | 84% | 210ms |
| Vertex AI Ranking | 0.59 | 79% | 240ms |
* Benchmarks de pruebas internas en datasets de QA médico. Contáctanos para metodología y datasets detallados.
Aumenta la precisión de RAG en 40%+ con selección precisa de documentos
Rerank resultados de BM25/embedding para máxima relevancia
Encuentra el párrafo exacto que responde preguntas médicas
Clasifica documentos médicos por relevancia a temas específicos
Usa Rerank después de embeddings cuando la precisión importa más que la velocidad. Mejora NDCG@10 en ~15% pero añade ~50ms de latencia.
Hasta 1,000 documentos por solicitud. Para mejor rendimiento, rerank los top 100-200 de tu búsqueda inicial.
Sí. Soporta 100+ idiomas con coincidencia cross-lingual (ej: consulta en coreano → documentos en inglés).
Las puntuaciones van de 0 a 1, representando la probabilidad de que un documento sea relevante para la consulta. Mayor es mejor.
Hablemos de cómo nuestras APIs pueden impulsar tu producto de salud