← Volver a APIs

Rerank

Reranker Médico de Clase Mundial

Maximiza la relevancia de búsqueda y la precisión de RAG para consultas médicas. Supera a Jina, Cohere y Vertex AI en benchmarks médicos.

El Problema con los Rerankers Genéricos

El Problema con los Rerankers Genéricos

  • "Metformin" vs "メトホルミン" (japonés) no coincide
  • "Diabetes mellitus tipo 2" vs "糖尿病" pierde contexto
  • Interacciones de medicamentos perdidas por falta de conocimiento médico
  • Abreviaturas médicas no reconocidas (HTN, DM, COPD)

Solución Persly Rerank

Entrenado con 102 fuentes de salud + 10M de artículos de PubMed:

  • Entiende sinónimos médicos y términos multilingües
  • Cross-attention sobre pares consulta-documento
  • +42% NDCG@10 en datasets de QA médico
  • Reconoce nombres de medicamentos, condiciones y procedimientos

Cómo Funciona Rerank

1

Búsqueda Inicial

Tu app recupera 100 documentos usando embeddings o BM25

2

Análisis Cross-Attention

Persly Rerank analiza pares consulta-documento conjuntamente (no independientemente como embeddings)

3

Ranking de Precisión

Devuelve los top_k documentos más relevantes con puntuaciones 0-1

¿Por Qué Cross-Attention?

A diferencia de embeddings (codifican por separado), cross-attention codifica consulta + documento juntos, capturando relaciones semánticas detalladas. Esto es crucial para consultas médicas con terminología compleja.

Ejemplo de Código

curl https://api.persly.ai/v1/rerank \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "query": "What are the side effects of metformin for diabetes?",
    "documents": [
      "Metformin is a first-line medication for type 2 diabetes...",
      "Common side effects include nausea, diarrhea, and stomach upset...",
      "SGLT2 inhibitors are an alternative class of diabetes medications..."
    ],
    "top_k": 6
  }'

Benchmarks de Reranking Médico

Subconjunto Médico BEIR (NDCG@10)

Persly Rerank0.68
Cohere Rerank 40.63
Jina Reranker v30.61
Vertex AI Ranking0.59

Comparación de Dataset de QA Médico

ModeloNDCG@10Recall@10Latencia (p95)
Persly Rerank0.6891%185ms
Cohere Rerank 40.6386%195ms
Jina Reranker v30.6184%210ms
Vertex AI Ranking0.5979%240ms

* Benchmarks de pruebas internas en datasets de QA médico. Contáctanos para metodología y datasets detallados.

Casos de Uso

Pipelines RAG

Aumenta la precisión de RAG en 40%+ con selección precisa de documentos

Motores de Búsqueda Médica

Rerank resultados de BM25/embedding para máxima relevancia

Respuesta a Preguntas

Encuentra el párrafo exacto que responde preguntas médicas

Clasificación de Documentos

Clasifica documentos médicos por relevancia a temas específicos

Preguntas Frecuentes

¿Cuándo debo usar Rerank vs solo Embeddings?

Usa Rerank después de embeddings cuando la precisión importa más que la velocidad. Mejora NDCG@10 en ~15% pero añade ~50ms de latencia.

¿Cuál es el número máximo de documentos que puedo rerank?

Hasta 1,000 documentos por solicitud. Para mejor rendimiento, rerank los top 100-200 de tu búsqueda inicial.

¿Rerank es multilingüe?

Sí. Soporta 100+ idiomas con coincidencia cross-lingual (ej: consulta en coreano → documentos en inglés).

¿Cómo se calcula la puntuación de relevancia?

Las puntuaciones van de 0 a 1, representando la probabilidad de que un documento sea relevante para la consulta. Mayor es mejor.

¿Listo para Construir con Persly?

Hablemos de cómo nuestras APIs pueden impulsar tu producto de salud