← Volver a APIs

Embed

Embeddings Optimizados para Salud

Embeddings semánticos que entienden terminología médica. +15% de precisión en similitud vs OpenAI text-embedding-3 en consultas médicas.

Los Embeddings Genéricos Fallan en Consultas Médicas

Abreviatura MédicaMI = ¿Entrevista Motivacional? ¿O Infarto de Miocardio?
Consulta:"Guías de tratamiento de MI"
Generic"Técnicas de entrevista motivacional"
Persly"Protocolo de emergencia para infarto de miocardio"
Marca → Nombre GenéricoLos nombres de marca requieren traducción de contexto clínico
Consulta:"Sobredosis de Tylenol qué hacer"
Generic"Opciones de medicamentos para el dolor"
Persly"Toxicidad por paracetamol: protocolo de N-acetilcisteína"
Combinación de Síntomas de EmergenciaLos pares de síntomas pueden señalar condiciones potencialmente mortales
Consulta:"dolor de pecho con dificultad para respirar"
Generic"Remedios para molestias torácicas"
Persly"Síndrome coronario agudo vs embolia pulmonar"

Especificaciones del Modelo

Dimensiones1536 (por defecto), ajustable 256-2048
Longitud de Contexto32,000 tokens
Idiomas Soportados100+ idiomas
Datos de Entrenamiento102 dominios de salud + 10M artículos de PubMed
Latencia (p95)120ms
Tamaño de BatchHasta 1,000 textos por solicitud

Ejemplo de Código

curl https://api.persly.ai/v1/embed \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "texts": [
      "What are the side effects of metformin?",
      "Metformin common adverse reactions include nausea..."
    ],
    "input_type": "document",
    "dimensions": 1536
  }'

Benchmarks de Similitud de Embeddings

Dataset de QA Médico - Similitud

Persly Embed0.85
Voyage Large 20.78
OpenAI text-embedding-3-large0.74
Jina Embeddings v30.71

1,000 preguntas médicas con 5,000 respuestas candidatas. Medida: Similitud coseno con respuestas correctas.

ModeloSimilitud Coseno Prom.Recall@10Costo (por 1M tokens)
Persly Embed0.8592%$0.50
Voyage Large 20.7885%$0.80
OpenAI text-embedding-3-large0.7481%$1.30
Jina Embeddings v30.7178%$0.40

* Pruebas internas en datasets de QA médico. Estimaciones de precios a 2026.

Casos de Uso

Búsqueda Vectorial

Construye búsqueda semántica sobre documentos médicos, FAQs, bases de conocimiento

Recuperación de Contexto RAG

Encuentra contexto relevante para prompts de LLM en pipelines RAG

Deduplicación Semántica

Encuentra registros médicos duplicados con diferente redacción

Sistemas de Recomendación

Recomienda artículos de salud, tratamientos o recursos similares

Preguntas Frecuentes

¿Puedo ajustar las dimensiones del embedding?

Sí. Usa el parámetro "dimensions" (256-2048). Menos dimensiones = búsqueda más rápida, más = mayor precisión.

¿Qué bases de datos vectoriales son soportadas?

Funciona con cualquier vector DB: Pinecone, LambdaDB, Weaviate, Qdrant, etc. Solo almacena los embeddings y consulta como siempre.

¿Cuál es la diferencia entre tipos query y document?

Usa "query" para consultas de búsqueda y "document" para contenido a buscar. Se aplican diferentes optimizaciones.

¿Hay un límite de lote?

Hasta 1,000 textos por solicitud. Para lotes más grandes, divide en partes.

¿Listo para Construir con Persly?

Hablemos de cómo nuestras APIs pueden impulsar tu producto de salud