Embeddings Optimizados para Salud
Embeddings semánticos que entienden terminología médica. +15% de precisión en similitud vs OpenAI text-embedding-3 en consultas médicas.
| Dimensiones | 1536 (por defecto), ajustable 256-2048 |
| Longitud de Contexto | 32,000 tokens |
| Idiomas Soportados | 100+ idiomas |
| Datos de Entrenamiento | 102 dominios de salud + 10M artículos de PubMed |
| Latencia (p95) | 120ms |
| Tamaño de Batch | Hasta 1,000 textos por solicitud |
curl https://api.persly.ai/v1/embed \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"texts": [
"What are the side effects of metformin?",
"Metformin common adverse reactions include nausea..."
],
"input_type": "document",
"dimensions": 1536
}'1,000 preguntas médicas con 5,000 respuestas candidatas. Medida: Similitud coseno con respuestas correctas.
| Modelo | Similitud Coseno Prom. | Recall@10 | Costo (por 1M tokens) |
|---|---|---|---|
| Persly Embed | 0.85 | 92% | $0.50 |
| Voyage Large 2 | 0.78 | 85% | $0.80 |
| OpenAI text-embedding-3-large | 0.74 | 81% | $1.30 |
| Jina Embeddings v3 | 0.71 | 78% | $0.40 |
* Pruebas internas en datasets de QA médico. Estimaciones de precios a 2026.
Construye búsqueda semántica sobre documentos médicos, FAQs, bases de conocimiento
Encuentra contexto relevante para prompts de LLM en pipelines RAG
Encuentra registros médicos duplicados con diferente redacción
Recomienda artículos de salud, tratamientos o recursos similares
Sí. Usa el parámetro "dimensions" (256-2048). Menos dimensiones = búsqueda más rápida, más = mayor precisión.
Funciona con cualquier vector DB: Pinecone, LambdaDB, Weaviate, Qdrant, etc. Solo almacena los embeddings y consulta como siempre.
Usa "query" para consultas de búsqueda y "document" para contenido a buscar. Se aplican diferentes optimizaciones.
Hasta 1,000 textos por solicitud. Para lotes más grandes, divide en partes.
Hablemos de cómo nuestras APIs pueden impulsar tu producto de salud