Embeddings Optimizados para Salud
Embeddings semánticos que entienden terminología médica. +15% de precisión en similitud vs OpenAI text-embedding-3 en consultas médicas.
| Dimensiones | 1536 (fijo) |
| Longitud de Contexto | 32,000 tokens |
| Idiomas Soportados | 100+ idiomas |
| Datos de Entrenamiento | 102 dominios de salud + 10M artículos de PubMed |
| Latencia (p95) | 120ms |
| Tamaño de Batch | Hasta 100 textos por solicitud |
curl https://api.persly.ai/v1/embeddings \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "persly-embed-v1",
"input": [
"What are the side effects of metformin?",
"Metformin common adverse reactions include nausea..."
],
"encoding_format": "float"
}'1,000 preguntas médicas con 5,000 respuestas candidatas. Medida: Similitud coseno con respuestas correctas.
| Modelo | Similitud Coseno Prom. | Recall@10 | Costo (por 1M tokens) |
|---|---|---|---|
| Persly Embed | 0.85 | 92% | $0.50 |
| Voyage Large 2 | 0.78 | 85% | $0.80 |
| OpenAI text-embedding-3-large | 0.74 | 81% | $1.30 |
| Jina Embeddings v3 | 0.71 | 78% | $0.40 |
* Pruebas internas en datasets de QA médico. Estimaciones de precios a 2026.
Construye búsqueda semántica sobre documentos médicos, FAQs, bases de conocimiento
Encuentra contexto relevante para prompts de LLM en pipelines RAG
Encuentra registros médicos duplicados con diferente redacción
Recomienda artículos de salud, tratamientos o recursos similares
No. "persly-embed-v1" siempre devuelve vectores de 1536 dimensiones.
Funciona con cualquier vector DB: Pinecone, LambdaDB, Weaviate, Qdrant, etc. Solo almacena los embeddings y consulta como siempre.
Usa "query" para consultas de búsqueda y "document" para contenido a buscar. Se aplican diferentes optimizaciones.
Hasta 100 textos por solicitud. Para lotes más grandes, divide en partes.
Hablemos de cómo nuestras APIs pueden impulsar tu producto de salud