| 维度 | 1536(默认),可调256-2048 |
| 上下文长度 | 32,000 tokens |
| 支持语言 | 100+语言 |
| 训练数据 | 102个医疗领域 + 1000万篇PubMed论文 |
| 延迟 (p95) | 120ms |
| 批量大小 | 每个请求最多1,000个文本 |
curl https://api.persly.ai/v1/embed \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"texts": [
"What are the side effects of metformin?",
"Metformin common adverse reactions include nausea..."
],
"input_type": "document",
"dimensions": 1536
}'1,000个医疗问题和5,000个候选答案。测量:与正确答案的余弦相似度。
| 模型 | 平均余弦相似度 | Recall@10 | 成本(每100万tokens) |
|---|---|---|---|
| Persly Embed | 0.85 | 92% | $0.50 |
| Voyage Large 2 | 0.78 | 85% | $0.80 |
| OpenAI text-embedding-3-large | 0.74 | 81% | $1.30 |
| Jina Embeddings v3 | 0.71 | 78% | $0.40 |
* 医疗QA数据集内部测试。价格估算截至2026年。
在医疗文档、FAQ、知识库上构建语义搜索
在RAG管道中为LLM提示找到相关上下文
查找不同表述的重复医疗记录
推荐类似的健康文章、治疗方法或资源
可以。使用"dimensions"参数(256-2048)。低维度 = 更快搜索,高维度 = 更高精度。
与任何向量数据库兼容:Pinecone、LambdaDB、Weaviate、Qdrant等。只需像往常一样存储嵌入并查询。
搜索查询使用"query",被搜索内容使用"document"。两者应用不同的优化。
每个请求最多1,000个文本。更大的批量请分块处理。
让我们探讨我们的API如何助力您的医疗产品