Embed

医疗优化嵌入

理解医学术语的语义嵌入。医疗查询相比OpenAI text-embedding-3相似度准确性+15%。

联系我们团队查看代码示例

通用嵌入在医疗查询上失效

医学缩写MI = 动机性访谈？还是心肌梗死？

查询:"MI 治疗指南"

✗Generic→"动机性访谈技术"

✓Persly→"心肌梗死急救方案"

品牌→通用名品牌名称需要临床语境解读

查询:"泰诺过量服用怎么办"

✗Generic→"止痛药种类介绍"

✓Persly→"对乙酰氨基酚中毒：N-乙酰半胱氨酸方案"

紧急症状组合症状组合可能预示危及生命的情况

查询:"胸痛伴呼吸困难"

✗Generic→"一般胸部不适缓解方法"

✓Persly→"急性冠脉综合征与肺栓塞鉴别"

模型规格

维度	1536（固定）
上下文长度	32,000 tokens
支持语言	100+语言
训练数据	102个医疗领域 + 1000万篇PubMed论文
延迟 (p95)	120ms
批量大小	每个请求最多100个文本

代码示例

curl https://api.persly.ai/v1/embeddings \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "persly-embed-v1",
    "input": [
      "What are the side effects of metformin?",
      "Metformin common adverse reactions include nausea..."
    ],
    "encoding_format": "float"
  }'

嵌入相似度基准

医疗QA相似度数据集

Persly Embed0.85

Voyage Large 20.78

OpenAI text-embedding-3-large0.74

Jina Embeddings v30.71

1,000个医疗问题和5,000个候选答案。测量：与正确答案的余弦相似度。

模型	平均余弦相似度	Recall@10	成本（每100万tokens）
Persly Embed	0.85	92%	$0.50
Voyage Large 2	0.78	85%	$0.80
OpenAI text-embedding-3-large	0.74	81%	$1.30
Jina Embeddings v3	0.71	78%	$0.40

* 医疗QA数据集内部测试。价格估算截至2026年。

使用场景

向量搜索

在医疗文档、FAQ、知识库上构建语义搜索

RAG上下文检索

在RAG管道中为LLM提示找到相关上下文

语义去重

查找不同表述的重复医疗记录

FAQ

可以调整嵌入维度吗？

不可以。"persly-embed-v1" 始终返回1536维向量。

支持哪些向量数据库？

与任何向量数据库兼容：Pinecone、LambdaDB、Weaviate、Qdrant等。只需像往常一样存储嵌入并查询。

query类型和document类型有什么区别？

搜索查询使用"query"，被搜索内容使用"document"。两者应用不同的优化。

有批量限制吗？

每个请求最多100个文本。更大的批量请分块处理。

准备好使用Persly构建了吗？

让我们探讨我们的API如何助力您的医疗产品