← 返回API

Embed

医疗优化嵌入

理解医学术语的语义嵌入。医疗查询相比OpenAI text-embedding-3相似度准确性+15%。

通用嵌入在医疗查询上失效

医学缩写MI = 动机性访谈?还是心肌梗死?
查询:"MI 治疗指南"
Generic"动机性访谈技术"
Persly"心肌梗死急救方案"
品牌→通用名品牌名称需要临床语境解读
查询:"泰诺过量服用怎么办"
Generic"止痛药种类介绍"
Persly"对乙酰氨基酚中毒:N-乙酰半胱氨酸方案"
紧急症状组合症状组合可能预示危及生命的情况
查询:"胸痛伴呼吸困难"
Generic"一般胸部不适缓解方法"
Persly"急性冠脉综合征与肺栓塞鉴别"

模型规格

维度1536(默认),可调256-2048
上下文长度32,000 tokens
支持语言100+语言
训练数据102个医疗领域 + 1000万篇PubMed论文
延迟 (p95)120ms
批量大小每个请求最多1,000个文本

代码示例

curl https://api.persly.ai/v1/embed \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "texts": [
      "What are the side effects of metformin?",
      "Metformin common adverse reactions include nausea..."
    ],
    "input_type": "document",
    "dimensions": 1536
  }'

嵌入相似度基准

医疗QA相似度数据集

Persly Embed0.85
Voyage Large 20.78
OpenAI text-embedding-3-large0.74
Jina Embeddings v30.71

1,000个医疗问题和5,000个候选答案。测量:与正确答案的余弦相似度。

模型平均余弦相似度Recall@10成本(每100万tokens)
Persly Embed0.8592%$0.50
Voyage Large 20.7885%$0.80
OpenAI text-embedding-3-large0.7481%$1.30
Jina Embeddings v30.7178%$0.40

* 医疗QA数据集内部测试。价格估算截至2026年。

使用场景

向量搜索

在医疗文档、FAQ、知识库上构建语义搜索

RAG上下文检索

在RAG管道中为LLM提示找到相关上下文

语义去重

查找不同表述的重复医疗记录

推荐系统

推荐类似的健康文章、治疗方法或资源

FAQ

可以调整嵌入维度吗?

可以。使用"dimensions"参数(256-2048)。低维度 = 更快搜索,高维度 = 更高精度。

支持哪些向量数据库?

与任何向量数据库兼容:Pinecone、LambdaDB、Weaviate、Qdrant等。只需像往常一样存储嵌入并查询。

query类型和document类型有什么区别?

搜索查询使用"query",被搜索内容使用"document"。两者应用不同的优化。

有批量限制吗?

每个请求最多1,000个文本。更大的批量请分块处理。

准备好使用Persly构建了吗?

让我们探讨我们的API如何助力您的医疗产品