Embed

ヘルスケア最適化エンベディング

医学用語を理解するセマンティックエンベディング。ヘルスケアクエリでOpenAI text-embedding-3比類似度精度+15%。

チームに相談するコード例を見る

汎用エンベディングは医療クエリで失敗する

医療略語MI = 動機づけ面接？それとも心筋梗塞？

クエリ:"MI 治療ガイドライン"

✗Generic→"動機づけ面接技法"

✓Persly→"心筋梗塞緊急プロトコル"

ブランド名 → 成分名ブランド名には臨床的な文脈の解釈が必要

クエリ:"タイレノール過剰摂取の対処法"

✗Generic→"鎮痛剤の種類案内"

✓Persly→"アセトアミノフェン中毒：N-アセチルシステイン投与プロトコル"

緊急症状の組み合わせ症状の組み合わせは生命を脅かす状態を示唆

クエリ:"胸の痛みと呼吸困難"

✗Generic→"一般的な胸の不快感の緩和法"

✓Persly→"急性冠症候群と肺塞栓症の鑑別"

モデル仕様

次元数	1536（固定）
コンテキスト長	32,000トークン
対応言語	100以上の言語
学習データ	102ヘルスケアドメイン + 1,000万件PubMed論文
レイテンシ (p95)	120ms
バッチサイズ	リクエストあたり最大100テキスト

コード例

curl https://api.persly.ai/v1/embeddings \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "persly-embed-v1",
    "input": [
      "What are the side effects of metformin?",
      "Metformin common adverse reactions include nausea..."
    ],
    "encoding_format": "float"
  }'

エンベディング類似度ベンチマーク

医療QA類似度データセット

Persly Embed0.85

Voyage Large 20.78

OpenAI text-embedding-3-large0.74

Jina Embeddings v30.71

1,000件の医療質問と5,000件の候補回答。測定：正解回答とのコサイン類似度。

モデル	平均コサイン類似度	Recall@10	コスト（100万トークンあたり）
Persly Embed	0.85	92%	$0.50
Voyage Large 2	0.78	85%	$0.80
OpenAI text-embedding-3-large	0.74	81%	$1.30
Jina Embeddings v3	0.71	78%	$0.40

* ヘルスケアQAデータセットでの内部テスト。価格見積もりは2026年時点。

ユースケース

ベクトル検索

医療文書、FAQ、ナレッジベースのセマンティック検索を構築

RAGコンテキスト検索

RAGパイプラインでLLMプロンプトに関連するコンテキストを検索

セマンティック重複排除

異なる表現の重複医療記録を検出

レコメンドシステム

類似の健康記事、治療法、リソースを推薦

FAQ

エンベディング次元を調整できますか？

いいえ。"persly-embed-v1" は常に1536次元ベクトルを返します。

どのベクトルデータベースに対応していますか？

すべてのベクトルDBに対応：Pinecone、LambdaDB、Weaviate、Qdrantなど。通常通りエンベディングを保存してクエリするだけです。

クエリタイプとドキュメントタイプの違いは何ですか？

検索クエリには「query」を、検索対象コンテンツには「document」を使用します。それぞれ異なる最適化が適用されます。

バッチ制限はありますか？

リクエストあたり最大100テキストまで。より大きなバッチの場合は、チャンクに分割してください。

Perslyで構築を始める準備はできましたか？

ヘルスケアAPIがどのようにお役に立てるかご相談ください