← APIに戻る

Embed

ヘルスケア最適化エンベディング

医学用語を理解するセマンティックエンベディング。ヘルスケアクエリでOpenAI text-embedding-3比類似度精度+15%。

汎用エンベディングは医療クエリで失敗する

医療略語MI = 動機づけ面接?それとも心筋梗塞?
クエリ:"MI 治療ガイドライン"
Generic"動機づけ面接技法"
Persly"心筋梗塞緊急プロトコル"
ブランド名 → 成分名ブランド名には臨床的な文脈の解釈が必要
クエリ:"タイレノール過剰摂取の対処法"
Generic"鎮痛剤の種類案内"
Persly"アセトアミノフェン中毒:N-アセチルシステイン投与プロトコル"
緊急症状の組み合わせ症状の組み合わせは生命を脅かす状態を示唆
クエリ:"胸の痛みと呼吸困難"
Generic"一般的な胸の不快感の緩和法"
Persly"急性冠症候群と肺塞栓症の鑑別"

モデル仕様

次元数1536(デフォルト)、256-2048で調整可能
コンテキスト長32,000トークン
対応言語100以上の言語
学習データ102ヘルスケアドメイン + 1,000万件PubMed論文
レイテンシ (p95)120ms
バッチサイズリクエストあたり最大1,000テキスト

コード例

curl https://api.persly.ai/v1/embed \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "texts": [
      "What are the side effects of metformin?",
      "Metformin common adverse reactions include nausea..."
    ],
    "input_type": "document",
    "dimensions": 1536
  }'

エンベディング類似度ベンチマーク

医療QA類似度データセット

Persly Embed0.85
Voyage Large 20.78
OpenAI text-embedding-3-large0.74
Jina Embeddings v30.71

1,000件の医療質問と5,000件の候補回答。測定:正解回答とのコサイン類似度。

モデル平均コサイン類似度Recall@10コスト(100万トークンあたり)
Persly Embed0.8592%$0.50
Voyage Large 20.7885%$0.80
OpenAI text-embedding-3-large0.7481%$1.30
Jina Embeddings v30.7178%$0.40

* ヘルスケアQAデータセットでの内部テスト。価格見積もりは2026年時点。

ユースケース

ベクトル検索

医療文書、FAQ、ナレッジベースのセマンティック検索を構築

RAGコンテキスト検索

RAGパイプラインでLLMプロンプトに関連するコンテキストを検索

セマンティック重複排除

異なる表現の重複医療記録を検出

レコメンドシステム

類似の健康記事、治療法、リソースを推薦

FAQ

エンベディング次元を調整できますか?

はい。"dimensions"パラメータ(256-2048)を使用してください。低次元 = 高速検索、高次元 = 高精度。

どのベクトルデータベースに対応していますか?

すべてのベクトルDBに対応:Pinecone、LambdaDB、Weaviate、Qdrantなど。通常通りエンベディングを保存してクエリするだけです。

クエリタイプとドキュメントタイプの違いは何ですか?

検索クエリには「query」を、検索対象コンテンツには「document」を使用します。それぞれ異なる最適化が適用されます。

バッチ制限はありますか?

リクエストあたり最大1,000テキストまで。より大きなバッチの場合は、チャンクに分割してください。

Perslyで構築を始める準備はできましたか?

ヘルスケアAPIがどのようにお役に立てるかご相談ください