| 次元数 | 1536(デフォルト)、256-2048で調整可能 |
| コンテキスト長 | 32,000トークン |
| 対応言語 | 100以上の言語 |
| 学習データ | 102ヘルスケアドメイン + 1,000万件PubMed論文 |
| レイテンシ (p95) | 120ms |
| バッチサイズ | リクエストあたり最大1,000テキスト |
curl https://api.persly.ai/v1/embed \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"texts": [
"What are the side effects of metformin?",
"Metformin common adverse reactions include nausea..."
],
"input_type": "document",
"dimensions": 1536
}'1,000件の医療質問と5,000件の候補回答。測定:正解回答とのコサイン類似度。
| モデル | 平均コサイン類似度 | Recall@10 | コスト(100万トークンあたり) |
|---|---|---|---|
| Persly Embed | 0.85 | 92% | $0.50 |
| Voyage Large 2 | 0.78 | 85% | $0.80 |
| OpenAI text-embedding-3-large | 0.74 | 81% | $1.30 |
| Jina Embeddings v3 | 0.71 | 78% | $0.40 |
* ヘルスケアQAデータセットでの内部テスト。価格見積もりは2026年時点。
医療文書、FAQ、ナレッジベースのセマンティック検索を構築
RAGパイプラインでLLMプロンプトに関連するコンテキストを検索
異なる表現の重複医療記録を検出
類似の健康記事、治療法、リソースを推薦
はい。"dimensions"パラメータ(256-2048)を使用してください。低次元 = 高速検索、高次元 = 高精度。
すべてのベクトルDBに対応:Pinecone、LambdaDB、Weaviate、Qdrantなど。通常通りエンベディングを保存してクエリするだけです。
検索クエリには「query」を、検索対象コンテンツには「document」を使用します。それぞれ異なる最適化が適用されます。
リクエストあたり最大1,000テキストまで。より大きなバッチの場合は、チャンクに分割してください。
ヘルスケアAPIがどのようにお役に立てるかご相談ください