| 차원 | 1536 (기본), 256-2048 조정 가능 |
| 컨텍스트 길이 | 32,000 토큰 |
| 지원 언어 | 100개 이상의 언어 |
| 학습 데이터 | 102개 헬스케어 도메인 + 1,000만 건 PubMed 논문 |
| 지연 시간 (p95) | 120ms |
| 배치 크기 | 요청당 최대 1,000개 텍스트 |
curl https://api.persly.ai/v1/embed \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"texts": [
"What are the side effects of metformin?",
"Metformin common adverse reactions include nausea..."
],
"input_type": "document",
"dimensions": 1536
}'1,000개 의료 질문과 5,000개 후보 답변. 측정: 정답과의 코사인 유사도.
| 모델 | 평균 코사인 유사도 | Recall@10 | 비용 (100만 토큰당) |
|---|---|---|---|
| Persly Embed | 0.85 | 92% | $0.50 |
| Voyage Large 2 | 0.78 | 85% | $0.80 |
| OpenAI text-embedding-3-large | 0.74 | 81% | $1.30 |
| Jina Embeddings v3 | 0.71 | 78% | $0.40 |
* 헬스케어 QA 데이터셋에 대한 내부 테스트. 가격 추정치는 2026년 기준.
의료 문서, FAQ, 지식 베이스에 대한 시맨틱 검색 구축
RAG 파이프라인에서 LLM 프롬프트를 위한 관련 컨텍스트 찾기
다른 표현으로 된 중복 의료 기록 찾기
유사한 건강 기사, 치료법 또는 리소스 추천
네. "dimensions" 파라미터(256-2048)를 사용하세요. 낮은 차원 = 빠른 검색, 높은 차원 = 더 높은 정확도.
모든 벡터 DB와 호환됩니다: Pinecone, LambdaDB, Weaviate, Qdrant 등. 임베딩을 저장하고 평소처럼 쿼리하세요.
검색 쿼리에는 "query"를, 검색 대상 콘텐츠에는 "document"를 사용하세요. 각각 다른 최적화가 적용됩니다.
요청당 최대 1,000개 텍스트입니다. 더 큰 배치는 청크로 나누세요.
헬스케어 API가 어떻게 도움이 될 수 있는지 함께 이야기해요