Embed

헬스케어 최적화 임베딩

의학 용어를 이해하는 시맨틱 임베딩. 헬스케어 쿼리에서 OpenAI text-embedding-3 대비 유사도 정확도 +15%.

팀과 상담하기 코드 예시 보기

일반 임베딩은 의료 쿼리에서 실패합니다

의료 약어MI = 동기 강화 면담? 아니면 심근경색?

쿼리:"MI 치료 가이드라인"

✗Generic→"동기 강화 면담 기법"

✓Persly→"심근경색 응급 프로토콜"

브랜드 → 성분명브랜드명은 임상적 맥락 해석이 필요합니다

쿼리:"타이레놀 과다복용 대처법"

✗Generic→"진통제 종류 안내"

✓Persly→"아세트아미노펜 독성: N-아세틸시스테인 프로토콜"

응급 증상 조합증상 조합은 생명을 위협하는 상황을 의미할 수 있습니다

쿼리:"가슴 통증과 호흡 곤란"

✗Generic→"일반 가슴 불편감 완화법"

✓Persly→"급성관상동맥증후군 vs 폐색전증 감별"

모델 사양

차원	1536 (고정)
컨텍스트 길이	32,000 토큰
지원 언어	100개 이상의 언어
학습 데이터	102개 헬스케어 도메인 + 1,000만 건 PubMed 논문
지연 시간 (p95)	120ms
배치 크기	요청당 최대 100개 텍스트

코드 예시

curl https://api.persly.ai/v1/embeddings \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "persly-embed-v1",
    "input": [
      "What are the side effects of metformin?",
      "Metformin common adverse reactions include nausea..."
    ],
    "encoding_format": "float"
  }'

임베딩 유사도 벤치마크

의료 QA 유사도 데이터셋

Persly Embed0.85

Voyage Large 20.78

OpenAI text-embedding-3-large0.74

Jina Embeddings v30.71

1,000개 의료 질문과 5,000개 후보 답변. 측정: 정답과의 코사인 유사도.

모델	평균 코사인 유사도	Recall@10	비용 (100만 토큰당)
Persly Embed	0.85	92%	$0.50
Voyage Large 2	0.78	85%	$0.80
OpenAI text-embedding-3-large	0.74	81%	$1.30
Jina Embeddings v3	0.71	78%	$0.40

* 헬스케어 QA 데이터셋에 대한 내부 테스트. 가격 추정치는 2026년 기준.

사용 사례

벡터 검색

의료 문서, FAQ, 지식 베이스에 대한 시맨틱 검색 구축

RAG 컨텍스트 검색

RAG 파이프라인에서 LLM 프롬프트를 위한 관련 컨텍스트 찾기

시맨틱 중복 제거

다른 표현으로 된 중복 의료 기록 찾기

FAQ

임베딩 차원을 조정할 수 있나요?

아니요. "persly-embed-v1"은 항상 1536차원 벡터를 반환합니다.

어떤 벡터 데이터베이스를 지원하나요?

모든 벡터 DB와 호환됩니다: Pinecone, LambdaDB, Weaviate, Qdrant 등. 임베딩을 저장하고 평소처럼 쿼리하세요.

쿼리 타입과 문서 타입의 차이점은 무엇인가요?

검색 쿼리에는 "query"를, 검색 대상 콘텐츠에는 "document"를 사용하세요. 각각 다른 최적화가 적용됩니다.

배치 제한이 있나요?

요청당 최대 100개 텍스트입니다. 더 큰 배치는 청크로 나누세요.

Persly와 함께 시작할 준비가 되셨나요?

헬스케어 API가 어떻게 도움이 될 수 있는지 함께 이야기해요