similarity-search-patterns
유사도 검색 패턴 구현
빠른 의미론적 검색을 구축하는 것은 복잡하고 오류가 발생하기 쉽습니다. 이 스킬은 일반적인 벡터 데이터베이스와 하이브리드 검색 방법에 대한 검증된 템플릿을 제공합니다.
스킬 ZIP 다운로드
Claude에서 업로드
설정 → 기능 → 스킬 → 스킬 업로드로 이동
토글을 켜고 사용 시작
테스트해 보기
"similarity-search-patterns" 사용 중입니다. Qdrant으로 하이브리드 검색을 구현하는 방법 설명
예상 결과:
- 메타데이터에 대한 선택적 필터와 함께 밀집 벡터 쿼리를 사용하세요.
- payload 필드를 관리하여 희소 또는 키워드 신호를 추가하세요.
- limit 및 score threshold 매개변수를 조정하여 관련성을 균형있게 조정하세요.
- 대규모에서 메모리 효율성을 위해 양자화를 활성화하는 것을 고려하세요.
"similarity-search-patterns" 사용 중입니다. 1천만 개의 벡터에 어떤 인덱스 유형을 사용해야 하나요?
예상 결과:
- 이 규모에서 속도와 재현율의 균형을 위해 HNSW를 고려하세요.
- 지연 시간 요구 사항에 따라 ef_search를 100-500 사이로 구성하세요.
- 검색 매개변수 조정을 위해 재현율 메트릭을 모니터링하세요.
- 매우 큰 데이터셋의 경우 메모리 효율성을 위해 IVF+PQ를 평가하세요.
"similarity-search-patterns" 사용 중입니다. Pinecone reranking 패턴을 보여주세요
예상 결과:
- 벡터 검색을 사용하여 초기 결과를 과하게 가져옵니다(50-100개).
- 쿼리와 상위 결과를 cross-encoder로 전달하여 점수를 매깁니다.
- cross-encoder 점수로 최종 결과를 다시 정렬합니다.
- 관련성 요구 사항에 따라 최종 출력을 top_k로 제한합니다.
보안 감사
안전This skill contains only documentation and code templates for implementing vector search. No executable code, file access, or network operations are performed by the skill itself. The static analyzer detected patterns in documentation examples and mathematical formulas that triggered false positive security alerts. All detected 'network', 'external_commands', and 'env_access' patterns are documentation artifacts, not actual malicious code.
위험 요인
🌐 네트워크 접근 (8)
⚙️ 외부 명령어 (9)
🔑 환경 변수 (3)
품질 점수
만들 수 있는 것
벡터 검색 API 추가
Pinecone, Qdrant, pgvector 또는 Weaviate를 사용하여 벡터 검색 계층을 구축합니다.
검색 인덱싱 확장
대규모 유사도 검색 워크로드에 대한 인덱스 유형과 매개변수를 선택합니다.
RAG 품질 개선
검색 증강 생성에서 관련성을 높이기 위해 하이브리드 검색과 reranking을 구현합니다.
이 프롬프트를 사용해 보세요
5백만 개의 벡터에 대해 지연 시간 100ms 미만의 인덱스 유형을 추천하고 트레이드오프를 설명하세요.
upsert 및 검색 메서드가 포함된 Pinecone 벡터 저장소 클래스를 작성하고 필요한 매개변수를 설명하세요.
벡터 유사도와 전체 텍스트 검색을 가중치 제어와 결합한 pgvector 하이브리드 검색 쿼리를 보여주세요.
벡터 검색 후 cross-encoder를 사용하여 reranking 단계를 추가하고 흐름을 설명하세요.
모범 사례
- 인덱스 매개변수 튜닝 전에 재현율과 지연 시간을 측정하세요
- 모호한 쿼리에 대해 더 나은 관련성을 위해 하이브리드 검색을 사용하세요
- API 오버헤드와 운영 비용을 줄이기 위해 배치 upsert를 사용하세요
피하기
- 평가 건너뛰고 기본 매개변수만 의존
- 작은 데이터셋에 과도한 인덱싱 - 플랫 검색이 충분한 경우
- 검색 공간을 줄일 수 있는 메타데이터 필터 무시