스킬 vector-index-tuning
🔍

vector-index-tuning

안전 🌐 네트워크 접근

속도와 재현율을 위한 벡터 인덱스 튜닝 최적화

벡터 검색이 잘못 구성된 인덱스로 인해 느리거나 비용이 많이드는 경우, 이 스킬은 지연 시간, 재현율 및 메모리 사용을 개선하기 위한 HNSW 및 양자화 전략에 대한 튜닝 템플릿과 휴리스틱을 제공합니다.

지원: Claude Codex Code(CC)
📊 70 적절함
1

스킬 ZIP 다운로드

2

Claude에서 업로드

설정 → 기능 → 스킬 → 스킬 업로드로 이동

3

토글을 켜고 사용 시작

테스트해 보기

"vector-index-tuning" 사용 중입니다. 1M 벡터에 대해 0.95 재현율과 10ms 미만의 지연 시간을 목표로 하는 HNSW 파라미터를 추천하세요.

예상 결과:

  • 빌드 품질을 위해 M: 32, efConstruction: 200 추천
  • 0.95 재현율을 목표로 efSearch를 128로 설정
  • M이 32일 때의 메모리 오버헤드를 추정하고 소규모 벤치마크로 검증

"vector-index-tuning" 사용 중입니다. FP32에서 INT8 양자화로 전환하면 얼마나 메모리를 절약할 수 있나요?

예상 결과:

  • FP32는 차원당 4바이트, INT8은 차원당 1바이트를 사용
  • 768 차원 벡터의 경우: FP32 = 3KB, INT8 = 벡터당 768바이트
  • 약 75% 메모리 감소로 약간의 재현율 영향

"vector-index-tuning" 사용 중입니다. 50M 벡터에 대해 IVF와 HNSW 중 어떤 것을 선택해야 하나요?

예상 결과:

  • HNSW: 메모리와 빌드 시간 비용으로 더 나은 재현율
  • IVF: 더 적은 메모리, 더 빠른 빌드, 약간 낮은 재현율
  • 메모리가 제한된 50M+ 벡터의 경우 하이브리드 IVF-PQ 고려

보안 감사

안전
v4 • 1/17/2026

Pure documentation skill with instructional Python templates for vector index tuning. All static findings are false positives: hardcoded URLs are documentation references, weak crypto patterns matched legitimate quantization terminology, backticks are markdown formatting, and memory-mapped references are Qdrant config parameters.

2
스캔된 파일
723
분석된 줄 수
1
발견 사항
4
총 감사 수

위험 요인

🌐 네트워크 접근 (1)
감사자: claude 감사 이력 보기 →

품질 점수

38
아키텍처
100
유지보수성
85
콘텐츠
30
커뮤니티
100
보안
87
사양 준수

만들 수 있는 것

재현율을 위한 ANN 튜닝

지연 시간 예산을 초과하지 않으면서 재현율 목표를 충족하는 HNSW 설정을 찾습니다.

메모리 사용량 감소

양자화 옵션을 평가하고 규모에 따른 저장소 트레이드오프를 추정합니다.

인덱스 스케일링 계획

수백만에서 수십억 개의 벡터를 위한 인덱스 유형과 구성을 선택합니다.

이 프롬프트를 사용해 보세요

빠른 HNSW 스윕
0.95 재현율을 목표로 200k 벡터에 대한 HNSW M과 efSearch를 벤치마킹합니다. 가장 균형 잡힌 구성을 추천하세요.
양자화 선택
768 차원의 10M 벡터에 대해 fp16, int8, 프로덕트 양자화를 비교합니다. 메모리와 재현율 영향을 요약합니다.
Qdrant 구성
5M 벡터에 대해 재현율과 속도의 균형을 맞춘 Qdrant 컬렉션 설정을 생성합니다. HNSW 및 양자화 구성을 포함합니다.
모니터링 계획
주간 인덱스 업데이트에 대한 지연 시간 백분위수와 재현율 드리프트를 추적하기 위한 메트릭과 테스트 루프를 정의합니다.

모범 사례

  • 정확한 재현율 측정을 위해 실제 쿼리와 정답 세트로 벤치마킹
  • 기본 파라미터부터 시작하여 한 번에 하나의 변수를 체계적으로 튜닝
  • 각 구성 변경 후 지연 시간 백분위수와 재현율 추적

피하기

  • 알려진 정답 세트에 대한 재현율 측정 없이 튜닝
  • 통제된 실험 없이 여러 파라미터를 동시에 변경
  • M이나 efSearch 값을 증가시킬 때 메모리 오버헤드 무시

자주 묻는 질문

이 스킬은 어떤 플랫폼을 지원하나요?
Claude, Codex, Claude Code와 호환됩니다. Qdrant 관련 예제가 포함된 일반적인 지침을 제공합니다.
템플릿의 주요 한계는 무엇인가요?
템플릿은 hnswlib과 sklearn 같은 라이브러리가 필요한 Python 예제입니다. 사용자는 자신의 데이터와 쿼리를 제공해야 합니다.
파이프라인에 통합할 수 있나요?
네. 벤치마킹 스크립트, CI 작업 또는 성능 테스트 워크플로에서 빌딩 블록으로 템플릿을 사용하세요.
내 데이터에 접근하거나 전송하나요?
아니요. 스킬 콘텐츠는 정적 문서입니다. 스킬 자체에서 데이터 수집이나 네트워크 호출이 발생하지 않습니다.
벤치마크 결과가 불안정하면 어떻게 해야 하나요?
쿼리 샘플 크기를 늘리고, 랜덤 시드를 고정하며, 인덱스 빌드 타이밍과 검색 타이밍 측정을 분리하세요.
일반적인 튜닝 가이드와 비교하면 어떻게 되나요?
구체적인 Python 템플릿, 파라미터 범위, 메모리 추정 공식 및 Qdrant 관련 구성을 제공합니다.

개발자 세부 정보

파일 구조

📄 SKILL.md