vector-index-tuning
속도와 재현율을 위한 벡터 인덱스 튜닝 최적화
벡터 검색이 잘못 구성된 인덱스로 인해 느리거나 비용이 많이드는 경우, 이 스킬은 지연 시간, 재현율 및 메모리 사용을 개선하기 위한 HNSW 및 양자화 전략에 대한 튜닝 템플릿과 휴리스틱을 제공합니다.
스킬 ZIP 다운로드
Claude에서 업로드
설정 → 기능 → 스킬 → 스킬 업로드로 이동
토글을 켜고 사용 시작
테스트해 보기
"vector-index-tuning" 사용 중입니다. 1M 벡터에 대해 0.95 재현율과 10ms 미만의 지연 시간을 목표로 하는 HNSW 파라미터를 추천하세요.
예상 결과:
- 빌드 품질을 위해 M: 32, efConstruction: 200 추천
- 0.95 재현율을 목표로 efSearch를 128로 설정
- M이 32일 때의 메모리 오버헤드를 추정하고 소규모 벤치마크로 검증
"vector-index-tuning" 사용 중입니다. FP32에서 INT8 양자화로 전환하면 얼마나 메모리를 절약할 수 있나요?
예상 결과:
- FP32는 차원당 4바이트, INT8은 차원당 1바이트를 사용
- 768 차원 벡터의 경우: FP32 = 3KB, INT8 = 벡터당 768바이트
- 약 75% 메모리 감소로 약간의 재현율 영향
"vector-index-tuning" 사용 중입니다. 50M 벡터에 대해 IVF와 HNSW 중 어떤 것을 선택해야 하나요?
예상 결과:
- HNSW: 메모리와 빌드 시간 비용으로 더 나은 재현율
- IVF: 더 적은 메모리, 더 빠른 빌드, 약간 낮은 재현율
- 메모리가 제한된 50M+ 벡터의 경우 하이브리드 IVF-PQ 고려
보안 감사
안전Pure documentation skill with instructional Python templates for vector index tuning. All static findings are false positives: hardcoded URLs are documentation references, weak crypto patterns matched legitimate quantization terminology, backticks are markdown formatting, and memory-mapped references are Qdrant config parameters.
위험 요인
🌐 네트워크 접근 (1)
품질 점수
만들 수 있는 것
재현율을 위한 ANN 튜닝
지연 시간 예산을 초과하지 않으면서 재현율 목표를 충족하는 HNSW 설정을 찾습니다.
메모리 사용량 감소
양자화 옵션을 평가하고 규모에 따른 저장소 트레이드오프를 추정합니다.
인덱스 스케일링 계획
수백만에서 수십억 개의 벡터를 위한 인덱스 유형과 구성을 선택합니다.
이 프롬프트를 사용해 보세요
0.95 재현율을 목표로 200k 벡터에 대한 HNSW M과 efSearch를 벤치마킹합니다. 가장 균형 잡힌 구성을 추천하세요.
768 차원의 10M 벡터에 대해 fp16, int8, 프로덕트 양자화를 비교합니다. 메모리와 재현율 영향을 요약합니다.
5M 벡터에 대해 재현율과 속도의 균형을 맞춘 Qdrant 컬렉션 설정을 생성합니다. HNSW 및 양자화 구성을 포함합니다.
주간 인덱스 업데이트에 대한 지연 시간 백분위수와 재현율 드리프트를 추적하기 위한 메트릭과 테스트 루프를 정의합니다.
모범 사례
- 정확한 재현율 측정을 위해 실제 쿼리와 정답 세트로 벤치마킹
- 기본 파라미터부터 시작하여 한 번에 하나의 변수를 체계적으로 튜닝
- 각 구성 변경 후 지연 시간 백분위수와 재현율 추적
피하기
- 알려진 정답 세트에 대한 재현율 측정 없이 튜닝
- 통제된 실험 없이 여러 파라미터를 동시에 변경
- M이나 efSearch 값을 증가시킬 때 메모리 오버헤드 무시
자주 묻는 질문
이 스킬은 어떤 플랫폼을 지원하나요?
템플릿의 주요 한계는 무엇인가요?
파이프라인에 통합할 수 있나요?
내 데이터에 접근하거나 전송하나요?
벤치마크 결과가 불안정하면 어떻게 해야 하나요?
일반적인 튜닝 가이드와 비교하면 어떻게 되나요?
개발자 세부 정보
작성자
wshobson라이선스
MIT
리포지토리
https://github.com/wshobson/agents/tree/main/plugins/llm-application-dev/skills/vector-index-tuning참조
main
파일 구조
📄 SKILL.md