Compétences vector-index-tuning

🔍

vector-index-tuning

Name: vector-index-tuning
Author: wshobson

Sûr 🌐 Accès réseau

속도와 재현율을 위한 벡터 인덱스 튜닝 최적화

Également disponible depuis: sickn33

벡터 검색이 잘못 구성된 인덱스로 인해 느리거나 비용이 많이드는 경우, 이 스킬은 지연 시간, 재현율 및 메모리 사용을 개선하기 위한 HNSW 및 양자화 전략에 대한 튜닝 템플릿과 휴리스틱을 제공합니다.

Prend en charge: Claude Codex Code(CC)

📊 69 Adéquat

Télécharger le ZIP du skill

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

Activez et commencez à utiliser

Tester

Utilisation de "vector-index-tuning". 1M 벡터에 대해 0.95 재현율과 10ms 미만의 지연 시간을 목표로 하는 HNSW 파라미터를 추천하세요.

Résultat attendu:

빌드 품질을 위해 M: 32, efConstruction: 200 추천
0.95 재현율을 목표로 efSearch를 128로 설정
M이 32일 때의 메모리 오버헤드를 추정하고 소규모 벤치마크로 검증

Utilisation de "vector-index-tuning". FP32에서 INT8 양자화로 전환하면 얼마나 메모리를 절약할 수 있나요?

Résultat attendu:

FP32는 차원당 4바이트, INT8은 차원당 1바이트를 사용
768 차원 벡터의 경우: FP32 = 3KB, INT8 = 벡터당 768바이트
약 75% 메모리 감소로 약간의 재현율 영향

Utilisation de "vector-index-tuning". 50M 벡터에 대해 IVF와 HNSW 중 어떤 것을 선택해야 하나요?

Résultat attendu:

HNSW: 메모리와 빌드 시간 비용으로 더 나은 재현율
IVF: 더 적은 메모리, 더 빠른 빌드, 약간 낮은 재현율
메모리가 제한된 50M+ 벡터의 경우 하이브리드 IVF-PQ 고려

Audit de sécurité

Sûr

v4 • 1/17/2026

Pure documentation skill with instructional Python templates for vector index tuning. All static findings are false positives: hardcoded URLs are documentation references, weak crypto patterns matched legitimate quantization terminology, backticks are markdown formatting, and memory-mapped references are Qdrant config parameters.

Fichiers analysés

723

Lignes analysées

résultats

Total des audits

Facteurs de risque

🌐 Accès réseau (1)

SKILL.md:519-521

Audité par: claude Voir l’historique des audits →

Score de qualité

Architecture

100

Maintenabilité

Contenu

Communauté

100

Sécurité

Conformité aux spécifications

Ce que vous pouvez construire

재현율을 위한 ANN 튜닝

지연 시간 예산을 초과하지 않으면서 재현율 목표를 충족하는 HNSW 설정을 찾습니다.

메모리 사용량 감소

양자화 옵션을 평가하고 규모에 따른 저장소 트레이드오프를 추정합니다.

인덱스 스케일링 계획

수백만에서 수십억 개의 벡터를 위한 인덱스 유형과 구성을 선택합니다.

Essayez ces prompts

빠른 HNSW 스윕

0.95 재현율을 목표로 200k 벡터에 대한 HNSW M과 efSearch를 벤치마킹합니다. 가장 균형 잡힌 구성을 추천하세요.

양자화 선택

768 차원의 10M 벡터에 대해 fp16, int8, 프로덕트 양자화를 비교합니다. 메모리와 재현율 영향을 요약합니다.

Qdrant 구성

5M 벡터에 대해 재현율과 속도의 균형을 맞춘 Qdrant 컬렉션 설정을 생성합니다. HNSW 및 양자화 구성을 포함합니다.

모니터링 계획

주간 인덱스 업데이트에 대한 지연 시간 백분위수와 재현율 드리프트를 추적하기 위한 메트릭과 테스트 루프를 정의합니다.

Bonnes pratiques

정확한 재현율 측정을 위해 실제 쿼리와 정답 세트로 벤치마킹
기본 파라미터부터 시작하여 한 번에 하나의 변수를 체계적으로 튜닝
각 구성 변경 후 지연 시간 백분위수와 재현율 추적

Éviter

알려진 정답 세트에 대한 재현율 측정 없이 튜닝
통제된 실험 없이 여러 파라미터를 동시에 변경
M이나 efSearch 값을 증가시킬 때 메모리 오버헤드 무시

Foire aux questions

이 스킬은 어떤 플랫폼을 지원하나요?

Claude, Codex, Claude Code와 호환됩니다. Qdrant 관련 예제가 포함된 일반적인 지침을 제공합니다.

템플릿의 주요 한계는 무엇인가요?

템플릿은 hnswlib과 sklearn 같은 라이브러리가 필요한 Python 예제입니다. 사용자는 자신의 데이터와 쿼리를 제공해야 합니다.

파이프라인에 통합할 수 있나요?

네. 벤치마킹 스크립트, CI 작업 또는 성능 테스트 워크플로에서 빌딩 블록으로 템플릿을 사용하세요.

내 데이터에 접근하거나 전송하나요?

아니요. 스킬 콘텐츠는 정적 문서입니다. 스킬 자체에서 데이터 수집이나 네트워크 호출이 발생하지 않습니다.

벤치마크 결과가 불안정하면 어떻게 해야 하나요?

쿼리 샘플 크기를 늘리고, 랜덤 시드를 고정하며, 인덱스 빌드 타이밍과 검색 타이밍 측정을 분리하세요.

일반적인 튜닝 가이드와 비교하면 어떻게 되나요?

구체적인 Python 템플릿, 파라미터 범위, 메모리 추정 공식 및 Qdrant 관련 구성을 제공합니다.

Détails du développeur

Auteur

wshobson

Licence

MIT

Dépôt

https://github.com/wshobson/agents/tree/main/plugins/llm-application-dev/skills/vector-index-tuning

Réf

main

Structure de fichiers

📄 SKILL.md