Compétences agentdb-vector-search-optimization
🚀

agentdb-vector-search-optimization

Sûr ⚙️ Commandes externes🌐 Accès réseau📁 Accès au système de fichiers

AgentDB 벡터 검색 성능 최적화

대규모에서 벡터 검색은 느리고 메모리 집약적이 됩니다. 이 스킬은 양자화, HNSW 인덱싱, 지능형 캐싱을 사용하여 4-32배 메모리 절감과 150배 빠른 검색을 달성하기 위한 체계적인 5단계 접근 방식을 제공합니다.

Prend en charge: Claude Codex Code(CC)
⚠️ 68 Médiocre
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "agentdb-vector-search-optimization". Optimize my AgentDB vector database with 1M embeddings of 1536 dimensions

Résultat attendu:

  • Phase 1: Baseline - Measured 45ms p95 latency, 64GB memory usage
  • Phase 2: Quantization - Applied 4x compression, accuracy 96.2%
  • Phase 3: HNSW Index - Built index with M=16, efConstruction=200
  • Phase 4: Caching - Configured LRU cache with 10K entries, 1hr TTL
  • Phase 5: Results - 16GB memory (4x reduction), 0.3ms latency (150x faster), 72% cache hit rate

Utilisation de "agentdb-vector-search-optimization". My RAG system with 10M embeddings is running slowly

Résultat attendu:

  • Identified bottleneck: Search latency 120ms p95
  • Applied scalar quantization: 4x memory reduction
  • Built HNSW index: 85x speedup achieved
  • Added query caching: 68% hit rate
  • Final result: 15ms latency, 75% memory reduction

Audit de sécurité

Sûr
v5 • 1/17/2026

Documentation-only skill containing process guides and code examples. No executable code, network calls, file system access, or external commands detected. All 24 static findings are false positives - the scanner misidentified TypeScript template literals as shell backticks, SHA256 hashes as C2 keywords, and URL strings as network calls.

5
Fichiers analysés
474
Lignes analysées
3
résultats
5
Total des audits

Score de qualité

38
Architecture
100
Maintenabilité
87
Contenu
19
Communauté
100
Sécurité
83
Conformité aux spécifications

Ce que vous pouvez construire

벡터 데이터베이스 확장

인프라 비용을 줄이면서 수백만 개의 임베딩을 효율적으로 처리하도록 프로덕션 벡터 데이터베이스를 최적화합니다.

RAG 시스템 속도 향상

더 빠른 벡터 유사성 검색 및 캐싱 계층으로 검색 증강 생성 시스템을 가속화합니다.

메모리 비용 절감

대규모 벡터 워크로드의 검색 품질을 유지하면서 상당한 메모리 절감을 달성합니다.

Essayez ces prompts

빠른 최적화
When optimizing vector search, apply quantization and HNSW indexing to reduce memory by 4x and speed up search by 10x.
기준선 측정
When optimizing vector search, first measure baseline metrics including p95 latency, memory usage, and throughput for 1000 queries.
양자화 구성
When optimizing vector search, configure product quantization with codebook size 256 and 8 subvectors to achieve 4x compression while maintaining accuracy above 95%.
전체 최적화
When optimizing vector search for production, execute the full 5-phase workflow: baseline measurement, quantization, HNSW indexing, caching setup, and comprehensive benchmarking with before-after comparison.

Bonnes pratiques

  • 개선 벤치마크를 설정하기 위해 최적화를 적용하기 전에 항상 기준 성능을 측정하세요
  • 메모리 절감과 정확도의 균형을 위해 공격적인 이진 양자화를 시도하기 전에 먼저 제품 양자화(4배 압축)로 시작하세요
  • 캐시 적중률을 모니터링하고 쿼리 패턴에 따라 TTL/제거 정책을 조정하여 최적의 성능 달성

Éviter

  • 기준선 측정을 건너뛰면 개선 주장을 검증하거나 회귀를 감지할 수 없음
  • 정확도 검증 없이 공격적인 32배 이진 양자화를 적용하면 검색 품질이 저하됨
  • 배포 후 캐시 워밍 업 기간을 무시하면 초기 쿼리에 대한 콜드 스타트 지연 시간 스파이크 발생

Foire aux questions

어떤 양자화 방법부터 시작해야 합니까?
최소한의 정확도 손실로 4배 압축을 위해 제품 양자화로 시작하세요. 극단적인 압축이 필요한 경우에만 이진 양자화로 이동하세요.
속도를 최적화하는 HNSW 매개변수는 무엇입니까?
더 높은 재현율을 위해 M(16-64)을 증가시키고 더 빠른 쿼리를 위해 efSearch(100-500)를 증가시키세요. 높은 값은 메모리를 증가시키지만 정확도를 향상시킵니다.
기존 AgentDB 코드와 어떻게 통합합니까?
agentdb-optimization 패키지에서 Quantization 및 QueryCache를 가져와서 인덱스를 만들거나 쿼리하기 전에 적용하세요.
최적화 중에 내 데이터가 안전한가요?
네. 양자화는 압축된 사본을 생성합니다. 원본 벡터는 명시적으로 교체할 때까지 그대로 유지됩니다.
최적화 후 정확도가 떨어지는 이유는 무엇입니까?
압축 비율(낮을수록 더 정확함)을 확인하고 대표 데이터에 대한 코드북 학습을 검증하고 하위 벡터 수를 조정하세요.
다른 벡터 데이터베이스와 비교하면 어떻습니까?
AgentDB 최적화는 전문화된 솔루션과 비교할 수 있는 결과를 달성합니다. HNSW 인덱싱은 pgvector 및 Milvus와 유사한 속도 향상을 제공합니다.