agentdb-performance-optimization
AgentDB 벡터 데이터베이스 성능 최적화
También disponible en: ruvnet
벡터 데이터베이스는 대규모에서 막대한 메모리를 소비하고 느린 검색 성능을 겪습니다. 이 스킬은 양자화, HNSW 인덱싱, 캐싱을 포함한 검증된 최적화 기법을 제공하여 150배~12,500배의 성능 향상을 달성하면서 메모리 사용량을 4배~32배 줄입니다.
Descargar el ZIP de la skill
Subir en Claude
Ve a Configuración → Capacidades → Skills → Subir skill
Activa y empieza a usar
Pruébalo
Usando "agentdb-performance-optimization". 대규모 배포를 위해 바이너리 양자화 및 HNSW 인덱싱으로 AgentDB 구성
Resultado esperado:
- 바이너리 양자화: 32배 메모리 감소 (1M 벡터 기준 3GB → 96MB)
- HNSW 인덱스: M=32 연결을 가진 계층적 탐색 가능 소형 월드
- 캐시 크기: 빈번한 쿼리 가속화를 위한 2000개 패턴
- 예상 성능: 100us 미만 검색 지연 시간, 10배 빠른 쿼리
- 트레이드오프: 규모 확장을 위해 2~5% 정확도 손실 허용
Usando "agentdb-performance-optimization". 속도 대신 최대 정확도로 최적화하는 방법
Resultado esperado:
- 양자화 비활성화 (type을 'none'으로 설정)하여 완전한 float32 정밀도 유지
- HNSW M 파라미터를 32로 증가하여 더 많은 그래프 연결 생성
- 쿼리 중 더 높은 재현율을 위해 efSearch를 200으로 설정
- 빈번한 패턴 보존을 위해 2000+ 캐시 크기 사용
- 예상: 100% 정확도를 유지하면서 200us 미만 지연 시간
Auditoría de seguridad
SeguroAll 78 static findings are false positives. This skill is pure documentation containing only markdown with TypeScript code examples. The CRITICAL heuristic misidentified documentation patterns as malicious. HIGH findings misclassified 'quantization' (ML compression) as cryptographic algorithms. MEDIUM findings mistook markdown code fences for shell execution. No executable code, network operations, or credential access exists.
Factores de riesgo
🌐 Acceso a red (3)
📁 Acceso al sistema de archivos (1)
⚙️ Comandos externos (55)
Puntuación de calidad
Lo que puedes crear
벡터 임베딩 확장
수백만 개의 임베딩을 가진 프로덕션 ML 애플리케이션을 위한 메모리 효율적인 벡터 검색 배포
에이전트 메모리 가속화
빠른 컨텍스트 검색이 필요한 지능형 에이전트의 추론 뱅크 쿼리 속도 향상
데이터베이스 리소스 최적화
대규모 벡터 저장소에 양자화 및 인덱싱을 적용하여 인프라 비용 절감
Prueba estos prompts
최적의 성능을 위해 양자화, HNSW 인덱싱, 캐싱으로 AgentDB를 구성하세요. 구성 옵션을 보여주고 메모리 사용량과 정확도 간의 트레이드오프를 설명하세요.
1M+ 벡터를 가진 대규모 배포에서 메모리 사용량을 32배 줄이려면 어떤 양자화 전략을 사용해야 하나요? 구성과 예상되는 정확도 영향을 보여주세요.
100us 미만의 쿼리로 최대 검색 속도를 위해 AgentDB를 구성하세요. HNSW 파라미터 튜닝 및 캐시 구성을 포함하세요. 어떤 정확도 트레이드오프를 예상해야 하나요?
AgentDB를 10K에서 1M 이상의 벡터로 확장하기 위한 최적화 방안을 작성하세요. 각 규모 단계별로 양자화 유형 선택, HNSW 파라미터, 캐시 크기 설정을 포함하세요.
Mejores prácticas
- 메모리가 중요하지 않다면 98~99% 정확도를 보존하는 스칼라 양자화(4배 감소)로 프로덕션을 시작하세요
- 캐시 적중률을 모니터링하고 액세스 패턴에 따라 cacheSize를 조정하여 80% 이상을 목표로 하세요
- HNSW 파라미터를 점진적으로 튜닝하세요: 기본값(M=16, efSearch=100)으로 시작한 후 재현율 요구사항에 따라 조정하세요
Evitar
- 10만 개 이상의 벡터 데이터셋에서 양자화를 사용하지 않으면 불필요한 메모리 압박과 느린 검색을 초래합니다
- efSearch를 너무 높게 설정하면(200 이상) 대부분의 사용 사례에서 큰 재현율 개선 없이 성능이 저하됩니다
- HNSW 인덱싱을 비활성화하면 선형 스캔(O(n))으로 되돌아가 대규모 쿼리가 비실용적이 됩니다
Preguntas frecuentes
어떤 양자화 유형을 선택해야 하나요?
필요한 최소 AgentDB 버전은 무엇인가요?
Claude Code와 어떻게 통합하나요?
양자화를 사용해도 데이터가 안전한가요?
최적화 후에도 검색이 느린 이유는 무엇인가요?
다른 벡터 데이터베이스와 어떻게 비교되나요?
Detalles del desarrollador
Autor
DNYoussefLicencia
MIT
Repositorio
https://github.com/DNYoussef/ai-chrome-extension/tree/main/.claude/skills/agentdb-optimizationRef.
main
Estructura de archivos
📄 SKILL.md