vector-index-tuning
Optimizar el Rendimiento de Índices Vectoriales
También disponible en: wshobson
Los sistemas de búsqueda vectorial a menudo luchan con latencia y memoria a gran escala. Esta skill proporciona patrones de ajuste HNSW probados y estrategias de cuantificación para equilibrar precisión, velocidad y uso de recursos.
Descargar el ZIP de la skill
Subir en Claude
Ve a Configuración → Capacidades → Skills → Subir skill
Activa y empieza a usar
Pruébalo
Usando "vector-index-tuning". Recomiende parámetros HNSW para 100K vectores con objetivo de 95% de precisión
Resultado esperado:
Para 100K vectores con objetivo de 95% de precisión: M=32 (conexiones incrementadas para mejor conectividad del grafo), efConstruction=200 (construcción exhaustiva del índice), efSearch=128 (calidad de búsqueda equilibrada). Memoria esperada: ~250MB para vectores FP32. Tiempo de construcción: 30-60 segundos. Latencia de búsqueda: 5-15ms en p99.
Usando "vector-index-tuning". ¿Cuánta memoria ahorra la cuantificación INT8 para 1M vectores de 768 dimensiones?
Resultado esperado:
Línea base FP32: 1M × 768 × 4 bytes = 2.93GB. Cuantificado INT8: 1M × 768 × 1 byte = 732MB. Reducción de memoria: 75% de ahorro (2.2GB). Impacto en precisión: típicamente 1-3% de degradación. Recomendado para aplicaciones sensibles a latencia con requisitos moderados de precisión.
Auditoría de seguridad
SeguroStatic analysis flagged 26 patterns that are all false positives. The skill contains only documentation and Python code examples for vector database optimization. Markdown code fences were misidentified as shell execution. URLs are reference links. Configuration parameter names were misidentified as filesystem operations. No actual security risks exist.
Puntuación de calidad
Lo que puedes crear
Optimización de Latencia de Búsqueda en Producción
Ajustar parámetros HNSW y habilitar cuantificación INT8 para reducir latencia p99 de 50ms a 10ms manteniendo 95% de precisión.
Despliegue de Índice con Restricciones de Memoria
Aplicar Product Quantization para ajustar 10M vectores en 8GB de RAM con compensaciones de precisión aceptables para despliegues sensibles al costo.
Planificación de Escalado de Índices Vectoriales
Seleccionar tipo de índice y configuración apropiados al escalar de 100K a 100M vectores con rendimiento predecible.
Prueba estos prompts
Tengo 500,000 vectores con 768 dimensiones. Necesito 95% de precisión con latencia p99 bajo 20ms y presupuesto de 16GB de memoria. Recomiende parámetros HNSW y cuantifique el uso esperado de memoria.
Compare cuantificación escalar INT8 vs Product Quantization para mi caso de uso: 10M vectores, 512 dimensiones, debe ajustarse en 8GB de RAM, mínimo 90% de precisión requerido. Incluya código para implementar el enfoque recomendado.
Genere una configuración completa de colección Qdrant optimizada para búsqueda de alta precisión en 5M vectores de embedding de productos. Incluya configuraciones HNSW, configuración de cuantificación y umbrales del optimizador con explicaciones.
Diseñe un plan de benchmark para evaluar barridos de parámetros HNSW. Tengo 1M vectores, 10K muestras de consulta con etiquetas ground truth. Incluya métricas a seguir, rangos de parámetros a probar y criterios para seleccionar la configuración ganadora.
Mejores prácticas
- Hacer benchmark con consultas reales de producción en lugar de datos sintéticos para capturar patrones reales de carga de trabajo
- Comenzar con parámetros HNSW predeterminados y solo ajustar cuando las métricas indiquen necesidad de optimización
- Monitorear la precisión continuamente en producción ya que el drift de datos puede degradar la calidad de búsqueda con el tiempo
Evitar
- Reindexar sistemas de producción sin un plan de reversión y validación en staging
- Sobre-optimizar para precisión a expensas de SLAs de latencia y presupuestos de memoria
- Omitir el calentamiento del índice después del despliegue lo que causa picos de latencia de cold-start
Preguntas frecuentes
¿Cuál es un buen punto de partida para parámetros HNSW?
¿Cómo afecta la cuantificación la calidad de búsqueda?
¿Cuándo debo usar IVF en lugar de HNSW?
¿Con qué frecuencia debo reindexar mi base de datos vectorial?
¿Cuál es la diferencia entre efConstruction y efSearch?
¿Puedo cambiar parámetros HNSW después de crear un índice?
Detalles del desarrollador
Autor
sickn33Licencia
MIT
Repositorio
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/vector-index-tuningRef.
main
Estructura de archivos