Навыки vector-index-tuning

🔍

vector-index-tuning

Name: vector-index-tuning
Author: wshobson

Безопасно 🌐 Доступ к сети

Оптимизация настройки векторного индекса для скорости и полноты поиска

Также доступно от: sickn33

Векторный поиск кажется медленным или затратным при неправильной настройке индексов. Этот навык предоставляет шаблоны и эвристики для улучшения задержки, полноты поиска и использования памяти для стратегий HNSW и квантизации.

Поддерживает: Claude Codex Code(CC)

📊 69 Адекватно

Скачать ZIP навыка

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

Включите и начните использовать

Протестировать

Использование «vector-index-tuning». Suggest HNSW parameters for 1M vectors with 0.95 recall and under 10 ms latency.

Ожидаемый результат:

Рекомендуемый M: 32 и efConstruction: 200 для качества построения
Установить efSearch в 128 для достижения полноты поиска 0.95
Оценить накладные расходы памяти при M = 32 и проверить с помощью небольшого теста

Использование «vector-index-tuning». What memory savings can I get by switching from FP32 to INT8 quantization?

Ожидаемый результат:

FP32 использует 4 байта на измерение, INT8 использует 1 байт
Для векторов размерности 768: FP32 = 3КБ, INT8 = 768 байт на вектор
Приблизительно 75% экономия памяти с незначительным влиянием на полноту поиска

Использование «vector-index-tuning». How do I choose between IVF and HNSW for 50M vectors?

Ожидаемый результат:

HNSW: лучшая полнота поиска за счет памяти и времени построения
IVF: меньше памяти, быстрее построение, немного ниже полнота поиска
Рассмотреть гибрид: IVF-PQ для 50M+ векторов при ограничениях памяти

Аудит безопасности

Безопасно

v4 • 1/17/2026

Pure documentation skill with instructional Python templates for vector index tuning. All static findings are false positives: hardcoded URLs are documentation references, weak crypto patterns matched legitimate quantization terminology, backticks are markdown formatting, and memory-mapped references are Qdrant config parameters.

Просканировано файлов

723

Проанализировано строк

находки

Всего аудитов

Факторы риска

🌐 Доступ к сети (1)

SKILL.md:519-521

Проверено: claude Посмотреть историю аудитов →

Оценка качества

Архитектура

100

Сопровождаемость

Контент

Сообщество

100

Безопасность

Соответствие спецификации

Что вы можете построить

Настройка ANN для полноты поиска

Найти настройки HNSW, которые соответствуют целям полноты поиска, не превышая бюджетов задержки.

Снижение объема памяти

Оценить варианты квантизации и оценить компромиссы хранения при масштабировании.

Планирование масштабирования индекса

Выбрать типы индексов и конфигурации для миллионов и миллиардов векторов.

Попробуйте эти промпты

Быстрый перебор HNSW

Benchmark HNSW M и efSearch для 200k векторов с целевой полнотой 0.95. Предложить лучшую сбалансированную конфигурацию.

Выбор квантизации

Сравнить fp16, int8 и продуктовую квантизацию для 10M векторов размерности 768. Обобщить влияние на память и полноту поиска.

Конфигурация Qdrant

Создать настройки коллекции Qdrant для сбалансированной полноты поиска и скорости с 5M векторами. Включить конфигурации HNSW и квантизации.

План мониторинга

Определить метрики и цикл тестирования для отслеживания дрейфа процентилей задержки и полноты поиска при еженедельных обновлениях индекса.

Лучшие практики

Тестировать с реальными запросами и эталонным набором данных для точного измерения полноты поиска
Начинать с параметров по умолчанию, затем систематически настраивать одну переменную за раз
Отслеживать процентили задержки и полноту поиска после каждого изменения конфигурации

Избегать

Настройка без измерения полноты поиска относительно известного эталонного набора данных
Изменение нескольких параметров одновременно без контролируемых экспериментов
Игнорирование накладных расходов памяти при увеличении значений M или efSearch

Часто задаваемые вопросы

Какие платформы подде��живает этот навык?

Работает с Claude, Codex и Claude Code. Предоставляет общие рекомендации с примерами, специфичными для Qdrant.

Каковы основные ограничения шаблонов?

Шаблоны представляют собой примеры на Python, требующие библиотеки такие как hnswlib и sklearn. Пользователи должны предоставить собственные данные и запросы.

Могу ли я интегрировать это в свой пайплайн?

Да. Используйте шаблоны как строительные блоки в скриптах тестирования, CI-заданиях или рабочих процессах тестирования производительности.

Он получает доступ к моим данным или отправляет их?

Нет. Содержимое навыка представляет собой статическую документацию. Никакой сбор данных или сетевых вызовов не происходит из самого навыка.

Что делать, если результаты тестов шумные?

Увеличьте размер выборки запросов, зафиксируйте случайные seed-значения и разделите измерение времени построения индекса от времени поиска.

Чем это отличается от общих руководств по настройке?

Предоставляет конкретные шаблоны Python, диапазоны параметров, формулы оценки памяти и конфигурации, специфичные для Qdrant.

Сведения для разработчиков

Автор

wshobson

Лицензия

MIT

Репозиторий

https://github.com/wshobson/agents/tree/main/plugins/llm-application-dev/skills/vector-index-tuning

Ссылка

main

Структура файлов

📄 SKILL.md