agentdb-vector-search-optimization
Оптимизация производительности векторного поиска AgentDB
Векторный поиск становится медленным и ресурсоемким при масштабировании. Этот навык предоставляет систематический 5-фазный подход для достижения 4-32-кратного сокращения памяти и 150-кратного ускорения поиска с использованием квантизации, индексации HNSW и интеллектуального кэширования.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "agentdb-vector-search-optimization". Оптимизировать мою векторную базу данных AgentDB с 1M эмбеддингов измерения 1536
Résultat attendu:
- Фаза 1: Базовые показатели - Измерена задержка p95 45ms, использование памяти 64GB
- Фаза 2: Квантизация - Применено 4-кратное сжатие, точность 96.2%
- Фаза 3: Индекс HNSW - Построен индекс с M=16, efConstruction=200
- Фаза 4: Кэширование - Настроен LRU кэш с 10K записей, TTL 1 час
- Фаза 5: Результаты - 16GB памяти (4-кратное сокращение), задержка 0.3ms (150-кратное ускорение), частота попаданий в кэш 72%
Utilisation de "agentdb-vector-search-optimization". Моя RAG-система с 10M эмбеддингов работает медленно
Résultat attendu:
- Выявлено узкое место: Задержка поиска 120ms p95
- Применена скалярная квантизация: 4-кратное сокращение памяти
- Построен индекс HNSW: Достигнуто 85-кратное ускорение
- Добавлено кэширование запросов: 68% попаданий
- Конечный результат: Задержка 15ms, сокращение памяти на 75%
Audit de sécurité
SûrDocumentation-only skill containing process guides and code examples. No executable code, network calls, file system access, or external commands detected. All 24 static findings are false positives - the scanner misidentified TypeScript template literals as shell backticks, SHA256 hashes as C2 keywords, and URL strings as network calls.
Facteurs de risque
⚙️ Commandes externes (11)
🌐 Accès réseau (2)
📁 Accès au système de fichiers (1)
Score de qualité
Ce que vous pouvez construire
Масштабирование векторных баз данных
Оптимизировать рабочие векторные базы данных для эффективной обработки миллионов эмбеддингов со сниженными инфраструктурными затратами.
Ускорение RAG-систем
Ускорить системы генерации с дополнением (RAG) за счет более быстрого поиска векторного сходства и слоев кэширования.
Снижение затрат на память
Достичь значительного сокращения использования памяти при сохранении качества поиска для крупномасштабных векторных нагрузок.
Essayez ces prompts
При оптимизации векторного поиска примените квантизацию и индексацию HNSW для сокращения памяти в 4 раза и ускорения поиска в 10 раз.
При оптимизации векторного поиска сначала измерьте базовые метрики, включая p95 задержку, использование памяти и пропускную способность для 1000 запросов.
При оптимизации векторного поиска настройте продуктовую квантизацию с размером кодовой книги 256 и 8 подвекторами для достижения 4-кратного сжатия при сохранении точности выше 95%.
При оптимизации векторного поиска для рабочей среды выполните полный 5-фазный рабочий процесс: измерение базовых показателей, квантизация, индексация HNSW, настройка кэширования и комплексное бенчмаркирование с сравнением до и после.
Bonnes pratiques
- Всегда измеряйте базовую производительность перед применением оптимизаций для установления контрольных показателей улучшений
- Начинайте с продуктовой квантизации (4-кратное сжатие) перед попыткой агрессивной бинарной квантизации для баланса между экономией памяти и точностью
- Отслеживайте частоту попаданий в кэш и корректируйте политики TTL/исключения на основе паттернов запросов для оптимальной производительности
Éviter
- Пропуск измерения базовых показателей делает невозможным проверку заявлений об улучшениях или обнаружение регрессий
- Применение агрессивной 32-кратной бинарной квантизации без проверки точности разрушает качество поиска
- Игнорирование периода прогрева кэша после развертывания вызывает всплески задержки при холодном старте для начальных запросов