Compétences agentdb-vector-search-optimization

🚀

agentdb-vector-search-optimization

Name: agentdb-vector-search-optimization
Author: DNYoussef

Sûr ⚙️ Commandes externes🌐 Accès réseau📁 Accès au système de fichiers

Оптимизация производительности векторного поиска AgentDB

Векторный поиск становится медленным и ресурсоемким при масштабировании. Этот навык предоставляет систематический 5-фазный подход для достижения 4-32-кратного сокращения памяти и 150-кратного ускорения поиска с использованием квантизации, индексации HNSW и интеллектуального кэширования.

Prend en charge: Claude Codex Code(CC)

⚠️ 68 Médiocre

Télécharger le ZIP du skill

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

Activez et commencez à utiliser

Tester

Utilisation de "agentdb-vector-search-optimization". Оптимизировать мою векторную базу данных AgentDB с 1M эмбеддингов измерения 1536

Résultat attendu:

Фаза 1: Базовые показатели - Измерена задержка p95 45ms, использование памяти 64GB
Фаза 2: Квантизация - Применено 4-кратное сжатие, точность 96.2%
Фаза 3: Индекс HNSW - Построен индекс с M=16, efConstruction=200
Фаза 4: Кэширование - Настроен LRU кэш с 10K записей, TTL 1 час
Фаза 5: Результаты - 16GB памяти (4-кратное сокращение), задержка 0.3ms (150-кратное ускорение), частота попаданий в кэш 72%

Utilisation de "agentdb-vector-search-optimization". Моя RAG-система с 10M эмбеддингов работает медленно

Résultat attendu:

Выявлено узкое место: Задержка поиска 120ms p95
Применена скалярная квантизация: 4-кратное сокращение памяти
Построен индекс HNSW: Достигнуто 85-кратное ускорение
Добавлено кэширование запросов: 68% попаданий
Конечный результат: Задержка 15ms, сокращение памяти на 75%

Audit de sécurité

Sûr

v5 • 1/17/2026

Documentation-only skill containing process guides and code examples. No executable code, network calls, file system access, or external commands detected. All 24 static findings are false positives - the scanner misidentified TypeScript template literals as shell backticks, SHA256 hashes as C2 keywords, and URL strings as network calls.

Fichiers analysés

474

Lignes analysées

résultats

Total des audits

Facteurs de risque

⚙️ Commandes externes (11)

PROCESS.md:5-22 PROCESS.md:22-26 PROCESS.md:26-36 PROCESS.md:36-40 PROCESS.md:40-49 PROCESS.md:49-53 PROCESS.md:53-59 PROCESS.md:59-63 PROCESS.md:63-71 README.md:14-17 SKILL.md:80-103

🌐 Accès réseau (2)

skill-report.json:6 SKILL.md:132

📁 Accès au système de fichiers (1)

skill-report.json:6

Audité par: claude Voir l’historique des audits →

Score de qualité

Architecture

100

Maintenabilité

Contenu

Communauté

100

Sécurité

Conformité aux spécifications

Ce que vous pouvez construire

Масштабирование векторных баз данных

Оптимизировать рабочие векторные базы данных для эффективной обработки миллионов эмбеддингов со сниженными инфраструктурными затратами.

Ускорение RAG-систем

Ускорить системы генерации с дополнением (RAG) за счет более быстрого поиска векторного сходства и слоев кэширования.

Снижение затрат на память

Достичь значительного сокращения использования памяти при сохранении качества поиска для крупномасштабных векторных нагрузок.

Essayez ces prompts

Быстрая оптимизация

При оптимизации векторного поиска примените квантизацию и индексацию HNSW для сокращения памяти в 4 раза и ускорения поиска в 10 раз.

Измерение базовых показателей

При оптимизации векторного поиска сначала измерьте базовые метрики, включая p95 задержку, использование памяти и пропускную способность для 1000 запросов.

Настройка квантизации

При оптимизации векторного поиска настройте продуктовую квантизацию с размером кодовой книги 256 и 8 подвекторами для достижения 4-кратного сжатия при сохранении точности выше 95%.

Полная оптимизация

При оптимизации векторного поиска для рабочей среды выполните полный 5-фазный рабочий процесс: измерение базовых показателей, квантизация, индексация HNSW, настройка кэширования и комплексное бенчмаркирование с сравнением до и после.

Bonnes pratiques

Всегда измеряйте базовую производительность перед применением оптимизаций для установления контрольных показателей улучшений
Начинайте с продуктовой квантизации (4-кратное сжатие) перед попыткой агрессивной бинарной квантизации для баланса между экономией памяти и точностью
Отслеживайте частоту попаданий в кэш и корректируйте политики TTL/исключения на основе паттернов запросов для оптимальной производительности

Éviter

Пропуск измерения базовых показателей делает невозможным проверку заявлений об улучшениях или обнаружение регрессий
Применение агрессивной 32-кратной бинарной квантизации без проверки точности разрушает качество поиска
Игнорирование периода прогрева кэша после развертывания вызывает всплески задержки при холодном старте для начальных запросов

Foire aux questions

Какой метод квантизации мне следует начать использовать?

Начните с продуктовой квантизации для 4-кратного сжатия и минимальной потери точности. Переходите к бинарной квантизации только если нужно экстремальное сжатие.

Какие параметры HNSW оптимизируют скорость?

Увеличьте M (16-64) для более высокого полноты поиска и efSearch (100-500) для более быстрых запросов. Более высокие значения увеличивают использование памяти, но улучшают точность.

Как интегрировать с существующим кодом AgentDB?

Импортируйте Quantization и QueryCache из пакета agentdb-optimization и примените перед созданием индекса или выполнением запросов.

Безопасны ли мои данные во время оптимизации?

Да. Квантизация создает сжатые копии. Оригинальные векторы остаются нетронутыми, пока вы явно их не замените.

Почему точность снижается после оптимизации?

Проверьте коэффициент сжатия (меньшее значение означает более высокую точность), проверьте обучение кодовой книги на репрезентативных данных и скорректируйте количество подвекторов.

Как это сравнивается с другими векторными базами данных?

Оптимизация AgentDB достигает сопоставимых результатов со специализированными решениями. Индексация HNSW обеспечивает аналогичное ускорение как pgvector и Milvus.

Détails du développeur

Auteur

DNYoussef

Licence

MIT

Dépôt

https://github.com/DNYoussef/ai-chrome-extension/tree/main/.claude/skills/agentdb/when-optimizing-vector-search-use-agentdb-optimization

Réf

main

Structure de fichiers

📄 process-diagram.gv

📄 PROCESS.md

📄 README.md

📄 SKILL.md