Навыки vector-database-engineer
🔍

vector-database-engineer

Безопасно

Создание масштабируемых систем векторного поиска

Реализация готовых к производству векторных баз данных и семантического поиска. Этот навык предоставляет экспертные рекомендации по стратегиям эмбеддингов, оптимизации индексов и архитектуре RAG для современных приложений искусственного интеллекта.

Поддерживает: Claude Codex Code(CC)
📊 70 Адекватно
1

Скачать ZIP навыка

2

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

3

Включите и начните использовать

Протестировать

Использование «vector-database-engineer». How should I chunk 500-page PDFs for semantic search?

Ожидаемый результат:

Use recursive character text splitting with 1000-1500 character chunks and 200 character overlap. This preserves context while maintaining semantic coherence. For technical documents, consider structure-aware chunking that respects section boundaries.

Использование «vector-database-engineer». Compare Pinecone vs Weaviate for production

Ожидаемый результат:

Pinecone offers managed scalability with zero operational overhead but has vendor lock-in. Weaviate provides self-hosted flexibility with hybrid search built-in but requires infrastructure management. Choose Pinecone for rapid development, Weaviate for cost control at scale.

Аудит безопасности

Безопасно
v1 • 2/25/2026

All static analysis findings are false positives. The skill contains only documentation text with no executable code, network requests, or security risks. The 'external_commands' flag was triggered by the word 'open' in a documentation sentence, not actual command execution. This is a legitimate educational skill about vector database engineering.

1
Просканировано файлов
63
Проанализировано строк
0
находки
1
Всего аудитов
Проблем безопасности не найдено
Проверено: claude

Оценка качества

38
Архитектура
100
Сопровождаемость
85
Контент
25
Сообщество
100
Безопасность
91
Соответствие спецификации

Что вы можете построить

Создание базы знаний RAG

Проектирование семантического поиска по документации для вопросно-ответных систем на основе ИИ

Внедрение рекомендательной системы

Создание рекомендаций товаров на основе подобия с использованием векторных эмбеддингов

Оптимизация производительности векторного поиска

Настройка стратегий индексации и разбиения для миллионов векторов

Попробуйте эти промпты

Выбор векторной базы данных
Помогите мне выбрать между Pinecone, Weaviate и Qdrant для системы поиска документов с 1 миллионом векторов
Разработка стратегии эмбеддингов
Разработайте конвейер эмбеддингов для технической документации. Рекомендуйте размер чанков, перекрытие и выбор модели
Настройка индекса HNSW
Настройте параметры индекса HNSW для достижения 90% полноты при задержке менее 50 мс на 5 миллионах векторов
Реализация гибридного поиска
Реализуйте гибридный поиск, объединяющий векторное сходство с фильтрами по ключевым словам для поиска товаров

Лучшие практики

  • Всегда тестируйте модели эмбеддингов на вашем конкретном домене перед развертыванием в производство
  • Начинайте с простых стратегий разбиения перед оптимизацией для сложных структур документов
  • Отслеживайте дрейф векторов и планируйте периодические циклы повторного эмбеддинга
  • Используйте фильтрацию по метаданным для сужения пространства поиска перед векторными запросами

Избегать

  • Использование больших размерностей эмбеддингов без тестирования того, подходят ли меньшие модели для вашего варианта использования
  • Разбиение документов без перекрытия, потеря контекста между сегментами
  • Пропуск тестирования полноты и измерение только задержки
  • Хранение эмбеддингов без исходного текста или ссылок на метаданные

Часто задаваемые вопросы

В чем разница между индексацией HNSW и IVF?
HNSW (Hierarchical Navigable Small World) обеспечивает более быстрые запросы при более высоком потреблении памяти. IVF (Inverted File) использует меньше памяти, но имеет более низкую скорость запросов. Используйте HNSW для приложений реального времени, IVF для крупномасштабных развертываний с учетом стоимости.
Как выбрать размерность эмбеддинга?
Более высокие размерности (1536)捕捉更多语义细微差别,但会增加存储和延迟。对于大多数用例,从 384-768 维度开始。只有在您有复杂的语义关系和足够的基础设施预算时才使用 1536。
Следует ли использовать предфильтрацию или постфильтрацию для метаданных?
Предварительная фильтрация сужает пространство поиска и повышает производительность, но может пропустить релевантные результаты. Постфильтрация обеспечивает полноту, но тратит вычислительные ресурсы на отфильтрованные результаты. Используйте предфильтрацию для строгих ограничений, постфильтрацию для мягких предпочтений.
Какую векторную базу данных мне использовать?
Pinecone для управляемой простоты, Weaviate для функций гибридного поиска, Qdrant для производительности и фильтрации, pgvector, если вы уже используете PostgreSQL. Выбирайте на основе опыта вашей команды и предпочтений в инфраструктуре.
Как обрабатывать дрейф эмбеддингов?
Дрейф эмбеддингов происходит, когда распределение ваших данных со временем меняется. Ежемесячно отслеживайте метрики качества поиска и планируйте квартальный повторный эмбеддинг для критически важных приложений. Используйте A/B-тестирование для сравнения старых и новых эмбеддингов перед полной миграцией.
Могу ли я использовать этот навык для прямого запроса к моей векторной базе данных?
Нет, этот навык предоставляет рекомендации и генерацию кода для архитектуры и оптимизации векторных баз данных. Он не выполняет запросы или не подключается к вашей базе данных напрямую. Вы должны реализовать предложенный код в своем приложении.

Сведения для разработчиков

Автор

sickn33

Лицензия

MIT

Ссылка

main

Структура файлов

📄 SKILL.md