Навыки rag-engineer
📦

rag-engineer

Безопасно

Создание производственных RAG-систем

RAG-системы часто не работают из-за плохих стратегий чанкования и наивного поиска. Этот навык предоставляет экспертные паттерны для семантического чанкования, гибридного поиска и оптимизации контекста для создания производственных систем поиска.

Поддерживает: Claude Codex Code(CC)
⚠️ 64 Плохо
1

Скачать ZIP навыка

2

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

3

Включите и начните использовать

Протестировать

Использование «rag-engineer». Как мне следует чанковать PDF-документы с заголовками и таблицами для RAG-системы?

Ожидаемый результат:

Используйте семантическое чанкование, учитывающее структуру документа: (1) Распарсите PDF для извлечения заголовков, абзацев и границ таблиц, (2) Чанкуйте на уровне абзацев, сохраняя метаданные заголовков, (3) Добавьте 10-20% перекрытия между чанками для непрерывности контекста, (4) Сохраните структурные метаданные для фильтрации при поиске. Этот подход сохраняет смысл лучше, чем чанкование фиксированным числом токенов.

Использование «rag-engineer». Моя RAG-система возвращает релевантные документы, но ответы всё равно плохие. Как мне это отладить?

Ожидаемый результат:

Разделите оценку поиска и генерации: (1) Проверьте точность поиска, вручную проверив top-k результаты, (2) Измерьте hit rate и MRR на тестовом наборе, (3) Если поиск в порядке, проблема в вашем промпте или выборе LLM. Частое решение: добавьте этап переранжирования между первоначальным поиском и финальной генерацией.

Аудит безопасности

Безопасно
v1 • 2/24/2026

All 16 static findings evaluated as false positives. The skill is a legitimate RAG (Retrieval-Augmented Generation) engineering documentation skill. External commands flagged are markdown code fence syntax (backticks) showing JavaScript examples. Cryptographic and reconnaissance warnings match keywords in context of semantic search and data pipelines, not security-relevant code.

1
Просканировано файлов
95
Проанализировано строк
3
находки
1
Всего аудитов

Критические проблемы (3)

External Commands - False Positive
Markdown code fence syntax (backticks) containing JavaScript code examples. Lines 38-91 contain documentation examples for semantic chunking, hierarchical retrieval, and hybrid search implementations. No actual shell or Ruby execution.
Weak Cryptographic Algorithm - False Positive
Scanner incorrectly matches keywords: 'generation' (in Retrieval-Augmented Generation), 'pipeline' (data pipeline), 'execute' (workflow). No cryptographic code present.
System Reconnaissance - False Positive
Scanner flags 'search' in context of semantic search and hybrid search. This is vector search in RAG systems, not network reconnaissance.
Проверено: claude

Оценка качества

38
Архитектура
100
Сопровождаемость
87
Контент
31
Сообщество
55
Безопасность
100
Соответствие спецификации

Что вы можете построить

Построение системы вопрос-ответ для документов

Создание RAG-системы вопрос-ответ, которая точно извлекает релевантный контекст из больших коллекций документов

Улучшение точности существующей RAG-системы

Диагностика и исправление проблем качества поиска в существующей RAG-реализации с использованием продвинутого чанкования и гибридного поиска

Проектирование системы многошагового рассуждения

Архитектура системы, способной отвечать на сложные вопросы, требующие информации из нескольких исходных документов

Попробуйте эти промпты

Базовый паттерн RAG-запроса
Как мне следует чанковать мои [document type] для RAG-системы? Какие стратегии сохраняют смысл и контекст?
Реализация гибридного поиска
Спроектируйте систему гибридного поиска, сочетающую сопоставление ключевых слов BM25 с векторным сходством. Как объединить оценки?
Оценка поиска
Как мне оценить мою систему поиска отдельно от генерации LLM? Какие метрики следует отслеживать?
Оптимизация контекстного окна
Мой извлечённый контекст превышает контекстное окно LLM. Как выбрать наиболее релевантные чанки, сохранив связность?

Лучшие практики

  • Всегда оценивайте качество поиска отдельно от генерации, используя метрики вроде hit rate и MRR
  • Используйте семантическое чанкование, учитывающее структуру документа, а не фиксированное количество токенов
  • Реализуйте гибридный поиск для объединения семантического понимания с точным сопоставлением ключевых слов

Избегать

  • Использование чанкования фиксированного размера независимо от структуры контента — это разрывает предложения и теряет смысл
  • Эмбеддинг всего без фильтрации — увеличивает стоимость и снижает релевантность
  • Пропуск оценки поиска — предположение, что проблемы генерации всегда являются проблемами LLM

Часто задаваемые вопросы

Что такое семантическое чанкование?
Семантическое чанкование разделяет документы по смыслу, а не по произвольному количеству токенов. Оно использует сходство эмбеддингов для обнаружения смен тем и сохраняет структуру документа, такую как заголовки и абзацы.
Когда следует использовать гибридный поиск?
Используйте гибридный поиск, когда запросы содержат специфические термины (имена, коды, точные фразы) наряду с семантическими концепциями. Он сочетает BM25 для сопоставления ключевых слов с векторным сходством для семантического понимания.
Как мне оценить качество поиска RAG?
Используйте метрики вроде hit rate (релевантные документы в top-k), mean reciprocal rank (качество ранжирования) и recall. Создайте тестовый набор запросов с эталонными релевантными документами.
Что такое reciprocal rank fusion?
Reciprocal Rank Fusion (RRF) объединяет ранжирования из нескольких методов поиска. Он преобразует ранги в оценки по формуле 1/(rank + k) и суммирует их, получая единое ранжирование без нормализации оценок.
Как мне работать с длинными документами, превышающими контекстные окна?
Используйте иерархический поиск: индексируйте на нескольких уровнях гранулярности (абзац, раздел, документ), сначала извлекайте грубые результаты, затем получайте детализированные чанки из релевантных разделов.
Какую модель эмбеддингов мне следует использовать?
Выбирайте в зависимости от вашего варианта использования. Модели общего назначения работают в большинстве случаев. Существуют специализированные модели для кода, научных текстов или многоязычного контента. Всегда тестируйте на ваших конкретных данных.

Сведения для разработчиков

Автор

sickn33

Лицензия

MIT

Ссылка

main

Структура файлов

📄 SKILL.md