rag-implementation
Создание RAG-пайплайна с обоснованными ответами
Вам нужны точные ответы на основе закрытых документов и меняющихся данных. Этот навык объясняет компоненты RAG и шаблоны поиска для обоснования ответов источниками.
Скачать ZIP навыка
Загрузить в Claude
Перейдите в Settings → Capabilities → Skills → Upload skill
Включите и начните использовать
Протестировать
Использование «rag-implementation». Опиши RAG-пайплайн для внутренних политик с цитированием.
Ожидаемый результат:
- Загрузить документы с политиками из контролируемой папки и разбить на фрагменты по 800 токенов
- Создать эмбеддинги с помощью text-embedding-ada-002 и сохранить их в векторной базе данных
- Использовать гибридный поиск, сочетающий BM25 и семантический поиск, затем переранжировать топ-20 результатов
- Ответить с цитатами, ссылающимися на исходные файлы и номера разделов
Использование «rag-implementation». Как выбрать размер фрагмента (chunk size) для технической документации?
Ожидаемый результат:
- Используйте 500-1000 токенов с перекрытием 10-20% для большинства документации
- Меньшие фрагменты (400 токенов) улучшают точность поиска для конкретных запросов
- Более крупные фрагменты (1500+ токенов) лучше подходят для повествовательного контента, требующего контекста
- Добавьте метаданные, такие как исходный файл и заголовки разделов, для включения фильтрации
Использование «rag-implementation». Какую векторную базу данных использовать для небольшой команды?
Ожидаемый результат:
- Chroma для локального тестирования и прототипов - простая настройка, без инфраструктуры
- Pinecone как управляемый сервис с автоматическим масштабированием и минимальными операциями
- Weaviate для нужд гибридного поиска, сочетающего векторное и ключевое сопоставление
- Рассмотрите FAISS для полного офлайн-развертывания без необходимости сети
Аудит безопасности
Низкий рискThis is a documentation-only skill containing Markdown guides with Python code examples. No executable scripts, network calls, or file access capabilities exist in the skill itself. All static findings are false positives from the scanner misinterpreting documentation patterns as security risks. Code examples demonstrate typical RAG patterns using LangChain APIs. No obfuscation, persistence mechanisms, or malicious patterns detected.
Факторы риска
🌐 Доступ к сети (3)
⚙️ Внешние команды (37)
🔑 Переменные окружения (1)
Оценка качества
Что вы можете построить
Проектирование RAG-чатбота
Планирование поискового пайплайна, который обосновывает ответы цитатами из внутренней документации.
Оценка качества поиска
Определение метрик и тестовых случаев для измерения точности, обоснованности и качества поиска.
Выбор векторного хранилища
Сравнение вариантов векторных баз данных и выбор подхода, соответствующего потребностям масштабирования и развертывания.
Попробуйте эти промпты
Создай простой план RAG для приложения вопросов и ответов по документам. Включи загрузку данных, разбивку на фрагменты (chunking), эмбеддинги, выбор векторного хранилища и цепочку поиска.
Разработай стратегию гибридного поиска с использованием dense (плотного) поиска и BM25. Укажи значения k, веса и когда выполнять переранжирование.
Предложи подход к переранжированию с использованием cross-encoders или MMR. Объясни размер выборки кандидатов и критерии отбора.
Составь план оценки для системы RAG. Включи метрики точности, качества поиска и обоснованности, а также структуру тестовых случаев.
Лучшие практики
- Используйте метаданные для фильтрации и отладки.
- Сочетайте гибридный поиск с переранжированием для получения лучших результатов.
- Отслеживайте метрики поиска во время оценки.
Избегать
- Индексация документов без перекрытия фрагментов (chunk overlap).
- Отсутствие цитат в ответах пользователю.
- Использование только плотного поиска (dense retrieval) для запросов с большим количеством ключевых слов.
Часто задаваемые вопросы
Какие платформы поддерживаются
Каковы основные ограничения
Как мне интегрировать это в мое приложение
Имеет ли это доступ к моим данным
Что делать, если качество поиска низкое
Чем это отличается от обычного поиска
Сведения для разработчиков
Автор
wshobsonЛицензия
MIT
Репозиторий
https://github.com/wshobson/agents/tree/main/plugins/llm-application-dev/skills/rag-implementationСсылка
main
Структура файлов
📄 SKILL.md