Реализация RAG-систем требует координации множества компонентов, включая эмбеддинги, векторные базы данных и конвейеры извлечения. Этот рабочий процесс обеспечивает структурированный подход к созданию готовых к продакшену RAG-приложений.
Скачать ZIP навыка
Загрузить в Claude
Перейдите в Settings → Capabilities → Skills → Upload skill
Включите и начните использовать
Протестировать
Использование «rag-implementation». Help me start building a RAG system
Ожидаемый результат:
- Фаза 1: Анализ требований — определите ваш вариант использования (вопросы и ответы по документам, семантический поиск и т.д.), определите источники данных, установите требования к точности и целевые показатели задержки
- Фаза 2: Выбор эмбеддингов — оцените модели эмбеддингов, протестируйте релевантность домену, измерьте качество эмбеддингов, рассмотрите компромиссы между стоимостью и задержкой
- Фаза 3: Настройка векторной базы данных — выберите векторную базу данных (Pinecone, Weaviate, Chroma), спроектируйте схему, настройте индексы, установите соединения
Использование «rag-implementation». Which embedding model should I use?
Ожидаемый результат:
- Учтите следующие факторы: релевантность домену (протестируйте с вашими данными), требования к размерности эмбеддингов, ограничения по задержке и стоимость за 1K токенов
- Распространённые варианты: OpenAI text-embedding-ada-002 для общего использования, Cohere для многоязычности, sentence-transformers для самостоятельного хостинга
- Рекомендация: протестируйте топ-3 кандидата с вашими реальными данными, используя точность извлечения в качестве решающей метрики
Аудит безопасности
БезопасноStatic analysis flagged 45 potential issues (external_commands, weak crypto, system reconnaissance). Manual evaluation confirms these are false positives. The skill contains only markdown documentation with code block examples referencing other skills. No actual shell commands, cryptographic algorithms, or system reconnaissance code exists. This is a documentation-only skill providing RAG implementation workflow guidance.
Проблемы низкого риска (3)
Оценка качества
Что вы можете построить
Создание системы вопросов и ответов по документам
Создайте приложение для ответов на вопросы по базе знаний, которое извлекает релевантные документы и генерирует ответы с помощью LLM.
Реализация семантического поиска
Настройте возможности семантического поиска по коллекциям документов с использованием эмбеддингов и векторного сходства.
Оптимизация RAG-конвейера
Оцените и улучшите производительность существующей RAG-системы через систематическую оптимизацию извлечения.
Попробуйте эти промпты
Help me start building a RAG system. Use @rag-implementation to guide me through the initial phases.
I need to choose an embedding model for my RAG system. Walk me through Phase 2 of the RAG implementation workflow.
Set up a vector database for my RAG application. Follow the Phase 3 vector database setup workflow.
Help me evaluate my RAG system quality. Use the Phase 8 evaluation workflow to define metrics and test approach.
Лучшие практики
- Начните с анализа требований Фазы 1 перед погружением в техническую реализацию
- Тестируйте качество извлечения с репрезентативными запросами перед интеграцией с LLM
- Используйте метрики оценки из Фазы 8 для проверки завершения каждой фазы
Избегать
- Пропуск анализа требований и переход непосредственно к выбору эмбеддингов
- Использование чанкинга по умолчанию без учёта структуры документов и паттернов запросов
- Интеграция LLM до проверки качества извлечения с помощью простых тестов
Часто задаваемые вопросы
Выполняет ли этот навык код?
На какие другие навыки ссылается этот навык?
Какие векторные базы данных поддерживаются?
Могу ли я использовать это для продакшен-систем?
Сколько времени занимает полная реализация?
Совместим ли этот навык с Claude Code?
Сведения для разработчиков
Автор
sickn33Лицензия
MIT
Репозиторий
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/rag-implementationСсылка
main
Структура файлов
📄 SKILL.md