rag-implementation
Construire des systèmes RAG étape par étape
Également disponible depuis: wshobson
La mise en œuvre de systèmes RAG nécessite la coordination de plusieurs composants, notamment les embeddings, les bases de données vectorielles et les pipelines de retrieval. Ce workflow offre une approche structurée pour construire des applications RAG prêtes pour la production.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "rag-implementation". Help me start building a RAG system
Résultat attendu:
- Phase 1: Analyse des exigences - Définissez votre cas d'utilisation (Q&A sur documents, recherche sémantique, etc.), identifiez les sources de données, définissez les exigences de précision et les objectifs de latence
- Phase 2: Sélection des embeddings - Évaluez les modèles d'embedding, testez la pertinence du domaine, mesurez la qualité des embeddings,考虑z les compromis coût et latence
- Phase 3: Configuration de la base de données vectorielle - Choisissez une base de données vectorielle (Pinecone, Weaviate, Chroma), concevez le schéma, configurez les indexes, établissez les connexions
Utilisation de "rag-implementation". Which embedding model should I use?
Résultat attendu:
- Considérez ces facteurs: pertinence du domaine (testez avec vos données), exigences de dimensionnement des embeddings, contraintes de latence, et coût par 1K de tokens
- Options courantes: OpenAI text-embedding-ada-002 pour usage général, Cohere pour le multilingue, sentence-transformers pour auto-hébergement
- Recommandation: Testez les 3 meilleures candidates avec vos données réelles en utilisant la précision du retrieval comme métrique décisive
Audit de sécurité
SûrStatic analysis flagged 45 potential issues (external_commands, weak crypto, system reconnaissance). Manual evaluation confirms these are false positives. The skill contains only markdown documentation with code block examples referencing other skills. No actual shell commands, cryptographic algorithms, or system reconnaissance code exists. This is a documentation-only skill providing RAG implementation workflow guidance.
Problèmes à risque faible (3)
Score de qualité
Ce que vous pouvez construire
Construire un système de Q&A sur documents
Créer une application de Q&A sur base de connaissances qui récupère les documents pertinents et génère des réponses en utilisant un LLM.
Implémenter la recherche sémantique
Configurer des capacités de recherche sémantique sur des collections de documents en utilisant les embeddings et la similarité vectorielle.
Optimiser le pipeline RAG
Évaluer et améliorer les performances du système RAG existant grâce à une optimisation systématique du retrieval.
Essayez ces prompts
Aidez-moi à commencer à construire un système RAG. Utilisez @rag-implementation pour me guider à travers les phases initiales.
Je dois choisir un modèle d'embedding pour mon système RAG. Parcourez avec moi la Phase 2 du workflow d'implémentation RAG.
Configurez une base de données vectorielle pour mon application RAG. Suivez le workflow de configuration de la Phase 3.
Aidez-moi à évaluer la qualité de mon système RAG. Utilisez le workflow d'évaluation de la Phase 8 pour définir les métriques et l'approche de test.
Bonnes pratiques
- Commencez par l'analyse des exigences de la Phase 1 avant de vous lancer dans l'implémentation technique
- Testez la qualité du retrieval avec des requêtes représentatives avant d'intégrer le LLM
- Utilisez les métriques d'évaluation de la Phase 8 pour valider chaque phase
Éviter
- Sauter l'analyse des exigences et passer directement à la sélection des embeddings
- Utiliser le chunking par défaut sans considérer la structure des documents et les modèles de requêtes
- Intégrer le LLM avant d'avoir vérifié la qualité du retrieval avec des tests simples