rag-implementation
Erstellen Sie eine fundierte RAG-Pipeline
Sie benötigen genaue Antworten aus privaten Dokumenten und sich ändernden Daten. Diese Fähigkeit erklärt RAG-Komponenten und Abrufmuster, um Antworten mit Quellen zu untermauern.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "rag-implementation". Skizzieren Sie eine RAG-Pipeline für interne Richtlinien mit Zitaten.
Erwartetes Ergebnis:
- Laden Sie Richtliniendokumente aus einem kontrollierten Ordner und teilen Sie sie in 800-Token-Chunks
- Erstellen Sie Embeddings mit text-embedding-ada-002 und speichern Sie sie in einer Vektordatenbank
- Verwenden Sie hybriden Abruf mit BM25 und semantischer Suche, dann Reranking der Top-20-Ergebnisse
- Antworten Sie mit Zitaten, die Quelldateien und Abschnittsnummern referenzieren
Verwendung von "rag-implementation". Wie wähle ich die Chunk-Größe für technische Dokumentation aus?
Erwartetes Ergebnis:
- Verwenden Sie 500-1000 Token mit 10-20% Überlappung für die meiste Dokumentation
- Kleinere Chunks (400 Token) verbessern die Abrufpräzision für spezifische Abfragen
- Größere Chunks (1500+ Token) funktionieren besser für narrative Inhalte, die Kontext erfordern
- Fügen Sie Metadaten wie Quelldatei und Abschnittsüberschriften hinzu, um Filterung zu ermöglichen
Verwendung von "rag-implementation". Welche Vektordatenbank sollte ich für ein kleines Team verwenden?
Erwartetes Ergebnis:
- Chroma für lokale Tests und Prototypen - einfache Einrichtung, keine Infrastruktur
- Pinecone für verwalteten Service mit automatischer Skalierung und minimalem Betrieb
- Weaviate für hybride Suchbedürfnisse, die Vektor- und Schlüsselwortabgleich kombinieren
- Erwägen Sie FAISS für vollständige Offline-Bereitstellung ohne Netzwerkverbindung
Sicherheitsaudit
Niedriges RisikoThis is a documentation-only skill containing Markdown guides with Python code examples. No executable scripts, network calls, or file access capabilities exist in the skill itself. All static findings are false positives from the scanner misinterpreting documentation patterns as security risks. Code examples demonstrate typical RAG patterns using LangChain APIs. No obfuscation, persistence mechanisms, or malicious patterns detected.
Risikofaktoren
🌐 Netzwerkzugriff (3)
⚙️ Externe Befehle (37)
🔑 Umgebungsvariablen (1)
Qualitätsbewertung
Was du bauen kannst
RAG-Chatbot entwerfen
Planen Sie eine Abruf-Pipeline, die Antworten mit Zitaten aus interner Dokumentation untermauert.
Abrufqualität evaluieren
Definieren Sie Metriken und Testfälle, um Genauierung, Fundierung und Abrufqualität zu messen.
Vektorspeicher auswählen
Vergleichen Sie Vektordatenbank-Optionen und wählen Sie einen Ansatz, der zu Skalierungs- und Bereitstellungsbedürfnissen passt.
Probiere diese Prompts
Erstellen Sie einen einfachen RAG-Plan für eine Dokument-Q&A-App. Einschließlich Datenaufnahme, Chunking, Embeddings, Vektorspeicherwahl und Abruf-Kette.
Entwerfen Sie eine hybride Abrufstrategie mit dense und BM25. Geben Sie k-Werte, Gewichtungen an und wann Reranking durchgeführt werden soll.
Schlagen Sie einen Reranking-Ansatz mit Cross-Encodern oder MMR vor. Erklären Sie Kandidatengröße und Auswahlkriterien.
Entwerfen Sie einen Evaluierungsplan für ein RAG-System. Einschließlich Genauigkeit, Abrufqualität, Fundierungsmetriken und Testfallstruktur.
Bewährte Verfahren
- Verwenden Sie Metadaten für Filterung und Debugging.
- Kombinieren Sie hybride Suche mit Reranking für Top-Ergebnisse.
- Verfolgen Sie Abrufmetriken während der Evaluation.
Vermeiden
- Indizieren von Dokumenten ohne Chunk-Überschneidung.
- Überspringen von Zitaten in benutzerorientierten Antworten.
- Verwenden von nur dichtem Abruf für schlüsselwortlastige Abfragen.
Häufig gestellte Fragen
Welche Plattformen werden unterstützt
Was sind die Hauptgrenzen
Wie integriere ich es in meine App
Greift es auf meine Daten zu
Was tun, wenn die Abrufqualität niedrig ist
Wie unterscheidet sich dies von der grundlegenden Suche
Entwicklerdetails
Autor
wshobsonLizenz
MIT
Repository
https://github.com/wshobson/agents/tree/main/plugins/llm-application-dev/skills/rag-implementationRef
main
Dateistruktur
📄 SKILL.md