Fähigkeiten rag-implementation

📚

rag-implementation

Name: rag-implementation
Author: wshobson

Niedriges Risiko 🌐 Netzwerkzugriff⚙️ Externe Befehle🔑 Umgebungsvariablen

Erstellen Sie eine fundierte RAG-Pipeline

Auch verfügbar von: sickn33

Sie benötigen genaue Antworten aus privaten Dokumenten und sich ändernden Daten. Diese Fähigkeit erklärt RAG-Komponenten und Abrufmuster, um Antworten mit Quellen zu untermauern.

Unterstützt: Claude Codex Code(CC)

⚠️ 68 Schlecht

Die Skill-ZIP herunterladen

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

Einschalten und loslegen

Teste es

Verwendung von "rag-implementation". Skizzieren Sie eine RAG-Pipeline für interne Richtlinien mit Zitaten.

Erwartetes Ergebnis:

Laden Sie Richtliniendokumente aus einem kontrollierten Ordner und teilen Sie sie in 800-Token-Chunks
Erstellen Sie Embeddings mit text-embedding-ada-002 und speichern Sie sie in einer Vektordatenbank
Verwenden Sie hybriden Abruf mit BM25 und semantischer Suche, dann Reranking der Top-20-Ergebnisse
Antworten Sie mit Zitaten, die Quelldateien und Abschnittsnummern referenzieren

Verwendung von "rag-implementation". Wie wähle ich die Chunk-Größe für technische Dokumentation aus?

Erwartetes Ergebnis:

Verwenden Sie 500-1000 Token mit 10-20% Überlappung für die meiste Dokumentation
Kleinere Chunks (400 Token) verbessern die Abrufpräzision für spezifische Abfragen
Größere Chunks (1500+ Token) funktionieren besser für narrative Inhalte, die Kontext erfordern
Fügen Sie Metadaten wie Quelldatei und Abschnittsüberschriften hinzu, um Filterung zu ermöglichen

Verwendung von "rag-implementation". Welche Vektordatenbank sollte ich für ein kleines Team verwenden?

Erwartetes Ergebnis:

Chroma für lokale Tests und Prototypen - einfache Einrichtung, keine Infrastruktur
Pinecone für verwalteten Service mit automatischer Skalierung und minimalem Betrieb
Weaviate für hybride Suchbedürfnisse, die Vektor- und Schlüsselwortabgleich kombinieren
Erwägen Sie FAISS für vollständige Offline-Bereitstellung ohne Netzwerkverbindung

Sicherheitsaudit

Niedriges Risiko

v4 • 1/17/2026

This is a documentation-only skill containing Markdown guides with Python code examples. No executable scripts, network calls, or file access capabilities exist in the skill itself. All static findings are false positives from the scanner misinterpreting documentation patterns as security risks. Code examples demonstrate typical RAG patterns using LangChain APIs. No obfuscation, persistence mechanisms, or malicious patterns detected.

Gescannte Dateien

604

Analysierte Zeilen

befunde

Gesamtzahl Audits

Risikofaktoren

🌐 Netzwerkzugriff (3)

skill-report.json:180 skill-report.json:6 SKILL.md:236

⚙️ Externe Befehle (37)

🔑 Umgebungsvariablen (1)

SKILL.md:224

Auditiert von: claude Audit-Verlauf anzeigen →

Qualitätsbewertung

Architektur

100

Wartbarkeit

Inhalt

Community

Sicherheit

Spezifikationskonformität

Was du bauen kannst

RAG-Chatbot entwerfen

Planen Sie eine Abruf-Pipeline, die Antworten mit Zitaten aus interner Dokumentation untermauert.

Abrufqualität evaluieren

Definieren Sie Metriken und Testfälle, um Genauierung, Fundierung und Abrufqualität zu messen.

Vektorspeicher auswählen

Vergleichen Sie Vektordatenbank-Optionen und wählen Sie einen Ansatz, der zu Skalierungs- und Bereitstellungsbedürfnissen passt.

Probiere diese Prompts

RAG-Grundlagen

Erstellen Sie einen einfachen RAG-Plan für eine Dokument-Q&A-App. Einschließlich Datenaufnahme, Chunking, Embeddings, Vektorspeicherwahl und Abruf-Kette.

Hybrider Abruf

Entwerfen Sie eine hybride Abrufstrategie mit dense und BM25. Geben Sie k-Werte, Gewichtungen an und wann Reranking durchgeführt werden soll.

Reranking-Plan

Schlagen Sie einen Reranking-Ansatz mit Cross-Encodern oder MMR vor. Erklären Sie Kandidatengröße und Auswahlkriterien.

Evaluierungsdesign

Entwerfen Sie einen Evaluierungsplan für ein RAG-System. Einschließlich Genauigkeit, Abrufqualität, Fundierungsmetriken und Testfallstruktur.

Bewährte Verfahren

Verwenden Sie Metadaten für Filterung und Debugging.
Kombinieren Sie hybride Suche mit Reranking für Top-Ergebnisse.
Verfolgen Sie Abrufmetriken während der Evaluation.

Vermeiden

Indizieren von Dokumenten ohne Chunk-Überschneidung.
Überspringen von Zitaten in benutzerorientierten Antworten.
Verwenden von nur dichtem Abruf für schlüsselwortlastige Abfragen.

Häufig gestellte Fragen

Welche Plattformen werden unterstützt

Es funktioniert mit Claude, Codex und Claude Code Prompts und ist Framework-agnostisch.

Was sind die Hauptgrenzen

Es bietet nur Anleitung und führt keinen Code aus oder verwaltet Infrastruktur.

Wie integriere ich es in meine App

Folgen Sie den Pipelineschritten und ordnen Sie Loader, Embeddings und Retriever Ihrem Stack zu.

Greift es auf meine Daten zu

Nein. Es ist ein Textleitfaden und liest keine Dateien oder sendet keine Netzwerkanfragen.

Was tun, wenn die Abrufqualität niedrig ist

Passen Sie Chunk-Größe, Embedding-Modell, Filter und Reranking-Gewichtungen an und testen Sie erneut.

Wie unterscheidet sich dies von der grundlegenden Suche

Es kombiniert semantischen Abruf mit Fundierung, was die Relevanz gegenüber der Schlüsselwortsuche verbessert.

Entwicklerdetails

Autor

wshobson

Lizenz

MIT

Repository

https://github.com/wshobson/agents/tree/main/plugins/llm-application-dev/skills/rag-implementation

Ref

main

Dateistruktur

📄 SKILL.md