Fähigkeiten rag-implementation
📚

rag-implementation

Niedriges Risiko 🌐 Netzwerkzugriff⚙️ Externe Befehle🔑 Umgebungsvariablen

Erstellen Sie eine fundierte RAG-Pipeline

Sie benötigen genaue Antworten aus privaten Dokumenten und sich ändernden Daten. Diese Fähigkeit erklärt RAG-Komponenten und Abrufmuster, um Antworten mit Quellen zu untermauern.

Unterstützt: Claude Codex Code(CC)
⚠️ 68 Schlecht
1

Die Skill-ZIP herunterladen

2

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

3

Einschalten und loslegen

Teste es

Verwendung von "rag-implementation". Skizzieren Sie eine RAG-Pipeline für interne Richtlinien mit Zitaten.

Erwartetes Ergebnis:

  • Laden Sie Richtliniendokumente aus einem kontrollierten Ordner und teilen Sie sie in 800-Token-Chunks
  • Erstellen Sie Embeddings mit text-embedding-ada-002 und speichern Sie sie in einer Vektordatenbank
  • Verwenden Sie hybriden Abruf mit BM25 und semantischer Suche, dann Reranking der Top-20-Ergebnisse
  • Antworten Sie mit Zitaten, die Quelldateien und Abschnittsnummern referenzieren

Verwendung von "rag-implementation". Wie wähle ich die Chunk-Größe für technische Dokumentation aus?

Erwartetes Ergebnis:

  • Verwenden Sie 500-1000 Token mit 10-20% Überlappung für die meiste Dokumentation
  • Kleinere Chunks (400 Token) verbessern die Abrufpräzision für spezifische Abfragen
  • Größere Chunks (1500+ Token) funktionieren besser für narrative Inhalte, die Kontext erfordern
  • Fügen Sie Metadaten wie Quelldatei und Abschnittsüberschriften hinzu, um Filterung zu ermöglichen

Verwendung von "rag-implementation". Welche Vektordatenbank sollte ich für ein kleines Team verwenden?

Erwartetes Ergebnis:

  • Chroma für lokale Tests und Prototypen - einfache Einrichtung, keine Infrastruktur
  • Pinecone für verwalteten Service mit automatischer Skalierung und minimalem Betrieb
  • Weaviate für hybride Suchbedürfnisse, die Vektor- und Schlüsselwortabgleich kombinieren
  • Erwägen Sie FAISS für vollständige Offline-Bereitstellung ohne Netzwerkverbindung

Sicherheitsaudit

Niedriges Risiko
v4 • 1/17/2026

This is a documentation-only skill containing Markdown guides with Python code examples. No executable scripts, network calls, or file access capabilities exist in the skill itself. All static findings are false positives from the scanner misinterpreting documentation patterns as security risks. Code examples demonstrate typical RAG patterns using LangChain APIs. No obfuscation, persistence mechanisms, or malicious patterns detected.

2
Gescannte Dateien
604
Analysierte Zeilen
3
befunde
4
Gesamtzahl Audits
Auditiert von: claude Audit-Verlauf anzeigen →

Qualitätsbewertung

38
Architektur
100
Wartbarkeit
85
Inhalt
21
Community
90
Sicherheit
91
Spezifikationskonformität

Was du bauen kannst

RAG-Chatbot entwerfen

Planen Sie eine Abruf-Pipeline, die Antworten mit Zitaten aus interner Dokumentation untermauert.

Abrufqualität evaluieren

Definieren Sie Metriken und Testfälle, um Genauierung, Fundierung und Abrufqualität zu messen.

Vektorspeicher auswählen

Vergleichen Sie Vektordatenbank-Optionen und wählen Sie einen Ansatz, der zu Skalierungs- und Bereitstellungsbedürfnissen passt.

Probiere diese Prompts

RAG-Grundlagen
Erstellen Sie einen einfachen RAG-Plan für eine Dokument-Q&A-App. Einschließlich Datenaufnahme, Chunking, Embeddings, Vektorspeicherwahl und Abruf-Kette.
Hybrider Abruf
Entwerfen Sie eine hybride Abrufstrategie mit dense und BM25. Geben Sie k-Werte, Gewichtungen an und wann Reranking durchgeführt werden soll.
Reranking-Plan
Schlagen Sie einen Reranking-Ansatz mit Cross-Encodern oder MMR vor. Erklären Sie Kandidatengröße und Auswahlkriterien.
Evaluierungsdesign
Entwerfen Sie einen Evaluierungsplan für ein RAG-System. Einschließlich Genauigkeit, Abrufqualität, Fundierungsmetriken und Testfallstruktur.

Bewährte Verfahren

  • Verwenden Sie Metadaten für Filterung und Debugging.
  • Kombinieren Sie hybride Suche mit Reranking für Top-Ergebnisse.
  • Verfolgen Sie Abrufmetriken während der Evaluation.

Vermeiden

  • Indizieren von Dokumenten ohne Chunk-Überschneidung.
  • Überspringen von Zitaten in benutzerorientierten Antworten.
  • Verwenden von nur dichtem Abruf für schlüsselwortlastige Abfragen.

Häufig gestellte Fragen

Welche Plattformen werden unterstützt
Es funktioniert mit Claude, Codex und Claude Code Prompts und ist Framework-agnostisch.
Was sind die Hauptgrenzen
Es bietet nur Anleitung und führt keinen Code aus oder verwaltet Infrastruktur.
Wie integriere ich es in meine App
Folgen Sie den Pipelineschritten und ordnen Sie Loader, Embeddings und Retriever Ihrem Stack zu.
Greift es auf meine Daten zu
Nein. Es ist ein Textleitfaden und liest keine Dateien oder sendet keine Netzwerkanfragen.
Was tun, wenn die Abrufqualität niedrig ist
Passen Sie Chunk-Größe, Embedding-Modell, Filter und Reranking-Gewichtungen an und testen Sie erneut.
Wie unterscheidet sich dies von der grundlegenden Suche
Es kombiniert semantischen Abruf mit Fundierung, was die Relevanz gegenüber der Schlüsselwortsuche verbessert.

Entwicklerdetails

Dateistruktur

📄 SKILL.md