Fähigkeiten hybrid-search-implementation
📦

hybrid-search-implementation

Sicher

Hybride Suche für RAG-Systeme implementieren

Auch verfügbar von: wshobson

Reine Vektor- oder Keyword-Suche allein verfehlt oft relevante Ergebnisse. Dieses Skill bietet bewährte Muster für die Kombination beider Ansätze, um eine überlegene Retrieval-Genauigkeit zu erreichen.

Unterstützt: Claude Codex Code(CC)
🥉 72 Bronze
1

Die Skill-ZIP herunterladen

2

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

3

Einschalten und loslegen

Teste es

Verwendung von "hybrid-search-implementation". Benutzer sucht nach 'authentication error 401' in API-Dokumentation

Erwartetes Ergebnis:

Hybride Suche gibt Dokumente zurück, die sowohl dem semantischen Konzept von Authentifizierungsfehlern ALS auch exakte Übereinstimmungen für Fehlercode 401 entsprechen, rangiert nach kombinierter Relevanzbewertung.

Verwendung von "hybrid-search-implementation". Entwickler fragt nach 'how to paginate results' in SDK-Dokumenten

Erwartetes Ergebnis:

Vektorsuche findet semantisch verwandte Paginierungsmuster, während Keyword-Suche sicherstellt, dass exakte Übereinstimmungen für 'limit', 'offset', 'cursor' Terminologie in den Ergebnissen enthalten sind.

Sicherheitsaudit

Sicher
v1 • 2/25/2026

Static analysis flagged 55 patterns but all are false positives. Files are markdown documentation with Python code samples. Backticks are markdown formatting not shell execution. URLs are documentation references not network calls. No cryptographic operations, credential access, or system commands detected. Skill is safe for publication.

2
Gescannte Dateien
603
Analysierte Zeilen
0
befunde
1
Gesamtzahl Audits
Keine Sicherheitsprobleme gefunden
Auditiert von: claude

Qualitätsbewertung

38
Architektur
100
Wartbarkeit
87
Inhalt
32
Community
100
Sicherheit
100
Spezifikationskonformität

Was du bauen kannst

RAG-System-Entwickler

Erstellen Sie Retrieval-augmented Generation-Systeme mit verbesserter Recall, indem Sie semantische Vektorsuche mit exakter Keyword-Übereinstimmung für technische Begriffe und Produktcodes kombinieren.

Suchmaschinen-Entwickler

Implementieren Sie Unternehmenssuche, die sowohl konzeptuelle Abfragen (über Embeddings) als auch präzise Term-Übereinstimmung (über BM25) für umfassende Ergebnisse verarbeitet.

Knowledge-Base-Architekt

Erstellen Sie Dokumentationssuche, die Benutzerabsichten semantisch versteht und gleichzeitig exakte Übereinstimmungen für Fehlercodes, API-Namen und Versionsnummern findet.

Probiere diese Prompts

Grundlegende hybride Such-Einrichtung
Ich muss hybride Suche für mein RAG-System implementieren. Zeigen Sie mir, wie ich Vektor-Embeddings mit Keyword-Suche mit Rezipienter-Rang-Fusion in Python kombinieren kann.
PostgreSQL pgvector Implementierung
Helfen Sie mir, hybride Suche in PostgreSQL mit pgvector für Embeddings und integrierter Volltextsuche einzurichten. Ich benötige SQL-Schema-Erstellung und Abfragebeispiele mit RRF-Fusion.
Elasticsearch hybride Such-Konfiguration
Zeigen Sie mir, wie ich Elasticsearch für hybride Suche konfigurieren kann, die dichte Vektorähnlichkeit mit BM25-Textsuche kombiniert. Einschließlich Index-Mapping, Suchabfragen und RRF-Konfiguration für Elasticsearch 8.x.
Erweiterte RAG-Pipeline mit Re-Ranking
Erstellen Sie eine vollständige hybride RAG-Pipeline, die Kandidaten mit Vektor- und Keyword-Suche abruft, Ergebnisse mit RRF zusammenführt und dann Top-Kandidaten mit einem Cross-Encoder-Modell neu rankt. Einschließlich asynchroner Python-Implementierung mit konfigurierbaren Gewichten.

Bewährte Verfahren

  • Passen Sie Fusionsgewichte empirisch an Ihren Datensatz an - RRF mit k=60 funktioniert gut als Ausgangspunkt, aber das optimale Gleichgewicht hängt von Ihrem Inhalt ab
  • Inkludieren Sie immer Cross-Encoder Re-Ranking für Produktionssysteme - die Qualitätsverbesserung rechtfertigt die zusätzliche Latenz für Top-K-Kandidaten
  • Protokollieren Sie während der Entwicklung sowohl individuelle als auch fusionierte Bewertungen, um zu verstehen, welche Abfragen von jeder Suchmethode profitieren

Vermeiden

  • Nur Vektorsuche für Domänen mit Exact-Match-Anforderungen wie Produktcodes, Fehlermeldungen oder Versionsnummern verwenden
  • Zu viele Kandidaten vor der Fusion abzurufen, was die Latenz erhöht, ohne die Ergebnisqualität zu verbessern
  • Annehmen, dass feste Fusionsgewichte für alle Abfragetypen ohne A/B-Tests oder Abfrage-Level-Optimierung funktionieren

Häufig gestellte Fragen

Wann sollte ich RRF versus lineare Fusion verwenden?
RRF ist einfacher und erfordert keine Tuning - es funktioniert gut sofort. Lineare Fusion bietet mehr Kontrolle, erfordert aber empirisches Gewicht-Tuning auf Ihren Daten. Beginnen Sie mit RRF, wechseln Sie zu linear, wenn Sie feinkörnige Kontrolle benötigen.
Wie viele Kandidaten sollte ich vor der Fusion abrufen?
Typischerweise 3x Ihr endgültiges Limit pro Methode. Für Top-10-Ergebnisse rufen Sie 30 von jeder Suchmethode ab. Dies bietet ausreichende Überlappung für effektive Fusion ohne übermäßige Latenz.
Ist Cross-Encoder Re-Ranking die Rechenkosten wert?
Ja für produktives RAG. Re-Ranking von 50 Kandidaten fügt ~100-500ms hinzu, verbessert aber die Relevanz erheblich. Wenden Sie Re-Ranking nur auf fusionierte Top-K-Kandidaten an, nicht auf den vollständigen Kandidatensatz.
Kann ich hybride Suche mit bestehenden Vektordatenbanken verwenden?
Die meisten Vektordatenbanken unterstützen jetzt native hybride Suche. Pinecone, Weaviate, Qdrant und pgvector bieten alle integrierte hybride Suche mit konfigurierbaren Fusionsparametern.
Welche Embedding-Modelle funktionieren am besten für hybride Suche?
Jedes Embedding-Modell funktioniert, da hybride Suche Embeddings mit Keyword-Suche kombiniert. OpenAI text-embedding-3, Cohere embed-v3 oder Open-Source-Modelle wie BGE funktionieren alle effektiv.
Wie gehe ich mit Abfragen um, die rein semantisch oder rein keyword-basiert sind?
Kurze exakte Abfragen (Fehlercodes, IDs) - erhöhen Sie das Keyword-Gewicht. Natürlichsprachliche Fragen - erhöhen Sie das Vektorgewicht. Erweiterte Systeme verwenden Abfrage-Klassifikation, um dynamische Gewichte festzulegen.