Fähigkeiten hybrid-search-implementation

📦

hybrid-search-implementation

Name: hybrid-search-implementation
Author: sickn33

Sicher

Hybride Suche für RAG-Systeme implementieren

Auch verfügbar von: wshobson

Reine Vektor- oder Keyword-Suche allein verfehlt oft relevante Ergebnisse. Dieses Skill bietet bewährte Muster für die Kombination beider Ansätze, um eine überlegene Retrieval-Genauigkeit zu erreichen.

Unterstützt: Claude Codex Code(CC)

📊 71 Angemessen

Die Skill-ZIP herunterladen

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

Einschalten und loslegen

Teste es

Verwendung von "hybrid-search-implementation". Benutzer sucht nach 'authentication error 401' in API-Dokumentation

Erwartetes Ergebnis:

Hybride Suche gibt Dokumente zurück, die sowohl dem semantischen Konzept von Authentifizierungsfehlern ALS auch exakte Übereinstimmungen für Fehlercode 401 entsprechen, rangiert nach kombinierter Relevanzbewertung.

Verwendung von "hybrid-search-implementation". Entwickler fragt nach 'how to paginate results' in SDK-Dokumenten

Erwartetes Ergebnis:

Vektorsuche findet semantisch verwandte Paginierungsmuster, während Keyword-Suche sicherstellt, dass exakte Übereinstimmungen für 'limit', 'offset', 'cursor' Terminologie in den Ergebnissen enthalten sind.

Sicherheitsaudit

Sicher

v1 • 2/25/2026

Static analysis flagged 55 patterns but all are false positives. Files are markdown documentation with Python code samples. Backticks are markdown formatting not shell execution. URLs are documentation references not network calls. No cryptographic operations, credential access, or system commands detected. Skill is safe for publication.

Gescannte Dateien

603

Analysierte Zeilen

befunde

Gesamtzahl Audits

Keine Sicherheitsprobleme gefunden

Auditiert von: claude

Qualitätsbewertung

Architektur

100

Wartbarkeit

Inhalt

Community

100

Sicherheit

100

Spezifikationskonformität

Was du bauen kannst

RAG-System-Entwickler

Erstellen Sie Retrieval-augmented Generation-Systeme mit verbesserter Recall, indem Sie semantische Vektorsuche mit exakter Keyword-Übereinstimmung für technische Begriffe und Produktcodes kombinieren.

Suchmaschinen-Entwickler

Implementieren Sie Unternehmenssuche, die sowohl konzeptuelle Abfragen (über Embeddings) als auch präzise Term-Übereinstimmung (über BM25) für umfassende Ergebnisse verarbeitet.

Knowledge-Base-Architekt

Erstellen Sie Dokumentationssuche, die Benutzerabsichten semantisch versteht und gleichzeitig exakte Übereinstimmungen für Fehlercodes, API-Namen und Versionsnummern findet.

Probiere diese Prompts

Grundlegende hybride Such-Einrichtung

Ich muss hybride Suche für mein RAG-System implementieren. Zeigen Sie mir, wie ich Vektor-Embeddings mit Keyword-Suche mit Rezipienter-Rang-Fusion in Python kombinieren kann.

PostgreSQL pgvector Implementierung

Helfen Sie mir, hybride Suche in PostgreSQL mit pgvector für Embeddings und integrierter Volltextsuche einzurichten. Ich benötige SQL-Schema-Erstellung und Abfragebeispiele mit RRF-Fusion.

Elasticsearch hybride Such-Konfiguration

Zeigen Sie mir, wie ich Elasticsearch für hybride Suche konfigurieren kann, die dichte Vektorähnlichkeit mit BM25-Textsuche kombiniert. Einschließlich Index-Mapping, Suchabfragen und RRF-Konfiguration für Elasticsearch 8.x.

Erweiterte RAG-Pipeline mit Re-Ranking

Erstellen Sie eine vollständige hybride RAG-Pipeline, die Kandidaten mit Vektor- und Keyword-Suche abruft, Ergebnisse mit RRF zusammenführt und dann Top-Kandidaten mit einem Cross-Encoder-Modell neu rankt. Einschließlich asynchroner Python-Implementierung mit konfigurierbaren Gewichten.

Bewährte Verfahren

Passen Sie Fusionsgewichte empirisch an Ihren Datensatz an - RRF mit k=60 funktioniert gut als Ausgangspunkt, aber das optimale Gleichgewicht hängt von Ihrem Inhalt ab
Inkludieren Sie immer Cross-Encoder Re-Ranking für Produktionssysteme - die Qualitätsverbesserung rechtfertigt die zusätzliche Latenz für Top-K-Kandidaten
Protokollieren Sie während der Entwicklung sowohl individuelle als auch fusionierte Bewertungen, um zu verstehen, welche Abfragen von jeder Suchmethode profitieren

Vermeiden

Nur Vektorsuche für Domänen mit Exact-Match-Anforderungen wie Produktcodes, Fehlermeldungen oder Versionsnummern verwenden
Zu viele Kandidaten vor der Fusion abzurufen, was die Latenz erhöht, ohne die Ergebnisqualität zu verbessern
Annehmen, dass feste Fusionsgewichte für alle Abfragetypen ohne A/B-Tests oder Abfrage-Level-Optimierung funktionieren

Häufig gestellte Fragen

Wann sollte ich RRF versus lineare Fusion verwenden?

RRF ist einfacher und erfordert keine Tuning - es funktioniert gut sofort. Lineare Fusion bietet mehr Kontrolle, erfordert aber empirisches Gewicht-Tuning auf Ihren Daten. Beginnen Sie mit RRF, wechseln Sie zu linear, wenn Sie feinkörnige Kontrolle benötigen.

Wie viele Kandidaten sollte ich vor der Fusion abrufen?

Typischerweise 3x Ihr endgültiges Limit pro Methode. Für Top-10-Ergebnisse rufen Sie 30 von jeder Suchmethode ab. Dies bietet ausreichende Überlappung für effektive Fusion ohne übermäßige Latenz.

Ist Cross-Encoder Re-Ranking die Rechenkosten wert?

Ja für produktives RAG. Re-Ranking von 50 Kandidaten fügt ~100-500ms hinzu, verbessert aber die Relevanz erheblich. Wenden Sie Re-Ranking nur auf fusionierte Top-K-Kandidaten an, nicht auf den vollständigen Kandidatensatz.

Kann ich hybride Suche mit bestehenden Vektordatenbanken verwenden?

Die meisten Vektordatenbanken unterstützen jetzt native hybride Suche. Pinecone, Weaviate, Qdrant und pgvector bieten alle integrierte hybride Suche mit konfigurierbaren Fusionsparametern.

Welche Embedding-Modelle funktionieren am besten für hybride Suche?

Jedes Embedding-Modell funktioniert, da hybride Suche Embeddings mit Keyword-Suche kombiniert. OpenAI text-embedding-3, Cohere embed-v3 oder Open-Source-Modelle wie BGE funktionieren alle effektiv.

Wie gehe ich mit Abfragen um, die rein semantisch oder rein keyword-basiert sind?

Kurze exakte Abfragen (Fehlercodes, IDs) - erhöhen Sie das Keyword-Gewicht. Natürlichsprachliche Fragen - erhöhen Sie das Vektorgewicht. Erweiterte Systeme verwenden Abfrage-Klassifikation, um dynamische Gewichte festzulegen.

Entwicklerdetails

Autor

sickn33

Lizenz

MIT

Repository

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/hybrid-search-implementation

Ref

main

Dateistruktur

📁 resources/

📄 implementation-playbook.md

📄 SKILL.md