hybrid-search-implementation
Implémenter la recherche hybride pour les systèmes RAG
Également disponible depuis: wshobson
La recherche purement vectorielle ou par mots-clés seule manque souvent des résultats pertinents. Cette compétence fournit des modèles éprouvés pour combiner les deux approches afin d'obtenir une précision de récupération supérieure.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "hybrid-search-implementation". L'utilisateur recherche 'authentication error 401' dans la documentation API
Résultat attendu:
La recherche hybride retourne des documents correspondant à la fois au concept sémantique des échecs d'authentification ET aux correspondances exactes pour le code d'erreur 401, classés par score de pertinence combiné.
Utilisation de "hybrid-search-implementation". Le développeur demande 'how to paginate results' dans la docs du SDK
Résultat attendu:
La recherche vectorielle trouve des modèles de pagination sémantiquement liés tandis que la recherche par mots-clés garantit que les correspondances exactes pour la terminologie 'limit', 'offset', 'cursor' sont incluses dans les résultats.
Audit de sécurité
SûrStatic analysis flagged 55 patterns but all are false positives. Files are markdown documentation with Python code samples. Backticks are markdown formatting not shell execution. URLs are documentation references not network calls. No cryptographic operations, credential access, or system commands detected. Skill is safe for publication.
Score de qualité
Ce que vous pouvez construire
Développeur de systèmes RAG
Construisez des systèmes de génération augmentée par récupération avec un rappel amélioré en combinant la recherche sémantique vectorielle avec la correspondance exacte par mots-clés pour les termes techniques et les codes produit.
Créateur de moteur de recherche
Implémentez une recherche d'entreprise qui gère à la fois les requêtes conceptuelles (via embeddings) et la correspondance de termes précise (via BM25) pour des résultats complets.
Architecte de base de connaissances
Créez une recherche de documentation qui comprend l'intention utilisateur de manière sémantique tout en trouvant des correspondances exactes pour les codes d'erreur, les noms d'API et les numéros de version.
Essayez ces prompts
I need to implement hybrid search for my RAG system. Show me how to combine vector embeddings with keyword search using Reciprocal Rank Fusion in Python.
Help me set up hybrid search in PostgreSQL using pgvector for embeddings and built-in full-text search. I need SQL schema creation and query examples with RRF fusion.
Show me how to configure Elasticsearch for hybrid search combining dense vector similarity with BM25 text search. Include index mapping, search queries, and RRF configuration for Elasticsearch 8.x.
Build a complete hybrid RAG pipeline that retrieves candidates with vector and keyword search, fuses results with RRF, then reranks top candidates using a cross-encoder model. Include async Python implementation with configurable weights.
Bonnes pratiques
- Ajustez les poids de fusion de manière empirique sur votre jeu de données - RRF avec k=60 fonctionne bien comme point de départ mais l'équilibre optimal dépend de votre contenu
- Incluez toujours un reranking cross-encoder pour les systèmes de production - l'amélioration de qualité justifie la latence supplémentaire pour les candidats top-k
- Journalisez les scores individuels et les scores fusionnés pendant le développement pour comprendre quelles requêtes bénéficient de chaque méthode de recherche
Éviter
- Utiliser uniquement la recherche vectorielle pour des domaines avec des exigences de correspondance exacte comme les codes produit, les messages d'erreur ou les numéros de version
- Récupérer trop de candidats avant la fusion, ce qui augmente la latence sans améliorer la qualité des résultats
- Supposer que des poids de fusion fixes fonctionnent pour tous les types de requêtes sans tests A/B ou optimisation au niveau des requêtes
Foire aux questions
Quand devrais-je utiliser RRF versus la fusion linéaire ?
Combien de candidats devrais-je récupérer avant la fusion ?
Le reranking cross-encoder vaut-il le coût computationnel ?
Puis-je utiliser la recherche hybride avec des bases de données vectorielles existantes ?
Quels modèles d'embedding fonctionnent le mieux pour la recherche hybride ?
Comment gérer les requêtes purement sémantiques ou purement basées sur des mots-clés ?
Détails du développeur
Auteur
sickn33Licence
MIT
Dépôt
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/hybrid-search-implementationRéf
main
Structure de fichiers