hybrid-search-implementation
Implémenter la recherche hybride pour les systèmes RAG
متاح أيضًا من: wshobson
La recherche purement vectorielle ou par mots-clés seule manque souvent des résultats pertinents. Cette compétence fournit des modèles éprouvés pour combiner les deux approches afin d'obtenir une précision de récupération supérieure.
تنزيل ZIP المهارة
رفع في Claude
اذهب إلى Settings → Capabilities → Skills → Upload skill
فعّل وابدأ الاستخدام
اختبرها
استخدام "hybrid-search-implementation". L'utilisateur recherche 'authentication error 401' dans la documentation API
النتيجة المتوقعة:
La recherche hybride retourne des documents correspondant à la fois au concept sémantique des échecs d'authentification ET aux correspondances exactes pour le code d'erreur 401, classés par score de pertinence combiné.
استخدام "hybrid-search-implementation". Le développeur demande 'how to paginate results' dans la docs du SDK
النتيجة المتوقعة:
La recherche vectorielle trouve des modèles de pagination sémantiquement liés tandis que la recherche par mots-clés garantit que les correspondances exactes pour la terminologie 'limit', 'offset', 'cursor' sont incluses dans les résultats.
التدقيق الأمني
آمنStatic analysis flagged 55 patterns but all are false positives. Files are markdown documentation with Python code samples. Backticks are markdown formatting not shell execution. URLs are documentation references not network calls. No cryptographic operations, credential access, or system commands detected. Skill is safe for publication.
درجة الجودة
ماذا يمكنك بناءه
Développeur de systèmes RAG
Construisez des systèmes de génération augmentée par récupération avec un rappel amélioré en combinant la recherche sémantique vectorielle avec la correspondance exacte par mots-clés pour les termes techniques et les codes produit.
Créateur de moteur de recherche
Implémentez une recherche d'entreprise qui gère à la fois les requêtes conceptuelles (via embeddings) et la correspondance de termes précise (via BM25) pour des résultats complets.
Architecte de base de connaissances
Créez une recherche de documentation qui comprend l'intention utilisateur de manière sémantique tout en trouvant des correspondances exactes pour les codes d'erreur, les noms d'API et les numéros de version.
جرّب هذه الموجهات
I need to implement hybrid search for my RAG system. Show me how to combine vector embeddings with keyword search using Reciprocal Rank Fusion in Python.
Help me set up hybrid search in PostgreSQL using pgvector for embeddings and built-in full-text search. I need SQL schema creation and query examples with RRF fusion.
Show me how to configure Elasticsearch for hybrid search combining dense vector similarity with BM25 text search. Include index mapping, search queries, and RRF configuration for Elasticsearch 8.x.
Build a complete hybrid RAG pipeline that retrieves candidates with vector and keyword search, fuses results with RRF, then reranks top candidates using a cross-encoder model. Include async Python implementation with configurable weights.
أفضل الممارسات
- Ajustez les poids de fusion de manière empirique sur votre jeu de données - RRF avec k=60 fonctionne bien comme point de départ mais l'équilibre optimal dépend de votre contenu
- Incluez toujours un reranking cross-encoder pour les systèmes de production - l'amélioration de qualité justifie la latence supplémentaire pour les candidats top-k
- Journalisez les scores individuels et les scores fusionnés pendant le développement pour comprendre quelles requêtes bénéficient de chaque méthode de recherche
تجنب
- Utiliser uniquement la recherche vectorielle pour des domaines avec des exigences de correspondance exacte comme les codes produit, les messages d'erreur ou les numéros de version
- Récupérer trop de candidats avant la fusion, ce qui augmente la latence sans améliorer la qualité des résultats
- Supposer que des poids de fusion fixes fonctionnent pour tous les types de requêtes sans tests A/B ou optimisation au niveau des requêtes
الأسئلة المتكررة
Quand devrais-je utiliser RRF versus la fusion linéaire ?
Combien de candidats devrais-je récupérer avant la fusion ?
Le reranking cross-encoder vaut-il le coût computationnel ?
Puis-je utiliser la recherche hybride avec des bases de données vectorielles existantes ?
Quels modèles d'embedding fonctionnent le mieux pour la recherche hybride ?
Comment gérer les requêtes purement sémantiques ou purement basées sur des mots-clés ?
تفاصيل المطور
المؤلف
sickn33الترخيص
MIT
المستودع
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/hybrid-search-implementationمرجع
main
بنية الملفات