المهارات hybrid-search-implementation
📦

hybrid-search-implementation

آمن

Implémenter la recherche hybride pour les systèmes RAG

متاح أيضًا من: wshobson

La recherche purement vectorielle ou par mots-clés seule manque souvent des résultats pertinents. Cette compétence fournit des modèles éprouvés pour combiner les deux approches afin d'obtenir une précision de récupération supérieure.

يدعم: Claude Codex Code(CC)
🥉 75 برونزي
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "hybrid-search-implementation". L'utilisateur recherche 'authentication error 401' dans la documentation API

النتيجة المتوقعة:

La recherche hybride retourne des documents correspondant à la fois au concept sémantique des échecs d'authentification ET aux correspondances exactes pour le code d'erreur 401, classés par score de pertinence combiné.

استخدام "hybrid-search-implementation". Le développeur demande 'how to paginate results' dans la docs du SDK

النتيجة المتوقعة:

La recherche vectorielle trouve des modèles de pagination sémantiquement liés tandis que la recherche par mots-clés garantit que les correspondances exactes pour la terminologie 'limit', 'offset', 'cursor' sont incluses dans les résultats.

التدقيق الأمني

آمن
v1 • 2/25/2026

Static analysis flagged 55 patterns but all are false positives. Files are markdown documentation with Python code samples. Backticks are markdown formatting not shell execution. URLs are documentation references not network calls. No cryptographic operations, credential access, or system commands detected. Skill is safe for publication.

2
الملفات التي تم فحصها
603
الأسطر التي تم تحليلها
0
النتائج
1
إجمالي عمليات التدقيق
لا توجد مشكلات أمنية
تم تدقيقه بواسطة: claude

درجة الجودة

38
الهندسة المعمارية
100
قابلية الصيانة
87
المحتوى
50
المجتمع
100
الأمان
100
الامتثال للمواصفات

ماذا يمكنك بناءه

Développeur de systèmes RAG

Construisez des systèmes de génération augmentée par récupération avec un rappel amélioré en combinant la recherche sémantique vectorielle avec la correspondance exacte par mots-clés pour les termes techniques et les codes produit.

Créateur de moteur de recherche

Implémentez une recherche d'entreprise qui gère à la fois les requêtes conceptuelles (via embeddings) et la correspondance de termes précise (via BM25) pour des résultats complets.

Architecte de base de connaissances

Créez une recherche de documentation qui comprend l'intention utilisateur de manière sémantique tout en trouvant des correspondances exactes pour les codes d'erreur, les noms d'API et les numéros de version.

جرّب هذه الموجهات

Configuration de base de la recherche hybride
I need to implement hybrid search for my RAG system. Show me how to combine vector embeddings with keyword search using Reciprocal Rank Fusion in Python.
Implémentation PostgreSQL pgvector
Help me set up hybrid search in PostgreSQL using pgvector for embeddings and built-in full-text search. I need SQL schema creation and query examples with RRF fusion.
Configuration de recherche hybride Elasticsearch
Show me how to configure Elasticsearch for hybrid search combining dense vector similarity with BM25 text search. Include index mapping, search queries, and RRF configuration for Elasticsearch 8.x.
Pipeline RAG avancé avec reranking
Build a complete hybrid RAG pipeline that retrieves candidates with vector and keyword search, fuses results with RRF, then reranks top candidates using a cross-encoder model. Include async Python implementation with configurable weights.

أفضل الممارسات

  • Ajustez les poids de fusion de manière empirique sur votre jeu de données - RRF avec k=60 fonctionne bien comme point de départ mais l'équilibre optimal dépend de votre contenu
  • Incluez toujours un reranking cross-encoder pour les systèmes de production - l'amélioration de qualité justifie la latence supplémentaire pour les candidats top-k
  • Journalisez les scores individuels et les scores fusionnés pendant le développement pour comprendre quelles requêtes bénéficient de chaque méthode de recherche

تجنب

  • Utiliser uniquement la recherche vectorielle pour des domaines avec des exigences de correspondance exacte comme les codes produit, les messages d'erreur ou les numéros de version
  • Récupérer trop de candidats avant la fusion, ce qui augmente la latence sans améliorer la qualité des résultats
  • Supposer que des poids de fusion fixes fonctionnent pour tous les types de requêtes sans tests A/B ou optimisation au niveau des requêtes

الأسئلة المتكررة

Quand devrais-je utiliser RRF versus la fusion linéaire ?
RRF est plus simple et ne nécessite aucun ajustement - il fonctionne bien dès le départ. La fusion linéaire offre plus de contrôle mais nécessite un ajustement empirique des poids sur vos données. Commencez avec RRF, passez au linéaire si vous avez besoin d'un contrôle plus fin.
Combien de candidats devrais-je récupérer avant la fusion ?
Typiquement 3x votre limite finale par méthode. Pour des résultats top-10, récupérez 30 de chaque méthode de recherche. Cela fournit un chevauchement suffisant pour une fusion efficace sans latence excessive.
Le reranking cross-encoder vaut-il le coût computationnel ?
Oui pour le RAG en production. Le reranking de 50 candidats ajoute ~100-500ms mais améliore significativement la pertinence. Appliquez le reranking uniquement aux candidats top-k fusionnés, pas à l'ensemble complet des candidats.
Puis-je utiliser la recherche hybride avec des bases de données vectorielles existantes ?
La plupart des bases de données vectorielles prennent maintenant en charge la recherche hybride nativement. Pinecone, Weaviate, Qdrant et pgvector offrent tous une recherche hybride intégrée avec des paramètres de fusion configurables.
Quels modèles d'embedding fonctionnent le mieux pour la recherche hybride ?
Tout modèle d'embedding fonctionne car la recherche hybride combine les embeddings avec la recherche par mots-clés. OpenAI text-embedding-3, Cohere embed-v3, ou des modèles open-source comme BGE fonctionnent tous efficacement.
Comment gérer les requêtes purement sémantiques ou purement basées sur des mots-clés ?
Pour les requêtes courtes exactes (codes d'erreur, IDs), augmentez le poids des mots-clés. Pour les questions en langage naturel, augmentez le poids vectoriel. Les systèmes avancés utilisent la classification de requêtes pour définir des poids dynamiques.

تفاصيل المطور

بنية الملفات