hybrid-search-implementation
Implementar Búsqueda Híbrida para Sistemas RAG
متاح أيضًا من: wshobson
La búsqueda únicamente vectorial o por palabras clave a menudo omite resultados relevantes. Esta habilidad proporciona patrones probados para combinar ambos enfoques y lograr una precisión de recuperación superior.
تنزيل ZIP المهارة
رفع في Claude
اذهب إلى Settings → Capabilities → Skills → Upload skill
فعّل وابدأ الاستخدام
اختبرها
استخدام "hybrid-search-implementation". Usuario busca 'authentication error 401' en documentación de API
النتيجة المتوقعة:
La búsqueda híbrida devuelve documentos que coinciden tanto con el concepto semántico de fallos de autenticación COMO coincidencias exactas del código de error 401, clasificados por puntuación de relevancia combinada.
استخدام "hybrid-search-implementation". Desarrollador consulta 'how to paginate results' en docs del SDK
النتيجة المتوقعة:
La búsqueda vectorial encuentra patrones de paginación semánticamente relacionados mientras que la búsqueda por palabras clave asegura que se incluyan en los resultados coincidencias exactas de terminología como 'limit', 'offset', 'cursor'.
التدقيق الأمني
آمنStatic analysis flagged 55 patterns but all are false positives. Files are markdown documentation with Python code samples. Backticks are markdown formatting not shell execution. URLs are documentation references not network calls. No cryptographic operations, credential access, or system commands detected. Skill is safe for publication.
درجة الجودة
ماذا يمكنك بناءه
Desarrollador de Sistemas RAG
Construir sistemas de generación aumentada por recuperación con mejor recall combinando búsqueda semántica vectorial con coincidencia exacta de palabras clave para términos técnicos y códigos de producto.
Constructor de Motores de Búsqueda
Implementar búsqueda empresarial que maneje tanto consultas conceptuales (vía embeddings) como coincidencia precisa de términos (vía BM25) para resultados comprehensivos.
Arquitecto de Base de Conocimientos
Crear búsqueda en documentación que comprenda la intención del usuario semánticamente mientras encuentra coincidencias exactas para códigos de error, nombres de API y números de versión.
جرّب هذه الموجهات
Necesito implementar búsqueda híbrida para mi sistema RAG. Muéstrame cómo combinar embeddings vectoriales con búsqueda por palabras clave usando Reciprocal Rank Fusion en Python.
Ayúdame a configurar búsqueda híbrida en PostgreSQL usando pgvector para embeddings y búsqueda de texto completa integrada. Necesito creación de esquema SQL y ejemplos de consultas con fusión RRF.
Muéstrame cómo configurar Elasticsearch para búsqueda híbrida combinando similitud de vectores densos con búsqueda de texto BM25. Incluye mapeo de índice, consultas de búsqueda y configuración RRF para Elasticsearch 8.x.
Construye un pipeline RAG híbrido completo que recupere candidatos con búsqueda vectorial y por palabras clave, fusione resultados con RRF, luego rerankee los mejores candidatos usando un modelo cross-encoder. Incluye implementación asíncrona en Python con pesos configurables.
أفضل الممارسات
- Ajusta empíricamente los pesos de fusión en tu conjunto de datos - RRF con k=60 funciona bien como punto de partida pero el balance óptimo depende de tu contenido
- Siempre incluye reranking con cross-encoder para sistemas en producción - la mejora en calidad justifica la latencia adicional para los candidatos top-k
- Registra tanto las puntuaciones individuales como las fusionadas durante el desarrollo para entender qué consultas se benefician de cada método de búsqueda
تجنب
- Usar solo búsqueda vectorial para dominios con requisitos de coincidencia exacta como códigos de producto, mensajes de error o números de versión
- Obtener demasiados candidatos antes de la fusión lo que incrementa la latencia sin mejorar la calidad de los resultados
- Asumir que los pesos de fusión fijos funcionan para todos los tipos de consulta sin testing A/B u optimización a nivel de consulta
الأسئلة المتكررة
¿Cuándo debo usar RRF versus fusión lineal?
¿Cuántos candidatos debo recuperar antes de la fusión?
¿Vale la pena el costo computacional del reranking con cross-encoder?
¿Puedo usar búsqueda híbrida con bases de datos vectoriales existentes?
¿Qué modelos de embedding funcionan mejor para búsqueda híbrida?
¿Cómo manejo consultas que son puramente semánticas o puramente basadas en palabras clave?
تفاصيل المطور
المؤلف
sickn33الترخيص
MIT
المستودع
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/hybrid-search-implementationمرجع
main
بنية الملفات