Habilidades hybrid-search-implementation

📦

hybrid-search-implementation

Name: hybrid-search-implementation
Author: sickn33

Seguro

Implementar Búsqueda Híbrida para Sistemas RAG

También disponible en: wshobson

La búsqueda únicamente vectorial o por palabras clave a menudo omite resultados relevantes. Esta habilidad proporciona patrones probados para combinar ambos enfoques y lograr una precisión de recuperación superior.

Soporta: Claude Codex Code(CC)

📊 71 Adecuado

Descargar el ZIP de la skill

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

Activa y empieza a usar

Pruébalo

Usando "hybrid-search-implementation". Usuario busca 'authentication error 401' en documentación de API

Resultado esperado:

La búsqueda híbrida devuelve documentos que coinciden tanto con el concepto semántico de fallos de autenticación COMO coincidencias exactas del código de error 401, clasificados por puntuación de relevancia combinada.

Usando "hybrid-search-implementation". Desarrollador consulta 'how to paginate results' en docs del SDK

Resultado esperado:

La búsqueda vectorial encuentra patrones de paginación semánticamente relacionados mientras que la búsqueda por palabras clave asegura que se incluyan en los resultados coincidencias exactas de terminología como 'limit', 'offset', 'cursor'.

Auditoría de seguridad

Seguro

v1 • 2/25/2026

Static analysis flagged 55 patterns but all are false positives. Files are markdown documentation with Python code samples. Backticks are markdown formatting not shell execution. URLs are documentation references not network calls. No cryptographic operations, credential access, or system commands detected. Skill is safe for publication.

Archivos escaneados

603

Líneas analizadas

hallazgos

Auditorías totales

No se encontraron problemas de seguridad

Auditado por: claude

Puntuación de calidad

Arquitectura

100

Mantenibilidad

Contenido

Comunidad

100

Seguridad

100

Cumplimiento de la especificación

Lo que puedes crear

Desarrollador de Sistemas RAG

Construir sistemas de generación aumentada por recuperación con mejor recall combinando búsqueda semántica vectorial con coincidencia exacta de palabras clave para términos técnicos y códigos de producto.

Constructor de Motores de Búsqueda

Implementar búsqueda empresarial que maneje tanto consultas conceptuales (vía embeddings) como coincidencia precisa de términos (vía BM25) para resultados comprehensivos.

Arquitecto de Base de Conocimientos

Crear búsqueda en documentación que comprenda la intención del usuario semánticamente mientras encuentra coincidencias exactas para códigos de error, nombres de API y números de versión.

Prueba estos prompts

Configuración Básica de Búsqueda Híbrida

Necesito implementar búsqueda híbrida para mi sistema RAG. Muéstrame cómo combinar embeddings vectoriales con búsqueda por palabras clave usando Reciprocal Rank Fusion en Python.

Implementación en PostgreSQL pgvector

Ayúdame a configurar búsqueda híbrida en PostgreSQL usando pgvector para embeddings y búsqueda de texto completa integrada. Necesito creación de esquema SQL y ejemplos de consultas con fusión RRF.

Configuración de Búsqueda Híbrida en Elasticsearch

Muéstrame cómo configurar Elasticsearch para búsqueda híbrida combinando similitud de vectores densos con búsqueda de texto BM25. Incluye mapeo de índice, consultas de búsqueda y configuración RRF para Elasticsearch 8.x.

Pipeline RAG Avanzado con Reranking

Construye un pipeline RAG híbrido completo que recupere candidatos con búsqueda vectorial y por palabras clave, fusione resultados con RRF, luego rerankee los mejores candidatos usando un modelo cross-encoder. Incluye implementación asíncrona en Python con pesos configurables.

Mejores prácticas

Ajusta empíricamente los pesos de fusión en tu conjunto de datos - RRF con k=60 funciona bien como punto de partida pero el balance óptimo depende de tu contenido
Siempre incluye reranking con cross-encoder para sistemas en producción - la mejora en calidad justifica la latencia adicional para los candidatos top-k
Registra tanto las puntuaciones individuales como las fusionadas durante el desarrollo para entender qué consultas se benefician de cada método de búsqueda

Evitar

Usar solo búsqueda vectorial para dominios con requisitos de coincidencia exacta como códigos de producto, mensajes de error o números de versión
Obtener demasiados candidatos antes de la fusión lo que incrementa la latencia sin mejorar la calidad de los resultados
Asumir que los pesos de fusión fijos funcionan para todos los tipos de consulta sin testing A/B u optimización a nivel de consulta

Preguntas frecuentes

¿Cuándo debo usar RRF versus fusión lineal?

RRF es más simple y no requiere ajuste - funciona bien desde el inicio. La fusión lineal ofrece más control pero requiere ajuste empírico de pesos en tus datos. Comienza con RRF, cambia a lineal si necesitas control granular.

¿Cuántos candidatos debo recuperar antes de la fusión?

Típicamente 3x tu límite final por método. Para resultados top-10, recupera 30 de cada método de búsqueda. Esto proporciona suficiente superposición para una fusión efectiva sin latencia excesiva.

¿Vale la pena el costo computacional del reranking con cross-encoder?

Sí para RAG en producción. El reranking de 50 candidatos agrega ~100-500ms pero mejora significativamente la relevancia. Aplica reranking solo a los candidatos top-k fusionados, no al conjunto completo de candidatos.

¿Puedo usar búsqueda híbrida con bases de datos vectoriales existentes?

La mayoría de las bases de datos vectoriales ahora soportan búsqueda híbrida de forma nativa. Pinecone, Weaviate, Qdrant y pgvector ofrecen búsqueda híbrida integrada con parámetros de fusión configurables.

¿Qué modelos de embedding funcionan mejor para búsqueda híbrida?

Cualquier modelo de embedding funciona ya que la búsqueda híbrida combina embeddings con búsqueda por palabras clave. OpenAI text-embedding-3, Cohere embed-v3, o modelos open-source como BGE funcionan efectivamente.

¿Cómo manejo consultas que son puramente semánticas o puramente basadas en palabras clave?

Para consultas exactas cortas (códigos de error, IDs), aumenta el peso de palabras clave. Para preguntas en lenguaje natural, aumenta el peso vectorial. Los sistemas avanzados usan clasificación de consultas para establecer pesos dinámicos.

Detalles del desarrollador

Autor

sickn33

Licencia

MIT

Repositorio

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/hybrid-search-implementation

Ref.

main

Estructura de archivos

📁 resources/

📄 implementation-playbook.md

📄 SKILL.md