Habilidades hybrid-search-implementation

🔍

hybrid-search-implementation

Name: hybrid-search-implementation
Author: wshobson

Seguro ⚡ Contiene scripts📁 Acceso al sistema de archivos

Implementar búsqueda híbrida para RAG

También disponible en: sickn33

La búsqueda vectorial pura no encuentra coincidencias exactas mientras que la búsqueda por palabras clave no maneja consultas semánticas. Esta habilidad proporciona plantillas listas para usar para combinar ambos enfoques mediante fusión RRF, combinación lineal y reranking con cross-encoder.

Soporta: Claude Codex Code(CC)

📊 69 Adecuado

Descargar el ZIP de la skill

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

Activa y empieza a usar

Pruébalo

Usando "hybrid-search-implementation". How do I combine vector and keyword search results?

Resultado esperado:

Usa Reciprocal Rank Fusion (RRF):
1. Ejecuta ambas búsquedas para obtener listas ordenadas
2. Para cada resultado, calcula score = sum(peso / (k + rank))
3. Fusiona ordenando por puntuaciones combinadas
Ejemplo:
vector_results = [('doc1', 0.9), ('doc2', 0.8)]
keyword_results = [('doc2', 0.95), ('doc3', 0.7)]
fused = rrf_fusion([vector_results, keyword_results])
# Retorna [('doc2', 0.03), ('doc1', 0.016), ('doc3', 0.016)]

Usando "hybrid-search-implementation". What's the difference between RRF and linear fusion?

Resultado esperado:

RRF (Reciprocal Rank Fusion):
- Score = sum(1 / (k + rank))
- Basado en rangos, no necesita normalización de puntuaciones
- k=60 es constante estándar
- Funciona bien sin ajuste
Combinación Lineal:
- Score = alpha * vector_score + (1-alpha) * keyword_score
- Requiere normalización de puntuaciones a [0,1]
- Alpha necesita ajuste empírico por conjunto de datos
- Más controlable pero requiere ajuste

Usando "hybrid-search-implementation". Should I add reranking to my hybrid search?

Resultado esperado:

Sí, el reranking mejora significativamente la calidad:
1. Obtén más candidatos de la búsqueda híbrida (50-100)
2. Usa cross-encoder para puntuar pares consulta-documento
3. Retorna los top-k rerankeados
Compromisos:
- + Mejor precisión y relevancia
- - Latencia adicional (inferencia cross-encoder)
- Modelo: cross-encoder/ms-marco-MiniLM-L-6-v2 es un buen punto de partida

Auditoría de seguridad

Seguro

v5 • 1/21/2026

All static findings are false positives. The skill contains documentation templates for hybrid search algorithms (RRF, linear fusion) with PostgreSQL, Elasticsearch, and custom RAG pipelines. Static scanner misidentified mathematical formulas as crypto operations, markdown code fences as command execution, and benign terminology as security risks. No malicious code or credential exfiltration present.

Archivos escaneados

1,169

Líneas analizadas

hallazgos

Auditorías totales

Factores de riesgo

⚡ Contiene scripts (1)

SKILL.md:41-110

📁 Acceso al sistema de archivos (1)

SKILL.md:1-569

Auditado por: claude Ver historial de auditorías →

Puntuación de calidad

Arquitectura

100

Mantenibilidad

Contenido

Comunidad

100

Seguridad

Cumplimiento de la especificación

Lo que puedes crear

Construir sistemas RAG con mejor recall

Combina la comprensión semántica con coincidencias exactas para mejorar la recuperación de documentos para el contexto de LLMs. Maneja consultas que necesitan tanto similitud conceptual como terminología específica.

Implementar búsqueda empresarial

Crea sistemas de búsqueda que encuentran tanto contenido semánticamente relacionado como documentos que contienen términos específicos como códigos de productos, nombres o identificadores.

Mejorar métricas de calidad de búsqueda

Aplica técnicas de fusión como RRF para aumentar el recall sin sacrificar precisión. Registra puntuaciones individuales para depurar y ajustar la calidad de búsqueda.

Prueba estos prompts

Fusión RRF básica

Ayúdame a implementar Reciprocal Rank Fusion para combinar resultados de búsqueda vectorial y por palabras clave. Tengo dos listas de tuplas (doc_id, score). Muéstrame cómo fusionarlas.

Configuración de PostgreSQL

Muéstrame cómo configurar una tabla de PostgreSQL con pgvector para embeddings y tsvector para búsqueda de texto completo. Incluye las definiciones de índices HNSW y GIN.

kNN de Elasticsearch

Ayúdame a escribir una consulta de búsqueda híbrida en Elasticsearch que combine kNN de vectores densos con coincidencia de texto BM25 usando la característica de rank RRF.

Pipeline RAG personalizado

Crea una clase HybridRAGPipeline completa que ejecute búsquedas vectoriales y por palabras clave en paralelo, fusione resultados con métodos configurables (RRF o lineal), y opcionalmente reranke con un cross-encoder.

Mejores prácticas

Comienza con fusión RRF ya que funciona bien sin ajuste de parámetros. Usa k=60 como constante estándar.
Obtén más candidatos de búsquedas individuales (3x el límite final) antes de la fusión para asegurar buen recall.
Registra puntuaciones vectoriales y de palabras clave por separado durante el desarrollo. Esto ayuda a depurar cuando faltan resultados.
Usa reranking con cross-encoder para sistemas de producción. La mejora de calidad es significativa.

Evitar

No asumas que un solo peso de fusión funciona para todas las consultas. Algunas consultas necesitan más coincidencia semántica mientras otras necesitan coincidencia por palabras clave.
No descartes la búsqueda por palabras clave completamente. La coincidencia exacta de términos maneja nombres, códigos y frases específicas mejor que los vectores.
No sobre-obtengas candidatos. Equilibra las necesidades de recall contra la latencia. 50-100 candidatos antes del reranking suele ser suficiente.

Preguntas frecuentes

¿Qué método de fusión debería usar para empezar?

Comienza con Reciprocal Rank Fusion (RRF). Funciona bien sin ajuste y es el valor predeterminado en muchos sistemas de producción. Usa k=60 como constante. Cambia a combinación lineal solo si necesitas control explícito sobre el equilibrio vector-palabras clave.

¿Cómo manejo diferentes rangos de puntuaciones entre búsqueda vectorial y por palabras clave?

Normaliza las puntuaciones a [0, 1] antes de combinar. Para vectores, usa normalización min-max. Para BM25, las puntuaciones ya están algo normalizadas. La combinación lineal requiere normalización; RRF no porque usa rangos en lugar de puntuaciones brutas.

¿Qué dimensiones de vector debería usar?

Las opciones comunes son 768 (Sentence Transformers), 1024 (modelos grandes), o 1536 (OpenAI ada-002). Coincide con tu modelo de embedding. PostgreSQL pgvector y Elasticsearch ambos soportan dimensiones configurables.

¿Cómo elijo el peso vector-palabras clave (alpha)?

Comienza con alpha=0.5 (peso igual). Prueba con tus consultas específicas y ajusta según si necesitas más recall semántico o coincidencia exacta. Algunas consultas necesitan alpha=0.7-0.8, otras necesitan 0.3-0.4.

¿Puedo usar búsqueda híbrida sin reranker?

Sí, la búsqueda híbrida sin reranking funciona bien para muchos casos de uso. El paso de fusión (RRF o lineal) ya combina resultados de forma inteligente. Añade reranking cuando necesitas los resultados de mayor calidad y puedes tolerar latencia adicional.

¿Qué bases de datos soportan búsqueda híbrida?

PostgreSQL con extensión pgvector, Elasticsearch 8.x (kNN nativo + RRF), Vespa, Milvus, Qdrant y Weaviate todos soportan patrones de búsqueda híbrida. La elección depende de tu infraestructura existente y requisitos de escalabilidad.

Detalles del desarrollador

Autor

wshobson

Licencia

MIT

Repositorio

https://github.com/wshobson/agents/tree/main/plugins/llm-application-dev/skills/hybrid-search-implementation

Ref.

main

Estructura de archivos

📄 SKILL.md