Compétences hybrid-search-implementation
🔍

hybrid-search-implementation

Sûr ⚡ Contient des scripts📁 Accès au système de fichiers

Implementar búsqueda híbrida para RAG

La búsqueda vectorial pura no encuentra coincidencias exactas mientras que la búsqueda por palabras clave no maneja consultas semánticas. Esta habilidad proporciona plantillas listas para usar para combinar ambos enfoques mediante fusión RRF, combinación lineal y reranking con cross-encoder.

Prend en charge: Claude Codex Code(CC)
📊 70 Adéquat
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "hybrid-search-implementation". How do I combine vector and keyword search results?

Résultat attendu:

  • Usa Reciprocal Rank Fusion (RRF):
  • 1. Ejecuta ambas búsquedas para obtener listas ordenadas
  • 2. Para cada resultado, calcula score = sum(peso / (k + rank))
  • 3. Fusiona ordenando por puntuaciones combinadas
  •  
  • Ejemplo:
  • vector_results = [('doc1', 0.9), ('doc2', 0.8)]
  • keyword_results = [('doc2', 0.95), ('doc3', 0.7)]
  • fused = rrf_fusion([vector_results, keyword_results])
  • # Retorna [('doc2', 0.03), ('doc1', 0.016), ('doc3', 0.016)]

Utilisation de "hybrid-search-implementation". What's the difference between RRF and linear fusion?

Résultat attendu:

  • RRF (Reciprocal Rank Fusion):
  • - Score = sum(1 / (k + rank))
  • - Basado en rangos, no necesita normalización de puntuaciones
  • - k=60 es constante estándar
  • - Funciona bien sin ajuste
  •  
  • Combinación Lineal:
  • - Score = alpha * vector_score + (1-alpha) * keyword_score
  • - Requiere normalización de puntuaciones a [0,1]
  • - Alpha necesita ajuste empírico por conjunto de datos
  • - Más controlable pero requiere ajuste

Utilisation de "hybrid-search-implementation". Should I add reranking to my hybrid search?

Résultat attendu:

  • Sí, el reranking mejora significativamente la calidad:
  •  
  • 1. Obtén más candidatos de la búsqueda híbrida (50-100)
  • 2. Usa cross-encoder para puntuar pares consulta-documento
  • 3. Retorna los top-k rerankeados
  •  
  • Compromisos:
  • - + Mejor precisión y relevancia
  • - - Latencia adicional (inferencia cross-encoder)
  • - Modelo: cross-encoder/ms-marco-MiniLM-L-6-v2 es un buen punto de partida

Audit de sécurité

Sûr
v5 • 1/21/2026

All static findings are false positives. The skill contains documentation templates for hybrid search algorithms (RRF, linear fusion) with PostgreSQL, Elasticsearch, and custom RAG pipelines. Static scanner misidentified mathematical formulas as crypto operations, markdown code fences as command execution, and benign terminology as security risks. No malicious code or credential exfiltration present.

2
Fichiers analysés
1,169
Lignes analysées
2
résultats
5
Total des audits

Facteurs de risque

⚡ Contient des scripts (1)
📁 Accès au système de fichiers (1)

Score de qualité

38
Architecture
100
Maintenabilité
87
Contenu
30
Communauté
100
Sécurité
87
Conformité aux spécifications

Ce que vous pouvez construire

Construir sistemas RAG con mejor recall

Combina la comprensión semántica con coincidencias exactas para mejorar la recuperación de documentos para el contexto de LLMs. Maneja consultas que necesitan tanto similitud conceptual como terminología específica.

Implementar búsqueda empresarial

Crea sistemas de búsqueda que encuentran tanto contenido semánticamente relacionado como documentos que contienen términos específicos como códigos de productos, nombres o identificadores.

Mejorar métricas de calidad de búsqueda

Aplica técnicas de fusión como RRF para aumentar el recall sin sacrificar precisión. Registra puntuaciones individuales para depurar y ajustar la calidad de búsqueda.

Essayez ces prompts

Fusión RRF básica
Ayúdame a implementar Reciprocal Rank Fusion para combinar resultados de búsqueda vectorial y por palabras clave. Tengo dos listas de tuplas (doc_id, score). Muéstrame cómo fusionarlas.
Configuración de PostgreSQL
Muéstrame cómo configurar una tabla de PostgreSQL con pgvector para embeddings y tsvector para búsqueda de texto completo. Incluye las definiciones de índices HNSW y GIN.
kNN de Elasticsearch
Ayúdame a escribir una consulta de búsqueda híbrida en Elasticsearch que combine kNN de vectores densos con coincidencia de texto BM25 usando la característica de rank RRF.
Pipeline RAG personalizado
Crea una clase HybridRAGPipeline completa que ejecute búsquedas vectoriales y por palabras clave en paralelo, fusione resultados con métodos configurables (RRF o lineal), y opcionalmente reranke con un cross-encoder.

Bonnes pratiques

  • Comienza con fusión RRF ya que funciona bien sin ajuste de parámetros. Usa k=60 como constante estándar.
  • Obtén más candidatos de búsquedas individuales (3x el límite final) antes de la fusión para asegurar buen recall.
  • Registra puntuaciones vectoriales y de palabras clave por separado durante el desarrollo. Esto ayuda a depurar cuando faltan resultados.
  • Usa reranking con cross-encoder para sistemas de producción. La mejora de calidad es significativa.

Éviter

  • No asumas que un solo peso de fusión funciona para todas las consultas. Algunas consultas necesitan más coincidencia semántica mientras otras necesitan coincidencia por palabras clave.
  • No descartes la búsqueda por palabras clave completamente. La coincidencia exacta de términos maneja nombres, códigos y frases específicas mejor que los vectores.
  • No sobre-obtengas candidatos. Equilibra las necesidades de recall contra la latencia. 50-100 candidatos antes del reranking suele ser suficiente.

Foire aux questions

¿Qué método de fusión debería usar para empezar?
Comienza con Reciprocal Rank Fusion (RRF). Funciona bien sin ajuste y es el valor predeterminado en muchos sistemas de producción. Usa k=60 como constante. Cambia a combinación lineal solo si necesitas control explícito sobre el equilibrio vector-palabras clave.
¿Cómo manejo diferentes rangos de puntuaciones entre búsqueda vectorial y por palabras clave?
Normaliza las puntuaciones a [0, 1] antes de combinar. Para vectores, usa normalización min-max. Para BM25, las puntuaciones ya están algo normalizadas. La combinación lineal requiere normalización; RRF no porque usa rangos en lugar de puntuaciones brutas.
¿Qué dimensiones de vector debería usar?
Las opciones comunes son 768 (Sentence Transformers), 1024 (modelos grandes), o 1536 (OpenAI ada-002). Coincide con tu modelo de embedding. PostgreSQL pgvector y Elasticsearch ambos soportan dimensiones configurables.
¿Cómo elijo el peso vector-palabras clave (alpha)?
Comienza con alpha=0.5 (peso igual). Prueba con tus consultas específicas y ajusta según si necesitas más recall semántico o coincidencia exacta. Algunas consultas necesitan alpha=0.7-0.8, otras necesitan 0.3-0.4.
¿Puedo usar búsqueda híbrida sin reranker?
Sí, la búsqueda híbrida sin reranking funciona bien para muchos casos de uso. El paso de fusión (RRF o lineal) ya combina resultados de forma inteligente. Añade reranking cuando necesitas los resultados de mayor calidad y puedes tolerar latencia adicional.
¿Qué bases de datos soportan búsqueda híbrida?
PostgreSQL con extensión pgvector, Elasticsearch 8.x (kNN nativo + RRF), Vespa, Milvus, Qdrant y Weaviate todos soportan patrones de búsqueda híbrida. La elección depende de tu infraestructura existente y requisitos de escalabilidad.

Détails du développeur

Structure de fichiers

📄 SKILL.md