hybrid-search-implementation
Implementar Pesquisa Híbrida para RAG
A pesquisa vetorial pura perde correspondências exatas, enquanto a pesquisa por palavras-chave falha em consultas semânticas. Este skill oferece templates prontos para usar para combinar ambas as abordagens usando fusão RRF, combinação linear e reordenação com cross-encoder.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "hybrid-search-implementation". How do I combine vector and keyword search results?
Résultat attendu:
- Use Reciprocal Rank Fusion (RRF):
- 1. Run both searches to get ranked lists
- 2. For each result, calculate score = sum(weight / (k + rank))
- 3. Fuse by sorting combined scores
- Example:
- vector_results = [('doc1', 0.9), ('doc2', 0.8)]
- keyword_results = [('doc2', 0.95), ('doc3', 0.7)]
- fused = rrf_fusion([vector_results, keyword_results])
- # Returns [('doc2', 0.03), ('doc1', 0.016), ('doc3', 0.016)]
Utilisation de "hybrid-search-implementation". What's the difference between RRF and linear fusion?
Résultat attendu:
- RRF (Reciprocal Rank Fusion):
- - Score = sum(1 / (k + rank))
- - Rank-based, no score normalization needed
- - k=60 is standard constant
- - Works well without tuning
- Linear Combination:
- - Score = alpha * vector_score + (1-alpha) * keyword_score
- - Requires score normalization to [0,1]
- - Alpha needs empirical tuning per dataset
- - More controllable but requires tuning
Utilisation de "hybrid-search-implementation". Should I add reranking to my hybrid search?
Résultat attendu:
- Yes, reranking improves quality significantly:
- 1. Fetch more candidates from hybrid search (50-100)
- 2. Use cross-encoder to score query-document pairs
- 3. Return top-k reranked results
- Trade-offs:
- - + Better precision and relevance
- - - Additional latency (cross-encoder inference)
- - Model: cross-encoder/ms-marco-MiniLM-L-6-v2 is a good starting point
Audit de sécurité
SûrAll static findings are false positives. The skill contains documentation templates for hybrid search algorithms (RRF, linear fusion) with PostgreSQL, Elasticsearch, and custom RAG pipelines. Static scanner misidentified mathematical formulas as crypto operations, markdown code fences as command execution, and benign terminology as security risks. No malicious code or credential exfiltration present.
Facteurs de risque
⚡ Contient des scripts (1)
📁 Accès au système de fichiers (1)
Score de qualité
Ce que vous pouvez construire
Construir Sistemas RAG com Melhor Recall
Combine compreensão semântica com correspondência exata para melhorar a recuperação de documentos para contexto de LLMs. Lide com consultas que precisam de similaridade conceitual e terminologia específica.
Implementar Busca Empresarial
Crie sistemas de busca que encontram tanto conteúdo semanticamente relacionado quanto documentos contendo termos exatos como códigos de produtos, nomes ou identificadores.
Melhorar Métricas de Qualidade de Busca
Aplique técnicas de fusão como RRF para aumentar recall sem sacrificar precisão. Registre pontuações individuais para depurar e ajustar a qualidade de busca.
Essayez ces prompts
Ajude-me a implementar Reciprocal Rank Fusion para combinar resultados de pesquisa vetorial e por palavras-chave. Tenho duas listas de tuplas (doc_id, score). Mostre-me como fundi-las.
Mostre-me como configurar uma tabela PostgreSQL com pgvector para embeddings e tsvector para pesquisa em texto completo. Inclua as definições de índices HNSW e GIN.
Ajude-me a escrever uma consulta de pesquisa híbrida no Elasticsearch que combine kNN de vetores densos com correspondência de texto BM25 usando o recurso rank do RRF.
Crie uma classe HybridRAGPipeline completa que execute pesquisas vetoriais e por palavras-chave em paralelo, funda resultados com métodos configuráveis (RRF ou linear), e opcionalmente reordene com um cross-encoder.
Bonnes pratiques
- Comece com fusão RRF, pois funciona bem sem ajuste de parâmetros. Use k=60 como constante padrão.
- Busque mais candidatos das pesquisas individuais (3x o limite final) antes da fusão para garantir bom recall.
- Registre as pontuações vetoriais e por palavras-chave separadamente durante o desenvolvimento. Isso ajuda a depurar quando resultados estão faltando.
- Use reordenação com cross-encoder para sistemas de produção. A melhoria de qualidade é significativa.
Éviter
- Não assuma que um único peso de fusão funciona para todas as consultas. Algumas consultas precisam de mais correspondência semântica, enquanto outras precisam de correspondência por palavras-chave.
- Não abandone completamente a pesquisa por palavras-chave. Correspondência exata de termos lida com nomes, códigos e frases específicas melhor do que vetores.
- Não busque candidatos em excesso. Equilibre as necessidades de recall contra a latência. 50-100 candidatos antes da reordenação geralmente é suficiente.