Habilidades hybrid-search-implementation

🔍

hybrid-search-implementation

Name: hybrid-search-implementation
Author: wshobson

Seguro ⚡ Contém scripts📁 Acesso ao sistema de arquivos

Implementar Pesquisa Híbrida para RAG

Também disponível em: sickn33

A pesquisa vetorial pura perde correspondências exatas, enquanto a pesquisa por palavras-chave falha em consultas semânticas. Este skill oferece templates prontos para usar para combinar ambas as abordagens usando fusão RRF, combinação linear e reordenação com cross-encoder.

Suporta: Claude Codex Code(CC)

📊 69 Adequado

Baixar o ZIP da skill

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

Ative e comece a usar

Testar

A utilizar "hybrid-search-implementation". How do I combine vector and keyword search results?

Resultado esperado:

Use Reciprocal Rank Fusion (RRF):
1. Run both searches to get ranked lists
2. For each result, calculate score = sum(weight / (k + rank))
3. Fuse by sorting combined scores
Example:
vector_results = [('doc1', 0.9), ('doc2', 0.8)]
keyword_results = [('doc2', 0.95), ('doc3', 0.7)]
fused = rrf_fusion([vector_results, keyword_results])
# Returns [('doc2', 0.03), ('doc1', 0.016), ('doc3', 0.016)]

A utilizar "hybrid-search-implementation". What's the difference between RRF and linear fusion?

Resultado esperado:

RRF (Reciprocal Rank Fusion):
- Score = sum(1 / (k + rank))
- Rank-based, no score normalization needed
- k=60 is standard constant
- Works well without tuning
Linear Combination:
- Score = alpha * vector_score + (1-alpha) * keyword_score
- Requires score normalization to [0,1]
- Alpha needs empirical tuning per dataset
- More controllable but requires tuning

A utilizar "hybrid-search-implementation". Should I add reranking to my hybrid search?

Resultado esperado:

Yes, reranking improves quality significantly:
1. Fetch more candidates from hybrid search (50-100)
2. Use cross-encoder to score query-document pairs
3. Return top-k reranked results
Trade-offs:
- + Better precision and relevance
- - Additional latency (cross-encoder inference)
- Model: cross-encoder/ms-marco-MiniLM-L-6-v2 is a good starting point

Auditoria de Segurança

Seguro

v5 • 1/21/2026

All static findings are false positives. The skill contains documentation templates for hybrid search algorithms (RRF, linear fusion) with PostgreSQL, Elasticsearch, and custom RAG pipelines. Static scanner misidentified mathematical formulas as crypto operations, markdown code fences as command execution, and benign terminology as security risks. No malicious code or credential exfiltration present.

Arquivos analisados

1,169

Linhas analisadas

achados

Total de auditorias

Fatores de risco

⚡ Contém scripts (1)

SKILL.md:41-110

📁 Acesso ao sistema de arquivos (1)

SKILL.md:1-569

Auditado por: claude Ver Histórico de Auditoria →

Pontuação de qualidade

Arquitetura

100

Manutenibilidade

Conteúdo

Comunidade

100

Segurança

Conformidade com especificações

O Que Você Pode Construir

Construir Sistemas RAG com Melhor Recall

Combine compreensão semântica com correspondência exata para melhorar a recuperação de documentos para contexto de LLMs. Lide com consultas que precisam de similaridade conceitual e terminologia específica.

Implementar Busca Empresarial

Crie sistemas de busca que encontram tanto conteúdo semanticamente relacionado quanto documentos contendo termos exatos como códigos de produtos, nomes ou identificadores.

Melhorar Métricas de Qualidade de Busca

Aplique técnicas de fusão como RRF para aumentar recall sem sacrificar precisão. Registre pontuações individuais para depurar e ajustar a qualidade de busca.

Tente Estes Prompts

Fusão RRF Básica

Ajude-me a implementar Reciprocal Rank Fusion para combinar resultados de pesquisa vetorial e por palavras-chave. Tenho duas listas de tuplas (doc_id, score). Mostre-me como fundi-las.

Configuração PostgreSQL

Mostre-me como configurar uma tabela PostgreSQL com pgvector para embeddings e tsvector para pesquisa em texto completo. Inclua as definições de índices HNSW e GIN.

kNN do Elasticsearch

Ajude-me a escrever uma consulta de pesquisa híbrida no Elasticsearch que combine kNN de vetores densos com correspondência de texto BM25 usando o recurso rank do RRF.

Pipeline RAG Personalizado

Crie uma classe HybridRAGPipeline completa que execute pesquisas vetoriais e por palavras-chave em paralelo, funda resultados com métodos configuráveis (RRF ou linear), e opcionalmente reordene com um cross-encoder.

Melhores Práticas

Comece com fusão RRF, pois funciona bem sem ajuste de parâmetros. Use k=60 como constante padrão.
Busque mais candidatos das pesquisas individuais (3x o limite final) antes da fusão para garantir bom recall.
Registre as pontuações vetoriais e por palavras-chave separadamente durante o desenvolvimento. Isso ajuda a depurar quando resultados estão faltando.
Use reordenação com cross-encoder para sistemas de produção. A melhoria de qualidade é significativa.

Evitar

Não assuma que um único peso de fusão funciona para todas as consultas. Algumas consultas precisam de mais correspondência semântica, enquanto outras precisam de correspondência por palavras-chave.
Não abandone completamente a pesquisa por palavras-chave. Correspondência exata de termos lida com nomes, códigos e frases específicas melhor do que vetores.
Não busque candidatos em excesso. Equilibre as necessidades de recall contra a latência. 50-100 candidatos antes da reordenação geralmente é suficiente.

Perguntas Frequentes

What fusion method should I start with?

Comece com Reciprocal Rank Fusion (RRF). Ele tem bom desempenho sem ajuste e é o padrão em muitos sistemas de produção. Use k=60 como constante. Alterne para combinação linear apenas se precisar de controle explícito sobre o equilíbrio entre vetor e palavras-chave.

How do I handle different score ranges between vector and keyword search?

Normalize as pontuações para [0, 1] antes de combinar. Para vetores, use normalização min-max. Para BM25, as pontuações já são um tanto normalizadas. Combinação linear requer normalização; RRF não porque usa rankings em vez de pontuações brutas.

What vector dimensions should I use?

Escolhas comuns são 768 (Sentence Transformers), 1024 (modelos grandes) ou 1536 (OpenAI ada-002). Combine com seu modelo de embedding. PostgreSQL pgvector e Elasticsearch suportam dimensões configuráveis.

How do I choose the vector-to-keyword weight (alpha)?

Comece com alpha=0.5 (peso igual). Teste em suas consultas específicas e ajuste baseado em se você precisa de mais recall semântico ou correspondência exata. Algumas consultas precisam de alpha=0.7-0.8, outras precisam de 0.3-0.4.

Can I use hybrid search without a reranker?

Sim, pesquisa híbrida sem reordenação funciona bem para muitos casos de uso. A etapa de fusão (RRF ou linear) já combina resultados de forma inteligente. Adicione reordenação quando precisar dos resultados de maior qualidade e puder tolerar latência adicional.

What databases support hybrid search?

PostgreSQL com extensão pgvector, Elasticsearch 8.x (kNN nativo + RRF), Vespa, Milvus, Qdrant e Weaviate todos suportam padrões de pesquisa híbrida. A escolha depende da sua infraestrutura existente e requisitos de escalabilidade.

Detalhes do Desenvolvedor

Autor

wshobson

Licença

MIT

Repositório

https://github.com/wshobson/agents/tree/main/plugins/llm-application-dev/skills/hybrid-search-implementation

Referência

main

Estrutura de arquivos

📄 SKILL.md