hybrid-search-implementation
Implemente Pesquisa Híbrida para Sistemas RAG
Também disponível em: wshobson
A pesquisa apenas por vetor ou apenas por palavra-chave frequentemente perde resultados relevantes. Esta habilidade fornece padrões comprovados para combinar ambas as abordagens para alcançar precisão de recuperação superior.
Baixar o ZIP da skill
Upload no Claude
Vá em Configurações → Capacidades → Skills → Upload skill
Ative e comece a usar
Testar
A utilizar "hybrid-search-implementation". Usuário pesquisa por 'authentication error 401' na documentação da API
Resultado esperado:
A pesquisa híbrida retorna documentos correspondendo tanto ao conceito semântico de falhas de autenticação QUANTO correspondências exatas para o código de erro 401, classificados por pontuação de relevância combinada.
A utilizar "hybrid-search-implementation". Desenvolvedor consulta 'how to paginate results' na documentação do SDK
Resultado esperado:
A pesquisa vetorial encontra padrões de paginação semanticamente relacionados enquanto a pesquisa por palavra-chave garante que correspondências exatas para terminologia 'limit', 'offset', 'cursor' sejam incluídas nos resultados.
Auditoria de Segurança
SeguroStatic analysis flagged 55 patterns but all are false positives. Files are markdown documentation with Python code samples. Backticks are markdown formatting not shell execution. URLs are documentation references not network calls. No cryptographic operations, credential access, or system commands detected. Skill is safe for publication.
Pontuação de qualidade
O Que Você Pode Construir
Desenvolvedor de Sistemas RAG
Construa sistemas de retrieval-augmented generation com recall aprimorado combinando pesquisa semântica por vetor com correspondência exata por palavra-chave para termos técnicos e códigos de produto.
Construtor de Mecanismos de Busca
Implemente busca empresarial que lida tanto com consultas conceituais (via embeddings) quanto com correspondência precisa de termos (via BM25) para resultados abrangentes.
Arquiteto de Base de Conhecimento
Crie busca de documentação que compreende a intenção do usuário semanticamente enquanto ainda encontra correspondências exatas para códigos de erro, nomes de API e números de versão.
Tente Estes Prompts
Preciso implementar pesquisa híbrida para meu sistema RAG. Mostre-me como combinar embeddings vetoriais com pesquisa por palavra-chave usando Reciprocal Rank Fusion em Python.
Ajude-me a configurar pesquisa híbrida no PostgreSQL usando pgvector para embeddings e full-text search nativo. Preciso de criação de esquema SQL e exemplos de consultas com fusão RRF.
Mostre-me como configurar o Elasticsearch para pesquisa híbrida combinando similaridade de vetores densos com busca de texto BM25. Inclua mapeamento de índice, consultas de busca e configuração RRF para Elasticsearch 8.x.
Construa um pipeline RAG híbrido completo que recupera candidatos com pesquisa vetorial e por palavra-chave, funde resultados com RRF, então reclassifica os melhores candidatos usando um modelo cross-encoder. Inclua implementação Python async com pesos configuráveis.
Melhores Práticas
- Ajuste os pesos de fusão empiricamente no seu dataset - RRF com k=60 funciona bem como ponto de partida, mas o equilíbrio ideal depende do seu conteúdo
- Sempre inclua reranking cross-encoder para sistemas de produção - a melhoria de qualidade justifica a latência adicional para candidatos top-k
- Registre tanto pontuações individuais quanto pontuações fundidas durante o desenvolvimento para entender quais consultas se beneficiam de cada método de busca
Evitar
- Usar apenas pesquisa vetorial para domínios com requisitos de correspondência exata como códigos de produto, mensagens de erro ou números de versão
- Buscar candidatos em excesso antes da fusão, o que aumenta a latência sem melhorar a qualidade dos resultados
- Assumir que pesos de fusão fixos funcionam em todos os tipos de consulta sem testes A/B ou otimização a nível de consulta
Perguntas Frequentes
Quando devo usar RRF versus fusão linear?
Quantos candidatos devo recuperar antes da fusão?
O reranking cross-encoder vale o custo computacional?
Posso usar pesquisa híbrida com bancos de dados vetoriais existentes?
Quais modelos de embedding funcionam melhor para pesquisa híbrida?
Como lido com consultas que são puramente semânticas ou puramente baseadas em palavras-chave?
Detalhes do Desenvolvedor
Autor
sickn33Licença
MIT
Repositório
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/hybrid-search-implementationReferência
main
Estrutura de arquivos