Habilidades hybrid-search-implementation
📦

hybrid-search-implementation

Seguro

Implemente Pesquisa Híbrida para Sistemas RAG

Também disponível em: wshobson

A pesquisa apenas por vetor ou apenas por palavra-chave frequentemente perde resultados relevantes. Esta habilidade fornece padrões comprovados para combinar ambas as abordagens para alcançar precisão de recuperação superior.

Suporta: Claude Codex Code(CC)
🥉 72 Bronze
1

Baixar o ZIP da skill

2

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

3

Ative e comece a usar

Testar

A utilizar "hybrid-search-implementation". Usuário pesquisa por 'authentication error 401' na documentação da API

Resultado esperado:

A pesquisa híbrida retorna documentos correspondendo tanto ao conceito semântico de falhas de autenticação QUANTO correspondências exatas para o código de erro 401, classificados por pontuação de relevância combinada.

A utilizar "hybrid-search-implementation". Desenvolvedor consulta 'how to paginate results' na documentação do SDK

Resultado esperado:

A pesquisa vetorial encontra padrões de paginação semanticamente relacionados enquanto a pesquisa por palavra-chave garante que correspondências exatas para terminologia 'limit', 'offset', 'cursor' sejam incluídas nos resultados.

Auditoria de Segurança

Seguro
v1 • 2/25/2026

Static analysis flagged 55 patterns but all are false positives. Files are markdown documentation with Python code samples. Backticks are markdown formatting not shell execution. URLs are documentation references not network calls. No cryptographic operations, credential access, or system commands detected. Skill is safe for publication.

2
Arquivos analisados
603
Linhas analisadas
0
achados
1
Total de auditorias
Nenhum problema de segurança encontrado
Auditado por: claude

Pontuação de qualidade

38
Arquitetura
100
Manutenibilidade
87
Conteúdo
32
Comunidade
100
Segurança
100
Conformidade com especificações

O Que Você Pode Construir

Desenvolvedor de Sistemas RAG

Construa sistemas de retrieval-augmented generation com recall aprimorado combinando pesquisa semântica por vetor com correspondência exata por palavra-chave para termos técnicos e códigos de produto.

Construtor de Mecanismos de Busca

Implemente busca empresarial que lida tanto com consultas conceituais (via embeddings) quanto com correspondência precisa de termos (via BM25) para resultados abrangentes.

Arquiteto de Base de Conhecimento

Crie busca de documentação que compreende a intenção do usuário semanticamente enquanto ainda encontra correspondências exatas para códigos de erro, nomes de API e números de versão.

Tente Estes Prompts

Configuração Básica de Pesquisa Híbrida
Preciso implementar pesquisa híbrida para meu sistema RAG. Mostre-me como combinar embeddings vetoriais com pesquisa por palavra-chave usando Reciprocal Rank Fusion em Python.
Implementação PostgreSQL pgvector
Ajude-me a configurar pesquisa híbrida no PostgreSQL usando pgvector para embeddings e full-text search nativo. Preciso de criação de esquema SQL e exemplos de consultas com fusão RRF.
Configuração de Pesquisa Híbrida Elasticsearch
Mostre-me como configurar o Elasticsearch para pesquisa híbrida combinando similaridade de vetores densos com busca de texto BM25. Inclua mapeamento de índice, consultas de busca e configuração RRF para Elasticsearch 8.x.
Pipeline RAG Avançado com Reranking
Construa um pipeline RAG híbrido completo que recupera candidatos com pesquisa vetorial e por palavra-chave, funde resultados com RRF, então reclassifica os melhores candidatos usando um modelo cross-encoder. Inclua implementação Python async com pesos configuráveis.

Melhores Práticas

  • Ajuste os pesos de fusão empiricamente no seu dataset - RRF com k=60 funciona bem como ponto de partida, mas o equilíbrio ideal depende do seu conteúdo
  • Sempre inclua reranking cross-encoder para sistemas de produção - a melhoria de qualidade justifica a latência adicional para candidatos top-k
  • Registre tanto pontuações individuais quanto pontuações fundidas durante o desenvolvimento para entender quais consultas se beneficiam de cada método de busca

Evitar

  • Usar apenas pesquisa vetorial para domínios com requisitos de correspondência exata como códigos de produto, mensagens de erro ou números de versão
  • Buscar candidatos em excesso antes da fusão, o que aumenta a latência sem melhorar a qualidade dos resultados
  • Assumir que pesos de fusão fixos funcionam em todos os tipos de consulta sem testes A/B ou otimização a nível de consulta

Perguntas Frequentes

Quando devo usar RRF versus fusão linear?
RRF é mais simples e não requer ajuste - funciona bem logo de início. A fusão linear oferece mais controle mas requer ajuste empírico de pesos nos seus dados. Comece com RRF, mude para linear se precisar de controle mais refinado.
Quantos candidatos devo recuperar antes da fusão?
Tipicamente 3x seu limite final por método. Para resultados top-10, recupere 30 de cada método de busca. Isso fornece sobreposição suficiente para fusão efetiva sem latência excessiva.
O reranking cross-encoder vale o custo computacional?
Sim para RAG em produção. Reranking de 50 candidatos adiciona ~100-500ms mas melhora significativamente a relevância. Aplique reranking apenas aos candidatos top-k fundidos, não ao conjunto completo de candidatos.
Posso usar pesquisa híbrida com bancos de dados vetoriais existentes?
A maioria dos bancos de dados vetoriais agora suporta pesquisa híbrida nativamente. Pinecone, Weaviate, Qdrant e pgvector oferecem pesquisa híbrida integrada com parâmetros de fusão configuráveis.
Quais modelos de embedding funcionam melhor para pesquisa híbrida?
Qualquer modelo de embedding funciona já que a pesquisa híbrida combina embeddings com pesquisa por palavra-chave. OpenAI text-embedding-3, Cohere embed-v3 ou modelos open-source como BGE funcionam efetivamente.
Como lido com consultas que são puramente semânticas ou puramente baseadas em palavras-chave?
Para consultas exatas curtas (códigos de erro, IDs), aumente o peso da palavra-chave. Para perguntas em linguagem natural, aumente o peso vetorial. Sistemas avançados usam classificação de consulta para definir pesos dinâmicos.

Detalhes do Desenvolvedor

Estrutura de arquivos