Habilidades hybrid-search-implementation

📦

hybrid-search-implementation

Name: hybrid-search-implementation
Author: sickn33

Seguro

Implemente Pesquisa Híbrida para Sistemas RAG

Também disponível em: wshobson

A pesquisa apenas por vetor ou apenas por palavra-chave frequentemente perde resultados relevantes. Esta habilidade fornece padrões comprovados para combinar ambas as abordagens para alcançar precisão de recuperação superior.

Suporta: Claude Codex Code(CC)

📊 71 Adequado

Baixar o ZIP da skill

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

Ative e comece a usar

Testar

A utilizar "hybrid-search-implementation". Usuário pesquisa por 'authentication error 401' na documentação da API

Resultado esperado:

A pesquisa híbrida retorna documentos correspondendo tanto ao conceito semântico de falhas de autenticação QUANTO correspondências exatas para o código de erro 401, classificados por pontuação de relevância combinada.

A utilizar "hybrid-search-implementation". Desenvolvedor consulta 'how to paginate results' na documentação do SDK

Resultado esperado:

A pesquisa vetorial encontra padrões de paginação semanticamente relacionados enquanto a pesquisa por palavra-chave garante que correspondências exatas para terminologia 'limit', 'offset', 'cursor' sejam incluídas nos resultados.

Auditoria de Segurança

Seguro

v1 • 2/25/2026

Static analysis flagged 55 patterns but all are false positives. Files are markdown documentation with Python code samples. Backticks are markdown formatting not shell execution. URLs are documentation references not network calls. No cryptographic operations, credential access, or system commands detected. Skill is safe for publication.

Arquivos analisados

603

Linhas analisadas

achados

Total de auditorias

Nenhum problema de segurança encontrado

Auditado por: claude

Pontuação de qualidade

Arquitetura

100

Manutenibilidade

Conteúdo

Comunidade

100

Segurança

100

Conformidade com especificações

O Que Você Pode Construir

Desenvolvedor de Sistemas RAG

Construa sistemas de retrieval-augmented generation com recall aprimorado combinando pesquisa semântica por vetor com correspondência exata por palavra-chave para termos técnicos e códigos de produto.

Construtor de Mecanismos de Busca

Implemente busca empresarial que lida tanto com consultas conceituais (via embeddings) quanto com correspondência precisa de termos (via BM25) para resultados abrangentes.

Arquiteto de Base de Conhecimento

Crie busca de documentação que compreende a intenção do usuário semanticamente enquanto ainda encontra correspondências exatas para códigos de erro, nomes de API e números de versão.

Tente Estes Prompts

Configuração Básica de Pesquisa Híbrida

Preciso implementar pesquisa híbrida para meu sistema RAG. Mostre-me como combinar embeddings vetoriais com pesquisa por palavra-chave usando Reciprocal Rank Fusion em Python.

Implementação PostgreSQL pgvector

Ajude-me a configurar pesquisa híbrida no PostgreSQL usando pgvector para embeddings e full-text search nativo. Preciso de criação de esquema SQL e exemplos de consultas com fusão RRF.

Configuração de Pesquisa Híbrida Elasticsearch

Mostre-me como configurar o Elasticsearch para pesquisa híbrida combinando similaridade de vetores densos com busca de texto BM25. Inclua mapeamento de índice, consultas de busca e configuração RRF para Elasticsearch 8.x.

Pipeline RAG Avançado com Reranking

Construa um pipeline RAG híbrido completo que recupera candidatos com pesquisa vetorial e por palavra-chave, funde resultados com RRF, então reclassifica os melhores candidatos usando um modelo cross-encoder. Inclua implementação Python async com pesos configuráveis.

Melhores Práticas

Ajuste os pesos de fusão empiricamente no seu dataset - RRF com k=60 funciona bem como ponto de partida, mas o equilíbrio ideal depende do seu conteúdo
Sempre inclua reranking cross-encoder para sistemas de produção - a melhoria de qualidade justifica a latência adicional para candidatos top-k
Registre tanto pontuações individuais quanto pontuações fundidas durante o desenvolvimento para entender quais consultas se beneficiam de cada método de busca

Evitar

Usar apenas pesquisa vetorial para domínios com requisitos de correspondência exata como códigos de produto, mensagens de erro ou números de versão
Buscar candidatos em excesso antes da fusão, o que aumenta a latência sem melhorar a qualidade dos resultados
Assumir que pesos de fusão fixos funcionam em todos os tipos de consulta sem testes A/B ou otimização a nível de consulta

Perguntas Frequentes

Quando devo usar RRF versus fusão linear?

RRF é mais simples e não requer ajuste - funciona bem logo de início. A fusão linear oferece mais controle mas requer ajuste empírico de pesos nos seus dados. Comece com RRF, mude para linear se precisar de controle mais refinado.

Quantos candidatos devo recuperar antes da fusão?

Tipicamente 3x seu limite final por método. Para resultados top-10, recupere 30 de cada método de busca. Isso fornece sobreposição suficiente para fusão efetiva sem latência excessiva.

O reranking cross-encoder vale o custo computacional?

Sim para RAG em produção. Reranking de 50 candidatos adiciona ~100-500ms mas melhora significativamente a relevância. Aplique reranking apenas aos candidatos top-k fundidos, não ao conjunto completo de candidatos.

Posso usar pesquisa híbrida com bancos de dados vetoriais existentes?

A maioria dos bancos de dados vetoriais agora suporta pesquisa híbrida nativamente. Pinecone, Weaviate, Qdrant e pgvector oferecem pesquisa híbrida integrada com parâmetros de fusão configuráveis.

Quais modelos de embedding funcionam melhor para pesquisa híbrida?

Qualquer modelo de embedding funciona já que a pesquisa híbrida combina embeddings com pesquisa por palavra-chave. OpenAI text-embedding-3, Cohere embed-v3 ou modelos open-source como BGE funcionam efetivamente.

Como lido com consultas que são puramente semânticas ou puramente baseadas em palavras-chave?

Para consultas exatas curtas (códigos de erro, IDs), aumente o peso da palavra-chave. Para perguntas em linguagem natural, aumente o peso vetorial. Sistemas avançados usam classificação de consulta para definir pesos dinâmicos.

Detalhes do Desenvolvedor

Autor

sickn33

Licença

MIT

Repositório

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/hybrid-search-implementation

Referência

main

Estrutura de arquivos

📁 resources/

📄 implementation-playbook.md

📄 SKILL.md