data-exploration
Explore e Perfilize Seus Dados de Banco de Dados
Compreender bancos de dados desconhecidos leva horas de consultas manuais. Esta skill automatiza a descoberta de esquema, perfilização de dados e avaliação de qualidade para que você possa compreender rapidamente qualquer conjunto de dados.
Baixar o ZIP da skill
Upload no Claude
Vá em Configurações → Capacidades → Skills → Upload skill
Ative e comece a usar
Testar
A utilizar "data-exploration". Que tabelas existem neste banco de dados?
Resultado esperado:
Encontradas 5 tabelas no esquema public:
1. users (12.450 linhas) - Contas de usuário principais
2. orders (48.923 linhas) - Pedidos de clientes
3. products (3.200 linhas) - Catálogo de produtos
4. order_items (145.200 linhas) - Itens de linha por pedido
5. categories (150 linhas) - Categorias de produtos
Relacionamentos chave detectados:
- orders.user_id → users.id
- order_items.order_id → orders.id
- order_items.product_id → products.id
- products.category_id → categories.id
A utilizar "data-exploration". Perfilize a tabela users para qualidade de dados
Resultado esperado:
Relatório de Qualidade de Dados: tabela users
Total de linhas: 12.450
Completude de colunas:
✓ id: 100% (12.450/12.450)
✓ email: 99,8% (12.425/12.450) - 25 nulos
✓ created_at: 100% (12.450/12.450)
⚠ phone: 45,2% (5.627/12.450) - Baixa completude
⚠ address: 62,8% (7.818/12.450) - Completude média
Flags de qualidade:
- A coluna email tem 25 valores nulos que podem precisar de atenção
- Dados de número de telefone são esparsos - campo opcional?
- Consulta sugerida: Investigar usuários sem endereços de e-mail
Auditoria de Segurança
SeguroStatic analysis detected 19 potential issues (external commands, weak crypto, system reconnaissance). All findings are false positives caused by pattern matching on markdown code blocks containing SQL queries. The skill contains only documentation and SQL query templates for database profiling - no executable code, no network access, no file system operations, no environment variable access. This is a legitimate data exploration guide.
Pontuação de qualidade
O Que Você Pode Construir
Integração a um Novo Banco de Dados
Compreenda rapidamente a estrutura e conteúdo de um banco de dados desconhecido descobrindo tabelas, perfilizando colunas e identificando relacionamentos.
Avalie a Qualidade dos Dados Antes da Análise
Avalie a completude e taxas de nulos nas colunas para identificar problemas de qualidade dos dados antes de iniciar projetos de analytics ou machine learning.
Documente Esquema de Banco de Dados Legado
Gere documentação abrangente da estrutura do banco de dados incluindo relacionamentos de tabelas, contagens de linhas e métricas de qualidade de dados.
Tente Estes Prompts
Que tabelas existem neste banco de dados e quantas linhas cada uma tem?
Explore o esquema e me dê um perfil completo da tabela [table_name] incluindo colunas, tipos de dados, contagem de linhas e métricas de qualidade de dados.
Analise o esquema do banco de dados e identifique todos os relacionamentos de chave estrangeira entre tabelas. Mostre como as tabelas se conectam umas às outras.
Perfilize todas as tabelas no esquema e identifique quaisquer problemas de qualidade de dados - colunas com altas taxas de nulos, tabelas vazias ou dados inconsistentes.
Melhores Práticas
- Comece com descoberta ampla de esquema usando read_schema antes de mergulhar em tabelas específicas
- Sempre verifique as contagens de linhas antes de executar consultas de agregação caras em tabelas grandes
- Use a pontuação de qualidade de dados para priorizar quais tabelas e colunas precisam de limpeza
- Documente os relacionamentos descobertos para referência futura - eles nem sempre estão explicitamente definidos como chaves estrangeiras
- Ao explorar bancos de dados grandes, foque em um esquema ou tabela de cada vez em vez de tentar perfilizar tudo de uma vez
Evitar
- Executar COUNT(*) em tabelas muito grandes sem primeiro entender o tamanho da tabela ou usar amostragem
- Assumir que nomes de colunas terminando em '_id' são chaves estrangeiras sem verificar se a tabela de destino existe
- Perfilizar todas as tabelas em um banco de dados grande simultaneamente - pode sobrecarregar o sistema e produzir saída gerenciável
- Tratar altas taxas de nulos como problemas de qualidade de dados sem entender o contexto de negócios - alguns campos são legitimamente opcionais