exploratory-data-analysis
Analisar Arquivos de Dados Científicos Automaticamente
Também disponível em: davila7
Arquivos de dados científicos existem em centenas de formatos. Esta skill detecta automaticamente o tipo de arquivo, extrai metadados, avalia a qualidade dos dados e gera relatórios markdown abrangentes com recomendações de análise específicas do formato.
Baixar o ZIP da skill
Upload no Claude
Vá em Configurações → Capacidades → Skills → Upload skill
Ative e comece a usar
Testar
A utilizar "exploratory-data-analysis". Analyze data/sample.fastq
Resultado esperado:
- File: sample.fastq (24.5 MB)
- Format: FASTQ (sequence data with quality scores)
- Sampled 10,000 reads: Mean length 150bp, Mean quality: 35.2
- GC Content: 52.3%
- Quality Assessment: High-quality data, suitable for downstream analysis
- Recommendations: Proceed with alignment; no trimming required
A utilizar "exploratory-data-analysis". Explore experiment_results.csv
Resultado esperado:
- File: experiment_results.csv (1.2 MB)
- Format: CSV (tabular data)
- Dimensions: 5,000 rows x 12 columns
- Missing Values: 2.3% in column 'temperature'
- Statistics: Mean=45.2, Std=12.8, Range=[-5.2, 98.4]
- Recommendations: Impute missing values; check for outliers in temperature column
Auditoria de Segurança
SeguroAfter thorough evaluation of 1077 static findings, all are false positives. The scanner misinterpreted Markdown code formatting (backticks) as shell commands, bioinformatics format names (SAM) as Windows credentials, and documentation references to file format specifications as weak cryptography. The skill is a legitimate scientific data analysis tool that only reads data files and writes markdown reports. No network access, no command execution, and no sensitive data handling were found.
Fatores de risco
📁 Acesso ao sistema de arquivos (1)
Pontuação de qualidade
O Que Você Pode Construir
Explorar dados de sequenciamento genômico
Analisar arquivos FASTQ, BAM e VCF para entender a qualidade das sequências, taxas de mapeamento e distribuições de variantes.
Examinar arquivos de estrutura molecular
Parsear arquivos PDB, SDF e CIF para avaliar estruturas moleculares, coordenadas atômicas e informações de ligações.
Inspecionar metadados de imagens de microscopia
Extrair dimensões, canais, carimbos de tempo e calibração espacial de arquivos de imagem TIFF, ND2 e CZI.
Tente Estes Prompts
Analisar este arquivo de dados científico no caminho: <filepath>
Gerar um relatório EDA abrangente para este arquivo e salvá-lo em <filepath>
Realizar uma avaliação de qualidade de dados neste arquivo e identificar quaisquer problemas ou anomalias.
Analisar estes múltiplos arquivos relacionados e criar um relatório de comparação resumido.
Melhores Práticas
- Forneça o caminho completo do arquivo ao solicitar análise para detecção precisa
- Especifique o nome do arquivo de saída para gerar um relatório markdown persistente
- Verifique as bibliotecas Python necessárias para formatos especializados antes da análise
Evitar
- Não peça à skill para modificar ou escrever nos arquivos de dados de origem
- Não espere que a skill realize modelagem estatística avançada
- Não assuma que a skill pode interpretar significado biológico de sequências
Perguntas Frequentes
Quais formatos de arquivo são suportados?
Isso modifica meus arquivos de dados?
O que o relatório gerado inclui?
Pode analisar arquivos grandes?
Quais bibliotecas Python são necessárias?
Pode analisar múltiplos arquivos juntos?
Detalhes do Desenvolvedor
Autor
K-Dense-AILicença
MIT license
Repositório
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/exploratory-data-analysisReferência
main
Estrutura de arquivos