📊

vaex

Name: vaex
Author: K-Dense-AI

Seguro ⚙️ Comandos externos📁 Acesso ao sistema de arquivos🌐 Acesso à rede

Analise conjuntos de dados massivos com Vaex

Também disponível em: davila7

Processar grandes conjuntos de dados tabulares que excedem a RAM exige ferramentas especializadas. O Vaex permite operacoes de DataFrame fora da memoria, avaliacao preguiçosa e processamento de bilhoes de linhas por segundo em conjuntos de dados grandes demais para a memoria. Perfeito para dados astronomicos, series temporais financeiras e analise cientifica em larga escala.

Suporta: Claude Codex Code(CC)

🥉 72 Bronze

Baixar o ZIP da skill

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

Ative e comece a usar

Testar

A utilizar "vaex". Load my parquet file and show statistics

Resultado esperado:

DataFrame shape: (10,000,000, 15) rows x columns
Column types: int64 (5), float64 (7), string (3)
Memory usage: 0.5 GB (virtual columns)
Mean age: 34.2 | Std income: 45200.5

A utilizar "vaex". Filter and group data

Resultado esperado:

Filtered to 2.3 million rows (age > 25)
Group by category results:
- Electronics: 450K rows, mean $52,000
- Clothing: 890K rows, mean $31,000
- Home: 960K rows, mean $42,000

A utilizar "vaex". Convert CSV to HDF5 for performance

Resultado esperado:

Original CSV: 15 GB, 45 minutes to load
Converted HDF5: 8 GB, instant loading
Memory-mapped access - zero RAM for exploration

Auditoria de Segurança

Seguro

v4 • 1/17/2026

This is a pure documentation skill for the Vaex Python library. All 498 static findings are false positives caused by markdown code block formatting. The scanner misinterpreted backticks in code examples as Ruby/shell commands, flagged memory-mapping as filesystem access, and misidentified DataFrame inspection methods as reconnaissance. No executable code, credential handling, or malicious patterns exist.

Arquivos analisados

6,268

Linhas analisadas

achados

Total de auditorias

Fatores de risco

⚙️ Comandos externos (7)

SKILL.md:32-178 references/core_dataframes.md:15-156 references/data_processing.md:11-554 references/io_operations.md:19-702 references/machine_learning.md:7-727 references/performance.md:11-570 references/visualization.md:20-612

📁 Acesso ao sistema de arquivos (3)

references/io_operations.md:10-13 references/io_operations.md:22-48 references/performance.md:259-262

🌐 Acesso à rede (2)

references/io_operations.md:474 skill-report.json:6

Auditado por: claude Ver Histórico de Auditoria →

Pontuação de qualidade

Arquitetura

100

Manutenibilidade

Conteúdo

Comunidade

100

Segurança

Conformidade com especificações

O Que Você Pode Construir

Explorar conjuntos de dados com bilhoes de linhas

Analise conjuntos de dados CSV/HDF5 massivos de forma interativa sem restricoes de memoria ou pre-processamento.

Processar dados astronomicos

Trabalhe com conjuntos de dados cientificos em escala de terabytes usando computacao fora da memoria e avaliacao preguiçosa.

Construir pipelines escalaveis

Crie fluxos de engenharia de atributos e ML que lidam com conjuntos de dados que excedem a RAM disponivel.

Tente Estes Prompts

Carregar conjunto de dados grande

Use Vaex to open my HDF5 file at data/large_dataset.hdf5 and show its structure, column types, and row count.

Filtrar e agregar

Filter the dataset for records where age > 25 and calculate the mean and standard deviation of income grouped by category.

Criar visualizacao

Create a heatmap showing the relationship between x and y coordinates with 100 bins on each axis.

Construir pipeline de ML

Use Vaex ML to create a StandardScaler for features age and income, then apply PCA for dimensionality reduction.

Melhores Práticas

Use formatos HDF5 ou Apache Arrow para carregamento instantaneo com memory-mapped em vez de CSV
Aproveite colunas virtuais e expressoes para computacoes sem materializar dados
Agrupe operacoes com delay=True ao realizar varias agregacoes para eficiencia

Evitar

Evite carregar conjuntos de dados inteiros na RAM - use vaex.open() para acesso com memory-mapped
Nao converta grandes conjuntos de dados para pandas - use operacoes Vaex em todo o pipeline
Evite varias exportacoes pequenas - agrupe escritas e use formatos eficientes como HDF5

Perguntas Frequentes

O que torna o Vaex diferente do pandas?

O Vaex usa avaliacao preguiçosa e memory-mapping para processar conjuntos de dados maiores que a RAM sem carregar tudo na memoria.

Quais formatos de arquivo o Vaex suporta?

O Vaex suporta formatos HDF5, Apache Arrow, Parquet, CSV e FITS com carregamento memory-mapped para acesso eficiente.

O Vaex lida com conjuntos de dados com bilhoes de linhas?

Sim, o Vaex pode processar mais de um bilhao de linhas por segundo usando operacoes C++ otimizadas e computacao fora da memoria.

O Vaex oferece suporte a machine learning?

O Vaex ML oferece transformers, encoders, PCA, K-means e integracao com scikit-learn, XGBoost e LightGBM.

Como funciona a avaliacao preguiçosa?

As operacoes nao sao executadas ate que os resultados sejam necessarios, permitindo agrupamento eficiente e uso minimo de memoria.

O Vaex pode acessar armazenamento em nuvem?

O Vaex pode ler de S3, GCS e outros armazenamentos em nuvem usando protocolos como os prefixos s3:// e gs://.

Detalhes do Desenvolvedor

Autor

K-Dense-AI

Licença

MIT license

Repositório

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/vaex

Referência

main

Estrutura de arquivos

📁 references/

📄 core_dataframes.md

📄 data_processing.md

📄 io_operations.md

📄 machine_learning.md

📄 performance.md

📄 visualization.md

📄 SKILL.md