polars
Trabalhe com DataFrames Polars de forma eficiente
Também disponível em: davila7
Processe grandes conjuntos de dados na memória com o Polars, a biblioteca de DataFrame de alto desempenho. Recursos de avaliação preguiçosa, execução paralela e backend Apache Arrow para operações 10x mais rápidas que o pandas.
Baixar o ZIP da skill
Upload no Claude
Vá em Configurações → Capacidades → Skills → Upload skill
Ative e comece a usar
Testar
A utilizar "polars". Carregue um arquivo CSV e filtre linhas onde a idade é maior que 25
Resultado esperado:
- Criado DataFrame com colunas: name, age, city
- Filtrado para 2 linhas onde age > 25
- Colunas selecionadas: name, age
A utilizar "polars". Agrupe dados de vendas por categoria de produto e calcule total e média de vendas
Resultado esperado:
- Agrupado por product_category
- Calculado soma e média de sales_amount
- Resultado inclui: category, total_sales, avg_sales
A utilizar "polars". Leia um arquivo Parquet usando avaliação preguiçosa e colete apenas as colunas necessárias
Resultado esperado:
- Usado scan_parquet para carregamento preguiçoso
- Selecionado apenas as colunas necessárias antecipadamente
- Coletado com otimização de pushdown de predicado
Auditoria de Segurança
SeguroThis skill contains ONLY markdown documentation files with Python code examples. All 690 static findings are FALSE POSITIVES. The analyzer misidentified markdown code blocks, Python syntax, and Polars library methods as security threats. No executable code, shell commands, credential access, or network operations exist.
Fatores de risco
⚙️ Comandos externos (647)
🔑 Variáveis de ambiente (9)
⚡ Contém scripts (1)
🌐 Acesso à rede (3)
Pontuação de qualidade
O Que Você Pode Construir
Construir pipelines ETL
Crie pipelines de dados eficientes com avaliação preguiçosa para otimização de memória e execução paralela.
Transformar e agregar dados
Filtre, agrupe e agregue grandes conjuntos de dados com sintaxe baseada em expressões e funções de janela.
Substituir pandas por alternativa mais rápida
Migrate código pandas existente para Polars para melhorias significativas de desempenho em conjuntos de dados médios.
Tente Estes Prompts
Carregue um arquivo CSV com Polars e mostre as primeiras linhas, tipos de colunas e estatísticas básicas.
Filtre linhas onde uma coluna atende a uma condição e selecione colunas específicas usando expressões Polars.
Agrupe dados por uma ou mais colunas e calcule agregações como média, soma e contagem.
Converta esta operação de DataFrame para usar avaliação preguiçosa e explique os benefícios de desempenho.
Melhores Práticas
- Use scan_csv ou scan_parquet com avaliação preguiçosa para grandes conjuntos de dados para habilitar otimização de consultas
- Filtre e selecione colunas antecipadamente em seu pipeline para reduzir uso de memória e melhorar desempenho
- Prefira expressões nativas do Polars sobre funções Python para habilitar execução paralela
Evitar
- Evite usar read_csv em arquivos grandes quando avaliação preguiçosa seria suficiente
- Não aplique funções Python dentro de caminhos críticos quando expressões Polars podem realizar a mesma tarefa
- Evite carregar conjuntos de dados inteiros na memória quando streaming com collect(streaming=True) funcionaria
Perguntas Frequentes
Como o Polars é diferente do pandas?
Quando devo usar avaliação preguiçosa?
Quais tamanhos de dados funcionam melhor com Polars?
Posso migrar do pandas facilmente?
Polars suporta armazenamento em nuvem?
Quais formatos de arquivo Polars suporta?
Detalhes do Desenvolvedor
Autor
K-Dense-AILicença
https://github.com/pola-rs/polars/blob/main/LICENSE
Repositório
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/polarsReferência
main
Estrutura de arquivos