📊

umap-learn

Name: umap-learn
Author: davila7

Seguro ⚙️ Comandos externos🌐 Acesso à rede

Aplicar UMAP para redução de dimensionalidade

Também disponível em: K-Dense-AI

Dados de alta dimensionalidade são difíceis de visualizar e analisar. O UMAP fornece redução de dimensionalidade não linear rápida que preserva tanto a estrutura local quanto global para visualizações 2D/3D claras e pré-processamento eficaz de agrupamento.

Suporta: Claude Codex Code(CC)

📊 69 Adequado

Baixar o ZIP da skill

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

Ative e comece a usar

Testar

A utilizar "umap-learn". Generate a UMAP embedding for my dataset

Resultado esperado:

1. Import umap and StandardScaler
2. Pré-processar: escalar dados para intervalos comparáveis
3. Configurar UMAP: n_neighbors=15, min_dist=0.1, n_components=2
4. Ajustar e transformar: embedding = umap.UMAP().fit_transform(scaled_data)
5. Visualizar com gráfico de dispersão matplotlib

A utilizar "umap-learn". Prepare my data for clustering with HDBSCAN

Resultado esperado:

Usar UMAP com n_neighbors=30, min_dist=0.0, n_components=10
Escalar dados primeiro com StandardScaler
Aplicar HDBSCAN com min_cluster_size=15
Resultado: separação de cluster mais densa para análise downstream

A utilizar "umap-learn". Use UMAP with labeled data for supervised learning

Resultado esperado:

Passar rótulos via parâmetro y: fit_transform(data, y=labels)
Ajustar target_weight (0.5 padrão) para balancear rótulos vs estrutura
target_weight mais alto = mais separação de classes
target_weight mais baixo = mais estrutura de dados preservada

Auditoria de Segurança

Seguro

v5 • 1/17/2026

This skill is pure documentation containing markdown files with Python code examples for UMAP library usage. All 118 static findings are FALSE POSITIVES: backticks detected are markdown code fences, the source URL is legitimate metadata, and cryptographic keywords appear only in text strings. No executable scripts, network calls, file access, or command execution capabilities exist.

Arquivos analisados

1,197

Linhas analisadas

achados

Total de auditorias

Fatores de risco

⚙️ Comandos externos (106)

🌐 Acesso à rede (1)

skill-report.json:6

Auditado por: claude Ver Histórico de Auditoria →

Pontuação de qualidade

Arquitetura

100

Manutenibilidade

Conteúdo

Comunidade

100

Segurança

Conformidade com especificações

O Que Você Pode Construir

Visualizar conjuntos de dados complexos

Reduzir expressão gênica, embeddings de texto ou características de imagem para 2D para análise exploratória e apresentação.

Pré-processar para agrupamento

Aplicar UMAP antes do HDBSCAN para superar a maldição da dimensionalidade e melhorar a separação de clusters.

Analisar conjuntos de dados rotulados

Usar UMAP supervisionado com informações de rótulos para separar classes conhecidas enquanto preserva a estrutura interna.

Tente Estes Prompts

Visualização básica

Use UMAP to reduce my data to 2 dimensions for visualization. Show me how to configure n_neighbors and min_dist parameters.

Fluxo de trabalho de agrupamento

Help me use UMAP as preprocessing for HDBSCAN clustering. What parameters should I use for best clustering results?

Análise supervisionada

I have labeled data. Show me how to use supervised UMAP to separate classes while preserving structure.

Paramétrico avançado

Explain parametric UMAP with TensorFlow/Keras. When should I use it over standard UMAP and how do I define custom architectures?

Melhores Práticas

Sempre padronizar características com StandardScaler antes de aplicar UMAP para ponderação igual de dimensões
Usar n_neighbors=30 e n_components=5-10 para pré-processamento de agrupamento (não visualização 2D)
Definir random_state para resultados reproduzíveis em pipelines de produção

Evitar

Aplicar UMAP a dados não escalonados pode produzir embeddings enganosos com características artificialmente ponderadas
Usar n_neighbors=15 padrão para agrupamento cria clusters artificiais fragmentados
Esperar que transform() funcione bem quando a distribuição de dados de teste difere significativamente dos dados de treinamento

Perguntas Frequentes

Qual é a diferença entre UMAP e t-SNE?

UMAP é mais rápido, escala melhor para dimensões mais altas e preserva mais estrutura global enquanto mantém detalhes de vizinhança local.

Quais parâmetros funcionam melhor para agrupamento?

Usar n_neighbors=30, min_dist=0.0 e n_components=5-10 em vez dos padrões de visualização.

UMAP pode se integrar com pipelines do scikit-learn?

Sim, UMAP segue as convenções do scikit-learn e funciona perfeitamente em Pipeline com StandardScaler e classificadores.

Meus dados estão seguros ao usar UMAP?

Sim, UMAP executa localmente e não envia dados para serviços externos. Todo o processamento acontece em sua máquina.

Por que meus clusters estão desconectados?

Aumentar n_neighbors para enfatizar a estrutura global. n_neighbors baixo cria vizinhanças locais fragmentadas.

Quando devo usar UMAP Paramétrico?

Usar UMAP Paramétrico quando você precisa de transformação eficiente de novos dados após o treinamento ou deseja capacidades de reconstrução.

Detalhes do Desenvolvedor

Autor

davila7

Licença

MIT

Repositório

https://github.com/davila7/claude-code-templates/tree/main/cli-tool/components/skills/scientific/umap-learn

Referência

main

Estrutura de arquivos

📁 references/

📄 api_reference.md

📄 SKILL.md