umap-learn
Aplicar UMAP para redução de dimensionalidade
Également disponible depuis: K-Dense-AI
Dados de alta dimensionalidade são difíceis de visualizar e analisar. O UMAP fornece redução de dimensionalidade não linear rápida que preserva tanto a estrutura local quanto global para visualizações 2D/3D claras e pré-processamento eficaz de agrupamento.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "umap-learn". Generate a UMAP embedding for my dataset
Résultat attendu:
- 1. Import umap and StandardScaler
- 2. Pré-processar: escalar dados para intervalos comparáveis
- 3. Configurar UMAP: n_neighbors=15, min_dist=0.1, n_components=2
- 4. Ajustar e transformar: embedding = umap.UMAP().fit_transform(scaled_data)
- 5. Visualizar com gráfico de dispersão matplotlib
Utilisation de "umap-learn". Prepare my data for clustering with HDBSCAN
Résultat attendu:
- Usar UMAP com n_neighbors=30, min_dist=0.0, n_components=10
- Escalar dados primeiro com StandardScaler
- Aplicar HDBSCAN com min_cluster_size=15
- Resultado: separação de cluster mais densa para análise downstream
Utilisation de "umap-learn". Use UMAP with labeled data for supervised learning
Résultat attendu:
- Passar rótulos via parâmetro y: fit_transform(data, y=labels)
- Ajustar target_weight (0.5 padrão) para balancear rótulos vs estrutura
- target_weight mais alto = mais separação de classes
- target_weight mais baixo = mais estrutura de dados preservada
Audit de sécurité
SûrThis skill is pure documentation containing markdown files with Python code examples for UMAP library usage. All 118 static findings are FALSE POSITIVES: backticks detected are markdown code fences, the source URL is legitimate metadata, and cryptographic keywords appear only in text strings. No executable scripts, network calls, file access, or command execution capabilities exist.
Facteurs de risque
⚙️ Commandes externes (106)
🌐 Accès réseau (1)
Score de qualité
Ce que vous pouvez construire
Visualizar conjuntos de dados complexos
Reduzir expressão gênica, embeddings de texto ou características de imagem para 2D para análise exploratória e apresentação.
Pré-processar para agrupamento
Aplicar UMAP antes do HDBSCAN para superar a maldição da dimensionalidade e melhorar a separação de clusters.
Analisar conjuntos de dados rotulados
Usar UMAP supervisionado com informações de rótulos para separar classes conhecidas enquanto preserva a estrutura interna.
Essayez ces prompts
Use UMAP to reduce my data to 2 dimensions for visualization. Show me how to configure n_neighbors and min_dist parameters.
Help me use UMAP as preprocessing for HDBSCAN clustering. What parameters should I use for best clustering results?
I have labeled data. Show me how to use supervised UMAP to separate classes while preserving structure.
Explain parametric UMAP with TensorFlow/Keras. When should I use it over standard UMAP and how do I define custom architectures?
Bonnes pratiques
- Sempre padronizar características com StandardScaler antes de aplicar UMAP para ponderação igual de dimensões
- Usar n_neighbors=30 e n_components=5-10 para pré-processamento de agrupamento (não visualização 2D)
- Definir random_state para resultados reproduzíveis em pipelines de produção
Éviter
- Aplicar UMAP a dados não escalonados pode produzir embeddings enganosos com características artificialmente ponderadas
- Usar n_neighbors=15 padrão para agrupamento cria clusters artificiais fragmentados
- Esperar que transform() funcione bem quando a distribuição de dados de teste difere significativamente dos dados de treinamento