umap-learn
Aplicar UMAP para reducción de dimensionalidad
Auch verfügbar von: K-Dense-AI
Los datos de alta dimensionalidad son difíciles de visualizar y analizar. UMAP proporciona reducción de dimensionalidad no lineal rápida que preserva tanto la estructura local como global para visualizaciones 2D/3D claras y preprocesamiento efectivo de agrupamiento.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "umap-learn". Generar un embedding UMAP para mi conjunto de datos
Erwartetes Ergebnis:
- 1. Importar umap y StandardScaler
- 2. Preprocesar: escalar datos a rangos comparables
- 3. Configurar UMAP: n_neighbors=15, min_dist=0.1, n_components=2
- 4. Ajustar y transformar: embedding = umap.UMAP().fit_transform(scaled_data)
- 5. Visualizar con gráfico de dispersión de matplotlib
Verwendung von "umap-learn". Preparar mis datos para agrupamiento con HDBSCAN
Erwartetes Ergebnis:
- Usar UMAP con n_neighbors=30, min_dist=0.0, n_components=10
- Escalar datos primero con StandardScaler
- Aplicar HDBSCAN con min_cluster_size=15
- Resultado: separación de clusters más densa para análisis posterior
Verwendung von "umap-learn". Usar UMAP con datos etiquetados para aprendizaje supervisado
Erwartetes Ergebnis:
- Pasar etiquetas mediante el parámetro y: fit_transform(data, y=labels)
- Ajustar target_weight (0.5 por defecto) para equilibrar etiquetas vs estructura
- target_weight más alto = más separación de clases
- target_weight más bajo = más estructura de datos preservada
Sicherheitsaudit
SicherThis skill is pure documentation containing markdown files with Python code examples for UMAP library usage. All 118 static findings are FALSE POSITIVES: backticks detected are markdown code fences, the source URL is legitimate metadata, and cryptographic keywords appear only in text strings. No executable scripts, network calls, file access, or command execution capabilities exist.
Risikofaktoren
⚙️ Externe Befehle (106)
🌐 Netzwerkzugriff (1)
Qualitätsbewertung
Was du bauen kannst
Visualizar conjuntos de datos complejos
Reducir expresión génica, embeddings de texto o características de imágenes a 2D para análisis exploratorio y presentación.
Preprocesar para agrupamiento
Aplicar UMAP antes de HDBSCAN para superar la maldición de la dimensionalidad y mejorar la separación de clusters.
Analizar conjuntos de datos etiquetados
Usar UMAP supervisado con información de etiquetas para separar clases conocidas mientras se preserva la estructura interna.
Probiere diese Prompts
Usa UMAP para reducir mis datos a 2 dimensiones para visualización. Muéstrame cómo configurar los parámetros n_neighbors y min_dist.
Ayúdame a usar UMAP como preprocesamiento para agrupamiento con HDBSCAN. ¿Qué parámetros debo usar para obtener los mejores resultados de agrupamiento?
Tengo datos etiquetados. Muéstrame cómo usar UMAP supervisado para separar clases mientras se preserva la estructura.
Explica UMAP paramétrico con TensorFlow/Keras. ¿Cuándo debería usarlo en lugar de UMAP estándar y cómo defino arquitecturas personalizadas?
Bewährte Verfahren
- Siempre estandarizar características con StandardScaler antes de aplicar UMAP para ponderación igual de dimensiones
- Usar n_neighbors=30 y n_components=5-10 para preprocesamiento de agrupamiento (no visualización 2D)
- Establecer random_state para resultados reproducibles en pipelines de producción
Vermeiden
- Aplicar UMAP a datos sin escalar puede producir embeddings engañosos con características artificialmente ponderadas
- Usar el n_neighbors=15 por defecto para agrupamiento crea clusters artificiales fragmentados
- Esperar que transform() funcione bien cuando la distribución de datos de prueba difiere significativamente de los datos de entrenamiento