📊

umap-learn

Name: umap-learn
Author: davila7

Seguro ⚙️ Comandos externos🌐 Acceso a red

Aplicar UMAP para reducción de dimensionalidad

También disponible en: K-Dense-AI

Los datos de alta dimensionalidad son difíciles de visualizar y analizar. UMAP proporciona reducción de dimensionalidad no lineal rápida que preserva tanto la estructura local como global para visualizaciones 2D/3D claras y preprocesamiento efectivo de agrupamiento.

Soporta: Claude Codex Code(CC)

📊 69 Adecuado

Descargar el ZIP de la skill

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

Activa y empieza a usar

Pruébalo

Usando "umap-learn". Generar un embedding UMAP para mi conjunto de datos

Resultado esperado:

1. Importar umap y StandardScaler
2. Preprocesar: escalar datos a rangos comparables
3. Configurar UMAP: n_neighbors=15, min_dist=0.1, n_components=2
4. Ajustar y transformar: embedding = umap.UMAP().fit_transform(scaled_data)
5. Visualizar con gráfico de dispersión de matplotlib

Usando "umap-learn". Preparar mis datos para agrupamiento con HDBSCAN

Resultado esperado:

Usar UMAP con n_neighbors=30, min_dist=0.0, n_components=10
Escalar datos primero con StandardScaler
Aplicar HDBSCAN con min_cluster_size=15
Resultado: separación de clusters más densa para análisis posterior

Usando "umap-learn". Usar UMAP con datos etiquetados para aprendizaje supervisado

Resultado esperado:

Pasar etiquetas mediante el parámetro y: fit_transform(data, y=labels)
Ajustar target_weight (0.5 por defecto) para equilibrar etiquetas vs estructura
target_weight más alto = más separación de clases
target_weight más bajo = más estructura de datos preservada

Auditoría de seguridad

Seguro

v5 • 1/17/2026

This skill is pure documentation containing markdown files with Python code examples for UMAP library usage. All 118 static findings are FALSE POSITIVES: backticks detected are markdown code fences, the source URL is legitimate metadata, and cryptographic keywords appear only in text strings. No executable scripts, network calls, file access, or command execution capabilities exist.

Archivos escaneados

1,197

Líneas analizadas

hallazgos

Auditorías totales

Factores de riesgo

⚙️ Comandos externos (106)

🌐 Acceso a red (1)

skill-report.json:6

Auditado por: claude Ver historial de auditorías →

Puntuación de calidad

Arquitectura

100

Mantenibilidad

Contenido

Comunidad

100

Seguridad

Cumplimiento de la especificación

Lo que puedes crear

Visualizar conjuntos de datos complejos

Reducir expresión génica, embeddings de texto o características de imágenes a 2D para análisis exploratorio y presentación.

Preprocesar para agrupamiento

Aplicar UMAP antes de HDBSCAN para superar la maldición de la dimensionalidad y mejorar la separación de clusters.

Analizar conjuntos de datos etiquetados

Usar UMAP supervisado con información de etiquetas para separar clases conocidas mientras se preserva la estructura interna.

Prueba estos prompts

Visualización básica

Usa UMAP para reducir mis datos a 2 dimensiones para visualización. Muéstrame cómo configurar los parámetros n_neighbors y min_dist.

Flujo de trabajo de agrupamiento

Ayúdame a usar UMAP como preprocesamiento para agrupamiento con HDBSCAN. ¿Qué parámetros debo usar para obtener los mejores resultados de agrupamiento?

Análisis supervisado

Tengo datos etiquetados. Muéstrame cómo usar UMAP supervisado para separar clases mientras se preserva la estructura.

Paramétrico avanzado

Explica UMAP paramétrico con TensorFlow/Keras. ¿Cuándo debería usarlo en lugar de UMAP estándar y cómo defino arquitecturas personalizadas?

Mejores prácticas

Siempre estandarizar características con StandardScaler antes de aplicar UMAP para ponderación igual de dimensiones
Usar n_neighbors=30 y n_components=5-10 para preprocesamiento de agrupamiento (no visualización 2D)
Establecer random_state para resultados reproducibles en pipelines de producción

Evitar

Aplicar UMAP a datos sin escalar puede producir embeddings engañosos con características artificialmente ponderadas
Usar el n_neighbors=15 por defecto para agrupamiento crea clusters artificiales fragmentados
Esperar que transform() funcione bien cuando la distribución de datos de prueba difiere significativamente de los datos de entrenamiento

Preguntas frecuentes

¿Cuál es la diferencia entre UMAP y t-SNE?

UMAP es más rápido, escala mejor a dimensiones más altas y preserva más estructura global mientras mantiene los detalles del vecindario local.

¿Qué parámetros funcionan mejor para agrupamiento?

Usar n_neighbors=30, min_dist=0.0 y n_components=5-10 en lugar de los valores por defecto para visualización.

¿Puede UMAP integrarse con pipelines de scikit-learn?

Sí, UMAP sigue las convenciones de scikit-learn y funciona perfectamente en Pipeline con StandardScaler y clasificadores.

¿Están seguros mis datos al usar UMAP?

Sí, UMAP se ejecuta localmente y no envía datos a servicios externos. Todo el procesamiento ocurre en tu máquina.

¿Por qué mis clusters están desconectados?

Aumentar n_neighbors para enfatizar la estructura global. n_neighbors bajo crea vecindarios locales fragmentados.

¿Cuándo debería usar UMAP Paramétrico?

Usar UMAP Paramétrico cuando necesites transformación eficiente de datos nuevos después del entrenamiento o quieras capacidades de reconstrucción.

Detalles del desarrollador

Autor

davila7

Licencia

MIT

Repositorio

https://github.com/davila7/claude-code-templates/tree/main/cli-tool/components/skills/scientific/umap-learn

Ref.

main

Estructura de archivos

📁 references/

📄 api_reference.md

📄 SKILL.md