Habilidades lamindb
🧬

lamindb

Seguro ⚙️ Comandos externos📁 Acceso al sistema de archivos🌐 Acceso a red🔑 Variables de entorno

Gestionar datos biológicos con LaminDB

También disponible en: davila7

La investigación biológica genera conjuntos de datos complejos que son difíciles de rastrear, consultar y reproducir. LaminDB proporciona un marco unificado para gestionar datos biológicos con seguimiento automático del linaje, anotaciones basadas en ontologías e integración perfecta con gestores de flujos de trabajo.

Soporta: Claude Codex Code(CC)
📊 71 Adecuado
1

Descargar el ZIP de la skill

2

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

3

Activa y empieza a usar

Pruébalo

Usando "lamindb". How do I track my notebook analysis with LaminDB?

Resultado esperado:

  • Use ln.track() at the start of your notebook to begin lineage capture
  • Import your data and perform analysis as normal
  • Call ln.finish() to complete tracking when done
  • View lineage with artifact.view_lineage() to see data provenance

Usando "lamindb". Can you help me validate my experimental metadata?

Resultado esperado:

  • Define a schema with required columns and data types
  • Create a DataFrameCurator or AnnDataCurator with your schema
  • Use curator.validate() to check data integrity
  • Use .cat.standardize() to fix typos and map synonyms

Usando "lamindb". How do I connect LaminDB to my cloud storage?

Resultado esperado:

  • Install extras: pip install 'lamindb[aws]' or 'lamindb[gcp]'
  • Configure storage: lamin init --storage s3://your-bucket
  • Set credentials via environment variables or config files
  • LaminDB handles caching and sync automatically

Auditoría de seguridad

Seguro
v4 • 1/17/2026

This is a pure documentation skill containing only markdown files with code examples for LaminDB biological data management. All 607 static findings are false positives. The analyzer incorrectly flagged markdown code formatting (backticks, code blocks), documentation about cloud storage configuration (AWS, GCP credentials), and library usage patterns (ln.Artifact) as security issues. No executable code, scripts, credential harvesting, or malicious patterns exist.

9
Archivos escaneados
6,559
Líneas analizadas
4
hallazgos
4
Auditorías totales

Puntuación de calidad

45
Arquitectura
100
Mantenibilidad
87
Contenido
21
Comunidad
100
Seguridad
91
Cumplimiento de la especificación

Lo que puedes crear

Anotar datos scRNA-seq

Validar y estandarizar anotaciones de tipos celulares usando vocabularios controlados de Cell Ontology

Construir data lakehouses

Crear interfaces de consulta unificadas entre múltiples conjuntos de datos biológicos con versionado automático

Rastrear linaje de modelos

Vincular artefactos de datos de entrenamiento a experimentos de MLflow o W&B para reproducibilidad completa

Prueba estos prompts

Comenzar
Ayúdame a configurar LaminDB localmente. Quiero instalarlo, autenticarme e inicializar una instancia local para gestionar mis conjuntos de datos de célular única.
Anotar datos
Tengo datos scRNA-seq con etiquetas de tipo celular. Muéstrame cómo validar y estandarizar estas etiquetas usando Cell Ontology vía Bionty.
Rastrear linaje
Ejecuto flujos Nextflow para análisis de RNA-seq masivo. Muéstrame cómo integrar LaminDB para rastrear qué código produjo qué archivos de salida.
Consultar datos
Tengo cientos de archivos Parquet organizados por experimento y lote. Muéstrame cómo consultar todos los artefactos del proyecto X con tejido=PBMC y condición=tratado sin cargar todos los archivos.

Mejores prácticas

  • Comienza cada cuaderno de análisis con ln.track() y termina con ln.finish() para captura automática del linaje
  • Define esquemas y valida los datos temprano para detectar problemas antes del análisis extenso
  • Usa claves de artefactos jerárquicos como 'proyecto/experimento/lote/archivo.h5ad' para organización

Evitar

  • Crear nuevas claves de artefactos para versiones modificadas en lugar de usar el versionado integrado
  • Cargar conjuntos de datos grandes sin filtrar primero - consulta metadatos primero para reducir E/S
  • Omitir la estandarización de ontologías que conduce a consultas inconsistentes entre términos similares

Preguntas frecuentes

¿Qué formatos de datos soporta LaminDB?
LaminDB soporta DataFrames (Parquet, CSV), AnnData (célular única), MuData (multimodal), SpatialData y arrays TileDB-SOMA.
¿Necesito un servidor para usar LaminDB?
No. LaminDB funciona localmente con SQLite para desarrollo. Escala a almacenamiento en la nube con PostgreSQL para equipos de producción.
¿Cómo integra LaminDB con Nextflow?
Usa ln.track() en scripts de proceso para registrar entradas y salidas. LaminDB captura automáticamente la procedencia de cada paso.
¿Qué ontologías biológicas están disponibles?
Genes (Ensembl), Proteínas (UniProt), Tipos celulares (CL), Tejidos (Uberon), Enfermedades (Mondo), Fenotipos (HPO) y Vías (GO).
¿Puedo usar LaminDB sin internet?
Sí para operaciones locales. Las descargas iniciales de ontologías y el acceso a almacenamiento en la nube requieren internet. Guarda ontologías en caché localmente para uso sin conexión.
¿Cómo es diferente LaminDB de una base de datos?
LaminDB combina características de base de datos (consulta, filtrado) con almacenamiento de archivos versionados y seguimiento de linaje especializado para flujos de trabajo de datos científicos.