🧬

lamindb

Name: lamindb
Author: K-Dense-AI

Seguro ⚙️ Comandos externos📁 Acceso al sistema de archivos🌐 Acceso a red🔑 Variables de entorno

Gestionar datos biológicos con LaminDB

También disponible en: davila7

La investigación biológica genera conjuntos de datos complejos que son difíciles de rastrear, consultar y reproducir. LaminDB proporciona un marco unificado para gestionar datos biológicos con seguimiento automático del linaje, anotaciones basadas en ontologías e integración perfecta con gestores de flujos de trabajo.

Soporta: Claude Codex Code(CC)

📊 71 Adecuado

Descargar el ZIP de la skill

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

Activa y empieza a usar

Pruébalo

Usando "lamindb". How do I track my notebook analysis with LaminDB?

Resultado esperado:

Use ln.track() at the start of your notebook to begin lineage capture
Import your data and perform analysis as normal
Call ln.finish() to complete tracking when done
View lineage with artifact.view_lineage() to see data provenance

Usando "lamindb". Can you help me validate my experimental metadata?

Resultado esperado:

Define a schema with required columns and data types
Create a DataFrameCurator or AnnDataCurator with your schema
Use curator.validate() to check data integrity
Use .cat.standardize() to fix typos and map synonyms

Usando "lamindb". How do I connect LaminDB to my cloud storage?

Resultado esperado:

Install extras: pip install 'lamindb[aws]' or 'lamindb[gcp]'
Configure storage: lamin init --storage s3://your-bucket
Set credentials via environment variables or config files
LaminDB handles caching and sync automatically

Auditoría de seguridad

Seguro

v4 • 1/17/2026

This is a pure documentation skill containing only markdown files with code examples for LaminDB biological data management. All 607 static findings are false positives. The analyzer incorrectly flagged markdown code formatting (backticks, code blocks), documentation about cloud storage configuration (AWS, GCP credentials), and library usage patterns (ln.Artifact) as security issues. No executable code, scripts, credential harvesting, or malicious patterns exist.

Archivos escaneados

6,559

Líneas analizadas

hallazgos

Auditorías totales

Factores de riesgo

⚙️ Comandos externos (3)

references/annotation-validation.md:21-32 SKILL.md:49-61 references/setup-deployment.md:9-21

📁 Acceso al sistema de archivos (2)

references/core-concepts.md:12-24 SKILL.md:195-226

🌐 Acceso a red (2)

references/integrations.md:46-72 SKILL.md:383-387

🔑 Variables de entorno (2)

references/integrations.md:49-50 references/setup-deployment.md:205-206

Auditado por: claude Ver historial de auditorías →

Puntuación de calidad

Arquitectura

100

Mantenibilidad

Contenido

Comunidad

100

Seguridad

Cumplimiento de la especificación

Lo que puedes crear

Anotar datos scRNA-seq

Validar y estandarizar anotaciones de tipos celulares usando vocabularios controlados de Cell Ontology

Construir data lakehouses

Crear interfaces de consulta unificadas entre múltiples conjuntos de datos biológicos con versionado automático

Rastrear linaje de modelos

Vincular artefactos de datos de entrenamiento a experimentos de MLflow o W&B para reproducibilidad completa

Prueba estos prompts

Comenzar

Ayúdame a configurar LaminDB localmente. Quiero instalarlo, autenticarme e inicializar una instancia local para gestionar mis conjuntos de datos de célular única.

Anotar datos

Tengo datos scRNA-seq con etiquetas de tipo celular. Muéstrame cómo validar y estandarizar estas etiquetas usando Cell Ontology vía Bionty.

Rastrear linaje

Ejecuto flujos Nextflow para análisis de RNA-seq masivo. Muéstrame cómo integrar LaminDB para rastrear qué código produjo qué archivos de salida.

Consultar datos

Tengo cientos de archivos Parquet organizados por experimento y lote. Muéstrame cómo consultar todos los artefactos del proyecto X con tejido=PBMC y condición=tratado sin cargar todos los archivos.

Mejores prácticas

Comienza cada cuaderno de análisis con ln.track() y termina con ln.finish() para captura automática del linaje
Define esquemas y valida los datos temprano para detectar problemas antes del análisis extenso
Usa claves de artefactos jerárquicos como 'proyecto/experimento/lote/archivo.h5ad' para organización

Evitar

Crear nuevas claves de artefactos para versiones modificadas en lugar de usar el versionado integrado
Cargar conjuntos de datos grandes sin filtrar primero - consulta metadatos primero para reducir E/S
Omitir la estandarización de ontologías que conduce a consultas inconsistentes entre términos similares

Preguntas frecuentes

¿Qué formatos de datos soporta LaminDB?

LaminDB soporta DataFrames (Parquet, CSV), AnnData (célular única), MuData (multimodal), SpatialData y arrays TileDB-SOMA.

¿Necesito un servidor para usar LaminDB?

No. LaminDB funciona localmente con SQLite para desarrollo. Escala a almacenamiento en la nube con PostgreSQL para equipos de producción.

¿Cómo integra LaminDB con Nextflow?

Usa ln.track() en scripts de proceso para registrar entradas y salidas. LaminDB captura automáticamente la procedencia de cada paso.

¿Qué ontologías biológicas están disponibles?

Genes (Ensembl), Proteínas (UniProt), Tipos celulares (CL), Tejidos (Uberon), Enfermedades (Mondo), Fenotipos (HPO) y Vías (GO).

¿Puedo usar LaminDB sin internet?

Sí para operaciones locales. Las descargas iniciales de ontologías y el acceso a almacenamiento en la nube requieren internet. Guarda ontologías en caché localmente para uso sin conexión.

¿Cómo es diferente LaminDB de una base de datos?

LaminDB combina características de base de datos (consulta, filtrado) con almacenamiento de archivos versionados y seguimiento de linaje especializado para flujos de trabajo de datos científicos.