🧬

lamindb

Name: lamindb
Author: K-Dense-AI

Sûr ⚙️ Commandes externes📁 Accès au système de fichiers🌐 Accès réseau🔑 Variables d’environnement

Gérer les données biologiques avec LaminDB

Également disponible depuis: davila7

La recherche biologique génère des ensembles de données complexes difficiles à suivre, interroger et reproduire. LaminDB fournit un cadre unifié pour gérer les données biologiques avec une traçabilité automatique de la lignée, des annotations basées sur des ontologies et une intégration transparente avec les gestionnaires de workflows.

Prend en charge: Claude Codex Code(CC)

📊 71 Adéquat

Télécharger le ZIP du skill

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

Activez et commencez à utiliser

Tester

Utilisation de "lamindb". Comment suivre mon analyse de notebook avec LaminDB?

Résultat attendu:

Utilisez ln.track() au début de votre notebook pour commencer la capture de lignée
Importez vos données et effectuez l'analyse normalement
Appelez ln.finish() pour terminer le suivi une fois terminé
Affichez la lignée avec artifact.view_lineage() pour voir la provenance des données

Utilisation de "lamindb". Pouvez-vous m'aider à valider mes métadonnées expérimentales?

Résultat attendu:

Définissez un schéma avec les colonnes et types de données requis
Créez un DataFrameCurator ou AnnDataCurator avec votre schéma
Utilisez curator.validate() pour vérifier l'intégrité des données
Utilisez .cat.standardize() pour corriger les fautes de frappe et mapper les synonymes

Utilisation de "lamindb". Comment connecter LaminDB à mon stockage cloud?

Résultat attendu:

Installez les extras: pip install 'lamindb[aws]' ou 'lamindb[gcp]'
Configurez le stockage: lamin init --storage s3://votre-bucket
Définissez les identifiants via des variables d'environnement ou des fichiers de configuration
LaminDB gère automatiquement la mise en cache et la synchronisation

Audit de sécurité

Sûr

v4 • 1/17/2026

This is a pure documentation skill containing only markdown files with code examples for LaminDB biological data management. All 607 static findings are false positives. The analyzer incorrectly flagged markdown code formatting (backticks, code blocks), documentation about cloud storage configuration (AWS, GCP credentials), and library usage patterns (ln.Artifact) as security issues. No executable code, scripts, credential harvesting, or malicious patterns exist.

Fichiers analysés

6,559

Lignes analysées

résultats

Total des audits

Facteurs de risque

⚙️ Commandes externes (3)

references/annotation-validation.md:21-32 SKILL.md:49-61 references/setup-deployment.md:9-21

📁 Accès au système de fichiers (2)

references/core-concepts.md:12-24 SKILL.md:195-226

🌐 Accès réseau (2)

references/integrations.md:46-72 SKILL.md:383-387

🔑 Variables d’environnement (2)

references/integrations.md:49-50 references/setup-deployment.md:205-206

Audité par: claude Voir l’historique des audits →

Score de qualité

Architecture

100

Maintenabilité

Contenu

Communauté

100

Sécurité

Conformité aux spécifications

Ce que vous pouvez construire

Annoter des données scRNA-seq

Valider et standardiser les annotations de types cellulaires à l'aide de vocabulaires contrôlés de Cell Ontology

Construire des data lakehouses

Créer des interfaces de requête unifiées sur plusieurs ensembles de données biologiques avec versionnement automatique

Suivre la lignée des modèles

Lier les artefacts de données d'entraînement aux expériences MLflow ou W&B pour une reproductibilité complète

Essayez ces prompts

Commencer

Aidez-moi à configurer LaminDB localement. Je veux l'installer, m'authentifier et initialiser une instance locale pour gérer mes ensembles de données monocellulaires.

Annoter des données

J'ai des données scRNA-seq avec des étiquettes de types cellulaires. Montrez-moi comment valider et standardiser ces étiquettes à l'aide de Cell Ontology via Bionty.

Suivre la lignée

J'exécute des pipelines Nextflow pour l'analyse RNA-seq en bulk. Montrez-moi comment intégrer LaminDB pour suivre quel code a produit quels fichiers de sortie.

Interroger des données

J'ai des centaines de fichiers Parquet organisés par expérience et lot. Montrez-moi comment interroger tous les artefacts du projet X avec tissu=PBMC et condition=traité sans charger tous les fichiers.

Bonnes pratiques

Commencez chaque notebook d'analyse avec ln.track() et terminez avec ln.finish() pour une capture automatique de lignée
Définissez des schémas et validez les données tôt pour détecter les problèmes avant une analyse approfondie
Utilisez des clés d'artefacts hiérarchiques comme 'projet/experience/lot/fichier.h5ad' pour l'organisation

Éviter

Créer de nouvelles clés d'artefacts pour les versions modifiées au lieu d'utiliser le versionnement intégré
Charger de grands ensembles de données sans filtrer d'abord - interrogez d'abord les métadonnées pour réduire les E/S
Sauter la standardisation des ontologies qui conduit à des requêtes incohérentes entre des termes similaires

Foire aux questions

Quels formats de données LaminDB supporte-t-il?

LaminDB supporte les DataFrames (Parquet, CSV), AnnData (monocellulaire), MuData (multi-modale), SpatialData et les tableaux TileDB-SOMA.

Ai-je besoin d'un serveur pour utiliser LaminDB?

Non. LaminDB fonctionne localement avec SQLite pour le développement. Passez au stockage cloud avec PostgreSQL pour les équipes de production.

Comment LaminDB s'intègre-t-il avec Nextflow?

Utilisez ln.track() dans les scripts de processus pour enregistrer les entrées et les sorties. LaminDB capture automatiquement la provenance pour chaque étape.

Quelles sont les ontologies biologiques disponibles?

Gènes (Ensembl), Protéines (UniProt), Types cellulaires (CL), Tissus (Uberon), Maladies (Mondo), Phénotypes (HPO) et Voies (GO).

Puis-je utiliser LaminDB sans Internet?

Oui pour les opérations locales. Les téléchargements initiaux d'ontologies et l'accès au stockage cloud nécessitent Internet. Mettez en cache les ontologies localement pour une utilisation hors ligne.

En quoi LaminDB est-il différent d'une base de données?

LaminDB combine les fonctionnalités de base de données (requêtage, filtrage) avec le stockage de fichiers versionnés et la traçabilité de lignée spécialisés pour les workflows de données scientifiques.