🔬

scanpy

Sûr 📁 Accès au système de fichiers🌐 Accès réseau⚙️ Commandes externes

Analyser les données RNA-seq monocellulaire

Également disponible depuis: davila7

Le séquençage RNA monocellulaire génère des ensembles de données complexes nécessitant une analyse spécialisée. Cette compétence fournit un flux de travail complet pour le contrôle qualité, la réduction de dimensionnalité, le clustering et la visualisation de l'expression génique monocellulaire.

Prend en charge: Claude Codex Code(CC)
🥈 79 Argent
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "scanpy". Load my single-cell data and perform quality control

Résultat attendu:

  • Loaded 3,245 cells x 20,000 genes
  • QC metrics: mean 1,542 genes per cell, 4.2% mitochondrial reads
  • After filtering: 2,987 cells x 15,432 genes (92% cells retained)
  • Saved QC violin plots to figures/qc_violin.pdf

Utilisation de "scanpy". Run complete clustering and annotation workflow

Résultat attendu:

  • Identified 12 cell clusters using Leiden algorithm
  • Generated UMAP visualization colored by cluster
  • Top marker genes identified for each cluster
  • Cell types annotated based on known marker expression

Audit de sécurité

Sûr
v4 • 1/17/2026

All 228 static findings are false positives. This is a legitimate scientific computing skill for single-cell RNA-seq analysis. The scanner incorrectly flagged: markdown inline code formatting (backticks), file I/O functions for data reading, directory creation operations, and git tree hashes as C2 indicators. No malicious patterns, network exfiltration, or command injection risks exist after human evaluation.

7
Fichiers analysés
3,003
Lignes analysées
3
résultats
4
Total des audits

Score de qualité

82
Architecture
90
Maintenabilité
85
Contenu
21
Communauté
100
Sécurité
91
Conformité aux spécifications

Ce que vous pouvez construire

Analyse exploratoire scRNA-seq

Analyser les ensembles de données d'expression génique monocellulaire pour identifier les types, états et populations cellulaires.

Découverte de gènes marqueurs

Identifier les gènes différentiellement exprimés entre les clusters et caractériser les populations cellulaires.

Pipelines de visualisation

Générer des plots UMAP, t-SNE et autres réductions de dimensionnalité pour les publications.

Essayez ces prompts

Charger et inspecter les données
Load my single-cell data from data.h5ad and show me the basic structure including cell and gene counts.
QC et filtrage
Run quality control on my dataset, filter cells with less than 200 genes or more than 5% mitochondrial reads, and generate QC plots.
Clustering et annotation
Perform clustering at resolution 0.5, generate UMAP visualization, and identify marker genes for each cluster.
Analyse complète
Run a complete scanpy workflow: QC, normalization, highly variable genes, PCA, neighbors, UMAP, Leiden clustering at resolution 0.8, and save results.

Bonnes pratiques

  • Toujours enregistrer les comptages bruts avant le filtrage : adata.raw = adata
  • Valider le clustering en vérifiant l'expression des gènes marqueurs connus
  • Enregistrer les résultats intermédiaires pour éviter de rerun de longs flux de travail

Éviter

  • Sauter les étapes de contrôle qualité avant l'analyse en aval
  • Utiliser la résolution de clustering par défaut sans tester plusieurs valeurs
  • Ne pas visualiser les données avant et après les étapes de filtrage

Foire aux questions

Quels formats de fichiers scanpy supporte-t-il ?
Scanpy supporte les formats h5ad, 10X Genomics MTX, HDF5, CSV, loom et fichiers texte.
Combien de voisins dois-je utiliser pour UMAP ?
La valeur par défaut est 10-30 voisins. Les valeurs plus faibles préservent la structure locale ; les valeurs plus élevées capturent les modèles globaux.
Clustering Leiden vs Louvain ?
Leiden est recommandé car il produit des clusters de meilleure qualité et est plus efficace que Louvain.
Combien de PCs dois-je utiliser ?
Vérifiez le plot du ratio de variance PCA. Utilisez les PCs avant le coude, typiquement 30-50 pour les ensembles de données à haute variabilité.
Quel est le seuil mitochondrial ?
Le seuil typique est 5-20%. Les seuils plus bas retirent plus de cellules ; validez avec les marqueurs de types cellulaires connus.
Comment annoter les types cellulaires ?
Utilisez les gènes marqueurs connus pour les types cellulaires. Visualisez l'expression sur UMAP et comparez les gènes marqueurs des clusters aux bases de données de référence.

Détails du développeur