scanpy
تحليل بيانات RNA-seq أحادية الخلية باستخدام scanpy
متاح أيضًا من: K-Dense-AI
يتطلب تحليل RNA-seq أحادي الخلية سير عمل معقد للتحكم في الجودة والتجميع والتصور. توفر هذه المهارة سير عمل scanpy كاملاً بما في ذلك إنشاء UMAP وتجميع Leiden وتحديد جينات markers وتطبيق تسميات أنواع الخلايا.
تنزيل ZIP المهارة
رفع في Claude
اذهب إلى Settings → Capabilities → Skills → Upload skill
فعّل وابدأ الاستخدام
اختبرها
استخدام "scanpy". Load my single-cell data and run a complete analysis pipeline
النتيجة المتوقعة:
- Loaded dataset: 3,500 cells × 20,000 genes
- After QC filtering: 3,200 cells × 15,000 genes retained (91% cells, 75% genes)
- Identified 8 clusters using Leiden clustering (resolution 0.5)
- Top markers for Cluster 0: CD3D, CD3E, CD3G (T cell markers)
- Top markers for Cluster 1: MS4A1, CD79A, CD79B (B cell markers)
- UMAP visualization saved to figures/umap_leiden.pdf
- Cell type annotations: CD4+ T cells, B cells, CD14+ Monocytes, NK cells, Dendritic cells
استخدام "scanpy". Perform quality control on my 10X dataset
النتيجة المتوقعة:
- Loaded 10X dataset: 4,200 cells × 18,000 genes
- QC summary: Mean genes per cell: 1,500, Mean mitochondrial %: 8.2
- Filtered 180 low-quality cells (genes < 200)
- Filtered 500 lowly expressed genes (cells < 3)
- Final dataset: 4,020 cells × 17,500 genes
- QC violin plots saved to figures/qc_after_violin.pdf
التدقيق الأمني
آمنAll 226 static findings are FALSE POSITIVES. The 'Ruby/shell backtick execution' alerts incorrectly flag markdown code formatting. 'Weak cryptographic algorithm' alerts match 'hash' in data structure context, not crypto. 'Python os file operations' are legitimate file I/O for output directories. 'Hardcoded URL' alerts point to official documentation. This is a pure bioinformatics data analysis toolkit with no malicious capabilities.
عوامل الخطر
📁 الوصول إلى نظام الملفات (2)
⚙️ الأوامر الخارجية (208)
🌐 الوصول إلى الشبكة (4)
درجة الجودة
ماذا يمكنك بناءه
سير عمل تحليل أحادي الخلية
معالجة بيانات أحادية الخلية الخام من خلال خط أنابيب كامل من QC إلى تطبيق تسميات أنواع الخلايا
استكشاف التصور
توليد تضمينات UMAP وتصور التجموعات لمجموعات البيانات البيولوجية
اكتشاف جينات markers
تحديد والتحقق من صحة جينات markers لأنواع الخلايا باستخدام طرق الترتيب الإحصائي
جرّب هذه الموجهات
Load my single-cell RNA-seq data from {file_path.h5ad} using scanpy and show me the basic dataset summary including number of cells and genesPerform quality control on my dataset: filter cells with fewer than {200} genes, remove cells with more than {5}% mitochondrial genes, and generate QC violin plotsRun Leiden clustering on my data with resolution {0.5}, generate UMAP visualization, and identify the top 10 marker genes for each cluster using Wilcoxon testHelp me annotate cell types in my clustered dataset. I have marker genes for T cells (CD3D, CD3E), B cells (MS4A1, CD79A), and monocytes (CD14, LYZ). Show gene expression on UMAP and assign cell type labels to each cluster
أفضل الممارسات
- احفظ القيم الخام قبل التصفية باستخدام adata.raw = adata للحفاظ على البيانات الأصلية
- تحقق من صحة تسميات أنواع الخلايا باستخدام multiple known markers قبل التحديد النهائي
- أنشئ رسوم QC قبل وبعد التصفية لتقييم تأثير جودة البيانات
تجنب
- تجاوز خطوات التحكم في الجودة يمكن أن يؤدي إلى مجموعات وهمية من الخلايا ذات الجودة المنخفضة
- استخدام دقة تجميع واحدة قد يؤدي إلى تفويت بنية مجموعات الخلايا المهمة
- الاعتماد فقط على التطبيق الآلي للتسميات دون التحقق اليدوي من جينات markers