توفر AnnData هيكل بيانات موحد للمصفوفات المُلحقة المستخدمة في الجينوميات أحادية الخلية. تتيح هذه المهارة إنشاء وقراءة وكتابة ومعالجة ملفات .h5ad مع دعم كامل للبيانات الوصفية والتضمينات ونظام scverse البيئي.
تنزيل ZIP المهارة
رفع في Claude
اذهب إلى Settings → Capabilities → Skills → Upload skill
فعّل وابدأ الاستخدام
اختبرها
استخدام "anndata". كيف أقرأ ملف 10X Genomics H5 وأحويله إلى AnnData؟
النتيجة المتوقعة:
- استخدم ad.read_10x_h5() لقراءة تنسيق H5 مباشرة
- تتولى الدالة استخراج الجين والباركود تلقائياً
- معلمة genome اختيارية لتحديد المرجع المحدد عند وجود مراجع متعددة
استخدام "anndata". ما هو الوضع المدعوم ومتى يجب استخدامه؟
النتيجة المتوقعة:
- الوضع المدعوم يحتفظ بالبيانات على القرص ويحمل فقط الأجزاء المستخدمة
- استخدمه لمجموعات البيانات أكبر من ذاكرة الوصول العشوائي المتاحة لتجنب أخطاء نفاد الذاكرة
- الوصول إلى البيانات الوصفية وإنشاء مجموعات فرعية دون تحميل الملف بأكمله في الذاكرة
التدقيق الأمني
آمنAll 397 static findings are FALSE POSITIVES. This skill contains only markdown documentation with Python code examples. The static scanner incorrectly flags backticks in fenced code blocks, URLs in documentation links, and generic programming terms. No executable code, network operations, or credential handling exists. This is a legitimate scientific computing documentation skill for the AnnData Python library.
عوامل الخطر
⚙️ الأوامر الخارجية (2)
🌐 الوصول إلى الشبكة (2)
درجة الجودة
ماذا يمكنك بناءه
تحليل RNA-seq أحادي الخلية
تحميل ومعالجة بيانات 10X Genomics لأبحاث نسخ أحادية الخلية مع تتبع البيانات الوصفية المناسبة.
تكامل البيانات متعددة الدفعات
دمج عدة دفعات تجريبية مع تتبع تلقائي لتصنيفات الدفعات وحل النزاعات.
التكامل مع التعلم العميق
تصدير البيانات إلى PyTorch DataLoaders لتدريب الشبكات العصبية على بيانات التعبير أحادي الخلية.
جرّب هذه الموجهات
إنشاء كائن AnnData من مصفوفة numpy مع بيانات وصفية للملاحظات لأنواع الخلايا ومعرفات العينات.
قراءة ملف H5AD في الوضع المدعوم وتصفية الخلايا عالية الجودة بناءً على عمود quality_score.
ربط ثلاثة كائنات AnnData على طول محور الملاحظات مع تصنيفات الدفعات وربط داخلي.
إظهار كيفية تحويل الأعمدة النصية إلى فئات واستخدام المصفوفات المتفرقة لكفاءة الذاكرة.
أفضل الممارسات
- استخدم الوضع المدعوم (backed='r') لمجموعات البيانات أكبر من ذاكرة الوصول العشوائي المتاحة لتجنب أخطاء نفاد الذاكرة.
- حوّل الأعمدة النصية إلى فئات باستخدام strings_to_categoricals() لتقليل الذاكرة بمقدار 10-50 ضعف.
- احتفظ بالبيانات الخام باستخدام adata.raw = adata.copy() قبل التصفية للاحتفاظ بالوصول إلى الجينات غير المفلترة.
تجنب
- تجنب تعديل العروض مباشرة دون نسخها أولاً، لأن التغييرات قد تؤثر على الكائن الأصلي.
- لا تحمّل مجموعات البيانات الكبيرة بأكملها في الذاكرة عندما يمكن للوضع المدعوم توفير وصول كسول.
- تجنب عدم محاذاة الفهرس عند إضافة البيانات الوصفية الخارجية باستخدام set_index() وloc[].join().