يحول Geniml ملفات BED إلى تضمينات التعلم الآلي لتحليل المناطق الجينومية. تدرب النماذج للعثور على أنماط في قابلية الوصول للكروماتين، وبناء مجموعات ذروة مت consensus، وتحليل بيانات scATAC-seq للخلايا المفردة.
تنزيل ZIP المهارة
رفع في Claude
اذهب إلى Settings → Capabilities → Skills → Upload skill
فعّل وابدأ الاستخدام
اختبرها
استخدام "geniml". تدريب region2vec على ذروات ATAC-seq الخاصة بي وتقييم التضمينات
النتيجة المتوقعة:
- تم ترميز 15,234 ذروة باستخدام ملف universe
- تم تدريب تضمينات بأبعاد 100 لـ 8,567 منطقة فريدة
- درجة Silhouette: 0.72 (جودة تجميع جيدة)
- مؤشر Davies-Bouldin: 0.85 (تشابه منخفض بين المجموعات)
- تم إنشاء UMAP ثنائي الأبعاد للتصور
استخدام "geniml". بناء universe ذروة مت consensus من 10 تجارب ATAC-seq
النتيجة المتوقعة:
- تم دمج 245,000 ذروة من جميع التجارب
- تم تطبيق طريقة حد التغطية مع عتبة 5x
- تم إنشاء universe مت consensus مع 32,450 منطقة
- تغطية ذروات المدخلات: 87.3%
- متوسط حجم المنطقة: 425bp (مناسب لـ ATAC-seq)
استخدام "geniml". تحليل بيانات scATAC-seq للخلايا المفردة لتوصيف نوع الخلية
النتيجة المتوقعة:
- تم ترميز مسبق 8,500 خلية من مجموعة بيانات PBMC
- تم تدريب نموذج scEmbed بأبعاد 100
- تم إنشاء تضمينات خلايا لجميع الخلايا
- تجميع Leiden حدد 12 مجموعة خلوية متميزة
- تم توصيف الأنواع الرئيسية: خلايا T، خلايا B، الوحيدات، خلايا NK
التدقيق الأمني
آمنStatic analysis flagged 194 patterns, but ALL are false positives. The 'external_commands' findings are markdown bash code blocks in documentation (not actual shell execution). 'Weak cryptographic' refers to MD5 checksums for file verification (legitimate bioinformatics practice). 'Ransomware keywords' is a false positive triggered by security audit text itself. 'Hidden file access' refers to standard cache directories. All patterns represent legitimate genomic ML workflows.
عوامل الخطر
درجة الجودة
ماذا يمكنك بناءه
مقارنة تجارب ChIP-seq
تدريب تضمينات المناطق للعثور على ذروات متشابهة عبر تجارب ارتباط عامل النسخ المختلفة
تجميع الخلايا بواسطة الكروماتين
استخدام scEmbed لتحليل بيانات scATAC-seq وتحديد أنواع الخلايا بناءً على أنماط قابلية الوصول للكروماتين
بناء مجموعات ذروة مرجعية
إنشاء أكوان مت consensus من تجارب ATAC-seq متعددة للتحليلات المعيارية
جرّب هذه الموجهات
ساعدني في تدريب تضمينات region2vec على ملفات BED الخاصة بي. أولاً، قم بترميزها باستخدام ملف universe، ثم قم بتدريب نموذج تضمين بأبعاد 100.
استخدم scEmbed لتحليل بيانات scATAC-seq الخاصة بي في scanpy. قم بترميز الخلايا، وتدريب نموذج التضمين، وإنشاء تصور UMAP.
بناء universe مت consensus من مجموعة ملفات BED الخاصة بي باستخدام طريقة حد التغطية مع عتبة 5x.
تدريب تضمينات BEDspace على المناطق مع تسميات نوع الخلية لتمكين الاستعلامات عبر الأنماط بين المناطق والبيانات الوصفية.
أفضل الممارسات
- قم دائماً ببناء أكوان عالية الجودة مع تغطية ذروة جيدة قبل تدريب التضمينات
- تحقق من تغطية الترميز (أكثر من 80 في المئة) واضبط عتبات قيمة p إذا لزم الأمر
- استخدم مقاييس تقييم متعددة لتقييم جودة التضمينات والصلة البيولوجية
تجنب
- التدريب على مجموعات ذروة ذات جودة منخفضة أو غير محاذاة دون بناء universe مناسب
- استخدام المعاملات الافتراضية دون ضبطها لنوع بياناتك ومقياسها المحدد
- تخطي خطوات التقييم - تحقق دائماً من التضمينات قبل التحليل التنازلي