🧬

arboreto

آمن ⚙️ الأوامر الخارجية🌐 الوصول إلى الشبكة

استنتاج شبكات التنظيم الجيني من بيانات التعبير الجيني

متاح أيضًا من: davila7

يحدد استنتاج شبكة التنظيم الجيني علاقات عامل النسخ-الجين المستهدف من بيانات Transcriptomics. يوفر Arboreto تطبيقات قابلة للتوسع لخوارزميات GRNBoost2 و GENIE3 التي تعالج بيانات RNA-seq السائبة والخلايا المفردة على الآلات المحلية أو المجموعات الموزعة.

يدعم: Claude Codex Code(CC)
🥈 78 فضي
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "arboreto". استنتاج شبكة تنظيم جيني من expression_data.tsv باستخدام arboreto

النتيجة المتوقعة:

  • تحتوي الشبكة على 1500 رابط تنظيمي
  • أعلى المنظمات: TF1 (45 هدف)، TF2 (38 هدف)، TF3 (32 هدف)
  • أعلى أهمية: TF1 -> gene5 (0.92 درجة أهمية)

استخدام "arboreto". تشغيل GRNBoost2 مع تصفية عامل النسخ على بيانات الخلايا المفردة

النتيجة المتوقعة:

  • معالجة 8000 خلية × 20000 جين
  • تمت التصفية إلى 250 عامل نسخ معروف
  • تم استنتاج الشبكة في 4.2 دقيقة على المجموعة المحلية
  • أعلى منظم لنوع الخلية: MYC (87 هدف، متوسط أهمية 0.78)

التدقيق الأمني

آمن
v4 • 1/17/2026

All 118 static findings are FALSE POSITIVES. The analyzer misidentified markdown Python code blocks (using triple backticks) as shell command execution, genetic algorithm names (GENIE3, GRNBoost2) as weak cryptographic algorithms, and Dask cluster configuration examples as C2/network reconnaissance. Arboreto is a legitimate open-source bioinformatics library for gene regulatory network inference from transcriptomics data. The only Python script (scripts/basic_grn_inference.py:1-97) is benign code that imports standard libraries and performs standard bioinformatics computations.

6
الملفات التي تم فحصها
1,589
الأسطر التي تم تحليلها
2
النتائج
4
إجمالي عمليات التدقيق

عوامل الخطر

تم تدقيقه بواسطة: claude عرض سجل التدقيق →

درجة الجودة

68
الهندسة المعمارية
100
قابلية الصيانة
87
المحتوى
30
المجتمع
100
الأمان
91
الامتثال للمواصفات

ماذا يمكنك بناءه

تحليل شبكة التنظيم الجيني للخلايا المفردة

استنتاج شبكات التنظيم الخاصة بنوع الخلية من بيانات scRNA-seq لفهم عدم تجانس الخلايا.

استنتاج شبكة RNA-seq السائبة

تحديد أهداف عامل النسخ في مجموعات بيانات التعبير السائبي مع تصفية عامل النسخ للتحليل المركزة.

شبكة التنظيم الجيني واسعة النطاق الموزعة

معالجة مجموعات البيانات مع thousands of samples باستخدام مجموعات Dask لبيئات الحوسبة عالية الأداء.

جرّب هذه الموجهات

استنتاج شبكة التنظيم الجيني الأساسي
Use arboreto to infer a gene regulatory network from my expression matrix in expression_data.tsv. Save results to network.tsv.
مع تصفية عامل النسخ
Run grnboost2 on expression_data.tsv using only the transcription factors listed in tfs.txt. Set seed to 42 for reproducibility.
حوسبة المجموعة
Connect to my Dask cluster at tcp://scheduler:8786 and run grnboost2 on my large dataset with verbose output enabled.
ظروف متعددة
Infer separate GRN networks for control, treatment_24h, and treatment_48h expression datasets using grnboost2. Save each with the corresponding condition name.

أفضل الممارسات

  • استخدم دائمًا حراسة 'if __name__ == __main__:' في البرامج النصية لأن Dask يولد عمليات جديدة
  • عين بذرة عشوائية للنتائج القابلة للتكرار عند مقارنة الشبكات
  • قم بتصفية قائمة عامل النسخ إلى عوامل النسخ المعروفة لتقليل وقت الحساب

تجنب

  • تشغيل arboreto بدون تصفية عامل النسخ على مجموعات البيانات الكبيرة يتسبب في وقت حساب مفرط
  • نسيان حراسة 'if __name__ == __main__:' يتسبب في أخطاء توليد عملية Dask
  • استخدام GENIE3 على مجموعات البيانات مع thousands of observations بطيء؛ يفضل GRNBoost2 للبيانات الكبيرة

الأسئلة المتكررة

ما الفرق بين GRNBoost2 و GENIE3؟
يستخدم GRNBoost2 تعزيز التدرج وهو أسرع للبيانات الكبيرة. يستخدم GENIE3 الغابة العشوائية وهو أفضل للبيانات الصغيرة أو التحقق.
ما صيغة الإدخال التي يتوقعها arboreto؟
مصفوفة التعبير الجيني مع الجينات كعمود والملاحظات كصف. استخدم DataFrame من Pandas أو مصفوفة NumPy مع أسماء الجينات.
كيف تعمل الحوسبة الموزعة؟
يستخدم arboreto Dask للتوازي الانحدار الجيني. اتصل بـ LocalCluster أو جدولة بعيدة للحساب متعدد العقد.
ماذا يعني الإخراج؟
الإخراج هو مزدوجات عامل النسخ-الهدف-الأهمية حيث تشير درجات الأهمية الأعلى إلى علاقات تنظيمية متنبأ بها أقوى.
كيف أقوم بتصفية النتائج؟
تصفية حسب عتبة الأهمية (مثلاً > 0.5) أو اختيار أعلى N روابط لكل جين مستهدف. استخدم عمليات DataFrame من pandas.
هل يمكنني استخدام هذا مع pySCENIC؟
نعم، يوفر arboreto استنتاج GRN كخطوة أولى من مسار SCENIC لتحليل شبكة التنظيم الخلوي المفرد.

تفاصيل المطور

المؤلف

K-Dense-AI

الترخيص

BSD-3-Clause license

مرجع

main