deepchem
تطبيق التعلم الآلي في الكيمياء واكتشاف الأدوية
متاح أيضًا من: davila7
توقع الخصائص الجزيئية مثل الذوبانية والسمية والألفة الرابطة باستخدام DeepChem. درب شبكات عصبية بيانية أو استخدم نماذج مدربة مسبقاً مثل ChemBERTa لاكتشاف الأدوية وتطبيقات علوم المواد.
تنزيل ZIP المهارة
رفع في Claude
اذهب إلى Settings → Capabilities → Skills → Upload skill
فعّل وابدأ الاستخدام
اختبرها
استخدام "deepchem". توقع الذوبانية لهذه الجزيئات: 'CCO' و'CC(=O)O' و'c1ccccc1'
النتيجة المتوقعة:
- توقعات الذوبان (log mol/L):
- • إيثانول (CCO): -0.92
- • حمض الأسيتيك (CC(=O)O): -0.45
- • بنزين (c1ccccc1): -1.69
- ملاحظة: القيم المنخفضة تشير إلى ذوبان مائي أقل.
التدقيق الأمني
آمنThis is a legitimate scientific computing skill for DeepChem molecular machine learning. All 237 static findings are false positives. The findings originate from markdown documentation code examples being incorrectly flagged as executable Ruby/shell commands. Common English words in chemistry documentation are matching C2 security patterns. The Python scripts use argparse for safe argument handling with no hardcoded secrets or dangerous operations.
عوامل الخطر
⚡ يحتوي على سكربتات (3)
📁 الوصول إلى نظام الملفات (3)
🌐 الوصول إلى الشبكة (1)
درجة الجودة
ماذا يمكنك بناءه
فحص مكتبات المركبات
توقع الذوبانية والسمية لمكتبات المركبات الكبيرة لترتيب المرشحين للتخليق.
بناء نماذج الخصائص الجزيئية
درب نماذج مخصصة على مجموعات البيانات المملوكة باستخدام الشبكات العصبية البيانية أو خوارزميات التعلم الآلي التقليدية.
تطبيق التعلم الانتقالي
ضبط النماذج المدربة مسبقاً مثل ChemBERTa على مجموعات بيانات صغيرة مع أمثلة مصنفة محدودة.
جرّب هذه الموجهات
استخدم DeepChem لتحميل ملف CSV مع سلاسل SMILES في 'molecules.csv' وتوقع الذوبانية باستخدام CircularFingerprint وmodel مدرب.
درب شبكة التفافية بيانية (Graph Convolutional Network) على مجموعة بيانات Tox21 باستخدام DeepChem للتوقع عبر جميع المهام ال 12.
استخدم نموذج ChemBERTa المدرب مسبقاً من HuggingFace واضبطه على مجموعة البيانات المخصصة في 'activity.csv' للتوقعة الألفة الرابطة.
حمّل نموذج DeepChem مدرباً وقم بالتوقعات على قائمة من سلاسل SMILES الجديدة: 'CCO' و'CC(=O)O' و'c1ccccc1'. أعد درجات الثقة.
أفضل الممارسات
- استخدم ScaffoldSplitter بدلاً من التقسيم العشوائي للبيانات الجزيئية لمنع تسرب البيانات من الجزيئات المتشابهة
- طبّق التعلم الانتقالي مع النماذج المدربة مسبقاً عندما يكون حجم مجموعة البيانات أقل من 10,000 عينة
- زيادة التسرب (0.3-0.5) واستخدام نماذج أبسط لمجموعات البيانات الصغيرة لمنع الإفراط في التخصيص
تجنب
- استخدام تقسيمات تدريب/اختبار عشوائية على البيانات الجزيئية - يؤدي إلى تسرب البيانات من البنى المتشابهة
- تدريب شبكات GNN عميقة على مجموعات بيانات أصغر من 1,000 عينة - خطر الإفراط في التخصيص الشديد
- تجاهل عدم التوازن في الفئات في مجموعات بيانات السموم - تحقق دائماً من توزيع المهمة قبل التدريب
الأسئلة المتكررة
ما المعير الذي يجب أن أستخدمه؟
كيف أتعامل مع مجموعات البيانات الصغيرة؟
أي مقسم يجب أن أستخدمه؟
هل يمكنني استخدام مجموعتي الخاصة؟
ما النماذج المدربة مسبقاً المتاحة؟
كيف أحسّن أداء النموذج؟
تفاصيل المطور
المؤلف
K-Dense-AIالترخيص
MIT license
المستودع
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/deepchemمرجع
main
بنية الملفات