🧪

molfeat

آمن ⚙️ الأوامر الخارجية📁 الوصول إلى نظام الملفات🌐 الوصول إلى الشبكة

تحويل الجزيئات إلى سمات التعلم الآلي

متاح أيضًا من: davila7

يتطلب التعلم الآلي الجزيئي تحويل البنى الكيميائية إلى تمثيلات رقمية. يوفر Molfeat أكثر من 100 مُهيئ لتحويل سلاسل SMILES إلى سمات جاهزة للتعلم الآلي لنمذجة QSAR واكتشاف الأدوية.

يدعم: Claude Codex Code(CC)
📊 70 كافٍ
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "molfeat". تحويل الأسبرين (CC(=O)OC1=CC=CC=C1C(=O)O) إلى بصمة ECFP

النتيجة المتوقعة:

  • تم توليد بصمة ECFP بنصف قطر 3 و 2048 بت
  • بتات غير صفرية: 45 سمة منشطة
  • كثافة البتات: 2.2% (تمثيل متفرق)
  • الشكل: مصفوفة numpy (2048,)
  • جاهزة لنماذج التعلم الآلي

استخدام "molfeat". قارن بين ECFP و MACCS وأوصاف RDKit للكافيين

النتيجة المتوقعة:

  • ECFP4: متجه 2048 بت مع 52 سمة غير صفرية
  • MACCS: مفاتيح هيكلية 167 بت مع 28 بت صحيحة
  • RDKit2D: أكثر من 200 قيمة وصف بما في ذلك LogP=0.43 و TPSA=61.1
  • السمات المجمعة: متجه بأبعاد 2415

التدقيق الأمني

آمن
v4 • 1/17/2026

The molfeat skill is a legitimate cheminformatics library for molecular feature extraction. All 397 static findings are false positives triggered by scientific terminology in documentation. The scanner misinterpreted markdown code fences as shell commands, chemistry terminology (ecfp, maccs, gin, c2) as security threats, and documentation URLs as network indicators.

5
الملفات التي تم فحصها
2,234
الأسطر التي تم تحليلها
3
النتائج
4
إجمالي عمليات التدقيق

عوامل الخطر

⚙️ الأوامر الخارجية (1)
📁 الوصول إلى نظام الملفات (1)
🌐 الوصول إلى الشبكة (1)
تم تدقيقه بواسطة: claude عرض سجل التدقيق →

درجة الجودة

45
الهندسة المعمارية
100
قابلية الصيانة
87
المحتوى
21
المجتمع
100
الأمان
78
الامتثال للمواصفات

ماذا يمكنك بناءه

بناء نماذج QSAR لخصائص الأدوية

استخدم البصمات الجزيئية والأوصاف لتدريب نماذج التعلم الآلي التي تتنبأ بخصائص ADME أو السمية أو النشاط البيولوجي

الفحص الافتراضي لمكتبات المركبات

حوّل ملايين الجزيئات إلى سمات للبحث بالتشابه والتنبؤ بالنشاط ضد الأهداف البيولوجية

تحليل الفضاء الكيميائي والتجميع

توليد تضمينات جزيئية لتصور مكتبات كيميائية وتجميعها لتحليل التنوع

جرّب هذه الموجهات

توليد بصمات أساسية
استخدم molfeat لتحويل هذه السلاسل SMILES إلى بصمات ECFP: CCO, CC(=O)O, c1ccccc1. اعرض الكود وشكل الناتج.
معالجة الدفع للأوصاف
حمّل مجموعة بيانات من 100 جزيء واستخرج أوصاف RDKit 2D باستخدام molfeat مع المعالجة المتوازية.
تضمينات النموذج المدرب مسبقاً
استخدم ChemBERTa لتوليد تضمينات لجزيئات شبيهة بالأدوية وتصورها باستخدام PCA.
تحسين خط أنابيب QSAR
قارن بين سمات ECFP و MACCS و ChemBERTa للتنبؤ بالخصائص الجزيئية باستخدام انحدار الغابات العشوائية.

أفضل الممارسات

  • استخدم n_jobs=-1 للمعالجة المتوازية على الأنظمة متعددة النوى
  • احفظ تضمينات النموذج المدرب مسبقاً لتجنب إعادة الحساب
  • تعامل مع الجزيئات غير الصالحة باستخدام ignore_errors=True للمجموعات الكبيرة

تجنب

  • معالجة جزيء واحد في كل مرة في حلقات بدلاً من المعالجة الدفعية
  • استخدام نماذج التعلم العميق للبحث البسيط بالتشناه حيث تكفي البصمات
  • تجاهل معالجة الأخطاء عند معالجة مكتبات المركبات الكبيرة

الأسئلة المتكررة

ما الفرق بين الآلات الحاسبة والمحولات؟
تعمل الآلات الحاسبة على جزيئات واحدة بينما يتعامل المحولات مع الدفعات مع التوازي والتوافق مع scikit-learn.
أي مُهيئ يجب أن أستخدمه لنمذجة QSAR؟
ابدأ ببصمات ECFP (نصف قطر 2-3، 1024-2048 بت) لأنها تلتقط أنماط الاتصال الجزيئي ذات الصلة بالنشاط البيولوجي.
كيف أتعامل مع سلاسل SMILES غير الصالحة؟
عيّن ignore_errors=True في MoleculeTransformer لتخطي الجزيئات غير الصالحة ومواصلة المعالجة.
هل يمكنني دمج مُهيئات متعددة؟
نعم، استخدم FeatConص لدمج أنواع السمات المختلفة مثل البصمات والأوصاف في متجه واحد.
لماذا النماذج المدربة مسبقاً أبطأ من البصمات؟
تتطلب نماذج التعلم العميق استدلال الشبكات العصبية بينما تستخدم البصمات خوارزميات محددة مسبقاً، لكنها توفر قدرات أفضل للتعلم بالنقل.
كيف أحفظ وأعيد استخدام تكوينات المُهيئ؟
استخدم transformer.to_state_yaml_file() للحفظ و MoleculeTransformer.from_state_yaml_file() لإعادة تحميل التكوينات.

تفاصيل المطور

المؤلف

K-Dense-AI

الترخيص

Apache-2.0 license

مرجع

main

بنية الملفات