المهارات when-debugging-ml-training-use-ml-training-debugger

🔧

when-debugging-ml-training-use-ml-training-debugger

Name: when-debugging-ml-training-use-ml-training-debugger
Author: DNYoussef

آمن ⚡ يحتوي على سكربتات🌐 الوصول إلى الشبكة📁 الوصول إلى نظام الملفات🔑 متغيرات البيئة⚙️ الأوامر الخارجية

تصحيح مشاكل تدريب نماذج التعلم الآلي وتحسين الأداء

قد يفشل تدريب نماذج التعلم الآلي بصمت مع مشاكل مثل تباعد الخسارة، وقيم NaN، والإفراط في التوفيق، ومشاكل التدرجات. توفر هذه المهارة سير عمل منهجي من 5 مراحل لتشخيص الأسباب الجذرية، وتطبيق الإصلاحات، والتحقق من التحسينات باستخدام تقنيات مثبتة.

يدعم: Claude Codex Code(CC)

⚠️ 68 ضعيف

تنزيل ZIP المهارة

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

فعّل وابدأ الاستخدام

اختبرها

استخدام "when-debugging-ml-training-use-ml-training-debugger". مصنف CNN الخاص بي لديه دقة تدريب 98 بالمائة ولكن دقة التحقق 55 بالمائة بعد 50 حقبة. ساعدني في إصلاح هذا الإفراط في التوفيق.

النتيجة المتوقعة:

المشكلة المحددة: الإفراط في التوفيق مع فجوة بين التدريب والتحقق بنسبة 43 بالمائة
السبب الجذري: النموذج معقد جدًا بالنسبة لحجم البيانات، تنظيم غير كافٍ
الإصلاحات المطبقة: إضافة L2 regularization عند 0.01، Dropout عند 0.3 بعد الطبقات الكثيفة
قبل: خسارة التحقق 2.1، دقة التحقق 55 بالمائة | بعد: خسارة التحقق 0.8، دقة التحقق 82 بالمائة
التحسين: انخفاض نسبي بنسبة 49 بالمائة في خسارة التحقق

استخدام "when-debugging-ml-training-use-ml-training-debugger". خسارة نموذج المحول الخاص بي أصبحت NaN في الحقبة 15. كان التدريب يعمل بشكل جيد قبل ذلك.

النتيجة المتوقعة:

المشكلة المحددة: خسارة NaN في الحقبة 15
السبب الجذري: عدم استقرار رقمي ربما بسبب قيم متطرفة أو معدل تعلم عالٍ
الإصلاحات المطبقة: إضافة gradient clipping مع clipnorm 1.0، تقليل معدل التعلم بمقدار 10 أضعاف
بعد الإصلاح: تقارب التدريب بنجاح مع خسارة التحقق النهائية 0.3
التوصية: تحقق من بيانات الإدخال بحثًا عن قيم NaN أو لا نهائية في المعالجة المسبقة

التدقيق الأمني

آمن

v5 • 1/17/2026

Documentation-only skill containing example Python code snippets for ML training debugging. No executable scripts, network calls, filesystem access, or external commands. Pure educational content matching stated purpose. All 47 static findings are false positives.

الملفات التي تم فحصها

910

الأسطر التي تم تحليلها

النتائج

إجمالي عمليات التدقيق

عوامل الخطر

⚡ يحتوي على سكربتات

لم يتم تسجيل أي مواقع محددة

🌐 الوصول إلى الشبكة

لم يتم تسجيل أي مواقع محددة

📁 الوصول إلى نظام الملفات

لم يتم تسجيل أي مواقع محددة

🔑 متغيرات البيئة

لم يتم تسجيل أي مواقع محددة

⚙️ الأوامر الخارجية

لم يتم تسجيل أي مواقع محددة

تم تدقيقه بواسطة: claude عرض سجل التدقيق →

درجة الجودة

الهندسة المعمارية

100

قابلية الصيانة

المحتوى

المجتمع

100

الأمان

الامتثال للمواصفات

ماذا يمكنك بناءه

إصلاح عمليات التدريب المعطلة

تشخيص سبب انفجار خسارة التدريب إلى NaN أو توقف التقارب بشكل غير متوقع

تقليل الإفراط في التوفيق

تحديد وإصلاح النماذج التي تؤدي بشكل جيد على بيانات التدريب ولكن بشكل سيئ على التحقق

تحسين أداء النموذج

تحسين استقرار التدريب وسرعة التقارب بشكل منهجي لمشاريع التعلم العميق

جرّب هذه الموجهات

التشخيص السريع

خسارة تدريب نموذجي أصبحت NaN بعد الحقبة 10. استخدم ml-training-debugger لتشخيص وإصلاح المشكلة.

إصلاح الإفراط في التوفيق

نموذجي لديه دقة تدريب 95 بالمائة ولكن دقة التحقق فقط 60 بالمائة. استخدم ml-training-debugger لتحديد وإصلاح الإفراط في التوفيق.

التقارب البطيء

خسارة التدريب لم تتغير في 50 حقبة. استخدم ml-training-debugger لتحليل معدل التقارب والتوصية بالإصلاحات.

التصحيح الكامل

صحح عملية التدريب الخاصة بي باستخدام training_history.json. شخص جميع المشاكل، وطبق الإصلاحات، وتحقق من التحسين مع المقارنة قبل وبعد.

أفضل الممارسات

احفظ سجل التدريب في كل حقبة لتمكين التشخيص اللاحق للمشاكل
راقب التدرجات أثناء التدريب لاكتشاف مشاكل التلاشي أو الانفجار مبكرًا
تحقق دائمًا من الإصلاحات من خلال عملية إعادة تدريب كاملة، وليس فقط بضع تكرارات
استخدم جداول معدل التعلم ومكالمات الإيقاف المبكر كممارسة قياسية

تجنب

التدريب دون حفظ السجل أو مراقبة مقاييس التحقق
تجاهل خسارة التحقق مع تتبع تقدم خسارة التدريب فقط
إجراء تغييرات متعددة في وقت واحد دون عزل المتغيرات للاختبار
التدريب على بيانات غير كافية وتوقع نتائج تعميم جيدة

الأسئلة المتكررة

ما هي أطر عمل التعلم الآلي التي تدعمها هذه المهارة؟

TensorFlow Keras و PyTorch مدعومان بالكامل. تنطبق أنماط التشخيص على نطاق واسع على معظم أطر عمل التعلم العميق.

ما هو تنسيق سجل التدريب المطلوب؟

تتوقع المهارة ملف JSON يحتوي على مصفوفات loss و val_loss و accuracy و val_accuracy لكل حقبة تدريب.

هل يمكن لهذه المهارة إصلاح انفجار التدرجات في الشبكات العصبية المتكررة؟

نعم. تكتشف مرحلة تحليل التدرجات انفجار التدرجات وتطبق gradient clipping مع clipnorm 1.0 كإصلاح.

هل تقوم هذه المهارة بتعديل ملفات النموذج الخاصة بي؟

لا. تنشئ المهارة ملف fixed_model.h5 بالبنية المعمارية المصححة. يبقى ملف النموذج الأصلي دون تغيير.

ماذا لو تم اكتشاف مشاكل متعددة؟

تعطي المهارة الأولوية للمشاكل حسب الخطورة من حرجة إلى عالية إلى متوسطة إلى منخفضة وتطبق الإصلاحات بهذا الترتيب بشكل منهجي.

كيف يمكن مقارنة ذلك بتصحيح TensorBoard؟

توفر هذه المهارة التشخيص الآلي والإصلاحات على مستوى الكود. يوفر TensorBoard التصور. استخدم كليهما معًا للحصول على أفضل النتائج.

تفاصيل المطور

المؤلف

DNYoussef

الترخيص

MIT

المستودع

https://github.com/DNYoussef/ai-chrome-extension/tree/main/.claude/skills/machine-learning/when-debugging-ml-training-use-ml-training-debugger

مرجع

main

بنية الملفات

📄 process-diagram.gv

📄 PROCESS.md

📄 README.md

📄 SKILL.md