Fähigkeiten when-debugging-ml-training-use-ml-training-debugger
🔧

when-debugging-ml-training-use-ml-training-debugger

Sicher ⚡ Enthält Skripte🌐 Netzwerkzugriff📁 Dateisystemzugriff🔑 Umgebungsvariablen⚙️ Externe Befehle

تصحيح مشاكل تدريب نماذج التعلم الآلي وتحسين الأداء

قد يفشل تدريب نماذج التعلم الآلي بصمت مع مشاكل مثل تباعد الخسارة، وقيم NaN، والإفراط في التوفيق، ومشاكل التدرجات. توفر هذه المهارة سير عمل منهجي من 5 مراحل لتشخيص الأسباب الجذرية، وتطبيق الإصلاحات، والتحقق من التحسينات باستخدام تقنيات مثبتة.

Unterstützt: Claude Codex Code(CC)
📊 69 Angemessen
1

Die Skill-ZIP herunterladen

2

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

3

Einschalten und loslegen

Teste es

Verwendung von "when-debugging-ml-training-use-ml-training-debugger". مصنف CNN الخاص بي لديه دقة تدريب 98 بالمائة ولكن دقة التحقق 55 بالمائة بعد 50 حقبة. ساعدني في إصلاح هذا الإفراط في التوفيق.

Erwartetes Ergebnis:

  • المشكلة المحددة: الإفراط في التوفيق مع فجوة بين التدريب والتحقق بنسبة 43 بالمائة
  • السبب الجذري: النموذج معقد جدًا بالنسبة لحجم البيانات، تنظيم غير كافٍ
  • الإصلاحات المطبقة: إضافة L2 regularization عند 0.01، Dropout عند 0.3 بعد الطبقات الكثيفة
  • قبل: خسارة التحقق 2.1، دقة التحقق 55 بالمائة | بعد: خسارة التحقق 0.8، دقة التحقق 82 بالمائة
  • التحسين: انخفاض نسبي بنسبة 49 بالمائة في خسارة التحقق

Verwendung von "when-debugging-ml-training-use-ml-training-debugger". خسارة نموذج المحول الخاص بي أصبحت NaN في الحقبة 15. كان التدريب يعمل بشكل جيد قبل ذلك.

Erwartetes Ergebnis:

  • المشكلة المحددة: خسارة NaN في الحقبة 15
  • السبب الجذري: عدم استقرار رقمي ربما بسبب قيم متطرفة أو معدل تعلم عالٍ
  • الإصلاحات المطبقة: إضافة gradient clipping مع clipnorm 1.0، تقليل معدل التعلم بمقدار 10 أضعاف
  • بعد الإصلاح: تقارب التدريب بنجاح مع خسارة التحقق النهائية 0.3
  • التوصية: تحقق من بيانات الإدخال بحثًا عن قيم NaN أو لا نهائية في المعالجة المسبقة

Sicherheitsaudit

Sicher
v5 • 1/17/2026

Documentation-only skill containing example Python code snippets for ML training debugging. No executable scripts, network calls, filesystem access, or external commands. Pure educational content matching stated purpose. All 47 static findings are false positives.

5
Gescannte Dateien
910
Analysierte Zeilen
5
befunde
5
Gesamtzahl Audits

Risikofaktoren

⚡ Enthält Skripte
Keine spezifischen Standorte aufgezeichnet
🌐 Netzwerkzugriff
Keine spezifischen Standorte aufgezeichnet
📁 Dateisystemzugriff
Keine spezifischen Standorte aufgezeichnet
🔑 Umgebungsvariablen
Keine spezifischen Standorte aufgezeichnet
⚙️ Externe Befehle
Keine spezifischen Standorte aufgezeichnet
Auditiert von: claude Audit-Verlauf anzeigen →

Qualitätsbewertung

38
Architektur
100
Wartbarkeit
85
Inhalt
30
Community
100
Sicherheit
78
Spezifikationskonformität

Was du bauen kannst

إصلاح عمليات التدريب المعطلة

تشخيص سبب انفجار خسارة التدريب إلى NaN أو توقف التقارب بشكل غير متوقع

تقليل الإفراط في التوفيق

تحديد وإصلاح النماذج التي تؤدي بشكل جيد على بيانات التدريب ولكن بشكل سيئ على التحقق

تحسين أداء النموذج

تحسين استقرار التدريب وسرعة التقارب بشكل منهجي لمشاريع التعلم العميق

Probiere diese Prompts

التشخيص السريع
خسارة تدريب نموذجي أصبحت NaN بعد الحقبة 10. استخدم ml-training-debugger لتشخيص وإصلاح المشكلة.
إصلاح الإفراط في التوفيق
نموذجي لديه دقة تدريب 95 بالمائة ولكن دقة التحقق فقط 60 بالمائة. استخدم ml-training-debugger لتحديد وإصلاح الإفراط في التوفيق.
التقارب البطيء
خسارة التدريب لم تتغير في 50 حقبة. استخدم ml-training-debugger لتحليل معدل التقارب والتوصية بالإصلاحات.
التصحيح الكامل
صحح عملية التدريب الخاصة بي باستخدام training_history.json. شخص جميع المشاكل، وطبق الإصلاحات، وتحقق من التحسين مع المقارنة قبل وبعد.

Bewährte Verfahren

  • احفظ سجل التدريب في كل حقبة لتمكين التشخيص اللاحق للمشاكل
  • راقب التدرجات أثناء التدريب لاكتشاف مشاكل التلاشي أو الانفجار مبكرًا
  • تحقق دائمًا من الإصلاحات من خلال عملية إعادة تدريب كاملة، وليس فقط بضع تكرارات
  • استخدم جداول معدل التعلم ومكالمات الإيقاف المبكر كممارسة قياسية

Vermeiden

  • التدريب دون حفظ السجل أو مراقبة مقاييس التحقق
  • تجاهل خسارة التحقق مع تتبع تقدم خسارة التدريب فقط
  • إجراء تغييرات متعددة في وقت واحد دون عزل المتغيرات للاختبار
  • التدريب على بيانات غير كافية وتوقع نتائج تعميم جيدة

Häufig gestellte Fragen

ما هي أطر عمل التعلم الآلي التي تدعمها هذه المهارة؟
TensorFlow Keras و PyTorch مدعومان بالكامل. تنطبق أنماط التشخيص على نطاق واسع على معظم أطر عمل التعلم العميق.
ما هو تنسيق سجل التدريب المطلوب؟
تتوقع المهارة ملف JSON يحتوي على مصفوفات loss و val_loss و accuracy و val_accuracy لكل حقبة تدريب.
هل يمكن لهذه المهارة إصلاح انفجار التدرجات في الشبكات العصبية المتكررة؟
نعم. تكتشف مرحلة تحليل التدرجات انفجار التدرجات وتطبق gradient clipping مع clipnorm 1.0 كإصلاح.
هل تقوم هذه المهارة بتعديل ملفات النموذج الخاصة بي؟
لا. تنشئ المهارة ملف fixed_model.h5 بالبنية المعمارية المصححة. يبقى ملف النموذج الأصلي دون تغيير.
ماذا لو تم اكتشاف مشاكل متعددة؟
تعطي المهارة الأولوية للمشاكل حسب الخطورة من حرجة إلى عالية إلى متوسطة إلى منخفضة وتطبق الإصلاحات بهذا الترتيب بشكل منهجي.
كيف يمكن مقارنة ذلك بتصحيح TensorBoard؟
توفر هذه المهارة التشخيص الآلي والإصلاحات على مستوى الكود. يوفر TensorBoard التصور. استخدم كليهما معًا للحصول على أفضل النتائج.