Habilidades when-debugging-ml-training-use-ml-training-debugger
🔧

when-debugging-ml-training-use-ml-training-debugger

Seguro ⚡ Contiene scripts🌐 Acceso a red📁 Acceso al sistema de archivos🔑 Variables de entorno⚙️ Comandos externos

MLトレーニングの問題をデバッグし、パフォーマンスを最適化する

MLトレーニングは、損失の乖離、NaN値、過学習、勾配の問題など、静かに失敗することがあります。このスキルは、根本原因の診断、修正の適用、証明された手法による改善の検証のための体系的な5段階ワークフローを提供します。

Soporta: Claude Codex Code(CC)
⚠️ 68 Deficiente
1

Descargar el ZIP de la skill

2

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

3

Activa y empieza a usar

Pruébalo

Usando "when-debugging-ml-training-use-ml-training-debugger". My CNN classifier has 98 percent training accuracy but 55 percent validation accuracy after 50 epochs. Help me fix this overfitting.

Resultado esperado:

  • 特定された問題: 43%のトレーニングと検証の乖離がある過学習
  • 根本原因: データサイズに対してモデルが複雑すぎ、正則化が不十分
  • 適用された修正: 0.01でL2正則化を追加、密な層の後にドロップアウト0.3を追加
  • 修正前: 検証損失 2.1、検証精度 55% | 修正後: 検証損失 0.8、検証精度 82%
  • 改善: 検証損失の相対的に49%減少

Usando "when-debugging-ml-training-use-ml-training-debugger". My transformer model loss became NaN at epoch 15. The training was working fine before that.

Resultado esperado:

  • 特定された問題: Epoch 15でのNaN損失
  • 根本原因: 極端な値または高い学習率导致的数値不安定性
  • 適用された修正: clipnorm 1.0で勾配クリッピングを追加、学習率を10分の1に削減
  • 修正後: トレーニングが正常に収束、最終検証損失0.3
  • 推奨事項: 入力データの前処理でNaNまたは無限値を確認してください

Auditoría de seguridad

Seguro
v5 • 1/17/2026

Documentation-only skill containing example Python code snippets for ML training debugging. No executable scripts, network calls, filesystem access, or external commands. Pure educational content matching stated purpose. All 47 static findings are false positives.

5
Archivos escaneados
910
Líneas analizadas
5
hallazgos
5
Auditorías totales

Factores de riesgo

⚡ Contiene scripts
No se registraron ubicaciones específicas
🌐 Acceso a red
No se registraron ubicaciones específicas
📁 Acceso al sistema de archivos
No se registraron ubicaciones específicas
🔑 Variables de entorno
No se registraron ubicaciones específicas
⚙️ Comandos externos
No se registraron ubicaciones específicas

Puntuación de calidad

38
Arquitectura
100
Mantenibilidad
85
Contenido
20
Comunidad
100
Seguridad
78
Cumplimiento de la especificación

Lo que puedes crear

失敗したトレーニング実行の修正

トレーニング損失がEpoch 10後にNaNになった、または予想外に収束しなくなった理由を診断する

過学習の軽減

トレーニングデータでは良好に機能するが検証データでは性能が低いモデルを特定し、修正する

モデルパフォーマンスの最適化

ディープラーニングプロジェクトのトレーニングの安定性と収束速度を体系的に改善する

Prueba estos prompts

クイック診断
My model training loss is NaN after epoch 10. Use ml-training-debugger to diagnose and fix the issue.
過学習の修正
My model has 95 percent training accuracy but only 60 percent validation accuracy. Use ml-training-debugger to identify and fix the overfitting.
収束の遅れ
My training loss has not changed in 50 epochs. Use ml-training-debugger to analyze convergence rate and recommend fixes.
完全なデバッグ
Debug my training run with training_history.json. Diagnose all issues, apply fixes, and validate improvement with before and after comparison.

Mejores prácticas

  • 問題の後付け診断を可能にするため、すべてのEpochでトレーニング履歴を保存する
  • トレーニング中に勾配を監視して、消失または爆発の問題を早期に発見する
  • 数回の反復だけでなく、完全な再トレーニング実行で修正を常に検証する
  • 標準的な実践として、学習率スケジューラーと早期停止コールバックを使用する

Evitar

  • 履歴の保存や検証指標の監視を行わずにトレーニングする
  • トレーニング損失のみを追跡しながら検証損失を無視する
  • 変数を分離してテストせずに複数の変更を同時に行う
  • 不十分なデータでトレーニングし、良好な汎化を期待する

Preguntas frecuentes

このスキルはどのMLフレームワークをサポートしていますか?
TensorFlow KerasとPyTorchが完全にサポートされています。診断パターンはほとんどの深層学習フレームワークに広く適用できます。
どのようなトレーニング履歴形式が必要ですか?
スキルは、各トレーニングEpochの損失、val_loss、正確さ、val_accuracyの配列を持つJSONファイルを想定しています。
このスキルはRNNの勾配爆発を修正できますか?
はい。勾配分析フェーズで勾配の爆発を検出し、修正としてclipnorm 1.0で勾配クリッピングを適用します。
このスキルは私のモデルファイルを修正しますか?
いいえ。スキルは修正されたアーキテクチャでfixed_model.h5ファイルを生成します。元のモデルファイルは変更されません。
複数の問題が検出された場合はどうなりますか?
スキルは問題を重大度順(クリティカル→高→中→低)で優先順位付けし、その順序で体系的に修正を適用します。
TensorBoardのデバッグと比較するとどうですか?
このスキルは自動化された診断とコードレベルの修正を提供します。TensorBoardは可視化を提供します。最好的結果を得るには、両方を一緒に使用してください。