技能 machine-learning
🧠

machine-learning

安全 ⚙️ 外部命令🌐 網路存取

تطبيق أفضل ممارسات تطوير التعلم الآلي

也可從以下取得: Joseph OBrien

يتطلب بناء أنظمة التعلم الآلي التنقل عبر خيارات معقدة من معالجة البيانات إلى النشر في الإنتاج. توفر هذه المهارة أنماطًا مُختبرة للدورة الكاملة للتعلم الآلي.

支援: Claude Codex Code(CC)
📊 71 充足
1

下載技能 ZIP

2

在 Claude 中上傳

前往 設定 → 功能 → 技能 → 上傳技能

3

開啟並開始使用

測試它

正在使用「machine-learning」。 ساعدني في بناء مصنف بريد عشوائي مع 10 آلاف بريد إلكتروني مُصنَّف

預期結果:

  • نوع المشكلة: تصنيف ثنائي
  • المقاييس الموصى بها: AUC-ROC (الأساسي)، F1 (الثانوي)
  • نماذج جيدة للبدء: الانحدار اللوجستي، الغابة العشوائية، أو آلة المتجهات الداعمة
  • لـ 10 آلاف عينة، استخدم تقسيم طبقي للحفاظ على توازن الفئة
  • اعتبر TF-IDF أو تضمينات المحولات لميزات النص
  • طبق SMOTE إذا تجاوز اختلال الفئة نسبة 10:1

正在使用「machine-learning」。 ما خطوات المعالجة التي أحتاجها للتنبؤ بترك العملاء باستخدام البيانات الجدولية؟

預期結果:

  • القيم المفقودة: استخدم إسناد المتوسط للقيم الرقمية، والمستوى للقيم الفئوية
  • التحجيم: طبّق StandardScaler، احسب على بيانات التدريب فقط
  • الترميز: One-hot للتعددية المنخفضة، ترميز الهدف للتعددية العالية
  • فحص التسرب: تأكد من عدم وجود معلومات مستقبلية في الميزات
  • التحقق: استخدم تقسيم طبقي بسبب اختلال الفئة المحتمل

安全審計

安全
v3 • 1/16/2026

Pure documentation skill containing only markdown guidance for ML development. All static findings are FALSE POSITIVES: The 'external_commands' detections are Python variable names (X_train, X_test) that regex incorrectly matches as backticks; the 'C2 keywords' and 'weak cryptographic algorithm' detections are SHA256 content hash strings in metadata; the 'system reconnaissance' detections are standard ML monitoring references. No executable code, scripts, network calls, or command execution capabilities exist.

3
已掃描檔案
564
分析行數
2
發現項
3
審計總數
審計者: claude 查看審計歷史 →

品質評分

41
架構
100
可維護性
85
內容
22
社群
100
安全
100
規範符合性

你能建構什麼

هيكلة مشاريع التعلم الآلي

اتبع أنماط مُثبتة من إعداد البيانات من خلال نشر النماذج

نشر النماذج في الإنتاج

تعلم أنماط التقديم واستراتيجيات الجداول الزمنية للصيانة

إضافة التعلم الآلي إلى التطبيقات

دمج قدرات التعلم الآلي باستخدام واجهات REST و الاستدلال المجمعة

試試這些提示

تعريف المشكلة
ساعدني في تحديد نوع مشكلة التعلم الآلي المناسبة ومقاييس النجاح لـ [use case description].
معالجة البيانات
ما هي أفضل الممارسات لـ معالجة [data type] مع [specific challenges]؟
اختيار النموذج
أوصِ بنماذج مناسبة لـ [data size] سجلات مع [problem type]. اشرح المفاضلات.
النشر في الإنتاج
ما أنماط النشر الأنسب لـ [use case] مع المتطلبات: [latency, throughput]؟

最佳實務

  • استخدم دائمًا مجموعات اختبار محجوزة للتقييم النهائي بعد التحقق عبر التحقق المتقاطع
  • احسب خطوات المعالجة على بيانات التدريب فقط، ثم حوّل بيانات الاختبار لمنع التسرب
  • تتبع التجارب مع التحكم في الإصدار للكود والبيانات ونماذج النتائج

避免

  • استخدام الدقة وحدها لمشاكل التصنيف غير المتوازنة
  • حساب خطوات المعالجة على مجموعة البيانات بأكملها قبل التقسيم
  • نشر النماذج دون مراقبة انحراف البيانات وتدهور الأداء

常見問題

ما أُطر التعلم الآلي التي تدعمها هذه المهارة؟
إرشادات عامة تنطبق على scikit-learn و TensorFlow و PyTorch و XGBoost والمكتبات المماثلة.
ما أحجام البيانات التي يمكن لـ Claude التعامل معها باستخدام هذه المهارة؟
توفر المهارة إرشادات لمجموعات البيانات الصغيرة والمتوسطة والكبيرة مع توصيات خوارزمية مناسبة.
كيف تتكامل هذه المهارة مع المهارات الأخرى؟
تعمل مع مهارات الأداء والاختبار وتحسين قاعدة البيانات وتصحيح الأخطاء لسير عمل التعلم الآلي الكامل.
هل بياناتي آمنة عند استخدام هذه المهارة؟
نعم. توفر هذه المهارة أنماط إرشادية فقط. لا يتم تخزين أي بيانات أو نقلها أو معالجتها خارجيًا.
لماذا أداء نمذجي ضعيف على البيانات الجديدة؟
تشمل الأسباب الشائعة تسرب البيانات والتجاوز والتوزيع المتغير بين بيانات التدريب والبيانات في الإنتاج.
كيف يقارن هذا بأدوات AutoML؟
تشرح هذه المهارة المفاهيم والأنماط. يُعد AutoML الاختيار الآلي. فهم كلا النهجين معًا هو الأكثر فعالية.

開發者詳情

檔案結構