يتطلب بناء أنظمة التعلم الآلي التنقل عبر خيارات معقدة من معالجة البيانات إلى النشر في الإنتاج. توفر هذه المهارة أنماطًا مُختبرة للدورة الكاملة للتعلم الآلي.
下載技能 ZIP
在 Claude 中上傳
前往 設定 → 功能 → 技能 → 上傳技能
開啟並開始使用
測試它
正在使用「machine-learning」。 ساعدني في بناء مصنف بريد عشوائي مع 10 آلاف بريد إلكتروني مُصنَّف
預期結果:
- نوع المشكلة: تصنيف ثنائي
- المقاييس الموصى بها: AUC-ROC (الأساسي)، F1 (الثانوي)
- نماذج جيدة للبدء: الانحدار اللوجستي، الغابة العشوائية، أو آلة المتجهات الداعمة
- لـ 10 آلاف عينة، استخدم تقسيم طبقي للحفاظ على توازن الفئة
- اعتبر TF-IDF أو تضمينات المحولات لميزات النص
- طبق SMOTE إذا تجاوز اختلال الفئة نسبة 10:1
正在使用「machine-learning」。 ما خطوات المعالجة التي أحتاجها للتنبؤ بترك العملاء باستخدام البيانات الجدولية؟
預期結果:
- القيم المفقودة: استخدم إسناد المتوسط للقيم الرقمية، والمستوى للقيم الفئوية
- التحجيم: طبّق StandardScaler، احسب على بيانات التدريب فقط
- الترميز: One-hot للتعددية المنخفضة، ترميز الهدف للتعددية العالية
- فحص التسرب: تأكد من عدم وجود معلومات مستقبلية في الميزات
- التحقق: استخدم تقسيم طبقي بسبب اختلال الفئة المحتمل
安全審計
安全Pure documentation skill containing only markdown guidance for ML development. All static findings are FALSE POSITIVES: The 'external_commands' detections are Python variable names (X_train, X_test) that regex incorrectly matches as backticks; the 'C2 keywords' and 'weak cryptographic algorithm' detections are SHA256 content hash strings in metadata; the 'system reconnaissance' detections are standard ML monitoring references. No executable code, scripts, network calls, or command execution capabilities exist.
風險因素
⚙️ 外部命令 (21)
🌐 網路存取 (1)
品質評分
你能建構什麼
هيكلة مشاريع التعلم الآلي
اتبع أنماط مُثبتة من إعداد البيانات من خلال نشر النماذج
نشر النماذج في الإنتاج
تعلم أنماط التقديم واستراتيجيات الجداول الزمنية للصيانة
إضافة التعلم الآلي إلى التطبيقات
دمج قدرات التعلم الآلي باستخدام واجهات REST و الاستدلال المجمعة
試試這些提示
ساعدني في تحديد نوع مشكلة التعلم الآلي المناسبة ومقاييس النجاح لـ [use case description].
ما هي أفضل الممارسات لـ معالجة [data type] مع [specific challenges]؟
أوصِ بنماذج مناسبة لـ [data size] سجلات مع [problem type]. اشرح المفاضلات.
ما أنماط النشر الأنسب لـ [use case] مع المتطلبات: [latency, throughput]؟
最佳實務
- استخدم دائمًا مجموعات اختبار محجوزة للتقييم النهائي بعد التحقق عبر التحقق المتقاطع
- احسب خطوات المعالجة على بيانات التدريب فقط، ثم حوّل بيانات الاختبار لمنع التسرب
- تتبع التجارب مع التحكم في الإصدار للكود والبيانات ونماذج النتائج
避免
- استخدام الدقة وحدها لمشاكل التصنيف غير المتوازنة
- حساب خطوات المعالجة على مجموعة البيانات بأكملها قبل التقسيم
- نشر النماذج دون مراقبة انحراف البيانات وتدهور الأداء
常見問題
ما أُطر التعلم الآلي التي تدعمها هذه المهارة؟
ما أحجام البيانات التي يمكن لـ Claude التعامل معها باستخدام هذه المهارة؟
كيف تتكامل هذه المهارة مع المهارات الأخرى؟
هل بياناتي آمنة عند استخدام هذه المهارة؟
لماذا أداء نمذجي ضعيف على البيانات الجديدة؟
كيف يقارن هذا بأدوات AutoML؟
開發者詳情
授權
UNLICENSED
引用
main
檔案結構