🧠

machine-learning

Name: machine-learning
Author: Joseph OBrien

آمن ⚙️ الأوامر الخارجية🌐 الوصول إلى الشبكة

تطبيق أفضل ممارسات تطوير التعلم الآلي

متاح أيضًا من: Joseph OBrien

يتطلب بناء أنظمة التعلم الآلي التنقل عبر خيارات معقدة من معالجة البيانات إلى النشر في الإنتاج. توفر هذه المهارة أنماطًا مُختبرة للدورة الكاملة للتعلم الآلي.

يدعم: Claude Codex Code(CC)

📊 71 كافٍ

تنزيل ZIP المهارة

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

فعّل وابدأ الاستخدام

اختبرها

استخدام "machine-learning". ساعدني في بناء مصنف بريد عشوائي مع 10 آلاف بريد إلكتروني مُصنَّف

النتيجة المتوقعة:

نوع المشكلة: تصنيف ثنائي
المقاييس الموصى بها: AUC-ROC (الأساسي)، F1 (الثانوي)
نماذج جيدة للبدء: الانحدار اللوجستي، الغابة العشوائية، أو آلة المتجهات الداعمة
لـ 10 آلاف عينة، استخدم تقسيم طبقي للحفاظ على توازن الفئة
اعتبر TF-IDF أو تضمينات المحولات لميزات النص
طبق SMOTE إذا تجاوز اختلال الفئة نسبة 10:1

استخدام "machine-learning". ما خطوات المعالجة التي أحتاجها للتنبؤ بترك العملاء باستخدام البيانات الجدولية؟

النتيجة المتوقعة:

القيم المفقودة: استخدم إسناد المتوسط للقيم الرقمية، والمستوى للقيم الفئوية
التحجيم: طبّق StandardScaler، احسب على بيانات التدريب فقط
الترميز: One-hot للتعددية المنخفضة، ترميز الهدف للتعددية العالية
فحص التسرب: تأكد من عدم وجود معلومات مستقبلية في الميزات
التحقق: استخدم تقسيم طبقي بسبب اختلال الفئة المحتمل

التدقيق الأمني

آمن

v3 • 1/16/2026

Pure documentation skill containing only markdown guidance for ML development. All static findings are FALSE POSITIVES: The 'external_commands' detections are Python variable names (X_train, X_test) that regex incorrectly matches as backticks; the 'C2 keywords' and 'weak cryptographic algorithm' detections are SHA256 content hash strings in metadata; the 'system reconnaissance' detections are standard ML monitoring references. No executable code, scripts, network calls, or command execution capabilities exist.

الملفات التي تم فحصها

564

الأسطر التي تم تحليلها

النتائج

إجمالي عمليات التدقيق

عوامل الخطر

تم تدقيقه بواسطة: claude عرض سجل التدقيق →

درجة الجودة

الهندسة المعمارية

100

قابلية الصيانة

المحتوى

المجتمع

100

الأمان

100

الامتثال للمواصفات

ماذا يمكنك بناءه

هيكلة مشاريع التعلم الآلي

اتبع أنماط مُثبتة من إعداد البيانات من خلال نشر النماذج

نشر النماذج في الإنتاج

تعلم أنماط التقديم واستراتيجيات الجداول الزمنية للصيانة

إضافة التعلم الآلي إلى التطبيقات

دمج قدرات التعلم الآلي باستخدام واجهات REST و الاستدلال المجمعة

جرّب هذه الموجهات

تعريف المشكلة

ساعدني في تحديد نوع مشكلة التعلم الآلي المناسبة ومقاييس النجاح لـ [use case description].

معالجة البيانات

ما هي أفضل الممارسات لـ معالجة [data type] مع [specific challenges]؟

اختيار النموذج

أوصِ بنماذج مناسبة لـ [data size] سجلات مع [problem type]. اشرح المفاضلات.

النشر في الإنتاج

ما أنماط النشر الأنسب لـ [use case] مع المتطلبات: [latency, throughput]؟

أفضل الممارسات

استخدم دائمًا مجموعات اختبار محجوزة للتقييم النهائي بعد التحقق عبر التحقق المتقاطع
احسب خطوات المعالجة على بيانات التدريب فقط، ثم حوّل بيانات الاختبار لمنع التسرب
تتبع التجارب مع التحكم في الإصدار للكود والبيانات ونماذج النتائج

تجنب

استخدام الدقة وحدها لمشاكل التصنيف غير المتوازنة
حساب خطوات المعالجة على مجموعة البيانات بأكملها قبل التقسيم
نشر النماذج دون مراقبة انحراف البيانات وتدهور الأداء

الأسئلة المتكررة

ما أُطر التعلم الآلي التي تدعمها هذه المهارة؟

إرشادات عامة تنطبق على scikit-learn و TensorFlow و PyTorch و XGBoost والمكتبات المماثلة.

ما أحجام البيانات التي يمكن لـ Claude التعامل معها باستخدام هذه المهارة؟

توفر المهارة إرشادات لمجموعات البيانات الصغيرة والمتوسطة والكبيرة مع توصيات خوارزمية مناسبة.

كيف تتكامل هذه المهارة مع المهارات الأخرى؟

تعمل مع مهارات الأداء والاختبار وتحسين قاعدة البيانات وتصحيح الأخطاء لسير عمل التعلم الآلي الكامل.

هل بياناتي آمنة عند استخدام هذه المهارة؟

نعم. توفر هذه المهارة أنماط إرشادية فقط. لا يتم تخزين أي بيانات أو نقلها أو معالجتها خارجيًا.

لماذا أداء نمذجي ضعيف على البيانات الجديدة؟

تشمل الأسباب الشائعة تسرب البيانات والتجاوز والتوزيع المتغير بين بيانات التدريب والبيانات في الإنتاج.

كيف يقارن هذا بأدوات AutoML؟

تشرح هذه المهارة المفاهيم والأنماط. يُعد AutoML الاختيار الآلي. فهم كلا النهجين معًا هو الأكثر فعالية.

تفاصيل المطور

المؤلف

Joseph OBrien

الترخيص

UNLICENSED

المستودع

https://github.com/89jobrien/steve/tree/main/steve/skills/machine-learning

مرجع

main

بنية الملفات

📁 references/

📄 preprocessing.md

📄 SKILL.md