خطوات العمل
- جمع البيانات: اجمع البيانات ذات الصلة بمسألة التنبؤ الخاصة بك.
- معالجة البيانات: نظف البيانات وإعدادها للنمذجة.
- اختيار خوارزمية: اختر خوارزمية التعلم الآلي المناسبة لمسألة التنبؤ الخاصة بك (على سبيل المثال، التصنيف أو الانحدار).
- تدريب النموذج: درب نموذج التعلم الآلي باستخدام بيانات التدريب.
- تقييم النموذج: قم بتقييم أداء النموذج باستخدام بيانات الاختبار.
المفاهيم الرئيسية
- التعلم بإشراف: نوع من التعلم الآلي حيث يتم تقديم البيانات إلى النموذج مصحوبة بالتسميات (إجابات معروفة).
- التصنيف: مسألة يتم فيها تخصيص بيانات المدخلات لفئات محددة مسبقًا (على سبيل المثال، القط أو الكلب).
- الانحدار: مسألة يتم فيها التنبؤ بقيمة مستمرة (على سبيل المثال، سعر المنزل).
- الخوارزميات الشائعة:
- التصنيف: الشجرة القرارية، والغابة العشوائية، والآلة الداعمة المتجهة
- الانحدار: الانحدار الخطي، والانحدار اللوجستي، والشبكات العصبية
المقدمة إلى التعلم بإشراف
المهمة:
توقع ما إذا كان البريد الإلكتروني هو بريد عشوائي أم لا.
البيانات:
- بيانات التدريب: مجموعة من رسائل البريد الإلكتروني المسمى كبريد عشوائي أو غير عشوائي
- بيانات الاختبار: مجموعة من رسائل البريد الإلكتروني غير المسمى لم يتم استخدامها في التدريب
خطوات:
- جمع البيانات: جمعنا رسائل بريد إلكتروني من مصادر مختلفة.
- معالجة البيانات: قمنا بإزالة كلمات التوقف وقمنا بتوحيد الكلمات وإجراء تحويل النص إلى رقم.
- اختيار الخوارزمية: اخترنا شجرة القرار لأنها سهلة الفهم والتنفيذ.
- تدريب النموذج: دربنا شجرة القرار باستخدام بيانات التدريب.
- تقييم النموذج: قمنا بتقييم أداء النموذج باستخدام بيانات الاختبار.
النتائج:
حقق نموذج شجرة القرار دقة عالية في التنبؤ بما إذا كان البريد الإلكتروني بريدًا عشوائيًا أم لا.