كلية تكنولوجيا المعلومات تناقش رسالة ماجستير بعنوان نهج نمذجه للتعامل مع مشاكل التنبؤ في تطبيقاتمجموعات البيانات الصغيره للطالبة نهى احمد سلمان .ناقشت كلية تكنولوجيا المعلومات رسالة ماجستير بعنوان نهج نمذجه للتعامل مع مشاكل التنبؤ في تطبيقاتمجموعات البيانات الصغيره للطالبة نهى احمد سلمان.حيث تضمنت الرسالة ما يلي :يمكن أن تشكل مجموعات البيانات الصغيرة مجموعة متنوعة من التحديات عندما يتعلق الأمر ببناء نماذج تنبؤية. يتطلب بناء النماذج التنبؤية بنجاح على مجموعات البيانات الصغيرة مجموعة من المعرفة بالمجال والأساليب الإحصائية وتقنيات التعلم الآلي. ستركز هذه الرسالة على إنشاء نموذج تنبؤلمجموعات البيانات باستخدام طرق التصنيف التقليدية مثل logistic regression و decision treesو Naive Bayesو KNN لتصميم نماذج التنبؤ لمجموعات البيانات. يمكن أن توفر هذه الأساليب دقة جيدة للغاية لتنبؤ التصنيف. نظرا لأن خوارزميات التعلم الآلي أصبحت أكثر شيوعا ويمكن الوصول إليها ، فقد يميل الباحثون إلى تطبيق نماذج الشبكة العصبية على مجموعات البيانات في محاولة لتحسين دقة التنبؤ بالتصنيف. ومع ذلك ، غال ًبا ما يتم تقييد البيانات بمجموعات أصغر من الملاحظات مما يُفضل عادةً للسماح بالتدريب الكافي واختبار النماذج التي تم إنشاؤها باستخدامخوارزميات التعلم الآلي.باستخدام نماذج التعلم الآلي مع البيانات الموسعة ، تم تحسين استقرار ودقة التنبؤ في حدود 94 في المائة لـ Naive Bayes ، ومثة بالمائة لشجرة القرار ، ومئة بالمائة لـ K-Nearest Neighbor ، و 99.9 بالمائة لـ logistic regression. لوحظ أن خوارزميات التنبؤ الأربعة التي تم استخدامها تختلف في الدقة وفقًا لحجم مجموعة البيانات. على سبيل المثال ، عند مجموعة البيانات الصغيرة ، تعمل KNN بكفاءة أكبر ، ولكن عندما تكون مجموعة البيانات المتوسطة والكبيرة ، تعمل شجرة القرار بكفاءة أكبر. تعتبر مجموعات البيانات التي يزيد حجمها عن 1000 مجموعات بيانات متوسطة أوSMOTكبيرة ، وتعمل معظم الخوارزميات عليها بكفاءة ولا تحتاج إلى تطبيق