اعلام جامعة بابل - كلية الطب

اطروحة دكتوراه في كلية تكنولوجيا المعلومات تناقش"تحسين ROBERTA لإكتشاف خطاب الكراهية في وسائل التواصل الاجتماعي اعتمادا على الدمج السياقي للإيموجي"

ضحى فاضل عباس
قسم البرمجيات في كلية تكنولوجيا المعلومات يناقش اطروحة دكتوراه " تحسين ROBERTA لإكتشاف خطاب الكراهية في وسائل التواصل الاجتماعي اعتمادا على الدمج السياقي للإيموجي"
لطالبة الدكتوراه ( جنان علي عبد حمزة ) و بإشراف (د.مهدي نصيف جاسم ) في قسم البرمجيات . و ذلك في الساعة التاسعة من صباح يوم الاحد المصادف 17/11/2024 و على قاعة المؤتمرات في كلية تكنولوجيا المعلومات .

بينت الاطروحة كيف ان وسائل التواصل الاجتماعي جزءًا لا يتجزأ من الحياة اليومية للإنسان المعاصر، ورغم إيجابياتها العديدة إلا أنها كانت لها عدة سلبيات، منها تسهيل انتشار خطاب الكراهية بسبب سهولة استخدامها وسرعتها والخصوصية التي تمنحها للمستخدمين، ويعتبر انتشار خطاب الكراهية خطراً على الأفراد والمجتمعات، ولذلك اهتم العديد من الباحثين بدراسة كيفية اكتشافه.
على الرغم من إجراء الكثير من الأبحاث في هذا المجال باستخدام العديد من استراتيجيات التعلم الآلي والتعلم العميق والتعلم الانتقالي، إلا أنها لا تزال تواجه العديد من التحديات. التحدي الأول هو أن معظم الأنظمة الحالية تعتمد فقط على النص في عملية الكشف. إن دمج عوامل أخرى في منشورات وسائل التواصل الاجتماعي أو التغريدات أو التعليقات يمكن أن يحدث فرقا كبيرًا. تعد الرموز التعبيرية أحد الأعضاء النشطين في نصوص وسائل التواصل الاجتماعي. لها دور كبير في تحديد المشاعر وبالتالي الكراهية، ولكن لسوء الحظ، يتم تجاهلها أو التعامل معها باستخدام طرق بدائية. علاوة على ذلك، هناك تحدٍ آخر وهو ندرة البيانات. يعتمد اكتشاف خطاب الكراهية في المقام الأول على البيانات المصنفة و نظرًا لأن عملية التصنيف هذه مكلفة ومعقدة و بطيئة، فإننا نعاني من مشكلة البيانات المصنفة المحدودة المتاحة لتدريب نماذج التصنيف، وخاصة لخطاب الكراهية متعدد التصنيفات وخطاب الكراهية القائم على الرموز التعبيرية. أخيرًا، تعاني نماذج التعلم العميق والتعلم الانتقالي من خاصية عدم القدرة على التفسير. تعتبر بمثابة صناديق سوداء، بسبب بنيتها المعقدة و طبقاتها وعددها الهائل من المعلمات.
للتعامل مع الفجوات المذكورة، تعمل هذه الدراسة على كل من جانب النموذج وجانب البيانات. فيما يتعلق بالنموذج، فقد عززت النسخة القائمة على BERT والتي تسمى RoBERTa لإضافة الرموز التعبيرية في قائمة المفردات الخاصة بها والقدرة على إنشاء تمثيلات متجهية للرموز التعبيرية وكذلك الكلمات. تم تحقيق هذا الهدف من خلال مزيد من التدريب المسبق لنموذج RoBERTa على بيانات كبيرة غير مصنفة غنية بالرموز التعبيرية، ثم ضبطها بدقة على بيانات مصنفة بخطاب الكراهية. لأغراض التصنيف، تمت إضافة طبقة خطية. من جانب البيانات، يحاول هذا العمل الجمع بين تقنيات تكبيرحجم البيانات المختلفة المتاحة لزيادة حجم وجودة كل من مجموعات البيانات التدريبية الثنائية والمتعددة التصنيف والحصول على نسخة أكثر تنوعًا وتمثيلاً للبيانات. علاوة على ذلك، استخدمت أساليب استبدال بسيطة لإضافة رموز الايموجي التعبيرية الخاصة بالأشياء. أما الايموجي الخاص بالمشاعر فتمت اضافته اعتمادا على تقنية الzero shot باستخدام المودل BART ,وتقنية اكتشاف المشاعر باستخدام المودل DistillRoBERTa. والهدف هو زيادة عدد رموز الايموجي التعبيرية في مجموعات بيانات التدريب. أخيرًا، استخدمنا نموذج LIME لتوليد تفسير للتنبؤ بمثيلات مجموعة البيانات.
تم إجراء التجارب على العديد من مجموعات البيانات. كانت الدقة وF1 المقياسين الرئيسيين المستخدمين للمقارنة. أظهرت النتائج أن نموذج EMOJI-RoBERTa المقترح لدينا تفوق على خطوط الأساس الأخرى والتقنيات التقليدية للتعامل مع الرموز التعبيرية بدقة ودرجة F1 بنسبة 92? لكل منهما على مجموعة بيانات HASOC2020 و 68? لكل منهما على مجموعة بيانات HATEMOJI. يثبت LIME الدور المهم للرموز التعبيرية وقدرات نموذجنا على دمجها في عملية التنبؤ. حققت طريقة تكبير النص المقترحة نتائج متفوقة من خلال تسجيل درجة F1 الكلية 0?8311 على مجموعة بيانات ETHOS متعددة العلامات، وحققت طريقة التكبير القائمة على الرموز التعبيرية المقترحة نتائج واعدة.

تاسماء اعضاء لجنة المناقشةاللقب العلميالاختصاص الدقيقمكان العملالمنصب
1د. اسراء هادي علياستاذوسائط متعددة و تنقيب بياناتجامعة بابل / كلية تكنولوجيا المعلوماترئيساً
2د. هدى ناجي نوافاستاذانظمة توصية و شبكات تواصل اجتماعيجامعة بابل / كلية تكنولوجيا المعلوماتعضوا
3د. علي عبيد شراداستاذذكاء اصطناعيجامعة القادسية / كلية علوم الحاسوب و تكنولوجيا المعلوماتعضوا
4د. اسيا مهدي ناصراستاذذكاء اصطناعي و تنقيب البياناتجامعة كربلاء/ كلية علوم الحاسوب و تكنولوجيا المعلوماتعضوا
5د. احمد خلفة عبيداستاذ مساعدذكاء اصطناعي و نظم معلوماتجامعة بابل / كلية تكنولوجيا المعلوماتعضوا
6د. مهدي نصيف جاسماستاذتنقيب البياناتجامعة تكنولوجيا المعلومات و الاتصالاتعضوا و مشرفا

الصور:

اعلام جامعة بابل - كلية الطب
اعلام جامعة بابل - كلية الطب
اعلام جامعة بابل - كلية الطب
اعلام جامعة بابل - كلية الطب
اعلام جامعة بابل - كلية الطب
اعلام جامعة بابل - كلية الطب
اعلام جامعة بابل - كلية الطب
اعلام جامعة بابل - كلية الطب
احداث علمية قادمة
مناقشة رسالة ماجستير "Proposing a Hybrid Image Compression Techniques"

نشر بواسطة: ضحى فاضل عباس

تاريخ: 27/08/2024

مناقشة رسالة ماجستير " GPS Trajectory Clustering for Spatio"

نشر بواسطة: ضحى فاضل عباس

تاريخ: 02/08/2024

مناقش أطروحة " Intrusion Detection System Based on Gaining-Sharing Knowledge"

نشر بواسطة: ضحى فاضل عباس

تاريخ: 22/05/2024

معرض للرسم يمثل الفتاة العراقية بصوره عامه

نشر بواسطة: ضحى فاضل عباس

تاريخ: 20/05/2022