Date of Award

6-2022

Document Type

Thesis

Degree Name

Master of Science in Information Technology Management

Department

Information Systems and Security

First Advisor

Nazar Zaki

Abstract

Recent years have seen a rapid development in the field of educational data mining (EDM), enhancing the ability to trace student knowledge. Data from intelligent tutoring systems (ITS) have been analyzed and interpreted by multiple researchers seeking to measure students’ knowledge as it evolves. Human nature, as well as other factors, makes it difficult to determine whether or not students are knowledgeable. This thesis sets out to examine the level of students’ knowledge by predicting their current and future academic performance based on records of their historical interactions. By restructuring data and considering a student perspective, we can gain insight into certain important attributes, their inter-relationships, and the overall effect on performance. The objectives of this study are as follows: (i) to apply machine learning (ML) techniques in order to determine students’ knowledge based on their predicted academic performance using student-focused aggregated data as opposed to the usual (problem-focused) data structure; (ii) to predict the academic accuracy of the next student response with the use of ML models. Lastly, (iii) to determine the problem sequence types (delivery patterns) that lead to the best academic performance; and to analyze how these sequence types influence the accuracy of each student’s response. Experimental work was carried out using the ASSISTments 2012–2013 dataset as well as ML models. It demonstrated that the proposed approach predicts student performance better than current knowledge tracing (KT) models. The results of the present study confirm the usefulness of classification and regression techniques in capturing greater variance within the data, resulting in more precise predictions.

Arabic Abstract


تحديد المعرفة من توقع أداء الطلاب باستخدام التعلم الآلي

شهدت السنوات الأخيرة تطوراً سريعاً في مجال تنقيب البيانات التعليمية، مما أدى إلى تعزيز القدرة على تتبع المعرفة لدى الطالب. تم تحليل البيانات من أنظمة التدريس الذكية وتفسيرها من قبل العديد من الباحثين الذين يسعون إلى قياس معرفة الطلاب أثناء تطورها. تجعل الطبيعة البشرية، بالإضافة إلى عوامل أخرى من الصعب تحديد ما إذا كان الطلاب على معرفة أم لا .تهدف هذه الأطروحة إلى فحص مستوى معرفة الطلاب من خلال التنبؤ بالأداء الأكاديمي الحالي والمستقبلي بناء على سجلات تفاعلاتهم التاريخية. من خلال إعادة هيكلة البيانات والنظر في منظور الطالب، يمكننا الحصول على نظرة ثاقبة لسمات مهمة معينة وعلاقاتها المتبادلة والتأثير العام على الأداء. أهداف هذه الدراسة هي كما يلي: (1) تطبيق تقنيات التعلم الآلي من أجل تحديد معرفة الطلاب بناء على أدائهم الأكاديمي المتوقع باستخدام البيانات المجمعة التي تركز على الطالب بدلا من البيانات المعتادة (لتي تركز على المشكلة) بنية؛ (2) للتنبؤ بالدقة الأكاديمية لاستجابة الطالب التالية باستخدام نماذج ML. أخيراً، (3) تحديد أنواع تسلسل المشكلة (أنماط التسليم) التي تؤدي إلى أفضل أداء أكاديمي؛ ولتحليل كيفية تأثير أنواع التسلسل هذه على دقة استجابة كل طالب. تم تنفيذ العمل التجريبي باستخدام مجموعة بيانات (ASSISTments 2012–2013) بالإضافة إلى نماذج تعلم الآلة (ML)، و أظهر أن النهج المقترح يتنبأ بأداء الطالب بشكل أفضل من نماذج تتبع المعرفة الحالية (KT). تؤكد نتائج الدراسة الحالية فائدة تقنيات التصنيف والانحدار في التقاط تباين أكبر داخل البيانات، مما يؤدي إلى تنبؤات أكثر دقة.

COinS