Date of Award
11-2025
Document Type
Thesis
Degree Name
Master of Science in Information Security
Department
Information Systems and Security
First Advisor
Dr. Rafat Damseh
Abstract
This thesis examines the vulnerability of AI medical imaging models to adversarial threats, with a specific focus on data poisoning attacks in chest X-ray classification. The study begins with a Systematic Literature Review (SLR) to assess the existing adversarial attacks and defenses in medical imaging, revealing a significant research gap in studies exploring data poisoning attacks in the medical domain. Based on our literature search, an efficient and lightweight defense, namely friendly noise defense, against data poisoning has not been investigated in medical imaging classification tasks. Hence, in this work, we investigated its effectiveness on the chest X-ray dataset, and our findings suggest limited test accuracy when applied to medical images, despite its success in general scenarios.
In this thesis, we propose a novel method of data poisoning detection by leveraging an Explainable AI (XAI) based approach. Specifically, this part of the work investigates the effect of label-flipping data poisoning attacks on chest X-ray images and proposes an XAI-driven feature extraction for poison detection. These extracted features, when represented in 3D space, revealed a clear separation between clean and poisoned models. Building on these insights, a classifier trained on these features effectively distinguished the two, with an AUC of 0.86. These findings suggest the promise of integrating XAI-driven feature extraction into the detection framework of data poisoning attacks, and future work can validate this approach across broader datasets under diverse attack scenarios.
Arabic Abstract
اكتشاف هجمات تسميم البيانات في التصوير الطبي :دراسة على مهام تصنيف صور الأشعة السينية للصدر
تتناول هذه الرسالة دراسة هشاشة نماذج التصوير الطبي أمام التهديدات الخصومية، مع تركيز خاص على هجمات تسميم البيانات في مهام تصنيف صور الأشعة السينية للصدر. يبدأ العمل بمراجعة منهجية للأدبيات لتقييم الهجمات والدفاعات الخصومية الموجودة في مجال التصوير الطبي، والتي كشفت عن فجوة بحثية كبيرة في الدراسات التي تستكشف هجمات تسميم البيانات في المجال الطبي. وبناءً على مراجعة الأدبيات، لم يتم التحقق من فعالية أسلوب دفاعي كفء وخفيف الوزن يُعرف باسم "الدفاع بالضوضاء الودية" ضد تسميم البيانات في مهام تصنيف الصور الطبية. ولذلك، قمنا في هذا العمل بدراسة فعاليته على مجموعة بيانات الأشعة السينية للصدر، وأظهرت النتائج انخفاضاً في دقة الاختبار عند تطبيقه على الصور الطبية، على الرغم من نجاحه في السيناريوهات العامة.
كما تقترح هذه الرسالة طريقة جديدة للكشف عن هجمات تسميم البيانات من خلال الاستفادة من منهج قائم على الذكاء الاصطناعي القابل للتفسير. يركز البحث بشكل خاص على دراسة تأثير هجمات تبديل التسميات على صور الأشعة السينية للصدر، ويقترح أسلوباً لاستخراج الخصائص يعتمد على الذكاء الاصطناعي القابل للتفسير للكشف عن التسميم. وعند تمثيل هذه الخصائص في فضاء ثلاثي الأبعاد، ظهر فصل واضح بين النماذج السليمة والمسمومة وبالاستناد إلى هذه النتائج، تمكن مصنِّف مدرّب على هذه الخصائص من التمييز بينهما بكفاءة، حيث حقق قيمة بلغت وتشير هذه النتائج إلى جدوى دمج استخراج الخصائص المعتمد على الذكاء الاصطناعي القابل للتفسير في 0.86 إطار الكشف عن هجمات تسميم البيانات، على أن يتم التحقق من صحة هذا النهج في أعمال مستقبلية باستخدام مجموعات بيانات أوسع وتحت سيناريوهات هجوم متنوعة.
Recommended Citation
Asgar, Akhila Abdulla, "DETECTING DATA POISONING ATTACKS IN MEDICAL IMAGING: A STUDY ON CHEST X-RAY CLASSIFICATION TASKS" (2025). Theses. 1421.
https://scholarworks.uaeu.ac.ae/all_theses/1421