Date of Award

5-2025

Document Type

Thesis

Degree Name

Master of Science in Engineering (MSE)

Department

Electrical and Communication Engineering

First Advisor

Nabil Albastaki

Abstract

Automatic detection of ocular diseases helps medical professionals efficiently identify eye disorders, reduce diagnostic errors, and accelerate diagnoses to prevent blindness. Deep learning has been successfully utilized in various fields, including medical image classification. However, in spite of these advancements, challenges remain in ocular disease classification.

The objective of this work is to address these challenges using data processing, data augmentation in combination with Region of Interest (ROI) techniques. Medical datasets often suffer from scarcity, imbalance, and low-quality images, leading to inaccurate classification. To mitigate these issues, we utilize the ODIR dataset, which contains 7,000 labelled training images for both left and right eyes, and propose a data augmentation method using a Generative Adversarial Networks (GANs) algorithm. This method aims to augment and balance the fundus images across eight different categories of ocular diseases, including normal fundus images. The generated images were then used to train transfer learning models, with 3,000 generated images per category. The data was split into 80% (2,400) for training, 10% (300) for testing, and 10% (300) for validation.

Using only generated images, the testing accuracy of a transfer learning model – Inception V3 – after training for 25 epochs, improved significantly to about 95% for eight eye disease categories. We further trained the filtered and separated ocular disease images using an unsupervised model – StyleGAN – for 160 to 260 iterations. A portion of the 2,400 generated images was then used to train transfer learning models to avoid overfitting and enhance accuracy. Additionally, we applied ROI and post-processing techniques to enhance the images. Using only real images for the binary glaucoma test resulted in an improvement of approximately 10% compared to unmodified images which achieved only 72% testing accuracy.

We have demonstrated that augmenting medical datasets with GANs, combined with the use of appropriate ROI techniques tailored to the characteristics of two categories of eye diseases, significantly improves classification accuracy. This comprehensive study includes numerous experiments using ocular disease images, ranging from imbalanced, unmodified, non-augmented data to balanced, augmented, and edited data. The study employs multi-approach methods with a standard benchmark, using only real, unadjusted images as testing data, and hence highlighting the challenges and uniqueness of this work.

Arabic Abstract


دراسة تأثير الموازنة بين المجموعات، وزيادة عدد البيانات باستخدام التحويل الهندسي، والشبكات التوليدية، وتقنيات منطقة الاهتمام على تصنيف أمراض العيون

يساعد الكشف التلقائي عن أمراض العيون الأطباء المتخصصين على تحديد اضطرابات العين بكفاءة، وتقليل الأخطاء التشخيصية، وتسريع التشخيص للوقاية من العمى في الوقت المناسب. وقد تم استخدام تقنيات التعلم العميق بنجاح في مجالات مختلفة، بما في ذلك تصنيف الصور الطبية بناء على نوع المرض وشدته. ومع ذلك، وعلى الرغم من هذه التطورات لا تزال هناك تحديات في تصنيف أمراض العين. يهدف هذا العمل إلى معالجة هذه التحديات باستخدام زيادة عدد البيانات جنبًا إلى جنب مع تقنيات منطقة الاهتمام (ROI). غالبًا ما تعاني مجموعات البيانات الطبية من قلة عدد البيانات وعدم التوازن بين مجموعاتها وانخفاض جودة الصور، مما يؤدي إلى تصنيف غير دقيق. لتقليل هذه المشكلات، نستخدم في هذه الدراسة مجموعة بيانات أمراض العيون المتاحة ODIR، التي تحتوي على 7,000 صورة تدريبية مصنفة لكل من العينين اليسرى واليمنى، ونقترح طريقة لزيادة البيانات باستخدام خوارزمية الشبكات التوليدية التنافسية (GANs). تهدف هذه الطريقة إلى زيادة عدد الصور والموازنة بين مجموعات صور قاع العين لثماني فئات مختلفة من أمراض العيون، بما في ذلك صور قاع العين الطبيعية. ثم تم استخدام الصور المولدة لتدريب نماذج التعلم الانتقالي، مع 3,000 صورة مولدة لكل فئة. قسمت البيانات إلى 80% (2400) للتدريب، و10% (300) للاختبار، و10% (300) للتحقق.

باستخدام الصور المولدة فقط، تحسنت دقة اختبار نموذج التعلم الانتقالي - Inception V3 - بعد التدريب لمدة 25 حقبة بشكل ملحوظ إلى حوالي 95% لثماني فئات من أمراض العيون. كما دربنا صور أمراض العيون المختارة والمقسمة حسب المجموعة باستخدام نموذج التعلم الغير الخاضع للإشراف – StyleGAN - لمدة 160 إلى 260 تكرارًا. ثم استخدم جزء من الصور المولدة البالغ عددها 2400 صورة لتدريب نماذج التعلم الانتقالي لتجنب مشكلة الإفراط في التدريب ولتحسين الدقة. بالإضافة إلى ذلك، طبقنا تقنيات منطقة الاهتمام ROI وما بعد المعالجة لتحسين الصور. وقد أدى استخدام الصور الحقيقية فقط لاختبار الجلوكوما إلى تحسن بنسبة تقارب 10% مقارنة بالصور غير المُعدَّلة التي حققت دقة اختبار وصلت إلى حوالي 72% فقط.

لقد أثبتنا أن تعديل مجموعات البيانات الطبية باستخدام شبكات GAN، إلى جانب استخدام تقنيات ROI المناسبة والمصممة خصيصا لخصائص فئتين من أمراض العيون، يُحسن دقة التصنيف بشكل ملحوظ.

تتضمن هذه الدراسة الشاملة تجارب عديدة باستخدام صور لأمراض العيون، تتراوح بين بيانات غير متوازنة وغير معدلة وغير معززة، وبيانات متوازنة ومعززة ومحررة. تعتمد الدراسة على منهجية متعددة المناهج مع معيار مهم باستخدام صور حقيقية غير معدلة فقط كبيانات اختبار، مما يُبرز تحديات هذا العمل وتميزه.

COinS