Date of Award
11-2025
Document Type
Thesis
Degree Name
Master of Science in Information Technology Management
Department
Information Systems and Security
First Advisor
Mohammad Mehedy Masud
Abstract
Federated Learning (FL) is a decentralized approach of machine learning on multiple clients jointly training models without sharing their raw data, which drastically improves privacy and enhance protection against security breach. This is particularly critical in the healthcare sector, where hospitals and medical institutions are often unable to exchange patient records due to strict privacy regulations and data-management policies. However, there is still a risk of privacy breach when clients send their model updates to the central server, because if a model update is intercepted or analyzed by a malicious entity, it could be used to recover sensitive data using inference attack. To address this issue, Homomorphic Encryption (HE) can be applied to protect against the interception, since the model updates remain encrypted during transmission as well as during aggregation. This is possible because Homomorphic Encryption allows computations to be performed directly on encrypted data without requiring decryption. In this research we propose an effective framework by integrating FL with HE. We focus on the encryption of model updates using HE prior to sending them to the central server. The server will perform aggregation on the encrypted updates using HE algorithms and send the encrypted aggregated model to the clients. Then the clients decrypt the aggregated model and again refine it using local data. After that, another cycle of model encryption, transmission to the central server and aggregation to the central server is conducted. Using this method, we intend to reduce the risk of leaking sensitive data and keep the efficiency of federated learning in an optimal level. The proposed privacy-preserving FL framework is evaluated on three healthcare-relevant datasets: Breast Cancer (Diagnostic), PIMA Diabetes, and MNIST handwritten digits. Experiments demonstrate that CKKS-based encrypted FL maintains accuracy close to plaintext training while incurring moderate computational overhead, whereas Paillier provides confidentiality but suffers from prohibitive runtime costs. Quantitative metrics including accuracy, precision, recall, and F1-score, along with runtime and model-size analysis, reveal a clear trade-off between privacy and efficiency. We expect this study to result in (i) a robust privacy-preserving FL framework that aligns with IT management best practices for efficient and secure data handling. (ii) significant improvement in the level of potential privacy vulnerabilities, and (iii) assessment of the trade-offs between improving performance and computational overhead vs. maintaining privacy. Overall, the results show that HE-enabled FL can provide a practical and secure solution for collaborative healthcare data analysis without exposing patient information, offering strong alignment with modern healthcare IT management and compliance requirements such as GDPR and HIPAA.
Arabic Abstract
تعزيز إدارة الرعاية الصحية من خلال التعلم الفيدرالي المتقدم لحماية الخصوصية باستخدام التشفير المتماثل
التعلم الفيدرالي هو أسلوب لامركزي في تعلم الآلة حيث يتم تدريب النماذج عبر عدة أجهزة دون الحاجة إلى مشاركة البيانات الأصلية، مما يعزز الخصوصية ويقلل من خطر التسريبات. وتكمن أهمية هذا الأسلوب بشكل خاص في قطاع الرعاية الصحية، حيث لا تستطيع المستشفيات والمؤسس ات الطبية تبادل سجلات المرضى بسبب القوانين الصارمة المتعلقة بالخصوصية وسياسات إدارة البيانات. ومع ذلك، عندما ترسل الأجهزة تحديثات النماذج إلى الخادم المركزي، قد تظهر مخاطر تتعلق بالخصوصية، لأن هذه التحديثات قد يتم اعتراضها أو تحليلها من قبل أطراف معادية، مما قد يؤدي إلى استنتاج معلومات حساسة عن البيانات الأصلية. لحل هذه المشكلة، يقدم التشفير المتماثل حلاً فعالاً، حيث يمكن إجراء العمليات الحسابية مباشرة على البيانات المشفرة دون الحاجة إلى فك تشفيرها، مما يضمن الحفاظ على السرية أثناء الإرسال وكذلك أثناء عملية التجميع في الخادم المركزي. في هذا البحث، نقترح إطار عمل فعال من خلال دمج التشفير المتماثل مع التعلم الفيدرالي لحماية الخصوصية. بشكل خاص، نركز على تشفير تحديثات النماذج قبل إرسالها إلى الخادم المركزي. يقوم الخادم باستقبال التحديثات المشفرة وتنفيذ عملية التجميع مباشرة على البيانات المشفرة، ثم إرسال النموذج المجمع والمشفر مرة أخرى إلى الأجهزة الطرفية. بعد ذلك، تقوم الأجهزة بفك تشفير النموذج المجمع ومتابعة تحسينه باستخدام بياناتها المحلية، لتبدأ دورة جديدة من التشفير، والإرسال، والتجميع. من خلال هذه الطريقة، نهدف إلى تقليل خطر تسريب البيانات الحساسة مع الحفاظ على كفاءة التعلم الفيدرالي عند مستوى مثالي. تم تقييم إطار العمل المقترح باستخدام ثلاث مجموعات بيانات مرتبطة بالمجال الصحي، وهي بيانات تشخيص سرطان الثدي، وبيانات مرض السكري، وبيانات الأرقام المكتوبة يدويًا. أظهرت النتائج التجريبية أن التعلم الفيدرالي المشفر باستخدام أحد مخططات التشفير التقريبية يحافظ على مستوى دقة قريب من التدريب غير المشفر مع تحمل عبء حسابي معتدل، في حين أن بعض مخططات التشفير الأخرى، رغم توفيرها مستوى عالٍ من السرية، تعاني من تكاليف زمنية مرتفعة جدًا. تم استخدام مجموعة من مؤشرات التقييم الكمية، بما في ذلك دقة التنبؤ، والاستدعاء، والدقة الإيجابية، ودرجة التوازن، بالإضافة إلى تحليل زمن التنفيذ وحجم النموذج، مما يوضح وجود توازن واضح بين مستوى الخصوصية والكفاءة الحسابية. نتوقع أن يؤدي هذا البحث إلى: أولاً، تطوير إطار عمل قوي للتعلم الفيدرالي المحافظ على الخصوصية يتماشى مع أفضل ممارسات إدارة تكنولوجيا المعلومات في التعامل الآمن والفعال مع البيانات. ثانيًا، تحسين كبير في مستوى الحماية ضد الثغرات المحتملة لانتهاك الخصوصية. ثالثًا، تقديم تقييم شامل للمفاضلة بين تحسين الأداء وزيادة العبء الحسابي مقابل الحفاظ على الخصوصية. وبشكل عام، تُظهر النتائج أن التعلم الفيدرالي المدعوم بالتشفير المتماثل يمكن أن يوفر حلاً عمليًا وآمنًا لتحليل بيانات الرعاية الصحية التعاونية دون الكشف عن معلومات المرضى، مع توافق قوي مع متطلبات الامتثال الحديثة لحماية البيانات والأنظمة الصحية.
Recommended Citation
Ali, Omar Abdulla, "ENHANCED PRIVACY PRESERVING HEALTHCARE DATA MANAGEMENT WITH FEDERATED LEARNING USING HOMOMORPHIC ENCRYPTION" (2025). Theses. 1420.
https://scholarworks.uaeu.ac.ae/all_theses/1420