Date of Award

11-2023

Document Type

Dissertation

Degree Name

Doctor of Philosophy in Informatics and Computing

Department

Computer Science and Software Engineering

First Advisor

Dr. Mohamed Adel Serhani

Second Advisor

Dr. Hadeel El-Kassabi

Abstract

Smart and Connected Health (SCH) is revolutionizing healthcare by leveraging extensive healthcare data for precise, personalized medicine. At its core, SCH relies on the concept of patient similarity, which involves the comparative analysis of newly encountered patients with those who exhibit comparable similarities from the existing patient cohort. Yet, this approach faces significant challenges, including data heterogeneity and dimensionality. Our research introduces a multi-dimensional Patient Similarity Network (PSN) Fusion model tailored to handle both static and dynamic features. The static data analysis focuses on extracting contextual information using Bidirectional Encoder Representations from Transformers (BERT), while dynamic features are captured through neural networks and with Long-Short-Term Memory (LSTM) based autoencoders to reduce dimensionality while preserving temporal features. The key to our approach is the novel Similarity Network Fusion (SNF) scheme, that aggregates static and dynamic PSN similarity matrices. Compared to conventional classification methods, our deep learning-based PSN Fusion model demonstrates superior classification accuracy across various patient health outcomes. However, during our evaluation, we identified certain quality issues in the data that need to be addressed at each of the data value chain’s processes to maximize the PSN’s accuracy. Our Data Quality Management model introduces the data profiling concept to capture, enhance, and validate data quality at every stage of the PSN. We proposed Federated Data Quality Profiling (FDQP), inspired by Federated Learning, to extend the concept of quality profiling to the edge node, ensuring robust data quality assurance in distributed environments. It employs federated feature selection and lightweight profile exchange, to swiftly identify and rectify data discrepancies. Extensive experiments across edge nodes demonstrate the positive impact of FDQP on data quality and the accuracy of Federated Patient Similarity Network (FPSN) models. Finally, we proposed a hybrid resource-aware FPSN solution to effectively combine static and dynamic resource quality profiles with edge reputation data to improve edge node selection. This all-inclusive approach ensures improvements in convergence time, as well as efficient memory, network, and disk usage within FPSN models. In summary, our research integrates the PSN Fusion model, the Federated Data Quality Profiling model, and the Resource-Aware Federated Profiling model to offer a holistic solution. This approach promises transformative benefits by efficiently managing multi-dimensional heterogeneous health data, emphasizing data quality, and optimizing edge computing resources. Ultimately, the goal is to deliver an enhanced healthcare system that empowers healthcare practitioners with efficient and data-driven tools, leading to improved patient outcomes.

Arabic Abstract


شبكة تشابه المرضى متعددة النماذج مبتكرة تعتمد على جودة البيانات الموحدة وتوصيف الموارد

تُحدث الصحة الذكية والمتصلة (SCH) ثورة في مجال الرعاية الصحية من خلال الاستفادة من بيانات الرعاية الصحية الشاملة للحصول على علاج دقيق وشخصي. تعتمد SCHفي جوهرها على مفهوم تشابه المرضى، والذي يتضمن التحليل المقارن للمرضى الذين تم التعرف عليهم حديثًا مع أولئك الذين يظهرون تشابهات مماثلة من مجموعة المرضى الحالية. ومع ذلك، يواجه هذا النهج تحديات كبيرة، بما في ذلك عدم تجانس البيانات وأبعادها. يقدم بحثنا نموذجاً متعدد الأبعاد لشبكة تشابه المرضى (PSN) مصمماً للتعامل مع الميزات الثابتة والديناميكية. يركز تحليل البيانات الثابتة على استخراج المعلومات السياقية باستخدام تمثيلات التشفير ثنائية الاتجاه من المحولات (BERT)، في حين يتم التقاط الميزات الديناميكية من خلال الشبكات العصبية ومع أجهزة التشفير التلقائية المستندة إلى الذاكرة طويلة المدى (LSTM) لتقليل الأبعاد مع الحفاظ على الميزات الزمنية. إن مفتاح النهج الذي نتبعه هو مخطط دمج شبكة التشابه (SNF) الجديد، الذي يجمع مصفوفات تشابه PSN الثابتة والديناميكية. بالمقارنة مع طرق التصنيف التقليدية، يُظهر نموذج دمج شبكة تشابه المرضى (PSN Fusion) القائم على التعلم العميق دقة تصنيف فائقة عبر مختلف النتائج الصحية للمرضى. ومع ذلك، أثناء التقييم الذي أجريناه، حددنا بعض مشكلات الجودة في البيانات التي يجب معالجتها في كل عملية من عمليات سلسلة قيمة البيانات لتحقيق أقصى قدر من دقة PSN. يقدم نموذج إدارة جودة البيانات لدينا مفهوم ملفات تعريف البيانات لالتقاط جودة البيانات وتحسينها والتحقق من صحتها في كل مرحلة من مراحل PSN. لقد اقترحنا ملفات تعريف جودة البيانات الموحدة (FDQP)، المستوحاة من التعلم الموحد، لتوسيع مفهوم ملفات تعريف الجودة إلى محطات الحافة، مما يؤكد ضمان قوي لجودة البيانات في البيئات الموزعة. فهو يستخدم اختيارًا متحدًا للميزات وتبادلًا خفيفًا لملف التعريف، لتحديد وتصحيح تناقضات البيانات بسرعة. تُظهر التجارب المكثفة عبر محطات الحافة التأثير الإيجابي لـ FDQP على جودة البيانات ودقة نماذج شبكة تشابه المرضى الموحدة (FPSN). أخيرًا، اقترحنا حل FPSN مختلطًا مدركًا للموارد للجمع بشكل فعال بين ملفات تعريف جودة الموارد الثابتة والديناميكية وبيانات سمعة الحافة لتحسين اختيار محطات الحافة. يضمن هذا النهج الشامل إجراء تحسينات في وقت التقارب، بالإضافة إلى كفاءة استخدام الذاكرة والشبكة والقرص ضمن نماذج FPSN. في المجمل، يدمج بح ثنا نموذج اندماج شبكة تشابه المرضى، ونموذج إدارة جودة البيانات الموزعة، ونموذج الملف الشامل المدرك للموارد لتقديم حلاً شاملاً. هذا النهج يعد بفوائد محورية من خلال إدارة بيانات الصحة متعددة الأبعاد والمتنوعة، مع التركيز على جودة البيانات، وتحسين موارد الحوسبة على الحوسبة الطرفية. في نهاية المطاف، الهدف هو تقديم نظام صحي محسّن يمكّن ممارسي الرعاية الصحية بأدوات فعّالة مدعومة بالبيانات، مما يؤدي إلى تحسين نتائج المرضى.

Share

COinS