Date of Award

6-2022

Document Type

Thesis

Degree Name

Master of Science in Electrical Engineering (MSEE)

Department

Electrical and Communication Engineering

First Advisor

Qurban A Memon

Abstract

Mountain recreation is becoming more popular with mountaineering, rock climbing, skiing, mountain biking, hiking, and mushroom picking among the most popular sports. Despite this tendency, there is currently limited research available explaining the rise in search and rescue (SAR), as well as the injuries and illnesses that entail SAR aid in tourist-friendly mountain and desert areas. The objective of a search and rescue operation is to scan the farthest area feasible in the shortest amount of time in order to locate a lost or wounded individual. In the past decade, several new and spectacular uses for drones, including search and rescue, surveillance, traffic monitoring, and weather monitoring, have been created and deployed. Current advancements in drone technology have resulted in major modifications that enable drones to conduct a vast array of tasks with an increasing degree of complexity. Missions such as search and rescue and forest surveillance need a vast camera coverage, making drones an ideal tool for performing complex tasks. Meantime, the rising prevalence of deep learning applications in computer vision offers exceptional insight into these research areas. In search and rescue operations, the main object is the human being; however, recordings from a bird's eye perspective are not embedded or incorporated in the large datasets that are used to train these cutting-edge detectors. To attain the best potential detection accuracy of the model, the dataset, which is to be employed for training, should contain conditions comparable to those that are encountered where model is to be tested. Hence, it is required to train the model with data, which is obtained using a bird's eye perspective. A recent dataset (SARD) has been used to detect a person's presence in mountain spots. The research conducted in this work proposes a method for identifying the presence of human's mountain setting utilizing an algorithm for human detection with a deep learning framework. Even if the individual is partially veiled, a trained deep learning system can recognize from a variety of perspectives. Existing well-known detectors such as YOLO-v4, RetinaNet, Faster R-CNN, and Cascade R-CNN have been investigated in previous research on various datasets to simulate rescue scenes. Although those algorithms achieve good recall, the other recent detector such as YOLO-v5 may be investigated for comparative performance. Thus, in this research, YOLO-v5 is trained on SARD dataset to validate its speed and accuracy, as well as the small number of false detections. It turns out that it achieves the highest mean average accuracy of 96.9% compared with other detectors. Experimental results using YOLO-v5 conducted on SARD dataset are presented for comparison.

Arabic Abstract


استخدام الشبكات العصبية للكشف عن الاشخاص في عمليات البحث والإنقاذ

أصبح الترفيه الجبلي أكثر شيوعًا، حيث أصبح تسلق الجبال وتسلق الصخور والتزلج وركوب الدراجات في الجبال والمشي لمسافات طويلة وقطف الفطر من بين أكثر الرياضات شعبية. على الرغم من هذا الاتجاه، إلا أن هناك أبحاثًا محدودة متاحة حاليًا تشرح الزيادة في عمليات البحث والإنقاذ (SAR)، فضلاً عن الإصابات والأمراض التي تنطوي على مساعدة البحث والإنقاذ في المناطق الجبلية والصحراوية الصديقة للسياح. الهدف من عملية البحث والإنقاذ هو البحث في أبعد منطقة ممكنة في أقصر فترة زمنية لتحديد مكان الشخص المفقود أو المصاب. في العقد الماضي ، تم إنشاء ونشر العديد من الاستخدامات الجديدة والمذهلة للطائرات بدون طيار ، بما في ذلك البحث والإنقاذ والمراقبة ومراقبة حركة المرور ومراقبة الطقس. أدت التطورات الحالية في تكنولوجيا الطائرات بدون طيار إلى تعديلات كبيرة تمكن الطائرات بدون طيار من إجراء مجموعة واسعة من المهام بدرجة متزايدة من التعقيد. تحتاج المهام مثل البحث والإنقاذ ومراقبة الغابات إلى تغطية واسعة للكاميرا، مما يجعل الطائرات بدون طيار أداة مثالية لأداء المهام المعقدة . في غضون ذلك، يوفر الانتشار المتزايد لتطبيقات التعلم العميق في رؤية الكمبيوتر نظرة ثاقبة استثنائية في مجالات البحث هذه. في عمليات البحث والإنقاذ، يكون الكائن الأساسي هو الشخص؛ ومع ذلك، لا يتم تضمين التسجيلات من منظور عين الطائر في مجموعات البيانات الكبيرة المستخدمة لتدريب هذه الكواشف المتطورة. لتحقيق أفضل دقة محتملة لنموذج الكشف، يجب أن تحتوي مجموعة البيانات التي يتم تدريب النموذج عليها على شروط مماثلة لتلك التي تمت مواجهتها أثناء اختبار النموذج. وبالتالي، من الضروري تدريب النموذج بالبيانات التي تم الحصول عليها من منظور عين الطائر. تم استخدام مجموعة بيانات حديثة (SARD) لاكتشاف وجود شخص في المناطق الجبلية. يقترح البحث الذي تم إجراؤه في هذا العمل طريقة لتحديد وجود بيئة جبلية للإنسان باستخدام خوارزمية لاكتشاف الكائن البشري وإطار عمل التعلم العميق. حتى لو كان الفرد محجباً جزئياً، يمكن لنظام التعلم العميق المدرب التعرف من مجموعة متنوعة من وجهات النظر. تم فحص أحدث أجهزة الكشف الحالية مثل Faster R-CNN و YOLO-v4و RetinaNetو Cascade R-CNN في بحث سابق على مجموعات بيانات مختلفة لمحاكاة مشاهد الإنقاذ. على الرغم من أن هذه الخوارزميات تحقق استرجاعًا جيدًا، إلا أنه قد يتم فحص الكاشف الحديث الآخر مثل YOLO-v5 من أجل الأداء المقارن. وبالتالي، تم تدريب YOLO-v5 على مجموعة بيانات الزراعة والتنمية الريفية المستدامتين في هذا البحث للتحقق من سرعته ودقته، بالإضافة إلى العدد الصغير من الاكتشافات الخاطئة. اتضح أنها تحقق أعلى متوسط دقة متوسط 96.9 ٪ مقارنة بأجهزة الكشف الأخرى. تم عرض النتائج التجريبية باستخدام YOLO-v5 التي أجريت على مجموعة SARD للمقارنة .

COinS