Date of Award

11-2023

Document Type

Thesis

Degree Name

Master of Science in Electrical Engineering (MSEE)

Department

Electrical and Communication Engineering

First Advisor

Dr. Qurban A Memon

Abstract

The advancement of computer vision, particularly in the domain of object tracking, involves the integration of conventional feature-based approaches with contemporary deep learning methodologies. The initial phase of object detection plays a fundamental role in generating prospective objects for further tracking, and its level of success has a direct influence on the overall effectiveness of the tracking process. Many of the methods used to generate candidate objects start with object detection, and then object tracking algorithms are developed to link the object instances together to create the trajectories.
The primary difficulties in object tracking pertain to the establishment of reliable data associations across consecutive frames. These challenges are particularly pronounced in scenarios involving surveillance and autonomous navigation. The challenges include factors like motion blur, variations in lighting, object size, diverse aerial views, and significant obstacles.
The integration of multithreading into the YOLOv5s detector, which has been trained on the VisDrone2019 dataset, results in a notable reduction in latency. The integrated methodology demonstrates superior performance compared to prior techniques, particularly on edge platforms like Nvidia Jetson AGX ORIN. It attains an F1 score of 93.31 for Intersection over Union (IOU) values greater than 0.5, while achieving a frame rate of 167.147 frames per second within a mere 0.0024 seconds.
The achievements made in this study establish a solid basis for future research, particularly in the areas of adaptive learning, usage of various datasets, and the development of specific tracking evaluation procedures.

Arabic Abstract


تتبع الكائنات في الوقت الفعلي باستخدام خوارزمیة یولو النسخة الخامسة والشبكة المتكررة على الأجھزة

یتضمن تقدم رؤیة الكمبیوتر، خاصة في مجال تتبع الكائنات والأجسام المتحركة، دمج الأسالیب التقلیدیة القائمة على المیزات مع منھجیات التعلم العمیق المعاصرة. یعد اكتشاف الاجسام وتتبع حركة الأھداف بالرؤیة الحاسوبیة مكوناً أساسیاً في العدید من التقنیات، وتلعب المرحلة الأولیة لاكتشاف الأجسام دورًا أساسیاً في تسھیل الاستمرار بتتبع الأجسام المحتملة، كما أن مستوى نجاحھا له تأثیر مباشر على الفعالیة والمنظومة الشاملة لعملیة التتبع. ھنالك العدید من الطرق المستخدمة لإنشاء أھداف مرشحة للاكتشاف ومن ثم تتطور الخوارمیات من مجرد اكتشاف إلى تتبع واستكشاف مسارات الاھداف.
تتعلق الصعوبات الأساسیة في تتبع الاھداف بإنشاء ارتباطات بیانات موثوقة عبر إطارات التسجیل المرئي المتتالیة. تظھر ھذه التحدیات بشكل خاص في السیناریوھات التي تتضمن المراقبة والملاحة الذاتیة وانظمة القیادة الذاتیة، عندما تكون ھناك عوامل مثل ضبابیة الحركة، والمناظر الجویة المتنوعة، وفقدان الأھداف وحجم الأجسام.
یؤدي دمج تقنیةّ مسارات التنفیذ المتعددّة في برمجیة YOLOv5s، الذي تم تدریبه على مجموعة بیانات VisDrone2019، إلى انخفاض ملحوظ في زمن انجاز البرمجیة وزیادة سرعتھا. تظُھر المنھجیة المتكاملة أداءً فائقاً مقارنة بالتقنیات والبرمجیات السابقة، خاصة على أجھزة الحافة المتطورة مثل Nvidia Jetson AGX ORIN. لقد حصلت برمجیتنا على 93.31 على مقیاس F1 وقیم التقاطع عبر الاتحاد (IOU) التي تزید عن 0.5، مع تحقیق معدل إطارات فیدیو یبلغ 167.147 إطارًا في الثانیة خلال 0.0024 ثانیة فقط.
ترسي الإنجازات التي تحققت في ھذه الدراسة أساسًا متیناً للبحث المستقبلي، لا سیما في مجالات التعلم التكیفي، واستخدام مجموعات البیانات المختلفة، وتطویر إجراءات تقییم تتبع محددة.

COinS