شريط الأخبار

تطوير نظام لكشف الأشخاص وملاحقتهم باستخدام مصفوفة البوابات المنطقية القابلة للبرمجة في الزمن الحقيقي

اسم الباحث:

المهندس أحمد إبراهيم عمران

اسم المشرف:

الدكتور المهندس بسيم عمران

العنوان:

تطوير نظام لكشف الأشخاص وملاحقتهم باستخدام مصفوفة البوابات المنطقية القابلة للبرمجة في الزمن الحقيقي

العنوان باللغة الإنكليزية:

Development of People Detection and Tracking System

Based on Field Programmable Gate Array in the Real Time 

العام:2024

القسم:هندسة التحكم الآلي والحواسيب

الملخص:

تُستخدم تقنية الرؤية الحاسوبية للتعرف على الأشخاص وهي أحد أهم وظائف المركبات ذاتية القيادة من أجل اكتشاف حركة الأشخاص ضمن المسارات المخصصة لها، كذلك منع الحوادث وتجنب المركبات المتحركة والعقبات. وكذلك المجالات الأمنية حيث من المهم التعرف على الجاني ومطاردته ضمن حشد من الناس بسرعة وكفاءة عالية تكون مناسبة للتطبيقات المحمولة ضمن الزمن الحقيقي. تُستخدم الشبكة العصبونية الالتفافية Convolution Neural Network CNN من أجل تصميم خوارزميات تؤدي هذه المهمة بدقة عالية. تُعتبر عائلة You Only Look Once (YOLO) من اهم الخوارزميات في وقتنا الحالي التي تُستخدم لمهام التعرف والتي تحقق أداءً جيداً من حيث الدقة، ولكن النماذج ذات الدقة العالية تملك عدداً كبيراً من عمليات فاصلة عائمة في الثانية Floating-point Operations per Seconds FLOPS وحجم نموذج كبير نسبياً لا يناسب التطبيقات المحمولة.

في هذا البحث تم تعديل نموذج YOLOv4 الأساسي كونه نموذج يعمل بكفاءة عالية، ولكنه يعاني من زيادة عدد عمليات الفاصلة العائمة وحجم نموذج كبير، لمعالجة هذه المشكلة تم الاستفادة من ميزات نموذج Efficientnet-B0 لتخفيض حجم النموذج مع إجراء مجموعة من التعديلات عليه، وتم استخدام شبكة Cross Stage Partial (CSP) بعد تعديلها من أجل زيادة الدقة. تم بناء خوارزمية CspEffv2Yolo لتحقيق الهدف المطلوب، وتم تدريبها باستخدام قاعدة بيانات Google Images ومن ثم اختبارها والحصول على النتائج، ومقارنتها مع النتائج المماثلة لنموذج YOLOv4 الأساسي، وكانت النتائج النهائية جيدة.

تمت عملية التصميم من خلال برنامج Vivado HLS 2019.1 لكل طبقة عصبونية على حدى، ومقارنة صحة عملها من خلال مقارنتها مع نتائج تنفيذ Microsoft visual studio 2015، بالإضافة إلى Vivado 2019.1 لمحاكاة النموذج ضمن شريحة FPGA، وحساب الموارد المستخدمة للنموذج وكذلك استهلاك الطاقة.

كلمات مفتاحية:

الرؤية الحاسوبية، التعرف على الأشخاص، الشبكة العصبونية الالتفافية.

تحميل البحث