شريط الأخبار

بناء نموذج تعلّم آلي لتحليل البيانات الضخمة في إنترنت الأشياء

اسم الباحث:

المهندس عمّار سهيل مقصود

اسم المشرف:

الدكتور المهندس ماهر عباس

العنوان:

بناء نموذج تعلّم آلي لتحليل البيانات الضخمة في

 إنترنت الأشياء

العنوان باللغة الإنكليزية:

Making a Machine Learning Model for Big Data Analysis in Internet of Things (IoT)

العام:2024

القسم:هندسة النظم والشبكات الحاسوبية

الملخص:

تزامناً مع النمو المتسارع لإنترنت الأشياء برزت تقنيات البيانات الضخمة كأدوات فعالة لتوفير المعرفة داخل مجالات إنترنت الأشياء لتحقيق أهداف المؤسسات المشغّلة لإنترنت الأشياء بشكل أفضل ودعم اتخاذ القرارات. على الرغم من أن مجال تحليل البيانات خضع بحد ذاته للبحث على نطاق واسع، إلا أن التباين بين مجالات انترنت الأشياء (مثل الرعاية الصحية والمدن الذكية والنقل وغيرها) أدى إلى عزل تطور طرق و مناهج البيانات الضخمة في كل مجال على حدى، دون الأخذ بالاعتبار وجود تشابه في التقنيات المستخدمة في تلك المجالات المختلفة أو أنها استخدمت تقنيات مختلفة. قد يؤدي  فهم الخصائص المشتركة وغير المشتركة  لمجالات إنترنت الأشياء إلى تعزيز تطور أبحاث تحليل البيانات الضخمة في إنترنت الأشياء، عبر إنشاء منصة عامة لتحديد أوجه التشابه والاختلاف في أبحاث البيانات الضخمة في مجالات انترنت الأشياء المختلفة، والانطلاق منها في بناء نموذج متقدم لتحليل البيانات الضخمة باستخدام التعلّم الآلي.

نقوم في هذا العمل بإجراء دراسة استقصائية حول تقنيات وأدوات البيانات الضخمة المطبقة في مجالات انترنت الأشياء المختلقة لتسهيل وتحفيز تبادل المعرفة عبر مجالات انترنت الأشياء. يناقش هذا البحث أوجه التشابه والاختلاف بين تقنيات البيانات الضخمة المستخدمة في مجالات انترنت الأشياء المختلفة، ويستعرض إيجابيات وسلبيات تقنيات البيانات الضخمة المطبقة في مجالات إنترنت الأشياء المدروسة عبر المراحل الأساسية في دورة حياة البيانات الضخمة (استيعاب البيانات الضخمة، تخزين البيانات الضخمة، معالجة البيانات الضخمة وتحليلها).

في إطار تعزيز تطبيق التعلّم الآلي في تحليل البيانات الضخمة الواردة من مصادر متعددة يقترح البحث نموذجاً يوظّف بنية المشفر التلقائي Auto Encoder  في  عملية استخلاص السّمات الأغنى والأكثر تمثيلاً من بيانات المصادر ذات الأبعاد الكبيرة، كي تصبح مساوية لأبعاد المصادر الأخرى المشاركة في عملية التعلّم وذلك بهدف إتاحة إمكانية استخدام تقنية دمج البيانات Cross Attention المتفوقة والتي تفترض تساوي أبعاد مصادر البيانات الضخمة، حيث حقق النموذج المقترح دقة أعلى بمقدار (.52%) في تطبيق التعرف على النشاط البشري Human Activity Recognition باستخدام مجموعة البيانات UTD_MHAD. كما يقترح البحث نموذجاً إضافياً يستخدم التعلّم الآلي لتحليل البيانات الضخمة باستخدام بنية Lambda،  يوفر النموذج المقترح الثاني زيادة في دقة نموذج تحليل البيانات الضخمة في الطبقة الدفعية من بنية Lambda عبر استخدام طريقة Differencing، كما يحقق النموذج المقترح في طبقة السرعة آلية جديدة للتدريب في الزمن شبه حقيقي near-RealTime Learning  مما يوفر التحرر من أزمنة انتظار مواعيد تدريب النماذج الدفعية المجدولة مسبقاً (من ساعات إلى أيام) والتي تبدأ في التدريب من الصفر في كل مرة، حيث تتيح عملية الاستمرار في التدريب في الزمن شبه الحقيقي في طبقة السرعة زيادة دقة النموذج من جهة والاستجابة للتغيرات الإحصائية في البيانات الضخمة الواردة على شكل سلاسل زمنية في بيئة انترنت الأشياء من جهة أخرى.

الكلمات المفتاحية: البيانات الضخمة، إنترنت الأشياء، تحليل البيانات، التعلّم العميق، المشفر التلقائي، المحوّل، الشبكة طويلة قصيرة الأمد.

تحميل البحث