التصحيح الآلي لأوراق الإجابة متعددة الخيارات باستخدام خوارزميات التعرف الضوئي المعتمدة على الذكاء الصنعي

اسم الباحث:

المهندس: محمد أحمد علي

اسم المشرف:الدكتورة: أليدا اسبر-الدكتور: سهيل الحمود.

العنوان:

التصحيح الآلي لأوراق الإجابة متعددة الخيارات باستخدام خوارزميات التعرف الضوئي المعتمدة على الذكاء الصنعي

العنوان باللغة الإنكليزية:

Automated Assessment of Multiple-Choice Answer Sheets Using Optical Recognition Algorithms Based on Artificial Intelligence

العام:2025

القسم:هندسة البرمجيات ونظم المعلومات

الملخص:

تقدّم الأطروحة إطاراً ذكياً ومتكاملاً لمعالجة وتصحيح أوراق الإجابة متعدّدة الخيارات باستخدام التعرف الآلي على العلامات (OMR) في ظروف واقعيّة متباينة باستخدام تقنيّات الذّكاء الاصطناعي ومعالجة الصّور. تضمّن العمل البحثي إنشاء مجموعة بيانات تغطي سيناريوهات واقعيّة في جامعة حمص تضم 9400 ورقة (مصورة بماسحات ضوئية وكاميرات) لضمان التنوع في مصادر الصّور وأنماط الطباعة والتّظليل، يتم تدريب نماذج الذكاء الاصطناعي على 300 صورة منها مُسمّاة باستخدام نهج تسمية ثنائي المراحل يجمع بين التسمية اليدوية والتسمية شبه الآليّة عبر أداة Label Studio لضمان جودة البيانات المسماة. تشمل هذه المنهجية استخدام نموذج YOLO-v11-m لاكتشاف العناصر البنيوية ضمن الورقة مثل صندوق نموذج الاختبار وصندوق رقم الطالب والمعالم العمودية والمعالم الأفقية (h_marker، v_marker، student_info_box، test_form_box) ونموذج SegFormer لتجزئة صناديق الإجابة (answer_box)، يلي ذلك استخدام الإسقاط الأفقي ثم DBSCAN لاستخراج الفقاعات وبناء مُصنِّف هجين (CNN+Transformer) لتصنيف فقاعات الإجابة (18000 فقاعة) حسب ثلاث فئات (مملوءة، مشطوبة، فارغة).

أظهرت التّجارب العمليّة فعالية النّظام المقترح في معالجة أوراق الإجابة بكفاءة عالية (باستخدام عتبات تقييم صارمة: IoU ≥ 0.75، confidence ≥ 0.3) وتحقيق كفاءة متقدّمة في اكتشاف وتصنيف الفقاعات، حيث حقق النموذج YOLO-v11-m نتائج أداء (Precision = 100.00%) و(Recall = 99.91%) و(mAP@0.5 = 99.50%) و(mAP@0.5:0.95 = 93.64%) وحقق نموذج SegFormer (Accuracy = 99.77%) و(IoU = 99.31%)، وسجّل المُصنِّف الهجين (Accuracy = 99.96%) (خطأ واحد فقط من 2,700 عيّنة اختبار). تستغرق عملية المعالجة الزمنية لورقة تحتوي على 100 سؤال (0.43 ثانية للورقة)، وورقة فيها 50 سؤالاً (0.31 ثانية للورقة) تشمل جميع المراحل من الكشف حتى التصنيف. وبحسب علمنا، يتميز هذا العمل عن الاعمال الحديثة في هذا المجال أنه تناول كشف العناصر البنيوية + التقسيم الدلالي لصناديق الإجابة + تصنيفاً ثلاثياً (مملوءة/فارغة/مشطوبة) على بيانات واقعية متعدّدة الظروف. تقتصر النتائج حالياً على قوالب الجامعات السورية المتطابقة مع نموذج جامعة حمص، مع خطط للتعميم لاحقاً إلى قوالب وبيئات تصوير أكثر تنوّعاً.

الكلمات المفتاحية: التعرّف الآلي على العلامات (OMR)، أوراق الإجابة متعددة الخيارات، كشف الأشياء، التقسيم الدلالي، التعلم العميق، الرؤية الحاسوبية (Computer Vision)، معالجة الصّورة، تسمية البيانات (Data Labeling)، تصنيف الفقاعات (Bubble Classification)، الشبكات العصبيّة، CNN، DBSCAN، YOLO، SegFormer، Transformers

تحميل البحث