付迎迎 林治 吳承鑫 薛金水 楊吉
摘要:高校課堂的出勤率一直是反映學(xué)校教學(xué)效果的一項重要指標,針對傳統(tǒng)考勤方式占用時間長、學(xué)生 代替考勤等問題,利用人工智能技術(shù),提出了包含目標檢測和人臉識別技術(shù)的深度學(xué)習(xí)輔助考勤系統(tǒng)。通 過教室內(nèi)的攝像頭設(shè)備捕獲的視頻流,跟蹤參加特定課程的學(xué)生,實現(xiàn)了技術(shù)化考勤,提高了上課效率, 從而實現(xiàn)教室管理的自動化、智能化。
關(guān)鍵詞:目標檢測;人臉識別;課堂;考勤
中圖分類號:TP391.41文獻標識碼:A
0 引言
學(xué)生出勤率對高校來說具有重要意義,其可以 督促每個學(xué)生的進步。傳統(tǒng)考勤常采取老師記名方 式,費時、費力、實施效果差。然而,隨著科技的 發(fā)展,有很多方法可以提高考勤效率,其中之一 就是人臉識別 [1]。人臉識別可以借助人臉數(shù)據(jù)庫從 視頻片段中識別某人面部,還可應(yīng)用于身份驗證 服務(wù)。
在科技飛速發(fā)展的時代,應(yīng)該充分將人臉識別 應(yīng)用于課堂考勤。人臉識別可以最大限度地減少考 勤時可能發(fā)生的欺詐行為,如缺勤和人為錯誤。因 此,人臉識別所運用的技術(shù)和實現(xiàn)手段非常適合大 學(xué)智慧化教學(xué)。通過合適的算法設(shè)計人臉識別系 統(tǒng),使考勤過程更加精確,避免出錯。
1 深度學(xué)習(xí)技術(shù)原理
1.1 目標檢測技術(shù)
計算機視覺研究中一項重要的任務(wù)是目標檢測 技術(shù),其根本目的是從攝像頭獲取外界信息,從 圖像中找到特殊的對象(目標)。該任務(wù)包括識別 圖像中物體的位置和邊界,并將物體分為不同的 類別 [2]。目標檢測技術(shù)與圖像分類和檢索一起構(gòu)成 了視覺識別的關(guān)鍵部分,現(xiàn)有技術(shù)方法可以分為 兩種主要類型:一是優(yōu)先考慮推理速度,模型包 括 YOLO、單次多目標檢測器(single shot multibox detector,SSD)和 RetinaNet 等;二是優(yōu)先考慮檢 測準確性,模型包括更快區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(faster region-based convolutional neural networks,F(xiàn)aster R-CNN)、掩膜區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(mask region-based convolutional neural networks,Mask R-CNN)和級聯(lián) 區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(cascade region-based convolutional neural networks,Cascade R-CNN)。
區(qū)域卷積神經(jīng)網(wǎng)絡(luò)方法(region-based convolutional neural networks,R-CNN)的提出開創(chuàng)了深度學(xué)習(xí) 技術(shù)運用到目標檢測任務(wù)中的先例,是利用深度學(xué) 習(xí)進行目標檢測的里程碑之作,對目標檢測技術(shù)的 發(fā)展起到了促進作用。R-CNN 是將待檢測圖像預(yù) 先劃分出目標候選區(qū)域,然后只檢測這些候選區(qū) 域,不必再滑動固定窗口對整幅圖像進行檢測,減 少了計算量并提高了檢測率。
快 速 區(qū) 域 卷 積 神 經(jīng) 網(wǎng) 絡(luò)(fast region-based convolutional neural networks,F(xiàn)ast R-CNN)的主 要創(chuàng)新是感興趣區(qū)域池化層,池化層可將不同大小 候選框的卷積特征圖統(tǒng)一采樣成固定大小的特征。 Fast R-CNN 主要解決訓(xùn)練階段步驟多以及耗費大量 的時間和資源等問題。該模型可將原有的特征提取 和分類操作進行合并,從輸入圖像到得出結(jié)果,全 部在一個網(wǎng)絡(luò)中完成。
2015 年,隨著 YOLO 算法的出現(xiàn),深度學(xué)習(xí) 目標檢測算法也發(fā)生了一定的改變。相較于早期的 算法,YOLO 算法直接在同一個卷積神經(jīng)網(wǎng)絡(luò)中完 成感興趣特征向量的提取,得到分類結(jié)果,從而簡 化了檢測模型的結(jié)構(gòu),去除一些不必要的計算使檢 測時間大大縮短 [3]。結(jié)合計算機運算能力,這種算 法使得實時檢測目標變?yōu)榭赡堋OLO 算法改變了 之前檢測算法的滑動窗口方式,將目標檢測視為一 個回歸問題,檢測網(wǎng)絡(luò)的輸出可直接給出目標的具 體信息。YOLO 算法檢測網(wǎng)絡(luò)在開始時將輸入的待 檢圖像分割成 S×S(S 為尺寸)大小的網(wǎng)格,每個 網(wǎng)格負責(zé)檢測各自的區(qū)域,看是否有物體的中心點 落在了網(wǎng)格內(nèi)。若單元格內(nèi)有目標的區(qū)域信息,就 由這個單元格負責(zé)檢出。
每個單元格會預(yù)測多個邊界框,每個邊界框包 含了目標坐標 x 和 y、邊界框?qū)挾?w、邊界框高度 h 和置信度等 5 個有效值。其中,置信度包含了這個 邊界框是否有目標以及準確度,置信度計算公式為:
1.2 人臉識別技術(shù)
人臉識別的任務(wù)是根據(jù)預(yù)先存在的臉部特征數(shù) 據(jù)庫對照片或視頻圖像中出現(xiàn)的人臉進行比對識 別。從圖像檢索開始,人臉識別對圖像出現(xiàn)的物體 進行檢測,區(qū)分人臉和其他物體,然后將檢測到的 人臉和數(shù)據(jù)庫進行比對識別。
由于低成本相機和計算能力的可用性,研究人 員一直從多個角度研究人臉識別問題。生物學(xué)特征 則被用來確定識別對象的身份信息。有效和高效的 人臉識別系統(tǒng)很大程度上依賴于特征提取和分類過 程 [4]。目前多種人臉識別算法已被開發(fā)。
人臉識別是基于圖像辨別個體的一項技術(shù)。這 項技術(shù)被應(yīng)用于許多領(lǐng)域,包括生物識別、安全信 息、進入控制區(qū)域、執(zhí)法、智能卡和監(jiān)視。人臉識 別系統(tǒng)可以分為兩個階段:第一階段是面部特征的 挑選或提??;第二階段涉及模式的特征分類。綜 上,特征的提取和特征的分類是開發(fā)人臉識別系統(tǒng) 的兩個最關(guān)鍵過程。自深度神經(jīng)網(wǎng)絡(luò)問世以來,卷 積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)在目標檢測的各個領(lǐng)域都表現(xiàn)出色,一度成為研究 人員熱衷的人臉識別方法。由于能夠從輸入數(shù)據(jù)中 學(xué)習(xí)復(fù)雜的模式,深度學(xué)習(xí)特別是 CNN,近年來 在神經(jīng)網(wǎng)絡(luò)技術(shù)方面取得了很大的進步 [5]。
2 系統(tǒng)功能設(shè)計
本文依托高校智慧校園建設(shè),面部識別比對數(shù) 據(jù)庫采用的是學(xué)生錄取報到時采集的數(shù)據(jù)。課堂考 勤管理系統(tǒng)設(shè)計框圖如圖 2 所示。
2.1 目標檢測模塊
目標檢測模塊主要對課堂人數(shù)進行在線監(jiān)控, 考慮到課堂攝像頭安裝位置以及遮擋物的影響,學(xué) 生人群暴露在視角下只有上半身或是更少部分,這 對檢測提出了更高的要求。因此,本系統(tǒng)選用了 YOLOv5 算法。
YOLOv5 算法在整體結(jié)構(gòu)框架上并沒有大的改 動,主要是在圖像輸入時增加了 Mosaic 數(shù)據(jù)增強 算法、自適應(yīng)錨框計算、自適應(yīng)圖片縮放等功能。 這些功能使 YOLOv5 算法在檢測精度和速率上都有 了一定的提升,有利于從圖像中發(fā)現(xiàn)目標,從而提 高檢出率。
2.2 人臉識別模塊
人臉識別模塊是根據(jù)教室內(nèi)攝像頭產(chǎn)生的視頻 流提取學(xué)生人臉特征,并進行檢測和對比。一般課 堂考勤都是在課前幾分鐘內(nèi)進行,該模塊可以由教 室自主控制,也可以設(shè)置為在某個時間段抓拍識別。 由于大多數(shù)教室攝像頭安裝位置在教室頂部, 導(dǎo)致學(xué)生臉部數(shù)據(jù)不清晰,且相較于正常圖像,在 視野內(nèi)人臉占據(jù)感興趣區(qū)域偏小,不易識別。本系 統(tǒng)采用的是 FaceNet 人臉識別算法。該算法發(fā)表于 2015 年,其直接利用深度學(xué)習(xí)網(wǎng)絡(luò)描述人臉的歐式 空間中的點的映射向量,通過對比計算特征向量間的歐式空間中點的距離,判斷人臉的相似度 [6]。
2.3 數(shù)據(jù)管理模塊
數(shù)據(jù)管理模塊主要是對考勤數(shù)據(jù)進行統(tǒng)一管 理,便于教師和管理人員下載統(tǒng)計數(shù)據(jù),包括人臉 識別打卡簽到數(shù)據(jù)和課堂在線人數(shù)統(tǒng)計。
3 結(jié)語
本文設(shè)計了基于目標檢測與人臉識別相結(jié)合的 課堂考勤系統(tǒng),通過智能化手段將目標實時檢測和 人臉識別算法運用到高校課堂管理中,實現(xiàn)了由傳 統(tǒng)考勤方式轉(zhuǎn)為智能化考勤新模式。該系統(tǒng)減少了 教師工作量,有利于課堂教學(xué)數(shù)據(jù)數(shù)字化管理,為 進一步建設(shè)智慧校園拓寬了新思路。
參考文獻
[1] 唐琳 . 基于人臉識別技術(shù)的學(xué)生課堂考勤管理系統(tǒng)的 設(shè)計與實現(xiàn) [J]. 數(shù)字技術(shù)與應(yīng)用,2023,41(9): 208-210.
[2] 黃繼梅 . 基于人臉識別的課堂考勤系統(tǒng)研究與實現(xiàn) [J]. 科學(xué)技術(shù)創(chuàng)新,2021(17):100-101.
[3] REDMON J,DIVVALA S,GIRSHICK R,et al. You only look once:unified,real-time object detection[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition(CVPR). Las Vegas,NV:IEEE,2016:779-788.
[4] 董亞蕾,張師寧,武旭聰 . 基于小人臉識別的高校課 堂考勤系統(tǒng)研究 [J]. 現(xiàn)代信息科技,2023,7(12): 62-65.
[5] 李春梅,張揚,陳靜雪,等 . 人臉識別與高校學(xué)生考 勤系統(tǒng) [J]. 科技視界,2022(28):25-27.
[6] SCHROFF F,KALENICHENKO D,PHILBIN J. FaceNet:a unified embedding for face recognition and clustering[C]//2015 IEEE Conference on Computer Vision and Pattern Recognition(CVPR). Boston,MA:IEEE, 2015:815-823.