沈開榮,張根源,吳飛龍
(1.浙江廣播電視傳輸發(fā)射中心,浙江杭州,310005;2.浙江傳媒學院電子信息學院,浙江杭州,310018;3.浙江大學儀器科學與工程學系,浙江杭州,310027)
?
基于人臉識別的校車考勤系統(tǒng)設計
沈開榮1,張根源2,吳飛龍3
(1.浙江廣播電視傳輸發(fā)射中心,浙江杭州,310005;2.浙江傳媒學院電子信息學院,浙江杭州,310018;3.浙江大學儀器科學與工程學系,浙江杭州,310027)
摘要:本文介紹了基于人臉識別的校車考勤系統(tǒng)設計思路,并對關鍵的人臉檢測與人臉識別算法進行了深入的分析與設計,最終結果表明該系統(tǒng)設計達到了實際使用要求。
關鍵詞:人臉檢測;人臉識別;校車;考勤
近年來,各地校車重大安全事故層出不窮,校車的安全管理成為了制約校車推廣的一個主要因素,采用人臉識別的校車考勤系統(tǒng)也應運而生。
人臉識別是一種基于人的面部圖像信息進行身份識別的方法。通過攝像頭獲得含有人臉的圖片或者視頻,在圖像中搜索和追蹤人臉,并對人臉圖片進行一系列的處理,最終識別不同人的身份信息。
相對于傳統(tǒng)RFID識別的考勤系統(tǒng),人臉識別的校車考勤具有方便快捷與安全性高的特點,不存在代刷卡的情況,且在上車的過程中就可以快速的完成檢測,同時人臉識別的方法可以有效的檢測出未注冊的上車乘客,及時的記錄乘客的信息,方便以后查詢,安全性更高。
近些年隨著深度學習技術的興起,人臉識別的一些技術問題也得到了較好的解決,比如之前的人臉識別算法對于光照的敏感性較強,而基于深度學習的人臉識別算法較好的解決了這一問題,其識別率較高,適應性強,可以完成乘客考勤的任務。
人臉識別的算法流程圖如圖1所示,首先由攝像頭采集到人臉圖像,然后通過人臉檢測算法定位人臉,之后對人臉進行特征提取,不過一般在特征提取之前會做一些復雜的預處理過程,其中常用的一項預處理方式就是人臉對齊,最后使用提取到的特征與數(shù)據(jù)庫中的人臉特征做比對,并輸出識別的結果。
人臉識別算法的第一步是人臉檢測,人臉檢測指的是在任意一幅給定的圖像中使用一定的搜索方法找出其中存在的人臉,并返回人臉的位置大小等信息。
人臉在空間中不僅存在剛性變換,而且還會因為表情等各種原因存在較大的非剛性變換,所以僅僅是采集到人臉位置是不足以完成高精度的人臉識別。接下來要進行人臉對齊,也就是通過算法求出人臉特征點的位置,方便后續(xù)的人臉識別。
最后進行的是人臉識別,將要檢測的人臉和數(shù)據(jù)庫中的人臉一一比對相似度,如果在數(shù)據(jù)庫中有符合要求的人臉則檢測成功,輸出檢測結果,否則沒有檢測成功,可以將沒有檢測成功的人臉記錄備案并輸出未成功驗證的識別結果。
人臉檢測即從背景圖片中找出人臉,并將其定位的過程。目前國內外主要的人臉檢測算法主要包括基于特征的人臉檢測、基于統(tǒng)計的人臉檢測、基于膚色的人臉檢測等,通過比較分析,最終選擇基于統(tǒng)計的人臉檢測方法。首先采集到要檢測的圖像,然后將原圖像按照一定的比例縮放成多個不同大小的圖片,然后使用一定大小的子窗口(這里選用20*20的子窗口)窮舉圖片中的每個位置。之后對每個子窗口使用訓練好的分類器檢測是否存在人臉,通過這種方法可能會對同一個人臉檢測出多個窗口,所以之后需要對多窗口進行合并,最后顯示出檢測到的人臉圖案。
使用機器學習的方法進行人臉檢測可以簡單的理解成一種模板匹配算法,既然是模板匹配,那就要求匹配的模板大小要相同,只有同樣大小的輸入才可以進行比對。產(chǎn)生同樣大小模板的方式是通過對圖像縮放產(chǎn)生多個不同尺寸的金字塔圖像,然后使用滑動窗口生成待檢測的子窗口。
圖像的特征描述子是決定系統(tǒng)檢測效果的關鍵因素之一,人們針對不同的圖像特性設計了一些檢測效果較好的特征,在人臉檢測方面較為常用的特征有Haar特征以及LBP特征。通過實驗比較,看出Haar特征的檢測較好,漏檢率較低,不過檢測速度相對較慢,考慮到本論文結果要在嵌入式系統(tǒng)下實現(xiàn),所以選擇了檢測速度較快的LBP特征。
表1 Haar特征和LBP特征檢測效果對比
本文選用了Adaboost分類器作為基礎的分類器,因為圖片中會產(chǎn)生多個檢測窗口,但是只有極少數(shù)窗口中存在人臉,所以采用級聯(lián)分類器的方式進行檢測,這樣如果前幾個分類器可以排除大部分非人臉圖片,就可以快速的完成分人臉圖片的檢測,加快檢測速度。
對于機器學習問題,選擇了適當?shù)乃惴ㄖ筮€需要配合足夠的有效的樣本才能訓練出好的模型。
樣本的選擇要覆蓋盡量大的概率分布,這樣才能學習到更好的模型,這里選用了FERET數(shù)據(jù)庫的人臉圖片作為正樣本,如圖2所示,其中足夠多的樣本包含了不同的年齡、性別、表情的人臉,而且也包含了不同光照環(huán)境下的人臉圖案。
圖2 人臉正樣本圖片
負樣本一般選用大量的不包含人臉的圖片,不過最好加入一定量的可能要檢測場景下的不包含人臉圖片作為負樣本,比如本文在校車上以及上車過程中檢測人臉,那么加入上車地點的背景圖片以及車內的圖片作為負樣本,可以有效的降低分類器的誤檢率。如圖3是其中一些較有代表性的負樣本圖片。這些圖片的大小遠大于模板的大小,而且不是灰度圖,所以在訓練之前需要對圖片灰度化處理,而且需要通過縮放和滑動窗口的方式產(chǎn)生多個和正樣本大小相同的負樣本窗口,最后才能作為負樣本被使用。
圖3 人臉檢測負樣本圖片
有了正負樣本之后接著就可以開始訓練分類器,圖4展示了分類器訓練的過程。
圖1 人臉識別算法流程圖
從樣本庫中獲得20*20大小的正負樣本,正樣本通過縮放到20*20大小,負樣本通過縮放以及裁剪生成20*20大小窗口,對正負樣本提取特征,由這些特征向量訓練弱分類器,再由弱分類器組合成強分類器,強分類器一般從前到后的級數(shù)不斷增加。在每次訓練好一個強分類器之后用強分類器檢測非人臉樣本,將可以正確區(qū)分的負樣本刪除,加入新的非人臉樣本繼續(xù)訓練新的強分類器。等到訓練好足夠多的強分類器之后組合成為級聯(lián)分類器,不過級聯(lián)分類器的訓練也不是一次就可以完成。訓練好分類器之后在新的樣本集上檢測,發(fā)現(xiàn)其中存在的問題,并把錯誤分類的圖片類別加入到訓練集中重新訓練分類器,經(jīng)過多次反復之后,最終才能得到較好的人臉檢測分類器。
使用圖像金字塔以及滑動窗口的檢測算法的結果一般會檢測出多個窗口,最后需要對多個窗口的結果進行合并,才能輸出最終的檢測結果。 本文采用K鄰近算法實現(xiàn)聚類,首先判斷任意兩個窗口是否屬于同一個人臉,這里依賴兩個窗口的位置關系判斷。然后對得到的窗口查并集,得到最后的檢測結果。
由于代碼需要在嵌入式平臺上實現(xiàn),所以程序的運行速度比較關鍵,特別是人臉檢測的程序需要在乘客上車中完成,需要較好的實時性來達到較好的用戶體驗,所以對速度的要求較高。這里根據(jù)真實的應用場景對算法做出一定的優(yōu)化,加快了算法執(zhí)行速度,提升用戶體驗。
基于分析可以知道,如果只是檢測一定距離內的人臉圖片,可以縮減多尺度圖像的數(shù)量,這樣的好處是加快了計算的速度,并且不檢測一些距離較遠的人臉圖像,對于之后的人臉識別算法,遠處拍攝到的圖片一般成像質量較差,會對識別率有一定不好的影響。通過縮減多尺度變化的數(shù)量可以有效的提高算法速度,并且提高獲取圖片質量。
而且視頻和單一的圖像也有不同,相鄰幀的圖片之間有相關性,一般情況下相鄰的兩幀圖片之間人臉的平面位置以及距離攝像頭的距離都十分接近,所以第一幀圖片中如果搜索到了人臉,那么對于下一幀的搜索,可以先從之前的縮放等級以及位置先開始,并在其相鄰空間搜索,這樣就能有效的加快算法的執(zhí)行速度。
表2 算法優(yōu)化后的結果
圖4 分類器的訓練過程
下表2是在嵌入式平臺下優(yōu)化過的算法的檢測速度,每一個時間為取樣100幀計算的平均值。為了方便人臉識別,這里的算法都是檢測到最大的一個人臉之后停止檢測??梢钥闯鼋?jīng)過優(yōu)化之后的檢測速度有了較大提升,可以完成實時的人臉檢測。
為了能夠達到較好的識別效果,這里選用了FACE++的人臉識別解決方案,F(xiàn)ACE++提供了人臉識別云服務,通過使用官方SDK可以快速完成人臉識別。FACE++識別的準確率較高,在LFW數(shù)據(jù)庫上已經(jīng)超越人眼的識別能力。經(jīng)過實驗發(fā)現(xiàn)FACE++的人臉識別算法對于光照、表情、模糊都有較好的抗性,這些因素對識別的結果影響較小,不過大角度的側臉會影響識別的精度。所以在對一名乘客建立數(shù)據(jù)庫的過程中需要建立多個角度的數(shù)據(jù),這樣有利于對多角度人臉的識別。
對于本文的應用場景一般校車的乘客數(shù)量不會超過100人,這里使用FERET數(shù)據(jù)庫中的90個人臉再加上10人建立了一個人臉庫,用于模擬校車上的乘客。選用FERET數(shù)據(jù)庫的原因是這個庫的人臉圖片包括了人臉的不同側面,這樣有助于提升檢測的準確率。
下面是500次注冊人員和500次非注冊人員進行人臉識別的輸出結果??梢钥闯鰧τ谧赃^乘客,雖然500次識別中有11次沒有檢測通過,但是并沒有出現(xiàn)錯誤的情況。500次對未注冊的乘客都可以有效的識別出來。所以這種基于人臉識別的考勤系統(tǒng)是安全可靠的。
表3 人臉識別效果
在識別速度方面,對于1000次測試中,平均檢測速度為0.7s左右,最慢檢測速度為1.4s,檢測速度較快??梢詽M足使用的需求。
本文提出的基于人臉識別的校車考勤系統(tǒng),已經(jīng)在NVIDIA公司專門為視覺計算推出了的嵌入式計算平臺Jetson TK1得以實現(xiàn),系統(tǒng)的主控芯片采用了四核A15 ARM架構處理器,內置NVIDIA Kepler架構GPU。經(jīng)過實驗表明,系統(tǒng)設計滿足了校車考勤實際使用的要求。
參考文獻
[1]吳飛龍,基于機器視覺的校車安全監(jiān)測系統(tǒng)[D],浙江大學,2016
[2]Organization W H. Global status report on road safety 2013: supporting a Decade of Action[J].World Health Organization, 2013.
[3]丁芝華.我國校車安全管理的現(xiàn)狀、問題與完善對策[J].中國公共安全:學術版,2011(4):93-96.
[4]Ghazarian O. Electronic vehicle product and personnel monitoring: US, US RE43178 E1[P]. 2012.
[5]Schmidhuber J. Deep Learning in Neural Networks: An Overview[J]. Neural Networks, 2014, 61:85–117.
作者簡介
沈開榮(1977-),男,浙江義烏,本科,工程師,研究方向為廣播電視傳輸技術。
Design of school bus attendance system based on face recognition
Shen Kairong1,Zhang Genyuan2,Wu Feilong3
(1.Zhejiang radio and television transmission and transmission center,Hangzhou Zhejiang,310005;2.Electronic information college,Zhejiang University of Media and Communications,Hangzhou Zhejiang,310018;3.Department of Instrument Science and engineering,Zhejiang University,Hangzhou Zhejiang,310027)
Abstract:This paper introduces the design idea of school attendance system based on face recognition,and the key of face detection and face recognition algorithm were in-depth analysis and design.
Keywords:face detection; face recognition;school bus;attendance