游清清,諶海云
( 西南石油大學,四川 成都 610500 )
職業(yè)教育培訓和學業(yè)能力考試是企業(yè)和社會選拔人才的重要手段和主要途徑,培訓和考試的種類復雜多樣,難度也越來越大。隨著社會競爭愈加激烈,學生或考生為了取得好成績,在相關(guān)考試中使用各種各樣的作弊手段,極大影響考試的公平性。如何保證考試的公平公正,是亟待解決的主要問題??荚囎鞅资侄沃谐R姷膴A帶、抄襲、利用電子高科技等作弊方式目前已有較好的解決方法,但是考生替考現(xiàn)象目前僅能通過傳統(tǒng)的監(jiān)考人員人工驗證來防范。人工驗證由于存在驗證時間短、驗證人數(shù)多、證件易修改、人為影響等諸多不利因素,無法完全達到防作弊效果。隨著計算機視覺的逐步發(fā)展,生物識別技術(shù)(指紋識別、虹膜識別、人臉識別等)被廣泛應用到各個領(lǐng)域當中,其中就包括了身份驗證領(lǐng)域?;诖耍疚奶岢龌谌四樧R別的身份驗證工具,以加強考試身份驗證管理,杜絕替考現(xiàn)象發(fā)生。
目前對于人臉識別研究大多是在多訓練樣本數(shù)據(jù)集的基礎(chǔ)上進行識別,對于一些場景,例如信用卡、駕照、個人身份驗證(包括本文涉及到的身份驗證情況)等場所,人在注冊時只能獲得一幅圖像,在人臉驗證時只有一張訓練樣本,從而產(chǎn)生了小樣本問題。由于小樣本問題僅有單一的訓練樣本,無法從中獲取樣本的類內(nèi)信息,傳統(tǒng)的人臉識別算法識別效果大大下降,甚至不能使用。
研究表明,不同的人臉具有相似形狀和輪廓,并且由于姿態(tài)、光照、表情等因素導致每個人人臉圖像的變化也具有較強的相似性,所以區(qū)分每個類的鑒別特征可以從其他類學習得到?;诖?,文獻[2]中提出通用學習框架法來解決小樣本問題,該方法利用通用框架庫學習特征空間,將訓練庫與待測試樣本投影至該特征空間中,采用距離度量,投影在該特征空間的訓練庫中與待測試庫中距離最近的樣本類別即待測試樣本的類別。文獻[3]中提出了擴展稀疏表示算法(ESRC),利用類內(nèi)圖像相減,即用訓練庫中的圖像減去對應的均值圖像,得到擴展的訓練樣本庫稱作誤差圖像,將誤差圖像與訓練樣本組成字典,得到測試庫中圖像的稀疏表示,從而對待檢測圖像進行識別。該方法雖然提高了識別率,但是研究發(fā)現(xiàn),ESRC 中使用的字典為固定字典,并不能夠?qū)θ四樳M行準確的描述。因此本文提出使用稀疏變化字典學習(SVDL)算法重構(gòu)人臉圖像,通過多次更新系數(shù)學習最稀疏的字典,得到人臉圖像的最優(yōu)表示,從而完成對待檢測樣本的識別,該方法在人臉表情、姿態(tài)光照等發(fā)生變化時仍具有較好的識別效果。
稀疏表示(Sparse Represent)最初是為了壓縮重建高維信號。稀疏表示高維信號主要是利用一組矩陣(字典)對原始信息用進行線性表示,用較少的數(shù)據(jù)對原始信息進行傳輸、處理存儲等。稀疏表示利用了信號的稀疏性對其進行數(shù)學建模,通過含有少量非零元素的稀疏矩陣反映信號的性質(zhì)與結(jié)構(gòu),該方法簡潔高效地表示了信號,較大程度降低了信號處理過程中的復雜度。
給定一個字典其中M << N,該字典的原子可以張成N維歐式空間,稱該字典為過完備字典。設(shè)向量x為人臉圖像X的向量表示形式,長度為M。該人臉圖像可由上述過完備字典線性展開,即:
其中為系數(shù)向量。
由于過完備字典Ψ列數(shù)大于行數(shù),因此在上述方程求解過程中,未知數(shù)大于方程數(shù),即式(1)為欠定的,存在無窮解。圖像的稀疏表示求解是為了使得系數(shù)向量α盡可能稀疏,即系數(shù)向量中非零元素盡可能少。向量的0-范數(shù)是指向量中非零元素的個數(shù),由此將圖像的稀疏表示求解問題轉(zhuǎn)換為求解下式優(yōu)化問題:
假設(shè)系數(shù)向量α為k稀疏的,即向量中非零元素有k個。這里的x和α為人臉圖像x在時域空間與Ψ域空間的不同表示,此時的k≤N,表明該圖像x是可以被壓縮表示的。
在實際應用中,式(2)還可以表示為:
上式指在小于k個原子的條件下,使得表示誤差盡可能小。
在式(2)求解過程中,當字典Ψ為正交基矩陣時,其解較易得到,但是對于一個過完備字典來說,稀疏表示求解問題變成了一個NP難題,且很難對其進行稀疏逼近。一些學者們通過數(shù)學推導發(fā)現(xiàn),在約束等距性條件下,0-范數(shù)與1-范數(shù)求解值相同。因此在滿足約束等距性條件下,一般選擇l1范數(shù)逼近l0范數(shù)。約束等距性是指投影前信息中各元素的距離在投影后各元素之間的保持不變,數(shù)學描述為對于一個整數(shù)s=1,2,…,定義矩陣A的等距常數(shù)δs為滿足下式的值:
在滿足約束等距性條件下,式(4)可轉(zhuǎn)換為式(5)所示。
求解模型(5)得到的系數(shù)向量,可較好反映出圖像信息。在求得系數(shù)向量之后,可根據(jù)過完備字典Ψ,重構(gòu)出原始圖像,最后通過比較原始圖像與重構(gòu)圖像之間的表示殘差對圖像完成最終分類,殘差r如式(6)所示。
針對小樣本識別問題,在稀疏表示的基礎(chǔ)上進行擴展延伸,提出通用框架庫法,該方法從其他類別的數(shù)據(jù)庫中學習到可區(qū)分待檢測類的類內(nèi)特征,根據(jù)訓練樣本重構(gòu)出測試圖像,對其進行識別驗證。通用框架庫法有很多,本文主要采用Yang Meng等人于2013年提出的稀疏變化字典學習算法完成小樣本人臉識別。
稀疏變化字典學習的基本原理是將訓練庫中的人臉圖像自適應投影在參考子集中,從變化子集中學習稀疏變化字典,重構(gòu)出待檢測人臉可能出現(xiàn)的變化,最后根據(jù)得到的自適應投影項與變化字典學習項得到人臉圖像的最終表示,并完成人臉的識別驗證。
稀疏變化字典學習算法模型如式(7)所示,包含自適應投影項和變化字典學習項。
其中,D為待學習的字典,γi為gi的稀疏表示,為自適應投影項,為變化字典學習項。在變化字典學習項中,通過稀疏向量γi將變化矩陣Xi投影到字典D上得到訓練庫的變化矩陣。
自適應投影項主要是將訓練庫中的圖像自適應在投影參考子集中,訓練圖庫中的第i個人臉可由參考子集近似得到,即因此自適應投影項可定義為:
訓練庫對應的具有其他變化的圖像定義為Yi(即為待測試圖像),可近似表示為:
由于待測試人臉圖像的變化較多且未知,使得變化矩陣維數(shù)過大且冗余,因此使用一個較為簡潔緊湊的字典D來表示待測試圖像。字典其中dj為字典D的原子。變化字典學習項為:
其中為的稀疏表示,為常數(shù)。分別表示系數(shù)矩陣項和字典原子基礎(chǔ)項。
由此可得SVDL算法的整體模型如式(11)所示。
為了求得SVDL模型的最小值,可對式(11)分成兩部分求解:自適應投影項與變化字典學習項。
在進行替代優(yōu)化前,初始化γi值。
將初始化后的γi值帶入式(10)中,為了描述方便,使得得 :
采用變量交替優(yōu)化的策略求上式解。固定字典D,使用BP算法求解為每個樣本得到相應的Bi,以Bi為初值更新字典D,可將式(13)寫為:
使用基于逐列更新策略的KSVD算法更新字典D,更新第i列元素時,其他列元素保持不變,令di表示字典D的第i列元素,Bi表達稀疏矩陣B的第i行元素,則式(14)可重寫為:
式中是固定的,使用K_SVD算法對上式最小化。根據(jù)以上反復迭代求得字典D和樣本集Y的稀疏表示矩陣B。
確定字典D和稀疏表示矩陣B之后,式(11)變?yōu)椋?/p>
對該式求導得最小值,即:
為驗證算法的有效性,在不同的數(shù)據(jù)庫上進行對比,同時也與目前流行的算法(PCA、SVM、SRC、CRC、ESRC等)進行了比較,結(jié)果如下所述。
1)AR數(shù)據(jù)庫測試
進行實驗時,將AR數(shù)據(jù)庫分為s1和s2,兩個庫包含了光照、表情、遮擋等變化,分別進行實驗后結(jié)果如表1和表2所示。
2)CMU-PIE數(shù)據(jù)庫測試
將CMU-PIE數(shù)據(jù)庫分為四個部分(s1、s2、s3),其中s1為不同光照下的人臉,s2為不同表情的人臉、s3為不同姿態(tài)的人臉,結(jié)果如表3所示。
3)Extended YaleB數(shù)據(jù)庫測試
Extended YaleB數(shù)據(jù)庫包含了38個志愿者在9種姿態(tài)、64種光照下采集的人臉圖像,每人64張,實驗結(jié)果如表4所示。
表1 AR數(shù)據(jù)庫對比實驗(s1)
表2 AR數(shù)據(jù)庫對比實驗(s2)
表3 CMU-PIE-database
表4 Extended YaleB
(4)自建庫測試
為選擇合適的通用數(shù)據(jù)庫應用在實踐中,在自建庫中進行實驗。分別選擇AR數(shù)據(jù)庫、CMU-PIE數(shù)據(jù)庫、ORL數(shù)據(jù)、FERET數(shù)據(jù)庫、Extended YaleB數(shù)據(jù)庫作為通用數(shù)據(jù)庫,自建庫中每類人臉的第二張圖像為訓練圖像,其余為測試圖像,實驗結(jié)果如表5所示。
表5 FERET-database
從稀疏變化字典學習算法在不同的人臉數(shù)據(jù)庫上進行的實驗可以看出,該算法通過使用通用框架庫,提取了樣本的類內(nèi)信息,解決了小樣本問題,并增強了算法對光照表情變化的魯棒性,與傳統(tǒng)的識別算法相比,一定程度上提高了識別效果。
根據(jù)系統(tǒng)功能,設(shè)計了驗證系統(tǒng),其整體框架見圖1。系統(tǒng)主要包括三大功能模塊,分別是信息管理模塊、身份驗證模塊和數(shù)據(jù)通訊模塊。信息管理模塊主要負責存儲管理從終端下載到的信息,實時人臉圖像采集和學員考生信息讀取。身份驗證模塊主要功能是負責身份驗證,數(shù)據(jù)通訊模塊主要用于數(shù)據(jù)傳輸、與后臺數(shù)據(jù)庫信息交互。
圖1 系統(tǒng)框架
針對上述系統(tǒng)總體框架及流程,對系統(tǒng)進行仿真實現(xiàn)??荚囬_始時,考生手持相應證件經(jīng)過身份驗證系統(tǒng),讀寫器讀取相關(guān)信息,檢索該考生所處考場,通過對比信息判斷是否為本考場考生,如不是,給出相應提示,見圖2。
圖2 不屬于本考場界面
考場確認無誤后進行人臉驗證,系統(tǒng)獲取人臉圖像之后,對圖像進行處理,與庫中模擬人臉進行比較,選擇誤差最小的作為擬身份,將考生信息與擬身份進行比較,相一致則匹配成功并顯示考生基本信息,若無法匹配則提醒監(jiān)考人員采取人工復核,避免系統(tǒng)誤檢,見圖3和圖4。
圖3 識別成功
圖4 誤檢提示
本文采用稀疏變化字典學習算法,利用通用框架庫的思想,解決了小樣本問題中難以獲取樣本類內(nèi)信息的問題,同時對光照、表情、姿態(tài)等變化有好的魯棒性,得到更高的人臉識別精度,在此基礎(chǔ)上建立了身份驗證系統(tǒng),具有實時有效特性。
[1]王科俊,段勝利,馮偉興.單訓練樣本人臉識別技術(shù)綜述[J].模式識別與人工智能,2008,21(5).
[2]Wang J,Plataniotis K N,LuJ,etal.On solving the face recognition problem with one training sample per subject[J].Pattern recognition, 2006,39(9):1746-1762.
[3]Deng W,HuJ,GuoJ.ExtendedSRC:undersampledface recognition via intraclass variant dictionary[J].IEEE transactions on pattern analysis &machine intelligen ce,2012,34(9):1864-1870.