闞美娜 何思誼 山世光
人臉識別,就是讓計算機像人用眼睛觀察一樣,通過攝像頭拍攝人臉來判斷看到的是誰。對計算機來說,這個“識別”過程包括兩個階段:首先要從拍攝的圖像中找到“人臉”,這個過程叫作“人臉檢測”;然后再與數(shù)據(jù)庫中存儲的人臉進行比對,從而判斷檢測到的人臉屬于誰,這個過程叫作“人臉識別”。
人臉檢測的任務是從圖像中標注出每張人臉的具體位置和大小,一般用人臉矩形框(如人臉識別流程圖中的綠色矩形框)四個頂點的坐標來標示。這對于人類來說似乎很簡單(不過科學家們還不完全清楚人腦是怎么做到的),可對計算機來說卻沒有那么容易。因為在計算機內部,彩色圖像是由一個挨一個的點(像素)組成的,每個像素通常由紅(R)、綠(G)、藍(B)三個顏色數(shù)值來表示。可想而知,直接通過這些數(shù)值的差異區(qū)分人臉和非人臉十分困難。因此,人工智能專家需要設計算法對這些數(shù)值進行處理,找到人臉區(qū)域與非人臉區(qū)域在這些數(shù)值中蘊藏的差異,從而區(qū)別人臉區(qū)域和非人臉區(qū)域,完成人臉檢測。
檢測出人臉后,就可以對這張臉的身份進行判斷了。人臉識別通常有兩種應用場景:一種是相對簡單的1:1人臉驗證,比如手機解鎖就是將使用手機的人和手機里儲存的“主人”照片進行比對;另一種是1:N人臉辨識,即將一張未知身份的人臉圖像與數(shù)據(jù)庫中所有的已知人臉圖像進行比對,判斷其是否是數(shù)據(jù)庫中的某個人,如果是,則顯示此人在數(shù)據(jù)庫中的信息。
人臉識別技術始于20世紀70年代,但直到近幾年才得到廣泛應用,這是為什么呢?因為人臉識別最大的難點就是對人臉圖像中的數(shù)值進行處理和分析,提取可以區(qū)分不同人的關鍵特征。
在201 4年之前,人臉識別專家一直都在嘗試人工設計這樣的特征。在2014年之前的十幾年里,最為普遍的人臉識別方法是統(tǒng)計人臉局部區(qū)域(比如左眼區(qū)域)中出現(xiàn)某種“微模式”的程度或數(shù)量,這類特征一般被稱為“局部特征”。這種方法在采集條件好、被識別人主動配合的情況下可以取得非常不錯的效果,但在復雜多變的人臉識別場景中,正確率可能連90%都達不到。
2014年之后,得益于深度學習算法、強大GPU算力支撐和大規(guī)模人臉數(shù)據(jù)庫這三大引擎的推動,人臉識別技術取得了跨越式的進步。深度學習算法的強大魅力在于人臉識別專家不需要再絞盡腦汁去自己定義“特征”,而只需要為深度學習算法準備好大量“食材”(照片),剩下的就交給深度學習算法自動完成。從此,人臉識別技術開始廣泛應用于我們的生活中,比如視頻偵查、嫌疑人追逃、考勤系統(tǒng)等。
未來,人臉識別技術將向著“智能視頻分析”發(fā)展,即對目標人臉進行分析、追蹤。如果犯罪嫌疑人出現(xiàn)在攝像頭中,一個個攝像頭拍攝的視頻將會聯(lián)動起來,追蹤嫌疑人的活動路徑。另外,還有一個有趣的方向:“讀心術”。中國科學院智能信息處理重點實驗室研發(fā)的“表情識別”系統(tǒng),能即時對捕捉到的人臉做18種面部動作單元的檢測,從而判斷此人的情緒、心理狀態(tài)乃至精神狀況。這項技術應用前景廣泛,比如在教室,通過對面部表情分析判斷你對課程的掌握程度,從而制訂出最適合你的學習計劃;在家里,讓你擁有一個及時感知你喜怒哀樂的機器人朋友……
如同其他科學技術一樣,人臉識別技術經過科學家們數(shù)十年的潛心鉆研,終于厚積薄發(fā),迎來了輝煌的發(fā)展,成為我們生活中不可或缺的一部分。未來,人臉識別技術還將以意想不到的方式繼續(xù)影響我們的生活,讓我們的生活更加便捷、安全。