傘璐
隨著人臉識別技術(shù)的普及,大家在日常生活中經(jīng)常遇到安檢“刷臉”、手機支付“刷臉”、上班打卡“刷臉”等場景。這項技術(shù)大大提高了生活的便利性,而且?guī)椭芏嘈袠I(yè)降本增效,但你知道它是怎么把人臉“刷”出來的嗎?當眼鏡、口罩、衣帽、頭盔、首飾等遮擋人臉時,機器還能識別嗎?
要在指定的環(huán)境中找出人臉,機器需要經(jīng)歷三個步驟:人臉檢測、人臉分析、人臉識別。
以機場安檢為例,前端設(shè)備負責人臉捕捉(即安檢時的小攝像頭)。當一張人臉照片輸入機器后,需要先找到人臉在圖片中的位置,我們將這一步驟稱為人臉檢測。人的面孔上有一些關(guān)鍵點,比如眼睛中心、嘴角等,不同的捕捉系統(tǒng)所提取的關(guān)鍵點數(shù)量相差很大,有的只提取左右眼睛中心兩個點,有的則多達近百個。利用這些關(guān)鍵點,機器可以對人臉進行幾何校正,即通過縮放、旋轉(zhuǎn)、拉伸等圖像變化,將人臉調(diào)整到一個比較標準的大小,這樣待識別的人臉區(qū)域會更加規(guī)整,便于后續(xù)進行匹配。
接下來是人臉分析。機器可以在人臉區(qū)域中辨別出眼睛、鼻子、嘴等五官位置,分析不同區(qū)域的輪廓,提取各種特征,然后連接成一個很長的特征向量。大家可以把特征向量想成一串數(shù)字,如A臉的數(shù)字是234.32,B臉的數(shù)字是235.32,等等。另一邊,機場地勤人員會提取旅客身份證照片上的特征向量,同樣獲得一串數(shù)字。將這兩串數(shù)字進行匹配,根據(jù)相似程度,系統(tǒng)會判定兩張圖片是不是同一個人,這便是最后一步的人臉識別了。
現(xiàn)在回到我們開頭所說的問題——如果你戴著眼鏡、口罩等遮擋物,機器還能認出你是誰嗎?
在前面介紹的人臉識別三部曲中,有一個步驟叫關(guān)鍵點抓取,即通過面部的許多采樣點進行整體取樣,因此眼鏡、首飾對它的影響并不大,但口罩、衣帽、頭盔這些大面積遮擋物會提升機器的誤識率。因此,如果過安檢時不摘掉帽子,肯定會影響機器的判斷。正如我們在生活中會認錯人一樣,人類會犯的錯誤,人工智能也會犯。
每一項新技術(shù)問世時,總會帶有一定的局限性。比如我們手機上的指紋識別功能,如果有人真想造假欺騙它,成本也不是特別高,但絕大部分人還是看重新技術(shù)的便捷、高效,愿意在日常生活中使用它。這也為新技術(shù)不斷改進完善提供了可能性。
所有的技術(shù)都是根據(jù)人類需求持續(xù)優(yōu)化發(fā)展的。未來會有越來越多的人臉識別產(chǎn)品替代簡單重復的勞動,如門衛(wèi)、保安等職業(yè),甚至門診醫(yī)生,因為機器看掃描片會比人工更準確,而且可以24小時不休息。到那時,很多傳統(tǒng)的產(chǎn)業(yè)模式、商業(yè)模式都會被顛覆,而這樣的未來也許就在幾年之內(nèi)。