摘 ?要:2016年以來,人工智能得到長足的發(fā)展,國家也開始大力發(fā)展人工智能產業(yè)。人工智能算法日趨成熟并進入商用階段,智能硬件具備更高的算力足以支撐千億人臉大庫。與此同時,公安擁有海量的數據可供應用開發(fā)。面對日趨復雜的公共安全治安形勢,對如何利用新興人工智能技術支撐實戰(zhàn)應用提出了更高的要求,只有不斷對其探索和研究才能建立更主動、更智慧的平安城市立體化安全防御體系。
關鍵詞:人工智能;視頻監(jiān)控;人臉識別;算法;計算機視覺
中圖分類號:TP18;TN948.6 ? ? ?文獻標識碼:A 文章編號:2096-4706(2019)13-0091-03
Application Research of Artificial Intelligence in the Field of
Public Security Video Surveillance
YU Dayong
(PCI-Suntek Technology Co.,Ltd.,Guangzhou ?510653,China)
Abstract:Since 2016,artificial intelligence has been greatly developed,and the country has begun to vigorously develop the artificial intelligence industry. The algorithm is maturing and entering the commercial stage,and the hardware has a higher computing power to support the 100 billion face database. At the same time,the public security has a huge amount of data for application development. In the face of the increasingly complex public security situation,how to use the new artificial intelligence technology to support practical applications puts forward higher requirements,in order to establish a more active and smarter three-dimensional security defense system for safe cities.
Keywords:artificial intelligence;video surveillance;face recognition;algorithms;computer vision
0 ?引 ?言
根據中國安全防范產品行業(yè)協(xié)會統(tǒng)計的數據,至2017年底,全國安裝視頻監(jiān)控的公共區(qū)域攝像機數量超過2800萬臺,覆蓋了城市的重點區(qū)域、重點場所、主干道路、重點建筑,也涉及公安、應急、交通、城管多個行業(yè),構筑了視頻監(jiān)控的“天網工程”。大量的視頻監(jiān)控攝像機產生了海量的視頻錄像數據,這些錄像數據就像“沉睡”的金礦,傳統(tǒng)方式下,單純依靠人工監(jiān)視和錄像回放已無法滿足公安業(yè)務的實戰(zhàn)要求,如何讓計算機能夠直接讀懂視頻監(jiān)控畫面中的信息,就依賴于計算機視覺識別技術,依賴于人工智能技術的發(fā)展,人臉識別、車牌識別、特征識別、視頻結構化、ReID、結構光、TOF等技術成為有效化解制約瓶頸的有效途徑。AI技術與視頻監(jiān)控技術的結合,是視頻監(jiān)控系統(tǒng)智能化應用研究的重要方向。
1 ?AI在公安視頻監(jiān)控領域的應用
目前成熟應用于公安視頻監(jiān)控領域的AI技術主要包括車輛識別、人臉識別和ReID三種技術,結構光、TOF(飛行時間測距法)也在研究當中。
第一,車輛識別技術。車輛識別包括車牌識別和車輛特征二次識別兩大技術。車牌識別多應用在卡口、電子警察和停車場的出入口。以車牌識別數據為基礎,并通過與車輛信息庫關聯(lián),開展相應的業(yè)務應用。車牌識別屬于OCR文字識別的范疇;車輛特征二次識別可以識別車牌之外的特征信息,包括:車輛類型、車輛品牌、車輛子品牌、車牌類型、車身顏色、安全帶、遮陽板、打手機、車輛特征(包含年檢標志、紙巾盒、遮陽板、擺件、掛件、車身噴字)等特征信息數據,對無牌照或遮擋牌照車輛也可進行車型識別,還可識別部分拍攝殘缺照片(車頭缺失不超過1/2),可以說大大挖掘了視頻和圖像的潛力,而且車標、顏色、標志物相對來說屬于分類識別,也比較容易實現(xiàn),于是市場上出現(xiàn)了多種車輛大數據平臺,也出現(xiàn)了各種車輛技戰(zhàn)法和應用,這都是AI賦能的結果。
第二,人臉識別技術。人臉識別技術是基于人的臉部特征信息進行身份識別的一種生物識別技術。在公安領域的實戰(zhàn)應用更注重動態(tài)人臉識別技術,安裝人臉抓拍機(人臉抓拍攝像機適合安裝在寬度2.5-3.5米的單一通道),人臉識別算法和相應技術多用于人員防控、人員管控和身份認證。把視頻抓拍的照片送至人臉識別系統(tǒng)進行比對,記錄比對結果,對發(fā)現(xiàn)的高危人員和重點人員進行標注后,產生實時告警并聯(lián)動相應的業(yè)務流程。不同光照、角度下的人臉識別的效率和性能有所不同。
第三,ReID技術。ReID就是行人再識別(也叫跨鏡追蹤),全寫是Re-identification,從其字面意思可以理解出,就是對于監(jiān)控攝像機下的物體進行重新識別和辨認。如對人物的識別,能夠辨認出人的服裝穿著、體態(tài)和人體其他代表性特征。它可以通過跨攝像機鏡頭,來對行人進行識別、追蹤和檢索。用來作為對人臉識別技術的重要補充,對于無法捕捉到清晰人臉的行人,可以采用跨鏡頭持續(xù)進行跟蹤??珑R追蹤技術發(fā)揮空間大,有著很大的實用價值,在公安視頻監(jiān)控領域大有所為。
2 ?AI在近年來的突破
AI是2018年的熱點技術,結合這一年以來AI的發(fā)展情況以及筆者對AI的理解,關于AI在公安領域的應用研究如下。
2.1 ?自然語言處理(NLP)
自然語言處理(NLP)是指計算機擁有識別理解人類文本語言的能力,是計算機科學與人類語言學的交叉學科。自然語言是人與動物之間的最大區(qū)別,人類的思維建立在語言之上,所以自然語言處理也就代表了人工智能的最終目標。機器若想實現(xiàn)真正的智能自然語言處理是必不可少的一環(huán)。[1]NLP在公安的最佳應用是語音識別,通過聲音可以判定人的身份(聲紋),通過NLP獲取語音中的文字信息,為公安技偵應用提供技術支撐,未來有望形成大面積落地應用。
2.2 ?計算機視覺(CV)
計算機視覺(Computer Version,CV)是從圖像或者視頻中提出符號或者數值信息,分析計算該信息以進行目標的識別、檢測和跟蹤等。更形象地說,計算機視覺就是讓計算機像人類一樣能看到圖像,并看懂理解圖像。到80、90年代,計算機視覺迅速發(fā)展,形成感知特征的新理論框架并逐漸應用到工業(yè)環(huán)境中。到21世紀,計算機視覺領域呈現(xiàn)許多新的趨勢,計算機視覺與計算機圖形學深度結合,基于計算機視覺的應用也呈爆炸性增長,除了在手機、電腦上的應用,計算機視覺技術在交通、安防、醫(yī)療、機器人上有各種各樣形態(tài)的應用[2]。計算機視覺的四大基本任務包括:分類、定位、語義分割和實例分割,近期又引入3D結構光和TOF技術做深度計算,以3D識別代替2D識別。CV技術在公安行業(yè)的典型應用包括:人臉識別、車輛識別、行為識別和特征屬性識別。
2.3 ?工具和框架
2.3.1 ?TensorFlow
TensorFlow是谷歌開發(fā)的用于深度學習或人工神經網絡的開源軟件庫。它由Google AI團隊內的Google Brain團隊開發(fā),并于2015年11月9日在Apache 2.0開源許可下發(fā)布。TensorFlow使用數據流圖進行數值計算。它具有非常靈活的體系結構,可以輕松部署跨各種平臺(CPU,GPU,TPU)以及從臺式機到服務器群集到移動和邊緣設備的計算。
2.3.2 ?PyTorch
PyTorch,是2017年Facebook在GitHub上開源的深度學習框架,PyTorch發(fā)布的較晚,但是熱度強勁,PyTorch是一個設計極為先進的框架,遵循“Python優(yōu)先”的原則。PyTorch不是簡單的封裝Torch的接口,而是對Tensor之上的所有模塊進行改造,新增了最先進也是PyTorch最顯著的特點自動求導,成為目前最流行的深度學習框架。
2.3.3 ?CNTK
微軟認知工具包(以前稱為CNTK)由微軟研究院開發(fā)。CNTK具高度的可定制性,因為它具有更快的訓練時間和易于使用的體系結構。無論是在只有CPU,單個GPU,多個GPU或具有多個GPU的多個機器上運行,它都擁有出色的性能。它允許你選擇自己的參數、算法和網絡。它是用Python和C++編寫的。雖然它在語音識別領域更受歡迎,但CNTK也可以用于文本、圖像和RNN訓練(遞歸神經網絡:一種神經網絡)。
2.3.4 ?Theano
Theano是一個專為深度學習而設計的Python庫。它允許你定義、優(yōu)化和評估涉及高效率的多維數組的數學表達式。它可以使用GPU并執(zhí)行有效的符號區(qū)分。該工具具有與NumPy集成、動態(tài)C代碼生成和符號區(qū)分等功能。該工具支持Linux,Mac OS X和Windows等平臺。
2.3.5 ?Keras
Keras是一個用Python編寫的開放源碼庫,這種高水平的神經網絡API旨在使用深度神經網絡進行快速實驗。它側重于用戶友好、模塊化和可擴展性。該工具針對CPU和GPU進行了優(yōu)化。
2.4 ?強化學習
強化學習是人工智能中策略學習的一種,是一種重要的機器學習方法,在智能控制機器人及分析預測等領域有許多應用。又稱再勵學習、評價學習,是從動物學習、參數擾動自適應控制等理論發(fā)展而來的。常用的強化學習算法包括TD(Temporal Difference)算法、Q-learning算法、Sarsa算法等。
3 ?算法和硬件
3.1 ?AI算法
在機器學習領域,有幾種主要的學習方式,即監(jiān)督式學習、非監(jiān)督式學習、半監(jiān)督式學習。有了算法,有了被訓練的數據(清洗過的數據),經過多次訓練(算力)后,經過模型評估和算法人員調試后,會獲得訓練模型。當新的數據輸入后,那么訓練模型就會給出結果。業(yè)務要求的最基礎的功能就算實現(xiàn)了。
3.2 ?AI芯片
目前,主流的AI芯片基本以GPU、FPGA、ASIC以及類腦芯片為主,它們各自發(fā)揮優(yōu)勢,多種類型的芯片組合應用,呈現(xiàn)多技術路徑并行發(fā)展態(tài)勢。深度學習引領了本輪AI發(fā)展熱潮。隨著深度學習模型算法對大規(guī)模并行計算能力的需求不斷激增,GPU、FPGA等通用芯片存在性能、功耗等方面的瓶頸,無法滿足AI巨大的算力需求。ASIC等專用芯片應運而生,滿足不同應用、不同算法和不同終端的需求。但目前AI算法仍處于快速演進階段,還不存在適應所有應用的通用AI算法,AI芯片也就沒有確定的架構。這使得定制化的ASIC專用芯片開發(fā)周期長,迭代進化快,資金和技術風險都很高。因此,AI芯片技術還存在著巨大的探索空間和創(chuàng)新空間,尤其是在算法基礎理論研究和芯片設計架構創(chuàng)新方面[3]。
4 ?結 ?論
人工智能的應用研究迎來了轉折點,國家大力發(fā)展人工智能產業(yè),在人工智能領域我國擁有海量的可被計算、訓練和挖掘的數據,尤其是在更高的計算能力、深度學習模型的建立等因素的推動下,使得人工智能算法應用領域取得了重大突破。人工智能未來發(fā)展的前景廣闊,充分利用深度學習技術挖掘可用數據潛力、改善決策的過程,產生更高階的智能,從而獲得更便捷的服務,全方面改善我們的生活,不斷提高我們對世界的認知。
面對日趨復雜的公共安全形勢,對于新興人工智能的實戰(zhàn)支撐能力提出了更高的要求,單單針對單一維度、單一類型的大數據挖掘分析無法滿足公共安全領域業(yè)務發(fā)展的需要。只有立足實戰(zhàn),多種資源關聯(lián)疊加,構建了資源服務體系和應用體系,實現(xiàn)多維感知數據的匯聚、解析和存儲之后,才能實現(xiàn)AI、視頻大數據、公安業(yè)務的融合和應用。
參考文獻:
[1] 崔雍浩,商聰,陳鍶奇,郝建業(yè).人工智能綜述:AI的發(fā)展 [J].無線電通信技術,2019,45(3):225-231.
[2] 倪晨旭.計算機視覺研究綜述 [J].電子世界,2018(1):91+93.
[3] 李麗婷.人工智能芯片技術進展及產業(yè)發(fā)展研究報告 [J].廈門科技,2019(1):1-9.
作者簡介:于大勇(1982.12-),男,漢族,黑龍江肇東人,總經理助理,本科,研究方向:AI算法在安防領域的賦能以及業(yè)務應用支撐。