劉思雨 薛勁松 景棟盛
摘 ?要:目前很多施工場(chǎng)地仍然使用人工方式檢測(cè)施工人員是否佩戴安全帽。針對(duì)此,設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)基于分階段深度神經(jīng)網(wǎng)的施工違章識(shí)別系統(tǒng),用以檢測(cè)施工人員是否佩戴安全帽。系統(tǒng)利用深度神經(jīng)網(wǎng),通過(guò)在視頻中采樣獲得圖片,然后將其分割成若干子區(qū)域,接著利用預(yù)處理后的數(shù)據(jù)訓(xùn)練模型,不斷優(yōu)化提升識(shí)別精度,然后將訓(xùn)練好的模型應(yīng)用到系統(tǒng)中。在室內(nèi)、室外和紅外線(xiàn)三個(gè)場(chǎng)景中進(jìn)行測(cè)試。實(shí)驗(yàn)結(jié)果表明,系統(tǒng)具有良好的實(shí)時(shí)檢測(cè)能力,總體平均正確檢出率達(dá)86.79%。
關(guān)鍵詞:違章識(shí)別;深度學(xué)習(xí);神經(jīng)網(wǎng)絡(luò);物體識(shí)別;視頻監(jiān)控
中圖分類(lèi)號(hào):TP18 ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
Construction Safety Violation Recognition based on Staged Deep Neural Network
LIU Siyu, XUE Jingsong, JING Dongsheng
(Suzhou Power Supply Branch, State Grid Jiangsu Electric Power Limited Company, Suzhou 215004, China)
lsy2801@163.com; 6802569@qq.com; jds19810119@163.com
Abstract: In many building sites, people still manually monitor whether the construction crew wear safety helmets or not. To solve this problem, this paper designs a safety-violation identification system based on phased deep neural network in order to locate the construction crews who appear without safety helmets. By using deep neural network, this proposed system samples pictures from videos, divides them into sub-sections, and then uses processed data to train the model. When the identification accuracy is high enough, the model is then applied to practical use. The model is tested respectively in indoor scene, outdoor scene and infrared scene. The experiment results show that this system can achieve good real-time monitoring, with an average correct detection rate of 86.79%.
Keywords: violation recognition; deep learning; neural network; object recognition; video surveillance
1 ? 引言(Introduction)
計(jì)算機(jī)在眾多領(lǐng)域得到了迅速的發(fā)展,其中包括計(jì)算機(jī)視覺(jué)技術(shù)、圖像技術(shù)等。不少工作研究如何將計(jì)算智能應(yīng)用于各種領(lǐng)域[1,2]。通過(guò)視頻監(jiān)控設(shè)備實(shí)時(shí)監(jiān)控檢測(cè)施工場(chǎng)地中人員是否有違章操作就是很重要的一類(lèi)應(yīng)用場(chǎng)景。然而,目前大部分還是通過(guò)人工方式來(lái)查看施工人員是否違章,這種方法比較耗時(shí)耗力,而且由于人的工作時(shí)間也有限,無(wú)法實(shí)現(xiàn)全天候?qū)崟r(shí)監(jiān)控。隨著工作時(shí)間的增加,效率也會(huì)降低。因此,人工方式來(lái)檢測(cè)違章的情況存在一定的局限性。
針對(duì)此,本文設(shè)計(jì)通過(guò)深度學(xué)習(xí)來(lái)自動(dòng)地檢測(cè)是否存在施工違章情況,生成并保存相應(yīng)的違章。這種方法和人工方法相比,在識(shí)別準(zhǔn)確率方面可能會(huì)下降,但是這種方式更加高效,并且大大節(jié)省了人工的成本。
2 ? 相關(guān)研究(Related studies)
2.1 ? 圖像處理技術(shù)
通過(guò)計(jì)算機(jī)來(lái)對(duì)圖像進(jìn)行一些操作包括對(duì)圖像進(jìn)行去噪,提取特征等類(lèi)似方法的技術(shù)就是圖像處理技術(shù)。計(jì)算機(jī)軟硬件的發(fā)展、離散數(shù)學(xué)的發(fā)展,以及各種需求推動(dòng)了圖像技術(shù)的發(fā)展。數(shù)學(xué)的對(duì)圖像處理技術(shù)的貢獻(xiàn)主要是在圖像處理的過(guò)程中需要將圖像信號(hào)轉(zhuǎn)換成數(shù)字信號(hào),轉(zhuǎn)化成數(shù)字信號(hào)后,計(jì)算機(jī)就可以處理這種信號(hào)。圖像處理技術(shù)在農(nóng)林、氣象和水利等眾多領(lǐng)域得到廣泛的應(yīng)用。
圖像處理有幾個(gè)目的。第一個(gè)目的是提高圖像的視感質(zhì)量,主要是讓圖像的質(zhì)量變得更好;第二個(gè)目的是提取圖像中特征,在計(jì)算機(jī)分析圖像時(shí)這些特征至關(guān)重要;第三個(gè)目的是對(duì)圖像中數(shù)據(jù)進(jìn)行處理,處理的方法主要是變換、編碼和壓縮,從而讓圖像的存儲(chǔ)和傳輸更為快捷。圖像處理技術(shù)有很多,而圖像分類(lèi)是其中的一種,其主要內(nèi)容是將圖像預(yù)處理,然后提取特征,根據(jù)特征來(lái)進(jìn)行分類(lèi)。圖像分類(lèi)的方法有很多種,而人工神經(jīng)網(wǎng)絡(luò)模式分類(lèi)在圖像技術(shù)中的表現(xiàn)和以前的方法相比,更為準(zhǔn)確,因此這種方法就越來(lái)越受到重視。
2.2 ? 人臉識(shí)別技術(shù)
人臉識(shí)別技術(shù)是近幾年興起的一種識(shí)別技術(shù)。這種識(shí)別技術(shù)是基于輸入的圖片的特征來(lái)識(shí)別,對(duì)于輸入的一張圖像,首先要做的就是判斷輸入的圖像中是否存在人臉。如果存在的話(huà),則需要進(jìn)一步給出臉的具體信息。這些信息中提取這張臉?biāo)鶎?duì)應(yīng)的身份特征。然后將這個(gè)身份特征與已知的情況,即可知道這張臉的身份情況。廣義的說(shuō)法是構(gòu)建一個(gè)人臉識(shí)別系統(tǒng),這個(gè)系統(tǒng)比較廣泛,包括人臉的定位,人臉的預(yù)處理等等;而只通過(guò)人臉來(lái)進(jìn)行身份上的確認(rèn)和廣義的人臉識(shí)別相比就是狹義上的人臉識(shí)別。
人臉識(shí)別技術(shù)主要采用的是特征分析算法,這個(gè)算法用到了兩個(gè)方面的技術(shù),一個(gè)是計(jì)算機(jī)圖像技術(shù),需要用圖像技術(shù)來(lái)提取圖像中的特征點(diǎn),第二個(gè)是生物統(tǒng)計(jì)學(xué)原理,利用這個(gè)來(lái)分析特征點(diǎn)來(lái)建立對(duì)應(yīng)數(shù)學(xué)模型,這個(gè)模型就是人臉特征模板。這個(gè)模板需要與被測(cè)的人的圖像來(lái)進(jìn)行特征分析,特征分析會(huì)得到一個(gè)相似值。判斷是否為同一個(gè)人就是根據(jù)這個(gè)值推理出來(lái)的。
2.3 ? 分類(lèi)問(wèn)題
機(jī)器學(xué)習(xí)是一門(mén)交叉學(xué)科,主要研究怎樣讓機(jī)器更加智能化,是目前人工智能領(lǐng)域的一個(gè)重要方向,從誕生到現(xiàn)在經(jīng)歷了若干個(gè)階段。機(jī)器學(xué)習(xí)的一些方法的應(yīng)用逐漸從一些理論轉(zhuǎn)化為落地的產(chǎn)品,應(yīng)用范圍更為逐漸變廣。
分類(lèi)問(wèn)題是機(jī)器學(xué)習(xí)中的基礎(chǔ)問(wèn)題。目前很多落地的產(chǎn)品當(dāng)中好很多就是分類(lèi)問(wèn)題的應(yīng)用?,F(xiàn)階段機(jī)器的計(jì)算能力很強(qiáng),使得機(jī)器學(xué)習(xí)可以對(duì)海量的數(shù)據(jù)進(jìn)行處理,由于數(shù)據(jù)的規(guī)模比較大,因此數(shù)據(jù)內(nèi)部存在著有用的信息,因此機(jī)器學(xué)習(xí)可以通過(guò)這些數(shù)據(jù)可以挖掘出很多有用的信息。監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)中的兩種數(shù)據(jù)處理方式[3]。機(jī)器學(xué)習(xí)中的分類(lèi)算法有很多,其中具有代表性方法包括決策樹(shù)[4]、支持向量機(jī)[5]、關(guān)聯(lián)規(guī)則[6]和AdaBoost算法[7]等。這些算法的步驟大致一致:首先,建立一個(gè)訓(xùn)練模型,根據(jù)模型所需要的訓(xùn)練數(shù)據(jù)和標(biāo)簽,然后構(gòu)建相應(yīng)的模型;然后,驗(yàn)證數(shù)據(jù)的輸入,模型建立好之后有對(duì)應(yīng)的輸入和輸出,將裝備好的數(shù)據(jù)放入模型之中,模型會(huì)輸出結(jié)果;最后,將結(jié)果與數(shù)據(jù)對(duì)應(yīng)的正確標(biāo)簽進(jìn)行比對(duì),從而評(píng)價(jià)算法的效果。數(shù)據(jù)的驗(yàn)證是算法準(zhǔn)確率的體現(xiàn),評(píng)價(jià)一個(gè)算法好壞最直接的標(biāo)準(zhǔn)就是準(zhǔn)確率,因此需要測(cè)試數(shù)據(jù)來(lái)進(jìn)行驗(yàn)證數(shù)據(jù)。隨著精確率的不斷提高,模型就變得越來(lái)越好,模型就可以運(yùn)用到現(xiàn)實(shí)之中。自深度學(xué)習(xí)提出以后,深度學(xué)習(xí)也可以運(yùn)用到分類(lèi)問(wèn)題中,并取得了很好的效果。
2.4 ? 深度學(xué)習(xí)
深度學(xué)習(xí)與機(jī)器學(xué)習(xí)領(lǐng)域中的神經(jīng)網(wǎng)絡(luò)有著特別大的關(guān)聯(lián)。深度學(xué)習(xí)也是學(xué)習(xí)海量數(shù)據(jù)中的潛在的信息,學(xué)到的信息對(duì)于對(duì)應(yīng)的數(shù)據(jù)的解釋有著很大的幫助。深度學(xué)習(xí)的目的是使計(jì)算機(jī)更智能,可以識(shí)別各種問(wèn)題,看懂各種圖像,聽(tīng)懂各種語(yǔ)音。深度學(xué)習(xí)近兩年在各種方面的取得較好的成就,其中在文本、圖像、語(yǔ)音和生成式對(duì)抗網(wǎng)(Generative Adversarial Network, GAN)等方面取得了很好的效果。
深度學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)有著很強(qiáng)的關(guān)聯(lián)主要是因?yàn)樯疃葘W(xué)習(xí)來(lái)源于人工神經(jīng)網(wǎng)絡(luò)的研究。深度學(xué)習(xí)可以通過(guò)組合底層特征來(lái)發(fā)現(xiàn)數(shù)據(jù)的特征表示,形成更高級(jí)的特征。神經(jīng)網(wǎng)絡(luò)是模擬人腦而建立的。深度學(xué)習(xí)就是通過(guò)這種方式來(lái)分析數(shù)據(jù)。深度學(xué)習(xí)中有很多網(wǎng)絡(luò)結(jié)構(gòu),其中包括卷積神經(jīng)網(wǎng)(Convolutional Neural Networks, CNN)、循環(huán)神經(jīng)網(wǎng)(Recurrent Neural Network, RNN)和長(zhǎng)短期記憶網(wǎng)(Long Short-Term Memory, LSTM)等。卷積神經(jīng)網(wǎng)是比較常見(jiàn)的一種網(wǎng)絡(luò),第一個(gè)卷積神經(jīng)網(wǎng)[8]計(jì)算模型是在Fukushima D的神經(jīng)認(rèn)知機(jī)中提出的,基于神經(jīng)元之間的局部連接得到一種平移不變神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)形式。之后,有研究人員在此基礎(chǔ)上,用誤差梯度設(shè)計(jì)并訓(xùn)練卷積神經(jīng)網(wǎng),在一些任務(wù)上得到優(yōu)越的性能[9]。
3 ? 方法設(shè)計(jì)(Method design)
3.1 ? 訓(xùn)練模型
訓(xùn)練模型采用的卷積神經(jīng)網(wǎng)所訓(xùn)練的模型。輸入層、隱藏層和全連接層構(gòu)成了卷積神經(jīng)網(wǎng)絡(luò)[10]。神經(jīng)網(wǎng)絡(luò)的輸是輸入層,本文中所使用的神經(jīng)網(wǎng)結(jié)構(gòu)中的卷積神經(jīng)網(wǎng),該網(wǎng)絡(luò)的輸入是一個(gè)像素矩陣,這個(gè)像素矩陣是圖片所對(duì)應(yīng)的。卷積神經(jīng)網(wǎng)絡(luò)示意圖,如圖1所示。
在圖1中,最左側(cè)的輸入是一個(gè)三維矩陣,矩陣長(zhǎng)寬代表圖像大小,深度代表色彩通道。卷積神經(jīng)網(wǎng)絡(luò)從輸入層通過(guò)不同的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)將上層的三維矩陣轉(zhuǎn)化為下一層的三維矩陣,生成的三維矩陣作為下一層的輸入,直到最后一個(gè)全連接層。圖中的隱藏層中包括卷積層和池化層。而卷積網(wǎng)絡(luò)結(jié)構(gòu)中最重要的部分就是卷積層。卷積層的輸入是上一層神經(jīng)網(wǎng)絡(luò)的輸出,卷積層再次進(jìn)行卷積操作從而獲得更抽象的特征。池化層的功能是縮小矩陣的大小,將高分辨率的圖像轉(zhuǎn)化為低分辨率的圖像。通過(guò)池化操作,最后一個(gè)全連接層的節(jié)點(diǎn)數(shù)就會(huì)減少。在經(jīng)歷多隱藏層的操作后,最后通過(guò)全連接層來(lái)輸出結(jié)果。隱藏層的操作是圖像抽象提出的過(guò)程,在完成了特征提取后,通過(guò)最后的全連接層就完成分類(lèi)。
在此基礎(chǔ)上,本文把一些符合安全條件的施工圖片和不符合安全的施工圖片放入此神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,最后準(zhǔn)確度高于90%的情況下,將此時(shí)的參數(shù)進(jìn)行保存,得到了訓(xùn)練后的模型。只要將施工中得到的圖片放入此模型中便可以得到施工中的人是否符合安全施工的條件。
3.2 ? 視頻處理
由于攝像頭獲取到數(shù)據(jù)是以視頻的方式呈現(xiàn)的,因此系統(tǒng)的輸入是視頻。然而視頻數(shù)據(jù)量很大,因此需要將視頻處理一下,以便做之后的處理。將視頻處理成需要的圖片是必不可少的。
目前的圖像處理技術(shù)很容易做到將視頻分割成圖片[11,12]。視頻中有幀率屬性,本文就是在幀率的基礎(chǔ)之上對(duì)視頻進(jìn)行,按照15幀獲取一次圖片,在所使用的視頻中,每15幀為視頻中的1秒,如果間隔幀率比15小的話(huà),獲取到的圖片就會(huì)更多,反正,獲得的圖片就會(huì)更少,本文采用1秒鐘截圖一次,盡量保存必要的信息。采用OpenCV技術(shù)來(lái)講視頻處理為若干圖片,第一步就是獲取視頻,這一步相當(dāng)于輸入,獲取到對(duì)應(yīng)的視頻后,然后獲取視頻的總幀數(shù),然后設(shè)置一個(gè)標(biāo)記,并且標(biāo)記此標(biāo)記為真,在標(biāo)記為真的情況下,持續(xù)讀取視頻,按照每15幀的情況截圖視頻中當(dāng)前的畫(huà)面,并保存在對(duì)應(yīng)的文件下,直至視頻結(jié)束,在視頻結(jié)束后,讓標(biāo)記變?yōu)榧佟+@取視頻總幀數(shù)的情況是保證獲取到的圖片數(shù)量不會(huì)太多,由于系統(tǒng)使用視頻幀率是已知的,因此規(guī)定每15幀取一張圖,在未知的情況下,可以通過(guò)總幀數(shù)和規(guī)劃獲取的圖片總量來(lái)決定多少幀獲取一張圖片。
3.3 ? 人臉識(shí)別
在圖片中,有一部分圖片中是包含人臉的,有一部分是不包含人臉的,因此需要將包含人臉的圖片挑選出來(lái)。本系統(tǒng)主要是來(lái)識(shí)別施工人員中是否穿戴安全帽的情況,因此需要將人臉和戴安全帽一起進(jìn)行檢測(cè)。因此,本文中做工作首先就是先將每個(gè)圖中的人臉部分獲取到,然后將獲取到的人臉進(jìn)行檢測(cè),檢測(cè)人臉是否穿戴安全帽,穿戴安全帽的標(biāo)記為真,反之,標(biāo)記為假。
本文中采用的人臉識(shí)別技術(shù)主要是采用深度學(xué)習(xí)的方法,根據(jù)圖像中的內(nèi)容,來(lái)檢測(cè)圖像中是否存在人臉,通過(guò)已經(jīng)訓(xùn)練好的檢測(cè)人臉的模型就可以做到,這種模型和其他的神經(jīng)網(wǎng)絡(luò)模型一致,其中最重要的部分是數(shù)據(jù)。本文采用的模型是谷歌訓(xùn)練好的模型。只要將一張圖片放入模型的輸入之中,就可以得到該圖所對(duì)應(yīng)的人臉,根據(jù)輸入的圖片的名稱(chēng)來(lái)以此命名對(duì)應(yīng)輸出的圖片的名稱(chēng),這是因?yàn)橐粡垐D中對(duì)應(yīng)的人臉可能不止一個(gè),因此需要這個(gè)操作。在得到這些人臉之后,我們可以把這些圖片放入檢測(cè)是否佩戴安全帽的模型之中,并根絕對(duì)應(yīng)的情況來(lái)輸出未佩戴安全帽的圖片對(duì)應(yīng)的原始圖片。
3.4 ? 分階段處理
由于系統(tǒng)比較復(fù)雜,因此需要采取分階段處理的方法去將復(fù)雜的問(wèn)題轉(zhuǎn)化為若干個(gè)簡(jiǎn)單的問(wèn)題并分別處理,直至系統(tǒng)的完成。
第一個(gè)階段就是從視頻處理為圖片的階段,需要將視頻轉(zhuǎn)化為圖片,根據(jù)視頻中的幀率情況將視頻轉(zhuǎn)化為若干圖片,用以保證產(chǎn)生的圖片不會(huì)太多也不會(huì)太少,更加保證產(chǎn)生的圖片中包含臉的圖片不會(huì)被遺漏。第二個(gè)階段主要是針對(duì)產(chǎn)生的圖片的處理,由于視頻清晰度的原因,產(chǎn)生的圖片可能會(huì)由于視頻的原因而大小不一。對(duì)圖片處理的速度受到了圖片清晰度的影響,圖片越清晰,對(duì)圖片的處理的速度就越快?;诖?,需要先對(duì)圖片進(jìn)行處理,無(wú)關(guān)圖片的清晰度,都需要對(duì)其進(jìn)行處理,從而保證后續(xù)的處理更加快捷。第三個(gè)階段就是將處理后的圖片進(jìn)行人臉的識(shí)別,由于有圖片的預(yù)處理過(guò)程,人臉識(shí)別的部分的效果會(huì)更好,減小了識(shí)別過(guò)程中的誤差。第四個(gè)階段就是識(shí)別當(dāng)前的人臉的圖片中是否佩戴了安全帽,如果沒(méi)有帶的話(huà),此圖片就保留下來(lái)用以輸出。經(jīng)過(guò)這種分階段的處理過(guò),保證了實(shí)施性更高,速度更快,效果更好,準(zhǔn)確率更高。
3.5 ? 算法描述
根據(jù)方法設(shè)計(jì)中所提到的各種技術(shù),在提前訓(xùn)練好兩個(gè)模型的基礎(chǔ)之上提出一個(gè)算法用以開(kāi)發(fā)這個(gè)系統(tǒng),其中第一個(gè)模型用以識(shí)別該張圖片中是否存在人臉,而第二個(gè)模型用以識(shí)別該張圖片中是否存在安全帽,圖片符合第一個(gè)模型識(shí)別下在第二個(gè)模型中得到了一個(gè)否的情況就是我們最后得到的情況,即該張圖片中存在人臉,但是并不存在安全帽。
算法1基于分階段深度神經(jīng)網(wǎng)的安全違章識(shí)別
輸入:實(shí)時(shí)視頻
輸出:帶有安全帽的人員圖片
讀取輸入的視頻
根據(jù)幀率情況將視頻分解為合適的圖片集
For ?i←1 to 圖片集末尾 do:
調(diào)整當(dāng)前圖片的大小
將圖片進(jìn)行灰度化處理
If 當(dāng)前圖片包含人臉:
圈出人臉并生成人臉圖片并放入一個(gè)新的圖片集
標(biāo)記生成人臉的原始圖片
End For
根據(jù)人臉圖片集的標(biāo)記情況去除原始圖片集中不包含人臉的圖片
For ?j←1 to 人臉圖片集末尾 do:
If 當(dāng)前圖片包含安全帽:
根據(jù)當(dāng)前圖片的標(biāo)記,去除原始圖片集中對(duì)應(yīng)的圖片
End For
返回處理后的原始圖片集
4 ? 系統(tǒng)效果展示(System effect display)
本文系統(tǒng)主要是通過(guò)對(duì)視頻進(jìn)行處理,得到最后的不戴安全帽的人員的圖片并進(jìn)行展示。系統(tǒng)監(jiān)控的展示效果如圖2所示。其中,圖2(a)是室內(nèi)場(chǎng)景效果圖,圖2(b)是室外場(chǎng)景效果圖,圖2(c)是紅外線(xiàn)場(chǎng)景效果圖。在本文中,對(duì)效果圖的涉及敏感的隱私信息部分進(jìn)行了處理。
(a)室內(nèi)場(chǎng)景效果圖 ? ?(b)室外場(chǎng)景效果圖 ? ?(c)紅外線(xiàn)場(chǎng)景效果圖
本文使用三種場(chǎng)景的視頻文件中所獲取的圖像作為訓(xùn)練數(shù)據(jù)。在完成了訓(xùn)練之后,本文分別在室內(nèi)、室外和紅外線(xiàn)三個(gè)場(chǎng)景中對(duì)模型進(jìn)行測(cè)試,統(tǒng)計(jì)分析正確率和誤報(bào)率,其中室內(nèi)場(chǎng)景下得到圖像13張,檢測(cè)出未戴安全帽的圖像13張,正確率100%,誤報(bào)率0%,室外場(chǎng)景下得到圖像10張,檢測(cè)出未戴安全帽的圖像7張,正確率70%,誤報(bào)率30%,紅外場(chǎng)景下得到圖像30張,檢測(cè)到未戴安全帽的圖像26張,正確率86.67%,誤報(bào)率13.33%。通過(guò)分析可以發(fā)現(xiàn),由于室外場(chǎng)景相對(duì)較為復(fù)雜,因此正確率較低。在三種場(chǎng)景中,總體正確率為86.79%,誤報(bào)率達(dá)13.21%,可以滿(mǎn)足識(shí)別需求。三種場(chǎng)景檢測(cè)結(jié)果統(tǒng)計(jì)如表1所示。
5 ? 結(jié)論(Conclusion)
本文提出了一個(gè)基于分階段深度神經(jīng)網(wǎng)的施工違章識(shí)別系統(tǒng),該系統(tǒng)可以面向視頻實(shí)現(xiàn)實(shí)時(shí)監(jiān)控,識(shí)別出未按要求佩戴安全帽的人員。本系統(tǒng)提供了模型學(xué)習(xí)的功能,能利用監(jiān)控視頻數(shù)據(jù)自動(dòng)學(xué)習(xí)獲得檢測(cè)模型。用戶(hù)只要輸入所需要的視頻文件,就可以得到檢測(cè)模型。學(xué)習(xí)完成后,系統(tǒng)即可在此基礎(chǔ)上進(jìn)行檢測(cè)。在本文實(shí)驗(yàn)中,學(xué)習(xí)了兩個(gè)模型,并將其運(yùn)用到系統(tǒng)中,實(shí)現(xiàn)了從視頻當(dāng)中檢測(cè)出未佩戴安全帽的情況,獲得了較高的正確識(shí)別率。
參考文獻(xiàn)(References)
[1] 孫卓晟,彭來(lái)湖,倪利明,等.基于虛擬現(xiàn)實(shí)技術(shù)的機(jī)房動(dòng)力環(huán)境監(jiān)控系統(tǒng)設(shè)計(jì)[J].軟件工程,2020,23(3):28-31.
[2] 王昌海,申紅雪,張王衛(wèi),等.一種基于人臉識(shí)別的課堂教學(xué)監(jiān)控系統(tǒng)[J].軟件工程,2020,23(1):48-50.
[3] 呂永標(biāo),趙建偉,曹飛龍.基于復(fù)合卷積神經(jīng)網(wǎng)絡(luò)的圖像去噪算法[J].模式識(shí)別與人工智能,2017,30(2):97-105.
[4] 湯鯤,蔣炳南,彭艷兵,等.基于決策樹(shù)的多維屬性自動(dòng)推理識(shí)別[J].計(jì)算機(jī)與現(xiàn)代化,2017(2):83-87.
[5] 游清順,王建新,張秀宇,等.基于支持向量機(jī)的食品安全抽檢數(shù)據(jù)分析方法[J].軟件工程,2019,22(2):29-31.
[6] 李昌盛,伍之昂,張璐,等.關(guān)聯(lián)規(guī)則推薦的高效分布式計(jì)算框架[J].計(jì)算機(jī)學(xué)報(bào),2019(6):1218-1231.
[7] 黃健.基于深度學(xué)習(xí)與二維離散小波分解特征相融合的adaboost人臉識(shí)別模型[J].軟件工程,2020,23(2):43-46.
[8] 周飛燕,金林鵬,董軍.卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J].計(jì)算機(jī)學(xué)報(bào),2017,40(6):1229-1251.
[9] 萬(wàn)曉琪,宋輝,羅林根,等.卷積神經(jīng)網(wǎng)絡(luò)在局部放電圖像模式識(shí)別中的應(yīng)用[J].電網(wǎng)技術(shù),2019(6):2219-2226.
[10] Jin K H, McCann M T, Froustey E, et al. Deep convolutional neural network for inverse problems in imaging[J]. IEEE Transactions on Image Processing, 2017, 26(9): 4509-4522.
[11] 周力,閔海.基于局部連接度和差異度算子的水平集紋理圖像分割[J].中國(guó)圖像圖形學(xué)報(bào),2018,24(1):39-49.
[12] Ding, Changxing, Dacheng Tao. Robust face recognition via multimodal deep face representation[J]. IEEE Transactions on Multimedia, 2015, 17(11): 2049-2058.
作者簡(jiǎn)介:
劉思雨(1994-),女,碩士,助理工程師.研究領(lǐng)域:智能信息系統(tǒng),計(jì)算機(jī)應(yīng)用.
薛勁松(1977-),男,本科,高級(jí)工程師.研究領(lǐng)域:網(wǎng)絡(luò)安全,智能化信息系統(tǒng).
景棟盛(1981-),男,碩士,高級(jí)工程師.研究領(lǐng)域:軟件智能化,信息安全.