国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

人工智能在應(yīng)急管理領(lǐng)域的技術(shù)應(yīng)用研究

2021-08-07 14:22:48張懿黃江蘭田立勤欒尚敏
現(xiàn)代計(jì)算機(jī) 2021年17期
關(guān)鍵詞:數(shù)據(jù)挖掘分類人工智能

張懿,黃江蘭,田立勤,欒尚敏

(華北科技學(xué)院,計(jì)算機(jī)學(xué)院,三河 101601)

0 引言

1955年,John McCarthy與Marvin Lee Minsky以及Claude Elwood Shannon一同作為發(fā)起者,在達(dá)特茅斯學(xué)院邀請(qǐng)眾多專家學(xué)者開(kāi)會(huì)共同研討人工智能,在會(huì)議上正式確立人工智能(Artificial Intelligence)為一專業(yè)術(shù)語(yǔ),開(kāi)始了人工智能學(xué)術(shù)角度的專精研究。達(dá)特茅斯會(huì)議是人工智能誕生的標(biāo)志性事件[1],奠定了人工智能快速發(fā)展的基調(diào),而發(fā)展至今的深度學(xué)習(xí)、識(shí)別技術(shù)在城市應(yīng)急管理領(lǐng)域的研究,對(duì)于分析事故,改善城市安全具有重要意義。

1 機(jī)器學(xué)習(xí)應(yīng)用

機(jī)器學(xué)習(xí)是指可以提供計(jì)算機(jī)能力而無(wú)需顯式編程的研究領(lǐng)域。Tom Mitchell定義機(jī)器學(xué)習(xí)為:對(duì)于某類給定的任務(wù)T和合理的性能度量P,如果某計(jì)算機(jī)程序在T上以P衡量的性能隨著經(jīng)驗(yàn)E而自我完善,性能逐步提高,則稱該計(jì)算機(jī)程序從經(jīng)驗(yàn)E學(xué)習(xí)[2]。機(jī)器學(xué)主要解決的是聚類、分類、預(yù)測(cè)和降維四類問(wèn)題,可分類為有監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、深度學(xué)習(xí)等。在應(yīng)急管理領(lǐng)域使用機(jī)器學(xué)習(xí)技術(shù)對(duì)于數(shù)據(jù)的訓(xùn)練處理是非常重要的。

1.1 監(jiān)督學(xué)習(xí)

監(jiān)督學(xué)習(xí)是指用有標(biāo)簽的數(shù)據(jù)集來(lái)預(yù)測(cè)新數(shù)據(jù)的值或類型,主要進(jìn)行模型的預(yù)測(cè)泛化處理。若預(yù)測(cè)的是離散數(shù)值,該類學(xué)習(xí)稱為分類。預(yù)測(cè)的是連續(xù)數(shù)值,則該類學(xué)習(xí)稱為回歸。

分類是利用實(shí)際模型來(lái)預(yù)測(cè)屬性和標(biāo)簽未知的對(duì)象類別的一種描述尋找和分類數(shù)據(jù)類型以及概念的過(guò)程,分類可以達(dá)到利用模型預(yù)測(cè)不知道的對(duì)象的目的。若涉及兩個(gè)類別,稱為二分類(binary classification)任務(wù),若涉及多個(gè)類別,稱為多分類任務(wù)(multi-class classification),例如事故多責(zé)任判定,文件分類判定技術(shù)等[3]。

(1)

線性回歸的一般形式為:

Y=β0+β1X1+β2X2+β3X3+…+βpXp+ε

(2)

其中ε~N(0,σ2),β0~βp為未知參數(shù),全部建模殘差平方之和ε應(yīng)盡量達(dá)到最小,并且用1進(jìn)行殘差平方之和的偏執(zhí)擬合。對(duì)β0~βp求偏導(dǎo)并等于0,得到正規(guī)方程:

XTXβ=XTY

(3)

=(XTX)-1XTY

(4)

找到最小的β,就可以擬合構(gòu)造直線找到數(shù)據(jù)的關(guān)系。但是在實(shí)際問(wèn)題中常常會(huì)有X的屬性個(gè)數(shù)大于樣本個(gè)數(shù)的情況,即XTX不是滿秩矩陣或者正定矩陣,則會(huì)得到多個(gè),且都能使誤差平方和達(dá)到最小化,選擇哪個(gè)解作為輸出,將由學(xué)習(xí)算法的歸納偏好決定。常見(jiàn)的做法是引入正則化項(xiàng),如嶺回歸等。

邏輯回歸是在線性回歸的求解結(jié)果上添加輸入值為z的Sigmoid函數(shù):

(5)

其中:

z=ω0x0+ω1x1+ω2x2+…+ωnxn(6)

Sigmoid函數(shù)圖像類似階躍函數(shù),目的是將數(shù)值結(jié)果轉(zhuǎn)化成0到1之間的概率來(lái)實(shí)現(xiàn)Logistic回歸,計(jì)算回歸系數(shù)和特征值的乘積并且求和,最后把結(jié)果代到Sigmoid激活,可以得出一個(gè)范圍在0~1之間的數(shù)值,可畫出一條分類線。大于0.5的數(shù)據(jù)被映射為1,小于0.5的數(shù)據(jù)則被映射為0。[5]從而輸出離散的分類。屬于監(jiān)督學(xué)習(xí)的常見(jiàn)模型有線性分類器、SVM等。監(jiān)督學(xué)習(xí)算法有:K-近鄰算法(K-Nearest Neighbors,KNN)[6]、決策樹(shù)(Decision Trees)[7]、樸素貝葉斯(Naive Bayes)[8]等。

1.2 無(wú)監(jiān)督學(xué)習(xí)

無(wú)監(jiān)督學(xué)習(xí)是指用完全無(wú)標(biāo)簽的數(shù)據(jù)集來(lái)預(yù)測(cè)新數(shù)據(jù)的值或類型,假設(shè)數(shù)據(jù)空間中相似樣本一般距離較近來(lái)將樣本進(jìn)行分類。在無(wú)監(jiān)督學(xué)習(xí)中,關(guān)聯(lián)分析、聚類問(wèn)題和維度減少是三種重要問(wèn)題。關(guān)聯(lián)分析指發(fā)現(xiàn)不同事物同時(shí)出現(xiàn)的概率,廣泛應(yīng)用于購(gòu)物籃問(wèn)題。[9]聚類分析是指將訓(xùn)練數(shù)據(jù)集里的數(shù)據(jù)分成很多個(gè)小組,每個(gè)小組形成一個(gè)“簇”(cluster),預(yù)先并不設(shè)置類別,訓(xùn)練數(shù)據(jù)無(wú)標(biāo)簽,目的是聚合相似的數(shù)據(jù),但是不探討數(shù)據(jù)小組的具體內(nèi)容,最后根據(jù)結(jié)果差別得出信息。維度約減是指在減少數(shù)據(jù)維度的同時(shí)又不損失有意義的信息,可以利用特征提取法和特征選擇法來(lái)實(shí)現(xiàn),特征選擇法是選擇原始變量的子集,而特征提取法是把數(shù)據(jù)從高維度向低維度進(jìn)行轉(zhuǎn)換。

1.3 深度學(xué)習(xí)

深度學(xué)習(xí)(Deep Learning)概念源于M-P模型[10]與Hopfield神經(jīng)網(wǎng)絡(luò)[11]。人工神經(jīng)網(wǎng)絡(luò)(ANN)代表著一種自上而下的思路,類似于生物大腦神經(jīng)元的作業(yè)機(jī)理與運(yùn)行機(jī)制,每個(gè)神經(jīng)元通過(guò)特定的激勵(lì)函數(shù),處理并計(jì)算來(lái)自另外的神經(jīng)元傳入信號(hào),信號(hào)輸入到輸入層,經(jīng)由隱層處理,再到達(dá)輸出層,這一過(guò)程達(dá)到了分層學(xué)習(xí)的目的。深度學(xué)習(xí)模型是一些幾何函數(shù)一個(gè)個(gè)地作用在數(shù)據(jù)上參與運(yùn)算,這些運(yùn)算被組織成為層,層進(jìn)行堆疊則形成圖。

圖1 一個(gè)深度學(xué)習(xí)結(jié)構(gòu)圖

圖中圓代表一個(gè)神經(jīng)節(jié)點(diǎn),相鄰的層節(jié)點(diǎn)之間彼此有鏈接,同層或越層節(jié)點(diǎn)彼此之間無(wú)連接。Layer1為一個(gè)輸入層,最終計(jì)算出來(lái)的H函數(shù)即預(yù)測(cè)值的層為輸出層,中間的層為負(fù)責(zé)數(shù)據(jù)變換的隱層,每一條直線代表了該節(jié)點(diǎn)到下一節(jié)點(diǎn)的權(quán)重,而且會(huì)存在偏置b,權(quán)重(weight)是在訓(xùn)練過(guò)程中需要學(xué)習(xí)的參數(shù),其中保存著模型的知識(shí),權(quán)重把這些層進(jìn)行參數(shù)化,得出預(yù)測(cè)值后,用損失函數(shù)即真實(shí)值和預(yù)測(cè)值的誤差最小化來(lái)衡量網(wǎng)絡(luò)準(zhǔn)確性,為這些權(quán)重找到合適值即深度學(xué)習(xí)。

在《懸崖上的愛(ài)》中,野生動(dòng)物研究專家方東升是個(gè)一出場(chǎng)就自帶光環(huán)的人物,他常年在野外考察,在研究領(lǐng)域獲獎(jiǎng)無(wú)數(shù),深受包括岳西在內(nèi)的學(xué)生敬仰和崇拜。但讓方東升在野生動(dòng)物研究這條路上抵達(dá)巔峰的,卻是多年前的一場(chǎng)婚姻危機(jī)給他帶來(lái)的性命威脅。方東升最初在事業(yè)上的成功吸引了許多女性,一時(shí)間女人的肉體成了是他獵物①,讓他充分享受到征服的快感。

從輸入層通過(guò)隱層到輸出層的運(yùn)動(dòng)為正向傳播。相應(yīng)的,建立神經(jīng)網(wǎng)絡(luò)時(shí),會(huì)出現(xiàn)初始的權(quán)重與誤差,迭代一次后,該誤差與成本函數(shù)梯度在外層通過(guò)隱層返回,可減少錯(cuò)誤,此時(shí)網(wǎng)絡(luò)的權(quán)重會(huì)被更新,即為誤差反向傳播。深度學(xué)習(xí)是學(xué)習(xí)樣本數(shù)據(jù)的表示層次與內(nèi)在規(guī)律[12],是多層的神經(jīng)網(wǎng)絡(luò)模型且層和層之間的聯(lián)系更為復(fù)雜,通過(guò)分層提取信息進(jìn)行學(xué)習(xí),達(dá)到了高效的目的。深度學(xué)習(xí)主要涵蓋四個(gè)發(fā)展路徑。分別是卷積神經(jīng)網(wǎng)絡(luò)(CNN)[13]、生成網(wǎng)絡(luò)[14]、序列模型[15]、增強(qiáng)學(xué)習(xí)[16]。

在人工智能以及大數(shù)據(jù)的新技術(shù)思維背景之下,通過(guò)應(yīng)急管理部和各級(jí)政府的數(shù)字化轉(zhuǎn)型,事后完善恢復(fù)系統(tǒng)也愈發(fā)成熟。發(fā)展迅速且火熱的深度學(xué)習(xí)技術(shù)通過(guò)訓(xùn)練數(shù)據(jù)、提高算法和建模精度使得事故的善后恢復(fù)和預(yù)防大大提高了效果,規(guī)模龐大且有效的數(shù)據(jù)是深度學(xué)習(xí)技術(shù)得以提高的重要來(lái)源,對(duì)于各類突發(fā)事件各環(huán)節(jié)的數(shù)據(jù)進(jìn)行訓(xùn)練,可以為事前預(yù)防系統(tǒng)提供更加準(zhǔn)確的分析處理能力,利用建模來(lái)可視化數(shù)據(jù),做到更加智能的預(yù)防,從而提高智慧城市應(yīng)急管理系統(tǒng)的響應(yīng)能力。

2 數(shù)據(jù)挖掘

數(shù)據(jù)挖掘(Data Mining)是一種涉及統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫(kù)技術(shù)以及機(jī)器學(xué)習(xí)的綜合性技術(shù)。主要分為預(yù)測(cè)性數(shù)據(jù)挖掘和描述性數(shù)據(jù)挖掘兩類[17]。

應(yīng)急管理信息大數(shù)據(jù)系統(tǒng)的構(gòu)建是至關(guān)重要的,在事發(fā)響應(yīng)、事中處理的過(guò)程中,由于各種突發(fā)事故所處的具體條件和環(huán)境不相同,各個(gè)時(shí)間段的特殊形勢(shì)、規(guī)模、性質(zhì)和后果不同,受到事故影響的人民群眾情況不同,因此事中處理的步驟程序也各有不同。人工智能在事中處理系統(tǒng)中的應(yīng)用,主要體現(xiàn)在良好控制的環(huán)節(jié)當(dāng)中,其中最重要的是社會(huì)輿論。社會(huì)輿論是突發(fā)事件發(fā)生后在社會(huì)上流傳最快的消息之一,一般分為正向輿論和負(fù)面輿論。正向輿論可以對(duì)事故的處理起到激勵(lì)作用,消解人民對(duì)于事故發(fā)生后的恐慌情緒,但負(fù)面的輿論以及謠言往往會(huì)引起人們的恐慌和反社會(huì)情緒,從而嚴(yán)重?cái)_亂社會(huì)秩序,間接地影響事故的處理與社會(huì)恢復(fù)。

表1中列出十大經(jīng)典數(shù)據(jù)挖掘算法(Top 10 data mining algorithms)[18]。

表1 十大數(shù)據(jù)挖掘算法

為了控制負(fù)面輿論,數(shù)據(jù)挖掘技術(shù)會(huì)作為合理的處理手段運(yùn)用到各種社交網(wǎng)絡(luò)和各大網(wǎng)絡(luò)平臺(tái)中,根據(jù)相關(guān)關(guān)鍵詞對(duì)或?qū)⒃斐韶?fù)面輿論的言語(yǔ)或謠言進(jìn)行自動(dòng)捕捉和刪除,將嚴(yán)重危害社會(huì)穩(wěn)定的散播謠言人員的網(wǎng)絡(luò)IP捕獲,避免負(fù)面信息的滋生,從而起到控制事態(tài)的作用。

3 語(yǔ)音識(shí)別

語(yǔ)音識(shí)別是一種使機(jī)器識(shí)別并且理解人類語(yǔ)音輸入信號(hào)含義的一種模式識(shí)別技術(shù),該技術(shù)旨在將語(yǔ)音轉(zhuǎn)換為命令編碼或者字符文本,設(shè)計(jì)一定的程序使計(jì)算機(jī)明白人類講話的語(yǔ)義并進(jìn)行合理判斷。

圖2 語(yǔ)音識(shí)別流程圖

首先對(duì)采集的非平穩(wěn)語(yǔ)音信號(hào)進(jìn)行預(yù)處理,過(guò)濾掉無(wú)用信息及其背景噪聲,然后運(yùn)用特定方法計(jì)算語(yǔ)音聲學(xué)參數(shù)來(lái)提取相應(yīng)的特征參數(shù),再模式識(shí)別提取到的參數(shù)。其中包含兩階段:第一階段是訓(xùn)練,即提取語(yǔ)音樣本的特征參數(shù)作為訓(xùn)練數(shù)據(jù),設(shè)置模型參數(shù)初始值時(shí)要相對(duì)合理,使識(shí)別系統(tǒng)的識(shí)別效果達(dá)到最好;之后進(jìn)行識(shí)別,把要識(shí)別的語(yǔ)音信號(hào)特征依據(jù)特定規(guī)則進(jìn)行對(duì)照處理,最終利用模式識(shí)別算法得出需要的結(jié)果。特征參數(shù)的選擇決定了識(shí)別結(jié)果的準(zhǔn)確度與模板庫(kù)是否準(zhǔn)確、模型參數(shù)的優(yōu)劣。

隱馬爾可夫模型(HMM)理論假設(shè)時(shí)間序列系統(tǒng)是由一系列隱狀態(tài)構(gòu)成,不同的隱狀態(tài)之間的轉(zhuǎn)換是系統(tǒng)運(yùn)行的本質(zhì),來(lái)觀察并分析語(yǔ)音基礎(chǔ)時(shí)間序列[26]。

顯式馬爾可夫模型可看作一個(gè)以一定概率自動(dòng)轉(zhuǎn)換狀態(tài)的過(guò)程,具有無(wú)后效性的特性即:

P(pt=Si|pt-1=Sj,pt-2=Sk,……)=P(pt=Si|pt-1=Sj)

(7)

其中t>1,Sk為一時(shí)刻的任意狀態(tài)。還具有齊次性的特點(diǎn)即:

P(pt=Si|pt-1=Sj)=P(pu=Si|pu-1=Sj)

(8)

其中u為任意時(shí)刻,說(shuō)明狀態(tài)轉(zhuǎn)移概率與時(shí)間無(wú)關(guān)。而隱馬爾可夫模型則是雙重隨機(jī)過(guò)程,不僅狀態(tài)之間的轉(zhuǎn)移是一個(gè)隨機(jī)過(guò)程,而且狀態(tài)的輸出也是一個(gè)隨機(jī)過(guò)程。此外,隱馬爾可夫模型的輸出僅與當(dāng)前狀態(tài)有關(guān),具有輸出獨(dú)立性。

先進(jìn)行時(shí)間序列分段,然后根據(jù)時(shí)序性與相似性來(lái)聚類這些時(shí)間序列分段,把每個(gè)聚類看作一種隱狀態(tài)從而得出狀態(tài)轉(zhuǎn)移概率矩陣,建立基于分段的初始隱馬爾科夫模型,對(duì)隱狀態(tài)下的時(shí)間序列分段的分布做出估計(jì),由于隱含因子直接存在轉(zhuǎn)換概率,就可以得到與顯式狀態(tài)之間的輸出概率,再利用迭代法,對(duì)初始隱馬爾科夫模型不斷精確直到得出最終模型。文獻(xiàn)[27]最終得出的隱馬爾科夫模型的每一種狀態(tài)都可以和接收到的語(yǔ)音幀一一對(duì)應(yīng),現(xiàn)如今傳統(tǒng)的隱馬爾科夫模型廣泛運(yùn)用在時(shí)間歸一法,在事故救援與分析成因有廣泛應(yīng)用前景。

4 計(jì)算機(jī)視覺(jué)

計(jì)算機(jī)視覺(jué)(Computer Vision,CV)是利用了攝像機(jī)以及電腦替代人眼使得計(jì)算機(jī)擁有人類的雙眼所具有的分割、分類、識(shí)別、跟蹤、判別決策等功能。

4.1 物體識(shí)別檢測(cè)

物體識(shí)別和檢測(cè)即給定一張輸入圖片,算法能夠自動(dòng)找出圖片中的常見(jiàn)物體,并將其所屬類別及位置輸出。物體分類與檢測(cè)在很多領(lǐng)域有廣泛應(yīng)用,包括安防領(lǐng)域的人臉識(shí)別、行人檢測(cè)、智能視頻分析、行人跟蹤等,交通領(lǐng)域的交通場(chǎng)景物體識(shí)別、車輛計(jì)數(shù)、逆行檢測(cè)、車牌檢測(cè),以及互聯(lián)網(wǎng)領(lǐng)域的基于內(nèi)容的圖像檢索、相冊(cè)自動(dòng)歸類等[28]。

在事故預(yù)防過(guò)程中,人工智能下的視頻識(shí)別技術(shù)得以運(yùn)用,通過(guò)視頻資料的讀取和識(shí)別,來(lái)監(jiān)測(cè)并判定其中的內(nèi)容是否符合預(yù)先設(shè)定的報(bào)警條件,如果條件符合則通過(guò)傳感器觸發(fā)報(bào)警。基本的對(duì)人識(shí)別內(nèi)容有人的舉動(dòng)、人的面目表情、人的步態(tài)等信息,而對(duì)物識(shí)別可識(shí)別物品缺失,線路故障、區(qū)域變化、滯留監(jiān)測(cè)等。運(yùn)用視頻識(shí)別,可有效地代替人工的查找和報(bào)告事故隱患,達(dá)到應(yīng)急響應(yīng)智能化的轉(zhuǎn)變。但該技術(shù)仍有許多缺陷,很多理想效果并未完全實(shí)現(xiàn)。

4.2 語(yǔ)義分割

語(yǔ)義分割是將圖片中的物體場(chǎng)景分割出來(lái),是自動(dòng)駕駛、醫(yī)學(xué)圖像處理、圖像檢索、目標(biāo)分類等視覺(jué)分析的基礎(chǔ)。例如,在自動(dòng)駕駛領(lǐng)域,需要對(duì)道路、行人、車輛等復(fù)雜情況進(jìn)行分析,從而才能對(duì)汽車發(fā)出操作指令。在對(duì)這些物體分析之前,首先需要進(jìn)行語(yǔ)義分割,即將事故道路、行人以及車輛分割出來(lái)。在醫(yī)學(xué)圖像處理領(lǐng)域,首先要將病灶區(qū)分割出來(lái),才能對(duì)病灶進(jìn)行量化分析[29]。

5 結(jié)語(yǔ)

隨著人工智能發(fā)展日趨成熟,怎樣將不斷涌現(xiàn)的技術(shù)在應(yīng)急管理體系各層次深度融合、綜合應(yīng)用,給城市應(yīng)急管理與安防行業(yè)提出了更高的挑戰(zhàn),尤其是經(jīng)過(guò)此次新冠疫情后,突發(fā)衛(wèi)生公共問(wèn)題會(huì)使得人工智能的應(yīng)用領(lǐng)域不斷擴(kuò)展與深入,使損失降到最低,為國(guó)家發(fā)展創(chuàng)造更大的價(jià)值。

猜你喜歡
數(shù)據(jù)挖掘分類人工智能
分類算一算
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
分類討論求坐標(biāo)
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業(yè)
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
數(shù)讀人工智能
小康(2017年16期)2017-06-07 09:00:59
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
下一幕,人工智能!
喀喇沁旗| 南康市| 偏关县| 土默特左旗| 淄博市| 临猗县| 奇台县| 会同县| 克东县| 泸西县| 墨江| 九台市| 尖扎县| 弋阳县| 定陶县| 林芝县| 屯门区| 兴城市| 安吉县| 安庆市| 长乐市| 淮滨县| 东乌珠穆沁旗| 资兴市| 上饶市| 石家庄市| 桦甸市| 屏山县| 廉江市| 保亭| 广水市| 黔南| 义乌市| 墨脱县| 台安县| 太康县| 蓝山县| 陇川县| 都江堰市| 泾川县| 双牌县|