郭 策 金 楓 馬朝陽
(1.北京北礦智能科技有限公司,北京 102628;2.金屬礦山智能開采技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 102628;3.礦冶科技集團(tuán)有限公司,北京 100160)
為了更好地研究和探討不規(guī)范航行的識別方法,本論文主要從以下三個(gè)方面對不規(guī)范航行通告的識別與識別方法展開論述。本文的目的是通過基于NLP的方法建立模型,通過預(yù)處理和識別不規(guī)范航行通告,提取不規(guī)范航行載具的運(yùn)動軌跡、速度等信息,進(jìn)行航行的安全性數(shù)據(jù)分析和優(yōu)化,使駕駛者的安全意識得以提升,減少交通事故的發(fā)生幾率。
信息是一種客觀的現(xiàn)象和事物的屬性及其變化的規(guī)律性的總和信息的概念,是指人們在社會生活中所接觸到的一切信息,包括文字、圖形、聲音等,也可以說信息就是人的思想和感情的反應(yīng)過程。不規(guī)范的航行通告識別系統(tǒng)主要研究的是不規(guī)范航行信息的識別與分析,它是一個(gè)對不規(guī)范的運(yùn)輸路線進(jìn)行實(shí)時(shí)的監(jiān)控與追蹤,并通過對異常情況的預(yù)警來實(shí)現(xiàn)對運(yùn)輸車輛的有效管理。
不規(guī)范的航行通告是指沒有經(jīng)過國家相關(guān)部門的批準(zhǔn)而在港口、碼頭等地方行駛的通告;影響交通安全不規(guī)范的航行通告會對運(yùn)輸設(shè)備造成一定的干擾作用,使其不能正常地運(yùn)行和使用。例如,如果在港的時(shí)候需要進(jìn)出,那么就必須要通過正規(guī)的程序來檢查,然后再由船公司的工作人員來負(fù)責(zé)。對于交通運(yùn)輸來說,它是一個(gè)非常重要的方面,它也可以為人們的出行提供便利,但同時(shí)也給城市的發(fā)展帶來了巨大的壓力和挑戰(zhàn)。因?yàn)橐坏┯辛瞬粶?zhǔn)確的航行通告,不僅僅會給我們的生活以及工作環(huán)境帶去威脅,而且還會破壞到整個(gè)地區(qū)的穩(wěn)定與和諧。因此,為了保證航行的安全性和效率,對其研究十分有必要[1]。
根據(jù)不規(guī)范航行通告的識別方法,可將其分為兩大類:一類是基于圖論的分類方法,另一類是基于神經(jīng)網(wǎng)絡(luò)的分類方法。(1)圖論的分類。不規(guī)范運(yùn)輸調(diào)度系統(tǒng)的主要功能就是對不規(guī)范的車輛進(jìn)行合理的規(guī)劃和管理,從而提高了交通的運(yùn)行效率。因此在研究中,有必要對其數(shù)學(xué)模型建立和分析,以方便對交通運(yùn)輸過程的優(yōu)化設(shè)計(jì)。(2)基于神經(jīng)網(wǎng)絡(luò)的分類方法。將不規(guī)范航行通告文本序列視為一組token,基于詞嵌入技術(shù),進(jìn)而將句子表示成token序列?;趖oken的標(biāo)識進(jìn)行詞性或詞義分類,應(yīng)用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)等常用深度學(xué)習(xí)技術(shù)實(shí)現(xiàn)文本序列建模。
在不規(guī)范運(yùn)行信息中,以前通常使用的是傳統(tǒng)的識別方法,這種方法是將不規(guī)范航行通告的發(fā)生原因和影響因素作為研究對象,然后對其進(jìn)行分類,最后再利用神經(jīng)網(wǎng)絡(luò)的原理對其特征、類型、分布等方面的內(nèi)容進(jìn)行分析,并根據(jù)這些特點(diǎn)來識別出不規(guī)范的航行通告[2]。目前,有很多的學(xué)者都致力于研究人工神經(jīng)網(wǎng)絡(luò)的模型來解決不精確的安全駕駛問題。其中有一種就是用模糊的數(shù)學(xué)語言來描述它的過程:在系統(tǒng)的輸入層,將一個(gè)復(fù)雜的非線性函數(shù)映射到輸出層上,接著通過輸出層的神經(jīng)元與外部環(huán)境的連接關(guān)系,從而得到了整個(gè)系統(tǒng)的狀態(tài)反饋。本文主要介紹的是基于NLP的智能識別的方法。該方法的優(yōu)點(diǎn)是簡單,可以很容易地從計(jì)算機(jī)的角度去處理,并且具有很強(qiáng)的魯棒性[3]。但是也存在著一定的缺點(diǎn),比如只能適用于一些特定的條件下,而不能完全適用于某些特殊的情況。
首先,對不規(guī)范航行通告進(jìn)行預(yù)判,然后對不規(guī)范運(yùn)行的原因分析,最后根據(jù)識別結(jié)果確定是否需要采取預(yù)判措施。在本實(shí)驗(yàn)中,先通過實(shí)驗(yàn)對比,判斷不規(guī)范航行的目的是什么,再從系統(tǒng)的角度出發(fā),選擇合適的識別方法,并結(jié)合實(shí)際的應(yīng)用情況,最終得出結(jié)論。在本實(shí)驗(yàn)中,主要采用了3種識別方法,分別為:(1)特征值法。該方法是一種比較常用的數(shù)據(jù)處理的算法;(2)神經(jīng)網(wǎng)絡(luò)法。它是將復(fù)雜的信息從大量的樣本空間映射到了有意義的集合上,并將其作為一個(gè)整體來研究。它具有簡單容易實(shí)現(xiàn)的特點(diǎn);(3)支持向量機(jī)(SVM)。它可以用于分類和建模,并且能夠很好地解決一些問題。3種方法都是以訓(xùn)練集為基礎(chǔ)的模型來建立的;各個(gè)模塊的組合都是用來輔助的對象和輸入的參數(shù)之間的關(guān)系以及輸出的概率分布。
計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)在軍事領(lǐng)域的應(yīng)用越來越廣泛,在航行運(yùn)輸中,通過對不規(guī)范航行通告的研究和分析,可以對不規(guī)范航行做出預(yù)警,從而減少損失。本文的主要內(nèi)容是利用MATLAB軟件進(jìn)行仿真,并結(jié)合Matlab中的運(yùn)動學(xué)和數(shù)學(xué)模型,建立起一個(gè)精確的、高效的、通用的航行通告識別系統(tǒng)。本論文的重點(diǎn)在于,如何識別出不規(guī)范的航行通告,并將其應(yīng)用于實(shí)際的駕駛過程,該系統(tǒng)的設(shè)計(jì)思路如下:(1)根據(jù)目標(biāo)車的行駛速度,以及環(huán)境的變化來判斷是否存在異常,然后再確定該車型的具體位置,最后再將其傳回?cái)?shù)據(jù)庫。(2)首先,需要對該車型的所有數(shù)據(jù)的采集及處理,包括車速和加速度等。其次,是要計(jì)算出該車型的相關(guān)參數(shù),比如發(fā)動機(jī)的轉(zhuǎn)速等。再次,就是要考慮到駕駛員的反應(yīng)時(shí)間,當(dāng)出現(xiàn)了緊急情況,應(yīng)該及時(shí)地采取相應(yīng)的應(yīng)對措施[3]。
該模塊主要是對不規(guī)范航行通告的識別和判斷包括對不規(guī)范運(yùn)行的分析、判定和預(yù)測。主要模塊有對不規(guī)范航行的識別,以及對于不規(guī)范運(yùn)行的預(yù)警機(jī)制的研究。在本系統(tǒng)中,將根據(jù)不同的規(guī)則分別建立起針對性的安全警告信息庫,并通過該庫的數(shù)據(jù)進(jìn)行預(yù)判,從而確定是否存在異常。然后再結(jié)合具體的事件來制定出相應(yīng)的應(yīng)對策略。
本次實(shí)驗(yàn)主要是為了驗(yàn)證不規(guī)范化航行通告識別的應(yīng)用效果,因此需要在實(shí)驗(yàn)前對實(shí)驗(yàn)數(shù)據(jù)進(jìn)行預(yù)處理,并將預(yù)處理結(jié)果與實(shí)際運(yùn)行情況對比,從而確定是否使用不規(guī)范化航行通告識別。首先,在MATLAB的環(huán)境中,設(shè)置好時(shí)間間隔,并將采集到的信息通過SPSS17.0軟件的GUI顯示模塊的形式發(fā)送給主控中心,主控中心可以根據(jù)接收到的信息對所收集的信息做出相應(yīng)的反應(yīng)和判斷。其次,在K-3的窗口中,將本系統(tǒng)的關(guān)鍵詞放在Excel表中,然后利用SPSS22.0來生成表格,方便用戶查看。最后,當(dāng)所有的樣本都測試完畢,則會把本文本框發(fā)給終端,由其來發(fā)送控制指令,同時(shí)也會發(fā)出提示,以提醒注意觀察。如果沒有達(dá)到要求,則會自動執(zhí)行相關(guān)操作[4]。
經(jīng)過對不規(guī)范航行船舶的仿真實(shí)驗(yàn),可以得出以下結(jié)論:(1)對不規(guī)范航行的影響:由于沒有建立起完善的數(shù)學(xué)模型,所以在運(yùn)行過程中,可能會出現(xiàn)一系列的錯(cuò)誤操作。(2)對不規(guī)范航行的預(yù)測:在進(jìn)行了大量的實(shí)驗(yàn)后,發(fā)現(xiàn)數(shù)據(jù)與實(shí)際的相差較大,這就表明有很多的誤差存在,這些誤差的產(chǎn)生是由許多因素造成的,例如時(shí)間和天氣等。
傳統(tǒng)的不規(guī)范航行通告識別方式主要有以下幾種:(1)人工識別:這種方法是通過現(xiàn)場的觀察和記錄,對不規(guī)范航行做出正確的判斷;(2)機(jī)器識別:在進(jìn)行了大量的資料收集之后,再對這些信息進(jìn)行進(jìn)一步的分析和處理,然后再將它們輸入到計(jì)算機(jī)中,從而實(shí)現(xiàn)對運(yùn)輸過程的控制;(3)專家系統(tǒng):該方法是一種比較先進(jìn)的檢測技術(shù),它能夠快速地發(fā)現(xiàn)不規(guī)范航行的行為并及時(shí)的作出反應(yīng),同時(shí)還能為決策者提供可靠的參考數(shù)據(jù)。但是由于其自身的局限性,它只能適用于一些特定的情況下,并不能完全解決具體的問題;另外,該方法也存在著一定的缺點(diǎn),比如無法實(shí)時(shí)的監(jiān)控到交通狀況,導(dǎo)致預(yù)測的不準(zhǔn)確性。但隨著科技的發(fā)展與進(jìn)步,人工智能化的研究也逐漸的開始應(yīng)用,這就使得智能化的辨識方式越來越多地出現(xiàn)在人們的日常生活中。
在進(jìn)行航路上的不規(guī)范航行通告的識別時(shí),可以用圖來表示。比如航路上的不規(guī)范航行通告,圖上的符號是“向”,它代表的是不規(guī)范的航行通告。在進(jìn)行航路上的違規(guī)船舶的識別時(shí),圖上的“向”的特點(diǎn)就是由圖右下角的箭頭來表示。因?yàn)轳{駛員的意圖是為了駕駛?cè)藛T的安全而設(shè)計(jì)的;所以,在進(jìn)行判斷的時(shí)候就會有很大的可能性。因此對于不規(guī)范的航行通告,需要對其做出準(zhǔn)確的識別和分析。在對違章行為的識別的過程中,圖上的符號也要根據(jù)實(shí)際情況做出相應(yīng)的變化。
預(yù)處理是指對不規(guī)范航行通告進(jìn)行識別、過濾、篩選和分析,并將其分類從而確定是否為違規(guī)的航行通告。首先,需要對文本中的標(biāo)點(diǎn)符號進(jìn)行預(yù)處理,通常利用正則表達(dá)式進(jìn)行判定;其次,應(yīng)用基于隱馬爾可夫的jieba分詞庫,對文本中的中文詞語進(jìn)行有效分割;再次,將文本中分割后的詞頻進(jìn)行統(tǒng)計(jì),消除小樣本噪聲;最后,將預(yù)處理后的每一個(gè)分詞進(jìn)行唯一識別號關(guān)聯(lián),用于后續(xù)的模型訓(xùn)練[5]。
在不規(guī)范航行通告的分割中加入一個(gè)NLP的概念來識別,NLP是指通過對不規(guī)范航行通告的分析和處理,將其與普通的航行通告進(jìn)行對比,從而判斷出是否存在違規(guī)行為[6]。這種新的方法也有很多的優(yōu)點(diǎn):(1)對于不規(guī)范的運(yùn)輸車輛,由于其自身的特點(diǎn)使得它的識別難度增加,所以需要對其的識別過程加以嚴(yán)格地把控[7]。(2)雖然該算法的原理很簡單,但是也有一些不足之處,比如說,當(dāng)駕駛員的反應(yīng)時(shí)間較長時(shí),就會導(dǎo)致錯(cuò)誤的發(fā)生概率加大,而且當(dāng)出現(xiàn)突發(fā)事件時(shí),因?yàn)樵撍惴ǖ臏?zhǔn)確度不高,因此無法保證準(zhǔn)確性[8]。
對于不規(guī)范航行,我們可以通過區(qū)域的劃分來進(jìn)行識別。
(1)根據(jù)地形、地貌等因素,對不規(guī)范航行的區(qū)域進(jìn)行分析,將其分為不同的區(qū)域。在地勢較為復(fù)雜的地區(qū),如山區(qū)和丘陵等,這些地方的安全系數(shù)較低,因此不規(guī)范運(yùn)行的概率較大;而在地勢相對平坦的地區(qū),如鐵路和公路等,這些地方的安全系數(shù)較高,因此一般不會發(fā)生大的交通事故[9]。(2)按照河流的流量大小,將整個(gè)河網(wǎng)劃為一個(gè)個(gè)的小流域,這樣做的好處是能夠有效地減少河網(wǎng)的擁擠程度,提高運(yùn)輸效率,但是這種做法的缺點(diǎn)是無法對河的流量做出準(zhǔn)確的判斷和預(yù)測,并且不能很好地控制進(jìn)出口的車輛數(shù)量,一旦出現(xiàn)擁堵情況,就會造成很大的損失[10]。
本文對不規(guī)范航行通告的神經(jīng)網(wǎng)絡(luò)方法進(jìn)行了研究,分析比較了各種模型和算法在不同條件下所表現(xiàn)出來的優(yōu)劣。通過實(shí)驗(yàn)對比發(fā)現(xiàn):(1)在不一樣條件時(shí),每種建模方式都有其適用范圍。(2)從仿真結(jié)果看得到最優(yōu)參數(shù)是最小化期望誤差與最大通信容量之間線性度;而當(dāng)傳輸速率高、速度快或者數(shù)據(jù)量大時(shí),可以選擇使用最短路徑法來進(jìn)行模擬計(jì)算分析,得出最佳節(jié)點(diǎn)位置和優(yōu)化模型,在不一樣的條件下,傳輸速率越快、通信容量越大時(shí)選擇最多路徑法。(3)從模型結(jié)果看得到最優(yōu)參數(shù)是最小化期望誤差與最大通信質(zhì)量之間的線性度,而最短路徑方法可以有效地減少信息量。