基于NLP的不規(guī)范航行通告識別方法

2023-04-05 21:08:28馬朝陽

中文信息 2023年3期

郭策金楓馬朝陽

（1.北京北礦智能科技有限公司，北京 102628；2.金屬礦山智能開采技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室，北京 102628；3.礦冶科技集團(tuán)有限公司，北京 100160）

為了更好地研究和探討不規(guī)范航行的識別方法，本論文主要從以下三個(gè)方面對不規(guī)范航行通告的識別與識別方法展開論述。本文的目的是通過基于NLP的方法建立模型，通過預(yù)處理和識別不規(guī)范航行通告，提取不規(guī)范航行載具的運(yùn)動軌跡、速度等信息，進(jìn)行航行的安全性數(shù)據(jù)分析和優(yōu)化，使駕駛者的安全意識得以提升，減少交通事故的發(fā)生幾率。

一、基于NLP的不規(guī)范航行通告識別技術(shù)概述

1.不規(guī)范信息的概念

信息是一種客觀的現(xiàn)象和事物的屬性及其變化的規(guī)律性的總和信息的概念，是指人們在社會生活中所接觸到的一切信息，包括文字、圖形、聲音等，也可以說信息就是人的思想和感情的反應(yīng)過程。不規(guī)范的航行通告識別系統(tǒng)主要研究的是不規(guī)范航行信息的識別與分析，它是一個(gè)對不規(guī)范的運(yùn)輸路線進(jìn)行實(shí)時(shí)的監(jiān)控與追蹤，并通過對異常情況的預(yù)警來實(shí)現(xiàn)對運(yùn)輸車輛的有效管理。

2.不規(guī)范航行通告的特點(diǎn)

不規(guī)范的航行通告是指沒有經(jīng)過國家相關(guān)部門的批準(zhǔn)而在港口、碼頭等地方行駛的通告；影響交通安全不規(guī)范的航行通告會對運(yùn)輸設(shè)備造成一定的干擾作用，使其不能正常地運(yùn)行和使用。例如，如果在港的時(shí)候需要進(jìn)出，那么就必須要通過正規(guī)的程序來檢查，然后再由船公司的工作人員來負(fù)責(zé)。對于交通運(yùn)輸來說，它是一個(gè)非常重要的方面，它也可以為人們的出行提供便利，但同時(shí)也給城市的發(fā)展帶來了巨大的壓力和挑戰(zhàn)。因?yàn)橐坏┯辛瞬粶?zhǔn)確的航行通告，不僅僅會給我們的生活以及工作環(huán)境帶去威脅，而且還會破壞到整個(gè)地區(qū)的穩(wěn)定與和諧。因此，為了保證航行的安全性和效率，對其研究十分有必要[1]。

3.不規(guī)范航行通告識別方法

根據(jù)不規(guī)范航行通告的識別方法，可將其分為兩大類：一類是基于圖論的分類方法，另一類是基于神經(jīng)網(wǎng)絡(luò)的分類方法。（1）圖論的分類。不規(guī)范運(yùn)輸調(diào)度系統(tǒng)的主要功能就是對不規(guī)范的車輛進(jìn)行合理的規(guī)劃和管理，從而提高了交通的運(yùn)行效率。因此在研究中，有必要對其數(shù)學(xué)模型建立和分析，以方便對交通運(yùn)輸過程的優(yōu)化設(shè)計(jì)。（2）基于神經(jīng)網(wǎng)絡(luò)的分類方法。將不規(guī)范航行通告文本序列視為一組token，基于詞嵌入技術(shù)，進(jìn)而將句子表示成token序列?；趖oken的標(biāo)識進(jìn)行詞性或詞義分類，應(yīng)用循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）和卷積神經(jīng)網(wǎng)絡(luò)（CNN）等常用深度學(xué)習(xí)技術(shù)實(shí)現(xiàn)文本序列建模。

4.不規(guī)范航行通告識別技術(shù)

在不規(guī)范運(yùn)行信息中，以前通常使用的是傳統(tǒng)的識別方法，這種方法是將不規(guī)范航行通告的發(fā)生原因和影響因素作為研究對象，然后對其進(jìn)行分類，最后再利用神經(jīng)網(wǎng)絡(luò)的原理對其特征、類型、分布等方面的內(nèi)容進(jìn)行分析，并根據(jù)這些特點(diǎn)來識別出不規(guī)范的航行通告[2]。目前，有很多的學(xué)者都致力于研究人工神經(jīng)網(wǎng)絡(luò)的模型來解決不精確的安全駕駛問題。其中有一種就是用模糊的數(shù)學(xué)語言來描述它的過程：在系統(tǒng)的輸入層，將一個(gè)復(fù)雜的非線性函數(shù)映射到輸出層上，接著通過輸出層的神經(jīng)元與外部環(huán)境的連接關(guān)系，從而得到了整個(gè)系統(tǒng)的狀態(tài)反饋。本文主要介紹的是基于NLP的智能識別的方法。該方法的優(yōu)點(diǎn)是簡單，可以很容易地從計(jì)算機(jī)的角度去處理，并且具有很強(qiáng)的魯棒性[3]。但是也存在著一定的缺點(diǎn)，比如只能適用于一些特定的條件下，而不能完全適用于某些特殊的情況。

二、不規(guī)范航行通告識別方法實(shí)驗(yàn)

1.試驗(yàn)方法

首先，對不規(guī)范航行通告進(jìn)行預(yù)判，然后對不規(guī)范運(yùn)行的原因分析，最后根據(jù)識別結(jié)果確定是否需要采取預(yù)判措施。在本實(shí)驗(yàn)中，先通過實(shí)驗(yàn)對比，判斷不規(guī)范航行的目的是什么，再從系統(tǒng)的角度出發(fā)，選擇合適的識別方法，并結(jié)合實(shí)際的應(yīng)用情況，最終得出結(jié)論。在本實(shí)驗(yàn)中，主要采用了3種識別方法，分別為：（1）特征值法。該方法是一種比較常用的數(shù)據(jù)處理的算法；（2）神經(jīng)網(wǎng)絡(luò)法。它是將復(fù)雜的信息從大量的樣本空間映射到了有意義的集合上，并將其作為一個(gè)整體來研究。它具有簡單容易實(shí)現(xiàn)的特點(diǎn)；（3）支持向量機(jī)（SVM）。它可以用于分類和建模，并且能夠很好地解決一些問題。3種方法都是以訓(xùn)練集為基礎(chǔ)的模型來建立的；各個(gè)模塊的組合都是用來輔助的對象和輸入的參數(shù)之間的關(guān)系以及輸出的概率分布。

2.不規(guī)范航行通告識別系統(tǒng)設(shè)計(jì)

計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)在軍事領(lǐng)域的應(yīng)用越來越廣泛，在航行運(yùn)輸中，通過對不規(guī)范航行通告的研究和分析，可以對不規(guī)范航行做出預(yù)警，從而減少損失。本文的主要內(nèi)容是利用MATLAB軟件進(jìn)行仿真，并結(jié)合Matlab中的運(yùn)動學(xué)和數(shù)學(xué)模型，建立起一個(gè)精確的、高效的、通用的航行通告識別系統(tǒng)。本論文的重點(diǎn)在于，如何識別出不規(guī)范的航行通告，并將其應(yīng)用于實(shí)際的駕駛過程，該系統(tǒng)的設(shè)計(jì)思路如下：（1）根據(jù)目標(biāo)車的行駛速度，以及環(huán)境的變化來判斷是否存在異常，然后再確定該車型的具體位置，最后再將其傳回?cái)?shù)據(jù)庫。（2）首先，需要對該車型的所有數(shù)據(jù)的采集及處理，包括車速和加速度等。其次，是要計(jì)算出該車型的相關(guān)參數(shù)，比如發(fā)動機(jī)的轉(zhuǎn)速等。再次，就是要考慮到駕駛員的反應(yīng)時(shí)間，當(dāng)出現(xiàn)了緊急情況，應(yīng)該及時(shí)地采取相應(yīng)的應(yīng)對措施[3]。

3.不規(guī)范航行通告識別模塊

該模塊主要是對不規(guī)范航行通告的識別和判斷包括對不規(guī)范運(yùn)行的分析、判定和預(yù)測。主要模塊有對不規(guī)范航行的識別，以及對于不規(guī)范運(yùn)行的預(yù)警機(jī)制的研究。在本系統(tǒng)中，將根據(jù)不同的規(guī)則分別建立起針對性的安全警告信息庫，并通過該庫的數(shù)據(jù)進(jìn)行預(yù)判，從而確定是否存在異常。然后再結(jié)合具體的事件來制定出相應(yīng)的應(yīng)對策略。

4.實(shí)驗(yàn)功能展示

本次實(shí)驗(yàn)主要是為了驗(yàn)證不規(guī)范化航行通告識別的應(yīng)用效果，因此需要在實(shí)驗(yàn)前對實(shí)驗(yàn)數(shù)據(jù)進(jìn)行預(yù)處理，并將預(yù)處理結(jié)果與實(shí)際運(yùn)行情況對比，從而確定是否使用不規(guī)范化航行通告識別。首先，在MATLAB的環(huán)境中，設(shè)置好時(shí)間間隔，并將采集到的信息通過SPSS17.0軟件的GUI顯示模塊的形式發(fā)送給主控中心，主控中心可以根據(jù)接收到的信息對所收集的信息做出相應(yīng)的反應(yīng)和判斷。其次，在K-3的窗口中，將本系統(tǒng)的關(guān)鍵詞放在Excel表中，然后利用SPSS22.0來生成表格，方便用戶查看。最后，當(dāng)所有的樣本都測試完畢，則會把本文本框發(fā)給終端，由其來發(fā)送控制指令，同時(shí)也會發(fā)出提示，以提醒注意觀察。如果沒有達(dá)到要求，則會自動執(zhí)行相關(guān)操作[4]。

5.實(shí)驗(yàn)結(jié)果分析與運(yùn)行

經(jīng)過對不規(guī)范航行船舶的仿真實(shí)驗(yàn)，可以得出以下結(jié)論：（1）對不規(guī)范航行的影響：由于沒有建立起完善的數(shù)學(xué)模型，所以在運(yùn)行過程中，可能會出現(xiàn)一系列的錯(cuò)誤操作。（2）對不規(guī)范航行的預(yù)測：在進(jìn)行了大量的實(shí)驗(yàn)后，發(fā)現(xiàn)數(shù)據(jù)與實(shí)際的相差較大，這就表明有很多的誤差存在，這些誤差的產(chǎn)生是由許多因素造成的，例如時(shí)間和天氣等。

三、基于NLP的不規(guī)范航行通告識別方法

1.不規(guī)范航行通告的表示

傳統(tǒng)的不規(guī)范航行通告識別方式主要有以下幾種：（1）人工識別：這種方法是通過現(xiàn)場的觀察和記錄，對不規(guī)范航行做出正確的判斷；（2）機(jī)器識別：在進(jìn)行了大量的資料收集之后，再對這些信息進(jìn)行進(jìn)一步的分析和處理，然后再將它們輸入到計(jì)算機(jī)中，從而實(shí)現(xiàn)對運(yùn)輸過程的控制；（3）專家系統(tǒng)：該方法是一種比較先進(jìn)的檢測技術(shù)，它能夠快速地發(fā)現(xiàn)不規(guī)范航行的行為并及時(shí)的作出反應(yīng)，同時(shí)還能為決策者提供可靠的參考數(shù)據(jù)。但是由于其自身的局限性，它只能適用于一些特定的情況下，并不能完全解決具體的問題；另外，該方法也存在著一定的缺點(diǎn)，比如無法實(shí)時(shí)的監(jiān)控到交通狀況，導(dǎo)致預(yù)測的不準(zhǔn)確性。但隨著科技的發(fā)展與進(jìn)步，人工智能化的研究也逐漸的開始應(yīng)用，這就使得智能化的辨識方式越來越多地出現(xiàn)在人們的日常生活中。

在進(jìn)行航路上的不規(guī)范航行通告的識別時(shí)，可以用圖來表示。比如航路上的不規(guī)范航行通告，圖上的符號是“向”，它代表的是不規(guī)范的航行通告。在進(jìn)行航路上的違規(guī)船舶的識別時(shí)，圖上的“向”的特點(diǎn)就是由圖右下角的箭頭來表示。因?yàn)轳{駛員的意圖是為了駕駛?cè)藛T的安全而設(shè)計(jì)的；所以，在進(jìn)行判斷的時(shí)候就會有很大的可能性。因此對于不規(guī)范的航行通告，需要對其做出準(zhǔn)確的識別和分析。在對違章行為的識別的過程中，圖上的符號也要根據(jù)實(shí)際情況做出相應(yīng)的變化。

2.不規(guī)范航行通告預(yù)處理

預(yù)處理是指對不規(guī)范航行通告進(jìn)行識別、過濾、篩選和分析，并將其分類從而確定是否為違規(guī)的航行通告。首先，需要對文本中的標(biāo)點(diǎn)符號進(jìn)行預(yù)處理，通常利用正則表達(dá)式進(jìn)行判定；其次，應(yīng)用基于隱馬爾可夫的jieba分詞庫，對文本中的中文詞語進(jìn)行有效分割；再次，將文本中分割后的詞頻進(jìn)行統(tǒng)計(jì)，消除小樣本噪聲；最后，將預(yù)處理后的每一個(gè)分詞進(jìn)行唯一識別號關(guān)聯(lián)，用于后續(xù)的模型訓(xùn)練[5]。

3.基于NLP不規(guī)范航行通告分割

在不規(guī)范航行通告的分割中加入一個(gè)NLP的概念來識別，NLP是指通過對不規(guī)范航行通告的分析和處理，將其與普通的航行通告進(jìn)行對比，從而判斷出是否存在違規(guī)行為[6]。這種新的方法也有很多的優(yōu)點(diǎn)：（1）對于不規(guī)范的運(yùn)輸車輛，由于其自身的特點(diǎn)使得它的識別難度增加，所以需要對其的識別過程加以嚴(yán)格地把控[7]。（2）雖然該算法的原理很簡單，但是也有一些不足之處，比如說，當(dāng)駕駛員的反應(yīng)時(shí)間較長時(shí)，就會導(dǎo)致錯(cuò)誤的發(fā)生概率加大，而且當(dāng)出現(xiàn)突發(fā)事件時(shí)，因?yàn)樵撍惴ǖ臏?zhǔn)確度不高，因此無法保證準(zhǔn)確性[8]。

4.區(qū)域選擇

對于不規(guī)范航行，我們可以通過區(qū)域的劃分來進(jìn)行識別。

（1）根據(jù)地形、地貌等因素，對不規(guī)范航行的區(qū)域進(jìn)行分析，將其分為不同的區(qū)域。在地勢較為復(fù)雜的地區(qū)，如山區(qū)和丘陵等，這些地方的安全系數(shù)較低，因此不規(guī)范運(yùn)行的概率較大；而在地勢相對平坦的地區(qū)，如鐵路和公路等，這些地方的安全系數(shù)較高，因此一般不會發(fā)生大的交通事故[9]。（2）按照河流的流量大小，將整個(gè)河網(wǎng)劃為一個(gè)個(gè)的小流域，這樣做的好處是能夠有效地減少河網(wǎng)的擁擠程度，提高運(yùn)輸效率，但是這種做法的缺點(diǎn)是無法對河的流量做出準(zhǔn)確的判斷和預(yù)測，并且不能很好地控制進(jìn)出口的車輛數(shù)量，一旦出現(xiàn)擁堵情況，就會造成很大的損失[10]。

結(jié)語

本文對不規(guī)范航行通告的神經(jīng)網(wǎng)絡(luò)方法進(jìn)行了研究，分析比較了各種模型和算法在不同條件下所表現(xiàn)出來的優(yōu)劣。通過實(shí)驗(yàn)對比發(fā)現(xiàn)：（1）在不一樣條件時(shí)，每種建模方式都有其適用范圍。（2）從仿真結(jié)果看得到最優(yōu)參數(shù)是最小化期望誤差與最大通信容量之間線性度；而當(dāng)傳輸速率高、速度快或者數(shù)據(jù)量大時(shí)，可以選擇使用最短路徑法來進(jìn)行模擬計(jì)算分析，得出最佳節(jié)點(diǎn)位置和優(yōu)化模型，在不一樣的條件下，傳輸速率越快、通信容量越大時(shí)選擇最多路徑法。（3）從模型結(jié)果看得到最優(yōu)參數(shù)是最小化期望誤差與最大通信質(zhì)量之間的線性度，而最短路徑方法可以有效地減少信息量。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡