鄧桂萍
(長沙航空職業(yè)技術(shù)學(xué)院,湖南 長沙 410124)
探地雷達(dá)(Ground Penetrating Radar,簡稱GPR)是一種可無損探測地下結(jié)構(gòu)的電磁波技術(shù)。它以無損、高效等優(yōu)點成為路基病害檢測的最佳選擇。其基本原理是向地下發(fā)射電磁波,電磁波在地下介質(zhì)傳播的過程中,遇到存在電性差異的介質(zhì)(如空洞、分界面等)時,會發(fā)生反射,接收天線接收反射回來的電磁波,并對這些信號進(jìn)行分析和處理,根據(jù)接收到的雷達(dá)波形、強度和雙程走時等參數(shù),便可推斷出地下介質(zhì)的分布結(jié)構(gòu)[1]。近年來,隨著我國經(jīng)濟的快速發(fā)展,道路、橋梁、隧道等基礎(chǔ)設(shè)施大量興建和使用,在這些交通基礎(chǔ)設(shè)施中存在大量如隧道、道路、橋梁這樣的線下多層混凝土結(jié)構(gòu),這種結(jié)構(gòu)通常具有平穩(wěn)、耐腐蝕、維修量較少的優(yōu)點。但是隨著時間的推移,混凝土結(jié)構(gòu)常會發(fā)生惡化,導(dǎo)致各種結(jié)構(gòu)病害,如充氣空洞、脫空和排水不良等,隨時有可能威脅到繁忙的交通運行,給廣大人民和社會帶來無法挽回的損失。因此,為了適應(yīng)我國城市地下空間的快速發(fā)展和保障人民的安全,應(yīng)當(dāng)對城市道路線下多層結(jié)構(gòu)容易出現(xiàn)的裂縫、空洞、充水等病害進(jìn)行科學(xué)的檢測和識別。
目前,在GPR路基病害識別方面,研究人員提出了基于非一致性檢測的脫空病害自動檢測算法,非一致性檢測出可疑的感興趣區(qū)域,然后對可疑的感興趣區(qū)域進(jìn)行曲線擬合,識別脫空病害[2]。該算法保證了有效性并降低了運算量。也有學(xué)者根據(jù)不同介質(zhì)在GPR圖像上的表征不同這一特征,得到了空洞內(nèi)填充不同的介質(zhì)時的仿真圖像,總結(jié)了空洞內(nèi)不同的填充介質(zhì)對GPR圖像產(chǎn)生的影響[3]。還有學(xué)者在以混凝土為主體介質(zhì)的實體模型上展開工作,研究了混凝土中各種常見病害的圖像特征及識別方法,總結(jié)了混凝土病害識別的一些規(guī)律[4]。然而,以上方法只增加了圖像病害的可解釋性,總結(jié)了GPR圖像人工解釋的規(guī)律,并不能做到分析并識別常見病害類型,并且人工解譯方法存在評價標(biāo)準(zhǔn)不客觀且效率低下的問題。為解決上述問題,亟須實現(xiàn)對GPR路基病害的自動識別。近年來,隨著深度學(xué)習(xí)技術(shù)的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)在圖像識別領(lǐng)域取得了巨大的成功,有研究者應(yīng)用深度學(xué)習(xí)技術(shù)識別GPR圖像,并取得了成效[5]。但在GPR領(lǐng)域有標(biāo)注的數(shù)據(jù)集往往較少,而標(biāo)注數(shù)據(jù)少會導(dǎo)致低識別率問題,因此研究一種在標(biāo)注數(shù)據(jù)少情況下的GPR路基病害圖像分類識別方法具有重大的意義。為此,文章提出了一種基于半監(jiān)督生成對抗網(wǎng)絡(luò)(Semi-Supervised Generative Adversarial Learning/Networks,SGAN)的GPR路基病害分類識別方法。
基于SGAN的GPR路基病害分類識別方法框架如圖1所示?;舅悸肥牵合全@取GPR路基病害B-scan圖像數(shù)據(jù)集,并劃分為訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集。然后搭建半監(jiān)督生成對抗網(wǎng)絡(luò)(SGAN),該SGAN包括一個生成器G和一個判別器D。再利用帶標(biāo)簽和不帶標(biāo)簽的GPR路基病害圖像以及生成器G生成的偽GPR圖像訓(xùn)練半監(jiān)督生成對抗網(wǎng)絡(luò)。最后將待識別的GPR路基病害圖像輸入至訓(xùn)練好的判別器,通過判別器輸出GPR路基病害的識別結(jié)果。該方法能夠在只標(biāo)注少量GPR路基病害圖像的情況下獲得較高的識別準(zhǔn)確率,克服在GPR領(lǐng)域中因標(biāo)注數(shù)據(jù)少而造成的低識別準(zhǔn)確率的問題。
圖1 基于SGAN的GPR路基病害分類識別方法框架
半監(jiān)督生成對抗網(wǎng)絡(luò)包括一個生成器G和一個判別器D,生成器G包括一層全連接層和四層反卷積層,判別器D包括三層卷積層、兩層LSTM(長短時記憶網(wǎng)絡(luò))層和一層全連接層。
若輸入的圖像大小為M×N×1,則生成器G中全連接層的神經(jīng)元節(jié)點數(shù)設(shè)置為M/16×N/16×K,K=2n,n=4,5,6……。第一層反卷積層的反卷積核大小為3×3,反卷積核的個數(shù)為K/2,反卷積步長為2;第二層反卷積層的反卷積核大小為3×3,反卷積核的個數(shù)為K/4,反卷積步長為2;第三層反卷積層的反卷積核大小為3×3,反卷積核的個數(shù)為K/8,反卷積步長為2;第四層反卷積層的反卷積核大小為3×3,反卷積核的個數(shù)為1,反卷積步長為2。在判別器D中,卷積網(wǎng)絡(luò)結(jié)構(gòu)中,第一層卷積層的卷積核大小為3×3,卷積核數(shù)量為K/8,卷積步長為2;第二層卷積層的卷積核大小為3×3,卷積核數(shù)量為K/4,卷積步長為2;第三層卷積層的卷積核大小為3×3,卷積核數(shù)量為8,卷積步長為2;LSTM結(jié)構(gòu)中兩層LSTM層中的單元數(shù)量皆為K。在全連接層中,其神經(jīng)元節(jié)點數(shù)為GPR路基病害的分類類別數(shù)C+1。
對于n1張有標(biāo)簽GPR路基病害圖像數(shù)據(jù)集和n2張無標(biāo)簽GPR路基病害圖像數(shù)據(jù)集,其中x表示GPR圖像樣本,尺寸大小為M×N×1,y表示該樣本對應(yīng)的標(biāo)簽。訓(xùn)練半監(jiān)督生成對抗網(wǎng)絡(luò)的過程如下:
(1)將一個隨機噪聲向量z輸入生成器中,z通過一層全連接層和四層反卷積層輸出偽GPR圖像xf,尺寸大小為M×N×1。其過程可表示為:
其中,G表示生成器,θ表示生成器網(wǎng)絡(luò)的權(quán)重參數(shù)。
(2)將帶標(biāo)簽和不帶標(biāo)簽GPR路基病害圖像x與偽GPR圖像xf輸入至判別器,輸入圖像經(jīng)過三層卷積層、兩層LSTM層、一層全連接層后,最后通過SoftMax函數(shù)處理,輸出一個類別數(shù)C+1維向量O,其中真實圖像被分為第C類,偽GPR圖像被分為第C+1類。該過程可表示為:
其中D表示判別器,ω表示判別器網(wǎng)絡(luò)的權(quán)值參數(shù)。若x為偽圖像,則輸出的概率表示為:
若x為真圖像且為i類,則輸出的概率表示為:
(3)優(yōu)化判別器。計算判別器D的損失函數(shù)L,并通過反向梯度傳播計算方法不斷優(yōu)化判別器網(wǎng)絡(luò)的權(quán)值參數(shù)ω。
(4)優(yōu)化生成器。固定判別器參數(shù),將隨機向量z輸入生成器,生成偽GPR圖像xf,再將xf輸入至判別器D,計算判別器D的損失函數(shù)L,并通過反向梯度傳播計算方法不斷優(yōu)化生成器網(wǎng)絡(luò)的權(quán)值參數(shù)θ。
半監(jiān)督生成對抗網(wǎng)絡(luò)的訓(xùn)練過程中,損失函數(shù)L包括兩個部分,分別為監(jiān)督損失和無監(jiān)督損失,可表示如下:
其中,Lsupervised=-Ex,y~Pdatalog[P(y=i|x,i<C+1)]
重復(fù)上述步驟,不斷對判別器和生成器進(jìn)行分別優(yōu)化,直至損失函數(shù)L下降到一個穩(wěn)定的值,該穩(wěn)定值接近于0,在區(qū)間(0, 0.02)之間變動,則認(rèn)為半監(jiān)督生成對抗訓(xùn)練完成。
使用gprMax軟件進(jìn)行正演模擬,建立了不同尺寸的路基脫空、路基空洞充氣、路基空洞充水、路基含水層4種典型的病害模型,4種典型病害圖像如圖2所示,共獲取了400張GPR B-scan圖像,為了擴大訓(xùn)練數(shù)據(jù)集,對原始數(shù)據(jù)集加入了三種不同程度的噪聲,分別構(gòu)成了信噪比為10 dB、5 dB和0 dB的數(shù)據(jù)集,最終獲得1200張圖像數(shù)據(jù)集。將數(shù)據(jù)集分為訓(xùn)練集800張,其中標(biāo)注數(shù)據(jù)占200張,無標(biāo)注數(shù)據(jù)占600張,測試集400張。在實驗中,利用TensorFlow深度學(xué)習(xí)框架實現(xiàn)了所設(shè)計的半監(jiān)督生成對抗網(wǎng)絡(luò),并對其進(jìn)行了訓(xùn)練和測試。
圖2 四種典型病害圖像
生成器中,全連接層的神經(jīng)元節(jié)點數(shù)為8×8×256, 第一層反卷積層的反卷積核大小為3×3,反卷積核的個數(shù)為128,反卷積步長為2;第二層反卷積層的反卷積核大小為3×3,反卷積核的個數(shù)為64,反卷積步長為2;第三層反卷積層的反卷積核大小為3×3,反卷積核的個數(shù)為32,反卷積步長為2;第四層反卷積層的反卷積核大小為3×3,反卷積核的個數(shù)為1,反卷積步長為2。在判別器中,卷積網(wǎng)絡(luò)結(jié)構(gòu)中第一層卷積層的卷積核大小為3×3,卷積核數(shù)量為32,卷積步長為2;第二層卷積層的卷積核大小為3×3,卷積核數(shù)量為64,卷積步長為2;第三層卷積層的卷積核大小為3×3,卷積核數(shù)量為8,卷積步長為2;LSTM結(jié)構(gòu)中兩層LSTM層中的單元數(shù)量皆為256。在全連接層中,其神經(jīng)元節(jié)點數(shù)為5。
在半監(jiān)督生成對抗網(wǎng)絡(luò)的訓(xùn)練過程中,首先將一個100維度的隨機噪聲向量z輸入生成器中,z通過一層全連接層和四層反卷積層輸出偽GPR圖像xf,尺寸大小為128×128×1。然后,將帶標(biāo)簽和不帶標(biāo)簽GPR路基病害圖像x與偽GPR圖像xf(尺寸均為128×128×1)輸入至判別器,輸入圖像經(jīng)過三層卷積層、兩層LSTM層、一層全連接層后,最后通過SoftMax函數(shù)處理,輸出一個5維向量O,其中真實圖像被分為第4類,偽GPR圖像被分為第5類。接著,優(yōu)化判別器。計算判別器D的損失函數(shù)L,并通過反向梯度傳播計算方法不斷優(yōu)化判別器網(wǎng)絡(luò)的權(quán)值參數(shù)ω。之后,優(yōu)化生成器。固定判別器參數(shù),將隨機向量z輸入生成器,生成偽GPR圖像xf,再將xf輸入至判別器D,計算判別器D的損失函數(shù)L,并通過反向梯度傳播計算方法不斷優(yōu)化生成器網(wǎng)絡(luò)的權(quán)值參數(shù)θ。重復(fù)上述步驟,不斷對判別器和生成器進(jìn)行分別優(yōu)化,直至損失函數(shù)L下降到一個穩(wěn)定的值,該穩(wěn)定值接近于0,GPR路基病害數(shù)據(jù)集訓(xùn)練半監(jiān)督生成對抗網(wǎng)絡(luò)其判別器監(jiān)督損失值下降曲線如圖3所示。在實驗中,每次訓(xùn)練時的批量大小設(shè)置為32;為了提高模型的泛化能力,加入BN歸一化方法和Dropout方法;每個迭代對測試集做一次測試并計算準(zhǔn)確率,經(jīng)過800個迭代之后,監(jiān)督損失L趨于穩(wěn)定,模型訓(xùn)練完畢,保存好模型的權(quán)重參數(shù)ω和θ;實驗過程中測試準(zhǔn)確率最高達(dá)到了98.65%,準(zhǔn)確地給出了GPR路基病害的分類識別結(jié)果,病害圖像分類識別測試準(zhǔn)確率曲線如圖4所示。
圖3 GPR路基病害數(shù)據(jù)集訓(xùn)練半監(jiān)督生成對抗網(wǎng)絡(luò)其判別器監(jiān)督損失值下降曲線圖
圖4 本方法的GPR路基病害圖像分類識別準(zhǔn)確率曲線圖
表1給出了四種路基病害圖像識別結(jié)果的混淆矩陣,分析了四種不同路基病害圖像的分類結(jié)果。可以看出,提出的SGAN能夠?qū)λ姆N路基病害圖像類型進(jìn)行高精度識別,識別準(zhǔn)確率在95% ~ 100%。其中有一類直徑的識別準(zhǔn)確率為100%,另外三類直徑的識別準(zhǔn)確率分別為95%、96%和99%,分別對應(yīng)空洞充水病害、脫空病害和含水層病害。整個數(shù)據(jù)集的識別準(zhǔn)確率可達(dá)到98.65%。
表1 四種路基病害識別結(jié)果的混淆矩陣
與經(jīng)典半監(jiān)督生成對抗網(wǎng)絡(luò)相比,本方法的半監(jiān)督生成對抗網(wǎng)絡(luò)其判別器增加LSTM網(wǎng)絡(luò)結(jié)構(gòu),更有效地提取了雷達(dá)信號的時序特征,且只需少量標(biāo)注數(shù)據(jù)便能訓(xùn)練好網(wǎng)絡(luò)。將待識別的GPR路基病害圖像輸入至訓(xùn)練好的判別器便可得到分類識別結(jié)果,且可在只標(biāo)注少量GPR路基病害圖像的情況下獲得較高的識別準(zhǔn)確率,克服了在GPR領(lǐng)域中因標(biāo)注數(shù)據(jù)少而造成的低識別準(zhǔn)確率的問題。在實驗過程中測試準(zhǔn)確率最高達(dá)到了98.65%,準(zhǔn)確地給出了GPR路基病害的分類識別結(jié)果。