邢秀文 沈洋 李靜
摘 要:本研究利用卷積神經(jīng)網(wǎng)絡(luò)LeNet識別了一批焊接缺陷圖像,發(fā)現(xiàn)圖像的分辨率對于缺陷的識別正確率有很大的影響;發(fā)現(xiàn)原始的LeNet在各種情況下具有高度的穩(wěn)定性,而幾個變形網(wǎng)絡(luò)結(jié)構(gòu)雖然在存儲空間以及運(yùn)算速度方面有一定的優(yōu)勢,但是穩(wěn)定性都不及原始的網(wǎng)絡(luò)結(jié)構(gòu)。
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);LeNet;焊接缺陷識別
一、引言
利用深度卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)人工智能,已然是一種時髦的趨勢,也很有可能劇烈的改變傳統(tǒng)檢測行業(yè)的形態(tài)。在醫(yī)學(xué)檢測領(lǐng)域,人工智能在識別CT圖像方面的能力,已經(jīng)超過中等能力的專家。而在工業(yè)檢測領(lǐng)域,人工智能判別缺陷類別的工作,尚處于起始階段。由于TOFD、相控陣、數(shù)字射線、CT、磁共振等新的檢測手段以及成像技術(shù)的發(fā)展,使得數(shù)字圖像的獲取變得非常容易,也使得人工智能識別缺陷成為可能。
在輸油管道等制造中,因為產(chǎn)品規(guī)格單一,數(shù)量巨大,所以很多企業(yè)采用了自動焊接,數(shù)字射線半自動化檢測的流程。自動化焊接的焊縫波紋很小,表面平整光滑,故而射線圖像沒有多余的干擾,非常適合智能識別。
二、數(shù)據(jù)
我們采用軟件模擬的方式,仿制了一批數(shù)字射線圖像(見圖1),分為4類:完好無缺陷、裂紋、未焊透、圓形缺陷。每類圖像1000張,分拆為800張訓(xùn)練數(shù)據(jù),200張驗證數(shù)據(jù)。4類缺陷合計3200張訓(xùn)練圖片,800張驗證圖片。
三、網(wǎng)絡(luò)結(jié)構(gòu)
LeNet是卷積神經(jīng)網(wǎng)絡(luò)的祖師爺LeCun在1998年提出的,用于解決手寫數(shù)字識別的視覺任務(wù),主要應(yīng)用于銀行系統(tǒng)的支票識別,取得了極大的成功。該網(wǎng)絡(luò)能夠處理的圖像分辨率不低于32×32,它的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示:
四、不同分辨率圖片的預(yù)測準(zhǔn)確率
我們將圖像的分辨率分別調(diào)整為32×32,64×64,128×128,用訓(xùn)練集的3200張圖像訓(xùn)練網(wǎng)絡(luò)參數(shù),然后用驗證集的800張圖片預(yù)測種類。如此反復(fù)執(zhí)行30遍,原則上,每多訓(xùn)練一遍,預(yù)測的正確率都會提高一點。實測結(jié)果(見圖3)分析如下:
1. 若分辨率太低(32×32),則圖像不夠清晰,各種缺陷的特征不夠顯著,所以正確率不超過50%,效果差。
2. 隨著分辨率的提高,預(yù)測準(zhǔn)確率也在提高。當(dāng)分辨率為64×64時,準(zhǔn)確率約為98%;當(dāng)圖片分辨率為128×128時,準(zhǔn)確率約為100%.
3. 無論是訓(xùn)練集還是驗證集,隨著訓(xùn)練次數(shù)的增加,在訓(xùn)練過程中,其準(zhǔn)確率總是有稍許跳動,原因不明。
五、改變LeNet的結(jié)構(gòu)
原始的LeNet網(wǎng)絡(luò)預(yù)測效果雖然很好,但是它的參數(shù)量較大,運(yùn)行時間也不夠快。如果我們將該網(wǎng)絡(luò)放到移動端設(shè)備上,則希望壓縮存儲空間,并降低對CPU計算速度的要求。我們將原始的LeNet網(wǎng)絡(luò)做少許的修改,看看是否有效果(圖4)。在LeNet1中,我們將5*5的卷積核替換為2個3*3的卷積核,其余不變;而在LeNet2中,我們將每一層的特征圖以及每一層的特征數(shù),都設(shè)定為2的冪次。
1. 經(jīng)過實測,LeNet1的預(yù)測正確率約為99%,LeNet2的正確率約為99%,都比LeNet0的正確率低。
2. LeNet0的參數(shù)量為61196,LeNet1為59904,LeNet2的參數(shù)量為10972。所以LeNet2更適合放到存儲空間受限的設(shè)備中。
3.預(yù)測相同的32張圖像,LeNet0用時1.56ms,LeNet1用時1.26ms,LeNet2用時1.28ms.從時間上看,它們比較接近。
六、結(jié)論
從測試結(jié)論可知,LeNet對于背景較為干凈的自動化焊接缺陷具有很高的識別正確率。而經(jīng)過簡單變形的網(wǎng)絡(luò),會稍微降低識別正確率,但是可以大幅度的減少存儲空間。
參考文獻(xiàn)
[1] 肖智清. 神經(jīng)網(wǎng)絡(luò)PyTorch實戰(zhàn)[M]. 機(jī)械工業(yè)出版社. 2018.8
[2] 言有三. 深度學(xué)習(xí)之圖像識別[M]. 機(jī)械工業(yè)出版社. 2019.7
[3] 吳茂貴等. Python深度學(xué)習(xí)[M]. 機(jī)械工業(yè)出版社. 2019.10
[4] 張若愚. Python科學(xué)計算[M]. 清華大小出版社. 2018.1
作者簡介:邢秀文(1979-),男,碩士,北京理工大學(xué)珠海學(xué)院教師,歷任大學(xué)物理教研室主任,物理實驗室主任,工程物理系主任,主講聲學(xué)基礎(chǔ)、射線檢測、機(jī)器視覺。