国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于高效通道注意力機(jī)制與多尺度特征融合的煙絲圖像識(shí)別方法研究

2022-02-02 08:54:10劉江鵬牛群峰
河南農(nóng)業(yè)科學(xué) 2022年11期
關(guān)鍵詞:葉絲煙絲注意力

劉江鵬,牛群峰,靳 毅,陳 霞,王 莉,袁 強(qiáng)

(1. 河南工業(yè)大學(xué) 電氣工程學(xué)院,河南 鄭州 450000;2. 河南中煙工業(yè)有限責(zé)任公司安陽卷煙廠,河南 安陽 455006)

梗絲、膨脹葉絲、葉絲和再造煙絲的摻配比例是影響煙支口感、配方設(shè)計(jì)的重要指標(biāo)[1]。因此,實(shí)現(xiàn)高精度、高效識(shí)別煙絲類型對(duì)探究配方設(shè)計(jì)、煙草制品質(zhì)量檢驗(yàn)具有重要意義。目前煙絲類型識(shí)別方法主要有人工分揀法、近紅外光譜法(NIR)和計(jì)算機(jī)視覺分析法。人工分揀法是具有經(jīng)驗(yàn)的工人進(jìn)行辨識(shí)并完成分揀工作,該方法效率低,準(zhǔn)確性受人工經(jīng)驗(yàn)影響波動(dòng)較大。NIR分析法通過檢測煙絲的光譜信息,判斷光譜數(shù)據(jù)辨別煙絲類型,但再造煙絲原料的光譜信息與其他煙絲差異較小,會(huì)造成較大的識(shí)別誤差,無法實(shí)際投入使用[2-3]?;跈C(jī)器視覺的識(shí)別方法通過提取圖像特征進(jìn)行煙絲類型區(qū)分,該方法相較于人工及NIR 分析法更遍及,但模型的泛化能力容易受成像質(zhì)量和工程環(huán)境的影響。

近年來,卷積神經(jīng)網(wǎng)絡(luò)模型在目標(biāo)檢測[4]、圖像分割[5-6]和圖像分類[7-8]等圖像處理任務(wù)中提供了先進(jìn)、高效的解決方案。其優(yōu)秀的特征提取能力極大地減少了圖像處理任務(wù)的工作量[9-10]。針對(duì)使用對(duì)象的差異性,研究人員大都會(huì)根據(jù)實(shí)際問題調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)[11-12]。高震宇等[13]提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的識(shí)別方法,該方法與人工及NIR 分析法相比更加便捷,但模型過分關(guān)注煙絲局部特征,導(dǎo)致模型在訓(xùn)練集和測試集表現(xiàn)差異較大,泛化能力差,難以投入應(yīng)用。鐘宇等[14]提出一種基于殘差神經(jīng)網(wǎng)絡(luò)的煙絲類型識(shí)別方法,該方法比卷積神經(jīng)網(wǎng)絡(luò)識(shí)別準(zhǔn)確率更高,但其數(shù)據(jù)集原始樣本過少,對(duì)宏觀上差異較小的煙絲難以區(qū)分。鑒于此,提出了一種基于高效注意力機(jī)制和多尺度特征融合的煙絲類型識(shí)別方法,旨在實(shí)現(xiàn)煙絲類型的高效和準(zhǔn)確識(shí)別。

1 材料和方法

1.1 材料

煙絲按照世界衛(wèi)生組織《煙草控制框架公約(FCTC)》[15]分為梗絲(Cut stem,CS)、膨脹葉絲(Expanded tobacco silk,ETS)、葉絲(Tobacco silk,TS)和再造煙絲(Reconstituted tobacco shred,RTS)4類。供試4 類煙絲樣本均來自于河南中煙工業(yè)有限責(zé)任公司安陽卷煙廠。使用上海市嘉定糧油儀器有限公司生產(chǎn)的JJSY30x10 檢驗(yàn)平篩篩除煙絲中的碎絲,其中篩孔徑為0.9 mm,每次檢驗(yàn)平篩工作10 s。通過篩選分別獲取4 類煙絲各1 100 根,共4 400根樣本。

1.1.1 圖像采集 使用??倒I(yè)相機(jī)MV-CE100-30GC 1 000 萬像素彩色相機(jī),配備MVL-HF1224M-10MP 12 mm 焦距海康工業(yè)鏡頭。使用標(biāo)準(zhǔn)白平衡卡作為煙絲拍攝的背景。為保證光源的均勻,選用華康科技公司生產(chǎn)的R20-80-25 環(huán)形光源。采集4種樣本各1 100 張,單張圖像大小為2 788 像素×2 238 像素。人工篩除模糊的煙絲圖像,篩選后的圖像建立煙絲數(shù)據(jù)集,經(jīng)過篩選最終得到煙絲圖像4 100張。

1.1.2 去噪與K-means 圖像分割 在采集得到的原始圖像中,煙絲所占區(qū)域較小,為了減少無關(guān)信息,加快模型的收斂速度,提高分類準(zhǔn)確度,需要對(duì)原始圖像進(jìn)行圖像處理,便于系統(tǒng)準(zhǔn)確高效實(shí)現(xiàn)特征提取。圖像預(yù)處理流程為:①雙邊濾波去噪,過濾噪聲的同時(shí)保留原有煙絲的輪廓細(xì)節(jié);②對(duì)圖像進(jìn)行K-means 聚類,分離煙絲圖像的主體和背景;③對(duì)聚類處理后的圖像進(jìn)行灰度化處理和最大類間方差法二值化處理;④獲取煙絲主體輪廓,得到感興趣區(qū)域(Region of interest,ROI);⑤分割調(diào)整后的ROI區(qū)域。

雙邊濾波中的2個(gè)核函數(shù)是組合空間域函數(shù)和范圍核函數(shù)。正是這2個(gè)核函數(shù)在濾波過程中的作用,使得雙邊濾波能在有效去除煙絲圖像噪聲的同時(shí),保留邊緣和細(xì)節(jié)信息。由于煙絲厚度、透光率和顏色深度存在差異,煙絲圖像在進(jìn)行二值化時(shí)需要使用不同的閾值以保證煙絲主體輪廓的完整性,而K-means 聚類算法有效解決了這個(gè)問題。K-means聚類算法是一種自適應(yīng)搜索的無監(jiān)督分類算法。該方法的本質(zhì)是通過反復(fù)迭代找到k個(gè)最優(yōu)聚類中心,將所有樣本分成k個(gè)類,使所有樣本與所屬類中心的歐氏距離之和E最小[16]。對(duì)于圖像數(shù)據(jù)而言,可將圖像中相似的像素值進(jìn)行聚類,形成一類,以達(dá)到劃分圖像不同區(qū)域的目的,從而區(qū)分前后景,完成圖像分割。

其中,nj和Xj分別表示在以Ci為中心的集合中樣本點(diǎn)個(gè)數(shù)和樣本點(diǎn)。

經(jīng)過K-means 聚類處理后,煙絲圖像的前后景已分離。對(duì)該圖像進(jìn)行灰度化處理,得到煙絲的灰度圖像。使用最大類間方差法得到煙絲的二值化圖像,獲取二值化圖像中的最大輪廓及該輪廓的最小外接矩形。根據(jù)煙絲的最小外接矩形進(jìn)行擴(kuò)展,以保證分割的圖像具有相同的長寬尺寸,防止圖像送入神經(jīng)網(wǎng)絡(luò)之前的縮放處理導(dǎo)致圖像失真。4類煙絲典型圖像如圖1所示。經(jīng)過處理得到4 100張,其中包含梗絲1 018 張、膨脹葉絲1 012 張、葉絲1 009 張、再造煙絲1 061 張,按照7∶3 的比例隨機(jī)劃分訓(xùn)練集和測試集。

圖1 煙絲數(shù)據(jù)集Fig.1 Tobacco shred dataset

1.2 方法

針對(duì)梗絲、膨脹葉絲、葉絲和再造煙絲4類煙絲所具有的宏觀尺度特征不明顯、尺寸小和形狀不規(guī)則等特征,提出一種基于高效通道注意力機(jī)制與多尺度特征融合的煙絲圖像識(shí)別方法。改動(dòng)后的模型結(jié)構(gòu)如圖2所示。在網(wǎng)絡(luò)中引入高效通道注意力策略,通過跨通道交互機(jī)制來加強(qiáng)模型提取特征的能力;同時(shí),將改進(jìn)后的模塊輸出的特征圖進(jìn)行多尺度融合,緩解深層特征圖的特征丟失問題。最后,在比較收斂性和準(zhǔn)確性時(shí),用PReLU 和AdaBound 代替了ReLU 激活函數(shù)和Adam 優(yōu)化器,進(jìn)一步提高模型的性能。

圖2 ECA-MS-Inception-ResNet-V2網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 ECA-MS-Inception-ResNet-V2 network structure

1.2.1 模型構(gòu)建 將Inception-ResNet-V2[17]網(wǎng)絡(luò)作為系統(tǒng)的主框架,Inception-ResNet-V2 是在Inception 網(wǎng)絡(luò)結(jié)構(gòu)上融入殘差思想得到的。Inception網(wǎng)絡(luò)結(jié)構(gòu)使用不同大小卷積核增強(qiáng)了網(wǎng)絡(luò)的適應(yīng)性,提取的特征更加豐富,殘差網(wǎng)絡(luò)用于防止梯度發(fā)散。它包含3個(gè)部分:①深度卷積層Stem,用于對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理;②Inception 模塊中的非對(duì)稱濾波器組合Inception-ResNet-B、Inception-ResNet-C,通過非對(duì)稱卷積分裂增強(qiáng)了濾波器模式的多樣性;Reduction-A 和Reduction-B 的縮減是為了增加維度,用于補(bǔ)償Inception 結(jié)構(gòu)造成的維度縮減。③預(yù)測層,包括池化層和Softmax層。

1.2.2 高效通道注意力 分析傳統(tǒng)的通道注意力機(jī)制發(fā)現(xiàn),降維操作會(huì)影響通道注意力的性能,適當(dāng)?shù)目缤ǖ澜换タ梢栽诒3指咝阅艿那疤嵯麓蟠蠼档湍P偷膹?fù)雜性。因此,在基本結(jié)構(gòu)設(shè)計(jì)中采用了不降維的策略。

跨通道交互不降維的策略,增加了通道注意力機(jī)制的收益,如圖3 所示。通過考慮每個(gè)通道和它的n個(gè)鄰域,跨通道互動(dòng)信息被捕獲。卷積核n的大小代表了跨通道交互的覆蓋率,即參與特定通道注意力預(yù)測的鄰域數(shù)量。

圖3 高效通道注意力模塊Fig.3 Efficient channel attention module

為了避免人工調(diào)整,采用了自適應(yīng)選擇一維卷積核大小的方法來確定n的值。一維卷積用于捕捉跨通道的相互作用;n的大小決定了相互作用的覆蓋范圍。n的數(shù)量與通道維度C有關(guān),在固定數(shù)量組卷積的情況下,高維(低維)通道與長距離(短距離)卷積呈正比。同樣,跨通道信息交互的覆蓋率也與通道維度呈正比[18]。高效通道注意力中指數(shù)函數(shù)被用來近似映射,如公式(4)所示。此外,由于通道維度通常設(shè)置為2 的整數(shù)次方,因此用2(γ×n-b)代替exp(γ×n-b),得到了公式(5)的映射關(guān)系。為了減少訓(xùn)練過程的時(shí)間和計(jì)算成本,將超參數(shù)γ和b分別設(shè)為2 和1。可以看出,對(duì)于大尺寸的通道,函數(shù)能夠?qū)崿F(xiàn)長距離的相互作用。

激活函數(shù)使用參數(shù)修正線性單元(PReLU)防止ReLU 中低于0 的輸入神經(jīng)元失去活性。PReLU的函數(shù)解析式為公式(7)。

其中,xi是激活函數(shù)的輸入,ai從模型訓(xùn)練中學(xué)習(xí),其初始值設(shè)定為0.25。

將ECANet 模型嵌入到Inception-ResNet-B、Inception-ResNet-C 模塊中,這2 個(gè)模塊都包含3 個(gè)分支,第1 個(gè)分支未經(jīng)過處理直接輸出,把第2、3 分支的結(jié)果堆疊后經(jīng)過1×1 的卷積操作,將卷積的結(jié)果通過一個(gè)ECANet模塊,最后把所得輸出與第1分支相加。同時(shí),將模塊中的激活函數(shù)從ReLU 改成PReLU,改動(dòng)后得到新的模塊ECA-Inception-ResNet-B、ECA-Inception-ResNet-C,模塊的結(jié)構(gòu)如圖4所示。

圖4 ECA-Inception-ResNet詳細(xì)結(jié)構(gòu)Fig.4 Detailed structure of ECA-Inception-ResNet

1.2.3 特征融合 膨脹葉絲由葉絲經(jīng)過膨脹處理制成,其膨脹部分會(huì)有所差異,甚至部分葉絲并沒有完成膨脹操作,因此,膨脹葉絲和葉絲的相似度很高,除此之外,模型深度的增加會(huì)丟失部分特征。淺層特征圖感受野較小,小目標(biāo)細(xì)節(jié)信息較多,但缺少豐富的語義信息;深層特征圖感受野較大,有豐富的語義信息,但包含的小目標(biāo)信息較少[19]。使用多尺度結(jié)構(gòu)能在一定程度上解決特征丟失問題[20]。針對(duì)淺層網(wǎng)絡(luò)與深層網(wǎng)絡(luò)特點(diǎn),將網(wǎng)絡(luò)中的第10 個(gè)ECA-Inception-ResNet-B 模 塊 和 第5 個(gè)ECA-Inception-ResNet-C 模塊的特征圖進(jìn)行全局平均池化,再使用Concat 層進(jìn)行特征拼接,該輸出經(jīng)過全連接層得到最終的分類結(jié)果。通過使用多尺度結(jié)構(gòu)減少小尺寸煙絲或大尺寸煙絲里的微小特征進(jìn)行有效提取,提升模型識(shí)別準(zhǔn)確率。

1.2.4 模型訓(xùn)練 模型通過優(yōu)化算法的方式,通過多次迭代進(jìn)行梯度下降,找到損失值最小時(shí)的模型權(quán)重,最終完成模型的訓(xùn)練,優(yōu)化算法能在模型訓(xùn)練過程中對(duì)學(xué)習(xí)率進(jìn)行衰減,使得模型獲得更好的分類性能[21]。訓(xùn)練前使用雙線性插值[22]來盡可能保證圖像縮放后的質(zhì)量,煙絲數(shù)據(jù)集中的每個(gè)圖像都被縮放到299×299 像素大小,用均值0.5 和標(biāo)準(zhǔn)差0.5對(duì)每個(gè)通道的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。在輸入前對(duì)訓(xùn)練集圖像進(jìn)行隨機(jī)打亂,以減少圖像順序?qū)δP偷挠绊憽?/p>

模型的優(yōu)化算法選用AdaBound:初始學(xué)習(xí)率為10-4。當(dāng)分類準(zhǔn)確率連續(xù)5次不下降時(shí),將當(dāng)前學(xué)習(xí)率調(diào)整為原學(xué)習(xí)率×0.2。設(shè)置訓(xùn)練批量大小為32。最大迭代次數(shù)設(shè)置為50次。每一輪迭代后,在測試集上對(duì)模型的準(zhǔn)確性進(jìn)行測試,保留每次迭代生成的模型及結(jié)果。選用交叉熵函數(shù)作為損失函數(shù),其表達(dá)式:

式中,m為當(dāng)前一批輸入網(wǎng)絡(luò)的圖像數(shù)量,yji為真實(shí)的標(biāo)簽,y?ji為預(yù)測的標(biāo)簽,Closs為損失值。交叉熵刻畫了實(shí)際輸出概率與期望輸出概率分布之間的距離,交叉熵的值越小,表示模型訓(xùn)練過程中的學(xué)習(xí)效果越好[23]。

試驗(yàn)基于Windows 10 操作系統(tǒng),GPU 為GeForce GTX 3080(10 GB 顯存),處理器為Inter(R)-Core(TM)i7-12700K CPU@3.61GHz,運(yùn)行內(nèi)存為32 G。模型的搭建與訓(xùn)練測試通過Python 語言實(shí)現(xiàn),基于PyTorch 深度學(xué)習(xí)框架,并行計(jì)算框架使用CUDA 11.3版本,開發(fā)環(huán)境使用Pycharm。

采用公式(9)—(12)計(jì)算準(zhǔn)確率(ACC)、精準(zhǔn)率(P)、召回率(R)、F1分?jǐn)?shù)等評(píng)價(jià)指標(biāo)。F1分?jǐn)?shù)是一個(gè)融合精準(zhǔn)率和召回率的綜合指標(biāo),F(xiàn)1分?jǐn)?shù)越高則說明模型越理想[24]。

式中:TP是正確分類為屬于該類的樣本數(shù),TN是正確分類為不屬于該類的樣本數(shù),F(xiàn)P是錯(cuò)誤分類為屬于該類的樣本數(shù),而FN是錯(cuò)誤分類為不屬于該類的樣本數(shù)。

2 結(jié)果與分析

2.1 模型性能分析

為了更清楚地顯示ECA-MS-Inception-ResNet-V2 的識(shí)別精度和分類結(jié)果,根據(jù)測試集上的模型分類結(jié)果繪制了一個(gè)混淆矩陣(圖5)。結(jié)合煙絲識(shí)別結(jié)果的混淆矩陣分析,提出的方法適用于梗絲、膨脹葉絲、葉絲、再造煙絲4 種不同類型的煙絲。在識(shí)別煙絲類型時(shí),每種煙絲類型的準(zhǔn)確性和召回率是不同的。ECA-MS-Inception-ResNet-V2網(wǎng)絡(luò)的具體性能如表1所示。各煙絲類型的識(shí)別精度保持在94.16%~100.00%,平均為97.21%;召回率保持在94.72%~99.69%,平均為97.20%。F1分?jǐn)?shù)為95.24%~99.84%,平均為97.20%。上述結(jié)果表明,所提出的方法在既定的數(shù)據(jù)集中表現(xiàn)良好,可以應(yīng)用于煙絲圖像在線識(shí)別。

圖5 使用ECA-MS-Inception-ResNet-V2的混淆矩陣Fig.5 Confusion matrix for using ECA-MS-Inception-ResNet-V2

表1 ECA-MS-Inception-ResNet-V2網(wǎng)絡(luò)性能表現(xiàn)Tab.1 Network performance with ECA-MS-Inception-ResNet-V2

2.2 高效通道注意力對(duì)模型性能的影響

去除高效注意力機(jī)制后(表2),識(shí)別精準(zhǔn)率降低0.31~1.88個(gè)百分點(diǎn),平均精準(zhǔn)率降低0.98個(gè)百分點(diǎn);平均召回率降低0.99 個(gè)百分點(diǎn);模型的平均F1分?jǐn)?shù)降低0.99 個(gè)百分點(diǎn),模型整體性能下降。注意力機(jī)制在低運(yùn)算工作量下有效增強(qiáng)了通道依賴性。在模型中融合高效通道注意力機(jī)制能強(qiáng)調(diào)煙絲圖像的關(guān)鍵信息,有效提升模型性能。

表2 去除高效通道注意力的網(wǎng)絡(luò)性能表現(xiàn)Tab.2 Network performance with efficient attention removed

2.3 多尺度特征融合對(duì)模型性能的影響

為了分析多尺度特征融合算法對(duì)模型性能的影響,使用煙絲數(shù)據(jù)集評(píng)估包含和不包含多尺度特征融合模塊的ECA-MS-Inception-ResNet-V2 模型。試驗(yàn)結(jié)果如圖6所示。應(yīng)用多尺度特征融合算法后,最大精度可以提高到100.00%。在相同條件下,梗絲、膨脹葉絲、葉絲和再造煙絲的準(zhǔn)確率分別提高了0.65、0.99、1.33、0.31個(gè)百分點(diǎn)。識(shí)別精度得到了明顯的提高。這說明由于深度網(wǎng)絡(luò)提取的信息過于抽象,在一定程度上造成了信息缺失。因此,多尺度特征融合算法在實(shí)踐中有效地提高了識(shí)別精度。

圖6 多尺度特征融合效果對(duì)比Fig.6 Effect comparison of multi-scale feature fusion

2.4 不同激活函數(shù)與優(yōu)化器的比較

在ECA-MS-Inception-ResNet-V2 網(wǎng)絡(luò)的構(gòu)建中,使用ReLU 或Sigmoid 作為激活函數(shù),Adam 作為優(yōu)化器是主流選擇。選擇了激活函數(shù)(ReLU、Sigmoid、PReLU)和優(yōu)化器(Adam、AdaBound)來形成多種方案。方案配置如表3所示。

一部分是在統(tǒng)一激活函數(shù)的前提下,進(jìn)行優(yōu)化器的選擇。試驗(yàn)包括方案1和方案4的比較,方案2和方案5的比較,以及方案3和方案6的比較。從表3可以看出,雖然方案1的F1分?jǐn)?shù)比方案4的高0.33個(gè)百分點(diǎn),但損失值卻比方案4 高。其他使用AdaBound 的方 案5 和6 比使用Adam 的方案表現(xiàn)更好。另一部分是在統(tǒng)一優(yōu)化器的前提下,進(jìn)行激活函數(shù)的選擇。試驗(yàn)包括方案1、2、3 和方案4、5、6 之間的比較。使用PReLU 函數(shù)的方案3 比方案1 和2的損失值低;方案4 和方案5 的F1分?jǐn)?shù)和損失值都比方案1低;方案6的F1分?jǐn)?shù)達(dá)到97.20%,而損失值最?。?.082)。根據(jù)試驗(yàn)結(jié)果和分析,最終使用AdaBound作為優(yōu)化器,使用PReLU作為激活函數(shù)。

表3 優(yōu)化器和激活函數(shù)的方案Tab.3 Scheme of optimizer and activation function

2.5 典型網(wǎng)絡(luò)性能對(duì)比

為了進(jìn)一步驗(yàn)證ECA-MS-Inception-ResNet-V2 網(wǎng)絡(luò)的性能,將該網(wǎng)絡(luò)與經(jīng)典網(wǎng)絡(luò)進(jìn)行性能比較。不同算法模型訓(xùn)練集損失值和測試集準(zhǔn)確率隨迭代次數(shù)變化的曲線如圖7 所示。從圖7 可以得出,ECA-MS-Inception-ResNet-V2 網(wǎng)絡(luò)比Inception-ResNet-V2 最終的損失值低,最終ECA-MSInception-ResNet-V2網(wǎng)絡(luò)準(zhǔn)確率最高。

圖7 不同算法模型的損失值和準(zhǔn)確率Fig.7 Loss and accuracy of different algorithm models

表4 顯示了6 種不同網(wǎng)絡(luò)的平均精度與耗時(shí)。ECA-MS-Inception-ResNet-V2 網(wǎng)絡(luò)增加了高效注意力機(jī)制和多尺度特征融合結(jié)構(gòu),并改變網(wǎng)絡(luò)的激活函數(shù),使煙絲圖像的識(shí)別更加準(zhǔn)確、高效。該算法的準(zhǔn)確率相比DensNet121 和Inception-ResNet-V2 分別提高3.50、2.60 個(gè)百分點(diǎn),而單幅圖像的檢測時(shí)間相比原模型增加0.014 s。在犧牲少量運(yùn)算速度的情況下,ECA-MS-Inception-ResNet-V2的準(zhǔn)確率得到了較大提升。

表4 各模型在測試集上的準(zhǔn)確率Tab.4 Test set accuracy of each model

選擇性能表現(xiàn)較好的DensNet121、Inception-ResNet-V2 和ECA-MS-Inception-ResNet-V2 進(jìn) 行比較,詳細(xì)的性能表現(xiàn)如表5 所示。ECA-MSInception-ResNet-V2 網(wǎng)絡(luò)與DensNet121 相 比,4 類 煙絲的識(shí)別效果有了明顯的提升。在DensNet121 分類結(jié)果中,梗絲、膨脹葉絲和葉絲的召回率較低,說明這3 類煙絲分類時(shí),相互混淆的概率較大。使用ECA-MS-Inception-ResNet-V2網(wǎng)絡(luò)進(jìn)行煙絲分類,梗絲、膨脹葉絲和葉絲的召回率都有了很大提升。

表5 各模型在測試集上的詳細(xì)性能表現(xiàn)Tab.5 Detailed performance of each model on the test set

ECA-MS-Inception-ResNet-V2 網(wǎng)絡(luò)與Inception-ResNet-V2網(wǎng)絡(luò)相比,梗絲、膨脹葉絲和葉絲的精準(zhǔn)率和召回率都有明顯提升。F1分?jǐn)?shù)的平均值提高2.62 個(gè)百分點(diǎn)。說明ECA-MS-Inception-ResNet-V2 網(wǎng)絡(luò)在煙絲分類任務(wù)中有著更加優(yōu)秀的模型性能。

2.6 消融試驗(yàn)結(jié)果

對(duì)ECA-MS-Inception-ResNet-V2 網(wǎng)絡(luò)進(jìn)行消融試驗(yàn),以評(píng)估所提出方法的每個(gè)組成部分對(duì)性能的影響。選擇Inception-ResNet-V2 網(wǎng)絡(luò),以評(píng)估圖像預(yù)處理模塊(IPP)、高效通道注意力模塊(ECA)、多尺度特征融合模塊(MCFF)對(duì)ECA-MSInception-ResNet-V2 模型性能的影響。消融試驗(yàn)結(jié)果如表6 所示?;揪W(wǎng)絡(luò)結(jié)構(gòu)Inception-ResNet-V2(網(wǎng)絡(luò)1)在未經(jīng)圖像預(yù)處理的原數(shù)據(jù)集上取得了92.92%的平均精度和92.84%的平均召回率,模型的平均F1分?jǐn)?shù)為92.85%。圖像預(yù)處理使平均精度和召回率分別達(dá)到94.63%和94.57%,圖像預(yù)處理與直接使用原始圖像(2 788 像素×2 238 像素)縮放到模型輸入圖像(229 像素×229 像素)的方法相比,其有效地減少了處理過程中圖像細(xì)節(jié)信息的損失。網(wǎng)絡(luò)3的高效通道注意力模塊提高了目標(biāo)特征表達(dá)能力,大大提高了模型性能,與網(wǎng)絡(luò)2 相比,評(píng)價(jià)指數(shù)分別提高了1.79、1.81、1.79 個(gè)百分點(diǎn)。與網(wǎng)絡(luò)3相比,網(wǎng)絡(luò)4包括一個(gè)多尺度特征融合模塊,以融合不同的特征信息,提高區(qū)分度和圖像表現(xiàn)能力。與網(wǎng)絡(luò)3 相比,它在每個(gè)評(píng)價(jià)指標(biāo)上分別提高了0.81、0.82、0.83 個(gè)百分點(diǎn)。試驗(yàn)結(jié)果顯示,每個(gè)組件都能明顯改善ECA-MS-Inception-ResNet-V2的性能。

表6 ECA-MS-Inception-ResNet-V2各組成部分的試驗(yàn)結(jié)果Tab.6 Experimental results of each component of the ECA-MS-Inception-ResNet-V2

3 結(jié)論與討論

為了解決煙絲類型識(shí)別中的一系列問題,提供篩選煙絲樣本、拍攝圖像、圖像預(yù)處理、建立數(shù)據(jù)集和類型識(shí)別的整套方案。使用K-means 聚類算法進(jìn)行煙絲圖像二值化,完成煙絲圖像的前后景分離,使最大類間方差法計(jì)算的閾值更符合煙絲圖像。避免了煙絲主體輪廓?dú)埲钡那闆r出現(xiàn),提高輸入圖像的抗環(huán)境干擾能力和特征提取能力。提出了一種基于ECA-MS-Inception-ResNet-V2 網(wǎng)絡(luò)的煙絲類型識(shí)別方法。首先,在Inception-ResNet-V2網(wǎng)絡(luò)中引入高效通道注意力策略,通過自適應(yīng)選擇一維卷積核來確定跨通道覆蓋率,在保持高效通道注意力性能的同時(shí)降低了計(jì)算成本,加強(qiáng)模型提取特征的能力;其次,將改進(jìn)后的模塊輸出的特征圖進(jìn)行多尺度融合,增加特征代表性,降低過擬合風(fēng)險(xiǎn);最后,在比較收斂性和準(zhǔn)確性時(shí),使用PReLU 激活函數(shù)和AdaBound 優(yōu)化器。最終,ECA-MSInception-ResNet-V2 網(wǎng)絡(luò)得到97.23%的識(shí)別準(zhǔn)確率,損失值為0.082,平均F1分?jǐn)?shù)為97.20%,識(shí)別單張煙絲圖像時(shí)間為0.107 s。試驗(yàn)結(jié)果表明,ECAMS-Inception-ResNet-V2網(wǎng)絡(luò)準(zhǔn)確率相比典型網(wǎng)絡(luò)Vgg16、ResNet34、MobileNet-V2、DensNet121 和Inception-ResNet-V2 分別提高10.50、10.42、7.16、3.50、2.60個(gè)百分點(diǎn),模型性能提升顯著。

后續(xù)將探究不同類型煙絲自身的幾何特征,如長度、寬度、面積和縱橫比等對(duì)煙絲分類的影響,將這些特征與圖像信息共同輸入網(wǎng)絡(luò)。同時(shí),將進(jìn)行實(shí)際現(xiàn)場安裝并應(yīng)用,進(jìn)一步驗(yàn)證模型性能。

猜你喜歡
葉絲煙絲注意力
含水率和溫度對(duì)煙絲破碎規(guī)律的影響
葉絲氣流干燥過程中水分和丙三醇遷移特性
煙草科技(2022年11期)2022-12-20 05:58:40
讓注意力“飛”回來
葉絲結(jié)構(gòu)均勻性在線調(diào)控系統(tǒng)的設(shè)計(jì)
煙草科技(2019年11期)2019-12-13 06:23:26
SH93蒸汽施加量對(duì)云南煙葉葉絲感官質(zhì)量的影響
結(jié)存煙絲返摻方式的選擇
“揚(yáng)眼”APP:讓注意力“變現(xiàn)”
A Beautiful Way Of Looking At Things
葉絲暫存工序?qū)χ平z卷煙加工質(zhì)量影響的研究
大眾科技(2015年8期)2015-12-17 05:56:26
基于PLC的煙絲配比控制系統(tǒng)的研制
河南科技(2014年24期)2014-02-27 14:19:42
济宁市| 日照市| 吉隆县| 陕西省| 新邵县| 高平市| 南木林县| 鹿邑县| 陇南市| 临海市| 波密县| 游戏| 鄂州市| 德惠市| 南丰县| 德化县| 新邵县| 丹巴县| 赤壁市| 柳州市| 巩义市| 兴和县| 太白县| 明溪县| 尼玛县| 桐乡市| 靖边县| 德兴市| 阿合奇县| 沂南县| 叶城县| 湘潭市| 沙田区| 全椒县| 芒康县| 承德市| 寿宁县| 鄂州市| 南通市| 龙海市| 丹江口市|