趙瑩瑩
(廣西工業(yè)職業(yè)技術(shù)學(xué)院,廣西 南寧 530001)
食品包裝作為現(xiàn)代食品產(chǎn)業(yè)的重要組成部分,不僅具有包裝和保護(hù)食品的功能,還扮演了關(guān)鍵的市場(chǎng)宣傳和品牌傳遞的角色。然而,在食品包裝的生產(chǎn)過(guò)程中,由于各種因素的影響,可能會(huì)出現(xiàn)各種缺陷,如破損、污漬、印刷不良等問(wèn)題,這不僅會(huì)損害產(chǎn)品的外觀質(zhì)量,還可能對(duì)產(chǎn)品的安全性產(chǎn)生不利影響[1-2]。因此,對(duì)食品包裝的缺陷進(jìn)行及時(shí)而有效的檢測(cè)變得尤為重要[3-4]。隨著計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)技術(shù)的快速發(fā)展,機(jī)器視覺(jué)檢測(cè)成為自動(dòng)化生產(chǎn)過(guò)程中廣泛應(yīng)用的技術(shù)之一[5-7]。機(jī)器視覺(jué)系統(tǒng)能夠高速和高精度地對(duì)產(chǎn)品進(jìn)行檢測(cè),為制造商提供了一種強(qiáng)有力的工具,以確保產(chǎn)品的質(zhì)量和一致性。在這一背景下,針對(duì)食品包裝的機(jī)器視覺(jué)檢測(cè)方法的研究變得至關(guān)重要。
本文旨在探討針對(duì)食品包裝的機(jī)器視覺(jué)檢測(cè)方法,以提高食品包裝缺陷的檢測(cè)效率和準(zhǔn)確性。首先,介紹構(gòu)建食品包裝缺陷檢測(cè)系統(tǒng)的基本框架;然后,詳細(xì)描述基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)的缺陷檢測(cè)方法,該方法已被廣泛用于計(jì)算機(jī)視覺(jué)任務(wù),具有強(qiáng)大的特征提取和分類能力;最后,對(duì)所提出方法進(jìn)行了實(shí)驗(yàn),驗(yàn)證其在實(shí)際應(yīng)用中的有效性。
食品包裝缺陷檢測(cè)的機(jī)器視覺(jué)系統(tǒng)由圖像采集模塊和上位機(jī)兩大部分組成,如圖1所示。系統(tǒng)工作時(shí),在檢測(cè)區(qū)域,光源照亮食品包裝,工業(yè)相機(jī)捕捉圖像數(shù)據(jù),這些圖像數(shù)據(jù)傳輸?shù)缴衔粰C(jī)。上位機(jī)的圖像識(shí)別模塊對(duì)圖像進(jìn)行處理和特征提取,然后傳遞給缺陷檢測(cè)模塊。缺陷檢測(cè)模塊運(yùn)用預(yù)訓(xùn)練的模型來(lái)判斷圖像中是否存在食品包裝缺陷,并對(duì)缺陷進(jìn)行分類。最后,系統(tǒng)可以根據(jù)檢測(cè)結(jié)果采取相應(yīng)的控制措施,如自動(dòng)拒絕有缺陷的包裝或進(jìn)行進(jìn)一步的質(zhì)量控制。
圖1 系統(tǒng)框架
CNN[8-10]是一種深度學(xué)習(xí)模型,包括輸入層、卷積層、特征圖、降采樣層、全連接層和輸出層,如圖2所示。輸入層接收原始圖像數(shù)據(jù)。通常,輸入圖像被表示為多通道的矩陣,其中每個(gè)通道對(duì)應(yīng)于圖像的不同特征。輸入層的輸出是一個(gè)三維張量,其維度由圖像的高度、寬度和通道數(shù)決定。卷積層是CNN的核心部分,用于提取圖像中的特征:
圖2 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
(1)
其中,I為輸入圖像;K為卷積核;(x,y)為輸出特征圖中的位置;(i,j)為卷積核的坐標(biāo);a和b分別為卷積核的高度和寬度。卷積層的輸出被稱為特征圖,每個(gè)特征圖對(duì)應(yīng)一個(gè)卷積核,捕捉輸入圖像的不同特征。降采樣層用于減小特征圖的空間分辨率,減少計(jì)算復(fù)雜度,并提高模型的泛化能力。常用的降采樣操作是池化(Pooling):
P(x,y)=maxi,jF(x+i,y+j)
(2)
其中,P為池化后的特征圖;F為輸入特征圖;(x,y)為輸出特征圖中的位置;(i,j)為池化區(qū)域的坐標(biāo)。全連接層將降采樣后的特征圖轉(zhuǎn)換為一個(gè)向量,然后通過(guò)一個(gè)全連接的神經(jīng)網(wǎng)絡(luò)層進(jìn)行分類或回歸等任務(wù):
Z=WX+b
(3)
其中,Z為輸出向量;W為權(quán)重矩陣;X為輸入向量;b為偏置向量。輸出層生成CNN的最終輸出,通常用于分類問(wèn)題,它可以采用 softmax 函數(shù)將輸出轉(zhuǎn)化為類別概率分布:
(4)
其中,P(y=i|X)為輸入樣本屬于第i類的概率;Zi為全連接層的輸出中的第i個(gè)元素;N為類別總數(shù)。
要使用卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)食品包裝的缺陷檢測(cè),可以遵循以下步驟。
(1)數(shù)據(jù)采集和標(biāo)注:收集包括正常和缺陷食品包裝的圖像數(shù)據(jù)集。
(2)數(shù)據(jù)預(yù)處理:對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,包括調(diào)整圖像大小、歸一化像素值和數(shù)據(jù)增強(qiáng)。數(shù)據(jù)增強(qiáng)可以通過(guò)隨機(jī)旋轉(zhuǎn)、翻轉(zhuǎn)和裁剪等方法增加數(shù)據(jù)集的多樣性,提高模型的泛化能力。
(3)構(gòu)建卷積神經(jīng)網(wǎng)絡(luò):確保網(wǎng)絡(luò)能夠適應(yīng)輸入圖像的尺寸和通道數(shù),并具有足夠的深度以提取特征。
(4)模型訓(xùn)練:使用數(shù)據(jù)集訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),并通過(guò)優(yōu)化損失函數(shù)來(lái)更新模型的權(quán)重。
(5)模型評(píng)估:對(duì)訓(xùn)練后的模型進(jìn)行評(píng)估,使用獨(dú)立的測(cè)試數(shù)據(jù)集來(lái)測(cè)量模型的性能。
(6)缺陷檢測(cè):將訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于實(shí)際的食品包裝圖像以進(jìn)行缺陷檢測(cè)。
(7)調(diào)整和優(yōu)化:根據(jù)實(shí)際應(yīng)用的需求,可以對(duì)模型進(jìn)行微調(diào)和優(yōu)化,以提高檢測(cè)的性能和魯棒性,包括調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)、超參數(shù)和數(shù)據(jù)增強(qiáng)策略。
為了對(duì)模型進(jìn)行測(cè)試,本文構(gòu)建了產(chǎn)品包裝數(shù)據(jù)集:首先,收集包括正常和缺陷食品包裝的圖像數(shù)據(jù),這些圖像為在線資源,確保數(shù)據(jù)涵蓋各種包裝類型、形狀、大小和缺陷類型;其次,對(duì)收集的圖像進(jìn)行標(biāo)注,以明確每個(gè)圖像是否存在缺陷以及缺陷的類型和位置;最后,將數(shù)據(jù)集分成訓(xùn)練集和測(cè)試集。
當(dāng)使用食品包裝數(shù)據(jù)集進(jìn)行缺陷檢測(cè)實(shí)驗(yàn)時(shí),實(shí)驗(yàn)分為訓(xùn)練和測(cè)試2個(gè)階段。
3.2.1 訓(xùn)練階段
(1)數(shù)據(jù)準(zhǔn)備。將數(shù)據(jù)集的70%劃分為訓(xùn)練集,30%劃分為測(cè)試集。
(2)數(shù)據(jù)預(yù)處理。對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,包括圖像大小調(diào)整、像素歸一化和數(shù)據(jù)增強(qiáng)。
(3)構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)。設(shè)計(jì)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),包括卷積層、池化層、全連接層和輸出層。
(4)模型訓(xùn)練。使用訓(xùn)練數(shù)據(jù)集訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),通過(guò)優(yōu)化損失函數(shù)來(lái)更新模型參數(shù)。
3.2.2 測(cè)試階段
(1)模型評(píng)估。使用測(cè)試集對(duì)訓(xùn)練好的模型進(jìn)行評(píng)估,計(jì)算準(zhǔn)確度、召回率、精確度和F1分?jǐn)?shù)等性能指標(biāo)。
(2)缺陷檢測(cè)。將訓(xùn)練好的模型應(yīng)用于新的未見(jiàn)數(shù)據(jù)(即真實(shí)食品包裝圖像),以檢測(cè)缺陷并輸出檢測(cè)結(jié)果。
(3)模型優(yōu)化。根據(jù)測(cè)試結(jié)果,對(duì)模型進(jìn)行微調(diào)和優(yōu)化,以提高性能和魯棒性。
本文采用準(zhǔn)確度、召回率、精確度和F1分?jǐn)?shù)對(duì)模型進(jìn)行綜合性評(píng)估,結(jié)果如表1所示。模型在整個(gè)測(cè)試數(shù)據(jù)集上的準(zhǔn)確率為94.0%,表示模型正確分類了94.0%的樣本,包括正常和缺陷的食品包裝。模型在檢測(cè)缺陷食品包裝方面表現(xiàn)良好,召回率為93.8%,意味著模型成功捕獲了93.8%的實(shí)際缺陷樣本;精確度為95.4%,表示模型在預(yù)測(cè)為缺陷的樣本中,有95.4%的預(yù)測(cè)是正確的;模型的F1分?jǐn)?shù)為94.6%,綜合考慮了召回率和精確度,可用于衡量模型的整體性能。綜合來(lái)看,模型在食品包裝缺陷檢測(cè)任務(wù)中表現(xiàn)出較高的準(zhǔn)確度和F1分?jǐn)?shù),這表明其在對(duì)正常和缺陷樣本的分類中都取得了良好的結(jié)果。
表1 實(shí)驗(yàn)結(jié)果
本研究構(gòu)建了一個(gè)機(jī)器視覺(jué)系統(tǒng),利用卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了食品包裝缺陷的自動(dòng)化檢測(cè)。該系統(tǒng)的核心部分包括圖像采集模塊和上位機(jī),協(xié)同工作,以高效、準(zhǔn)確地檢測(cè)食品包裝的缺陷。通過(guò)詳細(xì)的數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練和測(cè)試流程,本文獲得了有關(guān)模型性能的評(píng)估結(jié)果,表明模型在分類和檢測(cè)正常和缺陷食品包裝方面表現(xiàn)出良好的性能。
這項(xiàng)研究成果具有廣泛的實(shí)際應(yīng)用前景,不僅可以用于食品包裝質(zhì)量控制,還可以應(yīng)用于其他制造業(yè)領(lǐng)域的缺陷檢測(cè)任務(wù)。此外,隨著深度學(xué)習(xí)和機(jī)器視覺(jué)技術(shù)的不斷發(fā)展,相信這個(gè)研究能為未來(lái)的自動(dòng)化質(zhì)量控制提供有益的基礎(chǔ),有望推動(dòng)工業(yè)生產(chǎn)的提質(zhì)增效。