張 莉, 焦宇倩, 續(xù) 婷, 侯宇超, 白艷萍, 李建軍
(1. 中北大學 理學院, 山西 太原 030051; 2. 中北大學 信息與通信工程學院, 山西 太原 030051)
混凝土配合比的設(shè)計是混凝土材料設(shè)計的基礎(chǔ), 它直接影響混凝土結(jié)構(gòu)設(shè)計要求的強度、 施工所要求的混凝土拌合物的和易性、 耐久性要求等, 并保證不同用途混凝土所要求的質(zhì)量. 目前, 關(guān)于混凝土裂縫檢測[1-3]的研究比較多, 而針對混凝土配合比圖像識別的研究還很少. 圖像分類主要分三步, 分別是圖像預(yù)處理、 圖像特征提取、 圖像分類. 混凝土圖像特征提取與分類是本文研究的重點. 由于紋理是由灰度分布在空間位置上反復(fù)出現(xiàn)而形成的, 因而在圖像空間中相隔某距離的兩像素之間會存在一定的灰度關(guān)系, 即圖像中灰度的空間相關(guān)特性. 灰度共生矩陣就是一種通過研究灰度的空間相關(guān)特性來描述紋理的常用方法[4]. 王民等[4]提出了一種多尺度灰度共生矩陣的紋理特征提取方法, 分別提取HSI色彩分量的灰度共生矩陣紋理特征, 實現(xiàn)了對中國畫的分類. 朱琳等[5]結(jié)合灰度共生矩陣理論對CT混凝土圖像在不同荷載作用下的細觀損傷演化過程進行了說明. Relly Andayani等[6]利用灰度共生矩陣紋理特征值對混凝土塌落度進行了分類. Asha Gowda Karegowda等[7]利用彩色共生矩陣, 提高了圖像檢索的性能. 王輝等[8]利用彩色共生矩陣的方法實現(xiàn)了對木質(zhì)板材的分類.
根據(jù)上述研究發(fā)現(xiàn), 單純采用灰度共生矩陣進行圖像紋理特征提取, 會導致顏色信息的損失, 識別精度較低. 而用彩色共生矩陣進行圖像特征提取, 融合了顏色特征, 具有較強的魯棒性, 可以彌補其他特征的不足. 本文提出一種基于彩色共生矩陣和支持向量機的混凝土圖像識別方法, 獲得了較為滿意的識別精度.
選用的兩種數(shù)據(jù)集均來自于中北大學土木工程專業(yè)構(gòu)建的數(shù)據(jù)集, 每一張圖像都是同一樣本在不同拍攝角度下得到的. 其中CIRD_A的獲取時間為2019年11月, 共有12類混凝土圖像; CIRD_B的獲取時間為2020年3月, 共有33類混凝土圖像.
該數(shù)據(jù)集中混凝土的配合比有3種, 分別為 4∶6, 5∶5, 6∶4; 粒徑范圍有4種, 分別為: 0.3 mm~0.6 mm, 0.6 mm~1.18 mm, 1.18 mm~2.36 mm, 2.36 mm~4.75 mm. 選取表1 所列的9類混凝土圖像.
表1 CIRD_A文件目錄
該數(shù)據(jù)集中混凝土的配合比有11種, 分別為 0∶1, 1∶9, 2∶8, 3∶7, 4∶6, 5∶5, 6∶4, 7∶3, 8∶2, 9∶1, 1∶0; 粒徑范圍有3種, 分別為: 0.075 mm~0.3 mm, 0.3 mm~0.6 mm, 0.6 mm~1.18 mm. 選取表2 所列的9類混凝土圖像.
表2 CIRD_B文件目錄
由于混凝土圖像存在多余背景, 我們利用PS軟件中的裁切工具對這72張圖片進行處理. 將裁剪出的不規(guī)則四邊形目標圖像調(diào)整成2 000*2 000分辨率圖片進行保存(原始圖像大小為: 4 752*3 168像素). 目前兩種數(shù)據(jù)集中混凝土圖像樣本數(shù)較少, 因此采用步長裁剪的方式擴充數(shù)據(jù)集. 選擇步長為230, 將圖像裁剪成 280*280分辨率的圖片, 可以滿足混凝土圖像的真實配比, 有利于特征的有效提取. 圖 1 為原始圖像和裁切無關(guān)背景后的圖像.
圖 1 圖像處理示例圖
2.1.1 遺傳算法
遺傳算法最早是由Holland教授根據(jù)達爾文的進化論所提出的一種高效啟發(fā)式搜索方法[9]. 它通過遺傳中的選擇、 交叉、 變異等操作產(chǎn)生下一代的解, 使適應(yīng)度函數(shù)值高的個體被保留, 并逐漸淘汰適應(yīng)度函數(shù)值低的個體, 如此循環(huán), 就能得到滿足條件的解, 達到優(yōu)化目的.
2.1.2 SVM理論
支持向量機是由Vapnik于1995年提出的一種機器學習理論, 可用于回歸分析與分類[10]. 其分類思想是將低維空間中線性不可分的數(shù)據(jù)樣本映射到高維空間使其線性可分, 并在高維空間中找到一個最優(yōu)超平面, 使得不同類別數(shù)據(jù)點之間的距離最大化.
設(shè)n個樣本集{((xi,yi)|i=1,2,…,n)},xi∈Rn,yi∈{-1,+1},xi為訓練樣本點,yi為其對應(yīng)標簽.使y=+1類與y=-1類數(shù)據(jù)點的間隔最大的超平面為
ωTxi-b=0,i=1,2,…,n.
(1)
為了保證數(shù)據(jù)點xi所允許的偏離差最小, 引入松弛變量ξi(ξi≥0), 懲罰因子c, 得到如式(2)的目標函數(shù)
(2)
為了處理非線性數(shù)據(jù), 選用RBF核函數(shù)對SVM進行推廣, 利用此函數(shù)將樣本映射到高維空間, 使得線性分類的精確率提升. RBF核函數(shù)公式為
(3)
式中:g為核函數(shù)半徑.
(4)
根據(jù)給定的RBF核函數(shù), SVM分類器表示為
F(x)=sgn(f(x)),
(5)
式中:f(x)為SVM分類超平面決策函數(shù).
(6)
2.1.3 優(yōu)化模型
為了提升SVM的分類器性能, 提高分類精確率, 通過使用遺傳算法優(yōu)化支持向量機, 實質(zhì)上就是通過此方法尋找到合適的懲罰因子c及核函數(shù)半徑g[10]. 優(yōu)化步驟如下:
1) 對支持向量機中的參數(shù)c,g進行二進制編碼, 并產(chǎn)生初始種群;
2) 對種群進行選擇、 交叉、 變異操作及計算適應(yīng)度函數(shù), 若滿足GA終止條件, 直接輸出最優(yōu)參數(shù)組合(cbest=29.56,gbest=0.25);
3) 將參數(shù)cbest,gbest代入SVM進行訓練及測試集分類, 判別是否符合實驗設(shè)定的精度, 如不滿足, 返回步驟2);
4) 利用最優(yōu)參數(shù), 建立混凝土圖像分類的GA-SVM模型, 對測試集利用滿足精度的GA-SVM模型進行分類, 并輸出結(jié)果.
如圖 2 為GA算法優(yōu)化SVM模型的參數(shù)尋優(yōu)適應(yīng)度曲線, 從圖中可以看出, GA算法具有良好的收斂性能和尋優(yōu)效率.
圖 2 參數(shù)尋優(yōu)適應(yīng)度曲線
灰度共生矩陣是在20世紀70年代由Haralick[11]首次提出的, 自此被廣泛應(yīng)用于紋理特征提取. 它是通過研究具有一定距離像素對之間的空間相關(guān)性來表述圖像紋理特征. 由于灰度共生矩陣計算量較大, 一般不直接應(yīng)用, 而是在此基礎(chǔ)上采用二次統(tǒng)計量描述紋理信息. Haralick提出了14種灰度紋理特征參數(shù)(Haralick特征能數(shù)), 本文使用了其中的8種, 分別是二階矩、 對比度、 相關(guān)性、 逆差距、 均值和、 熵、 和方差與差方差.
灰度共生矩陣是圖像的一種二階統(tǒng)計量. 給定一副數(shù)字圖像I(x,y), 其灰度級為L, 則灰度共生矩陣G(x,y)中(i,j)的值被定義為I(x,y)在θ方向上, 間隔為d的兩個像素點對(i,j)的統(tǒng)計數(shù)目n.G(x,y)的尺寸為L×L,n為灰度共生矩陣在G(i,j)的像素值. 圖 3 為0°方向上的8級灰度共生矩陣構(gòu)造.
圖 3 0°方向上的8級灰度共生矩陣構(gòu)造
彩色共生矩陣的概念最早是由Palm[12]提出的, 其將顏色和紋理相結(jié)合的方法歸結(jié)為平行法、 順序法和綜合法. 平行法和順序法是將顏色和紋理作為獨立的圖像特征進行融合分析, 這樣勢必會造成原始彩色圖像信息的損失; 綜合法是指從某幅原始彩色圖像中獲取各個顏色通道的偽灰度圖像, 分別提取各偽灰度圖像的灰度共生矩陣紋理特征參數(shù), 用這些提取出來的紋理特征參數(shù)描述原始彩色圖像紋理. 本文采用綜合法.
彩色共生矩陣構(gòu)造步驟[13]如下:
1) 顏色空間選擇. 顏色空間的選擇對于彩色圖像的識別是一個至關(guān)重要的環(huán)節(jié). H(色調(diào)), S(飽和度), V(明度)空間能夠更加貼近人類的視覺感知. HSV顏色空間是一個均勻的六角椎體模型, 模型的 3個坐標是獨立的, 能夠把HSV各個分量的變化表現(xiàn)得很清晰.
圖 4 混凝土圖像的HSV分量及其共生矩陣
2) 顏色空間轉(zhuǎn)換. 將原始混凝土圖像從RGB空間轉(zhuǎn)換到HSV空間.
3) 對HSV空間中的每個顏色通道H, S, V分別構(gòu)造灰度共生矩陣, 并計算2.2節(jié)中提到的8個 Haralick特征參數(shù).
圖 4 為混凝土圖像的HSV分量及其構(gòu)造的共生矩陣圖像.
借助彩色共生矩陣的思想, 提出一種新的獲取混凝土圖像紋理特征的方法. 具體的操作步驟如下:
1) 將預(yù)處理后得到的混凝土圖像全部轉(zhuǎn)換到HSV空間, 并提取H, S, V 3個色彩分量, 得到的圖像定義為偽灰度圖像. 對9類混凝土圖像H分量的偽灰度圖像分別提取8個特征參數(shù), 并用A,B,C,D,E,F(xiàn),G,H代替. 例如Anm,n為混凝土圖像的類別;m為對應(yīng)的色彩分量,m為1時表示H,m為2時表示S,m為3時表示V. 得到如下8維特征矩陣.
(7)
2) 對S,V色彩分量重復(fù)步驟1), 這樣就得到了混凝土圖像3個色彩分量所對應(yīng)的特征矩陣.
3) 將3個特征矩陣進行融合, 可以得到了一個 24維的特征矩陣為
特征分析是目標識別、 圖像分割和圖像分類中的重要方法. 本研究應(yīng)用MATLAB2014a軟件編寫的程序來計算混凝土彩色圖像的特征參數(shù)均值.
圖 5 所示為CIRD_B中9類混凝土圖像彩色共生矩陣特征參數(shù)曲線. 由圖 5 可知, 彩色共生矩陣3個顏色通道的這8個特征參數(shù)與混凝土圖像不同類別之間存在著較大的差異, 因此, 利用這些信息, 能夠很好地獲取每一類混凝土圖像樣本的顏色及紋理信息. 因此, 本文方法是可行的.
圖 5 CIRD_B中9類混凝土圖像彩色共生矩陣特征參數(shù)曲線
選取預(yù)處理后的CIRD_B中的混凝土圖像(隨機選取訓練集70%, 測試集30%)進行識別, 驗證彩色共生矩陣提取特征應(yīng)用于混凝土圖像分類的有效性. 圖 6 所示為CIRD_B中9類混凝土圖像. 由于篇幅限制, 不再給出CIRD_A.
圖 6 CIRD_B中的9類混凝土圖像
根據(jù)本文提出的彩色共生矩陣方法, 繪制了如圖 7 所示的流程圖.
圖 7 分類方法框架圖
彩色共生矩陣容易受到步長d、 顏色空間、 灰度級以及方向等參數(shù)的影響. 方向參數(shù)選取0°, 45°, 90°, 135° 4個方向特征值的平均值, 這樣能大大減少方向?qū)μ卣鲄?shù)的影響[14]. 選擇SVM進行分類, 通過多組對比試驗, 分析步長、 顏色空間、 灰度級等參數(shù)對實驗結(jié)果的影響.
4.3.1 步長d對實驗結(jié)果的影響
顏色空間選擇HSV, 灰度級選擇256步, 討論步長d對實驗結(jié)果的影響, 這樣有利于保持混凝土圖像的最大信息量, 保證特征參數(shù)的有用性. 由于步長d較大時, 會導致大量像素點不參與灰度共生矩陣運算, 造成紋理信息不準確, 本實驗中d最大為5.CIRD_B不同步長的分類精確率見表3.實驗結(jié)果表明, 當d=2時效果最好, 合適的步長有利于灰度共生矩陣更好地描述混凝土圖像特征.
表3 CIRD_B不同步長的分類精確率
4.3.2 顏色空間對實驗結(jié)果的影響
顏色空間的選擇和建立對獲取混凝土圖像的色彩特征具有重要作用, 合適的色彩空間能夠有效地獲取樣本的色彩特征. 本研究選擇幾種常見的顏色空間并結(jié)合灰度共生矩陣來獲取特征. 其中, 步長d=2, 灰度級為256, 選取的顏色空間為HSV, HSI, RGB, 分類精確率見表4. 實驗結(jié)果表明, 顏色空間為HSV效果最好.
表4 CIRD_B不同顏色空間的分類精確率
4.3.3 灰度級對實驗結(jié)果的影響
步長d=2, 顏色空間選擇HSV空間, 灰度級選擇16, 32, 64, 128, 256時的分類精確率見表5. 實驗結(jié)果表明, 當灰度級為256時效果最好. 圖像的灰度級越大, 圖像紋理越清晰, 越能保留混凝土圖像的真實信息.
表5 CIRD_B不同灰度級的分類精確率
4.3.4 基于CGLCM與多種分類器的兩種數(shù)據(jù)集混凝土圖像識別
根據(jù)步長、 顏色空間、 灰度級3組對比實驗結(jié)果, 得到了較為合適的彩色共生矩陣參數(shù)值: 步長d=2, 灰度級為256, 顏色空間為HSV. 為了進一步驗證彩色共生矩陣(CELCM)的有效性, 將它與傳統(tǒng)灰度共生矩陣(GLCM)進行比較, 并且對比了不同分類器對實驗結(jié)果的影響. 由于BP神經(jīng)網(wǎng)絡(luò)也是一種經(jīng)典的分類器, 故將BP神經(jīng)網(wǎng)絡(luò)也加入到對比實驗中. 每種分類器分別對兩種數(shù)據(jù)集進行50次實驗, 并取精確率的平均值, 結(jié)果見表6. 實驗結(jié)果表明, 兩種數(shù)據(jù)集采用CGLCM與GA-SVM的分類效果最好.
表6 兩種數(shù)據(jù)集下傳統(tǒng)GLCM與CGLCM的分類精確率
本文選用了兩種混凝土圖像數(shù)據(jù)集, 提出了一種基于彩色共生矩陣支持和基于向量機的分類方法. 利用彩色共生矩陣提取24維特征向量, 將其輸入到BP神經(jīng)網(wǎng)絡(luò)、 SVM、 PSO-SVM、 GS-SVM、 GA-SVM中. 實驗結(jié)果表明, CIRD_A和CIRD_B在GA-SVM上的識別精度最好, 分別可以達到 97.76%, 96.34%, 遠超其他分類器, 用該方法識別混凝土圖像是可行的.