程昱之,鐘麗輝,何 鑫,王 遠,李朝嵐
(1. 西南林業(yè)大學 機械與交通學院,云南 昆明 650224;2. 西南林業(yè)大學 大數(shù)據(jù)與智能工程學院,云南 昆明650224)
闊葉材橫截面微觀圖像由管孔、木射線、生長輪、木纖維和軸向薄壁組織構成,其中管孔是木材研究最重要的特征之一[1?3]。管孔不僅是分析考古木材樣品的構造特征與保護狀態(tài)的研究要素[3],也是研究某一地區(qū)若干年內(nèi)木材生長量和環(huán)境氣候變化相關性的依據(jù)[4]。管孔的分割是微觀木材圖像中提取管孔特征量和進行木材樹種自動識別的關鍵步驟[5?6],因此,微觀木材圖像中的管孔分割有重要的研究意義。近些年來應用于管孔分割的算法主要有數(shù)學形態(tài)學、區(qū)域生長、目標遺傳和水平集等[7?9]。張廣群等[9]首先運用多目標遺傳算法成功地分割出圖像中的大部分管孔,但會出現(xiàn)復管孔或管孔團的漏分,同時部分軸向薄壁組織會連同其附近的管孔一起被分割出來。汪杭軍[10]運用局部水平集算法,以局部灰度分布的均值作為統(tǒng)計信息,加強了管孔區(qū)域和背景區(qū)域的對比度,該算法雖然克服了漏分問題,但出現(xiàn)了噪聲的誤分割,一部分噪聲為一些輪廓較大的木射線組織,另一部分為形狀大小與管孔相似的木纖維組織。祁亨年等[11]運用改變結構元素和形態(tài)尺度的數(shù)學形態(tài)學算法對管孔進行分割,該算法克服了木射線和木纖維組織等噪聲的影響,但出現(xiàn)了圖像邊緣細節(jié)丟失,如較小的管孔被當作噪聲去除或是較大的管孔部分組織缺失。SHEN等[12]通過檢測閉合區(qū)域的平均面積得出最適合的結構元素,并運用形態(tài)學算法對管孔進行分割,但還是會出現(xiàn)小孔漏分,大孔誤分的情況。由于木材橫截面微觀圖像中管孔數(shù)量眾多、形態(tài)各異且隨機分布,木纖維和軸向薄壁組織橫截面也呈現(xiàn)一個個相對較小的孔洞,從而對管孔進行分割較為困難。綜上所述,微觀木材圖像中管孔的分割依然是目前的研究熱點和難點。本研究提出了一種改進K-means聚類與分水嶺的木材橫截面管孔分割算法,旨在解決管孔漏分、誤分和噪聲去除的問題并快速分割出管孔區(qū)域。
日本森林數(shù)據(jù)庫(https://db.ffpri.go.jp/WoodDB/JWDB/home.php)。該數(shù)據(jù)庫成立于1928年,現(xiàn)有木材標本29 000余號,隸屬270科2 050屬8 500種;切片標本約90 000號[13]。本研究用到的木材樹種為大紅葉楓 Acer amoenum(15幀圖像)、尖齒槭A. argutum(5幀)、細柄槭A. capillipes(4幀)、茶條槭 A.ginnala(1幀)、桑葉槭 A. morifolium(3幀)、毛果槭 A. nikoense(3幀)、日本槭 A. nipponicum(5幀)、賽波德槭A. sicboldianum(24幀)、 花 楷 槭A. ukurunduense(6幀)、 紅 脈 槭A. rufinerve(25幀)、 薄 葉 槭A.tenuifolium(3幀)和褐枝獼猴桃Actinidia rufa(7幀)。
傳統(tǒng)的K-means聚類算法以距離作為相似性的評價指標,基本思想是按照距離將樣本聚成不同的簇,兩點距離越近,相似度就越大,以得到緊湊且獨立的簇作為聚類目標[14?15]。傳統(tǒng)的K-means聚類算法將樣本映射到RGB顏色特征空間,構造新的映射關系,能夠打破聚類只能是球狀的限制,但聚類中心的選擇會較大程度上影響分類效果,尤其是當聚類中心的選取全部位于管孔以外時,管孔區(qū)域會被整體歸為噪聲。此外,由于初始聚類中心的隨機生成,可能會導致分類結果不一致或?qū)⒛纠w維或軸向薄壁組織被整體分割出來?;诖?,針對以上問題進行算法改進,實現(xiàn)聚類中心的自適應選取。在RGB色彩空間下提取彩色木材微觀圖像的三通道分量。結合木材橫截面原圖,能夠看出生長輪和木射線區(qū)域顏色較深,顏色值較小,所以其對應顏色值較小的峰值附近區(qū)域;管孔區(qū)域顏色較淺,顏色值較大,所以其對應顏色值較大的峰值附近區(qū)域;軸向薄壁組織和木纖維區(qū)域顏色較為平均,顏色值介于前兩者之間,所以其對應兩峰之間的波谷附近區(qū)域。分別取3個分量的均值組成第1個中心點,代表顏色直方圖波谷附近區(qū)域,該點作為軸向薄壁組織和木纖維區(qū)域的簇類中心;遍歷三通道分量,對于大于各自均值的所有顏色值取中值作為第2個中心點,由于該點對應顏色值較大,所以該點作為管孔的簇類中心;小于各自均值的所有顏色值取中值作為第3個中心點,由于該點對應顏色值較小,所以作為生長輪和木射線區(qū)域的簇類中心,分別代表顏色直方圖兩峰峰值附近區(qū)域。設通道分量處的顏色值為計算每個通道分量的均值,均值兩側的中值為M1和M2,Meidan表示取目標數(shù)組的中值函數(shù)。
根據(jù)圖像中各組織部分對應的顏色峰值或波谷得出這一組織部分的中心點,再以這3個點作為初始聚類中心點,運用K-means算法實現(xiàn)管孔的粗分割。
雖然K-means聚類算法能夠?qū)⒛静奈⒂^圖像中的管孔區(qū)域和背景區(qū)域區(qū)分開,但兩者的顏色梯度差異較小,這可能會導致分水嶺變換的過度分割。為了增加管孔區(qū)域和背景區(qū)域的顏色梯度差異,使分水嶺變換在梯度運算判斷極大值點時更加準確,更加有效地實現(xiàn)管孔的精分割,按照聚類的結果將木材微觀圖像進行3類顏色編碼。第1類軸向薄壁組織細胞壁和木纖維區(qū)域進行紅色編碼,第2類管孔區(qū)域進行綠色編碼,第3類生長輪和木射線區(qū)域進行藍色編碼。最后,通過形態(tài)學操作和分水嶺變換實現(xiàn)管孔的精分割。
為實現(xiàn)木材橫截面微觀圖像的管孔分割,具體步驟如下(圖1):①提取木材橫截面微觀圖像的RGB分量并繪制顏色直方圖;②根據(jù)木材微觀圖像中的3類目標區(qū)域,即軸向薄壁組織和木纖維、管孔、生長輪和木射線,確定聚類初始中心點;③根據(jù)像素點與聚類中心點之間的歐式距離求出新的簇類中心并判斷中心點是否改變,若不一致則繼續(xù)迭代,一致則進行下一步;④對劃分出的3類區(qū)域進行顏色編碼;⑤最后通過形態(tài)學操作去除面積較小的噪聲,運用分水嶺算法分割出管孔。
圖1 改進 K-means 與分水嶺算法流程Figure 1 Improved K-means and watershed algorithm flow
以大紅葉楓橫截面原圖(997×1 418)為例,將本研究算法和現(xiàn)有算法(閾值分割、分水嶺、K-means聚類與閾值分割)的分割效果進行對比分析,并以平均管孔有效分割率(F)作為算法分割性能的評價指標進行評價。
式(4)~(5)中,Ti表示每張圖像的管孔實際分割總數(shù),Ni表示每張圖像中的管孔總數(shù),Pi表示每張圖像的管孔有效分割率,重復次數(shù)n的取值為101,,F(xiàn)表示平均管孔有效分割率。
隨機選擇3種木材微觀橫截面原圖(圖2)。在RGB色彩空間下提取彩色木材微觀圖像的三通道分量(圖3)??梢钥闯?個分量均有2個峰和1個波谷組成,其中2個峰分別代表管孔區(qū)域和生長輪、木射線區(qū)域,波谷代表軸向薄壁組織和木纖維區(qū)域。
圖2 木材橫截面原圖Figure 2 Original cross-section of wood
圖3 紅脈槭顏色直方圖Figure 3 Color histogram of A. rufinerve
按照顏色直方圖得到初始聚類中心點。尖齒槭顏色值為 (130.0, 144.0, 169.0),(20.0, 22.0, 49.0),(68.0, 78.4, 104.8);紅脈槭顏色值為 (84.6, 89.2, 110.4),(167.0, 184.0, 193.0),(32.0, 28.0, 56.0);賽波德槭顏色值為 (181.0, 173.0, 207.0),(64.0, 40.0, 110.0),(113.0, 99.4, 154.9)。運用改進 K-means 聚類算法劃分簇類 (圖 4)。
圖4 管孔粗分割結果Figure 4 Rough segmentation results of pores
為了增加管孔區(qū)域和背景區(qū)域兩者的顏色梯度差異,對聚類粗分割結果進行色彩編碼(圖5),第1類對軸向薄壁組織細胞壁和木射線區(qū)域進行紅色編碼,顏色值為(202, 12, 22);第2類對管孔區(qū)域進行綠色編碼,顏色值為(53, 106, 195);第3類對生長輪以及木射線區(qū)域歸進行藍色編碼,顏色值為(29,209, 107)。
圖5 顏色編碼結果Figure 5 Color coding results
經(jīng)過灰度轉換、開閉運算等圖像形態(tài)學處理后,消除了絕大部分的木射線、木纖維和軸向薄壁組織等面積較小的噪聲。此外運用分水嶺變換對已分類的木材微觀圖像進行目標分割,即管孔分割(圖6),將管孔快速準確地分割。從最終的分割結果來看,除了極個別的細小管孔未被檢測到之外,其余管孔均被完整地分割,分割出的輪廓也與實際輪廓基本吻合。
圖6 管孔精分割結果Figure 6 Fine segmentation results of pores
如圖7所示:閾值分割算法每張木材橫截面微觀圖像平均有88.1%的管孔被準確有效地分割出來;分水嶺算法每張木材橫截面微觀圖像平均有91.4%的管孔被準確有效地分割出來,但存在噪聲誤分的問題;K-means聚類與閾值分割算法先運用K-means聚類算法將木材圖像分為3類,再采用閾值分割和canny算子做管孔精分割,結果每張木材橫截面微觀圖像平均有96.3%的管孔被準確有效地分割出來,但部分木射線和軸向薄壁組織也被分割出來,且存在輪廓不飽滿的問題;本研究算法為改進K-means聚類與分水嶺算法,結果每張木材橫截面微觀圖像平均有97.1%的管孔被準確有效地分割出來,分割出的管孔與實際管孔基本吻合。
圖7 各算法分割效果Figure 7 Segmentation effect diagram of each algorithm
為驗證本研究算法分割管孔的準確性,對12類樹種的橫截面微觀圖像在各算法下的分割結果進行了比較(表1),能夠看出閾值分割不存在管孔誤分,但因面積較小而漏分的管孔較多;分水嶺算法不僅存在管孔漏分且會誤分割出木射線、木纖維以及軸向薄壁組織;K-means聚類與閾值分割存在木射線和軸向薄壁組織的誤分割;本研究算法基本不存在管孔的漏分和誤分問題。
表1 各算法分割效果對比Table 1 Comparison of segmentation effects of various algorithms
本研究改進的K-means聚類與分水嶺的管孔分割算法,解決了初始中心點的隨機性,并能有效地區(qū)分管孔區(qū)域與木纖維、木射線以及軸向薄壁組織等噪聲區(qū)域,對管孔分割更為準確。本研究算法采用取圖像顏色直方圖對應的峰值確定初始聚類中心點和色彩編碼的方式,充分將管孔與絕大部分噪聲區(qū)域區(qū)分開,更適合于木材橫截面微觀圖像分割任務。通過形態(tài)學處理和分水嶺算法,對管孔進行精分割,將兩者結合從而得到更為準確的分割結果。與其他分割算法相比,本研究算法分割效果顯著提升,在大小不一且隨機分布的管孔分割過程中魯棒性高,有效避免了管孔漏分問題,具有良好的分割性能。