關(guān)鍵詞:圖像分割;區(qū)域分割;水表數(shù)字;圖像處理
中圖分類號:TP391 文獻標識碼:A
文章編號:1009-3044(2024)26-0010-04開放科學(資源服務)標識碼(OSID) :
0引言
在醫(yī)院等特殊環(huán)境中,水表需要具備高精度以便準確測量非常小的水流量變化,這對于確保水資源的合理使用和控制成本至關(guān)重要。實時監(jiān)控水表讀數(shù)能夠幫助醫(yī)院管理人員及時了解水使用情況,快速檢測泄漏或異常使用模式,從而可以及時采取措施。自動記錄水表讀數(shù)并生成報告的能力,有助于醫(yī)院進行水資源管理和規(guī)劃。
傳統(tǒng)的人工查抄水表方法費時費力,正逐步被計算機自動識別取代[1-3]。在水表讀數(shù)識別過程中,水表數(shù)字的分割主要采用手動分割方法和列方向像素點灰度值累積方法。手動分割方法的穩(wěn)健性較低,要求每張水表圖像具有高度一致性,且分割結(jié)果易出現(xiàn)無意義的聚團[4-7];列方向像素點灰度值累積方法雖然穩(wěn)健性較高,但分割出的數(shù)字同樣容易帶有無意義的聚團[8-9]。李云棟等[10]提出的一種改進的基于連通域的分割方法雖然分割較為精準,但需要對所有的像素進行連通域分析,導致算法執(zhí)行效率低且穩(wěn)健性較差。
因此,本文提出了一種利用區(qū)域分割算法的方法來分割水表數(shù)字。該方法能夠通過自動選取種子點進行區(qū)域分割,并剔除錯誤的分割結(jié)果。由于該方法僅對目標數(shù)字進行精準切割,分割結(jié)果極少出現(xiàn)無關(guān)聚團,從而提高了分割的精準性和穩(wěn)健性。
1 分割算法
1.1 區(qū)域分割算法
區(qū)域分割算法在分割圖像時,首先需要確定種子點以及表示“相似程度”的閾值。區(qū)域分割算法的核心在于尋找符合閾值要求的種子點周圍的像素點,并形成一個連通圖。種子點的確定通常有兩種方式:一是手動確定種子點,二是依據(jù)預先設定的規(guī)則自動選取種子點。
在確定種子點和閾值后,算法開始對周圍像素點進行檢測。這些檢測點包括種子點的上、下、左、右、左上、右上、左下和右下這8個方向的像素點,如圖1 所示。分別計算這些點與種子點的差值。如果差值小于或等于閾值,則將這些點標記為下一步進行區(qū)域生長的種子點;如果差值大于閾值,則不標記這些點。
這種方法通過在圖像中逐步“生長”區(qū)域,使得能夠有效對感興趣的區(qū)域進行分割,從而提高分割的精準性和穩(wěn)健性。
在區(qū)域分割算法中,對所有種子點求其像素值的平均值,并將其作為這些種子點的新的像素值。隨后,對這些新合并的種子點進行新一輪的檢測。此過程重復進行,直到?jīng)]有新的種子點可合并為止,此時分割結(jié)束。
1.2 列方向像素點灰度值累積算法
列方向像素點灰度值累積算法通常用于處理二值圖像。這種方法首先計算圖像中每一列的像素值之和,然后根據(jù)先驗知識確定一個分割閾值。當某列的像素值之和小于該閾值時,這一列即被視為分割的邊界。
例如,要對圖2中的白色區(qū)域進行分割,可以根據(jù)圖3中列像素灰度值的統(tǒng)計結(jié)果進行操作。在列方向上,黑色色塊的灰度值累積之和為0,而白色色塊的累積之和為52。假設設定的閾值為52,由于黑色色塊在列方向上的灰度值累積之和為0,小于閾值,這可以用于找出白色色塊與黑色色塊的分割邊界。
2 圖像預處理
2.1查找數(shù)字大概區(qū)域
首先,將水表圖像轉(zhuǎn)換為灰度圖像?;叶葓D像是指僅有一種采樣顏色的圖像,通常從黑到白包含256 級灰度。轉(zhuǎn)化為灰度圖像可以為后續(xù)的邊緣檢測操作做好準備。如圖4所示,展示了轉(zhuǎn)換后的水表灰度圖像。由于碼字區(qū)域的灰度值較小且連續(xù),并與背景形成明顯的差異,因此可以通過以下操作獲取碼字的概略區(qū)域。
接下來,首先對圖像進行邊緣檢測。邊緣檢測采用Roberts算子,因為作為一階微分算子,Roberts算子簡單且計算量小,并對圖像細節(jié)反應敏感。通過這一步,可以得到包含水表圖像中各組成部分邊緣的二值圖像,如圖5所示。在獲取邊緣檢測圖像后,接下來進行腐蝕和閉運算。
對圖像進行閉運算后,仍然存在許多較小的聚團,這些聚團會影響碼字區(qū)域的準確定位,因此需要進行去除處理。經(jīng)過處理后,可以看到,最終獲得的圖像中白色區(qū)域便是水表數(shù)字的大致區(qū)域,如圖8所示。
2.2 定位碼字區(qū)域并分割
對碼字區(qū)域的分割,筆者采用累積像素值的方法。首先對碼字區(qū)域的上下邊界進行查找。基于先驗知識,確定一個合適的閾值。由于圖像是二值圖像,列方向灰度值的累積實際上就是計算每列中表示白色點的像素總和,灰度值即為像素值。從得到圖像的中間行開始,分別向上下兩個方向逐行累積像素值。當某行的像素累積值小于該閾值時,即認為該行是水表數(shù)字區(qū)域邊界的橫坐標。同樣地,利用列方向累積像素值的方法,可以得到水表數(shù)字區(qū)域左右邊界的縱坐標。圖9和圖10分別為圖像在列方向和行方向上像素點灰度值累積的統(tǒng)計圖。
根據(jù)上文所得的碼字區(qū)域的上下左右邊界的橫縱坐標,在原始的水表灰度圖像上進行裁剪,就可以獲得水表數(shù)字區(qū)域的圖像。結(jié)果如圖11所示。
3 水表數(shù)字分割
3.1 二值化處理
剪切得到的灰度圖像的像素值范圍較廣,由于難以準確確定圖像中水表數(shù)字的像素值范圍,直接進行基于區(qū)域分割算法的分割會存在一定困難。因此,筆者對定位剪切后的圖像進行二值化處理。二值化圖像是指將圖像中所有像素點的值根據(jù)一定方法劃分為0和1。在劃分過程中需要確定閾值,這里的二值化閾值可以采用Otsu(大津法)獲得。Otsu方法是由日本學者大津于1979年提出的一種自適應閾值確定方法,主要用于灰度圖像的背景與目標分割。該方法通過求解背景和目標之間的最大類間方差來確定全局閾值。
通過二值化處理,可以將所有表示水表數(shù)字的像素值設為1,從而統(tǒng)一水表數(shù)字的像素值,方便種子點的選取以及區(qū)域分割算法閾值的設置。
3.2 選取種子點
首先,選擇圖像中間行的一系列像素點作為種子點的備選點。由于圖像是二值化的,因此像素點的值只有0和1,且表示水表數(shù)字的像素值為1,所以在進行區(qū)域分割算法時,閾值設為0。從左邊起始的第一個像素點開始檢查:如果該像素值為0,則跳過該點,檢查下一個像素點;如果值為1,則將該點作為種子點,進行一次區(qū)域分割算法運算,求出包含該點的碼字圖像。
這一過程中可能存在的問題是,某兩個種子點可能被同一個碼字所包含,逐點檢查可能會生成重復的碼字圖像。為了解決這個問題,采用的方法是在利用區(qū)域分割算法分割出一個碼字圖像后,在下一次檢查時直接跳過M個像素點。這個M值取決于圖像中碼字的寬度,可以根據(jù)先驗知識選擇一個合適的M值,如圖13所示。
3.3 剔除無關(guān)圖像
在進行區(qū)域分割算法時,一些無關(guān)的像素點可能會被錯誤地當作碼字圖像分割出來,這不僅導致生成無意義的圖像,還可能引起圖像分割錯誤。為了解決這個問題,在執(zhí)行區(qū)域分割算法的過程中,可以通過計算生成圖像的寬度來做判斷。
具體步驟是:在生成圖像后,若其寬度小于某個預設值,則直接舍棄該圖像,視為無關(guān)點處理。同時,下一個種子點正常選取,不進行跳轉(zhuǎn)。這個寬度閾值同樣取決于圖像中碼字的期望寬度,可以根據(jù)實際需要設置一個合適的值,如圖14所示。這樣做能夠有效減少無效分割,并提高圖像分割的準確性。
3.4 對分割圖像裁剪
分割出的圖像需要進一步裁剪,以形成獨立的碼字圖片。裁剪的方法是首先識別圖像中碼字的左右邊緣,然后對圖像進行裁剪,去除多余的圖像內(nèi)容,如圖15、圖16所示。
4 實驗
4.1 實驗準備
為了驗證區(qū)域分割算法在分割圖像水表數(shù)字時的正確性和有效性,本文分別采用了區(qū)域分割算法、列方向像素點灰度值累積的方法以及手動分割方法進行實驗對比。算法的實驗環(huán)境為Windows 10操作系統(tǒng),使用Matlab平臺。實驗所用圖像為一般家用水表圖像,其中水表數(shù)字居中且清晰可見,圖像尺寸為640×480像素,如圖17所示。
4.2 實驗結(jié)果與分析
實驗結(jié)果如圖18、圖19、圖20所示。
從結(jié)果可以看出,當分割第二和第三個水表數(shù)字時,使用列方向像素點灰度值累積方法和手動分割方法所得到的分割結(jié)果中都存在與數(shù)字無關(guān)的聚團。這些聚團可能會干擾后續(xù)的圖像處理,因此分割結(jié)果不如本文提出的方法那樣理想,如圖21所示。
5 結(jié)論
針對醫(yī)院特殊環(huán)境中需要高精度實時讀取水表讀數(shù)的應用場景,本文提出了一種基于區(qū)域分割算法的水表數(shù)字分割方法。文章首先介紹了區(qū)域分割算法的基本原理,隨后描述了圖像分割的預處理過程,包括去除無關(guān)信息和定位碼字區(qū)域。在此基礎上,重點講解了水表數(shù)字分割的實際操作,包括種子點的選取方法、可能存在的問題及其解決方案,以及對分割圖像的進一步處理。最后,通過實驗將本文提出的方法與列方向像素點灰度值累積的方法進行對比,驗證了本文方法在分割水表數(shù)字上的精準性和穩(wěn)健性。此外,該圖像識別方法也可應用于醫(yī)院自助影像膠片打印等場景。