羅奕凱
(中國鐵路南寧局集團(tuán)有限公司 貨運服務(wù)中心,廣西 南寧 530029)
鐵路貨車裝載狀態(tài)圖像是貨檢人員對貨物裝載狀態(tài)的復(fù)現(xiàn),可以直觀地展現(xiàn)貨物在運輸過程中的情況,在現(xiàn)代化的鐵路貨檢中,往往會采用先進(jìn)的技術(shù)手段來生成高精度的貨車裝載狀態(tài)圖像。在鐵路貨車裝載狀態(tài)圖像采集系統(tǒng)建成驗收、維護(hù)驗收中,圖像質(zhì)量評價是非常重要的,能夠直接影響到后續(xù)運行情況的判斷和決策。當(dāng)前鐵路領(lǐng)域尚未開展圖像質(zhì)量評價的定量研究,尚未形成一種有效、客觀、權(quán)威的圖像質(zhì)量評價方法,在評估設(shè)備性能的過程中,容易出現(xiàn)評估結(jié)果與實際表現(xiàn)不符的情況,影響鐵路貨車裝載狀態(tài)圖像采集系統(tǒng)的運行效率和運行安全。因此,建立標(biāo)準(zhǔn)圖像質(zhì)量客觀評價機(jī)制,要求設(shè)備新建、更改后通過評價指標(biāo)要求,是非常值得研究探討的方向。
圖像質(zhì)量是比較圖像處理算法性能及優(yōu)化機(jī)器視覺應(yīng)用系統(tǒng)參數(shù)的重要指標(biāo),圖像質(zhì)量評價就是量化機(jī)器視覺應(yīng)用系統(tǒng)生成圖像質(zhì)量的優(yōu)劣程度,在不同場景下存在著不同的評價指標(biāo)和評價標(biāo)準(zhǔn)。鐵路貨車裝載狀態(tài)圖像采集系統(tǒng)通過采集運行中貨物列車的圖像信息,供鐵路工作人員對貨車裝載加固安全狀態(tài)進(jìn)行細(xì)致檢查,屬于機(jī)器視覺檢測應(yīng)用,因此鐵路貨車裝載狀態(tài)圖像質(zhì)量的優(yōu)劣,取決于該圖像是否能夠較好地呈現(xiàn)局部細(xì)節(jié)。
圖像質(zhì)量的評價方法主要可以歸納為主觀評價與客觀評價2 類[1]。主觀評價方法是從人類的主觀感知角度對圖像質(zhì)量進(jìn)行評判,然而這一評價過程不僅耗時且成本較高,在缺乏圖像評價領(lǐng)域權(quán)威專家參與的情況下,其說服力也相對較弱。客觀評價方法則采用數(shù)學(xué)模型對圖像質(zhì)量進(jìn)行量化評估,受人為因素影響較小,通過結(jié)合圖像特征并應(yīng)用相適宜的數(shù)學(xué)模型,可以在一定程度上較好地實現(xiàn)預(yù)期效果。從客觀評價方法所需參考圖像信息的依賴程度來看,又可以劃分為全參考型、部分參考型和無參考型3 類[2]。全參考型方法需要原始圖像以及經(jīng)過處理的圖像進(jìn)行比較,部分參考型方法僅需要原始圖像的部分信息,而無參考型方法則無需任何參考圖像。
在鐵路貨車裝載狀態(tài)圖像質(zhì)量評價場景下,采集到的圖像是列車階段狀態(tài)性的圖像,無法獲得原始圖像信息作為參考,因而研究主要集中于無參考型客觀評價方法,在保證鐵路貨車裝載狀態(tài)圖像質(zhì)量評價結(jié)果更具客觀性的同時,也能提高評價效率,降低評價成本。
根據(jù)《鐵路貨車裝載狀態(tài)標(biāo)準(zhǔn)圖像設(shè)備暫行技術(shù)條件》(TJ/KH 040—2022),鐵路貨車裝載狀態(tài)標(biāo)準(zhǔn)圖像是指“能夠完整、準(zhǔn)確反映鐵路貨車車體、貨物、貨物裝載加固狀態(tài)的無明顯變形、噪點、模糊的高清圖像”,同時還要求“圖像明亮清晰、亮度均勻”??梢娗逦取⒒兌群土炼葘D像細(xì)節(jié)信息的展示產(chǎn)生重要影響。其中,清晰度是指圖像中物體輪廓的清晰度和邊緣的銳利程度,一張清晰的圖像能夠呈現(xiàn)出更多的細(xì)節(jié)和紋理,提高圖像的可視性和辨別度,讓人們更容易識別圖像中的目標(biāo)物體;畸變度是指圖像中物體形狀和大小與實際物體的偏差程度,畸變度高的圖像可能會失真或變形,從而影響人們對圖像中物體的識別和分析;亮度是指圖像的明暗程度,過高或過低的亮度會使圖像出現(xiàn)過曝或欠曝的情況,從而降低圖像的可視性和細(xì)節(jié)表現(xiàn)能力。綜上,研究將以鐵路貨車裝載狀態(tài)圖像為基礎(chǔ),從清晰度、畸變度和亮度3 個方面研究圖像質(zhì)量客觀評價方法。
再模糊理論方法是一種專門針對圖像清晰度評價的方法,其思想是將待評價圖像通過濾波形式進(jìn)行再模糊,構(gòu)造一張模糊程度更大的參考圖像,然后運用全參考型評價方法,比較參考圖像與待評價圖像間的信息損失程度。信息損失程度可以作為圖像清晰度的評價指標(biāo),信息損失越大,代表圖像越清晰;信息損失越小,則圖像越模糊[3]。分析基于再模糊理論的無參考結(jié)構(gòu)清晰度評價方法[4](NRSS)、結(jié)構(gòu)相似性方法[5](SSIM),研究適用于貨車裝載狀態(tài)圖像的清晰度評價方法,計算步驟如下。
(1)將原圖進(jìn)行灰度化處理,作為待評價圖像。通過灰度化處理,可以使得圖像中的彩色信息轉(zhuǎn)化為亮度信息,為后續(xù)進(jìn)一步處理提供所需信息的同時,能夠顯著降低處理的復(fù)雜性和計算量。研究使用加權(quán)平均法進(jìn)行彩色圖像灰度化處理,將紅色、綠色、藍(lán)色分量的權(quán)值設(shè)置為0.30,0.59,0.11,以模擬人眼對于顏色的亮度感知,其表達(dá)式為
式中:g為輸出的灰度化圖像;r,g,b分別為輸入彩色圖像的紅、綠、藍(lán)3 個通道子圖像;(x,y)為圖像的像素坐標(biāo)。
(2)對待評價圖像進(jìn)行平滑處理,作為參考圖像。參照NRSS 算法,采用7×7 大小、標(biāo)準(zhǔn)差平方σ2為6 的高斯濾波器進(jìn)行平滑處理,則高斯卷積核G為
對待評價圖像進(jìn)行高斯平滑處理的表達(dá)式為
式中:Ir為參考圖像;I為待評價圖像;?為圖像的卷積運算。
(3)提取圖像待評價圖像I、參考圖像Ir的梯度圖像,分別記為X,Y?;贑anny 算子能在噪聲干擾的條件下較好地提取出目標(biāo)邊緣[6],研究采用Canny 算子提取梯度圖像,在生成梯度圖像時應(yīng)盡量濾除噪點,避免過多噪點被當(dāng)做邊緣信息參與信息損失程度的計算。并采取Otsu 閾值分割法確定Canny算子的雙閾值[7],設(shè)L為輸入圖像灰度級,有正整數(shù)t∈(0,L-1),可以將輸入圖像像素值分為[0,t]和[t+1,L-1]2個集合,則有
式中:μ1,μ2分別為2 個集合的平均灰度值;Pi為各灰度值的出現(xiàn)概率。
設(shè)f2(t)為上述2個集合的間類方差,則有
對t進(jìn)行遍歷,使得f2(t)取得最大值時,對應(yīng)的t則作為閾值上限,閾值下限取閾值上限的0.5倍。
(4)計算圖像X,Y的結(jié)構(gòu)相似度SSIM(X,Y)。SSIM(X,Y)是處于0 至1 之間的數(shù),用于衡量X,Y2幅圖像相似度的指標(biāo)。SSIM(X,Y)越大,2幅圖像的差異越小,說明模糊化處理后的信息損失越小,代表圖像越模糊。其表達(dá)式為
式中:μX,μY分別為圖像X,Y的像素均值;σX,σY分別為圖像X,Y的像素方差;σXY為圖像X,Y的像素協(xié)方差;C1,C2為常數(shù),是為了避免分母為0 的情況,在計算時,通常取C1=(K1×L)2,C2=(K2×L)2,其中K1,K2為遠(yuǎn)小于1 的正數(shù),L為灰度等級,一般取K1=0.01,K2=0.03。
(5)計算鐵路貨車裝載狀態(tài)圖像清晰度指標(biāo)S。S值處于0 至1 之間,越接近于1,則清晰度評價指標(biāo)越好。清晰度指標(biāo)計算公式為
在不采用參考圖像的前提下,對特定圖像畸變度的評價主要是通過獲取圖像特征物輪廓的長寬比,再與實際物的長寬比進(jìn)行比較,求出待評價圖像的形變率,因而計算前提為特征物的選取及其輪廓的提取方式。
在特征物選取上,考慮到鐵路貨車車型繁多且各異,而主流車型如棚車、敞車、平車、保溫車和雙層運輸汽車專用車等均標(biāo)記有鐵道車輛用路徽。同時,路徽的繪制須遵循1987 年鐵道部印制的《鐵道車輛用路徽標(biāo)記》(TB/T 1838—1987),即標(biāo)準(zhǔn)路徽標(biāo)記的底長與邊長的比值應(yīng)為20:23,鐵道車輛用路徽標(biāo)準(zhǔn)規(guī)格如圖1 所示。因此研究選擇路徽作為目標(biāo)特征物,具有覆蓋車型廣、特征明顯和標(biāo)準(zhǔn)可靠的優(yōu)點。
圖1 鐵道車輛用路徽標(biāo)準(zhǔn)規(guī)格Fig.1 Standard emblem for railway vehicles
在特征物輪廓提取方式上,鑒于YOLO算法檢測效率高、耗費資源少等優(yōu)點[8],研究采用基于YOLOv8 的目標(biāo)檢測模型,自動提取圖像特征物定位框坐標(biāo)信息,以此來代表特征物的輪廓信息。
考慮到列車運行時車輛在垂直方向的運動幅度不大,可以認(rèn)為線陣相機(jī)的成像中,拍攝物體在高度上基本不會發(fā)生畸變,僅在水平方向可能發(fā)生壓縮或拉伸[9]。在此基礎(chǔ)上,在將路徽圖像縮放至邊長與實際路徽的邊長相等時,用圖像中路徽的底長與實際路徽的底長進(jìn)行比較,以此計算畸變率,計算步驟如下。
(1)訓(xùn)練最優(yōu)檢測模型。從新豐鎮(zhèn)站、南寧南站鐵路貨車裝載狀態(tài)圖像采集系統(tǒng)歷史過車圖像中選取樣本圖像195 張,按照800 像素×800 像素大小依次剪裁包含路徽的子圖像,避免訓(xùn)練時壓縮幅度過大。劃分訓(xùn)練集圖像180張,驗證集15張,采取預(yù)訓(xùn)練模型YOLOv8 Nano 進(jìn)行訓(xùn)練,控制壓縮后的輸入圖像大小為640 像素×640 像素,設(shè)置BATCHS_SIZE 為4,epoch 為100,初始學(xué)習(xí)率為0.000 1,得出最優(yōu)檢測模型,用于檢測待評價圖像中路徽定位框的坐標(biāo)信息。
(2)使用訓(xùn)練得到的最優(yōu)模型,預(yù)測輸入的待評價圖像,獲取路徽定位框左上角及右下角的坐標(biāo),并用坐標(biāo)差值來代表圖像中路徽的底長和邊長的數(shù)值,表達(dá)式為
式中:Ax,Ay分別為圖像中路徽的底長和邊長的數(shù)值;(x1,y1),(x2,y2)分別為路徽定位框在圖像中的左上角和右下角的坐標(biāo)值。
以某幅貨車裝載視頻狀態(tài)圖像為例,在預(yù)測圖像上繪制定位框和坐標(biāo)信息并保存后,最優(yōu)模型驗證預(yù)測結(jié)果和信息展示如圖2 所示??梢姸ㄎ豢蜃笊辖亲鴺?biāo)值為(245,319),右下角坐標(biāo)值為(376,458),則底長為376-245=131,邊長為458-319=139。
圖2 最優(yōu)模型驗證預(yù)測結(jié)果和信息展示Fig.2 Prediction results validated by optimal model and information presentation
(3)將圖像中路徽縮放至邊長與實際路徽的邊長相等,用圖像中路徽的底長與實際路徽的底長的相對誤差來代表畸變度評價值D。D值處于0 至1 之間,越接近于1,代表圖像中車輛的長寬比越接近于實際車輛的長寬比,則畸變度評價指標(biāo)越好。其表達(dá)式為
式中:M為縮放倍率;Bx,By分別為實際路徽的底長和邊長。
在統(tǒng)計分析圖像中的像素灰度值時,所產(chǎn)生的直方圖被稱為圖像直方圖,圖像直方圖不僅能夠用于評估圖像亮度,也可以用于分析場景目標(biāo)[10]?;趫D像直方圖與亮度信息的關(guān)系,研究通過圖像直方圖的方式評價亮度,主要思路就是計算直方圖的峰值距離中心點的偏離程度,偏離程度越高,其亮度評價值越低。計算步驟如下。
(1)獲取直方圖信息,圖像的直方圖可以用以下離散函數(shù)hist(rk)表示為
式中:rk為第k級的灰度值;nk為灰度值為rk的像素個數(shù)。
(2)進(jìn)行歸一化計算,歸一化后的直方圖可以表示為
式中:R(rk)為灰度值為rk的像素在圖像中出現(xiàn)的概率,所有灰度值出現(xiàn)概率之和等于1;M×N為圖像的分辨率。
(3)以像素灰度值出現(xiàn)概率為權(quán)重,計算每個灰度值偏離中心點的程度值dk,表達(dá)式為
(4)以每個像素灰度值的加權(quán)偏離程度值為基礎(chǔ),綜合計算圖像亮度評價值B。B值處于0 至1 之間,越接近于1,代表圖像各像素點灰度值越接近于直方圖的中心,則亮度評價指標(biāo)越好。其表達(dá)式為
基于清晰度、畸變度、亮度3項評價指標(biāo),可以融合得到一個綜合的貨車裝載狀態(tài)圖像質(zhì)量評價指標(biāo)E。E的值處于0至1之間,越接近于1,代表圖像質(zhì)量評價結(jié)果越好。其表達(dá)式為
式中:a,b,c為參數(shù),a>0,b>0,c>0,且a+b+c=1,用于調(diào)整3項評價指標(biāo)的權(quán)重值。
為了驗證圖像質(zhì)量評價算法,篩選5 張質(zhì)量差異較大的鐵路貨車裝載狀態(tài)圖像作為本次評估的試驗數(shù)據(jù),分別用Pic1 至Pic5 來代表,并使用剪裁的方法對前景圖像進(jìn)行提取,避免背景圖像的影響。測試圖像集如圖3所示。
圖3 測試圖像集Fig.3 Test image collection
清晰度、畸變度、亮度3 項指標(biāo)都對貨車裝載狀態(tài)圖像質(zhì)量產(chǎn)生影響,根據(jù)實際工作經(jīng)驗,隨著應(yīng)用的不同,其重要程度也不同。例如,在人眼識別情況下,過低的清晰度和亮度會給人眼觀察帶來困難,并且會產(chǎn)生疲勞感,對圖像的辨識影響較大。相反,在智能識別情況下,機(jī)器對清晰度和亮度的適應(yīng)能力更強(qiáng),而對畸變的圖片則很可能將關(guān)鍵信息識別錯誤。目前全路大部分貨檢站采取人檢為主、機(jī)檢為輔的作業(yè)模式,少部分貨檢站運用了圖像智能識別模塊,正在向“到達(dá)作業(yè)機(jī)檢為主、人檢為輔,出發(fā)作業(yè)人檢為主、人機(jī)結(jié)合”的作業(yè)模式轉(zhuǎn)換,并且運用圖像智能識別推動少人化作業(yè)是發(fā)展趨勢。因此,在權(quán)重系數(shù)的設(shè)置上,應(yīng)根據(jù)不同測點的應(yīng)用情況,以及圖像智能識別應(yīng)用的推廣程度進(jìn)一步研究確定。研究暫設(shè)置a=b=c,即3項指標(biāo)同等重要來進(jìn)行驗證。
以測試圖像為例,運用研究提供的方法對5 張鐵路貨車裝載狀態(tài)圖像質(zhì)量進(jìn)行整體評價,整體評價值計算結(jié)果如表1 所示。由表1 可知,清晰度評價結(jié)果為Pic2>Pic3>Pic4>Pic5>Pic1,畸變度評價結(jié)果為Pic1>Pic2>Pic4>Pic5>Pic3,亮度評價結(jié)果為Pic4>Pic3>Pic2>Pic5>Pic1,綜合評價結(jié)果為Pic2>Pic4>Pic3>Pic5>Pic1。
表1 整體評價值計算結(jié)果Tab.1 Calculation results of overall evaluation value
以圖像的局部細(xì)節(jié)是否可以較好地呈現(xiàn)作為圖像質(zhì)量評價依據(jù),從人眼主觀感受對5 張測試圖像進(jìn)行觀察,顯然Pic1 基本無法通過人眼判斷貨車裝載狀態(tài),需要安排人員現(xiàn)場復(fù)檢,因而判定質(zhì)量最差;Pic5 可以明顯感受到模糊,給人眼判斷帶來困難,因而判定質(zhì)量僅較Pic1 稍好;Pic2,Pic3 和Pic4 可以從單項指標(biāo)辨清區(qū)別,但各有優(yōu)劣勢,難以通過主觀感受來評判整體圖像質(zhì)量,因而綜合評價值差異并不大,需要從人檢、機(jī)檢2 個方面,結(jié)合工作實際合理調(diào)節(jié)單項指標(biāo)的權(quán)重值,進(jìn)一步提高綜合評價值的準(zhǔn)確性。
從測試圖像的驗證結(jié)果上看,研究提出的評價方法與人眼主觀感受實現(xiàn)了較好的一致性。從清晰度、畸變度和亮度3 個方面建立鐵路貨車裝載狀態(tài)圖像整體評價指標(biāo),對鐵路貨車裝載狀態(tài)圖像采集系統(tǒng)的性能表現(xiàn)進(jìn)行科學(xué)、客觀的評價判斷,有助于為設(shè)備管理部門提供決策依據(jù),找準(zhǔn)后續(xù)補(bǔ)強(qiáng)方向。同時,也為鐵路各系統(tǒng)健全圖像質(zhì)量評價機(jī)制提供理論基礎(chǔ),通過對圖像采集設(shè)備進(jìn)行客觀的評估,要求設(shè)備符合硬性指標(biāo)條件,提高成像質(zhì)量,以保證設(shè)備具有良好的可靠性,幫助鐵路企業(yè)管理部門通過檢測圖像及時發(fā)現(xiàn)問題、分析問題和解決問題。