袁 磊, 甘慶鵬, 付 強
(1. 北京交通大學 軌道交通控制與安全國家重點實驗室,北京 100044;2. 北京交通大學 軌道交通運行控制系統(tǒng)國家工程研究中心, 北京 100044)
高速鐵路CTCS列車運行控制系統(tǒng)(簡稱列控系統(tǒng))車載設(shè)備通過人機界面DMI(Driver-Man Interface)向司機實時顯示距離監(jiān)督信息、速度信息、補充駕駛信息、運行計劃信息、監(jiān)控信息等,信息顯示方式包括:文字、數(shù)字、圖案、顏色、標尺、圖形等。[1]目前,列控系統(tǒng)的第3方測試(如:互聯(lián)互通測試、產(chǎn)品認證檢驗測試、現(xiàn)場聯(lián)調(diào)聯(lián)試等)多采用人工觀察DMI顯示判斷系統(tǒng)內(nèi)部工作狀態(tài),效率低下。實現(xiàn)對列控車載設(shè)備DMI顯示信息的自動識別,可更全面、準確的獲取列控系統(tǒng)內(nèi)部狀態(tài),從而有效提高列控系統(tǒng)第3方測試的準確度和效率。
目前國內(nèi)外針對列控系統(tǒng)DMI顯示信息自動識別的研究相對較少。張勇等[2]采用改進的字回溯切分法實現(xiàn)單個字體切割,采用統(tǒng)計模式和結(jié)構(gòu)模式相結(jié)合的方法提高對數(shù)字、字母和漢字的識別率。但該方法只有在保證車載DMI界面清晰穩(wěn)定的基礎(chǔ)上,才能獲得高識別率。除針對DMI信息顯示識別外,與文字識別相關(guān)的研究,即光學字符識別(OCR)[3],主要是基于圖像以及所需要識別的字符提取不同的特征再進行分類或者模板匹配。如文獻[4]在基于圖像預(yù)處理的前提下利用尺度不變特征轉(zhuǎn)換(SIFT)方法提取特征點,再通過隱馬爾科夫模型(HMM)進行模板匹配實現(xiàn)漢字識別。文獻[5]利用多分辨率工具提取特征并結(jié)合歐幾里得距離進行手寫的英文識別?;贠CR的研究為DMI信息的自動識別提供了參考,但由于安裝在動車組上的DMI設(shè)備以及圖像采集設(shè)備因列車運行而產(chǎn)生抖動、光照環(huán)境變化以及DMI顯示信息本身像素較少等因素,使得基于DMI圖像的信息識別有別于一般的OCR識別并具有一定的難點。
本文以DMI顯示的列控車載設(shè)備工作模式的分類識別為例,在通過圖像預(yù)處理分割出列模式文字顯示區(qū)域后,用二維主成分分析(2DPCA)方法提取模式主要特征,再利用SVM進行分類,其中SVM的參數(shù)通過改進的粒子群算法PSO[6]進行優(yōu)化,最終實現(xiàn)對列控車載設(shè)備工作模式DMI顯示的準確識別。實現(xiàn)流程見圖1。
列控車載系統(tǒng)在不同運行階段所承擔的安全防護功能不同,而列控車載模式正是系統(tǒng)當前所承擔的安全防護功能的標識。車載模式向司機表明了列控系統(tǒng)和司機之間的安全職責的劃分,是系統(tǒng)重要的狀態(tài)信息之一。CTCS列控系統(tǒng)車載模式包括待機、完全、引導(dǎo)、目視、調(diào)車、休眠、隔離、冒進、冒后、部分、機信、LKJ等模式[6]。車載模式信息在DMI顯示屏上的B7區(qū)以文字方式向司機顯示。車載DMI顯示分辨率一般為640×480像素,B區(qū)大小為280×300像素,B7區(qū)大小為36×36像素。車載模式信息顯示字體為幼圓,字體大小推薦為16 lb,顏色為白色(RGB值255、255、255),背景色RGB值為3、17、34[6]。車載模式信息在DMI上的顯示位置見圖2。
然而對列控系統(tǒng)在運行線上進行黑盒測試時(如聯(lián)調(diào)聯(lián)試、型式試驗等)只能通過攝像機或照相機等設(shè)備實時采集DMI的圖像顯示。同時,采集DMI顯示信息時的周圍環(huán)境具有不確定性,會影響圖像采集的質(zhì)量。例如環(huán)境明暗變化、環(huán)境中運動物體在屏幕上形成的光影、列車運行引起晃動影響對焦、為避開司機操作對顯示屏幕的遮擋而從側(cè)邊對顯示圖像進行采集等。這些都導(dǎo)致了采集信息的失真。圖3為車載模式在DMI上顯示的實際采集結(jié)果示例,該采集圖像采用攝像機采集并截圖得到,攝像機位于司機駕駛室內(nèi),從DMI屏幕右側(cè)約45°對圖像進行采集。信息采集時列車最高速度310 km/h。
圖3中,由于顯示信息實時采集過程中受到晃動影響對焦、光線明暗變化以及圖像分割等造成圖像中文字位置、大小等不一致,影響分類。因此,首先需要對圖像進行濾波、增強、分割及規(guī)整化等預(yù)處理,見圖4。
( 1 )
( 2 )
式中:φ∈Rm×r。
( 3 )
為了對提取的特征進行分類,采用在解決小樣本、非線性及高維模式識別中表現(xiàn)出許多特有的優(yōu)勢支持SVM 算法[8]。SVM最初來源于線性可分的2分類問題,通過尋找最優(yōu)超平面將樣本數(shù)據(jù)進行分類。數(shù)學上,2分類SVM方法可以描述為下面2次規(guī)劃問題的求解
s.t.yiwT·xi+b≥1-ζi
c≥0ζi≥0,i=1,2,…,l
( 4 )
式中:c是懲罰參數(shù);ζ是松弛變量;l為樣本數(shù)。通過求解其對偶問題可以得到分類判別函數(shù)
( 5 )
Kxi,xj為核函數(shù), 使在低維空間非線性不可分的特征變量投影到高維空間中變?yōu)榫€性可分。其中,徑向基核函數(shù)(RBF)在不同維數(shù)、不同樣本數(shù)情況下均表現(xiàn)出較好的學習能力,應(yīng)用比較廣泛。[9]因此,本文采用徑向基核函數(shù)作為SVM的核函數(shù)。其形式為
K(x,y)=exp[-γ‖x-y‖]
( 6 )
對于多分類問題,可以將其分解為2分類問題進行處理,如進行1類與其他類劃分的“1對多”方法、為任意兩個類建立分類器的“1對1”方法以及利用二叉決策樹的方法。構(gòu)建基于RBF核函數(shù)的SVM分類器(RBF-SVM)后,需要決定最優(yōu)參數(shù)(c,γ)。
參數(shù)的選取不一樣,SVM的分類效果就有一定程度的不同[10]。若在參數(shù)范圍內(nèi)以窮舉法搜尋最優(yōu)參數(shù),則運算效率低下,因此本文提出一種改進的PSO算法以獲得最佳的(c,γ)參數(shù)對。
PSO算法最早由Kennedy與Eberhart提出[11],是1種啟發(fā)式的全局搜索優(yōu)化算法。假設(shè)在d維的目標搜索空間Xmin~Xmax中有n個潛在問題解組成1個粒子群S={X1,X2,…,Xn},其中d維向量Xi(i=1,2,…,n)表示第i個粒子在搜索空間中的位置,通過求解目標函數(shù)得到群中每一粒子的個體解(個體適應(yīng)度)Pi及群體最佳解(全局適應(yīng)度)Pg,然后每個粒子按下式更新位置
( 7 )
式中:k表示迭代數(shù);w為慣性參數(shù),權(quán)衡全局與局部搜索能力;c1,c2是一個常數(shù),代表學習因子;r1,r2是兩個均勻分布于[0,1]之間的隨機參數(shù)。PSO作為一種群體智能算法,由于簡單且易于實現(xiàn),因而在優(yōu)化領(lǐng)域得到廣泛的應(yīng)用。但是基本的PSO算法容易存在容易陷入局部極值的缺點[12],因此為了提高算法性能,在Eberhart等人的研究[13]的基礎(chǔ)上,對慣性常量w進行優(yōu)化。考慮到粒子Xi具有不同范圍的不同變量,本文將w定義為一個d×d的自適應(yīng)變化的對角系數(shù)矩陣
w=diag(w1,w2,…,wd)=
( 8 )
( 9 )
式中:rand表示[0,1]內(nèi)的隨機數(shù),隨機矩陣R=diag(rand1,rand2,…,randd)。
在本文中,需要優(yōu)化的參數(shù)為Xi=[ci,γi]T,適應(yīng)度值RBF-SVM對訓(xùn)練樣本的正確分類率。
首先對比PCA降維、2DPCA降維以及不降維情況下模式識別效果。樣本數(shù)據(jù)為經(jīng)過二值化預(yù)處理得到的20×30像素二值圖像,共574個測試樣本。進行不同降維處理后,結(jié)果見表1。
表1 PCA、2DPCA降維識別結(jié)果
從表1中可見,降維到同樣維數(shù)時(原來維數(shù)為600,降維至200),2DPCA降維方法相比PCA方法雖然提取的主成分個數(shù)較少且主成分累計貢獻率較小,但樣本識別率基本一樣。同時可見采用兩種降維方法與不降維時識別率相差不大,因此在樣本數(shù)量很大時,可以采用2DPCA來降低SVM模型處理數(shù)據(jù)的規(guī)模。
對網(wǎng)格尋優(yōu)與粒子群算法尋優(yōu)這兩種SVM參數(shù)尋優(yōu)方法進行對比,選取測試樣本數(shù)為574個,重復(fù)測試次數(shù)為10次。結(jié)果見表2。
表2 網(wǎng)格尋優(yōu)、PSO算法識別結(jié)果
從表2中可見,網(wǎng)格尋優(yōu)方法平均運行時間要遠大于PSO算法,因為其類似于窮舉法,需遍歷網(wǎng)格中的所有點,所以效率較低。從識別效果來看,兩種尋優(yōu)算法基本一樣。綜合考慮,應(yīng)優(yōu)先選取PSO算法。
進一步對比PSO算法改進前與改進后的效果,本文以下式作為適應(yīng)度測試函數(shù)
(10)
當(x,y)→(0,0)時f(x,y)趨于極值1。該函數(shù)具有許多局部極值點。
應(yīng)用基本的PSO算法尋找最大值(最佳適應(yīng)度)的結(jié)果見圖5??梢娫诘螖?shù)為80代左右后,適應(yīng)度值在非常長一段時間內(nèi)沒有變化,說明算法陷入了局部極值點,直到450代左右才跳出局部極值點,找到最大值(0.990 03),很明顯算法耗時過長。在算法的種群初始化數(shù)據(jù)不變的前提下,應(yīng)用本文提出的改進的PSO算法對式(10)尋優(yōu)的結(jié)果見圖6。很顯然,算法沒有陷入到局部極值中,并且能夠很快的收斂找到最大值(0.995 86),說明了本文提出的對PSO算法的改進是具有明顯效果的。因此,采用該改進的PSO算法對RBF-SVM參數(shù)尋優(yōu)。
本文以完全模式、部分模式、目視行車模式、待機模式、冒進模式、冒進后防護模式等6種模式為訓(xùn)練和測試樣本。其中,以RBF-SVM分類器對180個訓(xùn)練樣本的再分類的準確率為適應(yīng)度值,以經(jīng)過改進的PSO算法對兩個參數(shù)(c,γ)的尋優(yōu)見圖7。
從圖7可見,改進了的PSO算法使得適應(yīng)度值在第3次迭代時便獲得了100%的適應(yīng)度值,確定的(c,γ)參數(shù)對為(18.34,0.01)。
在確定了RBF-SVM參數(shù)后,如果采用對應(yīng)于圖4(a)的對圖像分割后填充的歸一化大小方式,提取特征向量后通過SVM分類識別的結(jié)果見表3。
表3 列控工作模式識別結(jié)果
可以看到,某些類別的識別率并不理想,如對目視工作模式的識別率只達到了67.6%。主要原因在于當變換得到用于特征提取的圖像較小時(如20×30像素),則文字區(qū)域更小,圖像更加模糊,即使提取主要特征后也不利于分類。而若變換成更大的圖像,由于冗余信息黑色像素較多,圖像降維后仍然使得SVM的分類效率較慢。而如果采取割出文字區(qū)域后直接歸一化同樣大小后(如20×30像素)再進行特征提取、訓(xùn)練分類,則識別效果可以得到明顯提升,見表4。
表4 列控工作模式識別結(jié)果
為了更直觀地表示表4的分類結(jié)果,給出了分類的混淆矩陣,見表5,表示表格第一列(類別)中的工作模式分類的結(jié)果。
表5 列控工作模式識別的混淆矩陣
從表4可見,經(jīng)過SVM分類后,基本上各個工作模式都能夠正確識別,測試574個樣本的基礎(chǔ)上,平均識別率達到了98.3%。而通過表5的混淆矩陣可以看到,部分模式有1個樣本錯誤的分類成了目視模式,而目視模式則分別有3個樣本錯誤分類成了完全模式、6個樣本錯誤分類成了待機模式。主要的原因在于,當獲取的圖像中文字不夠清晰時,在進行二值化處理后就有可能得到形態(tài)與其他模式類別相近的圖像,最后對分類造成影響。盡管如此,總體的識別率仍然很高。
本文研究了列車運行控制系統(tǒng)DMI顯示的列車工作模式的分類識別,對分割出來的顯示工作模式的區(qū)域利用2DPCA進行特征提取后,利用RBF-SVM進行分類,其中RBF-SVM的參數(shù)用改進了的PSO算法進行了優(yōu)化,實現(xiàn)了列車工作模式DMI顯示的正確識別。實驗表明,通過本文的方法達到了平均98.3%的識別率,對DMI圖像其它顯示信息的識別與設(shè)備自動化測試具有參考意義。
參考文獻:
[1] 唐濤.列車運行控制系統(tǒng)[M].北京:中國鐵道出版社,2012.
[2] 張勇,覃燕,李凱,等.CTCS-3級列控系統(tǒng)車載設(shè)備人機界面信息的識別方法[J].中國鐵道科學,2010,31(4):92-99.
ZHANG Yong, QIN Yan, LI Kai, et al.The Method for Recognizing Driver Machine Interface Information of the Onboard Equipment in CTCS-3[J]. China Railway Science,2010,31(4):92-99.
[3] DEEPA B, KUMAR S S. Optical Character Recognition: An Overview and an Insight[C]//Proceedings of 2014 IEEE International Conference on Control, Instrumentation, Communication and Computational Technologies. New York:IEEE, 2014:1361.
[4] WANG Zhenyan.Chinese Character Recognition Method Based on Image Processing and Hidden Markov Model[C]// Proceedings of 2014 IEEE Fifth International Conference on Intelligent Systems Design and Engineering Applications (ISDEA). New York:IEEE, 2014: 276-279.
[5] PATEL D K, SOM T, SINGH M K. Multiresolution Technique to Handwritten English Character Recognition Using Learning Rule and Euclidean Distance Metric[C]//Proceedings of 2014 IEEE International Conference on Signal Processing and Communication (ICSC). New York:IEEE, 2013: 207-212.
[6] 中國鐵路總公司文件.鐵總運[2014]30號CTCS-2/3級列控車載設(shè)備人機界面(DMI)顯示暫行規(guī)范[Z].北京:中國鐵路總公司,2014.
[7] LI X, PANG Y, YUAN Y. L1-norm-based 2DPCA[J].IEEE Transactions on Systems, Man, and Cybernetics. Part B, Cybernetics: A Publication of the IEEE Systems, Man, and Cybernetics Society, 2010, 40(4): 1170-1175.
[8] VAISHNAV A P, GANATRA A P, BHENSDADIA C K. Support Vector Machine Classification Methods: A Review and Comparison with Different Classifiers[J].Data Mining and Knowledge Engineering, 2011, 3(1): 45-52.
[9] 王泳, 胡包鋼.應(yīng)用統(tǒng)計方法綜合評估核函數(shù)分類能力的研究[J].計算機學報, 2008, 31(6): 942-952.
WANG Yong, HU Baogang. A Study on Integrated Evaluating Kernel Classification Performance Using Statistical Methods[J]. Chinese Journal of Computers,2008, 31(6): 942-952.
[10] 林升梁,劉志.基于RBF核函數(shù)的支持向量機參數(shù)選擇[J]. 浙江工業(yè)大學學報, 2007,35(2):163-167.
LIN Shengliang,LIU Zhi.Parameter Selection in SVM with RBF Kernel Function[J]. Journal of Zhejiang University of Technology, 2007,35(2):163-167.
[11] POLI R, KENNEDY J, BLACKWELL T. Particle Swarm Optimization[J]. Swarm Intelligence, 2007,1(1): 33-57.
[12] 唐俊. PSO算法原理及應(yīng)用[J].計算機技術(shù)與發(fā)展, 2010(2):213-216.
TANG Jun. Principle and Application of PSO Algorithm[J].Computer Technology and Development, 2010(2): 213-216.
[13] SHI Y, EBERHART R C. Parameter Selection in Particle Swarm Optimization[C]// Proceedings of IEEE 7thAnnual Conference on Evolutionary Programming.New York:Springer-Verlag, 1998:591-600.