段 宇
(中車(chē)大同電力機(jī)車(chē)有限公司,山西 大同 037038)
2018年配屬西安鐵路局的HXD2機(jī)車(chē)出現(xiàn)的微機(jī)控制單元MPU切換故障,具體現(xiàn)象是機(jī)車(chē)運(yùn)行中報(bào)“MPU1 故障”,機(jī)車(chē)回段后試車(chē),查看MPU1指示燈電源燈頻繁微弱閃爍,其余指示燈不亮,MPU2指示燈正常,現(xiàn)場(chǎng)更換A節(jié)MPU機(jī)箱后試車(chē)正常。
MPU為冗余設(shè)計(jì),正常情況下MPU1工作,當(dāng)MPU1故障時(shí),MPU2工作。但針對(duì)上述現(xiàn)象是由于MPU2電源燒損,從而通過(guò)MPU2內(nèi)部的繼電器板控制另一個(gè)MPU1失電,但MPU2也未能工作,從而不能實(shí)現(xiàn)冗余。MPU是機(jī)車(chē)運(yùn)行的關(guān)鍵重要部件,相當(dāng)于電力機(jī)車(chē)的大腦,MPU系統(tǒng)冗余功能失效導(dǎo)致MPU無(wú)法正常工作會(huì)給行車(chē)安全帶來(lái)極大的安全隱患。本論文針對(duì)這一問(wèn)題,從MPU冗余的邏輯下手,改進(jìn)MPU冗余功能[1-2]。
微機(jī)控制單元MPU采用冗余設(shè)計(jì),內(nèi)部包含兩個(gè)MPU機(jī)箱,正常情況下,MPU1作為主控單元,負(fù)責(zé)管理和監(jiān)測(cè)網(wǎng)絡(luò)通信和各設(shè)備狀態(tài),MPU2熱備冗余;在MPU1故障的情況下,MPU2自動(dòng)接管主控單元功能。切換過(guò)程中除MPU1本身故障外任何數(shù)據(jù)無(wú)損失,不會(huì)引起其他設(shè)備故障。MPU通過(guò)內(nèi)部電器元件實(shí)現(xiàn)主控與從控主機(jī)得失替換,最終實(shí)現(xiàn)MPU1與MPU2的冗余功能。
HXD26138機(jī)車(chē)于2018年8月23日機(jī)車(chē)運(yùn)行中B節(jié)報(bào)“MPU1 故障”,機(jī)車(chē)回段后,試車(chē)排查故障,發(fā)現(xiàn)微機(jī)屏提示“MPU2 故障”(死現(xiàn)象),查看MPU2指示燈僅亮左下角1個(gè)電源燈,MPU1正常,MPU2數(shù)據(jù)無(wú)法下載,初步分析為MPU2電源板故障,運(yùn)行中故障MPU2錯(cuò)誤將MPU1切除,但由于自身電源板故障,將MPU1切除后,MPU2無(wú)法投入正常工作,更換MPU機(jī)箱后試車(chē)正常,判斷為HXD2機(jī)車(chē)MPU冗余功能失效。
后續(xù)對(duì)故障的MPU返廠檢測(cè),上電測(cè)試,故障復(fù)現(xiàn),電源燈閃爍,其他指示燈閃爍后熄滅,發(fā)現(xiàn)電源板燒損。
MPU內(nèi)部控制電路如圖1所示。
圖1 MPU內(nèi)部控制電路
MPU的冗余控制原理是,通過(guò)內(nèi)部數(shù)字量輸出通道(A、C腳)控制繼電器Q-PW閉合和斷開(kāi),再借助Q-PW繼電器觸點(diǎn)實(shí)現(xiàn)管控MPU的電源復(fù)位功能。這個(gè)功能可以實(shí)現(xiàn)當(dāng)某個(gè)MPU發(fā)生故障以至影響網(wǎng)絡(luò)通信時(shí),另一個(gè)MPU可以對(duì)其進(jìn)行電源復(fù)位,不影響整車(chē)運(yùn)行。圖2為MPU1和MPU2的控制接口圖。
圖2 MPU1和MPU2的控制接口圖
一般情況下,MPU2的AC腳之間處于高阻抗斷開(kāi)狀態(tài),繼電器保持失電,此時(shí)繼電器常閉觸點(diǎn)閉合,MPU1得電,但當(dāng)MPU2電源燒損時(shí),導(dǎo)致MPU2內(nèi)部電路板供電異常,導(dǎo)致DO控制電路芯片的工作基準(zhǔn)電壓不正常,造成MPU2的AC腳之間處于低阻抗導(dǎo)通狀態(tài),從而繼電器得電,繼電器常閉觸點(diǎn)斷開(kāi),最終造成MPU1的110 V電源斷開(kāi),MPU2錯(cuò)誤將MPU1切除,但又由于自身電源板故障,MPU2也無(wú)法投入正常工作。通過(guò)MPU返廠檢測(cè)分析再次驗(yàn)證了前期故障處理的判斷。
硬件冗余是通過(guò)熱備系統(tǒng)或冷備系統(tǒng)硬件實(shí)現(xiàn)冗余控制所需要的數(shù)據(jù)同步和主從切換,在機(jī)車(chē)運(yùn)行的過(guò)程中微機(jī)主控制器MPU1工作,從控制器MPU2處于聯(lián)機(jī)運(yùn)用狀態(tài),但不參與控制和輸出,一旦MPU1故障,MPU2便會(huì)立即接替主控制器投入工作,迅速接管控制與輸出,重新執(zhí)行主控制器故障時(shí)的那段任務(wù),不會(huì)造成數(shù)據(jù)丟失。
但根據(jù)前文中分析的故障問(wèn)題,若MPU的電源板燒損就會(huì)出現(xiàn)冗余功能失效,該冗余功能的可靠性受到MPU機(jī)箱內(nèi)電器元件的性能影響。一些老直流機(jī)車(chē)的控制單元采用的是冷備冗余,當(dāng)一組控制單元故障時(shí),手動(dòng)切換至另一組。若在原有硬件熱備的基礎(chǔ)上,增加硬件電源冷備裝置及當(dāng)微機(jī)控制單元MPU內(nèi)部電源板燒損熱備冗余失效時(shí),通過(guò)備用的冗余冷備電源裝置給其中的一組MPU故障,通過(guò)人工上電,可以讓另一組MPU得電繼續(xù)維持機(jī)車(chē)運(yùn)用,但這樣做的缺點(diǎn)是通過(guò)人工操作,過(guò)于依賴(lài)人員操作的熟練程度,人工操作所耽誤的實(shí)踐會(huì)造成部分?jǐn)?shù)據(jù)丟失,而MPU的數(shù)據(jù)記錄是毫秒級(jí),會(huì)對(duì)機(jī)車(chē)數(shù)據(jù)的運(yùn)用分析造成一定影響。
冷備冗余是通過(guò)備份所有正常運(yùn)行的組件放在一旁或者倉(cāng)庫(kù)里,等運(yùn)行的組件壞了以后更換新的組件來(lái)完成系統(tǒng)的正常運(yùn)行,這個(gè)冗余時(shí)間和更換時(shí)間息息相關(guān)。這種冷備用方式很少去關(guān)注響應(yīng)時(shí)間,并且需要運(yùn)維人員干預(yù)操作,人工上電的過(guò)程會(huì)耽誤多少時(shí)間,只能視運(yùn)維人員的對(duì)系統(tǒng)的熟練程度而定并且必須被動(dòng)接受。熱備冗余,是兩套完全一樣的配置組件,一個(gè)正常運(yùn)行被視為主,另一個(gè)待機(jī)并不運(yùn)行備用被視為從,每隔一段時(shí)間,主從的內(nèi)容相互交換一次,當(dāng)運(yùn)行組件出現(xiàn)故障,備用組件才會(huì)運(yùn)行承擔(dān)工作,同時(shí)會(huì)完好地保存數(shù)據(jù)。
MPU相當(dāng)于是機(jī)車(chē)微機(jī)網(wǎng)絡(luò)系統(tǒng)的大腦,我們希望提高M(jìn)PU使用的可靠性,包括全文給MPU增加冷備冗余裝置的目的也是希望提高M(jìn)PU冗余功能的可靠性,降低因電器元件故障導(dǎo)致冗余失效的風(fēng)險(xiǎn),但冷備冗余的模式不利于機(jī)車(chē)運(yùn)用數(shù)據(jù)的保留,站在這一角度思考,我們也可以通過(guò)改變MPU內(nèi)部電器元件的電路設(shè)計(jì),使MPU的DO控制電路內(nèi)部冗余,從而提升設(shè)備的可靠性。
根據(jù)上文敘述,改進(jìn)方案是在原來(lái)MPU主控和從控主機(jī)通過(guò)得失電實(shí)現(xiàn)冗余功能原理的基礎(chǔ)上,改進(jìn)MPU1和MPU2的DO電源控制電路,增加繼電器Q-PW,由2個(gè)增加為4個(gè),2個(gè)為一組,當(dāng)MPU內(nèi)部電源板路電器元件故障繼電器動(dòng)作時(shí),每組的繼電器互為冗余可以保證MPU繼續(xù)得電,從而實(shí)現(xiàn)DO電源控制的電路冗余,最終從電器元件的得失電和內(nèi)部電路設(shè)計(jì)方面的雙層冗余,提升了設(shè)備的安全可靠性,也避免了增加冷備冗余裝置的缺點(diǎn)和高費(fèi)用。圖3為改進(jìn)后的MPU1和MPU2的控制接口圖。
圖3 改進(jìn)后的MPU1和MPU2的控制接口圖
圖3中,改進(jìn)的電源控制板電路將MPU1和MPU2的控制電路由原來(lái)的1路繼電器控制增加為2路繼電器控制。MPU2通過(guò)2路可控輸出(MPU2 D01和D02)分別控制繼電器A2和A4的線(xiàn)圈,外部DC110 V電源正端經(jīng)過(guò)防反二極管及濾波電路后,分別經(jīng)過(guò)A2繼電器常閉觸點(diǎn)和A4繼電器的常開(kāi)觸點(diǎn)后接入MPU1的電源輸入端口正端。
因?yàn)橥獠侩娫唇?jīng)過(guò)2個(gè)繼電器的常閉和常開(kāi)觸點(diǎn)控制MPU1的電源輸入,當(dāng)發(fā)生故障時(shí),即使MPU2的D0通道故障,A2繼電器斷開(kāi),A4繼電器閉合,被控的MPU1電源仍處于正常導(dǎo)通狀態(tài),這就可以避免因MPU2故障導(dǎo)致MPU1失去電源輸入的問(wèn)題,提高M(jìn)PU冗余功能的可靠性,MPU1電源控制電路同理控制著MPU2。
針對(duì)MPU電源板U4芯片燒損,造成MPU1、MPU2冗余功能失效的問(wèn)題,我們結(jié)合優(yōu)化后的電源控制電路改進(jìn)方案,對(duì)MPU的電源控制板進(jìn)行了實(shí)際改進(jìn)優(yōu)化,改造前后的實(shí)物如圖4所示。
同時(shí),在MPU1和MPU2的D0控制引腳端與地之間增加了TVS(型號(hào)SMCJ15CA),增強(qiáng)了DO通道的抗干擾性。但在第一批改進(jìn)的MPU電源控制板上車(chē)實(shí)驗(yàn),通過(guò)切斷MPU1和MPU2斷路器實(shí)驗(yàn)冗余功能,試驗(yàn)中發(fā)生當(dāng)一組MPU電源斷路器斷開(kāi)后,另一組MPU有時(shí)不啟動(dòng)的問(wèn)題。主要原因是MPU控制電源板上的C3電容容量大造成啟動(dòng)電流偏大,后將C3電容容量由原來(lái)的100 μF更換為33 μF,啟動(dòng)電流降低了1/4,且不影響MPU正常啟動(dòng),MPU電源斷路器斷開(kāi)后可再正常閉合,具體電路如圖5所示。
圖5 電源隔離模塊改進(jìn)圖
圖4 改造前后的電路板
通過(guò)優(yōu)化,目前改進(jìn)的MPU電源控制板能夠更好地保證機(jī)車(chē)的正常運(yùn)用,HXD2機(jī)車(chē)的微機(jī)控制單元MPU的冗余功能可靠性得到大幅的提高,為機(jī)車(chē)的安全運(yùn)用提供了可靠的保證。
本文主要針對(duì)HXD2機(jī)車(chē)微機(jī)控制單元MPU在運(yùn)用中出現(xiàn)的問(wèn)題,從MPU內(nèi)部電路設(shè)計(jì)方面著手,進(jìn)一步使得MPU的冗余功能可靠性得到大幅的提高。