貝 珩
(中國(guó)國(guó)際航空股份有限公司 培訓(xùn)部,北京 101300)
近10年的統(tǒng)計(jì)數(shù)字表明,模擬機(jī)儀表接口系統(tǒng)是模擬機(jī)故障率最高的系統(tǒng),其故障占比達(dá)到各類系統(tǒng)故障總量的50%左右,維護(hù)人員在該系統(tǒng)中投入的工作量也相對(duì)較大。傳統(tǒng)的故障性維護(hù)方式一般是根據(jù)故障點(diǎn)對(duì)應(yīng)的電路連接,逐一測(cè)量和更換線路上的硬件設(shè)備,以期達(dá)到恢復(fù)模擬機(jī)正常功能的效果。以這種方式處理故障通常要面臨3種困難:
① 所有相關(guān)設(shè)備的更換都需要對(duì)應(yīng)的備件支持,并且新備件必須與原設(shè)備所在線路兼容;
② 測(cè)量點(diǎn)必須清晰可見,測(cè)量人員、測(cè)量設(shè)備和操作空間必須符合測(cè)量要求;
③ 為確保操作者和設(shè)備安全,必須暫停飛行訓(xùn)練,由至少二人協(xié)作、占用較長(zhǎng)時(shí)間完成上述操作。
而在故障現(xiàn)象復(fù)雜的情況下,更換單一的備件并不能保證100%排除故障,當(dāng)故障的癥結(jié)存在于未被更換的器件上或者軟件驅(qū)動(dòng)和尋址方面,就應(yīng)當(dāng)采用從軟件端對(duì)故障設(shè)備對(duì)應(yīng)的特征變量(label)實(shí)施監(jiān)測(cè)和控制的方法,來(lái)尋找故障的形成原因。
公共數(shù)據(jù)庫(kù)(Common Datebase,CDB)檢索也稱為公共數(shù)據(jù)庫(kù)查詢技術(shù),即在數(shù)據(jù)庫(kù)文件或系統(tǒng)中對(duì)關(guān)鍵字搜索的結(jié)果進(jìn)行分析、篩選和實(shí)驗(yàn),并獲得有用信息的技術(shù)[1]。使用CDB檢索找到特定label的方法剛好符合模擬機(jī)接口系統(tǒng)復(fù)雜故障的排故需求,但它在現(xiàn)行的排故工作中并不通用,這主要有3方面原因:
① CDB是模擬機(jī)軟件運(yùn)行的動(dòng)態(tài)參數(shù)庫(kù),廠家沒(méi)有明確給出對(duì)CDB進(jìn)行操作的方法和檢出label的定義;
② 交互頁(yè)面式的監(jiān)控軟件沒(méi)有提供輸入特定label實(shí)施監(jiān)控的手段,僅能對(duì)軟件中可視的label進(jìn)行監(jiān)控;
③ 對(duì)由時(shí)序信號(hào)控制并不斷刷新狀態(tài)的label進(jìn)行賦值時(shí),廠家沒(méi)有告知保持其賦值狀態(tài)的方法。
就上述問(wèn)題開展研究,分析模擬機(jī)軟硬件運(yùn)行的原理,在CDB初始文件中,使用設(shè)備關(guān)鍵字檢索的方法,找到可能影響設(shè)備狀態(tài)的若干個(gè)label。而后通過(guò)命令行軟件直接與模擬機(jī)運(yùn)行時(shí)使用的CDB進(jìn)行實(shí)時(shí)交互,窮舉觀察所有l(wèi)abel賦值帶來(lái)的設(shè)備狀態(tài)變化。以期在不中斷飛行訓(xùn)練的情況下,短時(shí)間內(nèi)確定故障癥結(jié),提高排故的針對(duì)性、操作的安全性,并減少對(duì)飛行訓(xùn)練的干擾,這是采用CDB檢索的排故方法預(yù)期達(dá)到的效果。
中國(guó)國(guó)際航空股份有限公司737-800型飛行模擬機(jī)于質(zhì)量自檢中發(fā)現(xiàn)第三部無(wú)線電調(diào)諧面板的對(duì)側(cè)調(diào)諧燈顯示邏輯出現(xiàn)錯(cuò)誤。根據(jù)中國(guó)國(guó)際航空股份有限公司737機(jī)組操作手冊(cè)第五章第十節(jié)的描述,這類面板在737-800型飛機(jī)內(nèi)共有3部,分別安裝于中央控制臺(tái)的左上(第1部)、右上(第2部)和中下(第3部),其英文名稱為Radio Tuning Panel,簡(jiǎn)稱RTP。
RTP的對(duì)側(cè)調(diào)諧燈位于面板中上部,其顯示邏輯正常時(shí)應(yīng)符合中國(guó)國(guó)際航空股份有限公司737機(jī)組操作手冊(cè)第五章第十節(jié)第七段的概括,即通常與這個(gè)面板連接的無(wú)線電正在由另一個(gè)無(wú)線電調(diào)諧面板調(diào)諧、或這個(gè)無(wú)線電調(diào)諧面板正在用于調(diào)諧通常不與它連接的無(wú)線電時(shí),該燈顯示為白色常亮[2]。也就是說(shuō)對(duì)側(cè)調(diào)諧燈邏輯的正常狀態(tài)為熄滅狀態(tài),此時(shí)三部RTP各自與通常應(yīng)當(dāng)連接的無(wú)線電進(jìn)行調(diào)諧,即RTP1選擇調(diào)諧VHF1(Very High Frequency),RTP2選擇調(diào)諧VHF2,RTP3在非備用狀態(tài)時(shí)調(diào)諧VHF3。而當(dāng)任何一個(gè)RTP調(diào)諧了其他RTP通常調(diào)諧的無(wú)線電頻率時(shí),這兩個(gè)RTP的對(duì)側(cè)調(diào)諧燈點(diǎn)亮。如:RTP1選擇調(diào)諧VHF2,RTP2和RTP3保持正常調(diào)諧狀態(tài),此時(shí)RTP1和RTP2的對(duì)側(cè)調(diào)諧燈點(diǎn)亮,RTP3的對(duì)側(cè)調(diào)諧燈熄滅。
按照上述原則,使用窮舉法采樣三部RTP的27組對(duì)側(cè)調(diào)諧燈顯示邏輯,如表1所示。發(fā)現(xiàn)僅有RTP1的對(duì)側(cè)調(diào)諧燈顯示邏輯符合機(jī)組操作手冊(cè)的描述,RTP2和RTP3的顯示邏輯則呈現(xiàn)出相反的狀態(tài),即RTP2的對(duì)側(cè)邏輯符合RTP3的調(diào)諧原則,RTP3的對(duì)側(cè)邏輯符合RTP2的調(diào)諧原則。初步估計(jì)二者在接口電路中傳輸?shù)目刂菩盘?hào)發(fā)生了錯(cuò)誤的互換。
表1 RTP對(duì)側(cè)調(diào)諧燈顯示邏輯采樣表
模擬機(jī)生產(chǎn)商利用波音、空客等飛機(jī)制造企業(yè)提供的、獲取自真實(shí)飛機(jī)的特性數(shù)據(jù),通過(guò)自行開發(fā)的主程序及其分支模塊,將各個(gè)系統(tǒng)的仿真效果傳遞給模擬機(jī)用戶[3]。這些系統(tǒng)通??梢苑譃橛?jì)算機(jī)系統(tǒng)、儀表接口系統(tǒng)、運(yùn)動(dòng)和操縱系統(tǒng)、視景系統(tǒng)和聲音系統(tǒng)[4]。
而上述故障發(fā)生在儀表接口系統(tǒng)中,對(duì)于這一系統(tǒng)的故障,傳統(tǒng)的方法通常需要測(cè)量故障線路的信號(hào)是否正常受控,或者在電路圖中找出故障線路的label,用軟件對(duì)label進(jìn)行賦值,再觀察對(duì)應(yīng)器件是否出現(xiàn)正常的響應(yīng)。這種故障處理方式面臨如下幾個(gè)問(wèn)題。
① 可靠的電子產(chǎn)品在設(shè)計(jì)時(shí)通常會(huì)考慮,在環(huán)境溫度、工作載荷和持續(xù)使用時(shí)間等因素的影響下,發(fā)生元件參數(shù)退化或小范圍特性漂移時(shí),產(chǎn)品性能指標(biāo)仍在關(guān)聯(lián)設(shè)備可識(shí)別的容差范圍內(nèi),部分電路的潛在故障可以被消除或容忍[5]。但由于RTP2和RTP3的顯示邏輯不是單獨(dú)出現(xiàn)錯(cuò)誤,而是發(fā)生了完整互換,其各自的接口設(shè)備同時(shí)存在對(duì)稱的顯性故障的可能性微乎其微,因此單純更換接口設(shè)備以消除故障的概率較低。
② 機(jī)載設(shè)備的功能復(fù)雜,對(duì)應(yīng)的接口模塊類型較多,為了維護(hù)方便,在設(shè)計(jì)時(shí)一般采用將串行數(shù)據(jù)模塊和ARINC模塊分別以單獨(dú)的接口板卡形式與用戶操作面板連接[6],同時(shí)遵循以最小可更換器件為單元,將每個(gè)RTP面板對(duì)應(yīng)的接口設(shè)備GPIM(General Purpose Interface Module)設(shè)計(jì)為3個(gè),如果同時(shí)更換2個(gè)RTP對(duì)應(yīng)的GPIM,將為接口系統(tǒng)引入7個(gè)不同類型的新設(shè)備,所需的備件數(shù)量和投入的工作時(shí)間都很多,新設(shè)備的兼容性隱患也非常大[7]。
③ GPIM是封閉安裝的設(shè)備,沒(méi)有外部可視的測(cè)量點(diǎn),僅可使用專用設(shè)備將測(cè)量點(diǎn)引出才能進(jìn)行測(cè)量,同時(shí)RTP面板除接收處理串口信號(hào)外,還接收ARINC信號(hào),這種時(shí)序信號(hào)需要專用設(shè)備測(cè)量,使用一般的工具無(wú)法得到有效的測(cè)量結(jié)果。
④ 如果信號(hào)的互換錯(cuò)誤發(fā)生在接口設(shè)備上,更換對(duì)應(yīng)GPIM可以排除故障,但如果信號(hào)的互換錯(cuò)誤發(fā)生在主機(jī)(Host)端,那么更換GPIM就毫無(wú)意義,必須對(duì)主機(jī)端軟件進(jìn)行進(jìn)一步處理。
因此必須選用軟件監(jiān)控的方法,從主機(jī)端著手,嘗試分別控制RTP2和RTP3,并對(duì)產(chǎn)生的現(xiàn)象加以分析,找出發(fā)生信號(hào)錯(cuò)誤互換的設(shè)備。
對(duì)于使用一般的串行數(shù)據(jù)控制的設(shè)備,廠家大多會(huì)給出每個(gè)器件對(duì)應(yīng)的label,正常情況下這些器件可使用特定的監(jiān)測(cè)軟件通過(guò)控制label的數(shù)值呈現(xiàn)出相應(yīng)的現(xiàn)象變化,如:燈光亮滅、指針轉(zhuǎn)動(dòng)等。而在模擬機(jī)內(nèi)對(duì)設(shè)備進(jìn)行如:電門開合、旋鈕轉(zhuǎn)動(dòng)等操作,也可以在監(jiān)測(cè)軟件上觀察到label數(shù)值的變化。
RTP面板既用到串口信號(hào)也用到ARINC信號(hào),其接口電路如圖1所示,主機(jī)通過(guò)以太網(wǎng)將串行和ARINC數(shù)據(jù)發(fā)送到節(jié)點(diǎn)計(jì)算機(jī)(USB_IO),再由節(jié)點(diǎn)計(jì)算機(jī)通過(guò)簡(jiǎn)化PCI總線發(fā)送到功能分立的GPIM上,負(fù)責(zé)串行接口的普通GPIM將信號(hào)分為數(shù)字量和模擬量的輸入輸出與下游器件實(shí)現(xiàn)驅(qū)動(dòng)和交互,而負(fù)責(zé)ARINC信號(hào)的特殊接口卡GPIM_AC則通過(guò)板載的FPGA模塊與相關(guān)設(shè)備建立聯(lián)系[8]。
圖1 RTP面板接口電路原理圖
串行信號(hào)一般控制面板上的按鍵、旋鈕和燈光,這些功能都在模擬機(jī)的CDB中有相應(yīng)的定義,這種定義被稱為label,可以通過(guò)在主機(jī)端運(yùn)行的接口軟件ITMS(Integrated Test Management System)對(duì)這些label實(shí)現(xiàn)監(jiān)測(cè)和控制。憑借對(duì)這些label的賦值和觀察,可以直觀地發(fā)現(xiàn)接口設(shè)備是否存在故障情況,并且可使用萬(wàn)用表等常用測(cè)量工具,通過(guò)由專用工具引出的測(cè)量點(diǎn),獲得對(duì)應(yīng)插針的電壓值。比如:在ITMS上,對(duì)某指示燈的label進(jìn)行賦值,同時(shí)檢查燈光的狀態(tài),如果無(wú)論賦予的邏輯是“0”還是“1”,燈光始終亮起,則可以認(rèn)為對(duì)應(yīng)的GPIM存在故障,并輸出了錯(cuò)誤的驅(qū)動(dòng)信號(hào)。但對(duì)于使用ARINC429協(xié)議的鏈路采用同樣的方法很難取得成效,這種協(xié)議傳輸?shù)氖请p極歸零式調(diào)制信號(hào),即頻率為12.5~100 kbit/s的周期性連續(xù)信號(hào),其傳輸字格式如表2所示。
表2 ARINC429傳輸字的格式[9]
這種信號(hào)的邏輯特性遵循以下原則:由高電平+5 V回歸到零電平表示邏輯“1”,由低電平-5 V回歸到零電平表示邏輯“0”。同時(shí)其信號(hào)發(fā)送和接收設(shè)備也不是常見的邏輯信號(hào)保持器,而是綜合譯碼邏輯、控制邏輯、實(shí)時(shí)時(shí)鐘和中斷的集成模塊FPGA(Field Programmable Gate Array),因此只能使用示波器等不常用手段觀察其信號(hào)狀態(tài),很難作為有效的故障判斷依據(jù)[10]。雖然原理上講ARINC信號(hào)有對(duì)應(yīng)的label,但在電路圖中,這些label往往不被直接給出,想要控制這類信號(hào)必須尋找到與之相關(guān)的上游label。
假設(shè)一個(gè)ARINC邏輯信號(hào)的函數(shù)模型為
A{0,1}=F(a,b,c,…,n)
如果找到任何一個(gè)可控的變量a,b,c,…,n,在對(duì)這一變量進(jìn)行賦值的同時(shí),保持其他所有變量不變,能夠使A的值發(fā)生變化,則可以認(rèn)為A能夠單獨(dú)被上述變量控制。也就是說(shuō),當(dāng)CDB中存在一個(gè)可以單獨(dú)控制某路ARINC邏輯的label時(shí),可以通過(guò)在賦值該label的同時(shí)觀察RTP面板狀態(tài)的變化,來(lái)確定GPIM、ARINC設(shè)備或鏈路是否存在故障,以期實(shí)施有針對(duì)性的軟硬件調(diào)整。
由于CDB文件中含有的變量包含了所有的輸入/輸出變量和所有系統(tǒng)之間,甚至是系統(tǒng)內(nèi)部模塊之間的交連變量,如圖2所示[11]。因此對(duì)CDB文件進(jìn)行檢索,一般可以發(fā)現(xiàn)直接或者間接控制ARINC設(shè)備各種功能的特定label。
圖2 模擬機(jī)數(shù)據(jù)庫(kù)文件內(nèi)容示意
根據(jù)模擬機(jī)的軟件運(yùn)行原理,模擬機(jī)各個(gè)節(jié)點(diǎn)計(jì)算機(jī)和接口設(shè)備會(huì)從在用的配置下轄的CDB中調(diào)用label。這些CDB的初始文件可以借助Windows系統(tǒng),在主機(jī)端的各個(gè)configuration文件夾下,使用*cdb*關(guān)鍵字搜索獲得,而與ARINC協(xié)議相關(guān)的初始文件,也可以用*arinc*關(guān)鍵字搜索獲得,此故障中涉及到的兩個(gè)文件為b73x2.cdb和b73xarinc.csv??梢允褂肬ltraEdit等軟件打開上述CDB文件,并在其中繼續(xù)搜索與RTP相關(guān)的label,對(duì)比兩個(gè)文件中描述語(yǔ)句具有相關(guān)性的label,可以發(fā)現(xiàn)數(shù)十項(xiàng)與一般label存在關(guān)聯(lián)的ARINC邏輯。
由于這些label在ITMS中缺少調(diào)用接口,因此使用監(jiān)控工具CTS-PLUS(Control Test System)來(lái)進(jìn)行l(wèi)abel賦值,CTS的工作原理如圖3所示。
圖3 CTS軟件工作原理
可以看到,CTS將獲取到的初始數(shù)據(jù)通過(guò)同步和異步進(jìn)程按照主程序的要求寫入CDB,模擬機(jī)執(zhí)行來(lái)自CDB的初始輸出后,再根據(jù)模擬機(jī)使用者的人為輸入形成反饋,并發(fā)往CDB中,CTS此時(shí)再通過(guò)同步和異步進(jìn)程從CDB中獲取反饋數(shù)據(jù),以實(shí)現(xiàn)監(jiān)測(cè)和控制。ARINC邏輯通常在同步進(jìn)程中進(jìn)行運(yùn)算和傳遞,并且刷新頻率較高。如果通過(guò)賦值其相關(guān)label來(lái)改變ARINC邏輯,則可能會(huì)發(fā)生賦值當(dāng)時(shí)所生成的ARINC輸出在下一個(gè)時(shí)鐘周期到來(lái)時(shí)即被刷新回原有狀態(tài)的現(xiàn)象,這會(huì)令監(jiān)測(cè)者無(wú)法看到機(jī)艙端發(fā)生的變化,因此在CTS中進(jìn)行l(wèi)abel賦值操作前,可以對(duì)模擬機(jī)進(jìn)行飛行凍結(jié)(Flight Freeze),此時(shí)大部分同步進(jìn)程會(huì)暫停刷新,操作者此時(shí)再行賦值,模擬機(jī)主程序只對(duì)發(fā)生賦值的label和由此產(chǎn)生的單次運(yùn)算結(jié)果進(jìn)行響應(yīng),對(duì)應(yīng)的機(jī)艙端現(xiàn)象可以保留下來(lái),直至凍結(jié)解除。
在上述故障中,通過(guò)搜索找到影響RTP2和RTP3對(duì)側(cè)調(diào)諧燈的label后,發(fā)現(xiàn)當(dāng)對(duì)RTP2的相關(guān)label進(jìn)行賦值改變其邏輯狀態(tài)時(shí),對(duì)側(cè)調(diào)諧燈發(fā)生亮暗變化的是RTP3;反之當(dāng)對(duì)RTP3的相關(guān)label進(jìn)行賦值改變其邏輯狀態(tài)時(shí),對(duì)側(cè)調(diào)諧燈發(fā)生亮暗變化的是RTP2;同時(shí)賦值RTP1的相關(guān)label,僅有RTP1會(huì)有對(duì)應(yīng)現(xiàn)象。由此可以斷定主程序發(fā)出的指令在接口鏈路中而不是主機(jī)端發(fā)生錯(cuò)誤互換。此后檢查RTP2和RTP3的地址定義列表,發(fā)現(xiàn)兩路接口設(shè)備的地址定義與正常值相反,重新進(jìn)行接口設(shè)備固件燒錄后,故障現(xiàn)象消失。
通過(guò)公共數(shù)據(jù)庫(kù)檢索,找出待測(cè)設(shè)備對(duì)應(yīng)的特征變量,并結(jié)合CTS軟件進(jìn)行賦值,是一種高效、準(zhǔn)確和安全的儀表接口系統(tǒng)故障排查方法。大量的工作驗(yàn)證這種方法可以應(yīng)用于CAE公司生產(chǎn)的不同機(jī)型,不同技術(shù)代別的各類模擬機(jī)中。運(yùn)用該種方法處理關(guān)閉的故障有:B737-800型CLASSIC模擬機(jī)氣象雷達(dá)面板增益旋鈕功能不正常、B737-Max型XR模擬機(jī)燈光測(cè)試開關(guān)常閉、A330型SIMXXI模擬機(jī)黃系統(tǒng)滲油測(cè)試閥開關(guān)常開、A320型R4模擬機(jī)時(shí)鐘計(jì)時(shí)器失效等。
故障性維護(hù)對(duì)工程人員的要求主要是對(duì)故障的快速定位和隔離,同時(shí)應(yīng)兼顧以最小的維護(hù)成本換取故障的排除。一般熟練的工程人員能夠在1 h內(nèi)完成label檢索和賦值,而更換對(duì)應(yīng)接口設(shè)備或節(jié)點(diǎn)計(jì)算機(jī)的工時(shí)都相對(duì)更長(zhǎng),從搜尋備件到斷電更換,再到對(duì)主機(jī)進(jìn)行相應(yīng)的軟件更新,耗時(shí)通常在2 h以上,同時(shí)還可能引入新備件兼容性帶來(lái)的故障隱患。如果對(duì)電路進(jìn)行直接測(cè)量,除去可能存在的觸電或損傷電路的風(fēng)險(xiǎn)外,還可能遇到測(cè)量點(diǎn)難以確認(rèn)或接觸、信號(hào)特殊無(wú)法用常規(guī)設(shè)備采樣等問(wèn)題。而在機(jī)艙端對(duì)故障現(xiàn)象的觀察也是通過(guò)CTS賦值的方式最為便捷。因此該種方法應(yīng)在模擬機(jī)儀表接口系統(tǒng)的故障處理中被優(yōu)先考慮和應(yīng)用。