摘? 要:針對現(xiàn)有技術(shù)對于處理器的監(jiān)控僅支持在處理器運行之后的自檢,而在處理器啟動過程中無法針對啟動過程中的故障進行定位的問題,本文設(shè)計了一種基于MCU的X86系統(tǒng)監(jiān)控方法,MCU不依賴于X86處理器,與之并行運行,實時對X86系統(tǒng)進行監(jiān)控,并且MCU運行之后不需要任何人工干預(yù),可對X86運行過程中出現(xiàn)的問題進行聲光報警,并指示出出錯位置,易于工程維護。
關(guān)鍵詞:處理器監(jiān)控;故障定位;MCU;X86;聲光報警;工程維護
中圖分類號:TP277? ? ? 文獻標(biāo)識碼:A 文章編號:2096-4706(2019)19-0012-04
Abstract:To the question which current technology only support processor monitoring in POST but don’t support error positioning during processor booting,a new approach of monitoring X86 system based on MCU is designed in this paper. Keep parallel operation with CPU but not relying on it,MCU is able to monitor X86 system in real time and totally unmanned after booting. The MCU also provides sound-light alarm and error positioning for easy to maintain.
Keywords:processor monitoring;error positioning;MCU(microcontroller unit);X86;sound-light alarm;engineering maintenance
0? 引? 言
目前市面上各種計算機已經(jīng)廣泛地應(yīng)用于各個領(lǐng)域,例如工業(yè)控制、軍工、軌道交通等。其中一些領(lǐng)域?qū)τ嬎銠C系統(tǒng)的可靠性和穩(wěn)定性具有很高的要求,一旦出現(xiàn)故障則要求迅速定位。而在現(xiàn)有技術(shù)中,一般只能在處理器運行起來后才能通過軟件進行自檢[1],而在啟動過程中若處理器發(fā)生故障,則無法對故障進行定位。
為此,本文提出一種可在X86系統(tǒng)啟動過程中迅速定位X86系統(tǒng)故障的處理器監(jiān)控方法,方案采用在X86系統(tǒng)內(nèi)嵌的MCU(Microcontroller Unit,微控制單元,本文中泛指包括各種單片機、ARM、MIPS等架構(gòu)的處理器),其獨立于X86運行,同時對X86整個運行過程進行監(jiān)控,并且給出相應(yīng)的處理和反饋,從而保證X86平臺的可靠運行。此外,在X86的運行過程中,MCU也會對X86運行的軟硬件環(huán)境進行監(jiān)測,如果有異常產(chǎn)生就會對X86進行通知、中斷、甚至斷電等處理。
1? 系統(tǒng)結(jié)構(gòu)設(shè)計
本文提出的一種基于MCU的監(jiān)控X86系統(tǒng)的方法,其系統(tǒng)結(jié)構(gòu)[2]如圖1所示:將MCU集成于X86的系統(tǒng)中,包括集成于主板上,或者以擴展插卡等形式存在,MCU通過UART、USB等通訊口與X86的CPU進行通訊[3],并通過各種IO對X86系統(tǒng)工作狀態(tài)進行監(jiān)控,對硬件的上電時序進行控制,對異常進行處理。
2? 系統(tǒng)監(jiān)控方法
系統(tǒng)監(jiān)控處理過程包括以下幾點:
(1)X86的上電啟動過程監(jiān)控,如圖2所示,MCU在獲得供電后首先啟動,MCU控制X86系統(tǒng)中的各個電路按照預(yù)設(shè)的上電時序依次上電啟動,在控制各個電路上電啟動過程中,監(jiān)測前一個電路上電啟動是否正常,在監(jiān)測到前一個電路上電啟動正常后,再控制后一個電路進行上電啟動,若監(jiān)測到任意一個電路上電啟動異常,則向報警電路發(fā)送與該電路對應(yīng)的上電異常信號;報警電路根據(jù)上電異常信號進行聲、光、電或圖形的指示。
MCU是指將計算機的CPU、RAM、ROM、定時計數(shù)器和多種I/O接口集成在一片芯片上而形成的芯片級的計算機。X86是由Intel推出的一種復(fù)雜指令集,用于控制芯片的運行,X86處理器可認(rèn)為是基于X86運行的中央處理器(CPU)。
上電啟動過程:向電路的電壓芯片輸入使能信號,使能信號為指示電壓芯片向電路輸出運行時所需的正常電壓的信號;
監(jiān)測一個電路上電啟動是否正常的依據(jù)為監(jiān)測電路的電壓芯片是否返回表示運行狀態(tài)的信號,并判斷該電路的電壓芯片返回的表示運行狀態(tài)的信號的電平是否對應(yīng)正常運行狀態(tài)。電路的電壓芯片返回的表示運行狀態(tài)的信號通常稱為PowerGood信號,PowerGood信號的電壓為3V則表示電路正常運行,PowerGood信號為0V則表示電路完全斷電。
若監(jiān)測到一個電路上電啟動異常,則再一次控制該電路進行上電啟動,直到對該電路已經(jīng)進行了預(yù)設(shè)次數(shù)的上電啟動,該電路還是不能正常地上電啟動后,則向報警電路發(fā)送與該電路對應(yīng)的上電異常信號。
報警電路可以根據(jù)不同的上電異常信號發(fā)出不同強度的聲音和光線,也可以根據(jù)不同的上電異常信號控制數(shù)碼管顯示不同的數(shù)字,從而指示出發(fā)生故障的具體電路。
(2)MCU監(jiān)測處理器運行過程中的運行溫度,當(dāng)運行溫度處于預(yù)設(shè)的高溫范圍時,向處理器發(fā)送降頻信號;當(dāng)運行溫度處于預(yù)設(shè)的危險范圍時,向處理器發(fā)送正常關(guān)機信號,并監(jiān)測處理器在預(yù)設(shè)時間段內(nèi)是否關(guān)機成功,若否,則向處理器發(fā)送強制關(guān)機信號。處理器運行過程中的運行溫度監(jiān)測過程如圖3所示。
與處理器集成于同一主板上的溫度傳感器感應(yīng)處理器的溫度,溫度傳感器與MCU通信連接,并向MCU發(fā)送表示處理器的溫度的信號。MCU根據(jù)從溫度傳感器接收的信號判斷處理器的運行溫度所處的范圍。若處理器的運行溫度大于等于第一閾值而小于第二閾值,則MCU判定處理器的運行溫度處于高溫范圍,其中第一閾值小于第二閾值。處理器在接收到降頻信號后進行降頻運行。處理器降頻運行后一般可降低自身的運行溫度。若處理器的運行溫度大于第二閾值,則MCU判定處理器的運行溫度處于危險范圍。處理器在接收到正常關(guān)機信號后,按照正常關(guān)閉程序的邏輯關(guān)閉所有正在運行的程序;處理器在接收到強制關(guān)機信號后,強制退出所有正在運行的程序。
基于MCU的X86系統(tǒng)監(jiān)控方法,MCU先于處理器啟動,并控制處理器的上電啟動:MCU控制處理器中的各個電路按照預(yù)設(shè)的上電時序依次上電啟動,并控制前一個電路正常上電啟動后,再控制后一個電路進行上電啟動,若監(jiān)測到任意一個電路上電啟動異常,則發(fā)出與該電路對應(yīng)的異常報警;因此上述處理器監(jiān)控方法可在處理器啟動過程中迅速定位出處理器中發(fā)生異常的電路,從而找出故障發(fā)生的原因。通過獨立于處理器的MCU監(jiān)控處理器的運行溫度,且當(dāng)處理器的運行溫度處于高溫范圍時,控制處理器進行降頻,可避免處理器的運行溫度進一步升高,而當(dāng)處理器的運行溫度處于危險范圍時,控制處理器進行關(guān)機,可避免處理器損壞。
3? 可配置看門狗電路
MCU中內(nèi)置可配置看門狗定時器(Watch Dog Timer,簡稱WDT)電路[4,5],如圖4所示,其實現(xiàn)包括以下步驟。
(1)MCU接收X86處理器傳送的喂狗時間間隔參數(shù)以及看門狗啟動命令。
處理器根據(jù)應(yīng)用程序指令向MCU發(fā)送喂狗時間間隔參數(shù)以及看門狗啟動命令。具體的喂狗時間間隔參數(shù)的值由各個具體的應(yīng)用程序而決定。
(2)MCU根據(jù)喂狗時間間隔參數(shù)配置可配置看門狗電路的計數(shù)器溢出參數(shù),并啟動可配置看門狗電路。
可配置看門狗啟動后,計數(shù)器開始計數(shù),當(dāng)累計值達到計數(shù)器溢出參數(shù)的值時,向MCU發(fā)送復(fù)位信號并將計數(shù)器清零,而當(dāng)接收到MCU的喂狗信號時也將計數(shù)器清零,并啟動計數(shù)器重新計數(shù)。
(3)MCU每當(dāng)接收到處理器的喂狗信號時,向可配置看門狗電路傳送喂狗信號。
處理器根據(jù)應(yīng)用程序指令向MCU發(fā)送喂狗信號,在應(yīng)用程序指令所屬的應(yīng)用程序正常運行的情況下,應(yīng)用程序指令每隔預(yù)設(shè)時長被執(zhí)行一次,即處理器每隔預(yù)設(shè)時長向MCU發(fā)送喂狗信號,預(yù)設(shè)時長小于喂狗時間間隔參數(shù)的值。
(4)MCU接收到可配置看門狗電路的復(fù)位信號后,向處理器傳送復(fù)位信號。
復(fù)位過程還包括帶電重啟和斷電重啟兩種方式;MCU判斷帶電重啟和斷電重啟條件是否成立,當(dāng)帶電重啟條件成立時,控制處理器帶電重啟,當(dāng)斷電重啟條件成立時,控制處理器斷電重啟。
斷電重啟過程:MCU向處理器發(fā)送正常關(guān)機信號;處理器在接收到正常關(guān)機信號后,按照正常關(guān)閉程序的邏輯關(guān)閉所有正在運行的程序;MCU監(jiān)測處理器是否已經(jīng)完全關(guān)閉所有程序,當(dāng)處理器完全關(guān)閉所有程序時,MCU控制處理器中的各個電路按照預(yù)設(shè)的斷電時序依次斷電;在各個電路全部斷電完畢后,MCU進一步控制處理器中的各個電路按照預(yù)設(shè)的上電時序依次上電啟動,在各個電路全部上電啟動完畢后,MCU向處理器發(fā)送啟動系統(tǒng)信號,處理器在接收到啟動系統(tǒng)信號后,啟動系統(tǒng)程序。
MCU通過其內(nèi)置的可配置看門狗監(jiān)測處理器執(zhí)行的應(yīng)用程序是否正常運行,若因應(yīng)用程序陷入死循環(huán)而導(dǎo)致處理器超時未向MCU發(fā)送喂狗信號,則MCU向處理器傳送復(fù)位信號,可避免處理器所執(zhí)行的應(yīng)用程序長時間陷入死循環(huán)。
4? 應(yīng)用案例
本文提出一種可在X86系統(tǒng)啟動過程中迅速定位X86系統(tǒng)故障的處理器監(jiān)控方法,在一款軌道交通整機上進行應(yīng)用。軌道交通整機的功能框圖如圖5所示。
在本文提出的系統(tǒng)中,MCU芯片使用NXP的LPC1823,其先于X86處理器N2600運行,其主要功能如下:通過A/D獲取環(huán)境溫度,當(dāng)按電源開關(guān)開機時,如果溫度過低,則通過DIO控制加熱模塊按預(yù)設(shè)的策略進行加熱,到達設(shè)定溫度時,停止加熱,從而實現(xiàn)了低溫擴展;會對上電時序和掉電時序進行控制,并且在出錯時,會嘗試對整個X86系統(tǒng)進行斷電重啟,如果還是出錯,則給出對應(yīng)的報警提示。
MCU通過光感應(yīng)器件讀取環(huán)境的亮度,然后按預(yù)設(shè)策略對LVDS屏的亮度進行自動或手動的調(diào)節(jié);與X86上擴出的串口COM4進行通信連接,X86通過串口對MCU進行控制策略的設(shè)置和更新。
5? 結(jié)? 論
在本文設(shè)計的監(jiān)控系統(tǒng)中,MCU先于X86系統(tǒng)啟動,并控制X86系統(tǒng)的上電啟動,MCU控制X86系統(tǒng)中的各個電路嚴(yán)格按照預(yù)設(shè)的上電和掉電時序進行上電開機和關(guān)機掉電動作,并控制前一個電路正常后,再控制后一個電路,若監(jiān)測到任意一個電路異常,則向報警電路發(fā)送與該電路對應(yīng)的異常信號,使得報警電路可發(fā)出與該電路對應(yīng)的異常報警,因此可在X86處理器啟動過程中迅速定位出發(fā)生異常的電路,從而找出故障發(fā)生的原因,同時還可以啟動基于MCU的看門狗對整個X86系統(tǒng)進行完整的復(fù)位,然后在X86系統(tǒng)的運行中對運行的環(huán)境進行檢測,并給出反饋,進而保證了X86系統(tǒng)的可靠運行,降低了X86的開銷。
參考文獻:
[1] 王錄恩.多處理器系統(tǒng)監(jiān)控的研究與設(shè)計 [D].合肥:中國科學(xué)技術(shù)大學(xué),2011.
[2] 陳客松,龐曉鳳,張徐亮,等.《微處理器系統(tǒng)結(jié)構(gòu)與嵌入式系統(tǒng)設(shè)計》課程的教學(xué)設(shè)計研究 [J].實驗科學(xué)與技術(shù),2013,11(4):214-216.
[3] 劉強,高振海,趙齊,等.海量分布式微處理器監(jiān)控系統(tǒng)可靠性研究 [J].電子世界,2013(11):88-90.
[4] 王彬,李文新,李得天,等.通過看門狗軟件設(shè)計提高抗干擾能力的方法 [J].計算機技術(shù)與發(fā)展,2012,22(10):188-190.
[5] 胡屏,柏軍.單片機應(yīng)用系統(tǒng)中的看門狗技術(shù) [J].吉林大學(xué)學(xué)報(信息科學(xué)版),2003(2):205-208.
作者簡介:李楊(1987.02-),女,漢族,廣東深圳人,工程師,研究生,研究方向:電子信息。