楊耀森,李 博*,孟 浩,馮小琴
(1.中北大學(xué)儀器科學(xué)與動(dòng)態(tài)測(cè)試教育部重點(diǎn)實(shí)驗(yàn)室,太原 030051;2.北方自動(dòng)控制技術(shù)研究所,太原 030006)
飛行試驗(yàn)是航空產(chǎn)品開(kāi)發(fā)過(guò)程中的一個(gè)重要步驟,隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,飛行試驗(yàn)中的測(cè)試設(shè)備和測(cè)驗(yàn)參數(shù)越來(lái)越多。美國(guó)的飛行試驗(yàn)技術(shù)和設(shè)備在全球處于領(lǐng)先地位,規(guī)模最大,在航空航天局空軍部均設(shè)有飛行試驗(yàn)研究基地。美國(guó)空軍試飛中心近年投入使用的飛行試驗(yàn)測(cè)試系統(tǒng)共有18 套機(jī)載系統(tǒng)和5 套地面系統(tǒng),具有高速處理數(shù)據(jù)的能力;還配有綜合飛行數(shù)據(jù)處理系統(tǒng)(IFDAPS),擁有超高清圖像的實(shí)時(shí)處理分析能力,支持洲際飛行作業(yè)[1]。
我國(guó)也早在20 世紀(jì)50 年代就開(kāi)始建設(shè)飛機(jī)飛行試驗(yàn)研究中心,并具有一定水平和規(guī)模。嫦娥一號(hào)衛(wèi)星的記錄器的數(shù)據(jù)存儲(chǔ)容量高達(dá)48 Gbits,還具有數(shù)據(jù)動(dòng)態(tài)分區(qū)存儲(chǔ)、圖像數(shù)據(jù)壓縮及存儲(chǔ)區(qū)自檢等功能;中北大學(xué)在遙測(cè)記錄器和測(cè)試裝置的研究上處于國(guó)內(nèi)較為領(lǐng)先的地位,采取高性能FPGA 架構(gòu),實(shí)現(xiàn)模數(shù)一體的線性存儲(chǔ)技術(shù);北京航天斯達(dá)技術(shù)設(shè)備公司研制的數(shù)據(jù)采集記錄器各通道相互獨(dú)立,不會(huì)因?yàn)槟骋煌ǖ赖墓收嫌绊懫渌ǖ?,體積小,可靠性高[2]。
但是,隨著圖像信息量的急劇上升以及外圍器件的增多,使用FPGA 實(shí)現(xiàn)復(fù)雜的圖像算法以及精準(zhǔn)的設(shè)備控制能力顯然不太可能,而老式NAND 的512 B 小頁(yè)、2 kB 大頁(yè)也限制了容量的提升,嚴(yán)重影響了飛行器的采集時(shí)間。所以本文將基于多核架構(gòu)VPM6467 平臺(tái)設(shè)計(jì),在重點(diǎn)突破H.264 裸機(jī)難關(guān)的同時(shí),優(yōu)化硬件接口,匹配8 k 頁(yè)容量,更新存儲(chǔ)管理模式,旨在設(shè)計(jì)出一種大容量、高速率的遙測(cè)記錄器,賦予飛行器超遠(yuǎn)距離采集能力。
多核架構(gòu)領(lǐng)域的發(fā)展主要以SOC(System on Chip,片上系統(tǒng))為主,其中ARM 提供控制處理能力,DSP 提供計(jì)算能力,F(xiàn)PGA 提供并行處理能力[3],因此,遙測(cè)記錄器要適應(yīng)多樣化的采集條件,向多核架構(gòu)轉(zhuǎn)變實(shí)屬必要。多核架構(gòu)的開(kāi)發(fā)模式多以linux 為主,其開(kāi)發(fā)工作主要集中在平臺(tái)移植,然而實(shí)際遙測(cè)環(huán)境中存在沖擊、震動(dòng)等惡劣因素,故而選用最合適也最為安全的裸機(jī)開(kāi)發(fā)方法,但是裸機(jī)開(kāi)發(fā)模式下實(shí)現(xiàn)H.264 圖像壓縮算法又將帶來(lái)新的難題[4],如圖1 所示,故本文的重點(diǎn)工作就是解決這些難題并對(duì)平臺(tái)進(jìn)行優(yōu)化。
圖1 待解決問(wèn)題
多核SOC 最難避免也是最直接的一個(gè)問(wèn)題就是接口問(wèn)題,包括DSP 與ARM 的通信問(wèn)題、FPGA與DSP 的接口選擇問(wèn)題等等,前者的最佳解決方案是利用達(dá)芬奇架構(gòu),采用融合DSP 與ARM 核的DSP 芯片來(lái)實(shí)現(xiàn)。后者經(jīng)過(guò)多年的發(fā)展,解決方案根據(jù)不同的情形有多種的選擇,如圖2 所示。
圖2 DSP-FPGA 接口
由于本系統(tǒng)需要FPGA 實(shí)時(shí)傳遞解析后的圖像數(shù)據(jù),數(shù)據(jù)量較大,所以接口選擇EMIF(External Memory Interface),并采用異步傳輸模式。FPGA 端編寫(xiě)一個(gè)雙口RAM 作為DSP 的外部SRAM,流程如圖3 所示。
圖3 接口操作流程
本記錄器設(shè)計(jì)階段有3 種存儲(chǔ)參考:一為插拔式SD 卡存儲(chǔ),二為eMMC 存儲(chǔ)陣列,三為NAND FLASH 集成芯片[5],如圖4 所示。考慮到實(shí)際作業(yè)環(huán)境,震動(dòng)沖擊等因素不允許SD 卡這種不固定結(jié)構(gòu),而eMMC 體積較大,高容量的芯片成本又太高,所以本文最終采用型號(hào)為MT29F128G 的工業(yè)級(jí)NAND FLASH,而這種大容量芯片帶來(lái)的難題就是需要設(shè)計(jì)專(zhuān)用的存儲(chǔ)管理方法。
圖4 存儲(chǔ)選型
在傳統(tǒng)的壞塊管理方案中,塊屬性信息僅在每塊的空余區(qū)和存儲(chǔ)控制CPU 的緩存中記錄,當(dāng)NAND FLASH 達(dá)到最大使用壽命而出現(xiàn)壞塊時(shí),繼續(xù)對(duì)壞塊操作無(wú)法保證數(shù)據(jù)的準(zhǔn)確性與安全性。CPU 緩沖中數(shù)據(jù)掉電丟失,再次上電還需掃描空余區(qū)重建塊屬性信息。因此,用空余區(qū)標(biāo)記的方式對(duì)使用壞塊進(jìn)行標(biāo)記可能出現(xiàn)標(biāo)記失敗,無(wú)法正確識(shí)別壞塊。所以本文采用一種應(yīng)用于星載存儲(chǔ)器的獨(dú)立存儲(chǔ)壞塊信息的方式[6],在NAND 中構(gòu)建一塊壞塊信息管理專(zhuān)屬區(qū),主要解決信息存儲(chǔ)失敗或故障掉電引起的壞塊信息更新不完全問(wèn)題。
圖5 NAND 管理流程圖
遙測(cè)采集作業(yè)中,除了對(duì)硬件系統(tǒng)要求必須達(dá)到工業(yè)級(jí)別外,對(duì)軟件的設(shè)計(jì)也有一定的限制:遙測(cè)記錄器無(wú)法與地面基站實(shí)時(shí)通信,采集過(guò)程中不允許發(fā)生類(lèi)似windows 系統(tǒng)的未響應(yīng)錯(cuò)誤,所以軟件編程必須嚴(yán)謹(jǐn)有效,采用循環(huán)加中斷的裸機(jī)開(kāi)發(fā)。而相對(duì)地面上傳則沒(méi)有太多要求,可以搭建linux 系統(tǒng)來(lái)進(jìn)行傳輸,因?yàn)槠洳粌H能提供完善的網(wǎng)絡(luò)層傳輸協(xié)議,而且附帶的測(cè)試工具以及調(diào)試模式都會(huì)加快系統(tǒng)的開(kāi)發(fā)周期[7]。
圖6 軟件分區(qū)圖
裸機(jī)模式下的H264 編碼存儲(chǔ)是本系統(tǒng)的關(guān)鍵工作,本文軟件編寫(xiě)在windows 系統(tǒng)下的CCS3.3 中完成,通過(guò)XDS560PLUS 仿真器實(shí)時(shí)調(diào)試,編程端分為C6400PLUS_0 子端編程和ARM926_0 子端編程[8]。ARM 與DSP 共享4G 內(nèi)存空間(有部分內(nèi)存屬于各自獨(dú)有),雙核通信通過(guò)達(dá)芬奇特有的中斷結(jié)構(gòu)進(jìn)行:首先把數(shù)據(jù)放在兩方能夠訪問(wèn)的內(nèi)存上,然后給對(duì)方一個(gè)中斷,對(duì)方在中斷中接收傳遞過(guò)來(lái)的數(shù)據(jù),傳遞過(guò)程等待用函數(shù)wait_XXX_sync()實(shí)現(xiàn)。
本文重點(diǎn)實(shí)現(xiàn)H264 算法裸機(jī)編程,所以對(duì)ARM 啟動(dòng)流程不作詳細(xì)解釋?zhuān)鋯?dòng)流程需要注意的有:1)上電啟動(dòng)模式不能選擇NAND FLASH,因?yàn)橐鎯?chǔ)機(jī)載采集數(shù)據(jù),所以本文選擇NOR FLASH這種讀取數(shù)據(jù)快的XIP 存儲(chǔ)芯片[9]。2)啟動(dòng)分為兩個(gè)階段:第1 階段用匯編編寫(xiě),完成簡(jiǎn)單的系統(tǒng)初始化并引導(dǎo)第2 階段啟動(dòng);第2 階段用C 語(yǔ)言編寫(xiě),入口函數(shù)為C_int0(),初始化后進(jìn)入main 函數(shù),因此,需要根據(jù)具體內(nèi)存空間構(gòu)造映射表。3)ARM核啟動(dòng)后,DSP 核處于睡眠狀態(tài),需要設(shè)置PSC 啟動(dòng),DSP 啟動(dòng)后開(kāi)始進(jìn)行main 中大循環(huán)。
H264 裸機(jī)編碼需要在DSP 啟動(dòng)后先進(jìn)行必要的初始化[10]:EnableEmifAcaching()使能EMIFA 接口;InitDavinciCache()初始化達(dá)芬奇架構(gòu)數(shù)據(jù)通道;Setup up RMAN()建立通用資源管理器;edma_request()建立DMA 通道。在初始化完畢之后通知ARM 端,當(dāng)ARM 處理好一幀數(shù)據(jù),通過(guò)Codec Engine 將待編碼幀的圖像參數(shù)傳入,ARM 進(jìn)入等待狀態(tài),DSP 端開(kāi)始編碼,編碼框架移植X264 開(kāi)源庫(kù),如圖7 所示。
圖7 X264 編碼框架
對(duì)多核架構(gòu)產(chǎn)生的問(wèn)題提出有效的解決方案,并搭建硬件框圖如圖8 所示。電路供電分為機(jī)上供電與地面供電,有效的隔離可以避免電源問(wèn)題的干擾,本系統(tǒng)采用繼電器隔斷;接口模塊負(fù)責(zé)LVTTL的電平轉(zhuǎn)換,保證數(shù)據(jù)的準(zhǔn)確性;FPGA 負(fù)責(zé)幀數(shù)據(jù)的接收,進(jìn)行壓縮前文件的預(yù)處理;VSC8641 是一款自適應(yīng)PHY 網(wǎng)卡芯片,MAC 層集成在DSP 內(nèi)部,本系統(tǒng)基于千兆傳輸模式,需要手動(dòng)調(diào)節(jié)計(jì)算機(jī)端為千兆狀態(tài)。
圖8 硬件框圖
對(duì)DSP 的EMIFA 接口使用EDMA 方式傳輸數(shù)據(jù):DSP 寫(xiě),即FPGA 讀,在FPGA 中檢測(cè)AWE 下降沿且CE 為低時(shí),讀數(shù)據(jù)總線即可;DSP 讀,即FPGA寫(xiě),在FPGA 中當(dāng)AOE 和CE 均為低時(shí),寫(xiě)數(shù)據(jù)總線即可。用示波器通道1 選CS3,通道2 為輸出使能信號(hào),得出圖9 測(cè)試圖,由圖可知一個(gè)周期為57.6 ns。
由圖9 可知,傳輸8 kB 的數(shù)據(jù)耗時(shí)235 us,速率為8 Kbytes/235 us=34 Mb/s,實(shí)驗(yàn)成功。
圖9 DSP-FPGA 傳輸波形
圖10 傳輸8 kB 數(shù)據(jù)
對(duì)系統(tǒng)進(jìn)行對(duì)比實(shí)驗(yàn)測(cè)試:舊式記錄器實(shí)驗(yàn)數(shù)據(jù)由飛行試驗(yàn)中心提供,采集時(shí)間為135 min,圖像數(shù)據(jù)量為4 063.3 MB,傳輸?shù)缴衔粰C(jī)耗時(shí)8 min。如圖11 所示。
圖11 上位機(jī)傳輸
對(duì)本系統(tǒng)進(jìn)行采集測(cè)試,采集數(shù)據(jù)傳輸至上位機(jī),配置對(duì)比見(jiàn)表1,對(duì)比數(shù)據(jù)見(jiàn)表2。
本文設(shè)計(jì)了一種可以實(shí)時(shí)壓縮PCM 圖像數(shù)據(jù)的遙測(cè)記錄器,先從該系統(tǒng)架構(gòu)帶來(lái)的問(wèn)題入手,接著從軟件編寫(xiě)以及硬件結(jié)構(gòu)介紹了設(shè)計(jì)過(guò)程,并提出一種裸機(jī)與系統(tǒng)共存的高效操作方式,最后進(jìn)行了接口與系統(tǒng)的整體測(cè)試,數(shù)據(jù)表明:該系統(tǒng)屬于高速數(shù)據(jù)傳輸系統(tǒng),DSP 與FPGA 的接口傳輸速度高達(dá)34 Mb/s,已經(jīng)超越當(dāng)前千兆網(wǎng)的實(shí)際傳輸速率;采用H264 壓縮圖像高效可行,壓縮比高達(dá)88倍,即在因存儲(chǔ)空間限制的1 d 飛行試驗(yàn)現(xiàn)在可以延長(zhǎng)到3 個(gè)月。
表1 新舊記錄器配置對(duì)比表
表2 遙測(cè)記錄器對(duì)比數(shù)據(jù)表