陳洪雁,張大偉,萬俊偉,齊宏為
(北京跟蹤與通信技術(shù)研究所,北京100094)
空間目標(biāo)監(jiān)測站的主要任務(wù)是利用各類設(shè)備采集、處理、傳輸空間目標(biāo)識別監(jiān)測數(shù)據(jù),并保證系統(tǒng)設(shè)備長期連續(xù)穩(wěn)定運(yùn)行。監(jiān)測站采集和管理的數(shù)據(jù)包括軌道及態(tài)勢數(shù)據(jù)、支持?jǐn)?shù)據(jù)(地球自轉(zhuǎn)、太陽輻射、地磁指數(shù)、事件分析)、已發(fā)生數(shù)據(jù)(發(fā)射、隕落、碰撞、解體)、未來數(shù)據(jù)(碰撞預(yù)警、隕落預(yù)報)等數(shù)據(jù),以及原子鐘、衛(wèi)通系統(tǒng)等設(shè)備工況數(shù)據(jù)。隨著我國航天事業(yè)的穩(wěn)步發(fā)展,空間目標(biāo)探測與識別試驗系統(tǒng)的信息數(shù)據(jù)獲取、處理能力的逐步提升,系統(tǒng)將逐步形成實用化的空間目標(biāo)監(jiān)視信息支持能力,監(jiān)測站的數(shù)據(jù)質(zhì)量是空間目標(biāo)探測與識別試驗系統(tǒng)整體性能、服務(wù)水平、設(shè)計指標(biāo)的最直接、最準(zhǔn)確的體現(xiàn)。由于各種原因,監(jiān)測站觀測數(shù)據(jù)的管理和深度應(yīng)用方面還存在一些問題,需要研究解決。
目前,監(jiān)測站實時接收空間目標(biāo)探測與識別數(shù)據(jù),每天產(chǎn)生幾十萬行的數(shù)據(jù)記錄,數(shù)據(jù)量達(dá)到了幾十吉比特,相應(yīng)每年產(chǎn)生它比特量級的數(shù)據(jù),而且隨著空間目標(biāo)探測與識別試驗信息系統(tǒng)的發(fā)展建設(shè),空間目標(biāo)數(shù)目不斷增多,每年產(chǎn)生的觀測數(shù)據(jù)還在成倍增加。當(dāng)前采用計算機(jī)單機(jī)采集、編目、短期硬盤存儲、長期光盤刻錄的方式管理數(shù)據(jù),對某個特征數(shù)據(jù)的長期變化(一年或者幾年)進(jìn)行分析,需要讀取光盤和解壓、解幀每天的原始觀測數(shù)據(jù),才能進(jìn)行相應(yīng)的數(shù)據(jù)分析,耗時費力,效率低下。此外,光盤的損壞、丟失都給數(shù)據(jù)的安全性帶來很大的隱患,不利用數(shù)據(jù)的長期存儲管理。
監(jiān)測站各類數(shù)據(jù)主要用以完成實時原始觀測數(shù)據(jù)采集成功率、衛(wèi)通數(shù)據(jù)發(fā)送成功率、測量數(shù)據(jù)一致性和合理性、軌道及態(tài)勢數(shù)據(jù)等基礎(chǔ)數(shù)據(jù),偽距測量精度分析、載波周跳分析、測量值的單雙差分析等簡單數(shù)據(jù)處理,監(jiān)測站各類數(shù)據(jù)互相獨立,缺乏橫向之間的相關(guān)關(guān)系分析,目前還沒有有效手段來深入挖掘海量觀測數(shù)據(jù)中蘊(yùn)藏的有效信息,對更長周期的監(jiān)測站參數(shù)指標(biāo)的分析處理比較困難,無法為系統(tǒng)狀態(tài)評測、故障預(yù)判和性能分析提供支持。
目前,在空間目標(biāo)識別試驗信息領(lǐng)域,關(guān)注于用戶層面的服務(wù)性能監(jiān)測與評估研究較多,關(guān)注于監(jiān)測站日常運(yùn)行管理研究不多,監(jiān)測站運(yùn)行管理存在著重事后監(jiān)測、輕事前預(yù)警的問題。特別是從監(jiān)測站觀測數(shù)據(jù)層面分析系統(tǒng)性能,運(yùn)用大數(shù)據(jù)技術(shù)對監(jiān)測站觀測數(shù)據(jù)進(jìn)行深入分析挖掘,建立平臺進(jìn)行管理、分析、評估的研究不多。同時綜合運(yùn)用多個監(jiān)測站數(shù)據(jù)、差分增強(qiáng)改正數(shù)據(jù)、用戶終端數(shù)據(jù)等多維導(dǎo)航數(shù)據(jù),挖掘監(jiān)測站與用戶端數(shù)據(jù)的閉環(huán)結(jié)構(gòu)關(guān)系,研究探索多維數(shù)據(jù)相關(guān)性與影響規(guī)律,這類研究目前較少。
鑒于上述現(xiàn)實問題,有必要建立一個管理系統(tǒng),將系統(tǒng)運(yùn)行管理與日常監(jiān)測評估有機(jī)結(jié)合,促成分析趨勢、預(yù)報問題、及時處理的良性互動,實現(xiàn)運(yùn)行與服務(wù)的深度耦合。完成對監(jiān)測站數(shù)據(jù)的采集、傳輸、存儲、管理、實時分析、顯示和預(yù)警、告警,實現(xiàn)數(shù)據(jù)的高效安全管理。利用各監(jiān)測站觀測數(shù)據(jù),分析挖掘系統(tǒng)及設(shè)備運(yùn)行狀態(tài)和規(guī)律,查找隱患,提供監(jiān)測站運(yùn)行狀態(tài)的預(yù)測評估,為監(jiān)測站、空間目標(biāo)識別試驗信息系統(tǒng)的穩(wěn)定運(yùn)行、評估預(yù)警提供數(shù)據(jù)支持。
按照數(shù)據(jù)從采集到使用的先后順序,從左至右流動,分為數(shù)據(jù)源、數(shù)據(jù)管理、數(shù)據(jù)挖掘、質(zhì)量評估和數(shù)據(jù)訪問??蚣芙Y(jié)構(gòu)如圖1 所示。數(shù)據(jù)源從監(jiān)測站和用戶終端獲取數(shù)據(jù),通過數(shù)據(jù)解幀軟件得到原始觀測數(shù)據(jù),并將數(shù)據(jù)存儲到管理分系統(tǒng)中,經(jīng)過數(shù)據(jù)挖掘?qū)ΡO(jiān)測站和用戶終端數(shù)據(jù)進(jìn)行全量分析,得出各測量值和工況信息之間的相互關(guān)系,建立監(jiān)測站系統(tǒng)狀態(tài)和用戶機(jī)定位性能的評估模型,真實客觀地反映監(jiān)測站和系統(tǒng)服務(wù)性能的變化。
監(jiān)測站數(shù)據(jù)包括監(jiān)測接收機(jī)接收的多通道偽距測量值、多通道載波相位觀測值、多通道載噪比觀測值、多頻點多普勒觀測值和干擾電平監(jiān)測值、軌道及態(tài)勢數(shù)據(jù)、氣象數(shù)據(jù)等觀測數(shù)據(jù),空間目標(biāo)識別系統(tǒng)、網(wǎng)絡(luò)通信、原子鐘系統(tǒng)等設(shè)備工況數(shù)據(jù),數(shù)據(jù)預(yù)處理等數(shù)據(jù)。用戶機(jī)數(shù)據(jù)包括偽距值、星歷、環(huán)路鎖定、差分改正信息、定位結(jié)果、定位成功率等信息。
將數(shù)據(jù)進(jìn)行存儲之前首先對采集到的數(shù)據(jù)進(jìn)行預(yù)處理,按照粗差理論、數(shù)據(jù)特性先驗信息、數(shù)據(jù)處理要求對數(shù)據(jù)進(jìn)行粗差剔除,清除無效數(shù)據(jù)。同時對原始數(shù)據(jù)合理性、多路數(shù)據(jù)一致性、目標(biāo)信號完好性進(jìn)行檢驗。將預(yù)處理后的觀測數(shù)據(jù)存入HBase 非關(guān)系數(shù)據(jù)庫中,代替使用光盤保存數(shù)據(jù)的模式,提升數(shù)據(jù)存儲和讀寫效率,實現(xiàn)大規(guī)模數(shù)據(jù)的隨機(jī)實時訪問。
使用R 語言結(jié)合Hadoop 平臺對監(jiān)測站和用戶機(jī)數(shù)據(jù)進(jìn)行挖掘,發(fā)現(xiàn)各類觀測數(shù)據(jù)之間的隱藏關(guān)系,如載噪比和偽距測量精度、軌道角度和偽距測量精度、多普勒值和載波相位等之間的關(guān)聯(lián)關(guān)系,探索監(jiān)測站周圍電磁環(huán)境的變化對測量數(shù)據(jù)精度的影響等。
根據(jù)故障案例的特征數(shù)據(jù)建立模型,對監(jiān)測站運(yùn)行狀態(tài)進(jìn)行評估預(yù)警。根據(jù)特定業(yè)務(wù)需求,采用圖表結(jié)合的方式生成相關(guān)數(shù)據(jù)分析結(jié)果,方便查詢統(tǒng)計分析。
圖1 系統(tǒng)總體結(jié)構(gòu)示意圖
監(jiān)測站生成的海量數(shù)據(jù)的存儲管理和分析處理,需要可擴(kuò)展性強(qiáng)、易于維護(hù)、具有可伸縮、計算處理能力強(qiáng)大的平臺來實現(xiàn)。根據(jù)業(yè)務(wù)數(shù)據(jù)處理的需求選擇Hadoop 大數(shù)據(jù)處理平臺搭建,滿足業(yè)務(wù)數(shù)據(jù)對安全容錯性、數(shù)據(jù)量可擴(kuò)展、高效讀寫的需求,同時在HDFS 分布式文件存儲系統(tǒng)之上建立HBase 非關(guān)系數(shù)據(jù)庫,不但具有HDFS 的優(yōu)點,可以實現(xiàn)對業(yè)務(wù)數(shù)據(jù)的實時隨機(jī)讀寫訪問,而且使得數(shù)據(jù)統(tǒng)計處理變得非常簡單。監(jiān)測站大數(shù)據(jù)平臺網(wǎng)絡(luò)拓?fù)淙鐖D2 所示。
圖2 數(shù)據(jù)管理平臺網(wǎng)絡(luò)拓?fù)鋱D
在滿足早期監(jiān)測站數(shù)據(jù)存儲要求的基礎(chǔ)上,考慮到監(jiān)測站的年度數(shù)據(jù)在TB 量級,集群在不增加節(jié)點的情況下滿足未來3 年的需求,選用HDFS 的默認(rèn)備份策略(即副本數(shù)為3),經(jīng)過計算集群的初始存儲能力至少為120 TB。基于此并考慮Hadoop 的計算需求,綜合成本因素,硬件構(gòu)成如下:6 臺PC 服務(wù)器(內(nèi)存:256 GB,硬盤:20 TB),其中包括1 臺NameNode節(jié)點、1 臺SecondaryNameNode 節(jié)點(與1 臺從節(jié)點合并使用)、5 臺從節(jié)點,集群存儲能力達(dá)到120 TB,滿足項目數(shù)據(jù)處理的需求,并且可以根據(jù)需要動態(tài)擴(kuò)展。選用萬兆交換機(jī)以滿足集群對網(wǎng)絡(luò)帶寬性能的要求。
數(shù)據(jù)庫軟件選型方面,采用NoSQL 數(shù)據(jù)庫進(jìn)行數(shù)據(jù)存儲,數(shù)據(jù)庫模型采用面向列存儲的HBase 數(shù)據(jù)模型,數(shù)據(jù)是按列存儲的,方便存儲結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù),方便數(shù)據(jù)壓縮,對針對某一列或者某幾列的查詢有非常大的I/O 優(yōu)勢。而這些特點,正好滿足對監(jiān)測站某些特征數(shù)據(jù)的長期分析研究需求。數(shù)據(jù)庫設(shè)計方面,根據(jù)監(jiān)測站設(shè)備和類型作用劃分存儲不同的數(shù)據(jù)表,存儲不同類型和設(shè)備的數(shù)據(jù),主要有:監(jiān)測接收機(jī)原始觀測數(shù)據(jù)表、數(shù)據(jù)預(yù)處理打包數(shù)據(jù)表、衛(wèi)通天線跟蹤數(shù)據(jù)表、衛(wèi)通接收電平數(shù)據(jù)表、衛(wèi)通基帶數(shù)據(jù)表、氣象觀測數(shù)據(jù)等表。
數(shù)據(jù)分析挖掘設(shè)計主要由以下6 個功能模塊構(gòu)成:載波相位周跳探測評估模塊、數(shù)據(jù)質(zhì)量綜合分析模塊、多路徑效應(yīng)評估模塊、電離層監(jiān)測分析評估模塊、衛(wèi)星軌道外推性能評估模塊、監(jiān)測接收機(jī)完好性監(jiān)測模塊,如圖3 所示。
圖3 數(shù)據(jù)分析挖掘功能模塊
載波相位周跳探測評估模塊功能是精確探測統(tǒng)計監(jiān)測接收機(jī)載波相位觀測數(shù)據(jù)的周跳,并評估接收機(jī)載波相位周跳探測的性能。由于監(jiān)測接收機(jī)處于靜態(tài),采用多項式擬合法比較合適。
數(shù)據(jù)質(zhì)量綜合分析模塊功能是根據(jù)數(shù)據(jù)質(zhì)量分析理論,建立監(jiān)測站導(dǎo)航信號質(zhì)量分析標(biāo)準(zhǔn)模型,綜合分析和統(tǒng)計觀測數(shù)據(jù)質(zhì)量。對偽距觀測數(shù)據(jù)、相位觀測數(shù)據(jù)進(jìn)行單差、雙差組合分析,提取其變化信息,對衛(wèi)星測距信號、載波相位信號質(zhì)量及監(jiān)測接收機(jī)工作穩(wěn)定性進(jìn)行評估。
多路徑效應(yīng)評估模塊功能是利用載波相位數(shù)據(jù)、偽距觀測數(shù)據(jù),進(jìn)行線性組合,提取偽距觀測數(shù)據(jù)上的多路徑變化量,并用載波相位平滑偽距;最后根據(jù)多路徑效應(yīng)的特性,對監(jiān)測站觀測環(huán)境和接收機(jī)抗多路徑效應(yīng)能力進(jìn)行評估。
電離層監(jiān)測分析評估模塊功能是利用雙頻觀測數(shù)據(jù)解算電離層的時間序列,評估多頻數(shù)據(jù)對電離層監(jiān)測能力的穩(wěn)定性,并評估監(jiān)測電離層對測距質(zhì)量的影響。
目標(biāo)軌道外推性能評估模塊功能是根據(jù)目標(biāo)星歷計算評估精確動力學(xué)模型外推目標(biāo)軌道技術(shù),主要評估隨著外推時間延長帶來的誤差積累影響。
監(jiān)測接收機(jī)完好性監(jiān)測模塊功能是利用接收機(jī)自身的冗余觀測量進(jìn)行衛(wèi)星故障的檢測識別。它無需外部設(shè)備的輔助,花費較低,容易實現(xiàn),是目前應(yīng)用較為廣泛的一種完好性監(jiān)測方法。主要通過偽距偏差值的計算進(jìn)行一致性校驗。
根據(jù)監(jiān)測站獲取大量觀測數(shù)據(jù),研究業(yè)務(wù)數(shù)據(jù)評估分析模型,通過對各類數(shù)據(jù)的分析挖掘,尋找各類參數(shù)指標(biāo)之間的相關(guān)關(guān)系,分析和提取系統(tǒng)運(yùn)行的趨勢和規(guī)律,實現(xiàn)系統(tǒng)設(shè)備狀態(tài)預(yù)測和預(yù)警評估。采用觀測數(shù)據(jù)測量質(zhì)量分析、多頻觀測數(shù)據(jù)電離層分析、多路徑檢測與分析、載波相位周跳探測與修復(fù),以及導(dǎo)航信號載噪比、多路徑分析值和偽距測量值的精度、載波相位周跳等測量值的關(guān)聯(lián)關(guān)系等分析方法和手段,通過長周期的數(shù)據(jù)分析挖掘和對故障案例的參數(shù)分析比對建立監(jiān)測站運(yùn)行模型,為監(jiān)測站系統(tǒng)預(yù)警評估提供數(shù)據(jù)支撐。
系統(tǒng)故障告警主要從系統(tǒng)綜合狀態(tài)顯示、分系統(tǒng)詳細(xì)狀態(tài)實時監(jiān)測、性能指標(biāo)實時監(jiān)測、導(dǎo)航信號實時監(jiān)測、衛(wèi)星軌道預(yù)報顯示、告警門限設(shè)計等方面來實現(xiàn)。同時建立系統(tǒng)典型故障庫,對可能出現(xiàn)的故障部位和節(jié)點建立邏輯樹關(guān)系,分析其中的相互關(guān)系,從實時指標(biāo)變化推斷系統(tǒng)設(shè)備運(yùn)行狀態(tài)和健康狀況、從分系統(tǒng)綜合狀態(tài)預(yù)判系統(tǒng)可能出現(xiàn)故障的部位,根據(jù)可能出現(xiàn)的故障提前進(jìn)行維護(hù)維修或者更換備件,制定預(yù)案,從而提前預(yù)判設(shè)備故障,提前進(jìn)行預(yù)警,實現(xiàn)主動受控式的預(yù)警功能。
另外,可利用用戶端接收信號的質(zhì)量、定位精度等來反推監(jiān)測站運(yùn)行狀態(tài),建立從系統(tǒng)到用戶的閉環(huán)結(jié)構(gòu),打通系統(tǒng)設(shè)備狀態(tài)和性能影響的雙向反饋鏈路,從系統(tǒng)數(shù)據(jù)和用戶數(shù)據(jù)兩個維度,相互驗證,達(dá)到預(yù)警評估的目的,提升監(jiān)測站的運(yùn)維管理質(zhì)量和效率。
該部分主要研究融合監(jiān)測站系統(tǒng)運(yùn)維數(shù)據(jù)和用戶端定位數(shù)據(jù),建立監(jiān)測站、差分增強(qiáng)接收終端、用戶接收終端間的網(wǎng)絡(luò)閉環(huán)結(jié)構(gòu)。在監(jiān)測站數(shù)據(jù)管理平臺的基礎(chǔ)上,建立差分增強(qiáng)數(shù)據(jù)接收子系統(tǒng)和用戶接收終端數(shù)據(jù)處理子系統(tǒng)。利用大數(shù)據(jù)技術(shù)融合分析并研究探索監(jiān)測站、差分增強(qiáng)改正、用戶接收終端數(shù)據(jù)等多個維度數(shù)據(jù)間的影響與規(guī)律。
本文設(shè)計實現(xiàn)監(jiān)測站數(shù)據(jù)管理系統(tǒng),改變了使用光盤刻錄保存數(shù)據(jù)的落后模式。同時深入分析挖掘海量導(dǎo)航數(shù)據(jù)中蘊(yùn)藏的有效信息,分析監(jiān)測站各項數(shù)據(jù)間的相關(guān)性與耦合性,研發(fā)觀測數(shù)據(jù)分析和評估模型,實現(xiàn)了監(jiān)測站數(shù)據(jù)質(zhì)量實時分析評估,為系統(tǒng)狀態(tài)判斷提供有效判斷依據(jù)。研究探索空間目標(biāo)探測與識別試驗系統(tǒng)監(jiān)測站業(yè)務(wù)運(yùn)維模型,建設(shè)主動受控式設(shè)備預(yù)測分析與故障預(yù)警系統(tǒng),實時監(jiān)測系統(tǒng)的整體運(yùn)行狀態(tài)和性能,改變傳統(tǒng)“救火式”的被動工作方式,變事后應(yīng)急搶修為事前分析預(yù)測,最大限度避免系統(tǒng)重大故障發(fā)生,大幅提升監(jiān)測的運(yùn)維管理質(zhì)量和效率。本項目可用于單個監(jiān)測站,也可聯(lián)合多站數(shù)據(jù)、差分增強(qiáng)改正數(shù)據(jù)、用戶終端數(shù)據(jù),實現(xiàn)從大系統(tǒng)到用戶端閉環(huán)結(jié)構(gòu)所有數(shù)據(jù)的分析挖掘,為空間目標(biāo)探測與識別試驗系統(tǒng)服務(wù)性能提升提供可靠的綜合處理平臺?!?/p>