林超,李陽(yáng)陽(yáng),廖 勇,孔瑞遠(yuǎn),武文曦
(中國(guó)電子科學(xué)研究院,北京 100041)
?
綜 述
面向大數(shù)據(jù)的情報(bào)系統(tǒng)初探張
林超,李陽(yáng)陽(yáng),廖 勇,孔瑞遠(yuǎn),武文曦
(中國(guó)電子科學(xué)研究院,北京 100041)
大數(shù)據(jù)時(shí)代的到來(lái),必將引發(fā)軍事信息系統(tǒng)的重大變革,以數(shù)據(jù)為中心的情報(bào)系統(tǒng)將成為信息化戰(zhàn)爭(zhēng)的制勝關(guān)鍵。本文從大數(shù)據(jù)對(duì)現(xiàn)代戰(zhàn)爭(zhēng)的影響出發(fā),首先定義了情報(bào)系統(tǒng)的基本功能和作用。在功能需求的基礎(chǔ)上,結(jié)合大數(shù)據(jù)相關(guān)的新技術(shù),分析了情報(bào)系統(tǒng)面臨的新問(wèn)題,設(shè)計(jì)了以大數(shù)據(jù)為中心的情報(bào)系統(tǒng)框架和工作過(guò)程。根據(jù)情報(bào)系統(tǒng)和大數(shù)據(jù)技術(shù)的現(xiàn)狀,展望了大數(shù)據(jù)時(shí)代情報(bào)系統(tǒng)的發(fā)展趨勢(shì)。
大數(shù)據(jù);情報(bào)系統(tǒng);系統(tǒng)架構(gòu)
隨著傳感器技術(shù)、物聯(lián)網(wǎng)技術(shù)和移動(dòng)終端技術(shù)的發(fā)展,數(shù)據(jù)與信息在各個(gè)方面都呈爆發(fā)式增長(zhǎng),數(shù)據(jù)類別(Variety)多樣化、數(shù)據(jù)容積(Volume)海量化、數(shù)據(jù)價(jià)值(Value)增值化驅(qū)使各種社會(huì)服務(wù)開始對(duì)海量數(shù)據(jù)進(jìn)行分析和挖掘。同時(shí),云計(jì)算技術(shù)、并行處理技術(shù)和分布式架構(gòu)技術(shù)為數(shù)據(jù)處理速度(Velocity)迅捷化提供了技術(shù)基礎(chǔ)和支撐?;谝陨咸卣?,大數(shù)據(jù)概念正在推動(dòng)生活、工作和思維的大變革?!洞髷?shù)據(jù)時(shí)代》一書指出[1],在大數(shù)據(jù)時(shí)代,信息技術(shù)變革的重點(diǎn)應(yīng)該從技術(shù)轉(zhuǎn)向信息本身,放眼于全體數(shù)據(jù),接受不精確的非結(jié)構(gòu)化數(shù)據(jù),關(guān)注數(shù)據(jù)的關(guān)聯(lián)性。
現(xiàn)代戰(zhàn)爭(zhēng)已經(jīng)發(fā)展成為陸、海、空、天、電磁、網(wǎng)絡(luò)等多空間、全方位的立體化戰(zhàn)爭(zhēng),以使用信息化武器為標(biāo)志,形成了數(shù)字化部隊(duì)和以網(wǎng)絡(luò)為中心的作戰(zhàn)體系。在這種作戰(zhàn)體系下,制信息權(quán)成為決定戰(zhàn)爭(zhēng)勝負(fù)的關(guān)鍵,情報(bào)系統(tǒng)作為爭(zhēng)奪制信息權(quán)的核心,已成為現(xiàn)代戰(zhàn)爭(zhēng)的靈魂。情報(bào)是對(duì)利用偵察與監(jiān)視手段或其他方法收集來(lái)的數(shù)據(jù)和信息,進(jìn)行處理、綜合、分析、評(píng)價(jià)和解釋而得到的信息產(chǎn)品[2]。由情報(bào)的定義可以看出,數(shù)據(jù)和信息是情報(bào)的主體。大數(shù)據(jù)時(shí)代數(shù)據(jù)和信息環(huán)境的變化,要求情報(bào)服務(wù)的構(gòu)建以數(shù)據(jù)為中心,結(jié)合新的大數(shù)據(jù)相關(guān)技術(shù),為軍事行動(dòng)和作戰(zhàn)指揮提供更加科學(xué)、精確、及時(shí)、到位的決策依據(jù)。
情報(bào)系統(tǒng)是為實(shí)現(xiàn)情報(bào)搜集、加工、存儲(chǔ)、檢索和傳遞的系統(tǒng)。在大數(shù)據(jù)時(shí)代,龐大而復(fù)雜的數(shù)據(jù)考驗(yàn)著情報(bào)系統(tǒng)的技術(shù)體系結(jié)構(gòu)和數(shù)據(jù)處理能力;另一方面,信息化作戰(zhàn)的突發(fā)性和速?zèng)Q性對(duì)情報(bào)系統(tǒng)的實(shí)時(shí)、分布式分發(fā)能力提出了新的要求。為適應(yīng)大數(shù)據(jù)和信息化作戰(zhàn)的要求,我們將情報(bào)系統(tǒng)的功能分為核心層、業(yè)務(wù)層和支撐層三層(見圖1)。核心層進(jìn)行情報(bào)計(jì)劃和準(zhǔn)備,對(duì)業(yè)務(wù)層進(jìn)行指導(dǎo);業(yè)務(wù)層將情報(bào)活動(dòng)分為情報(bào)搜集、情報(bào)處理、情報(bào)分發(fā)等三大部分;支撐層是對(duì)情報(bào)活動(dòng)三個(gè)階段的具體化。
圖1 情報(bào)系統(tǒng)功能
1.1 核心層
情報(bào)系統(tǒng)的核心層功能就是從戰(zhàn)略、戰(zhàn)役、戰(zhàn)術(shù)層面為軍事行動(dòng)的指揮決策提供詳細(xì)的情報(bào)數(shù)據(jù)以及綜合性的和快速反應(yīng)的情報(bào)能力。無(wú)論是戰(zhàn)時(shí)還是平時(shí),只有依賴準(zhǔn)確、及時(shí)的情報(bào),才能做出正確、迅速的指揮和決策。在戰(zhàn)略層面,情報(bào)系統(tǒng)需要查明有關(guān)國(guó)家、地區(qū)、集團(tuán)的戰(zhàn)略方針、企圖、方向、部署、武裝力量數(shù)量、作戰(zhàn)指導(dǎo)思想、戰(zhàn)略措施、戰(zhàn)爭(zhēng)潛力等情況;在戰(zhàn)術(shù)和戰(zhàn)役層面,情報(bào)系統(tǒng)需要提供敵方企圖、行動(dòng)方向、戰(zhàn)斗編成、兵力部署、主要裝備、工事、障礙、作戰(zhàn)能力、作戰(zhàn)特點(diǎn)、指揮官、指揮機(jī)構(gòu)、通信樞紐以及作戰(zhàn)地區(qū)的地理、水文、氣象、社會(huì)等情況[2]。
1.2 業(yè)務(wù)層
收集、處理、發(fā)布是各種信息處理系統(tǒng)的基本流程,情報(bào)系統(tǒng)作為典型的以信息和數(shù)據(jù)為中心的系統(tǒng),對(duì)應(yīng)的需要支持情報(bào)搜集、情報(bào)分析與生產(chǎn)和情報(bào)分發(fā)等三項(xiàng)基本功能。情報(bào)搜集是基礎(chǔ),通過(guò)各種情報(bào)源獲得最初的情報(bào)數(shù)據(jù),這些數(shù)據(jù)有的可以作為直接的情報(bào)產(chǎn)品,有的則需要經(jīng)過(guò)進(jìn)一步處理;情報(bào)分析是靈魂,負(fù)責(zé)對(duì)情報(bào)搜集得到的信息和數(shù)據(jù)進(jìn)行處理,結(jié)構(gòu)化情報(bào)數(shù)據(jù),從其中挖掘出潛在的有用信息;情報(bào)分發(fā)是表現(xiàn),分發(fā)過(guò)程的及時(shí)性和針對(duì)性直接影響情報(bào)對(duì)指揮決策的輔助效果。
1.3 支撐層
情報(bào)系統(tǒng)的支撐層功能主要包括:
a)偵察監(jiān)視。這是獲取情報(bào)的手段,通過(guò)有時(shí)限的偵察和連續(xù)性的監(jiān)視可以獲得7種主要的情報(bào)類型:圖形情報(bào)、信號(hào)情報(bào)、測(cè)量和特征情報(bào)、人工情報(bào)、公開來(lái)源情報(bào)、技術(shù)情報(bào)和反情報(bào)。
b)信息挖掘。這是鏈接情報(bào)搜集和情報(bào)處理的重要功能,信息處理技術(shù)歷經(jīng)了人工分析階段、自動(dòng)化管理階段、智能化綜合處理階段等三個(gè)階段,已經(jīng)形成了各種手段綜合利用的現(xiàn)代化信息挖掘技術(shù)。
c)態(tài)勢(shì)生成。態(tài)勢(shì)生成時(shí)隨著可視化技術(shù)發(fā)展起來(lái)的情報(bào)的圖形化表達(dá),可以分為平時(shí)和戰(zhàn)時(shí)兩種類型,平時(shí)態(tài)勢(shì)主要包括戰(zhàn)略部署、武器裝備情況、軍事重點(diǎn)分布等,戰(zhàn)時(shí)態(tài)勢(shì)則進(jìn)一步包括戰(zhàn)場(chǎng)態(tài)勢(shì)涉及的兵力部署、敵方動(dòng)向、地理數(shù)據(jù)和氣象電磁信息等。
d)威脅預(yù)警。通過(guò)實(shí)力估計(jì)、預(yù)測(cè)敵方意圖、威脅識(shí)別、進(jìn)攻和防御分析等多方面的評(píng)估,情報(bào)系統(tǒng)需要實(shí)現(xiàn)及時(shí)、準(zhǔn)確的威脅預(yù)警功能。
e)戰(zhàn)場(chǎng)支援。通過(guò)情報(bào)系統(tǒng)的綜合運(yùn)轉(zhuǎn),在目標(biāo)引導(dǎo)、部隊(duì)部署、毀傷評(píng)估等方面為戰(zhàn)場(chǎng)提供支援。
f)效果評(píng)估。為推動(dòng)情報(bào)系統(tǒng)的發(fā)展和優(yōu)化的推動(dòng),需要在情報(bào)活動(dòng)的各個(gè)階段對(duì)其進(jìn)行評(píng)估,檢驗(yàn)情報(bào)工作的效果,確保用戶的情報(bào)需求得到充分滿足。
美國(guó)情報(bào)基礎(chǔ)理論歷經(jīng)了從情報(bào)周期(Intelligence Cycle)到情報(bào)流程(Intelligence Process)的轉(zhuǎn)變,從最初的情報(bào)環(huán)路到強(qiáng)調(diào)情報(bào)活動(dòng)之間的有機(jī)聯(lián)系,最終在2000年版的《聯(lián)合作戰(zhàn)情報(bào)支援條令》將情報(bào)流程定義為計(jì)劃與指導(dǎo)、搜集、處理與加工、分析與生產(chǎn)、分發(fā)與整合、評(píng)估與反饋[3]。實(shí)際構(gòu)建情報(bào)系統(tǒng)的過(guò)程中,計(jì)劃與評(píng)估需要相互關(guān)聯(lián);同時(shí),大數(shù)據(jù)時(shí)代帶來(lái)的海量信息對(duì)數(shù)據(jù)采集和存儲(chǔ)提出了新的要求;此外,由于情報(bào)的各個(gè)階段活動(dòng)趨向于分布式和網(wǎng)狀化,需要情報(bào)系統(tǒng)提供安全保障服務(wù)。綜合以上考慮,情報(bào)系統(tǒng)的體系架構(gòu)設(shè)計(jì)如圖2所示。
圖2 面向大數(shù)據(jù)的情報(bào)系統(tǒng)架構(gòu)
2.1 情報(bào)計(jì)劃與評(píng)估
情報(bào)計(jì)劃的過(guò)程主要是根據(jù)戰(zhàn)略和作戰(zhàn)態(tài)勢(shì)的實(shí)時(shí)變化情況,在分析情報(bào)需求的基礎(chǔ)上,綜合考慮可用的偵察資源、情報(bào)系統(tǒng)能力、情報(bào)技術(shù)現(xiàn)狀等各個(gè)方面,指定情報(bào)系統(tǒng)在何時(shí)、何地針對(duì)何種對(duì)象進(jìn)行情報(bào)活動(dòng),確定情報(bào)服務(wù)指標(biāo)和要求,并根據(jù)各種軍事、社會(huì)環(huán)境的變化修訂相應(yīng)的情報(bào)計(jì)劃。情報(bào)計(jì)劃子系統(tǒng)需要提供需求匯集、情況收集、分析判斷、計(jì)劃制定、計(jì)劃推演、計(jì)劃分發(fā)以及計(jì)劃調(diào)整等服務(wù)[4]。
情報(bào)評(píng)估是根據(jù)所收集的情況信息,評(píng)估和評(píng)價(jià)情報(bào)活動(dòng)是否完成了情報(bào)計(jì)劃指定的情報(bào)指標(biāo)和要求,以確保情報(bào)需求獲得滿足。情報(bào)計(jì)劃與情報(bào)評(píng)估相互印證,以情報(bào)需求為中心,是情報(bào)系統(tǒng)的關(guān)鍵,貫穿并影響情報(bào)活動(dòng)的各個(gè)方面,連續(xù)不間斷的進(jìn)行。
大數(shù)據(jù)時(shí)代對(duì)情報(bào)計(jì)劃和評(píng)估系統(tǒng)的影響首先是思維上的轉(zhuǎn)變,情報(bào)計(jì)劃的確定要考慮海量數(shù)據(jù)的相互關(guān)聯(lián)和情報(bào)數(shù)據(jù)的實(shí)時(shí)變化,從而更注重預(yù)測(cè)性和時(shí)效性;其次,計(jì)劃和評(píng)估過(guò)程要爭(zhēng)取實(shí)現(xiàn)信息化、智能化、服務(wù)化,以應(yīng)對(duì)人力與大數(shù)據(jù)之間的巨大差距。
2.2 情報(bào)搜集
各種情報(bào)搜集設(shè)施是情報(bào)系統(tǒng)的根本,沒(méi)有情報(bào)搜集,情報(bào)活動(dòng)就無(wú)從談起。大數(shù)據(jù)對(duì)情報(bào)搜集的影響體現(xiàn)在情報(bào)來(lái)源越來(lái)越多樣,情報(bào)數(shù)據(jù)越來(lái)越復(fù)雜。當(dāng)前的軍事情報(bào)系統(tǒng)從陸??仗祀娋W(wǎng)一體化作戰(zhàn)出發(fā),建立了陸基偵察、?;鶄刹?、空基偵察、天基偵察、電磁偵察、網(wǎng)絡(luò)偵查、人力偵察和公開來(lái)源等軍事情報(bào)源,其中,公開來(lái)源的情報(bào)信息往往被低估甚至忽視。大數(shù)據(jù)興起的新時(shí)期,公開信息情報(bào)的政治和軍事優(yōu)勢(shì)得天獨(dú)厚并且成本低廉,能夠在在全球范圍內(nèi),針對(duì)所有秘密情報(bào)視野之外的海量數(shù)據(jù)開展情報(bào)搜集工作[5]。2012年,奧巴馬政府提出,對(duì)數(shù)據(jù)的占有和控制權(quán)將成為繼陸權(quán)、海權(quán)、空權(quán)等傳統(tǒng)權(quán)利之外的另一項(xiàng)國(guó)家核心資產(chǎn)。豐富情報(bào)系統(tǒng)的情報(bào)搜集手段,是爭(zhēng)奪和擴(kuò)大數(shù)據(jù)占有和控制權(quán)的重要表現(xiàn)。
2.3 數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理子系統(tǒng)將來(lái)自各種戰(zhàn)場(chǎng)傳感器、人力偵察和公開來(lái)源的情報(bào)信息安全、可靠、快速地傳送至情報(bào)處理系統(tǒng),主要進(jìn)行接入?yún)R集、數(shù)據(jù)預(yù)處理等工作。數(shù)據(jù)預(yù)處理過(guò)程包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)轉(zhuǎn)換等。
數(shù)據(jù)清理主要包括數(shù)據(jù)格式標(biāo)準(zhǔn)化、異常數(shù)據(jù)識(shí)別、錯(cuò)誤糾正、重復(fù)數(shù)據(jù)清除等。由于各情報(bào)源所處環(huán)境不同,尤其是戰(zhàn)時(shí),受敵方干擾或者惡劣環(huán)境影響,很容易出現(xiàn)錯(cuò)誤或者不規(guī)范的情報(bào)信息,數(shù)據(jù)清理過(guò)程需要對(duì)多源傳感器數(shù)據(jù)進(jìn)行凈化與篩選處理,減少噪聲影響,識(shí)別異常信息,并利用情報(bào)還原技術(shù)及時(shí)從其中獲得有用信息。在情報(bào)數(shù)據(jù)清理的過(guò)程中,應(yīng)根據(jù)情報(bào)計(jì)劃進(jìn)行必要的對(duì)照檢查,防止對(duì)重要情報(bào)的遺漏,對(duì)未達(dá)到要求的情報(bào)內(nèi)容要及時(shí)進(jìn)行補(bǔ)充收集。
數(shù)據(jù)集成是將多個(gè)情報(bào)源中獲得的數(shù)據(jù)結(jié)合起來(lái)并統(tǒng)一存儲(chǔ),是構(gòu)建關(guān)聯(lián)型數(shù)據(jù)庫(kù)的重要手段。通過(guò)構(gòu)建目標(biāo)情報(bào)信息模型、態(tài)勢(shì)預(yù)測(cè)模型,分別采用數(shù)據(jù)級(jí)、特征級(jí)、決策級(jí)的數(shù)據(jù)集中關(guān)聯(lián)實(shí)現(xiàn)多源情報(bào)信息的綜合集成,可以獲得面向情報(bào)對(duì)象的全方面、一體化的情報(bào)資源。
數(shù)據(jù)轉(zhuǎn)換是通過(guò)規(guī)范化和平滑聚集,將數(shù)據(jù)信息和數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換為適合情報(bào)處理的數(shù)據(jù)。由于各情報(bào)源輸出的數(shù)據(jù)形式、對(duì)環(huán)境的描述和說(shuō)明等都不一樣,為了綜合處理這些不同來(lái)源的信息,需要將其轉(zhuǎn)換成相同的形式和描述。例如,將監(jiān)視目標(biāo)的位置信息的連續(xù)變化轉(zhuǎn)變?yōu)閯?dòng)向情報(bào)的節(jié)點(diǎn)式間斷變化,將各個(gè)絕對(duì)坐標(biāo)轉(zhuǎn)變?yōu)閰⒖纪粎⒄瘴锏南鄬?duì)坐標(biāo)等都屬于情報(bào)轉(zhuǎn)換的重要手段,可以為后續(xù)的情報(bào)分析提供便利。
大數(shù)據(jù)時(shí)代的數(shù)據(jù)預(yù)處理與傳統(tǒng)的預(yù)處理區(qū)別在于,大數(shù)據(jù)時(shí)代的預(yù)處理考慮數(shù)據(jù)的可擴(kuò)展性,可以接受傳統(tǒng)數(shù)據(jù)時(shí)代所忽略的非結(jié)構(gòu)化數(shù)據(jù),并能從所謂的“數(shù)據(jù)廢氣”中挖掘潛在價(jià)值。傳統(tǒng)的數(shù)據(jù)預(yù)處理還包括數(shù)據(jù)歸約,主要用來(lái)得到數(shù)據(jù)集的歸約表示,大大精簡(jiǎn)數(shù)據(jù)量以縮短挖掘分析的時(shí)間。但是隨著大數(shù)據(jù)計(jì)算和大數(shù)據(jù)分析技術(shù)的發(fā)展,對(duì)全量數(shù)據(jù)的處理時(shí)間大大縮短,盲目的數(shù)據(jù)歸約反而會(huì)導(dǎo)致信息的丟失,得不償失。
2.4 情報(bào)數(shù)據(jù)存儲(chǔ)
面向大數(shù)據(jù)的情報(bào)系統(tǒng)需要對(duì)多源異構(gòu)的海量數(shù)據(jù)提供高容錯(cuò)、可擴(kuò)展、主動(dòng)交互的數(shù)據(jù)存儲(chǔ)服務(wù),對(duì)情報(bào)信息數(shù)據(jù)的存儲(chǔ)管理包括巨量數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)、全媒體多格式數(shù)據(jù)的快速容差處理、高增量數(shù)據(jù)的快速分類處理、信息可靠性初級(jí)評(píng)估、組合與遷移、數(shù)據(jù)備份、容災(zāi)與安全等。
情報(bào)數(shù)據(jù)可以分為結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化的數(shù)據(jù)是情報(bào)源和情報(bào)預(yù)處理系統(tǒng)根據(jù)事先明確的要求,以規(guī)范好的格式和順序給出的數(shù)據(jù)。例如以經(jīng)、緯度確定目標(biāo)的位置信息,用年、月、日、秒確定情報(bào)事件的時(shí)間點(diǎn)等。非結(jié)構(gòu)化的情報(bào)則指那些被動(dòng)接收、無(wú)法事先規(guī)定格式的數(shù)據(jù),文本數(shù)據(jù)、視頻數(shù)據(jù)、音頻數(shù)據(jù)都屬于這個(gè)范疇。半結(jié)構(gòu)化數(shù)據(jù)則是兩者的結(jié)合,以公開情報(bào)最重要的來(lái)源網(wǎng)絡(luò)日志為例,它既具有符合WeB傳輸規(guī)范的結(jié)構(gòu)化文本格式,它的內(nèi)容文本卻是非結(jié)構(gòu)化的。情報(bào)存儲(chǔ)子系統(tǒng)應(yīng)該構(gòu)建關(guān)聯(lián)型的數(shù)據(jù)庫(kù)集群,既支持結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ),又支持非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)存儲(chǔ)。此外,雖然非關(guān)系型(NoSQL)數(shù)據(jù)庫(kù)是目前大數(shù)據(jù)系統(tǒng)的大勢(shì)所趨,具有存儲(chǔ)速度快、可擴(kuò)展性高等特點(diǎn),但是傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)由于嚴(yán)格格式化并且設(shè)計(jì)成熟,是有針對(duì)性的情報(bào)系統(tǒng)必不可少的存儲(chǔ)方式。新一代的情報(bào)數(shù)據(jù)存儲(chǔ)應(yīng)該綜合關(guān)系型數(shù)據(jù)庫(kù)和非關(guān)系型(NoSQL)數(shù)據(jù)庫(kù),為情報(bào)融合和情報(bào)關(guān)聯(lián)預(yù)測(cè)提供支撐。
情報(bào)系統(tǒng)中數(shù)據(jù)的存儲(chǔ)方式與處理速度密切相關(guān),面向大數(shù)據(jù)的情報(bào)系統(tǒng)不僅對(duì)存儲(chǔ)的性能和容量提出了新的要求,還需具備快速的數(shù)據(jù)檢索與分析能力來(lái)隨時(shí)提取有價(jià)值的信息和數(shù)據(jù)。因此,各數(shù)據(jù)庫(kù)集群應(yīng)采用分布式存儲(chǔ),以提高系統(tǒng)可靠性和可擴(kuò)展性,為分布式的情報(bào)分析模式提供基礎(chǔ)。分布式存儲(chǔ)系統(tǒng)利用網(wǎng)絡(luò)中物理上獨(dú)立的存儲(chǔ)設(shè)備來(lái)分擔(dān)存儲(chǔ)負(fù)荷,通過(guò)映射關(guān)系實(shí)現(xiàn)邏輯上統(tǒng)一的存儲(chǔ)空間。與此同時(shí),由多臺(tái)計(jì)算機(jī)并行管理與使用形成強(qiáng)大處理能力的分布式文件系統(tǒng)也必不可少。當(dāng)前,開源分布式處理平臺(tái)Hadoop[6]是廣泛使用的一種云計(jì)算支撐架構(gòu),它的HDFS分布式文件系統(tǒng)將計(jì)算節(jié)點(diǎn)和存儲(chǔ)節(jié)點(diǎn)合二為一,提供了低成本、高效率的大型計(jì)算機(jī)集群模型;同時(shí),Hadoop的HBase分布式數(shù)據(jù)庫(kù)和MapReduce處理框架分別提供了非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)能力和大數(shù)據(jù)快速分析能力,可作為新一代情報(bào)系統(tǒng)的平臺(tái)參考。
需要指出的是,由于分布式存儲(chǔ)的基本特征使用戶失去了對(duì)數(shù)據(jù)的絕對(duì)控制權(quán),使得分布式存儲(chǔ)產(chǎn)生了特有的安全隱患。因此,情報(bào)系統(tǒng)需要綜合考慮安全性與海量數(shù)據(jù)存儲(chǔ)性能的得與失,從訪問(wèn)安全性、存儲(chǔ)安全性和數(shù)據(jù)備份安全性等方面出發(fā),添加適合情報(bào)系統(tǒng)的特定解決方案,設(shè)計(jì)并采用同時(shí)滿足性能要求和安全要求的專用分布式存儲(chǔ)系統(tǒng)。例如,分別針對(duì)公開來(lái)源情報(bào)和軍事偵察情報(bào),分別采用公有云、私有云以及混合云等不同形式的存儲(chǔ)方式,滿足不同的安全級(jí)別要求。
2.5 情報(bào)分析
大數(shù)據(jù)的核心意義并不在于數(shù)據(jù)量之大,而在于通過(guò)對(duì)海量數(shù)據(jù)進(jìn)行整合和分析,發(fā)現(xiàn)新知識(shí),創(chuàng)造新價(jià)值。美國(guó)國(guó)防部對(duì)情報(bào)分析的定義為“通過(guò)對(duì)全源數(shù)據(jù)進(jìn)行綜合、評(píng)估、分析和解讀,將處理過(guò)的信息轉(zhuǎn)換為情報(bào)以滿足已知或預(yù)期的用戶需求的過(guò)程”[3]。強(qiáng)調(diào)“全源數(shù)據(jù)”,與大數(shù)據(jù)的發(fā)展趨勢(shì)不謀而合。因此,對(duì)搜集的數(shù)據(jù)進(jìn)行信息挖掘、數(shù)據(jù)分析和信息融合,是情報(bào)系統(tǒng)的重中之重。
信息挖掘是對(duì)已預(yù)處理的數(shù)據(jù)進(jìn)行關(guān)聯(lián)、分類、聚類、偏差分析等,從中發(fā)現(xiàn)有價(jià)值的知識(shí)和模式。情報(bào)系統(tǒng)中,主要通過(guò)信息分類、信息整編、信息索引、信息標(biāo)注、信息關(guān)聯(lián)、模式識(shí)別以及推理判斷等技術(shù),以聚類統(tǒng)計(jì)分析和規(guī)則假設(shè)推理的方法來(lái)揭示隱藏的、未知的或驗(yàn)證已知的模式與規(guī)律,挖掘出有價(jià)值的情報(bào)。海量處理對(duì)象的需求和情報(bào)系統(tǒng)的實(shí)時(shí)性要求使面向大數(shù)據(jù)的信息挖掘要依托云計(jì)算技術(shù)和大數(shù)據(jù)分析技術(shù)[7]進(jìn)行分布式并行處理,配合情報(bào)搜集和存儲(chǔ)階段的云存儲(chǔ)模式,提供符合要求的情報(bào)挖掘服務(wù)。
通過(guò)信息挖掘得到的知識(shí)和模式還不能直接作為決策的知識(shí),需要進(jìn)一步分析才能真正轉(zhuǎn)化為有用的情報(bào)。新階段的情報(bào)分析應(yīng)該實(shí)現(xiàn)可視化分析、智能化分析和預(yù)測(cè)性分析??梢暬治鍪敲嫦虼髷?shù)據(jù)分析專家和情報(bào)用戶的,能夠直觀地呈現(xiàn)大數(shù)據(jù)特點(diǎn),讓數(shù)據(jù)自己說(shuō)明結(jié)果。智能化分析使情報(bào)系統(tǒng)能夠自動(dòng)從數(shù)據(jù)中發(fā)現(xiàn)有用信息,大幅提高了將情報(bào)優(yōu)勢(shì)轉(zhuǎn)化為決策優(yōu)勢(shì)的過(guò)程的時(shí)效性和準(zhǔn)確性,是大數(shù)據(jù)時(shí)代必備的要求。預(yù)測(cè)性分析是大數(shù)據(jù)技術(shù)的核心應(yīng)用,是根據(jù)已知情報(bào)信息對(duì)將來(lái)和未知的情報(bào)信息的大數(shù)據(jù)分析過(guò)程。此外,隨著網(wǎng)絡(luò)空間攻防戰(zhàn)的日益激烈,分析監(jiān)視數(shù)據(jù)并提供實(shí)時(shí)警告也是情報(bào)分析的重要任務(wù)。
信息融合是對(duì)來(lái)自多源的數(shù)據(jù)和多維度信息進(jìn)行檢測(cè)、互聯(lián)、相關(guān)、估計(jì)和綜合等多層次多方面的處理,以獲得準(zhǔn)確的狀態(tài)和身份認(rèn)證,完整而及時(shí)的戰(zhàn)場(chǎng)態(tài)勢(shì)和威脅評(píng)估[8]。信息融合利用了不同信息間的互補(bǔ)性和多元信息的冗余性,既可以產(chǎn)生較低層次上的狀態(tài)和身份評(píng)估,也可以獲得較高層次上的戰(zhàn)術(shù)態(tài)勢(shì)評(píng)估與威脅評(píng)估。以美國(guó)陸軍的全源信息分析系統(tǒng)(ASAS)為例[2],現(xiàn)代情報(bào)分析系統(tǒng)采用計(jì)算機(jī)、視頻顯示終端盒保密無(wú)線電通信設(shè)備組成混合系統(tǒng),把數(shù)據(jù)搜集和存儲(chǔ)階段生成的信息進(jìn)行互相補(bǔ)充、驗(yàn)證、比較和分析,從中得到綜合性的情報(bào)和近實(shí)時(shí)的戰(zhàn)場(chǎng)態(tài)勢(shì)圖。此外,針對(duì)情報(bào)分析的結(jié)果,應(yīng)形成對(duì)情報(bào)產(chǎn)品的分類管理,按照情報(bào)的類別確定保障范圍和條件,為后續(xù)的情報(bào)分發(fā)過(guò)程提供支撐。
基于大數(shù)據(jù)的情報(bào)分析系統(tǒng)基于分布式海量數(shù)據(jù)存儲(chǔ)與計(jì)算環(huán)境和豐富的數(shù)據(jù)分析和挖掘方法,提供智能化、可視化及預(yù)測(cè)性的分析服務(wù),融合多源情報(bào),通過(guò)網(wǎng)絡(luò)提供情報(bào)分析服務(wù)。情報(bào)分析服務(wù)的網(wǎng)絡(luò)服務(wù)特性,實(shí)現(xiàn)了情報(bào)生產(chǎn)者和情報(bào)用戶的交流和互動(dòng),讓處于不同位置、隸屬于不同部門的情報(bào)用戶和專家參與分析,通過(guò)“個(gè)性化”定制的情報(bào)分析,使情報(bào)產(chǎn)品更加具有針對(duì)性和靈活性。
2.6 情報(bào)分發(fā)
情報(bào)系統(tǒng)在形成各類情報(bào)產(chǎn)品之后,還需建立高效、快捷以及安全的情報(bào)分發(fā)機(jī)制[9]。面向大數(shù)據(jù)的情報(bào)分發(fā)應(yīng)實(shí)現(xiàn)按需分發(fā),主要功能和階段包括用戶需求訂閱、情報(bào)分發(fā)處理、分發(fā)路徑優(yōu)選與通信保障、情報(bào)分發(fā)監(jiān)控、情報(bào)共享等。
用戶需求訂閱功能需要按照用戶的情報(bào)保障級(jí)別,限定其訂閱范圍和類型,經(jīng)審核后按照用戶需求生成情報(bào)訂閱指令,然后提交給分發(fā)控制系統(tǒng)。
情報(bào)分發(fā)處理階段根據(jù)情報(bào)訂閱指令,對(duì)情報(bào)產(chǎn)品庫(kù)中的產(chǎn)品進(jìn)行信息過(guò)濾、裁剪以及模糊處理,確定對(duì)應(yīng)的分發(fā)策略。
分發(fā)路徑優(yōu)選與通信保障則是為了保障情報(bào)分發(fā)的時(shí)效性和可靠性,自動(dòng)選取傳輸鏈路和最優(yōu)路由,并通過(guò)接收確認(rèn)、斷鏈重傳等可靠性傳輸機(jī)制傳播情報(bào)。
情報(bào)分發(fā)監(jiān)控則是對(duì)情報(bào)分發(fā)過(guò)程的實(shí)時(shí)監(jiān)控能力,一方面要避免情報(bào)被竊取或者錯(cuò)誤分發(fā),另一方面要避免在通信中斷或情報(bào)系統(tǒng)失效的情況下出現(xiàn)用戶死等現(xiàn)象。在以上情況發(fā)生時(shí),示警并激活應(yīng)急機(jī)制,實(shí)現(xiàn)準(zhǔn)確和不間斷的情報(bào)保障。
情報(bào)共享是實(shí)現(xiàn)情報(bào)協(xié)調(diào)的基礎(chǔ),既包括垂直性的上級(jí)向多個(gè)下級(jí)機(jī)關(guān)的情報(bào)通告,也包括平行性的情報(bào)傳閱。通過(guò)分布式系統(tǒng)實(shí)現(xiàn)的情報(bào)共享機(jī)制,有利于提高一體化聯(lián)合戰(zhàn)爭(zhēng)大環(huán)境下的協(xié)同作戰(zhàn)能力。
2.7 情報(bào)服務(wù)
情報(bào)服務(wù)是情報(bào)系統(tǒng)呈現(xiàn)在用戶面前的直觀形態(tài),直接關(guān)系到情報(bào)系統(tǒng)的保障能力和應(yīng)用能力,它的核心目標(biāo)是能夠?qū)崿F(xiàn)“網(wǎng)絡(luò)中心、即插即用、按需共享、動(dòng)態(tài)重組”的情報(bào)信息共享能力,主要包括情報(bào)信息管理、情報(bào)服務(wù)應(yīng)用、信息服務(wù)傳輸和情報(bào)服務(wù)交互等功能。情報(bào)信息管理是通過(guò)建設(shè)情報(bào)信息平臺(tái)的方式,對(duì)情報(bào)信息資源進(jìn)行整編和索引,實(shí)現(xiàn)情報(bào)產(chǎn)品的統(tǒng)一入庫(kù)和管理;情報(bào)服務(wù)應(yīng)用是以情報(bào)信息為中心,針對(duì)不同的情報(bào)業(yè)務(wù)需求,設(shè)計(jì)自動(dòng)化的情報(bào)應(yīng)用和部署,增強(qiáng)情報(bào)信息面向戰(zhàn)役戰(zhàn)術(shù)應(yīng)用的支撐能力;信息服務(wù)傳輸是在情報(bào)分發(fā)層通信鏈路的基礎(chǔ)上,從邏輯層面進(jìn)一步優(yōu)化情報(bào)信息傳輸?shù)牧鞒?,減少傳輸過(guò)程的信息冗余,提升情報(bào)信息傳輸能力;情報(bào)服務(wù)交互是在用戶終端方面,通過(guò)Web服務(wù)接入、可視化、人機(jī)交互等技術(shù)實(shí)現(xiàn)對(duì)各類情報(bào)資源的訪問(wèn)和共享。
2.8 安全服務(wù)
軍事情報(bào)網(wǎng)絡(luò)的安全性至關(guān)重要,安全服務(wù)應(yīng)貫穿情報(bào)系統(tǒng)的始終。情報(bào)系統(tǒng)的各個(gè)階段應(yīng)提供身份認(rèn)證、訪問(wèn)授權(quán)、分級(jí)管理、密碼管理、容災(zāi)備份、數(shù)據(jù)校驗(yàn)等安全功能,來(lái)保障數(shù)據(jù)傳輸和訪問(wèn)安全以及數(shù)據(jù)存儲(chǔ)安全。數(shù)據(jù)傳輸和訪問(wèn)方面,當(dāng)用戶在登陸情報(bào)系統(tǒng)的云服務(wù)器時(shí),需要驗(yàn)證用戶的信任等級(jí),不同的用戶級(jí)別擁有不同的用戶使用權(quán)限,這些靠身份認(rèn)證、訪問(wèn)授權(quán)、分級(jí)管理和密碼管理等機(jī)制實(shí)現(xiàn)。數(shù)據(jù)存儲(chǔ)安全方面,為防止重大事故和復(fù)雜的戰(zhàn)爭(zhēng)環(huán)境導(dǎo)致數(shù)據(jù)無(wú)法恢復(fù),分布式存儲(chǔ)的各個(gè)數(shù)據(jù)中心應(yīng)定期進(jìn)行情報(bào)數(shù)據(jù)的備份,并提供短時(shí)間的數(shù)據(jù)恢復(fù)能力。此外,由于情報(bào)數(shù)據(jù)在云中集中存儲(chǔ),任何用戶獲取或者上傳的情報(bào)必須經(jīng)過(guò)云的安全框架認(rèn)證,這樣可以有效確保數(shù)據(jù)的完整可靠安全。
面向大數(shù)據(jù)的情報(bào)系統(tǒng)以區(qū)域性情報(bào)中心及高速互聯(lián)網(wǎng)為基礎(chǔ)設(shè)施,以互聯(lián)網(wǎng)服務(wù)體系為架構(gòu),以大數(shù)據(jù)存儲(chǔ)、云計(jì)算、信息挖掘、交互式可視化分析、并行處理等關(guān)鍵技術(shù)為支撐,通過(guò)情報(bào)服務(wù)平臺(tái)和多樣化移動(dòng)智能終端及移動(dòng)互聯(lián)網(wǎng)為用戶提供情報(bào)搜集、情報(bào)處理和情報(bào)分發(fā)服務(wù)。
3.1 大數(shù)據(jù)存儲(chǔ)推動(dòng)情報(bào)搜集深入化
隨著大數(shù)據(jù)技術(shù)的興起,本來(lái)無(wú)用的數(shù)據(jù)也可能成為新的情報(bào)觸發(fā)點(diǎn),情報(bào)搜集的重點(diǎn)已經(jīng)開始向追求數(shù)據(jù)的全面性和海量化轉(zhuǎn)變。偵察監(jiān)視傳感器的種類和數(shù)量將越來(lái)越多,傳感器網(wǎng)絡(luò)進(jìn)一步互聯(lián)、互通、互操作,導(dǎo)致情報(bào)監(jiān)視范圍更廣,情報(bào)數(shù)據(jù)更多樣。情報(bào)搜集工作將深入社會(huì)的各個(gè)方面,公開來(lái)源情報(bào)的價(jià)值、地位和影響將徹底轉(zhuǎn)變。
3.2 大數(shù)據(jù)分析支撐情報(bào)處理智能化
海量的大數(shù)據(jù)存儲(chǔ)要求情報(bào)分析從人工分析轉(zhuǎn)向以自動(dòng)關(guān)聯(lián)為中心的智能化分析,可視化分析和預(yù)測(cè)性分析都依賴于對(duì)情報(bào)信息的智能化處理。在海灣戰(zhàn)爭(zhēng)和伊拉克戰(zhàn)爭(zhēng)中,先進(jìn)的智能化情報(bào)處理技術(shù)已經(jīng)發(fā)揮了關(guān)鍵性作用。在大數(shù)據(jù)技術(shù)蓬勃發(fā)展的將來(lái),人力與數(shù)據(jù)量的鴻溝將使智能化情報(bào)處理的優(yōu)越性進(jìn)一步彰顯,在信息處理能力、準(zhǔn)確性、可靠性、穩(wěn)定性以及處理時(shí)間等方面發(fā)揮巨大信息優(yōu)勢(shì)。未來(lái)的信息化戰(zhàn)爭(zhēng),很可能是在智能化情報(bào)處理系統(tǒng)方面的對(duì)決。
3.3 大數(shù)據(jù)服務(wù)開啟情報(bào)分發(fā)網(wǎng)狀化
大數(shù)據(jù)時(shí)代,基于情報(bào)產(chǎn)品的分布式存儲(chǔ)和情報(bào)分析的并行處理,情報(bào)分發(fā)網(wǎng)絡(luò)有望從以一個(gè)或多個(gè)國(guó)家情報(bào)中心和區(qū)域情報(bào)中心的星形結(jié)構(gòu)轉(zhuǎn)向網(wǎng)狀化結(jié)構(gòu)。各情報(bào)分發(fā)節(jié)點(diǎn)既可以和上下級(jí)節(jié)點(diǎn)通信,又可以和平級(jí)節(jié)點(diǎn)通信,分發(fā)路徑增多,情報(bào)協(xié)作更加靈活,但需加強(qiáng)情報(bào)安全保障。
[1] Victor Mayer-Schonberger,Kenneth Cukier.大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革.盛楊燕,周濤譯,浙江人民出版社,2014.
[2] 雷厲 等編.偵察與監(jiān)視:作戰(zhàn)空間的千里眼和順風(fēng)耳.國(guó)防工業(yè)出版社,2008年.
[3] 張曉軍 等著.美國(guó)軍事情報(bào)理論研究.軍事科學(xué)出版社,2007.
[4] 卜卿,王妍妍,黃山良.面向服務(wù)的情報(bào)偵察計(jì)劃系統(tǒng)架構(gòu).中國(guó)指揮控制大會(huì)論文集,2013:658-662.
[5] 張?jiān)蕢?,劉戟鋒.大數(shù)據(jù)時(shí)代信息安全的機(jī)遇與挑戰(zhàn):以公開信息情報(bào)為例.國(guó)防科技,2013,34(2):6-9.
[6] 陳吉榮,樂(lè)嘉錦.基于Hadoop生態(tài)系統(tǒng)的大數(shù)據(jù)解決方案綜述.計(jì)算機(jī)工程與科學(xué),2013,35(100):25-35.
[7] 張春磊,楊小牛.大數(shù)據(jù)分析(BDA)及其在情報(bào)領(lǐng)域的應(yīng)用.中國(guó)電子科學(xué)研究院學(xué)報(bào),2013,8(1):18-22.
[8] 許輝輝,許榮榮. 云計(jì)算在軍事情報(bào)融合中的應(yīng)用研究. 西安文理學(xué)院學(xué)報(bào):自然科學(xué)版,2014,17(1):97-100.
[9] 張堅(jiān).聯(lián)合情報(bào)保障體系情報(bào)信息分發(fā)控制系統(tǒng).指揮信息系統(tǒng)與技術(shù),2013,4(2):33-36.
An Empirical Exploration of Intelligence System Based Big Data
ZHANG Lin-chao, LI Yang-yang, LIAO Yong, KONG Rui-yuan, WU Wen-xi
(China Academy of Electronic and Information Technology, Beijing 100041, China)
The big data revolution will certainly cause the evolution of the military information system, it can be foreseen that the intelligence system, which concentrate on data, will become the crucial factor to win the information-based warfare. Considering the influence of the big data revolution on the contemporary warfare, this paper defines the basic functions of the intelligence system. Based on the defined functions and the new technology related with big data, the new challenges of intelligence system are analyzed and a new architecture of the intelligence system is designed. Besides, the development trends of the intelligence system caused by the big data revolution are predicted.
Big data; Intelligence system; System Architecture
10.3969/j.issn.1673-5692.2016.06.008
2016-07-05
2016-09-08
:A
1673-5692(2016)06-603-07
張林超(1987—),男,河南人,工程師,博士,主要研究方向?yàn)橄到y(tǒng)工程、網(wǎng)絡(luò)協(xié)議、信息安全;
E-mail:hune213@163.com
李陽(yáng)陽(yáng)(1987—),男,江蘇人,工程師。博士,主要研究方向?yàn)樵朴?jì)算和數(shù)據(jù)中心網(wǎng)絡(luò);
廖 勇(1980—),男,湖南人,博士,資深數(shù)據(jù)科學(xué)家。主要研究方向?yàn)榫W(wǎng)絡(luò)信息系統(tǒng)、網(wǎng)絡(luò)大數(shù)據(jù)挖掘、網(wǎng)絡(luò)測(cè)量;
孔瑞遠(yuǎn)(1987—),男,河南人,工程師,博士,主要研究方向?yàn)橄到y(tǒng)工程、體系結(jié)構(gòu);
武文曦(1988—),男,湖南人,工程師,主要研究方向?yàn)橄到y(tǒng)工程、大數(shù)據(jù)分析。