魏鑫,汪洋
中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心,北京 100190
“態(tài)勢(shì)感知(Situation Awareness,SA)”最早由美國(guó)空軍首席科學(xué)家 Endsley 于20世紀(jì) 80年代提出,覆蓋感知(感覺(jué))、理解和預(yù)測(cè)三個(gè)層次。90年代,態(tài)勢(shì)感知的概念開(kāi)始被逐漸接受,并隨著網(wǎng)絡(luò)的發(fā)展升級(jí)為“網(wǎng)絡(luò)態(tài)勢(shì)感知(Cyberspace Situation Awareness,CSA)”。近年來(lái),隨著信息與網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,態(tài)勢(shì)感知理論和技術(shù)在網(wǎng)絡(luò)安全、情報(bào)系統(tǒng)、電力系統(tǒng)、智能交通系統(tǒng)等許多領(lǐng)域都有廣泛的用途,提高態(tài)勢(shì)感知能力成為系統(tǒng)和組織機(jī)制設(shè)計(jì)中不可或缺的一部分[1–3]。
本文從態(tài)勢(shì)感知的概念出發(fā),首先闡述其在軍方戰(zhàn)場(chǎng)及網(wǎng)絡(luò)方面的應(yīng)用,并在此基礎(chǔ)上給出科研管理態(tài)勢(shì)感知的概念,探討態(tài)勢(shì)感知技術(shù)在科技管理中的全新應(yīng)用。
美國(guó)心理學(xué)家 Endsley1988年在分析飛機(jī)駕駛員和領(lǐng)航員(機(jī)組人員)對(duì)周?chē)?空中環(huán)境和飛機(jī)狀態(tài))的感知程度對(duì)其活動(dòng)行為的影響時(shí),給出了態(tài)勢(shì)感知的定義[4]:“態(tài)勢(shì)感知是對(duì)一定時(shí)間和空間環(huán)境內(nèi)的態(tài)勢(shì)要素進(jìn)行感知,并對(duì)獲得的信息進(jìn)行理解,進(jìn)而形成對(duì)這些態(tài)勢(shì)要素下一時(shí)刻狀態(tài)的預(yù)測(cè)”。1995年Endsley 提出了態(tài)勢(shì)感知的三級(jí)模型[5](如圖1)。
(1)一級(jí) SA:察覺(jué)(perception)。察覺(jué)是指獲取所需的態(tài)勢(shì)要素,并掌握各要素之間的關(guān)系;
(2)二級(jí) SA:理解(comprehension)。理解是綜合集成所獲取的態(tài)勢(shì)信息,并形成對(duì)各態(tài)勢(shì)要素重要性和性質(zhì)的判斷;
(3)三級(jí) SA:預(yù)測(cè)(projection)。預(yù)測(cè)是對(duì)未來(lái)態(tài)勢(shì)發(fā)展變化趨勢(shì)的估計(jì),它通過(guò)對(duì)當(dāng)前態(tài)勢(shì)信息的理解,形成對(duì)當(dāng)前態(tài)勢(shì)在未來(lái)一段時(shí)間內(nèi)變化趨勢(shì)的推測(cè)。
Endsley的定義強(qiáng)調(diào)了“一定時(shí)間和空間環(huán)境”,即將態(tài)勢(shì)感知限制在一個(gè)短暫的時(shí)空范圍內(nèi),但事實(shí)上態(tài)勢(shì)感知是一個(gè)與過(guò)去、現(xiàn)在和將來(lái)都有關(guān)系的概念,是全局性的、動(dòng)態(tài)的。因此,本文結(jié)合態(tài)勢(shì)感知目前的應(yīng)用情況及信息技術(shù)發(fā)展現(xiàn)狀,將態(tài)勢(shì)感知定義為:態(tài)勢(shì)感知是一種基于環(huán)境的、動(dòng)態(tài)、整體地洞悉系統(tǒng)狀態(tài)的能力,是以大數(shù)據(jù)為基礎(chǔ),從全局視角提升對(duì)關(guān)鍵信息的發(fā)現(xiàn)識(shí)別、理解分析、預(yù)測(cè)能力的一種方式,最終是為了決策與行動(dòng),是綜合展示系統(tǒng)與決策支持系統(tǒng)的融合。
知己知彼,才能百戰(zhàn)不殆。全面準(zhǔn)確地掌握戰(zhàn)場(chǎng)態(tài)勢(shì),是正確決策和占據(jù)戰(zhàn)場(chǎng)主動(dòng)的基礎(chǔ)。戰(zhàn)場(chǎng)態(tài)勢(shì)感知活動(dòng)的作用域主要有物理域、信息域和認(rèn)知域,不同領(lǐng)域的專(zhuān)家關(guān)注的側(cè)重點(diǎn)不同,對(duì)戰(zhàn)場(chǎng)態(tài)勢(shì)感知的理解和定義也不盡相同。比如,在軍事領(lǐng)域,趙宗貴研究員將戰(zhàn)場(chǎng)態(tài)勢(shì)(Battlefield Situation,BS)定義為[5]:戰(zhàn)場(chǎng)態(tài)勢(shì)是指戰(zhàn)場(chǎng)中兵力分布及戰(zhàn)場(chǎng)環(huán)境的當(dāng)前狀態(tài)和發(fā)展變化趨勢(shì);而態(tài)勢(shì)要素則指構(gòu)成戰(zhàn)場(chǎng)態(tài)勢(shì)的兵力、目標(biāo)、環(huán)境等要素。
圖1 態(tài)勢(shì)感知的三級(jí)模型及嵌入式應(yīng)用Fig.1 A three-phase model for situation awareness and its embedded application
不同的作戰(zhàn)場(chǎng)景、作戰(zhàn)目標(biāo)所包含的態(tài)勢(shì)要素不盡相同,拋開(kāi)特定的作戰(zhàn)場(chǎng)景,從總體上講,戰(zhàn)場(chǎng)態(tài)勢(shì)由五類(lèi)要素構(gòu)成[5]:(1)兵力部署與作戰(zhàn)能力類(lèi);(2)重要?jiǎng)討B(tài)目標(biāo)類(lèi);(3)戰(zhàn)場(chǎng)環(huán)境類(lèi);(4)社會(huì)/政治/經(jīng)濟(jì)環(huán)境類(lèi);(5)對(duì)抗措施類(lèi)。每類(lèi)所含態(tài)勢(shì)要素的分層結(jié)構(gòu),如圖2所示。
戰(zhàn)場(chǎng)態(tài)勢(shì)感知系統(tǒng)[6]主要由感知節(jié)點(diǎn)(如雷達(dá)、紅外探測(cè)器等)、信息處理節(jié)點(diǎn)(如信息融合、處理器等)、指控節(jié)點(diǎn)等組成,廣泛作用于物理域、信息域和認(rèn)知域。戰(zhàn)場(chǎng)態(tài)勢(shì)感知系統(tǒng)框架如圖3所示。實(shí)際的戰(zhàn)場(chǎng)戰(zhàn)情是十分復(fù)雜的,戰(zhàn)場(chǎng)態(tài)勢(shì)感知系統(tǒng)也是多種多樣的,圖3只是簡(jiǎn)單示意。
戰(zhàn)場(chǎng)戰(zhàn)情瞬息萬(wàn)變,指揮部需要隨時(shí)了解戰(zhàn)情,對(duì)成千上萬(wàn)個(gè)作戰(zhàn)單元進(jìn)行指揮,指揮任務(wù)復(fù)雜且艱巨。“空間戰(zhàn)場(chǎng)態(tài)勢(shì)感知指揮可視化系統(tǒng)”的出現(xiàn),很好地解決了這一難題。
空間戰(zhàn)場(chǎng)態(tài)勢(shì)感知指揮可視化系統(tǒng)通過(guò)前端傳感器收集作站平臺(tái)參數(shù),包括主要性能參數(shù)、各分隊(duì)位置、集群數(shù)量、組織情況等,并將收集到的信息經(jīng)過(guò)分析、處理后,傳到后端進(jìn)行可視化呈現(xiàn)。系統(tǒng)可進(jìn)行全空間戰(zhàn)場(chǎng)實(shí)時(shí)動(dòng)態(tài)顯示、二三維地理信息顯示、三維戰(zhàn)場(chǎng)態(tài)勢(shì)顯示等,支持多屏關(guān)聯(lián)分析,用戶(hù)可以根據(jù)需求查看所需要的信息,還可通過(guò)手持設(shè)備對(duì)大屏幕進(jìn)行交互控制。目前該系統(tǒng)在航天系統(tǒng)及船舶部門(mén)得到了成功應(yīng)用,后續(xù)將在部隊(duì)中進(jìn)一步推廣,指揮部隊(duì)日常訓(xùn)練及作戰(zhàn)演習(xí)??臻g戰(zhàn)場(chǎng)態(tài)勢(shì)感知指揮可視化系統(tǒng)如圖4所示。
網(wǎng)絡(luò)態(tài)勢(shì)感知(Cyberspace situational Awareness,CSA)是在1999年被提出的。網(wǎng)絡(luò)態(tài)勢(shì)感知[7]是指在動(dòng)態(tài)網(wǎng)絡(luò)環(huán)境中,對(duì)能夠引起網(wǎng)絡(luò)態(tài)勢(shì)變化的各種要素進(jìn)行獲取、分析及評(píng)估,并預(yù)測(cè)其發(fā)展趨勢(shì),為決策提供依據(jù)。它既包括對(duì)內(nèi)部網(wǎng)絡(luò)系統(tǒng)運(yùn)行狀況、安全態(tài)勢(shì)的感知,也包括對(duì)外部網(wǎng)絡(luò)態(tài)勢(shì)的感知。
圖2 戰(zhàn)場(chǎng)態(tài)勢(shì)要素層次結(jié)構(gòu)Fig.2 Hierarchical structure showing battlefield situation elements
與物理空間的戰(zhàn)場(chǎng)態(tài)勢(shì)感知不同,網(wǎng)絡(luò)空間是虛擬的數(shù)字世界,研究對(duì)象不再局限于傳統(tǒng)的設(shè)備,還包括虛擬對(duì)象,如身份 ID、網(wǎng)絡(luò)服務(wù)、應(yīng)用等。同時(shí),由于網(wǎng)絡(luò)中的信息具有瞬時(shí)可達(dá)性,物理空間中的距離、方位等要素在網(wǎng)絡(luò)空間中已不具有太大意義。
網(wǎng)絡(luò)態(tài)勢(shì)感知通過(guò)融合各種感知數(shù)據(jù),并對(duì)數(shù)據(jù)信息進(jìn)行分析、評(píng)估,預(yù)測(cè)網(wǎng)絡(luò)發(fā)展趨勢(shì),為決策提供支持。網(wǎng)絡(luò)態(tài)勢(shì)感知涵蓋多方面的研究?jī)?nèi)容,拋開(kāi)具體研究?jī)?nèi)容,其整體研究框架[8]如圖5所示。
網(wǎng)絡(luò)態(tài)勢(shì)感知包括態(tài)勢(shì)要素提取、當(dāng)前態(tài)勢(shì)分析和未來(lái)態(tài)勢(shì)預(yù)測(cè)幾個(gè)部分,具體涉及如下幾個(gè)方面:
圖3 戰(zhàn)場(chǎng)態(tài)勢(shì)感知系統(tǒng)框架Fig.3 Framework of the battlefield situation awareness system
圖4 空間戰(zhàn)場(chǎng)態(tài)勢(shì)感知指揮可視化系統(tǒng)Fig.4 Command visualization system for spatial battlefield situation awareness
(1)從多個(gè)維度、利用數(shù)據(jù)挖掘、融合技術(shù),對(duì)網(wǎng)絡(luò)空間要素進(jìn)行實(shí)時(shí)監(jiān)測(cè)獲取,為態(tài)勢(shì)評(píng)估做準(zhǔn)備;
(2)對(duì)采集到的信息采用分類(lèi)、歸并等方式進(jìn)行數(shù)據(jù)融合,通過(guò)特征分析、深度挖掘等技術(shù)確定事件發(fā)生的深層次原因,確立態(tài)勢(shì)評(píng)價(jià)指標(biāo),評(píng)估網(wǎng)絡(luò)當(dāng)前態(tài)勢(shì);
(3)根據(jù)網(wǎng)絡(luò)當(dāng)前運(yùn)行狀況,運(yùn)用預(yù)測(cè)技術(shù)對(duì)網(wǎng)絡(luò)發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè),及時(shí)采取有效措施,避免大規(guī)模安全事故的發(fā)生;
(4)運(yùn)用可視化技術(shù)將網(wǎng)絡(luò)態(tài)勢(shì)狀況進(jìn)行直觀(guān)、清晰的展示,為網(wǎng)絡(luò)管理員提供輔助決策支持。
幾十年來(lái),研究者提出了多種數(shù)據(jù)融合模型,其中美國(guó)國(guó)防部實(shí)驗(yàn)室聯(lián)合領(lǐng)導(dǎo)機(jī)構(gòu)(Joint Directors of Laboratories,JDL)模型[8]最受歡迎。該模型最初用于軍事領(lǐng)域,將數(shù)據(jù)融合過(guò)程分為信息預(yù)處理、對(duì)象精煉、態(tài)勢(shì)評(píng)估等5個(gè)層次,如圖6所示。
JDL 模型將采集到的數(shù)據(jù)經(jīng)過(guò)信息預(yù)處理實(shí)現(xiàn)數(shù)據(jù)的初步篩選,對(duì)象精煉結(jié)合參數(shù)、身份等信息對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步處理,為后續(xù)態(tài)勢(shì)、威脅評(píng)估做準(zhǔn)備。
圖5 網(wǎng)絡(luò)態(tài)勢(shì)感知研究框架Fig.5 Research framework for network situation awareness
2000年,Tim Bass 提出 BASS 模型,應(yīng)用數(shù)據(jù)融合技術(shù)建立網(wǎng)絡(luò)態(tài)勢(shì)感知系統(tǒng)。BASS 模型共分 5層,分別為數(shù)據(jù)精煉、攻擊對(duì)象識(shí)別、態(tài)勢(shì)精煉等,如圖7所示。BASS 模型的出現(xiàn),為態(tài)勢(shì)感知研究領(lǐng)域提出了新的思路,后續(xù)出現(xiàn)了多種基于多源異構(gòu)信息的模型。
圖6 JDL 模型Fig.6 IDL model
圖7 BASS 模型Fig.7 BASS model
在“四個(gè)率先”戰(zhàn)略導(dǎo)向下,中科院《“十三五”信息化發(fā)展規(guī)劃》確立了“兩個(gè)面向”和“三個(gè)顯著提升”的發(fā)展目標(biāo),提出了實(shí)施五大工程的戰(zhàn)略舉措,旨在全面構(gòu)筑新型科研信息化體系。在大數(shù)據(jù)時(shí)代,中科院建設(shè)了一系列應(yīng)用系統(tǒng),在科研和管理過(guò)程中采集了海量的數(shù)據(jù)信息,如何有效的利用這些數(shù)據(jù)來(lái)幫助提升管理工作、輔助決策,是建設(shè)智慧中科院的關(guān)鍵一環(huán)。本文提出建設(shè)“科研管理態(tài)勢(shì)感知系統(tǒng)”,面向中科院科研與管理需求,全方位收集數(shù)據(jù)與信息資源,通過(guò)中科院創(chuàng)新發(fā)展相關(guān)要素?cái)?shù)據(jù)的有效融合及深度關(guān)聯(lián)分析,實(shí)現(xiàn)對(duì)中科院發(fā)展態(tài)勢(shì)的感知,為科學(xué)決策提供數(shù)據(jù)支撐。
科研管理態(tài)勢(shì)感知面向院、所兩級(jí)用戶(hù)需求,研究衡量中科院各方面發(fā)展的指標(biāo)體系,構(gòu)建了一套大數(shù)據(jù)管理、清洗與分析工具以及可視化展示算法庫(kù),全方位、多維度展示研究機(jī)構(gòu)、研究人員、科研項(xiàng)目、科研成果、研究方向等方面的發(fā)展?fàn)顟B(tài),實(shí)現(xiàn)“院-研究所-實(shí)驗(yàn)室-團(tuán)隊(duì)-人員”多級(jí)結(jié)構(gòu)的發(fā)展態(tài)勢(shì)實(shí)時(shí)展示與交互式分析,感知中科院各領(lǐng)域、各研究機(jī)構(gòu)的發(fā)展現(xiàn)狀與趨勢(shì),為管理決策提供數(shù)據(jù)支持。
科研管理態(tài)勢(shì)感知從數(shù)據(jù)到知識(shí)共分為四個(gè)層次:
(1)一維數(shù)據(jù)展示:原始數(shù)據(jù)是一維的“點(diǎn)”,是表示某一時(shí)間點(diǎn)的狀“態(tài)”;
(2)發(fā)展態(tài)勢(shì)指標(biāo):通過(guò)增加時(shí)間維度,一維的點(diǎn)變成了二維的線(xiàn),表示某一指標(biāo)在時(shí)間軸上的發(fā)展趨“勢(shì)”;
(3)態(tài)勢(shì)模型分析:通過(guò)引入用戶(hù)、專(zhuān)家的經(jīng)驗(yàn)與知識(shí),結(jié)合大數(shù)據(jù)模型,將多個(gè)指標(biāo)進(jìn)行有機(jī)整合賦予其新的概念,由二維的線(xiàn)變成三維的體,讓使用者“感”覺(jué)到某一簇指標(biāo)集的發(fā)展態(tài)勢(shì);
(4)整體橫向?qū)Ρ龋褐褐耍賾?zhàn)百勝。通過(guò)與其他機(jī)構(gòu)、實(shí)驗(yàn)室、人員的橫向?qū)Ρ?,讓使用者?duì)三維的空間有更加直觀(guān)的感受,“知”曉發(fā)展態(tài)勢(shì)的水平與差距。
科研管理態(tài)勢(shì)感知系統(tǒng)通過(guò)關(guān)系型數(shù)據(jù)庫(kù)和非關(guān)系數(shù)據(jù)庫(kù)技術(shù),構(gòu)建數(shù)據(jù)目錄及數(shù)據(jù)字典管理主題數(shù)據(jù)庫(kù),形成數(shù)據(jù)匯聚與交換平臺(tái)的基本框架;匯聚中科院 ARP 數(shù)據(jù)資源、文獻(xiàn)情報(bào)信息資源,以及國(guó)家科技部、國(guó)家自然科學(xué)基金委等科技項(xiàng)目資源庫(kù)和互聯(lián)網(wǎng)外部數(shù)據(jù),在主題數(shù)據(jù)庫(kù)系統(tǒng)的框架下,形成態(tài)勢(shì)感知數(shù)據(jù)資源池目錄體系和大數(shù)據(jù)存儲(chǔ)體系。通過(guò)系統(tǒng)正交方法,研究并梳理出態(tài)勢(shì)感知指標(biāo)項(xiàng),建立態(tài)勢(shì)感知指標(biāo)體系;通過(guò)數(shù)據(jù)索引技術(shù),建立數(shù)據(jù)匯聚與交換平臺(tái)和態(tài)勢(shì)感知指標(biāo)項(xiàng)關(guān)聯(lián)結(jié)構(gòu);通過(guò)爬蟲(chóng)等互聯(lián)網(wǎng)數(shù)據(jù)工具,抓取學(xué)科領(lǐng)域涉及科技團(tuán)隊(duì)、科研成果等反映科技競(jìng)爭(zhēng)力的相關(guān)數(shù)據(jù)并進(jìn)行清洗、整理,存儲(chǔ)到數(shù)據(jù)匯聚與交換平臺(tái);通過(guò)多維可視化方法,展示指標(biāo)體系各類(lèi)數(shù)據(jù),多維度展示我院科研、管理與教育的發(fā)展態(tài)勢(shì)。
科研管理態(tài)勢(shì)感知建設(shè)內(nèi)容包括如下七大部分:數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范與數(shù)據(jù)字典、數(shù)據(jù)匯聚與交換平臺(tái)、態(tài)勢(shì)感知數(shù)據(jù)收集與預(yù)處理、態(tài)勢(shì)感知指標(biāo)體系、態(tài)勢(shì)感知模型與數(shù)據(jù)分析、態(tài)勢(shì)感知可視化、領(lǐng)域互聯(lián)網(wǎng)信息垂直分析系統(tǒng),如圖8所示。
圖8 科研管理態(tài)勢(shì)感知主要建設(shè)任務(wù)Fig.8 Major steps for building the research management situation awareness
經(jīng)過(guò)相關(guān)工作的開(kāi)展,科研管理態(tài)勢(shì)感知已積累了超過(guò)百萬(wàn)條數(shù)據(jù),涉及相關(guān)科研機(jī)構(gòu)的人、財(cái)、物等各方面數(shù)據(jù),并在收集數(shù)據(jù)、構(gòu)建數(shù)據(jù)庫(kù)時(shí),形成態(tài)勢(shì)感知數(shù)據(jù)字典,規(guī)范了數(shù)據(jù)收集與整理;建立數(shù)據(jù)匯聚與交換平臺(tái)接口規(guī)范,指導(dǎo)數(shù)據(jù)匯聚與交換平臺(tái)建設(shè)。構(gòu)建了滿(mǎn)足不同類(lèi)型數(shù)據(jù)管理的數(shù)據(jù)匯聚與交換平臺(tái),為態(tài)勢(shì)感知分析提供基礎(chǔ)數(shù)據(jù)存儲(chǔ)與分析服務(wù),并通過(guò)前置機(jī)方式能夠與其他業(yè)務(wù)系統(tǒng)進(jìn)行數(shù)據(jù)交換。梳理能夠反映中科院科研、管理與教育發(fā)展態(tài)勢(shì)的指標(biāo),并形成全面、客觀(guān)反映中科院整體發(fā)展態(tài)勢(shì)的指標(biāo)體系。初步構(gòu)建了科研競(jìng)爭(zhēng)力模型,形成可反映科研單位科技競(jìng)爭(zhēng)力的評(píng)價(jià)指標(biāo)與模型;收集、整理國(guó)內(nèi)外對(duì)標(biāo)機(jī)構(gòu)的相關(guān)數(shù)據(jù),展現(xiàn)中科院科研機(jī)構(gòu)與國(guó)內(nèi)外相關(guān)科研機(jī)構(gòu)的橫向?qū)Ρ汝P(guān)系。最后通過(guò)可視化分析引擎和態(tài)勢(shì)感知駕駛艙構(gòu)建交互式可視化的態(tài)勢(shì)感知展示系統(tǒng),初步形成中科院科研管理態(tài)勢(shì)感知總覽,提供態(tài)勢(shì)感知分析的服務(wù)能力,對(duì)深入了解中科院科研機(jī)構(gòu)的科技競(jìng)爭(zhēng)力提供數(shù)據(jù)支持。
4.3.1 態(tài)勢(shì)感知數(shù)據(jù)收集與預(yù)處理
科研管理態(tài)勢(shì)感知系統(tǒng)數(shù)據(jù)來(lái)源廣泛,既包括基于實(shí)時(shí)事務(wù)處理型應(yīng)用的關(guān)系型數(shù)據(jù)庫(kù),如新一代ARP 中科研管理、人力資源、財(cái)務(wù)管理、資產(chǎn)設(shè)備、教學(xué)管理等;也包括XML等半結(jié)構(gòu)化數(shù)據(jù),以及以視頻、音頻、文本和其他形式存在的非結(jié)構(gòu)化數(shù)據(jù),如科技成果、科技文獻(xiàn)等??蒲泄芾響B(tài)勢(shì)感知系統(tǒng)通過(guò)對(duì)這些數(shù)據(jù)進(jìn)行規(guī)范化整理組織,形成了統(tǒng)一的科研管理數(shù)據(jù)視圖,為后續(xù)數(shù)據(jù)服務(wù)和共享提供依據(jù)。
此外,為了更好地分析和展示信息,提供可靠、可信、客觀(guān)的態(tài)勢(shì)感知服務(wù),除了中科院內(nèi)部信息系統(tǒng)之外,還需要從互聯(lián)網(wǎng)、第三方等平臺(tái)上抓取或接入數(shù)據(jù),通過(guò)補(bǔ)充外部數(shù)據(jù),實(shí)現(xiàn)對(duì)多源數(shù)據(jù)的集成和管理。因此,科研管理態(tài)勢(shì)感知系統(tǒng)針對(duì)科研管理活動(dòng)過(guò)程中的相關(guān)數(shù)據(jù),如科學(xué)數(shù)據(jù)、科技文獻(xiàn)、科學(xué)傳播、智慧教育等應(yīng)用數(shù)據(jù),也包括互聯(lián)網(wǎng)管理數(shù)據(jù),如科技部、國(guó)家自然科學(xué)基金委發(fā)布數(shù)據(jù)、科技動(dòng)態(tài)、科技文獻(xiàn)、科技成果產(chǎn)出等數(shù)據(jù)進(jìn)行梳理,遵循相應(yīng)的分類(lèi)體系、分類(lèi)方法、數(shù)據(jù)格式等標(biāo)準(zhǔn)規(guī)范,將數(shù)據(jù)存入數(shù)據(jù)匯聚與交換平臺(tái)中,服務(wù)于態(tài)勢(shì)感知融合分析。
目前,科研管理態(tài)勢(shì)感知系統(tǒng)收集的數(shù)據(jù)總量超過(guò)百萬(wàn)條,其中科研人才數(shù)據(jù)約 10 萬(wàn)條,科研投入數(shù)據(jù)約 19 萬(wàn)條,科研產(chǎn)出數(shù)據(jù)約 113 萬(wàn)條,科研發(fā)展數(shù)據(jù)約 2000 條。后續(xù)隨著相關(guān)工作的開(kāi)展,數(shù)據(jù)量還會(huì)不斷增加。
4.3.2 數(shù)據(jù)匯聚與交換平臺(tái)
態(tài)勢(shì)感知系統(tǒng)數(shù)據(jù)來(lái)源多樣、異構(gòu)、異地,為了更集中展示整體信息情況、預(yù)測(cè)未來(lái)趨勢(shì),同時(shí)也為了各系統(tǒng)間能夠進(jìn)行數(shù)據(jù)交換,在遵從數(shù)據(jù)標(biāo)準(zhǔn)和接口規(guī)范的基礎(chǔ)上,數(shù)據(jù)匯聚與交換平臺(tái)初步實(shí)現(xiàn)了對(duì)ARP 數(shù)據(jù)、教育管理數(shù)據(jù)、文情數(shù)據(jù)、傳播數(shù)據(jù)和互聯(lián)網(wǎng)數(shù)據(jù)等各類(lèi)數(shù)據(jù)的匯聚;在ETL、XML等技術(shù)支撐下,形成了數(shù)據(jù)交換規(guī)范。此外,通過(guò)建立數(shù)據(jù)匯聚與交換數(shù)據(jù)庫(kù),實(shí)現(xiàn)了異構(gòu)系統(tǒng)之間的互聯(lián)互通,完成了數(shù)據(jù)的抽取、集中、加載及展現(xiàn)。
數(shù)據(jù)匯聚與交換平臺(tái)具有集成協(xié)議轉(zhuǎn)換、加密、壓縮、交換過(guò)程監(jiān)控等多種功能,保證了各信息系統(tǒng)之間數(shù)據(jù)的有效交換。同時(shí),提供客戶(hù)接入端功能,可部署在每個(gè)應(yīng)用系統(tǒng)的前置機(jī)上,實(shí)現(xiàn)了數(shù)據(jù)匯聚與交換平臺(tái)與各信息系統(tǒng)的有機(jī)結(jié)合,在客戶(hù)接入端實(shí)現(xiàn)數(shù)據(jù)的自動(dòng)提取與轉(zhuǎn)換,支持手工錄入、審核數(shù)據(jù)。它是一個(gè)為不同數(shù)據(jù)庫(kù)、不同數(shù)據(jù)格式之間,進(jìn)行數(shù)據(jù)交換而提供服務(wù)的平臺(tái),解決了不同信息庫(kù)間信息數(shù)據(jù)無(wú)法自由轉(zhuǎn)換的問(wèn)題。
4.3.3 態(tài)勢(shì)感知指標(biāo)體系
通過(guò)調(diào)研國(guó)內(nèi)外科技評(píng)價(jià)指標(biāo)體系,包括世界經(jīng)濟(jì)論壇(WEF)的《全球競(jìng)爭(zhēng)力報(bào)告》、瑞士洛桑國(guó)際管理發(fā)展學(xué)院(IMD)的《世界競(jìng)爭(zhēng)力年鑒》、全球創(chuàng)新指數(shù)(GII)、歐盟創(chuàng)新指數(shù)、羅伯特·哈金斯協(xié)會(huì)的世界知識(shí)競(jìng)爭(zhēng)力指數(shù)、學(xué)術(shù)期刊影響因子、谷歌學(xué)術(shù)指標(biāo)(H5),并充分結(jié)合中科院科技發(fā)展中各方面因素以及院級(jí)領(lǐng)導(dǎo)關(guān)心的問(wèn)題,設(shè)計(jì)完成科研管理態(tài)勢(shì)感知指標(biāo)體系,覆蓋科研人才、科研投入、科研產(chǎn)出、科研發(fā)展四個(gè)大的方面,并形成三級(jí)指標(biāo)體系,如表1所示。
表1 科研管理態(tài)勢(shì)感知指標(biāo)體系Table1 Index system for the research management situation awareness
續(xù)表1
續(xù)表1
4.3.4 態(tài)勢(shì)感知模型與數(shù)據(jù)分析
在《中科院“十三五”發(fā)展規(guī)劃綱要》中,明確提出按照“面向世界科技前沿,面向國(guó)家重大需求,面向國(guó)民經(jīng)濟(jì)主戰(zhàn)場(chǎng)”,根據(jù)率先實(shí)現(xiàn)科學(xué)技術(shù)跨越發(fā)展的目標(biāo)要求,立足我院長(zhǎng)期形成的學(xué)科基礎(chǔ)和重要領(lǐng)域,發(fā)揮隊(duì)伍和平臺(tái)優(yōu)勢(shì),重點(diǎn)圍繞基礎(chǔ)前沿交叉、先進(jìn)材料、能源、生命與健康、海洋、資源生態(tài)環(huán)境、信息、光電空間等八個(gè)重大創(chuàng)新領(lǐng)域和有關(guān)重點(diǎn)方向,進(jìn)行我院未來(lái)科技布局,促進(jìn)“三重大”產(chǎn)出,保障跨越發(fā)展目標(biāo)實(shí)現(xiàn),支撐引領(lǐng)經(jīng)濟(jì)社會(huì)發(fā)展。為了更好的反映我院科技發(fā)展水平,根據(jù)科研管理態(tài)勢(shì)感知指標(biāo)體系,結(jié)合《中科院“十三五”規(guī)劃》中的八個(gè)重大創(chuàng)新領(lǐng)域,我們首先選取了能源與信息領(lǐng)域作為科技競(jìng)爭(zhēng)力模型的研究范圍,并針對(duì)能源與信息領(lǐng)域各自特點(diǎn),設(shè)計(jì)領(lǐng)域態(tài)勢(shì)感知模型。
信息領(lǐng)域是發(fā)展最為迅速、變化最快的一個(gè)領(lǐng)域,通過(guò)信息領(lǐng)域的態(tài)勢(shì)感知數(shù)據(jù)能夠使院領(lǐng)導(dǎo)對(duì)信息領(lǐng)域相關(guān)研究所的發(fā)展水平有所了解,并掌握我院信息領(lǐng)域科研力量在國(guó)內(nèi)外所處的地位。為了將信息領(lǐng)域細(xì)分為更細(xì)的科學(xué)方向,我們采用了中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)對(duì)學(xué)科領(lǐng)域的劃分,將信息領(lǐng)域分為:(1)計(jì)算機(jī)體系結(jié)構(gòu)/高性能計(jì)算/存儲(chǔ)系統(tǒng);(2)計(jì)算機(jī)網(wǎng)絡(luò);(3)網(wǎng)絡(luò)與信息安全;(4)軟件工程/系統(tǒng)軟件/程序設(shè)計(jì)語(yǔ)言;(5)數(shù)據(jù)庫(kù)/數(shù)據(jù)挖掘/內(nèi)容檢索;(6)計(jì)算機(jī)科學(xué)理論;(7)計(jì)算機(jī)圖形學(xué)與多媒體;(8)人工智能;(9)人機(jī)交互與普適計(jì)算;(10)交叉/新興/綜合等。同時(shí),我們采用了CCF 推薦的期刊、會(huì)議論文的數(shù)據(jù),將10個(gè)細(xì)分信息領(lǐng)域的相關(guān)期刊和會(huì)議論文分為A、B、C 三類(lèi),這樣可以有效地將細(xì)分領(lǐng)域中科技論文的發(fā)表、被引情況進(jìn)行詳細(xì)的分析,再結(jié)合科技人才、科技投入、科技發(fā)展以及其他科技產(chǎn)出的情況,就可以對(duì)我院科研機(jī)構(gòu)的科技發(fā)展能力有一個(gè)全面的展示。
最后,在調(diào)研了科技評(píng)估的主要方法(包括同行評(píng)議法、特爾斐法、文獻(xiàn)計(jì)量法、層次分析法、底層等權(quán)加和法、案例研究、回溯法、經(jīng)濟(jì)計(jì)量法等)后,考慮到各個(gè)指標(biāo)之間的客觀(guān)性以及可操作性,系統(tǒng)采用底層等權(quán)加和法對(duì)態(tài)勢(shì)感知指標(biāo)進(jìn)行計(jì)算,得到各級(jí)指標(biāo)的無(wú)量綱化得分,從而實(shí)現(xiàn)不同科研機(jī)構(gòu)之間的對(duì)比。
4.3.5 態(tài)勢(shì)感知可視化
態(tài)勢(shì)感知可視化平臺(tái)包括科研人才、科研投入、科研產(chǎn)出、科研發(fā)展四大板塊,所能分析的指標(biāo)覆蓋指標(biāo)體系80%以上。支持包含論文、專(zhuān)利、經(jīng)費(fèi)、項(xiàng)目、院士、百千萬(wàn)人才項(xiàng)目、獲獎(jiǎng)等7 大類(lèi)數(shù)據(jù)、26個(gè)子類(lèi)數(shù)據(jù)的展示與分析。
平臺(tái)根據(jù)展示分析需求設(shè)計(jì)了合理的可視化方案,能較好地對(duì)比中國(guó)科學(xué)院與其它單位在論文、專(zhuān)利、經(jīng)費(fèi)、項(xiàng)目、人才、獎(jiǎng)項(xiàng)、科研影響力等方面的優(yōu)勢(shì)和劣勢(shì)。同時(shí),引入動(dòng)畫(huà)、時(shí)間軸等可視化技術(shù),將論文、專(zhuān)利、經(jīng)費(fèi)、項(xiàng)目等數(shù)據(jù)的變化趨勢(shì)按時(shí)序播放,生動(dòng)直觀(guān)地展現(xiàn)各單位在上述維度的變化趨勢(shì)和排名情況。
平臺(tái)支持多視窗關(guān)聯(lián)分析,為用戶(hù)提供靈活便捷的分析方法和流程。用戶(hù)可以自由配置篩選條件以及需要分析的指標(biāo),探索分析不同維度的相關(guān)性。同時(shí),支持多視窗的關(guān)聯(lián)交互,為用戶(hù)提供交互式的探索分析功能。用戶(hù)可以在同一界面中靈活搭配不同數(shù)據(jù)集的不同維度,在不同的數(shù)據(jù)集間搭建橋梁,從而深度挖掘數(shù)據(jù)集之間的關(guān)系。此外,平臺(tái)支持多終端訪(fǎng)問(wèn),用戶(hù)可以隨時(shí)隨地對(duì)平臺(tái)進(jìn)行訪(fǎng)問(wèn)。圖9給出了可視化展示頁(yè)面示例。
態(tài)勢(shì)感知的概念源于軍事需求,隨后被引入信息技術(shù)安全領(lǐng)域,并且隨著信息技術(shù)的發(fā)展,逐步向其他領(lǐng)域和方向發(fā)展。本文從態(tài)勢(shì)感知的概念出發(fā),首先介紹了其在戰(zhàn)場(chǎng)及網(wǎng)絡(luò)方面的應(yīng)用,并給出科研管理領(lǐng)域態(tài)勢(shì)感知的全新嘗試??蒲泄芾響B(tài)勢(shì)感知系統(tǒng)在下一階段還將進(jìn)一步開(kāi)展研發(fā)工作,通過(guò)匯聚更多科技管理數(shù)據(jù),研究更豐富的態(tài)勢(shì)感知模型,并采用人工智能等技術(shù)使其進(jìn)入到第三級(jí)“預(yù)測(cè)”階段,從而真正為管理決策提供數(shù)據(jù)支撐。
圖9 科研管理態(tài)勢(shì)感知可視化展示頁(yè)面Fig.9 Visualization of the research management situation awareness
數(shù)據(jù)與計(jì)算發(fā)展前沿2018年6期