羅 仙
(中國電子科技集團公司第三十研究所,四川 成都 610041)
隨著智能世界的加速到來,人工智能作為一種通用目的技術(shù)(General Purpose Technology,GPT)正與社會經(jīng)濟產(chǎn)生更多的碰撞。世界主要國家不斷加大在人工智能領(lǐng)域的戰(zhàn)略布局,美國頒布了《美國人工智能倡議》《國防部人工智能戰(zhàn)略》等AI 技術(shù)創(chuàng)新和發(fā)展戰(zhàn)略;俄羅斯將人工智能發(fā)展戰(zhàn)略納入“俄羅斯聯(lián)邦數(shù)字經(jīng)濟”國家發(fā)展計劃。與此同時,我國國家政策亦持續(xù)為人工智能層層加碼,早在《2019 年政府工作報告》中就特別指出“深化大數(shù)據(jù)、人工智能的研發(fā)應(yīng)用”,以加快AI 與各領(lǐng)域的融合發(fā)展。
當(dāng)前,人工智能技術(shù)在軍事、經(jīng)濟、社會的滲透力和推動力越來越強,開源情報也成為其主要應(yīng)用領(lǐng)域之一。機器學(xué)習(xí)、網(wǎng)絡(luò)爬蟲、智能圖像分析、自然語言處理等人工智能技術(shù)在開源情報中的廣泛應(yīng)用,使得大規(guī)模、高質(zhì)量、多樣化且極具情報價值的信息被高效能挖掘出來,開源情報數(shù)據(jù)量呈指數(shù)級增長,給開源情報帶來了顛覆性變革。未來,人工智能技術(shù)在開源情報領(lǐng)域的發(fā)展與應(yīng)用,將會顯著提升開源情報在數(shù)據(jù)規(guī)模呈爆炸式增長的網(wǎng)絡(luò)空間時代的適應(yīng)性,使其以更快的速度、更大的規(guī)模分析聚合,成為更具價值的情報產(chǎn)品。
隨著互聯(lián)網(wǎng)在全球范圍內(nèi)的迅速發(fā)展,可供人們利用的網(wǎng)絡(luò)信息飛速膨脹,互聯(lián)網(wǎng)已成為取之不盡、用之不竭的公開來源信息資源寶庫。美國中央情報中心曾指出,高達(dá)80%的情報可
以從公開信息源獲得[1],開源渠道的情報價值與日俱增,在情報體系中發(fā)揮的作用越來越大。
開源情報(Open Source Intelligence,OSINT)作為軍事情報的重要組成部分,自20 世紀(jì)中葉開始便活躍于情報體系。關(guān)于開源情報的定義,目前暫未形成統(tǒng)一描述,根據(jù)美國2006 年《國防授權(quán)法案》,“開源情報是為了響應(yīng)特定的情報需求,通過搜集和利用公開可得信息而進行情報生產(chǎn),并及時地分發(fā)給適當(dāng)?shù)氖鼙娙后w”。[2]
開源情報周期遵循情報生成的基本規(guī)律,國內(nèi)外研究學(xué)者提出過不同的開源情報周期模型,其側(cè)重點各不相同,但大致均包含從情報需求、數(shù)據(jù)收集直至反饋評估的一系列過程。從流程、技術(shù)及循環(huán)視角出發(fā),能夠?qū)﹂_源情報周期形成較全面的認(rèn)識。
從流程視角來看,田仲等人[3]認(rèn)為開源情報周期可分為需求確定、計劃指導(dǎo)、數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析和數(shù)據(jù)分發(fā)6 個環(huán)節(jié)。該模型側(cè)重呈現(xiàn)了開源情報分析的步驟和過程,從確定需求出發(fā),根據(jù)開源情報需求進行開源數(shù)據(jù)的采集工作,繼而對搜集得到的數(shù)據(jù)進行加工、處理和分析,最后將形成的開源情報產(chǎn)品分發(fā)給用戶。
從技術(shù)視角來看,由Pastor-Galindo 等人組成的西班牙研究團隊將開源情報工作周期分為搜集、分析和知識抽取3 個步驟[4]。面向網(wǎng)絡(luò)數(shù)據(jù)集,將搜集階段獲得的數(shù)據(jù)碎片視為從原料輸入到分析階段,側(cè)重于借助人工智能技術(shù),經(jīng)過諸如語義分析、回歸分析、關(guān)聯(lián)技術(shù)等,按照需求輸入形成開源情報產(chǎn)品。
從循環(huán)視角來看,蘭德公司(Rand)提出開源情報循環(huán)周期由搜集、處理、利用、生產(chǎn)4個環(huán)節(jié)組成(如圖1 所示),主要強調(diào)各組成部分的循環(huán)和反饋[5]。搜集階段是在明確的計劃或指導(dǎo)下對互聯(lián)網(wǎng)開源信息的獲取和留存;處理階段包括對海量數(shù)據(jù)進行進一步的分類、處理,將原始數(shù)據(jù)轉(zhuǎn)換為可用的情報信息;開發(fā)階段包含對信息源的驗證和信息內(nèi)容可信度的評估;展示階段包括分類和分發(fā),將有價值的開源情報產(chǎn)品提供給用戶。
當(dāng)前,開源情報在海量數(shù)據(jù)條件下,可以及時、高效、智能地完成情報分析,但同時也面臨著一些瓶頸問題。一是從量來看,開源情報的信息獲取渠道多元化,包括政府公共文件和報告、在線多媒體內(nèi)容、社交網(wǎng)絡(luò)、報紙,甚至是“深網(wǎng)”“暗網(wǎng)”的數(shù)據(jù)和信息等,采集到的數(shù)據(jù)格式各異,難以處理。二是從質(zhì)來看,開源情報信息來源不斷向互聯(lián)網(wǎng)轉(zhuǎn)移,而互聯(lián)網(wǎng)上采集到的原始數(shù)據(jù)約80%都是非結(jié)構(gòu)化數(shù)據(jù),且虛假信息層出不窮,各類數(shù)據(jù)資源魚龍混雜、真?zhèn)文?。三是從時效性來看,社交媒體等互聯(lián)網(wǎng)平臺的輿論信息,往往成為把握事態(tài)發(fā)展、推理事件范圍、預(yù)測事件態(tài)勢的第一窗口,而輿論信息是瞬時更新的,且開源情報信息容易失效。為此,探索將人工智能等新興技術(shù)應(yīng)用到開源情報工作中,可以提升開源情報搜索能力,為決策者提供有效的戰(zhàn)略情報,對在日益復(fù)雜的外部環(huán)境中保持情報競爭優(yōu)勢、維護國家安全利益具有重要意義。
一是未來開源情報渠道的價值屬性持續(xù)提升。憑借網(wǎng)絡(luò)時代社交媒體平臺的蓬勃發(fā)展,在互聯(lián)網(wǎng)上可挖掘到大規(guī)模、高質(zhì)量、多樣化且極具情報價值的信息。因此,相比其他情報渠道,開源情報兼具信息面廣、時效性高、可用性強等優(yōu)勢,在情報體系中的價值和地位將會大幅提升。
二是人工智能的應(yīng)用持續(xù)為開源情報賦能。數(shù)據(jù)處理和人工智能系統(tǒng)的計算和處理能力的巨幅增長,計算機視覺、自然語言處理等技術(shù)的廣泛應(yīng)用,以及商用人工智能應(yīng)用程序與情報數(shù)據(jù)和系統(tǒng)的有效結(jié)合,將顯著提升開源情報收集、處理數(shù)據(jù)和從數(shù)據(jù)中提取情報信息的能力。
三是開源情報推動人工智能領(lǐng)域的深化發(fā)展。隨著新的全球威脅快速演變和出現(xiàn),以及政策制定者決策周期的加快,情報分析過程及范式面臨變革。一些國際利益集團采取非正常途徑,從開源和閉源情報中挖掘敏感信息,對其他國家的重要行業(yè)、金融秩序、社會安全等構(gòu)成了較大威脅。須在提升智能融合、重塑、拓展和強化開源情報研究的可用性和時效性的同時,確保人工智能在開源情報中使用的合規(guī)性。
綜合國內(nèi)外學(xué)者提出的開源情報周期模型,以基于流程視角的開源情報周期模型為參考,同時結(jié)合人工智能技術(shù)在開源情報周期中的具體應(yīng)用,因此對“需求確定”“計劃指導(dǎo)”兩個階段不做重點分析,主要聚焦開源情報的“數(shù)據(jù)采集”“數(shù)據(jù)處理”“數(shù)據(jù)分析”“情報分發(fā)”4 個核心階段(如圖2 所示),并分別闡述人工智能技術(shù)對上述4 個核心階段的關(guān)鍵性驅(qū)動作用。
開源情報數(shù)據(jù)被隱藏在廣闊的虛擬空間原始數(shù)據(jù)中,普通的自動化檢索難以滿足海量數(shù)據(jù)的處理和分析需求。將基于人工智能的數(shù)據(jù)采集模型運用到開源情報提取中,顯著提升了開源情報在數(shù)據(jù)規(guī)模呈現(xiàn)爆炸式增長的網(wǎng)絡(luò)空間時代的適應(yīng)性。
2.1.1 自主精確搜集和篩選
開源情報數(shù)據(jù)采集階段利用人工智能驅(qū)動的自主傳感器和網(wǎng)絡(luò)爬蟲程序,實現(xiàn)持續(xù)自動抓取大量數(shù)據(jù),形成針對目標(biāo)的自主和半自主數(shù)據(jù)采集,爬蟲獲取數(shù)據(jù)的效率和覆蓋率都得到了顯著提升。同時,利用基于機器學(xué)習(xí)的分析平臺篩選社交媒體等數(shù)據(jù)源,構(gòu)建基于知識庫的主動式專題搜索引擎系統(tǒng)模型,實現(xiàn)自動化檢測,提高抓取和篩選數(shù)據(jù)的效率,并自動生成包含任務(wù)、地點和時間等要素的規(guī)范化材料。
2.1.2 個性化預(yù)處理
利用人工智能工具在采集階段進行初篩、分類等預(yù)處理,使采集到的數(shù)據(jù)更加易于后續(xù)的處理和分析,依靠深度學(xué)習(xí)模型,對海量開源情報進行多維度的學(xué)習(xí),形成高效可用的情報分類器,利用分類器進行預(yù)處理,完成采集的同時進行分類派發(fā)、存儲、管理,為后續(xù)的處理和分析環(huán)節(jié)提供結(jié)構(gòu)化的數(shù)據(jù)支撐。
2.1.3 信息優(yōu)先級排序
開源情報借助人工智能技術(shù),通過預(yù)先標(biāo)記等功能確定數(shù)據(jù)的重要性等級和優(yōu)先級排序。如利用強化學(xué)習(xí)模型,根據(jù)多維度可信特征對模型進行激勵,加強爬蟲獲取情報的可信度和相關(guān)性,同時利用情報數(shù)據(jù)類型庫對數(shù)據(jù)進行全局融合、研判與標(biāo)注,提取優(yōu)先級最高的信息。
在數(shù)據(jù)處理階段,由于開源情報數(shù)據(jù)的無序性、異構(gòu)性和龐雜性,信息量和價值點難以被界定。相比之下,人工智能技術(shù)則能突破人腦的計算速度和耐力限制,情報人員利用人工智能圖像處理等技術(shù),對采集到的數(shù)據(jù)進行清洗、甄別、比對及分類,可使格式多樣的、結(jié)構(gòu)不規(guī)則或不完整的數(shù)據(jù)轉(zhuǎn)化為“可讀性”數(shù)據(jù),極大提升數(shù)據(jù)處理的效率和穩(wěn)定性,滿足開源情報的數(shù)據(jù)處理需求。
2.2.1 大規(guī)模數(shù)據(jù)集的自動化處理
網(wǎng)絡(luò)信息時代的大規(guī)模數(shù)據(jù)集給數(shù)據(jù)處理的實時性帶來巨大的挑戰(zhàn),采用人工智能技術(shù)可實現(xiàn)以較快的速度和較大的規(guī)模執(zhí)行諸如圖像識別和分類等關(guān)鍵、耗時的任務(wù)。如計算機視覺可用于協(xié)助處理大量圖像和視頻數(shù)據(jù)流,機器學(xué)習(xí)算法可用來處理大型數(shù)據(jù)集,這些人工智能工具的發(fā)展,將使數(shù)據(jù)處理的后端以更加易于理解和可操作的形式交付至開源情報的分析階段。
2.2.2 自動分類和智能推薦
數(shù)據(jù)處理階段面臨數(shù)據(jù)格式標(biāo)準(zhǔn)化、異常數(shù)據(jù)識別、錯誤糾正、重復(fù)數(shù)據(jù)清除等環(huán)節(jié)。機器學(xué)習(xí)技術(shù)的進步,使得算法能夠?qū)Υ罅康拈_源信息進行歸類,遠(yuǎn)超傳統(tǒng)的開源情報分析人員手工完成的任務(wù)量。人工智能工具除了可以幫助處理日益增長的開源情報數(shù)據(jù),還可以顯示與開源情報任務(wù)需求最相關(guān)和最有用的信息。如推薦算法可根據(jù)開源情報人員的任務(wù)需求,發(fā)現(xiàn)模式、趨勢和相互關(guān)系,查找和標(biāo)記相關(guān)度較高的內(nèi)容。
2.2.3 早期預(yù)警
人工智能技術(shù)能夠輔助情報人員對特定分析需求保持持續(xù)的態(tài)勢感知,識別原始情報中的細(xì)微變化、隱含趨勢、潛在威脅及相關(guān)聯(lián)系,提升開源情報的精準(zhǔn)性。此外,對人工智能工具進行訓(xùn)練,識別和標(biāo)記關(guān)鍵信息,如機器學(xué)習(xí)可以幫助建立正常行為活動的基線準(zhǔn)則,識別目標(biāo)環(huán)境中不可察覺的變化,并感知異?;蚋唢L(fēng)險行為,為分析人員提供“早期預(yù)警”。
在數(shù)據(jù)分析階段,針對完成預(yù)處理的數(shù)據(jù)進行進一步的特征提取,并在此基礎(chǔ)上對數(shù)據(jù)進行整合和分析,最終形成可被利用的、有價值的情報。大數(shù)據(jù)時代,將龐大、多樣、無關(guān)聯(lián)的數(shù)據(jù)轉(zhuǎn)化為諸如趨勢走向、關(guān)鍵數(shù)據(jù)點、態(tài)勢分析等直觀可用的信息,是開源情報面臨的一大難題。人工智能技術(shù)中基于特定規(guī)則生成的算法和模型可以對所收集和處理的信息做出進一步判別,提煉出看似無用的海量信息之間的關(guān)聯(lián),挖掘出大量信息背后所蘊含的知識。
2.3.1 自主分析
人工智能工具自動化執(zhí)行某些特定類型的分析工作,使開源情報人員能夠?qū)⒏嗟臅r間密集型任務(wù)交給計算機完成。如地緣政治事件、沖突地區(qū)的政治和軍事發(fā)展等常規(guī)開源情報產(chǎn)品,人工智能工具可以完成相關(guān)信息的整合,并生成摘要報告,情報分析人員只需對其進行更新、微調(diào)或補充即可。美國國防情報局的機器輔助分析快速存儲系統(tǒng)(Machine-assisted Analytic Rapid-repository System,MARS)可連接不同來源的情報數(shù)據(jù),并自動分析原始情報[6],極大地提升了開源情報的收集、融合及分析能力。
2.3.2 模式識別和語義分析
通過對數(shù)據(jù)進行篩選和簡化,人工智能技術(shù)可以幫助開源情報人員進行語義分析和理解。例如,采用深度學(xué)習(xí)算法可識別數(shù)據(jù)流中的模式和趨勢,推斷目標(biāo)之間的關(guān)系;自然語言處理技術(shù)可以進行由語音到文本的轉(zhuǎn)錄、語音識別、文本摘要、語言翻譯等;先進的自然語義分析和模式識別技術(shù)還能夠提高復(fù)雜背景和環(huán)境下的語言、圖像及視頻識別的準(zhǔn)確性。
2.3.3 增強監(jiān)測和風(fēng)險識別
人工智能可以監(jiān)測日常情報信息變動中的增量變化,避免錯過情報信息的最佳時間窗口。通過非結(jié)構(gòu)化數(shù)據(jù)處理、動態(tài)情報分析和多源情報融合,構(gòu)建統(tǒng)一的現(xiàn)實場景,識別重要目標(biāo)和事件,發(fā)現(xiàn)規(guī)律并推斷其發(fā)展動向,察覺潛在威脅與風(fēng)險。此外,分析人員還可以利用基于人工智能的數(shù)據(jù)挖掘、情緒分析、地理定位等工具,幫助監(jiān)測和預(yù)測大規(guī)??棺h等破壞性事件,對社會潛在危機和不穩(wěn)定性做出預(yù)警。美國國防部高級研究計劃局于2019 年開展“知識導(dǎo)向型人工智能推理模式”項目,旨在用一種“基于模式的人工智能”技術(shù)感知世界各地的事件,尤其可用于發(fā)掘多媒體信息中的復(fù)雜事件,并對其進行上下文理解和時間推理,預(yù)測其發(fā)展趨勢[7]。
在情報分發(fā)階段,開源情報也面臨著兩大難題:一是面對不同類型的開源情報需求,如何針對性提供具有實時性、完整性、準(zhǔn)確性的情報產(chǎn)品;二是情報信息的共享,如何利用公共的或可訪問的數(shù)據(jù)架構(gòu)來共享數(shù)據(jù)集,并促使情報界實現(xiàn)更容易、更安全、不同密級的信息共享。
2.4.1 定制化服務(wù)
類似于人工智能可以幫助分析人員處理和確定相關(guān)數(shù)據(jù)的優(yōu)先級,也可以幫助開源情報人員根據(jù)任務(wù)需求,為不同群體定制情報服務(wù)。人工智能工具可以幫助不同群體確定其情報產(chǎn)品的優(yōu)先級,針對性推送情報讀物;機器學(xué)習(xí)模型可以智能推薦關(guān)聯(lián)度高的內(nèi)容,并隨著時間的推移采用新的數(shù)據(jù)進行自動更新。
2.4.2 可視化呈現(xiàn)
開源情報人員需將復(fù)雜的信息或規(guī)律以圖形符號的形式表達(dá)出來,實現(xiàn)對情報獲取目標(biāo)的直觀展示。利用交互式圖形、動畫和其他增強現(xiàn)實或沉浸式技術(shù)可以改變情報產(chǎn)品的呈現(xiàn)形式,可視化展示情報目標(biāo)之間的關(guān)系和網(wǎng)絡(luò),進而輔助決策人員推斷其中的關(guān)鍵影響因素。
2.4.3 按需安全分發(fā)
依靠新興技術(shù),開源情報系統(tǒng)通過提供身份認(rèn)證、訪問授權(quán)、分級管理、密碼管理、容災(zāi)備份、數(shù)據(jù)校驗等安全功能,保障數(shù)據(jù)傳輸和訪問安全以及數(shù)據(jù)存儲安全。如人工智能和云計算能夠根據(jù)用戶的屬性(如等級、角色和地點),自動化、針對性地向“需要知道”的用戶提供關(guān)鍵的、具有時間敏感性的情報。
綜上,人工智能技術(shù)在開源情報領(lǐng)域的發(fā)展與應(yīng)用,重塑了開源情報周期中的重點環(huán)節(jié),為開源情報的發(fā)展帶來了新機遇,推動開源情報工作朝著數(shù)據(jù)采集智能化、異構(gòu)數(shù)據(jù)整合化、信息識別自動化、情報知識關(guān)聯(lián)化的趨勢加速發(fā)展,對開源情報周期中的核心階段起到了巨大的賦能增效作用。
美國高度重視開源情報領(lǐng)域的創(chuàng)新與發(fā)展,早在2005 年就創(chuàng)建了國家獨立的開源情報機構(gòu),即情報總監(jiān)開源中心(Open Source Center,OSC),隸屬于美國國家情報總監(jiān)。近年來,美國情報界(Intelligence Community,IC)早已把人工智能技術(shù)融入到開源情報周期的核心環(huán)節(jié),從頂層戰(zhàn)略、防務(wù)智庫、公私合作等方面積極推動開源情報的發(fā)展。
2019 年,美國國家情報總監(jiān)辦公室(Office of the Director of National Intelligence,ODNI)發(fā)布《國家情報戰(zhàn)略》,重點關(guān)注了人工智能、自動化和高性能計算等新興技術(shù)給情報界帶來的機遇和挑戰(zhàn)[8];同年,ODNI 還發(fā)布了《AIM倡議:利用機器增強情報戰(zhàn)略》,強調(diào)AIM 倡議的目標(biāo)之一即是情報界整合利用現(xiàn)有聯(lián)邦政府和私營部門對人工智能在開源情報領(lǐng)域的研究成果,從根本上改變情報界的情報產(chǎn)出方式。次年,ODNI 頒布《2020—2022 年美國國家反情報戰(zhàn)略》,提出了反情報威脅的主要趨勢,重點闡述了越來越先進的情報功能和技術(shù),包括網(wǎng)絡(luò)工具、增強的技術(shù)監(jiān)視設(shè)備和大數(shù)據(jù)分析等帶來的威脅。
在防務(wù)智庫方面,2018 年5 月,Rand 發(fā)布研究報告《為防務(wù)機構(gòu)定義第二代開源情報》,指出得益于機器學(xué)習(xí)、自然語言處理、智能圖像分析等人工智能技術(shù)的發(fā)展與應(yīng)用,第三代開源情報能以更快的速度、更大的規(guī)模分析聚合成更具價值的情報產(chǎn)品;2020 年4 月,戰(zhàn)略與國際研究中心(Center for Strategic and International Studies,CSIS)成立技術(shù)與情報工作組,研究發(fā)布了《分析優(yōu)勢:利用新興技術(shù)來轉(zhuǎn)變情報分析》等4 份報告,重點探討新興技術(shù)對美國情報界的影響和應(yīng)用??傮w而言,美國情報界致力于利用新興技術(shù)優(yōu)化整個開源情報流程,強化美國相對于戰(zhàn)略競爭對手的情報優(yōu)勢。
在過去十幾年中,私營部門已逐步發(fā)展成為美國情報界技術(shù)和咨詢服務(wù)的主要供應(yīng)商,按照性質(zhì)和分工可以將這類私營部門分為4 類:一是防務(wù)巨頭,負(fù)責(zé)提供情報分析、風(fēng)險評估等服務(wù),如洛克希德·馬丁公司、諾斯羅普·格魯門公司、雷神公司等;二是網(wǎng)絡(luò)威脅情報公司,負(fù)責(zé)提供情報搜集、預(yù)測性情報以及威脅信息共享等,如Recorded Future 和Palantir 等;三是信息科技公司,負(fù)責(zé)提供搜索引擎技術(shù)、開源記錄軟件、自動化數(shù)據(jù)庫系統(tǒng)等技術(shù)支持,如谷歌、IBM、微軟等;四是管理咨詢公司,負(fù)責(zé)提供情報咨詢規(guī)劃、戰(zhàn)略運營及情報對策研究等,如埃森哲、博思艾倫咨詢公司、德勤咨詢公司等。因此,得益于聯(lián)邦政府的戰(zhàn)略支持和私營部門的技術(shù)優(yōu)勢,開源情報領(lǐng)域的協(xié)同發(fā)展基本滿足了美國情報界日益增長的開源情報需求。
未來,人工智能、機器學(xué)習(xí)、云計算、高級傳感器技術(shù)與開源情報的融合將更加緊密,開源情報的價值和決策輔助方面的作用將會更加顯著。值得注意的是,人工智能等新興技術(shù)在改變和增強開源情報潛力的同時,還可能被用來滲透、操縱和削弱開源情報能力,給開源情報人員帶來了前所未有的挑戰(zhàn)??梢灶A(yù)見的是,欺騙技術(shù)可以通過欺騙算法對數(shù)據(jù)錯誤進行分類;基于人工智能的虛假信息行動可以使對手以前所未有的規(guī)模傳播虛假信息;外國情報機構(gòu)可以利用反人工智能技術(shù)將“中毒”或虛假數(shù)據(jù)插入訓(xùn)練集,以破壞機器學(xué)習(xí)模型。當(dāng)前,世界主要國家還將繼續(xù)按下開源情報發(fā)展的快進鍵,我國如何提升人工智能技術(shù)和開源情報服務(wù)的融合發(fā)展值得深思,基于此提出如下建議。
一是在開源情報體系方面,建議加快建立和完善科學(xué)合理的開源情報體系,從總體上明確開源情報工作的戰(zhàn)略部署、體制機制以及發(fā)展方向。歐美等地區(qū)和國家已在短短十幾年間建立了較為完善且層次分明的開源情報體系,尤其是美國,建立了涵蓋戰(zhàn)略指導(dǎo)、機構(gòu)設(shè)置、任務(wù)管理、運行機制、教育培訓(xùn)等方面的開源情報體系,如機構(gòu)設(shè)置方面,美國國家開源委員會(National Open Source Center,NOSC)對情報界17 個機構(gòu)的開源情報行動進行統(tǒng)一協(xié)調(diào)。相比而言,我國亟待加強開源情報體系的建設(shè)及應(yīng)用,聚合政府、軍隊和業(yè)內(nèi)地方力量,共同探討采用先進技術(shù)為決策者提供戰(zhàn)略情報的方式。
二是在人工智能技術(shù)方面,建議高度重視基礎(chǔ)算法的研究和數(shù)據(jù)的深度分析,加強人工智能的數(shù)據(jù)分析和算法能力。國外情報領(lǐng)域主要圍繞機器學(xué)習(xí)、深度學(xué)習(xí)算法的優(yōu)化和應(yīng)用開展研究,如深度神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)在圖像識別、情感分析、自然語言處理等方面的應(yīng)用。相比而言,在深度學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)研究方面我們已取得進展,未來還應(yīng)不斷加強自然語言處理、計算機視覺、語音識別、機器學(xué)習(xí)等技術(shù)在開源情報各流程中的發(fā)展與應(yīng)用,促進情報的獲取、存儲、推理和應(yīng)用。
三是在情報分析人才方面,建議加大開展計算機和網(wǎng)絡(luò)操作技能、情報軟件利用、情報研究和分析、重大情報敏感意識、多語種等方面的能力培養(yǎng)。重視開源情報人才多層次供給,開展多維度的能力培養(yǎng)和技能培訓(xùn),是跨越當(dāng)前開源情報人才現(xiàn)狀與日益提升的開源情報工作需求鴻溝的關(guān)鍵所在。例如,美國開源中心下屬的開源學(xué)院定期開展專業(yè)的、成體系的開源技能培訓(xùn);澳大利亞國家開源情報中心十分重視計算機和網(wǎng)絡(luò)操作技能、情報軟件利用、情報研究和分析、重大情報敏感意識、報告寫作能力、多語種等方面的能力培養(yǎng)。我國應(yīng)加強開源情報人才多維度、多方面能力的培養(yǎng),不斷提升利用開源信息服務(wù)決策的能力。
四是在社會科技力量方面,建議加強國家情報力量與高科技企業(yè)間的緊密聯(lián)系,在保障國家安全的前提下,充分發(fā)揮地方科技資源優(yōu)勢,提升情報智能化速度。人臉識別、語音識別和自然語言處理等技術(shù)在商業(yè)領(lǐng)域已取得良好的應(yīng)用效果。美國國家情報力量與高科技企業(yè)間建立了緊密的關(guān)系,許多重大項目通過市場化運作高效執(zhí)行。我國在智能語音、圖像識別翻譯等應(yīng)用方面已取得不少成果,未來開源情報的發(fā)展應(yīng)進一步吸納商業(yè)創(chuàng)新力量和成果,加快融合發(fā)展。