◆劉鵬程
(中國人民公安大學(xué) 北京 100038)
隨著信息技術(shù)的發(fā)展,大數(shù)據(jù)環(huán)境下,網(wǎng)絡(luò)社交媒體的出現(xiàn)以不可阻擋之勢顛覆性地改變了人們的生活方式。傳統(tǒng)媒體時(shí)代,受制于交流渠道,政府官方是發(fā)聲主體,然而現(xiàn)在借助網(wǎng)絡(luò)社交媒體平臺,人們可以隨時(shí)隨地將獲取、接受信息,群體的匯集更是擴(kuò)大了其影響力,從個(gè)人生活逐漸輻射到政治、經(jīng)濟(jì)、軍事等各個(gè)領(lǐng)域。根據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)最新發(fā)布的第49 次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》,截至2021 年12 月,我國網(wǎng)民規(guī)模已經(jīng)達(dá)到10.32億,較2020 年12 月增長4296 萬,互聯(lián)網(wǎng)普及率達(dá)73.0%[1]。社交媒體平臺的火熱的同時(shí)不可避免地會產(chǎn)生海量的數(shù)據(jù)信息,無疑會成為開源情報(bào)重要的信息來源,這已經(jīng)引起了各國的重視。因此本文通過研究大數(shù)據(jù)時(shí)代下社交媒體平臺特點(diǎn)從而分析對開源情報(bào)工作的價(jià)值,并針對缺點(diǎn)和不足提出對策,以期為開源情報(bào)工作提供借鑒。
開源情報(bào)一定是指通過公開途徑、運(yùn)用合法手段對公開信息和資料的系統(tǒng)性搜集、處理和分析而得到的情報(bào)[2],開源情報(bào)是相對秘密情報(bào)衍生出來的,強(qiáng)調(diào)其開源的特點(diǎn),這也是開源情報(bào)與公開信息、公開資料區(qū)別的重要標(biāo)志。包括獲取手段公開,情報(bào)對象公開以及獲取途徑的公開。情報(bào)最開始服務(wù)于軍事領(lǐng)域,開源情報(bào)作為重要分支,其來源同樣源于戰(zhàn)場,開源情主要經(jīng)歷了以下幾個(gè)階段:首先是二戰(zhàn)時(shí)期,開源情報(bào)開始受到重視,主要服務(wù)于軍事領(lǐng)域;到互聯(lián)網(wǎng)時(shí)代后,眾多信息開始涌入虛擬世界,開源情報(bào)發(fā)展也進(jìn)入第二階段;最后隨著技術(shù)升級大數(shù)據(jù)的到來,信息的爆炸式增加使得開源情報(bào)的地位和作用急劇上升,從而進(jìn)入第三階段?,F(xiàn)階段開源情報(bào)對象很多,如傳統(tǒng)媒體像廣播、報(bào)紙、雜志等,以及網(wǎng)絡(luò)社交媒體微博、論壇、貼吧等等。正如美國中央情報(bào)主任霍伊特·范所言,80%的情報(bào)可以通過公開資料獲取[3]。
Web2.0 的到來使得人們借助網(wǎng)絡(luò)可輕松實(shí)現(xiàn)交流與互動,打破了時(shí)間和空間的限制,這一高效便捷的優(yōu)勢是傳統(tǒng)媒介無法比擬的,眾多社交軟件也應(yīng)運(yùn)而生。按其功能本文將其分為以下幾類:(1)通訊類,社交軟件的首要功能便是要將人們在虛擬空間中聯(lián)絡(luò)起來,這是交流的基礎(chǔ),如現(xiàn)在的微信、QQ 等;(2)論壇貼吧類,如果說通訊類社交軟件是將較為熟知的人聯(lián)絡(luò)起來,那么論壇貼吧類更像是一個(gè)會議、集會,它通過某個(gè)熱點(diǎn)事件將對其興趣的陌生人聯(lián)絡(luò)在一起,如比較知名的天涯論壇、帝吧等等;(3)展示自我型,相比前兩種這類社交軟件更加突出個(gè)人,以個(gè)人為中心,在廣闊的虛擬空間為每個(gè)人搭建屬于自己的地帶,用戶可以通過發(fā)布個(gè)人作品去吸引他人關(guān)注,如短視頻平臺,直播平臺等等。
通過在虛擬空間建立個(gè)人賬戶與外界進(jìn)行交流,用戶便可將自己在虛擬空間中的任何信息通過數(shù)據(jù)儲存下來,實(shí)質(zhì)上便是社交媒體將現(xiàn)實(shí)關(guān)系投射到網(wǎng)絡(luò)中,其中各種異構(gòu)數(shù)據(jù)相互交互,會從一定層面上反映了個(gè)人與群體的真實(shí)性[4]。從而為情報(bào)人員進(jìn)行分析研判提供了可能。
區(qū)別于傳統(tǒng)的工作方法,虛擬空間的開源情報(bào)工作特點(diǎn)有很大的不同,具體來說包括以下幾個(gè)方面:
2.1.1 隱蔽性強(qiáng)
社交平臺絕大多數(shù)是開放性平臺,任何人都可以借助平臺發(fā)聲,平臺用戶也可以瀏覽到其想搜索的信息,這就使得情報(bào)人員可以隱蔽起來,以平臺用戶的身份開展公開,幾乎不會被發(fā)覺,極大降低了情報(bào)人員暴露的風(fēng)險(xiǎn),從而保證了秘密的情報(bào)工作得以公開方式開展。同時(shí)由于社交媒體平臺的特點(diǎn),更加有助于情報(bào)工作的開展,現(xiàn)在很多社交軟件會設(shè)置程序編程接口(API),可以利用相應(yīng)軟件如Python進(jìn)行爬取,從而獲取大量數(shù)據(jù)。
2.1.2 有效降低成本
傳統(tǒng)情報(bào)工作中,為了形成高效全面的情報(bào)體制,會投入極大的資源。以美國為例,擁有全球5%的人口,每年創(chuàng)造23%的財(cái)富,但是其用于情報(bào)工作的資金卻占全球情報(bào)開支的三分之二以上。間諜更是需要用極大地成本培養(yǎng),如果在潛入其他國家開展工作被抓捕,往往需要動用外交手段。如2020 年美俄就雙方扣押的10 名和4 名間諜進(jìn)行交換,這也是冷戰(zhàn)結(jié)束以來兩國最大規(guī)模的間諜交換行動。而在網(wǎng)絡(luò)社交媒體中情報(bào)人員開展工作幾乎不需出行,只需利用專業(yè)技術(shù)在網(wǎng)絡(luò)上瀏覽分析數(shù)據(jù),通過整合匯報(bào)便可完成工作目標(biāo),極大降低了風(fēng)險(xiǎn)和情報(bào)工工作成本。
2.1.3 信息內(nèi)容豐富
社交媒體軟件信息是一個(gè)人在虛擬空間中的展示,通過其注冊的信息我們可以對其有一個(gè)大概的理解,比如年齡、籍貫、地區(qū)等等,平臺用戶也會在平臺上瀏覽網(wǎng)站、視頻等,從而根據(jù)其點(diǎn)贊、收藏推算出其個(gè)人愛好。而社交平臺注定不會是個(gè)人相互隔離的平臺,人們在虛擬空間建立個(gè)人信息后會去與其他用戶發(fā)生交互行為,并不斷深入到政治、經(jīng)濟(jì)、文化等共同感興趣的領(lǐng)域,這些都會在網(wǎng)絡(luò)中留下具體痕跡,因此通過社交平臺不光可以對其本人有一個(gè)大體的刻畫,我們還能通過他連鎖到其他節(jié)點(diǎn),勾勒出社交圈子,與其聯(lián)系密切的相關(guān)人,從而極大豐富了可獲得的信息資源。
大數(shù)據(jù)時(shí)代社交媒體平臺的蓬勃發(fā)展使人們得以站在新聞的前線,然而與傳統(tǒng)媒體相比,這種信息的傳遞并不是單向的,用戶除了通過網(wǎng)絡(luò)獲取信息,他們還可以通過網(wǎng)絡(luò)傳遞信息,用戶不再是信息的接受者,也成為信息的傳遞者。這一重大改變在促進(jìn)消息交流與共享的同時(shí)也會對情報(bào)工作產(chǎn)生諸多問題:
2.2.1 眾多信息掩蓋目標(biāo)情報(bào)
社交媒體平臺內(nèi)容豐富、板塊極多、信息更新極快,平臺用戶會根據(jù)自己的喜好進(jìn)行點(diǎn)贊、交流、轉(zhuǎn)發(fā)等,每人都會與其他聯(lián)系節(jié)點(diǎn)產(chǎn)生多條數(shù)據(jù),這些匯集起來便會是海量的信息。以國外社交軟件Twitter 為例,僅僅一天就更新4 億張?zhí)?,而這還只是社交軟件中的一小部分信息[5]。海量的信息無疑會掩蓋重要的情報(bào),如何在浩如煙海的無關(guān)資料中獲取目標(biāo)信息,這便需要情報(bào)工作者具備足夠的耐心和搜集信息能力的技術(shù)。碎片化的信息收集同樣需要情報(bào)工作者具備優(yōu)秀的信息整合能力,通過將部分信息進(jìn)行組合從而進(jìn)行整體的情報(bào)分析。
2.2.2 虛假信息混淆視聽
傳統(tǒng)媒體發(fā)聲都會有嚴(yán)格的事前和事后審查制度,而信息化時(shí)代下的社交平臺為了追求效率幾乎不會對用戶發(fā)表內(nèi)容進(jìn)行審查,甚至大多數(shù)情況下依賴于事后舉報(bào)制度,這就使得社交媒體平臺上信息魚龍混雜。平臺管理制度的漏洞也為謠言的產(chǎn)生提供了條件,如國內(nèi)微博平臺曾發(fā)生多起謠言傳播重大事件,為此平臺專門開通了ID 為“微博辟謠”的賬戶,每天針對轉(zhuǎn)發(fā)瀏覽較多的新聞進(jìn)行核實(shí),及時(shí)辟謠。情報(bào)收集是情報(bào)分析的基礎(chǔ),倘若收集的信息就是錯(cuò)誤的,那么情報(bào)分析便會一錯(cuò)再錯(cuò),從而導(dǎo)致重大的決策失誤。目前很多國家已經(jīng)開始通過人為制造虛假用戶開展情報(bào)擾亂工作。
2.2.3 情報(bào)搜集與信息保護(hù)的矛盾
盡管大數(shù)據(jù)時(shí)代社交媒體平臺的發(fā)展如火如荼,但是隨著時(shí)間推移,公眾的權(quán)利意識不斷覺醒,尤其是對隱私權(quán)的保護(hù)開始格外重視。之前一些理所應(yīng)當(dāng)?shù)男袨槿缡褂闷脚_需同意隱私條款,通過收集用戶數(shù)據(jù)分析用戶喜愛從而有針對性地推薦其瀏覽等行為均開始受到抵制,2021 年11 月1 日,《中華人民共和國個(gè)人信息保護(hù)法》正式實(shí)施,從法律層面進(jìn)一步加強(qiáng)了公民的隱私保護(hù),其中第六條第二款明確規(guī)定:“收集個(gè)人信息應(yīng)當(dāng)限于實(shí)現(xiàn)處理目的的最小范圍,不得過度收集個(gè)人信息”。因此情報(bào)工作人員在獲取開源數(shù)據(jù)時(shí)必須謹(jǐn)慎,否則很可能構(gòu)成犯罪。
信息化背景下社交媒體平臺無疑為情報(bào)工作者提供了異常豐富的情報(bào)來源,在方便用戶的同時(shí),也使情報(bào)人員足不出戶便可以收集大量信息進(jìn)行分析研判。然而處在社交媒體平臺野蠻生長的時(shí)代,總會暴露出很多問題,如何解決這些問題,在加強(qiáng)開源情報(bào)應(yīng)用的同時(shí)完善平臺自身建設(shè),使情報(bào)人員高效開展工作,具體要注意以下幾點(diǎn):
大數(shù)據(jù)時(shí)代開源情報(bào)無處不在,網(wǎng)絡(luò)社交媒體信息更是浩如煙海,如何在紛繁復(fù)雜的信息海洋中收集情報(bào),情報(bào)人員首先要緊跟發(fā)展潮流,以適應(yīng)信息化時(shí)代開源情報(bào)工作。2006 年美國《國家開源情報(bào)計(jì)劃》對開源情報(bào)工作的開展原則進(jìn)行了確定,其中一個(gè)原則即對信息來源進(jìn)行全球覆蓋[6]。社交媒體平臺已成為現(xiàn)代社會不可或缺的重要內(nèi)容,小到衣食住行大到國計(jì)民生,涵蓋了各個(gè)方面?!盁o論我們所要破解的難題如何復(fù)雜,也無論我們在搜集和存儲所需信息時(shí)可能使用的技術(shù)多么復(fù)雜,有思想的人在情報(bào)機(jī)構(gòu)中的最高地位永遠(yuǎn)都無法被代替”[7]情報(bào)分析人員要從以往傳統(tǒng)情報(bào)工作中跳出來,利用數(shù)據(jù)分析數(shù)據(jù),從而加強(qiáng)開源情報(bào)工作。
大數(shù)據(jù)技術(shù)主要由互聯(lián)網(wǎng)經(jīng)濟(jì)和商業(yè)數(shù)據(jù)分析需求推動,關(guān)鍵點(diǎn)就在于分析目標(biāo)的各類數(shù)據(jù)要盡量全部獲取[8]。面對海量數(shù)據(jù),僅僅依靠情報(bào)分析人員人海戰(zhàn)術(shù)是不可取的,必須充分利用現(xiàn)有技術(shù)。比如熟練掌握基礎(chǔ)的數(shù)據(jù)類型和質(zhì)量的清洗技術(shù)、異常值搜索和處理技術(shù)、時(shí)空基準(zhǔn)技術(shù)等等。如果能熟練運(yùn)用數(shù)據(jù)分析技術(shù),那么社交媒體平臺的數(shù)據(jù)無異于巨大的資源庫,反之將會迷失在數(shù)據(jù)的海洋中。
開源情報(bào)的顯著優(yōu)勢便是安全,以公開手段通過公開途徑獲取公開資源,然而隨著一個(gè)國家整體隱私意識的增強(qiáng),無論是平臺還是公用戶,都已經(jīng)對獲取大量信息另作他用的行為開始抵制,相關(guān)法律法規(guī)也不斷出臺。為保障開源情報(bào)的順利進(jìn)行,情報(bào)工作人員需接受相關(guān)法律意識的培訓(xùn),以風(fēng)險(xiǎn)做小的方式從事工作。
大數(shù)據(jù)網(wǎng)絡(luò)時(shí)代社交媒體是開源情報(bào)工作的重要資源,是情報(bào)工作不可或缺的一方面,價(jià)值顯著,必須充分重視起來。然而也存在不少阻礙,如虛假信息、公民隱私意識的覺醒等等,為加強(qiáng)社交媒體平臺的開源情報(bào)工作價(jià)值我們須從情報(bào)人員意識、技術(shù)以及法律素養(yǎng)三個(gè)方面入手進(jìn)行完善改革,從而促進(jìn)信息化時(shí)代開源情報(bào)有序發(fā)展。