◆杜碩碩 鄭楠
大數(shù)據(jù)背景下情報分析中思維方式的轉變
◆杜碩碩 鄭楠
(中國人民警察大學 河北 065000)
本文分析大數(shù)據(jù)環(huán)境下數(shù)據(jù)規(guī)模、數(shù)據(jù)類型的變化及對情報分析產(chǎn)生的影響,研究情報分析中思維方式的轉變。在梳理大數(shù)據(jù)對情報分析影響的基礎上,從三個方面論述了情報分析中思維方式應完成的轉變,進而有效保障情報工作的穩(wěn)定提升,為大數(shù)據(jù)環(huán)境下情報分析中思維方式的轉變提供理論參考。
大數(shù)據(jù);情報;情報分析;思維轉變
隨著網(wǎng)絡技術的深度應用,大數(shù)據(jù)時代已悄然到來。數(shù)據(jù)的規(guī)模越來越大,且具有很強的客觀性與真實性,幾乎能夠勾勒出事物的全部特征。數(shù)據(jù)的結構也發(fā)生了巨大的變化,產(chǎn)生了更多的半結構化數(shù)據(jù)與非結構化數(shù)據(jù)。麥肯錫認為:大數(shù)據(jù)已經(jīng)深度融入人們生活的各個方面,并逐漸成為重要的生產(chǎn)因素,海量數(shù)據(jù)的應用將帶來新一波消費盈余浪潮與新一輪生產(chǎn)率的增長[1]。但關于大數(shù)據(jù)的明確定義,目前尚未達成一致。城田真琴指出:大數(shù)據(jù)是人才、數(shù)據(jù)、技術、組織等要素的統(tǒng)合體[2]。高德納咨詢公司認為:大數(shù)據(jù)是需要新的模式才能具有更強的洞察力、決策力與流程優(yōu)化能力的高增長率和多樣化的信息資產(chǎn)[3]。而麥肯錫全球研究所給出的定義被大家所普遍接受:它是一種數(shù)據(jù)集合,具有規(guī)模龐大、類型眾多、價值密度低和數(shù)據(jù)流轉快速等四個基本特征,以至于傳統(tǒng)的工具和方法對其在獲取、存儲、管理和分析等方面近乎無能為力。
隨著大數(shù)據(jù)逐步應用于人們生活的各個領域,作為與人力資源、自然資源同等重要的另一種戰(zhàn)略資源,大數(shù)據(jù)在不斷顯示出其所蘊含的巨大能量與價值,這其中尤其引起人們注意的是大數(shù)據(jù)在情報領域的應用。國內的一些學者對此問題進行了相應的研究。夏一雪提出了基于輿情大數(shù)據(jù)構建情報感知指標體系并進行相關的研究,為網(wǎng)絡環(huán)境下社會安全事件的應急管理提供新的思路與方法[4]。蘇新寧認為情報學應抓住大數(shù)據(jù)帶來重大機遇,承擔起保障國家安全推進發(fā)展戰(zhàn)略的社會責任與歷史使命[5]。陳麗強在指出傳統(tǒng)網(wǎng)絡安全與情報發(fā)展中存在的問題的基礎上,探討了大數(shù)據(jù)技術的應用與發(fā)展趨勢[6]。謝爾曼●肯特指出情報是組織、是知識、是活動[7]。筆者認為,大數(shù)據(jù)為情報帶來的影響,也在這三個方面得以體現(xiàn)。
為了實現(xiàn)數(shù)據(jù)價值的最大化,大數(shù)據(jù)將倒逼情報界進行機構改革,圍繞在保持機構分離的情況下實現(xiàn)情報的深度融合這個中心點,情報界的內部及內外部關系將發(fā)生重大變化。
2.1.1情報界內部關系變革
在大數(shù)據(jù)的環(huán)境下,情報機構通過數(shù)據(jù)的傳遞共享實現(xiàn)情報工作的整體化聯(lián)系。不同情報單位應根據(jù)數(shù)據(jù)的類型與性質建立其所屬領域的數(shù)據(jù)池,在云計算等技術的支持下,采用分布式數(shù)據(jù)中心建設管理方法,從不同的數(shù)據(jù)池中采集數(shù)據(jù),實現(xiàn)情報界數(shù)據(jù)的協(xié)調、傳遞與共享。
2.1.2情報界內外部關系變革
在社會大環(huán)境中,情報界應進一步突破自身的壁壘,加強與其他組織、行業(yè)的數(shù)據(jù)聯(lián)系,實現(xiàn)社會各界從各自為政的“煙囪式”結構向以情報界為中心的“蜂巢式”結構轉變。大數(shù)據(jù)時代,情報滲入各行各業(yè),針對開源數(shù)據(jù)和跨領域數(shù)據(jù)的整體分析越來越重要,市場愈發(fā)證明,誰掌握了情報,誰就掌握主動權。同時,情報機構也需不斷地從其他行業(yè)獲取數(shù)據(jù),學習先進的數(shù)據(jù)分析技術,不斷地提升自身情報分析價值。
大數(shù)據(jù)為情報來源拓寬了范圍,海量數(shù)據(jù)為情報工作提供了更加廣闊的平臺與空間。大數(shù)據(jù)時代,產(chǎn)生情報的數(shù)據(jù)將發(fā)生巨大變化。
2.2.1數(shù)據(jù)量趨于無限
由于互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、計算機技術等的不斷發(fā)展帶來的數(shù)據(jù)爆炸,情報領域的數(shù)據(jù)量迅速增加,各個領域的數(shù)據(jù)呈現(xiàn)井噴式增長。在整體的大數(shù)據(jù)思維下,作為情報分析對象的數(shù)據(jù)集合由原來一個或者幾個針對性很強的數(shù)據(jù)集合,擴展為覆蓋范圍廣大的數(shù)據(jù)集合,這些數(shù)據(jù)雜亂龐大,覆蓋研究對象的各個方面,情報分析人員要將所有與研究對象有可能相關的數(shù)據(jù)全部置于處理的范圍之內。
2.2.2數(shù)字數(shù)據(jù)日益重要
信息以數(shù)據(jù)為載體,人類社會記錄和儲存的數(shù)據(jù)包括兩大類:數(shù)字數(shù)據(jù)和模擬數(shù)據(jù)。大數(shù)據(jù)環(huán)境下數(shù)字數(shù)據(jù)產(chǎn)出率不斷增加,模擬數(shù)據(jù)也日益數(shù)字化,數(shù)字數(shù)據(jù)在未來占的比重持續(xù)增加。
大數(shù)據(jù)在大大提高情報工作效率的同時,也很大程度上提升了情報分析的全面性與準確性。
2.3.1情報分析更加科學嚴謹
在大數(shù)據(jù)環(huán)境下,情報分析人員將不再依賴主觀判斷去獲得粗略的判斷,而是通過計算機自動化來處理加工數(shù)據(jù),再以人的判斷作為輔助。采用數(shù)據(jù)挖掘和統(tǒng)計等方法對各種信息資源轉化后的可被計算機理解、處理的數(shù)據(jù)進行計算,使隱性的知識顯性化。在數(shù)據(jù)等輸入條件一致的情況下,通過自動化分析技術進行分析,得到的結論應當是一致的。很多情況下,不同的技術手段對同一個問題可能會產(chǎn)生不同的結論,為了避免技術自身的不足帶來的偏差,在大數(shù)據(jù)的環(huán)境下,應采用多種技術方法或算法,全方位的感知數(shù)據(jù)的內容與內在關系,從而保證情報的科學嚴謹。
2.3.2數(shù)據(jù)利用更加充分有效
數(shù)據(jù)不再是過去的一次性的孤立使用,社會生活是一個連續(xù)多變的復雜過程,這意味著對一個數(shù)據(jù)的首次使用,可能僅僅只能解讀出其在某個時間點的特定特征,這種特征大都是片面的。而在大數(shù)據(jù)的環(huán)境下,關于一個事物的從始至終、由里及表的各方面數(shù)據(jù)盡在掌握,通過對數(shù)據(jù)的整體使用與重復使用,可以將事物在不同時空中產(chǎn)生的信息相互聯(lián)系、對比,從而勾勒出事物的全貌,解讀出新的乃至更加重要的信息。情報工作的數(shù)據(jù)利用不再是單一領域,數(shù)據(jù)的價值也不再局限于單一的維度。大數(shù)據(jù)時代,情報活動將不再限于最初收集數(shù)據(jù)時的目的,數(shù)據(jù)的情報作用在多領域多維度中不斷衍生、層層放大。
思維是通過動作、語言或表象實現(xiàn)的對客觀事物的概括與間接的認識,是認識的高級形式,具有間接性、概括性的特征。
在大數(shù)據(jù)到來之前,情報分析中統(tǒng)一性思維占據(jù)主要地位,情報分析人員更多的是對穩(wěn)定的、抽象的、概念的追求。當數(shù)據(jù)的風暴撲面而來,統(tǒng)一性思維顯然已經(jīng)無法進行全面的統(tǒng)籌,思維方式不得不向多樣性思維轉變。
3.1.1數(shù)據(jù)的多樣性
多樣性思維首先表現(xiàn)為數(shù)據(jù)的多樣性。在過去的情報分析中,數(shù)據(jù)的來源比較單一,且多為結構化數(shù)據(jù)。但在大數(shù)據(jù)時代,數(shù)據(jù)來源多種多樣,且存在著大量的半結構化數(shù)據(jù)和非結構化數(shù)據(jù)。結構化數(shù)據(jù)是能夠被計算機直接讀取并使用的數(shù)據(jù),一般都遵循著一定的長度規(guī)范與數(shù)據(jù)格式,有著固定的結構形態(tài)。而情報數(shù)據(jù)例如圖片、視頻等沒有固定的結構形態(tài)便是非結構數(shù)據(jù),這類數(shù)據(jù)一般不便于存儲和分析使用,通常會借助二進制語言將數(shù)據(jù)的內容大概地表現(xiàn)出來并進行編號,通過編號這個中介來實現(xiàn)數(shù)據(jù)的存儲、查找、分析與使用。半結構化數(shù)據(jù)是一種界定在結構化數(shù)據(jù)與非結構化數(shù)據(jù)之間的形態(tài)。
3.1.2多向性的需求特征
多向性的需求特征也是情報分析多樣性思維的重要表現(xiàn)。隨著計算機和信息技術的快速發(fā)展,數(shù)據(jù)工具在情報分析中的作用也呈現(xiàn)出多向性,科技的進步使得數(shù)據(jù)工具的使用也有了不同的思維內涵。在海量數(shù)據(jù)面前,數(shù)據(jù)工具不再只是一種簡單的認識工具,只識別數(shù)據(jù)的一些共有的、群體化的特征,更多的是一種創(chuàng)造價值的工具,針對特定的對象創(chuàng)造出特定的價值,滿足其不同的需求。
線性和非線性是一組相對而言的概念,在數(shù)學模型中,線性是指自變量和因變量之間是成比例變化的且一一對應,在函數(shù)上即表現(xiàn)為一條直線。非線性是指自變量與因變量之間不是成比例的變化,他們之間是一種不規(guī)則表現(xiàn)形式。
在大數(shù)據(jù)以前,數(shù)據(jù)類型較為單一,且數(shù)據(jù)之間往往具有較為緊密的聯(lián)系,情報人員進行情報分析工作時,通常采用線性思維,尋找數(shù)據(jù)之間的因果聯(lián)系,建立它們之間的線性關系,這種關系往往是直接的、規(guī)則的,可以通過線性進行直觀表示。大數(shù)據(jù)時代,數(shù)據(jù)之間的聯(lián)系更多的是間接的、不規(guī)則的,因果關系弱化,大都是千絲萬縷的相關關系,而不是由此及彼的強關系,其很難被直觀地發(fā)現(xiàn)獲取,這需要情報人員在進行數(shù)據(jù)收集整理時,應涵蓋各個方面與各個領域,將其與所分析對象相關的數(shù)據(jù)信息全部囊括在內,進行情報分析時應實現(xiàn)線性思維向非線性思維的轉變,做到對數(shù)據(jù)的整體分析,將分析焦點更多放在數(shù)據(jù)之間的相關性上面,通過對數(shù)據(jù)間若有若無的相關關系分析,實現(xiàn)對分析對象的全面掌控。
分析思維是從部分入手的一種思維方式,在大數(shù)據(jù)出現(xiàn)以前,由于技術的限制,情報人員所獲得的且可分析的數(shù)據(jù)是有限的,因此只能從部分數(shù)據(jù)中獲得數(shù)據(jù)之間的關系。情報分析人員需要從零碎的數(shù)據(jù)中獲取有價值的信息,而所獲取的信息往往是間斷的、片面的,很難刻畫出研究對象的全貌。且分析思維更加依賴情報分析人員的經(jīng)驗,主觀認識起到主導作用,這是分析思維的局限性。而整體性思維恰好彌補了這一點。大數(shù)據(jù)時代,數(shù)據(jù)龐大,數(shù)據(jù)價值密度低,進行情報分析活動時,如果僅僅圍繞某一方面或某一領域的數(shù)據(jù)進行分析,就很難得到有價值的情報。應將海量的數(shù)據(jù)看成一個整體,不應再對部分數(shù)據(jù)進行分析后得到的特征推導至整體特征,要將數(shù)據(jù)作為一個完備的整體,充分分析研究對象所涉及的各個方面與各個領域的數(shù)據(jù),注重數(shù)據(jù)的全面,將具有相關關系的數(shù)據(jù),無論強相關或弱相關全部納入數(shù)據(jù)分析的范疇,對數(shù)據(jù)的分析不再是對部分數(shù)據(jù)的分析,而是對其整體的分析。
本文是對大數(shù)據(jù)環(huán)境下情報分析中思維方式轉變的探討。首先對大數(shù)據(jù)環(huán)境下數(shù)據(jù)規(guī)模和數(shù)據(jù)類型的變化進行了分析,數(shù)據(jù)規(guī)模日益海量龐大,數(shù)據(jù)類型呈現(xiàn)多樣化。其次,從情報組織、情報知識、情報活動等三個方面具體闡述了大數(shù)據(jù)對情報分析的影響。最后,從統(tǒng)一性思維向多樣性思維轉變、線性思維向非線性思維轉變和分析思維向整體思維轉變三個方面闡明了大數(shù)據(jù)環(huán)境下情報分析中思維方式應進行的轉變??茖W技術的飛速發(fā)展為情報分析中思維轉變提供了客觀的技術條件,但思維轉變才是情報分析工作所存在問題的關鍵所在。思想決定行為,完成思維方式的轉變,情報工作方能不滯后于時代的發(fā)展。
[1]洪斌.大數(shù)據(jù)來了[J].華東科技,2015(11):16-19.
[2]城田真琴.大數(shù)據(jù)的沖擊[M].周自恒,譯.北京:人民郵電出版社,2014:8.
[3]Jackson D. Big data in little New Zealand[EB/ OL].[2019-11-26]. https:// channellife. co. nz/ story / big-data-in-little-new-zealand.
[4]夏一雪. 基于輿情大數(shù)據(jù)的社會安全事件情報感知與應用研究[J]. 現(xiàn)代情報,2019,39(11):121-127.
[5]蘇新寧. 大數(shù)據(jù)時代情報學學科崛起之思考[J]. 情報學報,2018,37(5):451-459.
[6]陳麗強.基于大數(shù)據(jù)的網(wǎng)絡安全與情報分析[D].四川大學,2017.
[7]Kent S. Strategicintelligence for American world policy[M].Princeton:Princeton University Press,2015:xxv.
[8]Wikipedia. Open-source intelligence[EB/OL].[2019-12-26]. https://en. wikipedia. org / wiki/ Open-source_intelligence.)