李涵霄
摘 要:隨著大數(shù)據(jù)時(shí)代的到來,信息分析工作越來越受到人們的重視。文章根據(jù)國內(nèi)信息分析的研究狀況,深入地分析了在大數(shù)據(jù)環(huán)境下,信息分析工作面臨的來自市場(chǎng)需求和技術(shù)層面的機(jī)遇以及關(guān)于信息倫理問題的挑戰(zhàn),并提出具有針對(duì)性的解決措施,希望能夠使信息分析人員在工作中規(guī)避錯(cuò)誤,提高工作效率,同時(shí)豐富信息分析領(lǐng)域的研究成果,為今后學(xué)者的研究提供參考。
關(guān)鍵詞:大數(shù)據(jù);信息分析;信息倫理問題
大數(shù)據(jù)時(shí)代的到來,使得全球信息總量呈幾何式增長(zhǎng),然而大數(shù)據(jù)所帶來的影響遠(yuǎn)不止這些,依靠數(shù)據(jù)體量巨大(Volume)、數(shù)據(jù)種類繁多(Variety)、流動(dòng)速度快(Velocity)、價(jià)值密度低(Value)的4V特性[1],大數(shù)據(jù)迅速顛覆了整個(gè)行業(yè)領(lǐng)域。從最基本的衣食住行到國家的國防軍事,幾乎所有事物都與數(shù)據(jù)相關(guān),因此,如何對(duì)這些身邊的數(shù)據(jù)進(jìn)行詳盡的分析成了每個(gè)人所面臨的難題。在這樣的背景下,大數(shù)據(jù)迫使信息分析領(lǐng)域的學(xué)者更多地關(guān)注于信息分析工作方式的創(chuàng)新層面,借以適應(yīng)變化如此迅速的社會(huì)。
1 國內(nèi)研究現(xiàn)狀
以知網(wǎng)為檢索工具,以“大數(shù)據(jù)”“大數(shù)據(jù)時(shí)代”“信息分析”“情報(bào)分析”等為關(guān)鍵詞,對(duì)檢索結(jié)果進(jìn)行可視化分析,發(fā)現(xiàn)隨著大數(shù)據(jù)熱度的上升,文獻(xiàn)數(shù)量不斷增多,并且學(xué)者的研究重點(diǎn)大多數(shù)集中在如何將大數(shù)據(jù)與信息分析相結(jié)合這一方面。在國內(nèi),最早明確地提出將大數(shù)據(jù)與信息分析相結(jié)合的是《自然》雜志在2008年出版的一系列論文,在這其中主要分析討論了大數(shù)據(jù)與情報(bào)分析之間的關(guān)系等內(nèi)容[2],為今后國內(nèi)對(duì)于大數(shù)據(jù)信息分析的研究奠定了堅(jiān)實(shí)的基礎(chǔ)。隨后的幾年時(shí)間里不斷有學(xué)者提出新的觀點(diǎn),如陳鐵勇[3]提出在大數(shù)據(jù)時(shí)代信息分析工作應(yīng)該從多層面多視角展開,對(duì)獲取的信息進(jìn)行“降噪”;官思發(fā)等[2]提出大數(shù)據(jù)信息分析應(yīng)該在改變?cè)械男畔⒎治鏊季S的同時(shí)應(yīng)該建立起完整的信息資源保障體系。除此之外,信息分析同樣涉及了其他諸多領(lǐng)域,并且研究成果豐富。這點(diǎn)主要體現(xiàn)在公安信息安全、情報(bào)分析方面,從算法周期方面,動(dòng)態(tài)地討論大數(shù)據(jù)信息分析在安全管理平臺(tái)中的應(yīng)用。然而從這些研究中,我們不難看出,由于我國大數(shù)據(jù)環(huán)境下的信息分析剛剛起步,雖然對(duì)于信息分析的工作方式、思維、工作模式已經(jīng)有了一定的成果,但是缺乏深入的研究,不能夠適應(yīng)如今多變的社會(huì)環(huán)境。
2 大數(shù)據(jù)環(huán)境下信息分析工作的機(jī)遇與挑戰(zhàn)
2.1 大數(shù)據(jù)環(huán)境下信息分析工作的機(jī)遇
2.1.1 旺盛的信息需求
即使是處于大數(shù)據(jù)環(huán)境之下,信息分析的對(duì)象依然是信息。但是與以往不同的是,此時(shí)信息的規(guī)模不斷擴(kuò)大,這一點(diǎn)可以從數(shù)據(jù)的單位看出,信息規(guī)模從最初的GB已經(jīng)達(dá)到了PB,甚至?xí)玫紼B和ZB進(jìn)行計(jì)數(shù)。然而這些數(shù)據(jù)種類繁多,每一種數(shù)據(jù)的處理方式各不相同,需要差別對(duì)待,并且這些數(shù)據(jù)并不都能夠被人們所直接利用,需要經(jīng)過一定的分析處理才能夠發(fā)揮它原有的價(jià)值。根據(jù)麥肯錫預(yù)測(cè),若把這些數(shù)據(jù)用于美國醫(yī)療保健,每年將產(chǎn)生3 000億美元的潛在價(jià)值[4],然而信息是不能夠主動(dòng)地作用于社會(huì)生產(chǎn)活動(dòng)之上的,需要通過人才將信息與生產(chǎn)生活相結(jié)合,也就是說在大數(shù)據(jù)環(huán)境之下,信息分析工作能夠創(chuàng)造出更多的財(cái)富。這也就導(dǎo)致了各企業(yè)在追求更多利益的同時(shí),將目光轉(zhuǎn)向了專業(yè)的信息分析工作,希望能夠在競(jìng)爭(zhēng)中把握先機(jī)。
2.1.2 研究重點(diǎn)的轉(zhuǎn)移
一個(gè)時(shí)代的到來必定會(huì)代替之前舊的時(shí)代,如果將兩個(gè)時(shí)代進(jìn)行對(duì)比,就能夠很容易地發(fā)現(xiàn)新時(shí)代所帶來的機(jī)遇與挑戰(zhàn)。在大數(shù)據(jù)時(shí)代來臨之前,小數(shù)據(jù)分析一直占據(jù)信息分析的半壁江山。小數(shù)據(jù)分析往往是在理論完美主義的指導(dǎo)下完成的,試圖通過對(duì)歷史數(shù)據(jù)進(jìn)行深度分析之后,達(dá)到深刻理解自我或解釋客觀現(xiàn)象的目的,其側(cè)重的是因果分析,即以解釋型分析為主[5],這就需要對(duì)于信息進(jìn)行全面細(xì)致的分析,理清邏輯脈絡(luò),而這樣的做法必定會(huì)消耗大量的時(shí)間,在追求效率的時(shí)代主旋律下,因果分析顯然有些不合時(shí)宜,雖然因果分析與相關(guān)分析的目的同樣是實(shí)現(xiàn)信息數(shù)據(jù)的價(jià)值,但是相關(guān)分析摒棄了以往復(fù)雜的程序,選擇了“從數(shù)據(jù)直接到價(jià)值”的捷徑[2],更加注重信息之間的相關(guān)關(guān)系,能夠幫助信息分析研究人員更好地預(yù)測(cè)未來即將發(fā)生的事情,從而獲得實(shí)際的利益,縮短實(shí)現(xiàn)信息價(jià)值的周期,提高信息分析效率。
2.2 大數(shù)據(jù)環(huán)境下信息分析工作的挑戰(zhàn)
2.2.1 過于追求經(jīng)濟(jì)利益,忽視科研價(jià)值
大數(shù)據(jù)環(huán)境下,節(jié)奏過快的社會(huì)生活使得人們一致朝“錢”看,大量的經(jīng)濟(jì)利益充斥著大數(shù)據(jù)環(huán)境,很多企業(yè)希望通過信息分析能夠帶來足夠多的營(yíng)業(yè)額,如eBay通過數(shù)據(jù)挖掘可精確計(jì)算出廣告中的每一個(gè)關(guān)鍵字為公司帶來的回報(bào)。通過對(duì)廣告投放的優(yōu)化,2007年以來eBay產(chǎn)品銷售的廣告費(fèi)降低了99%,而頂級(jí)賣家占總銷售額的百分比卻上升至32%[6]。誠然,實(shí)現(xiàn)信息價(jià)值的途徑之一就是將信息與商業(yè)活動(dòng)相結(jié)合,發(fā)揮信息本身包含的經(jīng)濟(jì)價(jià)值,以一個(gè)最吸引人的因素來促使人們關(guān)注信息分析領(lǐng)域,從而推動(dòng)其發(fā)展,完善信息分析工作,發(fā)展與之相關(guān)的科研工具。然而過度地追求經(jīng)濟(jì)利益,很容易導(dǎo)致人們?cè)谶M(jìn)行信息分析的過程中,忽視其本身所存在的科研價(jià)值,較少地進(jìn)行對(duì)于信息的二次挖掘。雖然經(jīng)濟(jì)水平提升上去了,但這只是一種短暫的現(xiàn)象,由于缺乏對(duì)信息背后所隱藏的學(xué)術(shù)性研究,難以從根本上找到可以提升經(jīng)濟(jì)水平的方法,從而使得經(jīng)濟(jì)停滯不前,甚至后退。雖然在大數(shù)據(jù)來臨之前,這種現(xiàn)象也曾存在,但是隨著大數(shù)據(jù)深入我們的生產(chǎn)生活,這種問題顯得越發(fā)嚴(yán)峻。如何平衡經(jīng)濟(jì)利益與科研價(jià)值,是今后各位學(xué)者面臨的一項(xiàng)挑戰(zhàn)。
2.2.2 數(shù)據(jù)龐雜,價(jià)值密度低
雖然數(shù)據(jù)總量在呈幾何式的增長(zhǎng),但是隱藏在海量數(shù)據(jù)之下的有用信息卻沒有相應(yīng)比例增長(zhǎng),反而使我們獲取有用信息的難度加大。數(shù)據(jù)種類的豐富雖然能夠使研究者涉及更加廣闊的領(lǐng)域,但是同時(shí)也對(duì)研究人員的專業(yè)素養(yǎng)提出了要求,大數(shù)據(jù)的“4V”特征表明其不僅是數(shù)據(jù)海量,對(duì)于大數(shù)據(jù)的分析將更加復(fù)雜、更追求速度、更注重實(shí)效,這就對(duì)于現(xiàn)代信息分析工作提出了新的挑戰(zhàn),2005年以前,業(yè)界一直認(rèn)為政府是信息資源的最大保有者(80%左右),信息機(jī)構(gòu)(信息中心和圖書館等)是信息資源體系中的核心節(jié)點(diǎn),而2011年麥肯錫公司的報(bào)告顯示,政府擁有約848 PB數(shù)據(jù),約占數(shù)字信息資源總量的12%左右,信息機(jī)構(gòu)的數(shù)字信息資源總量更是遠(yuǎn)遠(yuǎn)低于信息服務(wù)商的數(shù)據(jù)總量[7],這就表明了,余下的80%左右的數(shù)據(jù)都分散在社會(huì)的各個(gè)層面,無法通過簡(jiǎn)單易行的方式獲得,并且與政府所掌握的信息不同的是,這些信息具有高度的流動(dòng)性,一條有價(jià)值的信息倘若在發(fā)現(xiàn)后沒有對(duì)其進(jìn)行跟蹤處理,那么很可能會(huì)失去與這條信息的聯(lián)系,再次搜尋可謂是海底撈針。
2.2.3 個(gè)人隱私問題突顯
大數(shù)據(jù)種類繁雜,其中就包括個(gè)人隱私數(shù)據(jù)。隨著信息技術(shù)的發(fā)展,信息可以被當(dāng)作一種商品進(jìn)行交換,個(gè)人產(chǎn)生的數(shù)據(jù)脫離了主體的控制范圍,很可能在進(jìn)行商品交換的同時(shí),商家侵犯了個(gè)人的隱私。大數(shù)據(jù)時(shí)代,前所未有的數(shù)據(jù)挖掘與信息分析以及對(duì)于用戶興趣喜好的實(shí)時(shí)監(jiān)控,在用戶不知情的情況下,泄露的個(gè)人隱私信息被當(dāng)作富有價(jià)值的信息進(jìn)行深入分析,從而研究出用戶群體的需求。然而由于國內(nèi)法律體系的不健全等問題,這種侵犯?jìng)€(gè)人隱私的行為并沒有受到有效的限制,也就是說大數(shù)據(jù)環(huán)境中仍將保留著大量的個(gè)人隱私信息,在進(jìn)行信息分析工作的同時(shí),如果沒有做好信息的脫敏或者是篩選,則很有可能在不知不覺中侵犯了個(gè)人的隱私問題,違反信息的倫理要求。
3 結(jié)語
隨著大數(shù)據(jù)時(shí)代的發(fā)展,信息分析工作會(huì)越來越多地受到各方的關(guān)注,雖然目前國內(nèi)對(duì)于這方面的研究才剛剛起步,但是如果能夠把握好機(jī)遇,運(yùn)用先進(jìn)的計(jì)算機(jī)技術(shù)與網(wǎng)絡(luò)技術(shù),強(qiáng)化信息分析的處理能力,構(gòu)建合適的關(guān)系網(wǎng)絡(luò),從定性研究轉(zhuǎn)向定量研究,一定能夠很好地迎接來自各方面的挑戰(zhàn)。我們?cè)谝筇嵘畔⒎治鲅芯咳藛T的專業(yè)素養(yǎng)水平的同時(shí),也應(yīng)該注意到大數(shù)據(jù)環(huán)境中日趨增多的個(gè)人隱私信息,做好信息脫敏及篩選工作。就目前來說,結(jié)合國內(nèi)信息分析領(lǐng)域的研究情況,未來國內(nèi)信息分析領(lǐng)域的發(fā)展與互聯(lián)網(wǎng)的關(guān)系將更為緊密,從而可以大幅度地提升信息分析工作的效率和水平。
[參考文獻(xiàn)]
[1]陶雪嬌,胡曉峰,劉洋.大數(shù)據(jù)研究綜述[J].系統(tǒng)偽真學(xué)報(bào),2013(1):142-146.
[2]官思發(fā),朝樂門.大數(shù)據(jù)時(shí)代信息分析的關(guān)鍵問題、挑戰(zhàn)與對(duì)策[J].圖書情報(bào)工作,2015(3):12-18,34.
[3]陳鐵勇.大數(shù)據(jù)時(shí)代核科技信息工作的思考—從信息分析與研究談起[C].北京:中國核學(xué)會(huì)論文集,2013:76-79.
[4]陳飛.大數(shù)據(jù)時(shí)代信息經(jīng)濟(jì)發(fā)展趨勢(shì)及對(duì)策建議[J].宏觀經(jīng)濟(jì)管理,2014(3):61-62,84.
[5]王宜鴻,魏雪迎,葉鷹.大小數(shù)據(jù)集上的信息分析芻議[J].圖書館雜志,2018(12):14-19.
[6]李國杰,程學(xué)旗.大數(shù)據(jù)研究:未來科技及經(jīng)濟(jì)社會(huì)發(fā)展的重大戰(zhàn)略領(lǐng)域—大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J].中國科學(xué)院院刊,2012(6):647-657.
[7]張斌,馬費(fèi)成.大數(shù)據(jù)環(huán)境下數(shù)字信息資源服務(wù)創(chuàng)新[J].情報(bào)理論與實(shí)踐,2014(6):28-33.