趙蓉英+魏緒秋
〔摘 要〕 數(shù)據(jù)時(shí)代,數(shù)據(jù)即資源,數(shù)據(jù)即服務(wù)。大數(shù)據(jù)時(shí)代,情報(bào)分析人員做好情報(bào)服務(wù)工作尤為重要。本研究首先論述了大數(shù)據(jù)相關(guān)概念、特征及發(fā)展趨勢;其次,探討了大數(shù)據(jù)環(huán)境給情報(bào)服務(wù)所帶來的機(jī)遇與挑戰(zhàn);最后,結(jié)合大數(shù)據(jù)的數(shù)據(jù)特征,構(gòu)建了大數(shù)據(jù)時(shí)代的情報(bào)服務(wù)模型。該模型充分考慮了大數(shù)據(jù)的數(shù)據(jù)特征、情報(bào)用戶對(duì)情報(bào)內(nèi)容與目的等特殊要求以及情報(bào)分析人員情報(bào)服務(wù)工作的流程,實(shí)現(xiàn)了情報(bào)服務(wù)的定制化和個(gè)性化。模型在數(shù)據(jù)處理過程中體現(xiàn)了數(shù)據(jù)-信息-知識(shí)-智慧的轉(zhuǎn)化過程:實(shí)現(xiàn)了從實(shí)時(shí)數(shù)據(jù)、動(dòng)態(tài)數(shù)據(jù)轉(zhuǎn)化為信息,隨后抽象、凝煉為知識(shí),再深度升華為智慧,最終形成智慧產(chǎn)品并提供給情報(bào)用戶,從而達(dá)到情報(bào)分析與情報(bào)服務(wù)的目的。
〔關(guān)鍵詞〕大數(shù)據(jù);情報(bào)服務(wù);服務(wù)模型;智慧產(chǎn)品
DOI:10.3969/j.issn.1008-0821.2017.08.002
〔中圖分類號(hào)〕G250.2 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2017)08-0012-06
〔Abstract〕In the era of data,data is source and data is service. It is the mostly important for intelligence analysts to do intelligence service in the era of big data. This research firstly discussed the concept,the characteristics and the development of big data. Then it explored the opportunities or challenges of intelligence services,which were brought by big data. And finally,combined with the characteristics of big data,it established intelligence service model in the era of big data. This model took the data characteristics of big data,the intelligence demands of intelligence users and the process of intelligence service work into account to implement customized service or personalized service. The transformation processing of data-information-knowledge-wisdom was reflected in the mode,i.e. it conversed real-time data and dynamic data into information,then abstracted and condensed above information into knowledge,then sublimates knowledge deeply and forms wisdom,and finally it got wisdom products that were provided to intelligence users in order to achieve intelligence analysis and the purpose of the service.
〔Key words〕big data;intelligence service;service model;wisdom product
隨著互聯(lián)網(wǎng)、通信技術(shù)的飛速發(fā)展,信息技術(shù)與人類社會(huì)的交互融合,促使數(shù)據(jù)迅猛增長,人類社會(huì)步入了大數(shù)據(jù)時(shí)代。數(shù)據(jù)時(shí)代,數(shù)據(jù)的價(jià)值無處不在,價(jià)值數(shù)據(jù)正日益影響著國家經(jīng)濟(jì)的運(yùn)行機(jī)制、社會(huì)生產(chǎn)生活方式以及國家機(jī)構(gòu)等的日常管理與經(jīng)營。大數(shù)據(jù)時(shí)代,數(shù)據(jù)即資源。數(shù)據(jù)已經(jīng)成為個(gè)人、企業(yè)組織甚至是國家機(jī)構(gòu)重要的基礎(chǔ)資源,并引起了學(xué)術(shù)界、企業(yè)界、國家政府的高度關(guān)注和重視。大數(shù)據(jù)時(shí)代,如何及時(shí)、快速、有效、低成本地從海量數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)中挖掘出有潛在應(yīng)用價(jià)值的數(shù)據(jù)并及時(shí)開展相應(yīng)的情報(bào)服務(wù)工作,以此來促進(jìn)社會(huì)經(jīng)濟(jì)增長、優(yōu)化社會(huì)生活方式,是情報(bào)機(jī)構(gòu)的研究和工作重點(diǎn)。
隨著信息革命浪潮、信息技術(shù)的快速發(fā)展以及知識(shí)經(jīng)濟(jì)時(shí)代的到來,情報(bào)服務(wù)由文獻(xiàn)傳遞走向信息服務(wù),再由信息服務(wù)逐步向知識(shí)服務(wù)的轉(zhuǎn)變;隨著大數(shù)據(jù)、互聯(lián)網(wǎng)+等新專有名詞的提出、應(yīng)用和普及,情報(bào)服務(wù)正駛向智能服務(wù)[1]。大數(shù)據(jù)時(shí)代,情報(bào)服務(wù)演變?yōu)橹悄芊?wù)。那么,在大數(shù)據(jù)環(huán)境中,情報(bào)分析人員如何開展情報(bào)服務(wù)工作將是本研究的重點(diǎn)所在。筆者基于大數(shù)據(jù)的特點(diǎn),結(jié)合情報(bào)用戶的情報(bào)需求特點(diǎn)以及情報(bào)分析人員的情報(bào)服務(wù)工作流程,充分考慮數(shù)據(jù)的實(shí)時(shí)性與動(dòng)態(tài)性,構(gòu)建大數(shù)據(jù)時(shí)代的情報(bào)服務(wù)模型,以期為情報(bào)分析人員為情報(bào)用戶開展智能服務(wù)提供一定的借鑒。
1 大數(shù)據(jù)
1.1 大數(shù)據(jù)概念及特點(diǎn)
什么是大數(shù)據(jù)?目前,學(xué)術(shù)界還沒有明確的定義。Wikipedia認(rèn)為大數(shù)據(jù)是廣義數(shù)據(jù)集術(shù)語,由于其數(shù)據(jù)量巨大、復(fù)雜程度已遠(yuǎn)遠(yuǎn)超出了傳統(tǒng)數(shù)據(jù)處理工具的范圍[2];Stephen Kaisler等對(duì)大數(shù)據(jù)的定義與維基百科類似,認(rèn)為:大數(shù)據(jù)由于數(shù)據(jù)量巨大已超越了目前技術(shù)的存儲(chǔ)、管理和處理的能力[3];Sam Madden 在談及大數(shù)據(jù)時(shí),認(rèn)為大數(shù)據(jù)意味著數(shù)據(jù)量巨大、存儲(chǔ)速度太快,現(xiàn)有的數(shù)據(jù)處理工具很難處理[4]。上述大數(shù)據(jù)的定義表述都直接或間接體現(xiàn)了大數(shù)據(jù)數(shù)據(jù)量大的特點(diǎn)。
對(duì)于大數(shù)據(jù)的數(shù)據(jù)特點(diǎn),不同學(xué)者也有著不同的認(rèn)識(shí)或論述:Arkady Zaslavsky 等[5]比較認(rèn)同大數(shù)據(jù)有3V特點(diǎn): Volume(大量)、Velocity(高速)和Variety(多樣);IAT Hashem等[6]認(rèn)為大數(shù)據(jù)具有4V特點(diǎn):Volume(大量)、Variety(多樣)、Velocity(高速)和Value(價(jià)值);Ranjit Biswas[7] 認(rèn)為大數(shù)據(jù)具有Volume(大量)、 Varity(多樣)、Velocity(高速)和Veracity(真實(shí)性) 4V特點(diǎn);Stephen Kaisler等[3]認(rèn)為大數(shù)據(jù)具有4V+1C特點(diǎn): Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價(jià)值)和Complexity(復(fù)雜性)。而筆者較為認(rèn)同大數(shù)據(jù)的4V特點(diǎn),即Volume(大量)、Variety(多樣)、Velocity(高速)和Value(價(jià)值)。
1)數(shù)據(jù)量大。數(shù)據(jù)無處不在,數(shù)據(jù)隨時(shí)產(chǎn)生。大數(shù)據(jù)時(shí)代,數(shù)據(jù)量已經(jīng)高達(dá)TB級(jí)(1 TB = 1024 GB)、PB級(jí)(1 PB = 1024 TB)甚至是EB級(jí)(1 EB = 1024 PB)、ZB級(jí)(1 ZB = 1024 EB)。IDC最新的數(shù)字宇宙(Digital Universe)研究:預(yù)計(jì)到2020年,世界上的數(shù)據(jù)存儲(chǔ)總額將達(dá)到35 ZB[8]??梢?,大數(shù)據(jù)時(shí)代,數(shù)據(jù)量之龐大已遠(yuǎn)遠(yuǎn)超出了人們的預(yù)期。
2)數(shù)據(jù)多樣。筆者認(rèn)為大數(shù)據(jù)的數(shù)據(jù)多樣性包括兩類:一是,數(shù)據(jù)來源的多樣性,包括個(gè)人、企業(yè)、政府、網(wǎng)絡(luò)等所產(chǎn)生的數(shù)據(jù);二是,數(shù)據(jù)類型的多樣性,包括數(shù)字、文本、視頻、音頻等結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。
3)數(shù)據(jù)高速。由于數(shù)據(jù)信息無處不在,數(shù)據(jù)隨時(shí)產(chǎn)生,數(shù)據(jù)正在進(jìn)行著高速增長,“火箭”式增長。Gartner認(rèn)為,信息量每年正以至少59%速度在遞增[8]??梢姡髷?shù)據(jù)時(shí)代,數(shù)據(jù)量不僅龐大,而且其增長速度之快也在人們的預(yù)料之外。
4)數(shù)據(jù)價(jià)值。大數(shù)據(jù)并不在于其數(shù)據(jù)的海量、類型眾多、增長速度快,大數(shù)據(jù)最為重要的是其所蘊(yùn)含的數(shù)據(jù)價(jià)值。對(duì)海量、多類型、復(fù)雜數(shù)據(jù)進(jìn)行采集、存儲(chǔ)和關(guān)聯(lián)分析,從中發(fā)現(xiàn)新知識(shí)、創(chuàng)造新價(jià)值正是大數(shù)據(jù)研究和應(yīng)用的關(guān)鍵所在。如沃爾瑪對(duì)超市的銷售量分析,發(fā)現(xiàn)啤酒與尿不濕的銷量之間的關(guān)系,從而對(duì)超市中啤酒與尿不濕的擺放位置進(jìn)行了相應(yīng)的調(diào)整,進(jìn)而獲得巨大的經(jīng)濟(jì)收益。由此可知,大數(shù)據(jù)所蘊(yùn)含的數(shù)據(jù)價(jià)值不言而喻。
1.2 大數(shù)據(jù)的發(fā)展前景
大數(shù)據(jù)具有良好的應(yīng)用價(jià)值和發(fā)展前景,本研究從大數(shù)據(jù)研究相關(guān)文獻(xiàn)量增長趨勢、國家政策導(dǎo)向以及大數(shù)據(jù)的應(yīng)用范圍三個(gè)方面來闡述大數(shù)據(jù)的應(yīng)用價(jià)值和發(fā)展前景。
1)研究文獻(xiàn)量呈增長態(tài)勢??茖W(xué)文獻(xiàn)數(shù)量的增長可以反映一個(gè)國家某項(xiàng)技術(shù)發(fā)展的過程和所達(dá)到的水平,從而掌握某一技術(shù)領(lǐng)域的產(chǎn)生、發(fā)展的全過程和未來的趨勢[9] 。筆者通過CNKI數(shù)據(jù)庫和Web of Science核心合集檢索與“大數(shù)據(jù)”相關(guān)的研究文獻(xiàn),并對(duì)其文獻(xiàn)累積量進(jìn)行統(tǒng)計(jì)以此來反映大數(shù)據(jù)的發(fā)展?fàn)顩r,如圖1所示。檢索條件:CNKI數(shù)據(jù)庫以“大數(shù)據(jù)”為主題,選擇SCI來源期、EI來源期刊、核心期刊和CSSCI,發(fā)表時(shí)間截止到2016年;Web of Science核心合集檢索以“big data”為主題,選擇SCI-EXPANDED、SSCI、A&HCI、CPCI-S、CPCI-SSH、ESCI、CCR-EXPANDED和IC索引,發(fā)表時(shí)間截止到2016;檢索時(shí)間為2017年2月1日。由圖1中的Web of science和CNKI的文獻(xiàn)累積量分布可知,國外有關(guān)大數(shù)據(jù)研究文獻(xiàn)可以追溯至1970年,而國內(nèi)的最早可以追溯至1992年,可見國外有關(guān)大數(shù)據(jù)的研究比國內(nèi)相關(guān)研究較早。對(duì)國內(nèi)外有關(guān)大數(shù)據(jù)研究的文獻(xiàn)積累性進(jìn)行曲線估計(jì),發(fā)現(xiàn)WOS和CNKI中數(shù)據(jù)均呈現(xiàn)指數(shù)函數(shù):WOS的模擬趨勢線為y=2.0027e0.2863x,R2=0.9417;而CNKI的模擬趨勢線為y=0.3009e0.2603x,R2=0.9827。可見,國內(nèi)外有關(guān)大數(shù)據(jù)研究的文獻(xiàn)累積量近幾年內(nèi)都呈現(xiàn)快速增長態(tài)勢,大數(shù)據(jù)相關(guān)研究工作受到學(xué)術(shù)界的高度關(guān)注和重視。筆者認(rèn)為,在今后的一段時(shí)間內(nèi),大數(shù)據(jù)相關(guān)問題的研究依舊是學(xué)術(shù)界關(guān)注的重點(diǎn),值得研究人員繼續(xù)開展相應(yīng)的研究工作。
2)國家政策導(dǎo)向。數(shù)據(jù)是國家的重要戰(zhàn)略資源,越來越多的國家已經(jīng)意識(shí)到數(shù)據(jù)的重要性,并將其納入國家計(jì)劃或上升為國家競爭戰(zhàn)略。2012年3月,美國奧巴馬政府宣布《大數(shù)據(jù)研究和發(fā)展計(jì)劃》(Big Data Research and Development Initiative),旨在提高美國從龐大復(fù)雜的數(shù)字?jǐn)?shù)據(jù)中提取知識(shí)和見解的能力,從而加速科學(xué)、工程探索的步伐,增強(qiáng)國家安全,轉(zhuǎn)變教學(xué)、學(xué)習(xí)[10];2015年9月,我國政府印發(fā)了促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要,以全面推動(dòng)我國大數(shù)據(jù)的發(fā)展和應(yīng)用,實(shí)現(xiàn)數(shù)據(jù)強(qiáng)國建設(shè)目標(biāo)[11]。筆者認(rèn)為上述計(jì)劃或行動(dòng)綱要有助于高等院校、研究單位、企業(yè)中的眾多研究人員了解大數(shù)據(jù)研究的價(jià)值所在,明確大數(shù)據(jù)研究的主要任務(wù)、研究方向,從而開展大數(shù)據(jù)及其相關(guān)研究。
3)應(yīng)用領(lǐng)域范圍廣泛。Travis B. Murdoch認(rèn)為大數(shù)據(jù)在天文學(xué)、零售銷售、搜索引擎和政治選舉中得到成功地應(yīng)用,并論述了大數(shù)據(jù)在醫(yī)療衛(wèi)生領(lǐng)域中的應(yīng)用[12];C.L. Philip Chen認(rèn)為大數(shù)據(jù)改變了人們企業(yè)經(jīng)營、管理、研究的模式,并簡要介紹了大數(shù)據(jù)在商業(yè)貿(mào)易、社會(huì)管理、科學(xué)研究中的應(yīng)用[13];維基百科認(rèn)為,大數(shù)據(jù)在政府、經(jīng)濟(jì)發(fā)、衛(wèi)生醫(yī)療、科學(xué)研究等方面有著重要的應(yīng)用??梢?,大數(shù)據(jù)應(yīng)用范圍廣泛,值得學(xué)術(shù)研究人員、企業(yè)研究人員及政府機(jī)構(gòu)研究人員開展相應(yīng)的研究工作,以此來促進(jìn)大數(shù)據(jù)在各個(gè)領(lǐng)域的發(fā)展和實(shí)際應(yīng)用。
2 大數(shù)據(jù)時(shí)代的情報(bào)服務(wù)
2.1 大數(shù)據(jù)對(duì)情報(bào)服務(wù)的影響
大數(shù)據(jù)時(shí)代,做好情報(bào)服務(wù)尤為重要。然而,大數(shù)據(jù)的4V特征既給情報(bào)服務(wù)工作帶來了一定的機(jī)遇,又帶來新的挑戰(zhàn)。
2.1.1 面臨的機(jī)遇
筆者認(rèn)為大數(shù)據(jù)給情報(bào)服務(wù)工作帶來的機(jī)遇主要體現(xiàn)在三個(gè)方面:一是,組織機(jī)構(gòu)情報(bào)觀的深入;二是,組織機(jī)構(gòu)競爭能力的提升;三是,情報(bào)服務(wù)成本的降低。
1)組織機(jī)構(gòu)情報(bào)觀的深入。大數(shù)據(jù)環(huán)境下,組織機(jī)構(gòu)所賴以生存的數(shù)據(jù)環(huán)境發(fā)生巨大變化:數(shù)據(jù)無處不在,數(shù)據(jù)隨時(shí)產(chǎn)生。隨著計(jì)算機(jī)、智能終端、互聯(lián)網(wǎng)等的普及與發(fā)展,人類社會(huì)步入數(shù)字時(shí)代。這使得情報(bào)服務(wù)人員能夠挖掘組織內(nèi)部及組織外部的數(shù)據(jù)信息,并經(jīng)過挖掘分析,及時(shí)準(zhǔn)確地掌握企業(yè)目前的自身及競爭對(duì)手的經(jīng)營狀況,發(fā)現(xiàn)消費(fèi)群體的行為特征,制定相應(yīng)的競爭策略,指導(dǎo)企業(yè)的經(jīng)營與產(chǎn)品的競爭,發(fā)揮知識(shí)資本優(yōu)勢,獲取巨大經(jīng)濟(jì)收益。在這一過程中,無疑不體現(xiàn)著企業(yè)機(jī)構(gòu)對(duì)數(shù)據(jù)、知識(shí)、情報(bào)觀念認(rèn)識(shí)的深入——通過知識(shí)獲取經(jīng)濟(jì)效益。
2)組織機(jī)構(gòu)競爭能力的提升。數(shù)據(jù)競爭、知識(shí)競爭、智慧決策是企業(yè)機(jī)構(gòu)提升核心競爭力的關(guān)鍵。大數(shù)據(jù)環(huán)境,企業(yè)將企業(yè)內(nèi)部數(shù)據(jù)和企業(yè)外部數(shù)據(jù)融合在一起,通過數(shù)據(jù)的挖掘與分析,洞察自身經(jīng)營、競爭對(duì)手以及競爭環(huán)境的數(shù)據(jù)的實(shí)時(shí)轉(zhuǎn)變,從而快速響應(yīng)并制定有效的競爭策略。以數(shù)據(jù)知識(shí)作為競爭決策的依據(jù),用智慧制定相應(yīng)的競爭戰(zhàn)略,不斷提升企業(yè)的核心競爭力、持續(xù)競爭力,從而采取或保持組織機(jī)構(gòu)的產(chǎn)品領(lǐng)先戰(zhàn)略或差異化戰(zhàn)略,幫助企業(yè)獲得競爭先機(jī),獲取巨大的經(jīng)濟(jì)效益。
3)情報(bào)服務(wù)成本的降低。大數(shù)據(jù)時(shí)代數(shù)據(jù)信息的網(wǎng)絡(luò)化,讓情報(bào)工作人員極易獲取相關(guān)數(shù)據(jù)信息,從而避免設(shè)計(jì)調(diào)查問卷、填寫調(diào)查問卷、統(tǒng)計(jì)分析調(diào)查問卷等繁瑣步驟。這不僅降低了獲取一手原始數(shù)據(jù)的資金成本,還降低了獲取一手原始數(shù)據(jù)的時(shí)間成本。為了應(yīng)對(duì)大數(shù)據(jù)時(shí)代數(shù)據(jù)手機(jī)、處理、分析的新訴求,研究人員開發(fā)的眾多應(yīng)用工具和技術(shù)(如Hadoop[14]、HBase[15]、Cassandra[16]、MongoDB[17]等)。情報(bào)分析人員運(yùn)用上述工具或技術(shù),從而獲取個(gè)人、組織機(jī)構(gòu)、國家、互聯(lián)網(wǎng)等數(shù)據(jù)信息,并對(duì)上述信息進(jìn)行挖掘與分析,最終形成智慧產(chǎn)品,從而被情報(bào)需求用戶所應(yīng)用。
2.1.2 存在的挑戰(zhàn)
筆者認(rèn)為,大數(shù)據(jù)對(duì)情報(bào)服務(wù)工作存在的影響主要體現(xiàn)在三個(gè)方面:一是,數(shù)據(jù)源來源;二是,數(shù)據(jù)處理與分析;三是,數(shù)據(jù)安全。
1)數(shù)據(jù)源問題。由大數(shù)據(jù)的特點(diǎn)可知,大數(shù)據(jù)不僅數(shù)據(jù)量大而且類型眾多、復(fù)雜程度高。情報(bào)數(shù)據(jù)的來源關(guān)系著情報(bào)質(zhì)量的高低。因此,情報(bào)分析人員在情報(bào)數(shù)據(jù)收集階段中,要充分保證數(shù)據(jù)的來源,不僅要考慮組織的內(nèi)部數(shù)據(jù)還要考慮組織外部數(shù)據(jù)(如國家政策、競爭對(duì)手、服務(wù)對(duì)象的滿意度等眾多環(huán)境因素)。只有這樣,情報(bào)分析人員才能從大數(shù)據(jù)環(huán)境中挖掘出有價(jià)值的數(shù)據(jù)情報(bào),從而較好的支持組織機(jī)構(gòu)決策與指導(dǎo)生產(chǎn)經(jīng)營。
2)數(shù)據(jù)處理與分析問題。如何從海量數(shù)據(jù)、復(fù)雜數(shù)據(jù)中及時(shí)準(zhǔn)確地挖掘出有價(jià)值的數(shù)據(jù),是大數(shù)據(jù)時(shí)代的難點(diǎn)和重點(diǎn),也是大數(shù)據(jù)時(shí)代數(shù)據(jù)服務(wù)工作所面臨的重點(diǎn)和難點(diǎn)。大數(shù)據(jù)時(shí)代,信息數(shù)據(jù)無處不在,信息數(shù)據(jù)實(shí)時(shí)產(chǎn)生。因此,對(duì)實(shí)時(shí)數(shù)據(jù)收集、處理與分析,離不開先進(jìn)的數(shù)據(jù)獲取、處理、分析技術(shù)和工具的支持和幫助。隨著大數(shù)據(jù)時(shí)代的來臨,研究人員、組織機(jī)構(gòu)甚至是政府都已經(jīng)意識(shí)到大數(shù)據(jù)的重要性,并著手對(duì)大數(shù)據(jù)獲取、處理、分析技術(shù)和工具進(jìn)行相應(yīng)的研究。如2011年,EMC推出了支持大數(shù)據(jù)分析的下一代EMC Greenplum統(tǒng)一分析平臺(tái);2011年,IBM收購了數(shù)據(jù)分析公司Netezza,開始拓展商業(yè)價(jià)值方面的市場;2011年,甲骨文發(fā)布了NoSQL數(shù)據(jù)庫企業(yè)版,這是運(yùn)行于Hadoop之上的大數(shù)據(jù)軟件之一[18];等等。
3)數(shù)據(jù)安全問題。大數(shù)據(jù)時(shí)代,數(shù)據(jù)信息的網(wǎng)絡(luò)化給我們帶了生產(chǎn)生活的便利的同時(shí),也給我們帶了一些不必要的麻煩,如在銀行辦理一張信用卡,極大方便了我們的購物消費(fèi),然而,由于信息的泄漏,信用卡極易被他人盜刷;企業(yè)數(shù)據(jù)的泄漏,可能失去競爭優(yōu)勢,甚至是倒閉;國家基礎(chǔ)建設(shè)數(shù)據(jù)的泄漏,能夠直接威脅著國家安全與穩(wěn)定,等等。因此,大數(shù)據(jù)時(shí)代,無論是個(gè)人、企業(yè)、組織機(jī)構(gòu)甚至是國家政府都要樹立數(shù)據(jù)信息安全觀念,保護(hù)好隱私數(shù)據(jù),避免重要數(shù)據(jù)的遺失或泄密。此外,國家政府可以指定相關(guān)的法律法規(guī)保護(hù)隱私數(shù)據(jù);企業(yè)行業(yè)達(dá)成協(xié)議,規(guī)范自身的行為;等等。
2.2 大數(shù)據(jù)環(huán)境下的情報(bào)服務(wù)模型
數(shù)據(jù)、信息、知識(shí)和智慧是情報(bào)學(xué)的主要研究對(duì)象[19],情報(bào)(智慧)是由數(shù)據(jù)-信息-知識(shí)-智慧鏈而來。由此可見,數(shù)據(jù)是情報(bào)(智慧)的起點(diǎn)。大數(shù)據(jù)時(shí)代,數(shù)據(jù)并不在于數(shù)據(jù)量大、復(fù)雜性高,而在于有價(jià)值數(shù)據(jù)的實(shí)際應(yīng)用。大數(shù)據(jù)時(shí)代,情報(bào)服務(wù)工作由數(shù)據(jù)服務(wù)轉(zhuǎn)變?yōu)橹悄芊?wù)。在此過程中,從眾多數(shù)據(jù)源中提取出有價(jià)值的數(shù)據(jù),轉(zhuǎn)化為知識(shí),再凝練升華為智慧,最終為情報(bào)用戶提供智慧產(chǎn)品。筆者依據(jù)從原始數(shù)據(jù)到智慧產(chǎn)品的產(chǎn)出與應(yīng)用的過程,構(gòu)建了大數(shù)據(jù)環(huán)境下的情報(bào)服務(wù)模型框架,如圖2所示。
2.2.1 大數(shù)據(jù)環(huán)境下的情報(bào)服務(wù)模型構(gòu)建原則
模型的構(gòu)建需遵循一定的原則。根據(jù)大數(shù)據(jù)的4V特征以及所提供的情報(bào)服務(wù),大數(shù)據(jù)環(huán)境下的情報(bào)服務(wù)模型的構(gòu)建應(yīng)遵循以下幾個(gè)原則:
1)系統(tǒng)性原則。大數(shù)據(jù)時(shí)代,由最基礎(chǔ)的數(shù)據(jù)到最終的情報(bào)服務(wù)這一過程中的各個(gè)階段并不是孤立存在的,而是一個(gè)有機(jī)的整體和系統(tǒng)。數(shù)據(jù)來源到情報(bào)服務(wù)是有順序性和層次性的。
2)適用性原則。數(shù)據(jù)無處不在,數(shù)據(jù)實(shí)時(shí)產(chǎn)生決定了情報(bào)服務(wù)的原始數(shù)據(jù)是實(shí)時(shí)動(dòng)態(tài)數(shù)據(jù)。因此,在構(gòu)建大數(shù)據(jù)環(huán)境下的情報(bào)服務(wù)模型時(shí),要考慮模型的實(shí)時(shí)動(dòng)態(tài)性,才能保證情報(bào)服務(wù)的準(zhǔn)確、及時(shí)。適用性是大數(shù)據(jù)環(huán)境下的情報(bào)服務(wù)模型存在的前提。
3)用戶參與原則。大數(shù)據(jù)環(huán)境下的情報(bào)服務(wù)需要情報(bào)用戶的參與。情報(bào)分析人員在開展情報(bào)服務(wù)時(shí)要充分了解情報(bào)用戶所需的要求,才能準(zhǔn)確、及時(shí)的為情報(bào)用戶開展情報(bào)服務(wù)。此外,情報(bào)用戶對(duì)所開展的情報(bào)服務(wù)質(zhì)量進(jìn)行反饋,從而有助于情報(bào)分析人員開展高質(zhì)量的情報(bào)服務(wù)。
4)經(jīng)濟(jì)性原則。運(yùn)行質(zhì)量好,運(yùn)營成本低是系統(tǒng)模型構(gòu)建的要求之一。因此,經(jīng)濟(jì)性原則也是大數(shù)據(jù)環(huán)境下情報(bào)服務(wù)模型構(gòu)建原則之一。
2.2.2 大數(shù)據(jù)環(huán)境下情報(bào)服務(wù)模型的組成要素及服務(wù)流程
根據(jù)數(shù)據(jù)-信息-知識(shí)-智慧鏈,大數(shù)據(jù)環(huán)境下的情報(bào)服務(wù)流程主要由4部分組成:一是,數(shù)據(jù)來源層;二是,數(shù)據(jù)交互層;三是,智慧產(chǎn)品產(chǎn)出層;四是,智能服務(wù)層。
1)數(shù)據(jù)來源層
數(shù)據(jù)來源層重在強(qiáng)調(diào)大數(shù)據(jù)環(huán)境下開展情報(bào)服務(wù)所需數(shù)據(jù)的全面性。數(shù)據(jù)來源層在一定程度上體現(xiàn)了大數(shù)據(jù)的量大、多樣和價(jià)值密度低的特性。因此,數(shù)據(jù)來源層是大數(shù)據(jù)環(huán)境下情報(bào)服務(wù)開展的數(shù)據(jù)前提。大數(shù)據(jù)時(shí)代,在情報(bào)數(shù)據(jù)獲取過程中,情報(bào)分析人員應(yīng)充分考慮大數(shù)據(jù)的特點(diǎn)(數(shù)據(jù)量大、類型多),將個(gè)人產(chǎn)生的數(shù)據(jù)、企業(yè)機(jī)構(gòu)所產(chǎn)生的數(shù)據(jù)、國家政府所產(chǎn)生的數(shù)據(jù)及指定的相應(yīng)的法律法規(guī)、網(wǎng)絡(luò)上的數(shù)據(jù)等納入情報(bào)數(shù)據(jù)的來源,從而實(shí)現(xiàn)結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù)的隱性知識(shí)和顯性知識(shí)的識(shí)別與發(fā)現(xiàn),進(jìn)而更好的實(shí)現(xiàn)情報(bào)服務(wù)工作。此外,大數(shù)據(jù)時(shí)代,數(shù)據(jù)量巨大,其所含有的價(jià)值密度相對(duì)較低,這也在另一個(gè)層面說明了情報(bào)數(shù)據(jù)來源的重要性:情報(bào)數(shù)據(jù)來源廣泛,極易獲得有價(jià)值的數(shù)據(jù),情報(bào)分析人員將會(huì)做出正確的判斷、分析、預(yù)測,進(jìn)而為情報(bào)用戶制定合理、有效的競爭策略;數(shù)據(jù)來源片面且數(shù)據(jù)質(zhì)量低下,情報(bào)分析人員極易挖掘出片面甚至是錯(cuò)誤的信息,從而做出片面或錯(cuò)誤的判斷及預(yù)測,最終給情報(bào)用戶造成難以估量的損失。因此,個(gè)人數(shù)據(jù)、企業(yè)機(jī)構(gòu)數(shù)據(jù)、國家數(shù)據(jù)、網(wǎng)絡(luò)數(shù)據(jù)等組成了大數(shù)據(jù)環(huán)境下的情報(bào)服務(wù)模型的數(shù)據(jù)來源層。
2)數(shù)據(jù)交互層
數(shù)據(jù)無處不在,數(shù)據(jù)實(shí)時(shí)產(chǎn)生,造就了大數(shù)據(jù)時(shí)代數(shù)據(jù)快速增長的特征。此外,數(shù)據(jù)具有時(shí)效性。情報(bào)服務(wù)尤其注重情報(bào)的準(zhǔn)確性和時(shí)效性。因此,在大數(shù)據(jù)環(huán)境下的情報(bào)服務(wù)模型框架中設(shè)置數(shù)據(jù)交互層,以此來實(shí)現(xiàn)情報(bào)源庫的動(dòng)態(tài)更新。這在一定程度上既保證數(shù)據(jù)的全面性,又保證了數(shù)據(jù)的時(shí)效性與準(zhǔn)確性。數(shù)據(jù)交互層是大數(shù)據(jù)環(huán)境下情報(bào)服務(wù)開展的數(shù)據(jù)基礎(chǔ)和保證。這就要求情報(bào)分析人員在數(shù)據(jù)收集、存儲(chǔ)、分析的過程中要充分考慮大數(shù)據(jù)快速增長、實(shí)時(shí)變化的特點(diǎn),將實(shí)時(shí)數(shù)據(jù)、動(dòng)態(tài)數(shù)據(jù)納入到情報(bào)數(shù)據(jù)分析中,既保證數(shù)據(jù)的來源,又凸顯了情報(bào)分析工作的動(dòng)態(tài)性,從而更好地處理、挖掘和分析所收集的數(shù)據(jù),從而獲得有用數(shù)據(jù)來預(yù)測并指導(dǎo)社會(huì)生產(chǎn)生活、國家政府治理、企業(yè)組織良好運(yùn)行或經(jīng)營等,提升企業(yè)、國家的競爭能力或服務(wù)水平,實(shí)現(xiàn)國家的進(jìn)步、經(jīng)濟(jì)的發(fā)展、生活的穩(wěn)定、社會(huì)的繁榮。在構(gòu)建大數(shù)據(jù)環(huán)境下的情報(bào)服務(wù)流程框架時(shí),筆者充分考慮數(shù)據(jù)的上述特點(diǎn),設(shè)計(jì)了數(shù)據(jù)交互層,從而實(shí)現(xiàn)了數(shù)據(jù)與情報(bào)源庫的實(shí)時(shí)、動(dòng)態(tài)交互,使數(shù)據(jù)源庫中的數(shù)據(jù)及時(shí)獲得補(bǔ)充,從而保證了情報(bào)分析的質(zhì)量,達(dá)到情報(bào)分析的目的。
3)智慧產(chǎn)品產(chǎn)出層
智慧產(chǎn)品產(chǎn)出層是大數(shù)據(jù)環(huán)境下情報(bào)服務(wù)開展的智慧產(chǎn)品加工過程。在該過程中,智慧產(chǎn)品由數(shù)據(jù)-信息-知識(shí)-智慧鏈而來。知識(shí)時(shí)代,知識(shí)就是資本,知識(shí)就是力量;大數(shù)據(jù)時(shí)代,數(shù)據(jù)即服務(wù),數(shù)據(jù)即情報(bào)。情報(bào)分析的最終目的是為情報(bào)用戶提供情報(bào)服務(wù)產(chǎn)品,即智慧產(chǎn)品。由于情報(bào)用戶對(duì)情報(bào)需求及目的性等的不同,情報(bào)分析人員需依據(jù)情報(bào)用戶的需求及目的,對(duì)情報(bào)源庫相應(yīng)的數(shù)據(jù)進(jìn)行處理、分析,從而為該情報(bào)用戶提供其所需的智慧產(chǎn)品,做到定制化服務(wù)、個(gè)性化服務(wù)。因此,大數(shù)據(jù)環(huán)境下的情報(bào)服務(wù)流程需要將情報(bào)用戶的情報(bào)需求納入到智慧產(chǎn)品產(chǎn)出的過程,并依據(jù)情報(bào)用戶的需求及目的性等的不同要求,情報(bào)分析人員從情報(bào)源庫中獲取相關(guān)數(shù)據(jù)信息,對(duì)其進(jìn)行處理、分析,挖掘出有價(jià)值(有用)的數(shù)據(jù),接著對(duì)這些數(shù)據(jù)進(jìn)行分類匯總或聚類后,依據(jù)數(shù)據(jù)信息的種類、特點(diǎn)及規(guī)律等,發(fā)現(xiàn)并揭示數(shù)據(jù)背后所蘊(yùn)含的信息。隨后,情報(bào)分析人員對(duì)獲取的信息進(jìn)一步地抽象、升華和凝煉,從而形成知識(shí)(或知識(shí)產(chǎn)品)。情報(bào)分析人員繼續(xù)對(duì)所形成的知識(shí)(或獲取的知識(shí)產(chǎn)品)進(jìn)行深度升華,并轉(zhuǎn)知為智,最終形成智慧產(chǎn)品??傊腔郛a(chǎn)品產(chǎn)出層存在數(shù)據(jù)-信息-知識(shí)-智慧的轉(zhuǎn)化。
4)智能服務(wù)層
智慧產(chǎn)品是情報(bào)分析人員勞動(dòng)與智慧的結(jié)晶。僅僅實(shí)現(xiàn)智慧產(chǎn)品的產(chǎn)出不是情報(bào)服務(wù)的最終目的,而智慧產(chǎn)品服務(wù)于情報(bào)用戶,被情報(bào)用戶最終得以應(yīng)用是大數(shù)據(jù)環(huán)境下情報(bào)服務(wù)開展的最終目的所在。因此,在大數(shù)據(jù)環(huán)境下的情報(bào)服務(wù)模型框架中設(shè)置智能服務(wù)層是十分有必要的。情報(bào)分析人員通過對(duì)情報(bào)庫源中的數(shù)據(jù)進(jìn)行分析獲取有價(jià)值數(shù)據(jù),轉(zhuǎn)化為信息,并抽象、凝煉為知識(shí),深度升華為智慧,最終形成智慧產(chǎn)品,并將智慧產(chǎn)品及時(shí)推送給情報(bào)用戶。情報(bào)用戶依據(jù)情報(bào)分析人員所提供的智慧產(chǎn)品,進(jìn)行相應(yīng)的管理、經(jīng)營與決策,發(fā)揮出智慧產(chǎn)品所應(yīng)有的價(jià)值,增加情報(bào)用戶的競爭能力與創(chuàng)新力。
此外,在情報(bào)分析流程服務(wù)過程中,無論是情報(bào)分析人員還是情報(bào)用戶,都應(yīng)及時(shí)交流溝通:情報(bào)用戶將情報(bào)的需求、所達(dá)到的目的清晰地表達(dá)給情報(bào)分析人員,并將情報(bào)分析人員所形成的智慧產(chǎn)品的實(shí)際實(shí)踐或應(yīng)用價(jià)值及時(shí)的反饋給情報(bào)分析人員,及時(shí)讓情報(bào)分析人員了解其情報(bào)產(chǎn)品的價(jià)值或質(zhì)量,從而更好地改進(jìn)情報(bào)服務(wù)工作;情報(bào)分析人員應(yīng)將自己情報(bào)分析的進(jìn)度及時(shí)反饋給情報(bào)用戶,讓情報(bào)用戶及時(shí)了解情報(bào)分析的進(jìn)度,并將情報(bào)分析所產(chǎn)生的智慧產(chǎn)品及時(shí)推送給情報(bào)用戶,及時(shí)跟蹤智慧產(chǎn)品的實(shí)際實(shí)踐或應(yīng)用價(jià)值,從而提高情報(bào)服務(wù)的質(zhì)量。
3 結(jié)語
大數(shù)據(jù)時(shí)代,數(shù)據(jù)即服務(wù),數(shù)據(jù)即情報(bào)。數(shù)據(jù)的量大、多樣、高速、價(jià)值4V特點(diǎn)既給情報(bào)服務(wù)帶來了機(jī)遇,又對(duì)情報(bào)服務(wù)產(chǎn)生了一定的影響。因此,在大數(shù)據(jù)環(huán)境中,情報(bào)分析人員做好情報(bào)服務(wù)工作尤為重要。情報(bào)服務(wù)工作既可以幫助情報(bào)用戶(個(gè)人、組織機(jī)構(gòu)、國家政府等)提高自身價(jià)值或競爭能力,從而適應(yīng)復(fù)雜多變的社會(huì)環(huán)境,又可以增加情報(bào)分析人員的情報(bào)收集、處理、分析和挖掘的能力,從而生產(chǎn)出更多高質(zhì)量的智慧產(chǎn)品,以促進(jìn)國家經(jīng)濟(jì)繁榮、社會(huì)進(jìn)步、人民安居樂業(yè)。
本研究從大數(shù)據(jù)環(huán)境下的數(shù)據(jù)特點(diǎn),并結(jié)合情報(bào)用戶對(duì)所需情報(bào)內(nèi)容、情報(bào)目的等特殊需求,以及情報(bào)分析工作的步驟,構(gòu)建了大數(shù)據(jù)時(shí)代的情報(bào)服務(wù)模型。該模型的4個(gè)主要層次不僅體現(xiàn)了大數(shù)據(jù)環(huán)境中數(shù)據(jù)的特點(diǎn)以及情報(bào)用戶的需求,還將情報(bào)用戶的定制化服務(wù)、個(gè)性化服務(wù)納入研究模型當(dāng)中,從而使模型較好的體現(xiàn)出大數(shù)據(jù)環(huán)境下的情報(bào)服務(wù)人性化。
總之,情報(bào)服務(wù)模型實(shí)現(xiàn)了大數(shù)據(jù)環(huán)境數(shù)據(jù)的實(shí)時(shí)收集并存儲(chǔ)在情報(bào)源庫中,并依據(jù)情報(bào)用戶的情報(bào)需求,對(duì)上述實(shí)時(shí)數(shù)據(jù)、動(dòng)態(tài)數(shù)據(jù)進(jìn)行處理、分析、挖掘轉(zhuǎn)化為信息,隨后對(duì)所獲取的信息進(jìn)行抽象、凝煉為知識(shí),再對(duì)所獲取的只是進(jìn)行深度升華為智慧,并最終形成智慧產(chǎn)品,從而被情報(bào)用戶所使用。
參 考 文 獻(xiàn)
[ 1 ] 吳晨生,李輝,付宏,等. 情報(bào)服務(wù)邁向3.0時(shí)代[J]. 情報(bào)理論與實(shí)踐,2015,(09):1-7.
[ 2 ] Wikipedia. Big Data[EB/OL]. [2015-12-10]. https://en.wikipedia.org/wiki/Big_data.
[ 3 ] Kaisler S,Armour F,Espinosa J A,et al. Big Data:Lssues and Challenges Moving Forward[C]//System Sciences (HICSS),2013 46th Hawaii International Conference on. IEEE,2013:995-1004.
[ 4 ] Madden S. From Databases to Big Data[J]. IEEE Internet Computing,2012,(3):4-6.
[ 5 ] Zaslavsky A,Perera C,Georgakopoulos D. Sensing as a Service and Big Data[J]. arXiv Preprint arXiv:1301.0159,2013.
[ 6 ] Hashem I A T,Yaqoob I,Anuar N B,et al. The Rise of “big data” on Cloud Computing:Review and Open Research Issues[J]. Information Systems,2015,(47):98-115.
[ 7 ] Biswas R. Theory of Solid Matrices & Solid Latrices,Introducing New Data Structures MA,MT:for Big Data[J]. International Journal of Algebra,2013,7(16):767-789.
[ 8 ] 大數(shù)據(jù)時(shí)代:0和1的“生活大爆炸”[EB/OL]. [2016-12-10].http://www.d1net.com/news/hyxg/88955.html.
[ 9 ] 邱均平. 信息計(jì)量學(xué)[M]. 武漢:武漢大學(xué)出版社,2007.
[ 10 ] Kalil T. Big Data is a Big Deal[EB/OL]. [2012-03-29]. https://www.whitehouse.gov/blog/2012/03/29/big-data-big-deal.
[ 11 ] 國務(wù)院. 促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要[EB/OL]. [2015-09-05]. http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.
[ 12 ] Murdoch T B,Detsky A S. The Inevitable Application of Big Data to Health Care.[J]. Jama the Journal of the American Medical Association,2013,309(13):1351-1352.
[ 13 ] Chen C P,Zhang C. Data-intensive Applications,Challenges,Techniques and Technologies:A survey on Big Data[J]. Information Sciences,2014,275(11):314-347.
[ 14 ] Hadoop[EB/LO].[2016-12-26]. http://hadoop.apache.org/.
[ 15 ] HBase [EB/LO].[2016-12-26]. http://hbase.apache.org/.
[ 16 ] Cassandra[EB/LO].[2016-12-26]. http://cassandra.apache.org/.
[ 17 ] MongoDB [EB/LO].[2016-12-26]. https://www.mongodb.org/.
[ 18 ] 大數(shù)據(jù)時(shí)代:0和1生活里的那些事[EB/LO].[2016-12-26]. http://www.d1net.com/news/hyxg/88953.html.
[ 19 ] 任福兵. 信息管理模式的演化與發(fā)展——從數(shù)據(jù)管理到智慧管理[J]. 圖書情報(bào)工作,2017,(02):41-49.
(本文責(zé)任編輯:馬 卓)