国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

對大數(shù)據(jù)的多維度解讀研究

2019-05-06 09:27:50沈娟
關(guān)鍵詞:解讀大數(shù)據(jù)維度

沈娟

中圖分類號:C37 文獻(xiàn)標(biāo)識:A 文章編號:1674-1145(2019)12-157-02

摘 要 隨著科技的飛速發(fā)展,各種數(shù)據(jù)蜂擁而來,大數(shù)據(jù)時(shí)代已然來臨,深刻地影響著社會的各個(gè)方面。大眾并不是數(shù)據(jù)專家,對數(shù)據(jù)的了解不夠深入。通過對大數(shù)據(jù)的特征進(jìn)行分析,多維度解讀大數(shù)據(jù)的內(nèi)涵,清楚認(rèn)識到大數(shù)據(jù)面臨的困境,從而更好的利用大數(shù)據(jù)服務(wù)于社會,建設(shè)數(shù)據(jù)化國家。

關(guān)鍵詞 大數(shù)據(jù) 維度 解讀

自從2015年國務(wù)院印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》之后,大數(shù)據(jù)已經(jīng)上升為國家戰(zhàn)略,大數(shù)據(jù)逐漸被大眾所熟悉。但是“何為大數(shù)據(jù)”,大數(shù)據(jù)如何在生活中應(yīng)用,普通大眾并不是很清楚,因此對大數(shù)據(jù)的全方位解讀是很有必要的。

一、大數(shù)據(jù)的特征

關(guān)于大數(shù)據(jù)的定義,目前并沒有統(tǒng)一的定論,各個(gè)領(lǐng)域?qū)ζ涠加凶约旱膶I(yè)定義。世界著名思想庫麥肯錫( MGI) 認(rèn)為: “大數(shù)據(jù)是指大小超出了典型數(shù)據(jù)軟件工具收集、存儲、管理和分析能力的數(shù)據(jù)集。”[1]蓋特納( Gartner) 公司認(rèn)為: “大數(shù)據(jù)是大容量、高速度和形式多樣的信息資產(chǎn),它需要低成本的、形式創(chuàng)新的信息處理,以增強(qiáng)洞察力和輔助決策?!蓖孔优嬲J(rèn)為:“大數(shù)據(jù)”之“大”,并不僅僅指“容量大”。??更多的意義在于:人類可以‘分析和使用的數(shù)據(jù)在大量增加,通過這些數(shù)據(jù)的交換、整合和分析,人類可以發(fā)現(xiàn)新的知識,創(chuàng)造新的價(jià)值,帶來 “大知識”、“大科技”、“大利潤”和“大發(fā)展”。[2]有學(xué)者認(rèn)為,大數(shù)據(jù)有廣義和狹義之分,廣義是指所有可以在電腦上儲存的數(shù)據(jù),而狹義上所指傳統(tǒng)的數(shù)字類,比如1、2、3、4等小數(shù)據(jù)??梢姡诓煌囊暯?,對大數(shù)據(jù)的定義也是各有偏重。

(一)大數(shù)據(jù)規(guī)模巨大

隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,計(jì)算機(jī)硬件的處理速度和儲存能力,一到兩年就會提升一倍。硬盤的容量是越來越大,而價(jià)格卻在不斷下降,可見計(jì)算機(jī)硬件的技術(shù)將持續(xù)發(fā)展,而價(jià)格將會下跌。計(jì)算機(jī)硬件的發(fā)展速度,使全世界的數(shù)據(jù)處理和存儲速度越來越快,越來越便捷,還越來越便宜,這讓海量數(shù)據(jù)的存儲成為了可能。

另外,數(shù)據(jù)的規(guī)模越來越大。2011年的時(shí)候,美國國家安全局電話監(jiān)控的數(shù)據(jù)量就已經(jīng)是非常驚人的了,它每六個(gè)小時(shí)產(chǎn)生的數(shù)據(jù)量就相當(dāng)于美國國會圖書館所有印刷體藏書的信息總量。而美國國會圖書館是世界上館藏量最大的圖書館。而在今天的大數(shù)據(jù)時(shí)代,無處不在的傳感器收集到的數(shù)據(jù)規(guī)模更是呈幾何式暴增,大數(shù)據(jù)已經(jīng)從幾個(gè)TB發(fā)展到了幾個(gè)PB(數(shù)千TB)。

(二)大數(shù)據(jù)種類繁多

在大數(shù)據(jù)時(shí)代,萬物皆是數(shù)據(jù),只要能存儲在計(jì)算機(jī)上的都可以稱之為數(shù)據(jù),包括文字、音頻、視頻、圖片、地理位置信息等等。隨著互聯(lián)網(wǎng)的迅速發(fā)展,智能手機(jī)的普及,新的數(shù)據(jù)來源和新的數(shù)據(jù)種類在不斷增加。從傳感器、攝像頭到微博、微信、網(wǎng)購等信息,來自于不同渠道的數(shù)據(jù)正以不同的形式展現(xiàn)出來。這些數(shù)據(jù)以不同的格式存儲在不同的平臺上。

從數(shù)據(jù)的種類來看,包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)指的是傳統(tǒng)意義上的小數(shù)據(jù),而半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)意指類似于文本、音頻視頻、圖片等非傳統(tǒng)意義上的數(shù)據(jù)。其中,半結(jié)構(gòu)數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)所占比例越來越大。

(三)大數(shù)據(jù)價(jià)值重大

大數(shù)據(jù)作為一個(gè)單獨(dú)的個(gè)體是沒有什么意義的,但是數(shù)據(jù)的不斷組合、不斷重組,會發(fā)現(xiàn)其新的價(jià)值。收集的數(shù)據(jù)越多,得到的信息也就越多,可以對主體進(jìn)行準(zhǔn)確的描述。只要愿意,對一個(gè)人從出生到死亡的數(shù)據(jù)都可以收集到,從而可以完整地描述出這個(gè)人的一生。

通過對大量的數(shù)據(jù)信息進(jìn)行分析匯總,可以從看似沒有關(guān)聯(lián)的事物當(dāng)中獲取有價(jià)值的規(guī)律。商業(yè)公司可以從大數(shù)據(jù)中發(fā)現(xiàn)利潤增長點(diǎn),比如每年的支付寶賬單都可以看出消費(fèi)的偏好,不難發(fā)現(xiàn),女性的支出會比較多,并且發(fā)現(xiàn)在服裝、鞋帽、化妝品等都是高利潤的商品。這對一個(gè)商業(yè)公司來說,數(shù)據(jù)無疑幫它挖掘出了商業(yè)價(jià)值。

(四)大數(shù)據(jù)速度快

大數(shù)據(jù)具有高速的特點(diǎn),1秒定律,可從各種類型的數(shù)據(jù)中快速獲得高價(jià)值的信息,大數(shù)據(jù)產(chǎn)生的速度很快,現(xiàn)在只需要兩天就能夠創(chuàng)造出自文明誕生以來到今天所產(chǎn)生的數(shù)據(jù)總和。現(xiàn)在的數(shù)據(jù)每天呈一種爆炸狀態(tài):同一類型的數(shù)據(jù)量在快速增長;不同類型的數(shù)據(jù)量也在飛速增長;數(shù)據(jù)增長的速度在加快。

另外大數(shù)據(jù)也具有即時(shí)性的特點(diǎn),能夠更快地滿足實(shí)時(shí)性的要求?,F(xiàn)在大多數(shù)人開車的時(shí)候都會啟動導(dǎo)航,而地圖導(dǎo)航軟件收到用戶的導(dǎo)航需求時(shí),會即時(shí)開始導(dǎo)航。同時(shí)也會搜集同一時(shí)刻用戶的信息,能夠預(yù)測擁堵路段,包括還要擁堵的時(shí)間,同時(shí)進(jìn)行路線新的規(guī)劃,繞開擁堵路段。

二、大數(shù)據(jù)的內(nèi)涵

大數(shù)據(jù)時(shí)代悄然而至,每個(gè)人都在每時(shí)每刻不停地產(chǎn)生數(shù)據(jù),同時(shí)也在運(yùn)用各種數(shù)據(jù),人們逐漸認(rèn)識到大數(shù)據(jù)給自己帶來的改變,對大數(shù)據(jù)的認(rèn)識也日益清晰。

(一)大數(shù)據(jù)是一種戰(zhàn)略資源

大數(shù)據(jù)作為信息革命的核心,是猶如石油一樣寶貴的戰(zhàn)略物資。大數(shù)據(jù)的核心是預(yù)測,通過對大量的數(shù)據(jù)的分析建模,可以對有些事情進(jìn)行精準(zhǔn)預(yù)測,大數(shù)據(jù)將是決策的重要依據(jù)。誰掌握了大數(shù)據(jù),誰就占了先機(jī)。谷歌公司就是根據(jù)用戶的搜索訪問數(shù)據(jù),比當(dāng)?shù)胤酪卟块T還要早一步預(yù)測出流感的爆發(fā)。

另外,通過大數(shù)據(jù),可以完整的還原出一個(gè)人的行為軌跡,甚至能夠了解其思想的演變軌跡,那么對社會的主流意識形態(tài)應(yīng)該能夠掌握其發(fā)展趨勢,把控住社會意識形態(tài)的安全。

再者,數(shù)據(jù)會成為社會財(cái)富增長的支撐點(diǎn)。通過對顧客的消費(fèi)數(shù)據(jù)進(jìn)行分析,可以清楚地知道顧客的消費(fèi)喜好,從而針對性地投放廣告,自然會讓銷售額不斷提升。

(二)大數(shù)據(jù)是一種思維方法

以前的思維方式是執(zhí)著于追究因果關(guān)系,而大數(shù)據(jù)時(shí)代卻只看相關(guān)關(guān)系,從事物的相關(guān)關(guān)系中找出規(guī)律,預(yù)測出未來的事物走向。這完全突破了以前固有的苦苦追尋因果關(guān)系思維模式,讓工作更有效率。畢竟有些事情知道是什么就夠了,沒有必要一定知道為什么。在淘寶主頁面的推薦往往是根據(jù)你平時(shí)的搜索記錄來進(jìn)行關(guān)聯(lián)性推薦,這種算法模型就是梳理出各種有趣的相關(guān)關(guān)系,背后的原因反而并不重要。

相關(guān)關(guān)系,是預(yù)測的關(guān)鍵。在海量的數(shù)據(jù)中,尋找相關(guān)關(guān)系,能夠更容易、更迅速、更清晰地分析事物,從而預(yù)測可能發(fā)生的事情。

(三)大數(shù)據(jù)是一種科學(xué)工具

在小數(shù)據(jù)時(shí)代,只能依靠一小部分的數(shù)據(jù)來進(jìn)行研究,主要是樣本研究。通過一小部分的數(shù)據(jù)進(jìn)行樣本研究,來證實(shí)某些發(fā)現(xiàn)。這些數(shù)據(jù)的采集都是隨機(jī)采樣,期望用最少的數(shù)據(jù)獲得最多的信息,而且由于技術(shù)的原因,也沒有辦法收集所有的數(shù)據(jù),但是小部分并不能完全代表所有可能的情況。

在大數(shù)據(jù)時(shí)代,技術(shù)的發(fā)展,讓全部數(shù)據(jù)的收集成為了可能,大數(shù)據(jù)就是全部。雖然不可能真的研究所有的數(shù)據(jù),但是只要想,可以盡可能的收集最多、最完善的數(shù)據(jù)。通過對大規(guī)模的數(shù)據(jù)進(jìn)行搜集,然后建立數(shù)據(jù)模型,進(jìn)行算法分析,找出相關(guān)規(guī)律,最終得出精準(zhǔn)預(yù)測。

(四)大數(shù)據(jù)是一種話語權(quán)

在大數(shù)據(jù)時(shí)代,誰擁有數(shù)據(jù),誰就有話語權(quán)。人可能會撒謊,但是數(shù)據(jù)不會撒謊,數(shù)據(jù)是客觀的,數(shù)據(jù)能夠真實(shí)的反映事物規(guī)律。人們相信數(shù)據(jù),出行會問導(dǎo)航那條路最快,哪里不堵車;出去吃飯,會打開美食網(wǎng)站,看看餐館評分和顧客評價(jià);遇到不了解的問題,首先就會問百度。

當(dāng)人們相信數(shù)據(jù),甚至是迷信數(shù)據(jù)的時(shí)候,誰掌握了大數(shù)據(jù),誰就擁有了話語權(quán)。因?yàn)槿藗冇肋h(yuǎn)不可能掌握全部的數(shù)據(jù),那么數(shù)據(jù)擁有者給出什么數(shù)據(jù),人們就看到什么數(shù)據(jù),也就相信那些數(shù)據(jù)所反映的所謂事實(shí)。

三、大數(shù)據(jù)的困境

大數(shù)據(jù)的優(yōu)勢顯而易見,但是也會有些困境需要去面對。

(一)數(shù)據(jù)的價(jià)值密度

海量的數(shù)據(jù),是否全部都有價(jià)值呢?應(yīng)該來說,價(jià)值密度低。警察尋找嫌疑人也許需要從成千上萬的監(jiān)控視頻中找出那一幀,當(dāng)年整個(gè)南京市的硬盤和眼藥水脫銷,就是因?yàn)榫鞛榱苏页瞿莻€(gè)殺人通緝犯周克華把所有的監(jiān)控視頻看了個(gè)遍。為了在視頻中找到周克華,全市1000多名民警在兩個(gè)月的時(shí)間里觀看了近30萬GB的監(jiān)控視頻,這相當(dāng)于每名干警每周看100多部電影。

所以,不是所有的數(shù)據(jù)都有價(jià)值,那就需要建立好比較精準(zhǔn)的模型,找對參數(shù),找準(zhǔn)關(guān)鍵變量,這樣才能從海量的數(shù)據(jù)中快速、準(zhǔn)確的挖掘出所需要的信息。

(二)數(shù)據(jù)的可信度

雖然數(shù)據(jù)越來越大,但并不是所有的數(shù)據(jù)都是真實(shí)的。網(wǎng)絡(luò)數(shù)據(jù)真?zhèn)坞y辨,特別是微博上經(jīng)常出現(xiàn)各種謠言,還有一些移花接木的圖片,總是容易迷惑普通大眾,所以大家現(xiàn)在習(xí)慣“坐等反轉(zhuǎn)”。

為了讓數(shù)據(jù)盡可能真實(shí),就需要搜集數(shù)據(jù)的時(shí)候確定更多的維度,不同的源頭、不同的結(jié)構(gòu)都需要涉及到,同時(shí)要與歷史數(shù)據(jù)相對比,多角度、多層面地搜集數(shù)據(jù),也可以建立數(shù)學(xué)模型來鑒別真假。

(三)數(shù)據(jù)的隱私性

大數(shù)據(jù)存在著一定的安全和隱私隱患,雖然用戶產(chǎn)生數(shù)據(jù),但是并不擁有數(shù)據(jù),數(shù)據(jù)儲存在各個(gè)云端,當(dāng)云端被攻破就有了信息泄露的危險(xiǎn)。前段時(shí)間,萬豪酒店發(fā)布聲明,其酒店的客房預(yù)定數(shù)據(jù)庫被黑客入侵,最多有約5億名客人的信息或被泄露。酒店客戶的信息被大規(guī)模泄露就表明了這個(gè)數(shù)據(jù)存在安全隱患,客戶的個(gè)人信息甚至被明碼標(biāo)價(jià)地售賣。

另外,數(shù)據(jù)的挖掘是否征求了用戶的同意,對數(shù)據(jù)的使用是否獲得了用戶的許可?一般來說,數(shù)據(jù)平臺在用戶使用的時(shí)候都有一個(gè)協(xié)議,但是大多數(shù)用戶并沒有仔細(xì)閱讀,即使閱讀了,為了使用平臺,也不得不勾選“同意”,而這并不是真正意義上的同意,因?yàn)橛脩舨⒉恢肋@些數(shù)據(jù)會被如何搜集、怎樣使用、會有怎樣的后果,畢竟不是每一個(gè)用戶都是數(shù)據(jù)專家。

【基金項(xiàng)目:武漢市教育科學(xué)“十三五”規(guī)劃2 0 1 7年度立項(xiàng)課題《大數(shù)據(jù)與大學(xué)生思想政治教育的融合性研究》(2 0 1 7 C 1 4 4)和2 0 1 8年湖北省教育廳人文社會科學(xué)研究專項(xiàng)任務(wù)項(xiàng)目《新媒體背景下高校思想政治教育話語權(quán)的重構(gòu)研究》(1 8 Z 1 2 7)階段性研究成果】

參考文獻(xiàn):

[1]麥肯錫.大數(shù)據(jù): 下一個(gè)創(chuàng)新、競爭和生產(chǎn)力的前沿報(bào)告.2011.5.

[2]涂子沛.大數(shù)據(jù):正在到來的數(shù)據(jù)革命,以及它如何改變政府、商業(yè)與我們的生活[M].廣西: 廣西師范大學(xué)出版社,2015.4:219.

猜你喜歡
解讀大數(shù)據(jù)維度
淺論詩中“史”識的四個(gè)維度
中華詩詞(2019年7期)2019-11-25 01:43:00
解讀日本攝影家植田正治的擺拍寫實(shí)現(xiàn)象
關(guān)注生成,激活學(xué)生認(rèn)知
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
光的維度
燈與照明(2016年4期)2016-06-05 09:01:45
“五個(gè)維度”解有機(jī)化學(xué)推斷題
人生三維度
吐魯番(2014年2期)2014-02-28 16:54:43
稻城县| 图们市| 镇康县| 东宁县| 缙云县| 昌图县| 亚东县| 磐安县| 宁蒗| 新巴尔虎右旗| 黄山市| 富民县| 清水县| 漠河县| 吉水县| 绥江县| 福海县| 崇礼县| 甘南县| 宁远县| 辽阳县| 宝应县| 永嘉县| 城市| 潼关县| 英德市| 蚌埠市| 维西| 济宁市| 诏安县| 昂仁县| 云南省| 柳林县| 大理市| 准格尔旗| 宝鸡市| 武川县| 邳州市| 西乌珠穆沁旗| 天长市| 沙雅县|