国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數據實乃海量數據集

2017-12-29 00:00:00
科學導報 2017年36期

記者:在數字信息如此普及的今天,大數據正方方面面影響和改變著我們的生活。請問,什么是大數據?

王艷云:到底什么是大數據(Big Data)?維基百科(Wikipedia)中提到:大數據就是這樣一種數據集,它特指用現有通用軟件在可容忍的時間內無法加工、處理和分析的數據。今天度量數據存儲的大小已經到了Tb級和Pb級,甚至到了Eib級(2的60次方)。但數據量的巨大并不是大數據的唯一特征,在一定條件下,對個人而言是大數據,對企業(yè)級應用就是中數據,對移動和淘寶可能就是小數據,對谷歌和百度可能就不算數據了。所以有一種說法:大數據就是越來越大的數據。

現在比較流行的一種大數據說法叫4V理論,強調大數據的數量(Volume)、類型(Variety)、速度(Velocity)、可用性(Veracity)或價值(Value)。當然,大數據的定義,甚至概念界定至今并沒有得到學界或業(yè)界的統(tǒng)一,不同專業(yè)領域,不同學科背景,不同應用場景都有著不同側重點的闡釋。其實大數據這個概念沒有流行前,我們就面臨著海量數據的處理問題,所以在一定程度上大數據概念落地就是早年的數據挖掘(data mining),是指從海量數據中發(fā)現知識的過程,也稱為KDD(Knowledge Discover in Database)。

我比較認可麥肯錫全球研究所的定義——大數據是一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數據庫軟件工具能力范圍的數據集合,具有海量的數據規(guī)模、快速的數據流轉、多樣的數據類型和價值密度低四大特征。由于大數據的這些特征,就要求在大數據處理的存儲、讀取、清洗、解析、聚合、建模等多個環(huán)節(jié)都需要采用新的技術或模式。

宣化县| 瑞昌市| 南江县| 蕲春县| 曲靖市| 宁津县| 上犹县| 周至县| 玉田县| 宿松县| 宁陵县| 永仁县| 吴忠市| 封丘县| 宜城市| 思南县| 长子县| 汾西县| 平阴县| 南通市| 清河县| 福泉市| 孙吴县| 黄龙县| 临朐县| 镇宁| 广丰县| 滦南县| 方城县| 盈江县| 土默特右旗| 神池县| 谷城县| 天柱县| 永年县| 云和县| 平江县| 社旗县| 双城市| 商都县| 锦州市|