大數(shù)據(jù)是什么?其實很簡單,大數(shù)據(jù)其實就是海量資料巨量資料,這些巨量資料來源于世界各地隨時產(chǎn)生的數(shù)據(jù),在大數(shù)據(jù)時代,任何微小的數(shù)據(jù)都可能產(chǎn)生不可思議的價值。大數(shù)據(jù)有4個特點,分別為:大量(Volume)、多樣(Variety)、高速(Velocity)、價值(Value),一般我們稱之為4V。
1.大量。大數(shù)據(jù)的特征首先就體現(xiàn)為“大”,從先Map3時代,一個小小的MB級別的Map3就可以滿足很多人的需求,然而隨著時間的推移,存儲單位從過去的GB到TB,乃至現(xiàn)在的PB、EB級別。隨著信息技術(shù)的高速發(fā)展,數(shù)據(jù)開始爆發(fā)性增長。社交網(wǎng)絡(luò)(微博、推特、臉書)、移動網(wǎng)絡(luò)、各種智能工具,服務(wù)工具等,都成為數(shù)據(jù)的來源。
2.多樣。廣泛的數(shù)據(jù)來源,決定了大數(shù)據(jù)形式的多樣性。任何形式的數(shù)據(jù)都可以產(chǎn)生作用,目前應(yīng)用最廣泛的就是推薦系統(tǒng),如淘寶,網(wǎng)易云音樂、今日頭條等,這些平臺都會通過對用戶的日志數(shù)據(jù)進(jìn)行分析,從而進(jìn)一步推薦用戶喜歡的東西。
3.高速。大數(shù)據(jù)的產(chǎn)生非常迅速,主要通過互聯(lián)網(wǎng)傳輸。大數(shù)據(jù)對處理速度有非常嚴(yán)格的要求,服務(wù)器中大量的資源都用于處理和計算數(shù)據(jù),很多平臺都需要做到實時分析。數(shù)據(jù)無時無刻不在產(chǎn)生,誰的速度更快,誰就有優(yōu)勢。
4.價值。這也是大數(shù)據(jù)的核心特征。大數(shù)據(jù)最大的價值在于通過從大量不相關(guān)的各種類型的數(shù)據(jù)中,挖掘出對未來趨勢與模式預(yù)測分析有價值的數(shù)據(jù),并通過機(jī)器學(xué)習(xí)方法、人工智能方法或數(shù)據(jù)挖掘方法深度分析,發(fā)現(xiàn)新規(guī)律和新知識,并運(yùn)用于農(nóng)業(yè)、金融、醫(yī)療等各個領(lǐng)域。