今天的大數(shù)據(jù)就是明天的小數(shù)據(jù),這個(gè)是做大數(shù)據(jù)的人都知道的,其實(shí)我們現(xiàn)在處于在數(shù)據(jù)里跑馬圈地的時(shí)代。當(dāng)你以為數(shù)據(jù)是很大的時(shí)候,其實(shí)只不過(guò)是冰山一角而已,在未來(lái)更多數(shù)據(jù)會(huì)出現(xiàn),當(dāng)數(shù)據(jù)多到覆蓋整個(gè)樣本空間的時(shí)候才是大數(shù)據(jù)。
今天我們所講的大數(shù)據(jù),從科學(xué)的角度來(lái)看,更多用的是樣本空間的觀點(diǎn)。過(guò)去我們從新樣本中找到特征,實(shí)驗(yàn)了之后得到結(jié)果,但是在大數(shù)據(jù)時(shí)代,因?yàn)橛泻A繑?shù)據(jù)樣本,所以我們用簡(jiǎn)單模型取代復(fù)雜模型去解釋數(shù)據(jù)。
現(xiàn)實(shí)中,企業(yè)其實(shí)很少用大數(shù)據(jù)。企業(yè)一般會(huì)用大數(shù)據(jù)先找到方向,之后用傳統(tǒng)的方法來(lái)提煉自己的數(shù)據(jù)。有人問(wèn)我怎么開(kāi)始用起數(shù)據(jù)?企業(yè)得忘掉大數(shù)據(jù),理解業(yè)務(wù)的場(chǎng)景,然后回答是否能解決問(wèn)題,以及日后怎樣改進(jìn)。企業(yè)最困難的是用數(shù)據(jù)的文化,以及用數(shù)據(jù)的管理。我們倡導(dǎo)“數(shù)據(jù)的生態(tài)圈”的概念:用數(shù)據(jù)幫企業(yè)做判斷,解決問(wèn)題,這個(gè)叫“數(shù)據(jù)歡迎你”;反過(guò)來(lái),我們又從無(wú)限數(shù)據(jù)中尋找數(shù)據(jù),獲取運(yùn)營(yíng)數(shù)據(jù)。實(shí)際上,這個(gè)生態(tài)圈轉(zhuǎn)起來(lái)是很困難的。我一般都說(shuō)這個(gè)圈越小越好,不要搞得很大。
阿里用了很多時(shí)間去健全大數(shù)據(jù)工具。例如,我們已經(jīng)開(kāi)始建立數(shù)據(jù)地圖,用大數(shù)據(jù)的原數(shù)據(jù)告訴我們這個(gè)地圖是從哪里來(lái)的。過(guò)去我們只是用數(shù)據(jù),但是今天我們要知道數(shù)據(jù)是從哪里來(lái)的。過(guò)去我們是有問(wèn)題找數(shù)據(jù),今天我們用數(shù)據(jù)找問(wèn)題。因?yàn)榇髷?shù)據(jù),阿里的決策支持部開(kāi)始變化了,未來(lái)我們要每個(gè)業(yè)務(wù)部門(mén)都有做數(shù)據(jù)分析的能力,而不是讓數(shù)據(jù)技術(shù)部門(mén)幫助業(yè)務(wù)部門(mén)。這是因?yàn)楫?dāng)我們做分析的時(shí)候,只要業(yè)務(wù)部門(mén)的人稍做改動(dòng),底層數(shù)據(jù)就全變了,數(shù)據(jù)分析要重新來(lái)過(guò),這對(duì)我們來(lái)說(shuō)工作量太大了。所以我們要做更多的工具,讓更多的人很容易的找到他所要的數(shù)據(jù)。
大數(shù)據(jù)里還有非常多的問(wèn)題需要解決。例如,沒(méi)有人知道拿著手機(jī)上網(wǎng)的一個(gè)人和用電腦上網(wǎng)的是不是同一個(gè)人。再比如,在大數(shù)據(jù)中,我們有多少數(shù)據(jù)就收集多少數(shù)據(jù),因?yàn)檫@個(gè)數(shù)據(jù)可能未來(lái)會(huì)有用,但當(dāng)數(shù)據(jù)大到一定程度的時(shí)候,我們不可能無(wú)極限收集下去,需要放棄一些數(shù)據(jù)。這也是我最近在思考的事情之一,數(shù)據(jù)存還是不存?數(shù)據(jù)現(xiàn)在有用,未來(lái)是否有用?我思考的另外一個(gè)問(wèn)題是數(shù)據(jù)開(kāi)放不開(kāi)放?數(shù)據(jù)的安全很重要,選擇數(shù)據(jù)開(kāi)放是否會(huì)侵犯別人的隱私?此外,大數(shù)據(jù)是否安全?在控制安全時(shí),兩個(gè)數(shù)據(jù)加起來(lái)可能是非常不安全的,這種情況下,你不會(huì)知道這個(gè)數(shù)據(jù)是安全還是不安全,此時(shí)監(jiān)管是失效的。
最后我說(shuō)一句,讓人做人擅長(zhǎng)做事,機(jī)器做機(jī)器擅長(zhǎng)的事。其實(shí)數(shù)據(jù)都是實(shí)效的,對(duì)企業(yè)來(lái)講,并沒(méi)有什么大數(shù)據(jù)的神話。