目前,大數(shù)據(jù)的應(yīng)用非常廣泛。那么,如何挖掘大數(shù)據(jù)的價(jià)值,來幫助政府解決實(shí)際的問題,我們?cè)谶@邊做了很多年的研究,接下來我將做一些具體應(yīng)用層面的展示。我們可以看到全球智能終端的數(shù)據(jù)大概有50億條,最核心、最集中的數(shù)據(jù)還是在中國,密集度非常高。
我們?yōu)槭裁唇凶鰪某鞘杏^象臺(tái)“觀”城市,分析所有城市的動(dòng)向呢?
因?yàn)槲覀冊(cè)谶@個(gè)基礎(chǔ)上做了大量的數(shù)據(jù)積累,基于TalkingData移動(dòng)設(shè)備位置數(shù)據(jù),分析整個(gè)城市人口分布、人口變化、人口流動(dòng),職住等,再結(jié)合空間地圖分析可以應(yīng)用于人口統(tǒng)計(jì)、城市規(guī)劃、交通運(yùn)營、旅游管理以及社會(huì)安全等領(lǐng)域,幫助相關(guān)部門做一些人口決策支撐。
既然來到青島,我就舉個(gè)關(guān)于青島旅游的例子。青島是個(gè)旅游城市,我們?cè)诮衲?月1日至5日,把青島游客來源地分布做了統(tǒng)計(jì)和排名,分析了前十位的省份分布,河南省排在首位,其次是省內(nèi)以及周邊省的游客。我們還給每一個(gè)人做具體畫像:女性占比多,且游客以家庭為單位的人群為主,26~35歲人群占比52.27%,整體看游客以家庭人群為主,消費(fèi)興趣以服裝鞋帽、餐飲為主。青島游客熱力圖反映了青島整個(gè)城區(qū)游客的分布情況,可以看到青島市區(qū)、嶗山區(qū)、黃島區(qū)游客聚集。
大家在冬天都非常喜歡去滑雪,全國冰雪旅游人群主要集中在東北、華北、東部沿海地區(qū)這三大核心區(qū)域,以及中西部省會(huì)城市的次核心區(qū)域,長三角、珠三角地區(qū)是南方最主要的冰雪旅游人群聚集地。我們也在這方面幫助當(dāng)?shù)氐穆糜尾块T做了很多工作。從黑龍江的一個(gè)冰雪節(jié)的熱力圖上可以看到,黑龍江省冰雪旅游景區(qū)客源地覆蓋全國,省外游客主要來自京津、長三角以及珠三角地區(qū),而北京市冰雪旅游景區(qū)客源地主要集中在京津冀一帶,以及上海和廣東。吉林省冰雪旅游景區(qū)的外地游客主要來自周邊的沈陽、哈爾濱,以及北上廣深這四大城市,而遼寧省冰雪旅游景區(qū)以省內(nèi)游客為主,外地游客主要來自北京。河北省冰雪旅游景區(qū)游客主要來自冀北、京津一帶,而內(nèi)蒙古各景區(qū)冬季游客以周邊省份和北京、廣東為主。
許多游客喜歡在冬季或夏季去新疆阿勒泰。阿勒泰是全國著名的旅游勝地,聞名遐邇的喀納斯湖風(fēng)景區(qū)吸引著大量的國內(nèi)外游客。從阿勒泰旅游部門的歷史統(tǒng)計(jì)數(shù)據(jù),以往每年到喀納斯的游客大概為1000到2000萬。2016年,我們幫助喀納斯當(dāng)?shù)氐穆糜挝隽松疃确治?,?shí)際上2016年到喀納斯的真實(shí)游客人數(shù)只有353萬人,女性占比55%。另外從2016年阿勒泰地區(qū)客群的年齡分布來看,占比最多的年齡段是26~35歲,占比53%,其次是19~25歲,占比21%,第三是36~45歲,占比17%。三個(gè)年齡段總計(jì)占比達(dá)到91%,說明19~45歲年齡段的游客是阿勒泰旅游的客源主力軍。從2016年阿勒泰地區(qū)客源地(省/市/區(qū))來看,新疆自治區(qū)區(qū)內(nèi)的客源最多且遠(yuǎn)高于其他地區(qū)。針對(duì)這些情況,我們做了一些能夠提升當(dāng)?shù)鼐皡^(qū)的規(guī)劃,以及能更好地服務(wù)游客的服務(wù)項(xiàng)目。
回歸到城市里面的人,TalkingData其實(shí)是在打造一個(gè)數(shù)據(jù)生態(tài)。目前,我們有51個(gè)智能數(shù)據(jù)的覆蓋終端,用戶大概有6.5億。我們?cè)谡麄€(gè)城市人口的特征分析上也做了360度的洞察,即基于TalkingData移動(dòng)設(shè)備屬性、線上/線下行為數(shù)據(jù)、位置數(shù)據(jù),結(jié)合城市各類數(shù)據(jù),形成對(duì)人口特征深度刻畫和洞察。
在大數(shù)據(jù)的分析層面,我們做了城市產(chǎn)業(yè)、公共服務(wù)資源的特征分析,助力政府資源合理規(guī)劃配置。在城市建設(shè)方面,我們需要分析整個(gè)人口的基礎(chǔ)屬性,比如來源地、常駐地、行為偏好、位置軌跡、通行分布等情況,這些可以應(yīng)用在大量規(guī)劃決策的業(yè)務(wù)當(dāng)中。例如,基于TalkingData移動(dòng)位置數(shù)據(jù),結(jié)合運(yùn)營商數(shù)據(jù),實(shí)時(shí)分析城市交通路況、城市高速路況、城際出行,利用大數(shù)據(jù)能力支持道路規(guī)劃、交通調(diào)查、交通運(yùn)營、路況監(jiān)測,提供決策支撐?;赥alkingData數(shù)據(jù)的統(tǒng)計(jì)分析,幫助政府合理規(guī)劃加速實(shí)現(xiàn)新型城鎮(zhèn)化建設(shè),改善區(qū)域的服務(wù),提升生活的品質(zhì)。
以上是我們積累的一部分應(yīng)用場景。我們公司命名為TalkingData,公司重視用數(shù)據(jù)說話,用數(shù)據(jù)真正幫助用戶解決實(shí)際問題。我們目前總部是在北京,上海、深圳都有辦公室,同時(shí)在美國的硅谷成立了大數(shù)據(jù)的創(chuàng)新實(shí)驗(yàn)室,聯(lián)合當(dāng)?shù)氐乃固垢4髮W(xué)等院校做一些創(chuàng)新性的研究。
我們希望在中國大數(shù)據(jù)的領(lǐng)域,搭建一個(gè)開放的生態(tài)圈,與合作伙伴一起幫助政府和企業(yè)實(shí)現(xiàn)數(shù)據(jù)的最大價(jià)值。在金融、商圈、航空、旅游方面,我們幫助客戶做一些獲客,同時(shí)利用自己海量的數(shù)據(jù)和算法幫助用戶解決問題。我們目前在國有銀行覆蓋率達(dá)40%,對(duì)銀行、券商做了大量深度的研究。TalkingData開辦了騰云大學(xué),致力于讓數(shù)據(jù)科學(xué)在國內(nèi)能夠更加普及,來彌補(bǔ)國內(nèi)對(duì)數(shù)據(jù)科學(xué)領(lǐng)域了解的欠缺,讓他們的數(shù)據(jù)科學(xué)家能夠更有力地支持傳統(tǒng)企業(yè)利用數(shù)據(jù)解決實(shí)際問題。我們有很多專業(yè)的數(shù)據(jù)科學(xué)家,聯(lián)合行業(yè)內(nèi)的數(shù)據(jù)專家,會(huì)定期跟我們的合作伙伴和用戶做一些技術(shù)層面和業(yè)務(wù)層面的分享。