左磊
數(shù)據(jù)主流概念就是介紹聚合數(shù)據(jù),聚合數(shù)據(jù)是一個初創(chuàng)的公司,雖然不是一家大的企業(yè),但是所做的事情并不算小,它為騰訊、百度、京東提供大數(shù)據(jù)服務(wù),至少覆蓋億人次級別以上,以下更多的是結(jié)合數(shù)據(jù)的模式講講對大數(shù)據(jù)的認識。
模式執(zhí)勤
說到聚合數(shù)據(jù)的模式執(zhí)勤,在PC時代最終用戶行為習慣更多的是通過COOKIE,或者是通過IP,到了移動互聯(lián)網(wǎng)時代需要通過APP和SDK其他的方式獲取,但是MBFA并不能夠完全地做用戶匹配,所以更多的是通過MK結(jié)合手機號碼來確定一個用戶的行為習慣,這也是現(xiàn)在移動互聯(lián)網(wǎng)最熱最重要的一個數(shù)據(jù)。
大家知道通過APP,SDK獲取的數(shù)據(jù)通過關(guān)聯(lián)以后,會很清晰地對個人貼一些標簽,就是所謂的人物畫像。在人物畫像這塊做的最好的是阿里巴巴,它有兩個最大的APP,一個是淘寶,一個是支付寶,支付寶有超過3億人的消費習慣,首先是消費金額,第二個是物流快遞地址,還有家庭地址、公司地址,同時支付寶還可以用來沖話費,交燃氣和充電費,還有淘寶購物習慣。
大部分年輕人在淘寶數(shù)據(jù)庫里是非常清晰的,雖然在虛擬世界里,但是已經(jīng)被貼了很多標簽,但是阿里并沒有滿足這些數(shù)據(jù),它投入了一系列的投資,比如新浪微博、微信等等,阿里巴巴投資和收購?fù)瓿梢院?,把里面的用戶打通,因為它投資的這幾家企業(yè)都擁有上億的安裝量,所以重合度很高,并不像小的APP,假設(shè)兩個APP,兩個都是兩千萬,可能這兩個一千萬都沒有關(guān)聯(lián),但是阿里巴巴并購的這些數(shù)據(jù)后臺重合度非常高,根據(jù)一個人在什么位置,就知道他做什么工作,了如指掌。
聚合數(shù)據(jù)就沒有這么大,而且也沒有錢收購大的APP,更多的是中小型的數(shù)據(jù)開發(fā)者,提供的數(shù)據(jù)目前大概有100多個,有50或者60個是我們自己在運營,包括天氣、網(wǎng)上日記,跟人相關(guān)的,包括掛號、12306定火車票等,還有一些通過第三方開發(fā)商合作,比如說360、京東,馬上會接進來的必應(yīng)等等,通過有數(shù)據(jù)源的公司把數(shù)據(jù)開放出來,從我們公司數(shù)據(jù)平臺再開放出去。
這個是典型的數(shù)據(jù)模型,這里面介紹了一個人的數(shù)據(jù),雖然他不知道這個人長什么樣,但是他在聚合數(shù)據(jù)后臺或者是在阿里巴巴后臺很清晰,這個人拿了數(shù)據(jù)票,定了酒店,或者他的身份證號碼,他的家庭住址等等是非常清晰的畫像模型。
聚合的模式
回到聚合的模式,聚合現(xiàn)在作為第三方最大的公司,每天有超過22萬開發(fā)者,到明年會有50萬開發(fā)者,調(diào)用量將達到3萬億。聚合最早的爬蟲自己去抓取,這是聚合自己做的,但是后來做到一定規(guī)模時跟數(shù)據(jù)中心開始合作,跟360等公司進行合作。另外一方面比如短信運營商,他可能充值10萬20萬,比如買10萬條次數(shù),在聚合開發(fā)者平臺去銷售,所以聚合像是數(shù)據(jù)銀行,通過數(shù)據(jù)聚合的方式,包括聚合在代理亞馬遜,就會把數(shù)據(jù)方式存儲到集合平臺上,通過存錢和取錢了解到用戶量很大,將這些優(yōu)質(zhì)客戶留下來做精準的廣告投放,做優(yōu)化。舉一個簡單的例子,比如精準內(nèi)容投放,聚合數(shù)據(jù)有一個違章查詢接口,每天違章查詢量1200萬左右,事實上有重復(fù)的數(shù)據(jù),真實保存下來的有價值的汽車車牌號,一個月查四次以上,聚合數(shù)據(jù)平臺認為這個用戶是有車的,會通過MA和這個用戶關(guān)聯(lián),知道這個用戶有車,可以做廣告投放,他打開APP時給他提供一些車企的廣告,或者提供給他P2P的互聯(lián)網(wǎng)金融公司信息,提供一些征信的識別。這是聚合做數(shù)據(jù)銀行的模式。
聚合數(shù)據(jù)的這個平臺做了大概三年半,到現(xiàn)在應(yīng)該有超過22萬的開發(fā)者,有9萬多個應(yīng)用,或者是網(wǎng)站,或者是微信公眾號,還有一些插件利用聚合數(shù)據(jù)開發(fā),每天的量次數(shù)接近5千萬次。聚合的模式很簡單,一方面通過在線的網(wǎng)站去進行在線充值和在線消費,另一方面為一些大的客戶,比如微信、京東提供線下的定制服務(wù),這是兩個主要的運營模式。聚合除了做自己的數(shù)據(jù)挖掘,還和第三方數(shù)據(jù)研究合作,通常會選某一個領(lǐng)域最好的兩家公司進行合作,聚合在平臺里面把數(shù)據(jù)開放出去,通過分成模式,這里面是有典型的客戶,包括一些知名客戶,這些都在或多或少的用聚合的數(shù)據(jù),做開發(fā),做平臺業(yè)務(wù),都會調(diào)用我們的數(shù)據(jù)。
另外聚合也通過一系列的方式來推廣和傳播這樣的數(shù)據(jù)服務(wù),包括聚合跟主流的互聯(lián)網(wǎng)巨頭還有一些知名的企業(yè)合作,為它們提供很好的服務(wù),幫助它們擴大影響力。
聚合除了跟一些媒體合作也跟一些培訓(xùn)機構(gòu)合作,主要為了自身提高價值,集成學院是教育平臺,現(xiàn)在有三個聚合教學視頻在這個平臺上運營,免費地被查看,包括CSDN,有幾百個老師在使用聚合的帳號做教育培訓(xùn)。明年聚合會正式推出自己的應(yīng)用數(shù)據(jù),因為這個應(yīng)用數(shù)據(jù)除了被中國開發(fā)者使用外,也同樣適合美國的開發(fā)者,去拓展美國的視角。