趙國棟
和一些企業(yè)交流時,有幾個問題會被經(jīng)常問到,“沒有多少數(shù)據(jù)怎么辦”、“大數(shù)據(jù)都是大公司的事情,我們小公司怎么辦”、“能不能告訴我,哪些軟件或者工具可以解決大數(shù)據(jù)的問題”一般情況下,我都會說,首先要有大數(shù)據(jù)思維!
但什么才是大數(shù)據(jù)思維,我以大數(shù)據(jù)飛輪模型來概括。大數(shù)據(jù)飛輪(見右圖)涵蓋了大數(shù)據(jù)思維的全部思想。
怎樣拼數(shù)據(jù)資產(chǎn)
大數(shù)據(jù)飛輪模型的上半部分,關(guān)系到企業(yè)是如何認(rèn)知哪些是自己的數(shù)據(jù),也是大數(shù)據(jù)的商業(yè)功用。就是說有了大數(shù)據(jù)我們能干什么?怎么賺錢?有哪些好玩的商業(yè)模式?
大數(shù)據(jù)的商業(yè)功能即常見的商業(yè)模式,包括租售數(shù)據(jù)模式、租售信息模式、數(shù)字媒體模式、數(shù)據(jù)使能模式、數(shù)據(jù)空間運(yùn)營模式以及大數(shù)據(jù)技術(shù)提供商。
如果我們在企業(yè)層面觀察,上述的商業(yè)模式就是典型的大數(shù)據(jù)的功用。但這遠(yuǎn)遠(yuǎn)不是全部。跳出具體的企業(yè),從產(chǎn)業(yè)層面考察,其實(shí)產(chǎn)業(yè)間的興衰交替、攻掠征伐,已經(jīng)過渡到數(shù)據(jù)資產(chǎn)比拼的階段了。
那些擁有優(yōu)質(zhì)數(shù)據(jù)資產(chǎn)的公司,挾天子以令諸侯,不斷地攻伐、侵襲其他產(chǎn)業(yè)的傳統(tǒng)領(lǐng)地。產(chǎn)業(yè)融合大幕隨之拉開,天平卻向這些新興的公司傾斜。由此也得出我們第一個公司價值的判斷標(biāo)準(zhǔn):大數(shù)據(jù)時代,公司的價值與其數(shù)字資產(chǎn)的規(guī)模、活性成正比,與其解釋、運(yùn)用數(shù)據(jù)的能力成正比。
比如,谷歌通過提供搜索、郵件等廣受歡迎的網(wǎng)絡(luò)服務(wù),獲取人們大量的行為數(shù)據(jù),加上谷歌自己抓取的網(wǎng)頁數(shù)據(jù),構(gòu)成谷歌大數(shù)據(jù)資產(chǎn)。谷歌利用這些數(shù)據(jù)資產(chǎn),開始涉足基礎(chǔ)電信業(yè)務(wù)、IT解決方案、媒體、終端,甚至是傳統(tǒng)的IDC(互聯(lián)網(wǎng)數(shù)據(jù)中心)業(yè)務(wù)。而在這所有業(yè)務(wù)中,來自媒體的廣告業(yè)務(wù),每天為谷歌提供現(xiàn)金流。所有其他涉足的行業(yè),都以免費(fèi)或者成本價殺入。谷歌也不是活雷鋒,雖然它新進(jìn)入的行業(yè)不以盈利為目的,但是卻拿走了這個行業(yè)至關(guān)重要的數(shù)據(jù),成為它數(shù)據(jù)資產(chǎn)的一部分。
資產(chǎn)評估:從顆粒度到關(guān)聯(lián)度
接下來,大家自然而然地關(guān)心,數(shù)據(jù)這么值錢,理所當(dāng)然應(yīng)構(gòu)成新型的資產(chǎn)。這也是大數(shù)據(jù)飛輪的中間部分,“數(shù)據(jù)成為資產(chǎn)”這一論斷是大數(shù)據(jù)思維的中心理論。優(yōu)秀的數(shù)據(jù)思維,必然反映在優(yōu)質(zhì)數(shù)據(jù)資產(chǎn)上。我們難以定量評價一個人的數(shù)據(jù)思維,所以只好退而求其次,關(guān)心在數(shù)據(jù)思維的影響下,數(shù)據(jù)資產(chǎn)的優(yōu)劣。數(shù)據(jù)資產(chǎn)的價值從五個維度來評估,分別是規(guī)模、活性、多維度、關(guān)聯(lián)性、顆粒度。這五個維度,沒有絕對的數(shù)值可以參考。只能給出定性的描述,具體到每個行業(yè),需要根據(jù)這個模型來靈活運(yùn)用。
顆粒度指標(biāo)反映數(shù)據(jù)的精細(xì)化程度。那些宏觀的數(shù)據(jù),價值含量較低。相反那些細(xì)化到個人、單品的數(shù)據(jù),才會帶來前所未有的洞察,這也是和精細(xì)化管理的思想緊密相關(guān)的。早期管理者認(rèn)為工業(yè)產(chǎn)品沒有差別,同一個批次、型號的產(chǎn)品是一模一樣的。但是現(xiàn)在人們需要管理到“單品”,也就是每一件產(chǎn)品。提高社會治理水平,也是逐漸細(xì)化“管理單元”的過程。秦始皇設(shè)定“郡縣”,這是當(dāng)時最小的國家機(jī)構(gòu),傳統(tǒng)戲劇中經(jīng)常戲謔“七品芝麻官”。但是現(xiàn)代的管理單元已經(jīng)細(xì)化到100米乘100米的正方形,形象的稱為“網(wǎng)格”,一個網(wǎng)格中,很可能只有一座樓房而已。
所以我們把顆粒度作為反映數(shù)據(jù)資產(chǎn)質(zhì)量的第一個維度。細(xì)化到一個人、一件單品、一個網(wǎng)格、一個門牌號、一個零件??鋸埖恼f,就算是一粒沙,也要清清楚楚的記錄下它的位置、大小、重量,甚至因風(fēng)吹浪打漂流的軌跡。
多維度指標(biāo)借用空間維度的概念,來指代數(shù)據(jù)來源的豐富性。每增加一個數(shù)據(jù)維度,則會影響所有原數(shù)據(jù)的分析和判斷,甚至?xí)眍嵏残缘淖C據(jù)。
FICO信用評分是美國評估個人信用級別的通行標(biāo)準(zhǔn)。幾乎每個美國人都有一個FICO評分。當(dāng)人們申請信用卡、汽車貸款、住房貸款時,大多數(shù)的信貸機(jī)構(gòu)都會參考申請者的FICO得分。但是在其發(fā)展的初期,F(xiàn)ICO模型中,僅僅依賴申請人在現(xiàn)有住址住了多久、為現(xiàn)在的企業(yè)工作了多長時間、申請人賬號開設(shè)了多久等數(shù)據(jù)。
根據(jù)這個評估標(biāo)準(zhǔn),幾乎所有30歲以下的人,都會存在很大的信用風(fēng)險(xiǎn)。而現(xiàn)在淘寶上的購買主力,恰恰是以年輕人為主。所以零售商們?nèi)浩鸱磳?,這些條款限制了發(fā)卡人數(shù),不利于刺激消費(fèi)。當(dāng)FICO增加了評估數(shù)據(jù)的維度時,譬如納入教育水平、職業(yè)等指標(biāo)后,那些受過良好的教育,從事體面職業(yè)的人,也就獲得了信用卡。事實(shí)證明,他們的違約率也很低。
在多維度指標(biāo)中,我們尤其重視一類“先驗(yàn)”數(shù)據(jù)維度。譬如人們在買股票的時候,一定先觀察一支股票的行情走勢;人們在買商品的時候,一定會對比和詢價?;ヂ?lián)網(wǎng)有助于把這些數(shù)據(jù)收集起來,進(jìn)行分析,可以預(yù)測未來人們是否會買入股票或者商品。
數(shù)據(jù)的活性,指數(shù)據(jù)被更新的頻次。頻次越高,活性越大。Facebook在2012年10月慶祝月度活躍用戶超過10億,這里的活躍用戶,和數(shù)據(jù)的活性緊密相關(guān)。股民對換手率指標(biāo)非常熟悉,換手率標(biāo)志股票交易是否活躍,成為判斷股價走勢非常重要的指標(biāo)。
曾經(jīng)有一家公司不知道他們的數(shù)據(jù)能否算作大數(shù)據(jù),這家公司收集了大量的用戶繳費(fèi)數(shù)據(jù),譬如交水電費(fèi)、煤氣費(fèi)、有線電視費(fèi)等。毫無疑問,這些數(shù)據(jù)非常有價值,但就是活性稍差,用戶繳費(fèi)最多也是一個月交一次費(fèi)用。而微信的數(shù)據(jù),無疑是最具活性的數(shù)據(jù)之一,體現(xiàn)出實(shí)時的價值。
規(guī)模指標(biāo)最容易理解。沒有“量”的積累,就沒有“質(zhì)”的突破。數(shù)據(jù)量的增長,即是數(shù)據(jù)規(guī)模的擴(kuò)大。但是到底有多大規(guī)模,才能是算是“大”數(shù)據(jù),的確是各行各業(yè)都很關(guān)心的問題。譬如互聯(lián)網(wǎng)應(yīng)用,如果沒有1000萬用戶,估計(jì)很難稱為大規(guī)模。但是如果一家券商擁有1000萬個A股賬戶,那絕對是呼風(fēng)喚雨的“老大”。規(guī)模這個指標(biāo)很重要,但不需要執(zhí)著于此指標(biāo)。不同行業(yè),不同的業(yè)務(wù)特征,對規(guī)模的定義完全不同。數(shù)據(jù)思維要先行于數(shù)據(jù)規(guī)模。
關(guān)聯(lián)度指標(biāo),反映不同多維數(shù)據(jù)之間的內(nèi)在聯(lián)系。之所以把關(guān)聯(lián)度拿出來單獨(dú)討論,主要原因是同一企業(yè)內(nèi)部存在大量的“孤島”現(xiàn)象,不同部門之間積累的數(shù)據(jù)無法融合,形不成合力。
[編輯 胡 俊]
E-mail:hj@chinacbr.com