車品覺
過去,有一些問題一直困擾著我:“現(xiàn)在的企業(yè)獲取數(shù)據(jù)如此容易,數(shù)據(jù)的增長速度如此之快,那么對于企業(yè)來說,到底要收集什么樣的數(shù)據(jù)?收集多少數(shù)據(jù)?收集數(shù)據(jù)的邊界在哪里?”后來,我在美國遇到一位高人,他認為,過去收集數(shù)據(jù)很難,而現(xiàn)在獲取數(shù)據(jù)資源變得越來越容易,但是如果收集數(shù)據(jù)的出發(fā)點不是為了解決問題,那么收集再多的數(shù)據(jù)也沒有什么意義。
同時,許多企業(yè)還有一個疑問:“現(xiàn)在收集數(shù)據(jù)不難,成本也不高,為什么不先收集了數(shù)據(jù)再說呢?等以后需要數(shù)據(jù)來解決問題時,再拿出來用不是也可以嗎?”這位高人同樣也給出了這個問題的答案,他對此持否定觀點,并指出用這樣的理念來設(shè)計數(shù)據(jù)應(yīng)用注定會失敗。
數(shù)據(jù)收集是沒有邊界的,我為此也痛苦了好一段日子,比如,收集一個人的生日,雖然可以精確到幾分幾秒,但這么精確的數(shù)據(jù)又能用在什么領(lǐng)域,又能產(chǎn)生什么價值呢?
事實上,數(shù)據(jù)是有生命周期的。比如,某網(wǎng)站的母嬰頻道在主動收集用戶的寶寶信息,包含寶寶生日、性別、小名、身高、體重,這里我們就要清楚這幾個數(shù)據(jù)的用途和生命周期,如寶寶的身高和體重。但是,媽媽們填寫的是寶寶當(dāng)前的數(shù)據(jù),我們知道寶寶的身高、體重變化非常之快,也就是說這兩個數(shù)據(jù)的生命周期很短,在當(dāng)時的推薦中可能有用,但過了一段時間后,這兩個數(shù)據(jù)就失效(Data Broken)了;而寶寶生日和性別這兩個數(shù)據(jù)的生命周期就很長,可以從生日的年份中推算出寶寶的年齡,而性別則基本是終生穩(wěn)定的。
保存數(shù)據(jù)及其收集時的背景(Context),也是一件不容易的事情。
還是以收集寶寶的年齡作為例子來闡述,我們可以通過用戶購買特定的商品集合,如幾段奶粉和尿不濕的型號等,知道寶寶所處的大概年齡段,以推算出寶寶當(dāng)前的年齡。但如果僅僅是保存寶寶幾歲這個數(shù)據(jù),那么這個數(shù)據(jù)很快也會失效,因為人的年齡是在動態(tài)變化的。同時,你還需要保存寶寶幾歲這個數(shù)據(jù)獲得的時間,即在哪年哪月計算得知這個寶寶的年齡,而這個信息就是背景數(shù)據(jù)。另一種做法更加聰明一些,即通過寶寶現(xiàn)在的年齡反過來推算寶寶是什么時候出生的。
所以說,在收集數(shù)據(jù)時,我們必須知道這些數(shù)據(jù)未來可以用來做什么,如果今天都想象不出來的話,日后就更不可能了。
打一個比方,如今很多電商高管會詢問數(shù)據(jù)分析師商品的重復(fù)購買率是多少。于是,工作人員收集數(shù)據(jù)來計算重復(fù)購買率,卻很少想到高管們需要重復(fù)購買率是來做什么決定的,這就好比“刻舟求劍”的故事。事實上,在世事多變的大數(shù)據(jù)時代,我們不能只是機械地套用方法或指標(biāo)。
重復(fù)購買率有不同的定義,而做不同的決策需要考慮經(jīng)過不同定義的重復(fù)購買率。如果一家投資公司想收購A 公司,那么會從重復(fù)購買率來看整個A 公司的運營良好程度或用戶質(zhì)量等;如果從A公司本身運營的角度來看重復(fù)購買率,那么它更應(yīng)該關(guān)注的是日、周級別的重復(fù)購買率的變化趨勢,或者當(dāng)月新增客戶有多少人在三個月后進行了重復(fù)購買,從而可以衡量出每個月新增及存量客戶的忠誠度和質(zhì)量,進而找出改善的空間。在知道了以上的背景之后,再去選擇使用什么數(shù)據(jù)不是更有的放矢嗎?
數(shù)據(jù)應(yīng)用因小而美
“小”不是指數(shù)據(jù)量,而是指應(yīng)用的目標(biāo)很具體。
2011年年底,作為一名數(shù)據(jù)分析師,我開始思考怎么從“用數(shù)據(jù)”轉(zhuǎn)變?yōu)椤梆B(yǎng)數(shù)據(jù)”(即從數(shù)據(jù)化運營轉(zhuǎn)變?yōu)檫\營數(shù)據(jù)),這段時間我為收集什么樣的數(shù)據(jù)而特別煩惱。而且,我也曾經(jīng)試圖做出一個特別大且適合多數(shù)人使用的數(shù)據(jù)應(yīng)用,可是后來發(fā)現(xiàn)這在數(shù)據(jù)應(yīng)用的起步階段幾乎是不可能的—— 一是找到可以解決大部分人需求的數(shù)據(jù)應(yīng)用并不容易;二是當(dāng)時公司的數(shù)據(jù)非常豐富,需要考慮的因素很多,因素之間的聯(lián)系又很復(fù)雜。
所以,當(dāng)開發(fā)數(shù)據(jù)應(yīng)用的時候,數(shù)據(jù)就等于原材料;當(dāng)原材料一直處于變化的情況下,做出來的產(chǎn)品就很容易出問題。體會到數(shù)據(jù)和應(yīng)用的關(guān)系之后,我最后決定從小角度切入,先把小應(yīng)用做出來,這就是很好的瞄準(zhǔn)器。
這里說的“小”指的是應(yīng)用的目標(biāo)很具體。請注意,“小”不是指數(shù)據(jù)量。許多人在沒有獲取足夠的數(shù)據(jù),并且缺乏對數(shù)據(jù)理解的情況下做出決策,其實是在“享受”自己的無知。打個比方來說,對于一款數(shù)據(jù)應(yīng)用,如果我的目的是分辨兩種決策誰更好以及差異在哪里,這就是一個很具體的問題;但如果我的目標(biāo)是想知道如何讓公司贏利,這就是一個空泛的目標(biāo)。
經(jīng)過這樣的一番周折后,按照小角度切入的想法設(shè)計數(shù)據(jù)應(yīng)用,就可以做得具體而快速,而且可以避免因原材料的變化而導(dǎo)致數(shù)據(jù)缺失的問題。
把數(shù)據(jù)放進“框”之中
在大數(shù)據(jù)的背景下,必須考慮數(shù)據(jù)之間的關(guān)聯(lián)性。一個單獨的數(shù)據(jù)是沒有意義的,要把數(shù)據(jù)放在一個“數(shù)據(jù)框架”(場景)之中,才能看出存在的問題。
為了把這個問題說得更明白,這里我拿前陣子一家電商公司找我討論的問題來舉例。
A 公司問我,要不要撤去導(dǎo)航網(wǎng)站的廣告?因為它懷疑許多老客戶是從導(dǎo)航網(wǎng)站訪問官網(wǎng),而不是直接訪問官網(wǎng)。把這個問題說得再直白點,就是他們想弄清楚在導(dǎo)航做廣告與公司業(yè)務(wù)之間的關(guān)系。那么,接下來就要觀察用什么“數(shù)據(jù)框架”有助于其做出決策。
1. 公司當(dāng)前的投入產(chǎn)出比
(1) 明確導(dǎo)航網(wǎng)站引進的新老用戶占比如何?
(2) 引入的新老用戶的投入產(chǎn)出比和轉(zhuǎn)化率如何?
(3)推斷撤去導(dǎo)航網(wǎng)站,對流失新老用戶的影響如何?
2. 與競爭對手的博弈
有一個問題可能會被忽略,那就是你不做導(dǎo)航網(wǎng)站廣告,你的對手就會立馬投放此廣告。做數(shù)據(jù)框架的時候,要特別注意框架不是靜態(tài)的,而是存在博弈的,需要把競爭對手的因素考慮進來。
3. 考慮時間因素
建立框架時要考慮時間因素:
(1)用現(xiàn)在、過去和未來的眼光來審視導(dǎo)航網(wǎng)站,看看導(dǎo)航的質(zhì)量是不是越來越好;
(2)需要注意的是時間有延遲性,引進來的流量會有一些延遲,在兩三個月后才能知道新用戶的價值。
總之,“數(shù)據(jù)框架”是商業(yè)分析師的靈魂所在,可以讓其從框架中找尋問題的關(guān)鍵因素及答案。不同的問題有不同的框架,不能完全在此進行闡述。
如何用框架來做決策
想要解決的問題越復(fù)雜,框架也就越復(fù)雜。但是,決策最重要的前提是要從小角度切入,從“小”做起。
對此,我總結(jié)了4 步走的方法:
1. 首先確定有什么問題,從解決問題的角度出發(fā)去收集數(shù)據(jù)。
2. 把收集到的數(shù)據(jù)整理好,放入一個“數(shù)據(jù)框架”內(nèi)(這個框架是用來幫助決策者做決定的)。讓決策者用框架更清楚地看到數(shù)據(jù)與決策之間的關(guān)系,比如A 公司在框架內(nèi)要知道競爭情況、新老客戶的比例情況等因素以及多種因素之間的關(guān)系。
3. 看框架與做決策的關(guān)系。比如,A 公司與導(dǎo)航網(wǎng)站有三種選擇——完全不合作、部分合作和全面合作。數(shù)據(jù)分析師就可以根據(jù)數(shù)據(jù)框架告知A 公司該怎么決策。如果發(fā)現(xiàn)數(shù)據(jù)框架與決策不能匹配,就必須返回到第2 步。
4. 根據(jù)決策行動,然后檢查行動是否達到目的。如果行動后發(fā)現(xiàn)根本沒有達到目的,就要檢討整個鏈條,尋找問題出在哪里。是數(shù)據(jù)有問題嗎?還是因為框架不對?或者是決策不對?是否還有數(shù)據(jù)沒考慮進去?
所以,想要解決的問題越復(fù)雜,框架也就越復(fù)雜。對于現(xiàn)在多數(shù)還沒有開始做數(shù)據(jù)應(yīng)用的電商公司來說,框架一開始千萬不要過于復(fù)雜,一定是要針對某個需要解決的具體問題開始搭建框架,令框架與決策緊密相關(guān)。所以,在搭建框架前問問自己:“你的問題是什么?你的決策是什么?反過來你的框架又該怎樣搭建?”雖然你的回答可能多種多樣,但是,最重要的前提是要從小角度切入,從“小”做起。
養(yǎng)數(shù)據(jù),重要的數(shù)據(jù)戰(zhàn)略
“用數(shù)據(jù)”更多的是一種方法論,而“養(yǎng)數(shù)據(jù)”則是一種數(shù)據(jù)戰(zhàn)略,是基于深入業(yè)務(wù)理解的更高層次的商業(yè)決策。
“養(yǎng)數(shù)據(jù)”還有一個重要的含義,就是要決定收集哪些數(shù)據(jù)。這個決定不容忽視,因為這可能是公司數(shù)據(jù)戰(zhàn)略中非常重要的一個環(huán)節(jié)。因為,很多公司的做法,是有什么數(shù)據(jù)就收集什么數(shù)據(jù),完全沒有主動性,但這樣做遇到的一個核心問題就是,公司自主思考的能力開始缺失,對該收集什么樣的數(shù)據(jù)不甚了解。事實上,在我看來,被動收集數(shù)據(jù)的行為是“收集”,而主動收集數(shù)據(jù)的行為則是“養(yǎng)數(shù)據(jù)”。再拿上面講到的某電商母嬰頻道的例子來說,如果收集主體是一家醫(yī)院,那么寶寶的姓名、性別、出生年月和媽媽的姓名等數(shù)據(jù)的收集,就是收集數(shù)據(jù),因為在住院檔案和出生證明上,這些都是必不可少的。但是,如果是母嬰用品要針對家庭進行營銷,那么這些信息顯然是不夠的,寶寶奶粉的品牌、家庭收入、職業(yè)等信息則需要企業(yè)自己主動去收集,而這些數(shù)據(jù)也就是“養(yǎng)”出來的數(shù)據(jù)。
養(yǎng)數(shù)據(jù)通常有兩類,一類是網(wǎng)站自身沒有的數(shù)據(jù),需要用戶主動提供的;另一類是公司擁有的,但沒有進行收集的數(shù)據(jù)。
若要收集公司沒有的數(shù)據(jù),在“養(yǎng)數(shù)據(jù)”時通常需要花費更多的精力和技巧。舉例來說,現(xiàn)在國內(nèi)外有很多個性化的手機購物應(yīng)用,他們會根據(jù)用戶的偏好進行商品的推薦,讓每個人都有完全不一樣的購物體驗。具體的運作原理是,當(dāng)用戶第一次使用這些應(yīng)用時,界面中會彈出一些問題,通過互動的方式來收集用戶的信息數(shù)據(jù),比如會出幾款衣服,讓用戶挑選哪一款是更喜歡的。這樣,在幾個問題之后,應(yīng)用就知道用戶的喜好了。這類應(yīng)用通常還會有另外一個特點,就是會讓用戶點“贊”,這個點贊的功能,就是讓用戶明確地告訴應(yīng)用自己喜歡什么,這樣用戶就可以在過程中,不斷地告訴應(yīng)用自己的偏好。這樣一來,應(yīng)用就可以“養(yǎng)”出用戶的核心數(shù)據(jù)。
對于公司有數(shù)據(jù)但沒有收集的狀況,則更多的是因為內(nèi)部資源協(xié)調(diào)的問題和公司決策的問題。很多提供餐飲和團購類信息服務(wù)的網(wǎng)站,通常會有一個功能是“把信息通過短信發(fā)送到手機”,這樣就不需要用戶進行特別的記錄,不過有些網(wǎng)站會記錄用戶的手機號,而有些網(wǎng)站則不會。那么,這些手機號需不需要企業(yè)存下來呢?這就是一個與業(yè)務(wù)決定和資源協(xié)調(diào)相關(guān)的問題,如果決定是記錄,則必然會需要開發(fā)人員在后臺進行功能的優(yōu)化,如果不記錄,那就會丟失這部分信息。我的觀點當(dāng)然是記錄這些數(shù)據(jù),也即是“養(yǎng)”數(shù)據(jù),因為這不僅能夠校驗用戶的手機號碼是否有效,還能夠慢慢地建立起企業(yè)與用戶的社交關(guān)系。
總之,“用數(shù)據(jù)”更多的是一種方法論,而“養(yǎng)數(shù)據(jù)”則是一種數(shù)據(jù)戰(zhàn)略,是基于深入業(yè)務(wù)理解的更高層次的商業(yè)決策,數(shù)據(jù)養(yǎng)的時間越早,積累的數(shù)據(jù)也就越多。養(yǎng)數(shù)據(jù)同樣也是一種管理和商業(yè)藝術(shù),在養(yǎng)之前可能誰也不確定最終會出現(xiàn)什么后果,但一旦養(yǎng)成,則會產(chǎn)生非常大的商業(yè)價值。