文/高柳旭
分析能力構(gòu)成大數(shù)據(jù)公司核心競爭力
文/高柳旭
隨著互聯(lián)網(wǎng)應用的日益深化,全球數(shù)據(jù)量正在呈現(xiàn)爆炸式增長,數(shù)據(jù)已經(jīng)滲透到每一個行業(yè)和業(yè)務領域,并成為重要的生產(chǎn)因素。大數(shù)據(jù)的使用將成為企業(yè)成長和競爭的關鍵,人們對大數(shù)據(jù)的運用將支撐新一波生產(chǎn)力增長的浪潮。大數(shù)據(jù)時代對海量數(shù)據(jù)的積累、加工和利用能力將成為國力的新標志,大數(shù)據(jù)的深度分析和利用將對推動經(jīng)濟持續(xù)增長、提升國家的競爭力起到重要的作用。
為了使讀者更進一步地了解我國大數(shù)據(jù)公司的發(fā)展現(xiàn)狀,《中國商界》記者對易觀國際產(chǎn)品中心總經(jīng)理朱江進行了專訪。
《中國商界》:易觀國際成立于2000年,到現(xiàn)在已有16年了。多年來,易觀國際一直是大數(shù)據(jù)行業(yè)的領跑者,目前的發(fā)展狀況如何?
朱江:傳統(tǒng)觀念認為易觀只是一個互聯(lián)網(wǎng)分析公司,事實絕非如此。當然,我們在互聯(lián)網(wǎng)分析上也擁有很強的專業(yè)能力。2010年以后,我們開始在技術(shù)與數(shù)據(jù)上投入更多精力,收集用戶使用互聯(lián)網(wǎng)的行為記錄。通過這些監(jiān)測數(shù)據(jù),我們能夠得到量化的數(shù)據(jù),用以支撐分析師的觀點與分析報告。易觀的發(fā)展立足于分析師業(yè)務,這是我們的核心競爭力。2010—2012年,易觀經(jīng)歷了一個快速發(fā)展過程,開始成為真正的大數(shù)據(jù)公司。我們基于收集到的數(shù)據(jù)與分析師的分析,對互聯(lián)網(wǎng)企業(yè)和互聯(lián)網(wǎng)產(chǎn)品做分析與評級的業(yè)務。另外,我們還對互聯(lián)網(wǎng)用戶的行為偏好做相關的分析。
目前易觀的業(yè)務主要是傳統(tǒng)的分析師業(yè)務與大數(shù)據(jù)產(chǎn)品。易觀把大數(shù)據(jù)AI(人工智能)作為發(fā)展方向。隨著互聯(lián)網(wǎng)的發(fā)展,易觀在2007年提出“互聯(lián)網(wǎng)化”,2012年提出“互聯(lián)網(wǎng)+”,去年又提出“數(shù)據(jù)是新能源”的理念。在未來,所有傳統(tǒng)企業(yè)都會演變?yōu)閿?shù)字企業(yè),即互聯(lián)網(wǎng)化的企業(yè),用戶數(shù)據(jù)將成為企業(yè)的核心資產(chǎn)。當然,僅僅擁有這些數(shù)據(jù)是不夠的,只有分析能力強的企業(yè)才會在市場競爭中脫穎而出。數(shù)據(jù)分析會成為基礎條件,并逐漸向人工智能方向發(fā)展。在未來,數(shù)據(jù)會成為“新能源”,在數(shù)字化企業(yè)的成長過程中,易觀將為其提供“加油站”的服務。
《中國商界》:經(jīng)過多年的發(fā)展,易觀國際已經(jīng)擁有了很多產(chǎn)品。請您介紹一下,易觀國際目前擁有哪些產(chǎn)品?
朱江:開發(fā)者在開發(fā)應用時會嵌入易觀的SDK,通過用戶下載APP進入到移動終端。當用戶打開應用時,用戶行為習慣會反饋到數(shù)據(jù)庫。易觀會對開發(fā)者的產(chǎn)品運行狀況進行分析,包括提供用戶畫像、應用評級的服務,這種服務產(chǎn)品我們稱之為“易觀方舟”,它是一種面向開發(fā)者的分析類產(chǎn)品,所有的數(shù)據(jù)源都源于“易觀方舟”?!耙子^方舟”目前還是免費的,在未來,核心功能要收費。
易觀另一個主要產(chǎn)品是“易觀千帆”,它對整個移動互聯(lián)網(wǎng)上的產(chǎn)品實施分析與評級。我們把收集到的數(shù)據(jù),以APP作為聚合目標,得到若干指標,進行分類對比,得出某一應用在它所處的領域里面相對位置狀況,領先它的競爭對手與落后它的競爭對手優(yōu)勢與劣勢分別是什么,這樣就得到了市場上不同細分領域下不同產(chǎn)品的競爭關系與發(fā)展?jié)摿??!耙子^千帆”是對互聯(lián)網(wǎng)企業(yè)和互聯(lián)網(wǎng)產(chǎn)品進行分析,而“易觀萬象”則是與“易觀千帆”相是對應的,“易觀萬象”是對用戶的行為習慣進行分析,通過它,可以很清晰地看出互聯(lián)網(wǎng)產(chǎn)品的用戶特征是什么,用戶在移動端的使用習慣是什么,以及使用習慣背后的人群特征是什么。通過數(shù)據(jù)分析可以使用戶標簽化,標簽化以后可以把用戶畫像通過我們的產(chǎn)品呈現(xiàn)給用戶。
另外,易觀還有一個細分化的產(chǎn)品“廣告萬象”。目前,移動端吸引了70%左右的廣告投入,這就需要知道投放在哪個APP上的廣告受眾最多、滲透率最高。易觀依據(jù)用戶的行為特征,為廣告、媒體行業(yè)尋找精確的受眾,制訂投放廣告或新聞的計劃,比如可以對育嬰階段的女性用戶準確投放母嬰類廣告,讓廣告實現(xiàn)最大價值。
“易觀博閱”則是積累了分析師十幾年來所有分析成果的報告庫,用戶可以購買賬號,去查詢所在行業(yè)的報告分析。
《中國商界》:易觀國際一直充當著互聯(lián)網(wǎng)行業(yè)觀察者、分析者的角色。其技術(shù)優(yōu)勢在哪里?
朱江:“易觀千帆”與“易觀萬象”是易觀的大數(shù)據(jù)產(chǎn)品,傳統(tǒng)的互聯(lián)網(wǎng)監(jiān)測產(chǎn)品一般都是采取統(tǒng)計、抽樣的方式得到數(shù)據(jù),這種樣品池的方式收集的數(shù)據(jù)量比較小。易觀的產(chǎn)品是通過海量的數(shù)據(jù)做出分析,所以結(jié)論的準確性會更高。今年第二季度末的時候,易觀數(shù)據(jù)庫覆蓋的移動終端已超過10億,每月活躍的用戶達到2億,這樣的數(shù)量級別,為分析師結(jié)論的準確性提供了保障。
如何高效、快速地處理億級別的數(shù)據(jù)量,考驗著一個公司的技術(shù)能力,這對易觀來說也是一項挑戰(zhàn)。在中國,月活躍量達到2億的APP不會超過10個,每天易觀數(shù)據(jù)庫接收到的數(shù)據(jù)量與活躍度前5名的APP規(guī)模是差不多的,這對數(shù)據(jù)的接入與處理能力提出了一個很高的要求,所以易觀的數(shù)據(jù)處理能力是非常強大的。易觀采用了業(yè)內(nèi)首創(chuàng)的混合云架構(gòu),每天處理的數(shù)據(jù)超過100億條(每個用戶在移動端上的一個行為就是一條記錄)。
易觀分析師對互聯(lián)網(wǎng)行業(yè)數(shù)據(jù)的分析有很深的經(jīng)驗積累與高超的分析能力,構(gòu)造出了很多獨有的數(shù)據(jù)分析模型,在市場中極具競爭力。
《中國商界》:據(jù)了解,TO B產(chǎn)品與TO C產(chǎn)品的區(qū)別是很大的。您能談談它們之間的區(qū)別嗎?
朱江:現(xiàn)在大多數(shù)互聯(lián)網(wǎng)產(chǎn)品是TO C產(chǎn)品,而我一直在做TO B產(chǎn)品。TO C產(chǎn)品能夠很快上手,即使是一個剛步入職場的大學畢業(yè)生也能夠做到。而要想做好TO C產(chǎn)品,沒有3年至5年的從業(yè)經(jīng)驗是不行的。產(chǎn)品的好與不好,關鍵看能否滿足特定用戶群體的需求。TO C產(chǎn)品一般都是免費的,注重的是用戶體驗、界面美化、流程簡便等,可以解決用戶生活中特定場景下的某一問題,比如外賣軟件,足不出戶能夠解決就餐問題。TO B產(chǎn)品是要滿足行業(yè)中的業(yè)務需求、解決業(yè)務中的核心和難點問題,這就必須對產(chǎn)業(yè)的每個節(jié)點都非常清楚。相比較而言,產(chǎn)品的用戶體驗、界面美化倒是次要的。比如在廣告投放過程中,需要了解受眾對不同產(chǎn)品的需求,沒有豐富廣告從業(yè)經(jīng)驗的開發(fā)者,是很難做出用于投放廣告的TO B 產(chǎn)品的。這就是TO B與TO C產(chǎn)品的差別。
《中國商界》:數(shù)據(jù)的準確性非常重要,大數(shù)據(jù)公司是如何準確獲取數(shù)據(jù)的?
朱江:監(jiān)測類產(chǎn)品一般采取兩種獲取數(shù)據(jù)的方法。一種是通過運營商的流量數(shù)據(jù)去分析,還有一種是嵌入式分析,易觀使用的是通過SDK嵌入式方法獲取用戶在終端的行為數(shù)據(jù)。SDK嵌入式的好處是即使用戶終端并沒有聯(lián)網(wǎng),在玩一個本地游戲,依然可以獲取到用戶的行為記錄,這是流量數(shù)據(jù)分析做不到的。不僅能采集到用戶的操作行為,還能夠采集用戶的位置變化信息,確定用戶連上咖啡館的WIFI或者體育館的WIFI,就可以推測出用戶的生活習慣。
《中國商界》:信息泄露已經(jīng)成為行業(yè)中飽受詬病的問題。易觀是如何把握收集數(shù)據(jù)與保護用戶隱私之間的界限的?
朱江:大數(shù)據(jù)狂潮如暴風般席卷了每個行業(yè)、每個人。隨著成本降低、長期存儲大量數(shù)據(jù)的技術(shù)和解決方案不斷出現(xiàn),越來越多的公司出手投資,使保存的數(shù)據(jù)量持續(xù)增大,時間也不斷延長。在大數(shù)據(jù)漸成趨勢的背景下,從保護用戶隱私的角度做一番審視顯得尤為重要。
美國在隱私保護方面做得很好。易觀采用了美國公司的隱私保障機制。第一,采集之前要告知,如果用戶不愿意可以拒絕。第二,設立安全保障機制,以加密的方式實施數(shù)據(jù)的傳輸和處理。第三,設立一個讓用戶可以“叫?!钡臋C制,用戶隨時可以拒絕信息的繼續(xù)采集。
先存儲一切、以后再決定其用途的新時代已然來臨。在不同數(shù)據(jù)隱私和保護框架下處理數(shù)據(jù)時,必須謹慎行事,確保遵守現(xiàn)行的成文法規(guī)(法律要求或監(jiān)管條例)以及隱性規(guī)則。數(shù)據(jù)隱私及保護規(guī)則和監(jiān)管條例必須不斷更新才能符合大數(shù)據(jù)時代的要求。
《中國商界》:任何企業(yè)都是要盈利的,大數(shù)據(jù)公司的盈利方式是什么?
朱江:易觀從成立到現(xiàn)在,一直都處于盈利的狀態(tài),之前我們主要由分析師服務與報告組成公司收入的主要來源。從去年開始,易觀的大數(shù)據(jù)產(chǎn)品通過多次測試、運營,并且通過客戶的試用,已經(jīng)磨練得比較成熟,得到了市場的認可。目前40%左右的收入來自于大數(shù)據(jù)分析,50%左右的收入來自于分析師服務。易觀的分析能力才是核心競爭力,大數(shù)據(jù)交易的收入不是很多,主要是通過數(shù)據(jù)分析產(chǎn)生報告,這已經(jīng)成為可持續(xù)發(fā)展的主要盈利方式。大數(shù)據(jù)+分析,這兩種盈利方式相輔相成,成為易觀發(fā)展下去的動力。
《中國商界》:目前,大數(shù)據(jù)公司良莠不齊,只有可持續(xù)發(fā)展的公司才是最具前景的。易觀未來的發(fā)展戰(zhàn)略是什么?
朱江:簡單的數(shù)據(jù)交易時代已經(jīng)成為過去,數(shù)據(jù)分析能力才是一個大數(shù)據(jù)企業(yè)的核心競爭力。
投資機構(gòu)在投資產(chǎn)品的時候,需要知道這款產(chǎn)品的競爭力是怎么樣的,未來的增速情況如何,用戶黏度會不會好,通過我們的分析,可以得知這款產(chǎn)品是否有投資價值,以及投資領域的整體發(fā)展趨勢。
目前,市場上擁有數(shù)據(jù)的公司很多,有分析能力的公司也不少,但是既有數(shù)據(jù)又有分析能力的公司并不多。數(shù)據(jù)分析能力的高低,決定了價值發(fā)現(xiàn)過程的好壞與成敗。獲取的數(shù)據(jù)可能具有多種結(jié)構(gòu)和類型,在數(shù)據(jù)抽取過程中,可以將這些復雜的數(shù)據(jù)轉(zhuǎn)化為單一的或者便于處理的構(gòu)型,以達到快速分析處理的目的??梢哉f,沒有數(shù)據(jù)分析,“大數(shù)據(jù)”只是一堆IT庫存,成本高而收益為零。另外,并不是所有數(shù)據(jù)都是有價值的,有些數(shù)據(jù)并不是我們所關心的內(nèi)容,而另一些數(shù)據(jù)則是完全錯誤的干擾項,因此要對數(shù)據(jù)實行過濾“去噪”,提取出有效的數(shù)據(jù)。
但是國內(nèi)的大數(shù)據(jù)行業(yè),目前仍然停留在數(shù)據(jù)收集、整理、存儲和簡單報表等初級階段。能夠?qū)Υ髷?shù)據(jù)進行基本分析和運用的,只是少數(shù)企業(yè)。大數(shù)據(jù)規(guī)模龐大、類型多樣、關聯(lián)復雜的特點導致傳統(tǒng)數(shù)據(jù)計算模式不再適用,大數(shù)據(jù)計算面臨基本模式的挑戰(zhàn)。如何對大數(shù)據(jù)的復雜性深入解析,并在此基礎上構(gòu)建高效的大數(shù)據(jù)計算模型,成為大數(shù)據(jù)處理的核心問題。
易觀的最終目標是把現(xiàn)有的模型程序化,通過訓練機器的深度學習能力,提高機器的分析水平,讓機器發(fā)現(xiàn)更多的數(shù)據(jù)模型,這就是AI,即人工智能。這將打破人類思維上的局限性,也許會得出很多出乎意料的分析結(jié)果。
《中國商界》:基于互聯(lián)網(wǎng)的大數(shù)據(jù)行業(yè),前景是極其廣闊的。您對這個前景怎么看?
朱江:我對大數(shù)據(jù)行業(yè)的前景非常樂觀,在未來,數(shù)據(jù)會成為“新能源”,它在各個行業(yè)都會成為核心資產(chǎn),所有的企業(yè)都會變成數(shù)字企業(yè),每個企業(yè)都會擁有大量的用戶數(shù)據(jù)資產(chǎn),這也將成為最有價值的資產(chǎn),挖掘用戶數(shù)據(jù)對企業(yè)的貢獻非常大。
大數(shù)據(jù)技術(shù)能夠?qū)㈦[藏于海量數(shù)據(jù)中的信息和知識挖掘出來,為人類的社會經(jīng)濟活動提供依據(jù),從而提高各個領域的運行效率,并大大提高整個社會經(jīng)濟的集約化程度。隨著大數(shù)據(jù)的應用越來越廣泛,應用的行業(yè)也越來越普遍,我們每天都可以看到大數(shù)據(jù)的一些新穎的應用形式,從而幫助人們獲取到真正有用的價值。