王東東
大數(shù)據(jù)是一個既傳統(tǒng)又時髦的名詞。說它傳統(tǒng),因為從人類用數(shù)字計量開始,早已把數(shù)據(jù)融入我們的生活中,身高、體重、視力等等都和數(shù)據(jù)相關(guān)。說它時髦,是因為近幾年圍繞大數(shù)據(jù)開發(fā)的新產(chǎn)品和新技術(shù),如IP影視劇火熱、AI技術(shù)井噴等都和它息息相關(guān)。
隨著智能手機的普及,電商追求流量、企業(yè)開發(fā)新品、商家促銷設(shè)計等都把大數(shù)據(jù)放在活動項目之初,甚至到了“無數(shù)據(jù),不成立”的地步。大數(shù)據(jù),真的面面俱到嗎?
大數(shù)據(jù)來路有痕,歸途無影
以一年一度的奧斯卡為例,人們愿意相信,根據(jù)觀影的好評度、票房的數(shù)據(jù)統(tǒng)計等大數(shù)據(jù)分析,我們是可以預(yù)測獎項的。也正如之前預(yù)測的那樣,2018年第90屆奧斯卡開幕和落幕,《水形物語》《三塊廣告牌》等熱門影片不出所料斬獲了多項大獎,這正是大數(shù)據(jù)的魅力所在。
然而,現(xiàn)實并不是都可以實現(xiàn)統(tǒng)計和預(yù)測的。在2018年奧斯卡頒獎的同時,號稱“東方野獸”的西伯利亞寒流卻意外地持續(xù)橫掃歐洲,威力由北歐直至地中海岸,暴風(fēng)雪甚至造成56人死亡。寒流如此兇猛,這讓擁有豐富氣象大數(shù)據(jù)的預(yù)測部門始料不及。
現(xiàn)實告誡我們,在結(jié)果發(fā)生之前,數(shù)據(jù)是存在的,但卻不是萬能的,更不是近乎完美的,有時候甚至大相徑庭。能夠采集的數(shù)據(jù),都已經(jīng)發(fā)生,是過去,來路有痕,但未來的數(shù)據(jù),今天未知。對氣象部門而言,用昨天的溫度推測今天的溫度,兩者之間或有關(guān)聯(lián),但換個領(lǐng)域,用昨天的彩票中獎號碼推測今天的中獎號碼,兩者之間卻不會有任何聯(lián)系。差別在哪?時間和邏輯。
過去發(fā)生的歷史是有價值的,但由過去的大數(shù)據(jù)推斷尚未發(fā)生的未來,這種由此及彼的關(guān)聯(lián)性和邏輯性,卻不是大數(shù)據(jù)能夠提供的。好比開庭審判,大數(shù)據(jù)可以幫助提供多樣證據(jù),但罪名是否成立,還得靠法官和法庭對證據(jù)的綜合分析,才能公正地宣判。
大數(shù)據(jù)偏執(zhí)循環(huán),無力創(chuàng)新
前不久有新聞?wù)f,有人發(fā)現(xiàn)用自己的賬號在經(jīng)常使用的旅游網(wǎng)站訂酒店是380元,換個手機就變成了300元,“殺熟”成了無良商家的秘密武器。暫且拋開商家的商業(yè)道德,僅從技術(shù)層面解釋,軟件數(shù)據(jù)已經(jīng)將該熟客認定為“價格不敏感者”,顧客曾經(jīng)消費380元房間,大數(shù)據(jù)認為顧客偏愛這個價位,高于或低于該價位匹配度不高,于是投其所好,繼續(xù)推薦,這就是大數(shù)據(jù)的簡單循環(huán),老百姓說的“一根筋”。
不單是旅游APP,經(jīng)常上淘寶、京東等平臺購物的顧客也會發(fā)現(xiàn),不同登錄人打開的首頁內(nèi)容是很不一樣的。假如上次瀏覽襯衫,下次再打開,鋪天蓋地的襯衫鏈接和圖片迎面而來,不管你已經(jīng)買了還是沒買,一次又一次的強制循環(huán)推介??葱侣凙PP也是,上次多看了兩眼體育新聞,下次會有更多的體育新聞讓你應(yīng)接不暇,哪怕是你點錯鏈接,誤操作而打開的,大數(shù)據(jù)也會認為你是認真的,矢志不渝地推介下去。
這些都如經(jīng)濟學(xué)中的馬太效應(yīng),因為多而多,因為少而少,大數(shù)據(jù)的最后結(jié)果只會將過去發(fā)揚光大,卻不會改弦更張,另起爐灶。大數(shù)據(jù)留給了互聯(lián)網(wǎng)包括聲音、圖片、視頻、文字等在內(nèi)的海量數(shù)據(jù),可謂應(yīng)有盡有,卻不會自主生成一部電影、一篇小說。正如經(jīng)濟學(xué)鼻祖亞當(dāng)·斯密提出分工創(chuàng)造價值理論,大數(shù)據(jù)的分工職能在于記錄和計算數(shù)據(jù),在單維軌道上不斷迭代升級,而實現(xiàn)單維空間的突破,完成多維空間的組合,這些是大數(shù)據(jù)最欠缺和無助的,而這恰恰是人類生命體的職能分工范疇,即創(chuàng)新。
直面靜冷,無視動感
很多人直觀面對企業(yè)會計報表,第一感覺是枯燥乏味,畢竟數(shù)據(jù)是冰冷的,靜靜地躺在那里,毫無聲息,企業(yè)CFO的職能之一就是把財務(wù)數(shù)據(jù)信息轉(zhuǎn)化為企業(yè)運營狀態(tài)信息,供決策者使用。教師的存在也是如此。學(xué)生面對教材上文字冰冷的羅列,茫然無措,只有搭配上抑揚頓挫、聲情并茂的講解才能獲得真知(從這一點講,在線教育并不能替代課堂教育)??偨Y(jié)來說,大數(shù)據(jù)可以提供劇本、臺詞和角色,但無法塑造一個立體感的靈魂。
我們常驚訝于沙畫藝術(shù)家的精妙絕倫,能夠用幾把沙子畫出連貫的場景,講述一個完整的故事。其實,每粒沙子就是一個數(shù)據(jù),數(shù)據(jù)的整合只有在藝術(shù)家的創(chuàng)作中才能體現(xiàn)非凡的價值。否則,沙子還是沙子,成為不了藝術(shù)。因此,動態(tài)條件下的數(shù)據(jù)能夠創(chuàng)作更大的價值空間。
再舉個例子,20年前,馮小剛導(dǎo)演的《甲方乙方》《不見不散》等喜劇電影深受歡迎。20年后,馮小剛導(dǎo)演的《1942》《芳華》這樣的悲情影片也有極好的口碑。那么,從大數(shù)據(jù)的分析,喜劇和悲情電影會是同一批觀眾嗎?答案是:會的!因為,當(dāng)年的嘻哈青年20年后已人到中年,早已深刻體會到生活的沉重和艱辛。而這些,是冰冷的大數(shù)據(jù)計算不出來的。因為從數(shù)據(jù)上看,喜劇和悲情劇面對的是完全迥異的兩個細分人群。只有把數(shù)據(jù)與時間、空間相結(jié)合后的四維動態(tài)演繹,才能透析市場真實的演進和隱藏的商機。
微觀最優(yōu),宏觀不及
為了精準投放廣告,電視臺曾經(jīng)推廣了數(shù)字機頂盒,通過機頂盒數(shù)據(jù)的采集,電視臺能夠精準地知道,觀眾在什么時間打開電視,看什么節(jié)目,看多久。據(jù)此再投放廣告,能夠讓廣告企業(yè)收益最大化。但事實并非如此,原因在于機頂盒能夠統(tǒng)計開機、關(guān)機和節(jié)目收視率,但無法統(tǒng)計收看電視的人是誰;是主動看,還是被動看;是購買者,還是使用者;是看了廣告買,還是看了后決定再也不買了。這樣的收視率統(tǒng)計,只能反映廣告播出了多少,至于廣告效果的宏觀總賬永遠是個謎。
因此,我們知道,數(shù)據(jù)在很多時候只能反映單一的、局部的數(shù)量效果,對整體的、宏觀的體系顧及不到,簡單的數(shù)據(jù)分析有時候甚至得出誤導(dǎo)的結(jié)論。還是以電影為例,有數(shù)據(jù)表明:2017年票房第一的《戰(zhàn)狼2》,觀眾觀影時消費的冷飲數(shù)量,要遠遠超過2016年的前票房冠軍《美人魚》,因此得出結(jié)論,激烈的戰(zhàn)爭場面能夠極大提升消費者對冷飲的需求。但把背景放大會發(fā)現(xiàn),美人魚上映時是春節(jié)正月初一,而《戰(zhàn)狼2》是7月底,暑期賣的冷飲比春節(jié)多,正常得不能再正常了??梢?,微觀的數(shù)據(jù)再完備,脫離宏觀的框架,也顯得毫無意義。
市場經(jīng)濟是理性經(jīng)濟,而每個經(jīng)濟個體都是在自身的利益最大化假設(shè)前提下,做出最符合自身利益的行為判斷,大數(shù)據(jù)也是基于此邏輯的數(shù)理分析,給出最優(yōu)化的建議。然而,每個人的最優(yōu)化,合并在一起,未必是宏觀的最優(yōu)化。假設(shè)每個人聽從個人專屬的智能設(shè)備的數(shù)據(jù)分析結(jié)論來行動,那么大數(shù)據(jù)給董存瑞的建議應(yīng)該是“爆炸當(dāng)量巨大,生命有危險,撤”;給雷鋒做好事時的建議應(yīng)該是“只有成本,無收益,拜拜”。一味地相信大數(shù)據(jù)的結(jié)論,忽視大數(shù)據(jù)產(chǎn)生的背景和假設(shè)前提,最終的微觀結(jié)論極可能導(dǎo)致一葉障目,置宏觀整體和公共利益于不顧,出現(xiàn)“公地悲劇”。因此,如何規(guī)避大數(shù)據(jù)的微觀片面化,是一個值得時刻警惕和思考的問題。
依賴系統(tǒng),局限自我
大數(shù)據(jù)的精準和高效是人類無法超越的,這毋庸置疑。但即使是再先進的數(shù)據(jù)庫、再高能的計算機,甚至勝過阿爾法狗數(shù)倍,也都依賴一定的物理系統(tǒng)本身,比如存儲設(shè)備、電能消耗、數(shù)據(jù)采集和輸出工具等,也得通過互聯(lián)網(wǎng)和手機信號的收集和整理形成數(shù)據(jù)源。一旦離開這些條件,大數(shù)據(jù)就無能為力。
假如阿爾法狗和柯潔對弈時停電了,后果可想而知。再比如以GPS手機定位為例,當(dāng)驢友深入無信號地帶,再高能的導(dǎo)航定位裝置也只能廢棄,只能靠人對自然環(huán)境的經(jīng)驗來判斷方位。所以說,數(shù)據(jù)對物理環(huán)境的依賴決定了其只能按照自有體系運行,而一旦脫離原有體系,數(shù)據(jù)則無能為力。
換種場景,當(dāng)我向谷歌或百度提出一個沒有原數(shù)據(jù)或解決方案的問題時,比如問人類怎么才能飛向火星并返回?大數(shù)據(jù)只能告訴我:第一,過去沒有人曾飛向火星;第二,更不可能返回。但這并不意味著,從此人類就放棄飛向火星的夢想,仍然有馬斯克這樣的開拓者創(chuàng)造著一個又一個嘗試飛向火星的大數(shù)據(jù),突破原有系統(tǒng)認知并不斷創(chuàng)新。
大數(shù)據(jù)是工具,可以增大我們勝算的概率,提升我們工作的效率,讓我們享受更美好的生活。大數(shù)據(jù)也是屏障,無原則的依賴和信任,會讓我們故步自封,更可能南轅北轍。我們可以用大數(shù)據(jù)計算出來何時的月亮最大最圓,但卻計算不出來,那時的你會和誰一起花前月下,那時你的生活是否幸福美滿,因為這些需要個人的機緣,更需要你去努力創(chuàng)造。(作者單位:鄭州大學(xué)西亞斯國際學(xué)院)