數(shù)據(jù)積累大到一定規(guī)模,就具備了生命體特征,無數(shù)隱藏在碎片事實之后的線索和規(guī)律,通過科學(xué)算法的提煉,就會變得無比強大。
7月5日凌晨,身為資深德國球迷,體驗了一個歡快的夜晚。是役,德國隊1:0擊敗法國隊,連續(xù)四屆挺進世界杯四強,創(chuàng)造了一項新紀錄。
同時,筆者也長長出了口惡氣!此前谷歌說,法國對德國的勝率高達69%,多少讓德粉揪了一把心。之所以揪心,乃是此前谷歌對十六強的賽果預(yù)測——竟然全對了!
這個基于谷歌云計算平臺的大數(shù)據(jù)挖掘和研究系統(tǒng),基礎(chǔ)數(shù)據(jù)來自O(shè)pta Sports,評估每個職業(yè)足球聯(lián)盟過去多個賽季的情況,以及世界杯小組賽期間的統(tǒng)計數(shù)據(jù);加之BigQuery工程師喬丹·提加尼開發(fā)的實力排行榜系統(tǒng),同時參照觀眾熱情程度數(shù)據(jù),以計算預(yù)測世界杯淘汰賽階段的每場勝率。
當(dāng)然,對十六強賽果的準(zhǔn)確預(yù)測,并不能說明太多問題,連谷歌自己也承認,“16強賽中沒有冷門出現(xiàn)”,并且“不是唯一做出完美預(yù)測的公司”。
實際上,長期使用大數(shù)據(jù)進行體育賽事預(yù)測的,以博彩公司為首,否則無法支撐確保莊家穩(wěn)賺不賠的賠率精算。另外,還有足球發(fā)達國家的足協(xié)、各大職業(yè)聯(lián)賽的豪門俱樂部熱衷此道,那是為了系統(tǒng)對每場比賽進行科學(xué)指導(dǎo)。無獨有偶,就在7月4日的SAP論壇上,筆者就親身體驗了其與德國足協(xié)聯(lián)合開發(fā)的Match Insights方案,遠在巴西的德國隊正在使用該系統(tǒng),對每一場比賽、每一個球員、每一次跑位和傳球的數(shù)據(jù)進行監(jiān)測、匯總、計算、分析,輔之以可視化的3D全景界面,甚是直觀。
數(shù)據(jù)積累大到一定規(guī)模,就具備了生命體特征,無數(shù)隱藏在碎片事實之后的線索和規(guī)律,通過科學(xué)算法的提煉,就會變得無比強大。足球如是,電影亦然。谷歌曾在去年發(fā)布《Quantifying Movie Magic with Google Search》報告,通過電影正片開畫前一個月電影預(yù)告片在谷歌的搜索行為等數(shù)據(jù),與該片檔期和觀影周期進行對比能夠預(yù)測該片首映周末的票房收入情況,準(zhǔn)確率高達94%。
根據(jù)已知,探索未知,大數(shù)據(jù)是個好手段。更重要的是,開放的互聯(lián)網(wǎng)為每一個普通人都提供了撬動支點的可能。從谷歌到亞馬遜,再到國內(nèi)的B.A.T,云計算已不僅僅是高大上的稀罕玩意,而是一種實實在在的平臺能力輸出,從企業(yè)到個人,只要接入平臺,就可以獲得相應(yīng)的云計算和大數(shù)據(jù)能力。
這時候,能否具備充分的技術(shù)自覺,利用云計算開放平臺的機遇,結(jié)合自身行業(yè)特點和應(yīng)用特征,建立相應(yīng)的大數(shù)據(jù)模型,挖掘潛伏著的運營規(guī)律和商業(yè)線索,決定了在互聯(lián)網(wǎng)思維時代的競爭力。
目前,正如火如荼搞這個的有兩個行業(yè)。其一是O2O,線下商家尤其是大型百貨商場,在經(jīng)受過數(shù)波電子商務(wù)的席卷后,轉(zhuǎn)型情勢之迫切,毋庸多言;其二是傳媒業(yè),這個幾乎已經(jīng)被互聯(lián)網(wǎng)徹底顛覆的行業(yè),面臨的是比商貿(mào)物流業(yè)更加嚴峻的生死之局——新技術(shù)和新產(chǎn)品層出不窮,面對利用數(shù)據(jù)分析進行“內(nèi)容搬運”的“今日頭條”們,傳統(tǒng)媒體除了祭出版權(quán)大棒爭取正當(dāng)權(quán)益,更重要的是自己要擁有這種大數(shù)據(jù)時代的能力,才能避免陷入日復(fù)一日的被動。
不過,回到世界杯最后的四場比賽,筆者還是希望大數(shù)據(jù)預(yù)測不要再“顯靈”了。畢竟,圓的足球才有趣兒,不是嗎?