葉德義
所謂“大”,就是“多”。
在“大數(shù)據(jù)時(shí)代”,我們可以通過數(shù)據(jù)收集、存儲(chǔ)、挖掘、分析,弄清事物之間的聯(lián)系,得出一些規(guī)律性的東西,用數(shù)據(jù)引導(dǎo)決策。
比如,網(wǎng)絡(luò)上熱門話題的來源,就是通過海量詞匯的對(duì)比,找出哪些是最受網(wǎng)民關(guān)注的。
比如,移動(dòng)電話網(wǎng)絡(luò)運(yùn)營(yíng)商們,通過跟蹤用戶的話費(fèi)消耗情況,就能知道哪些用戶在流失,從而采取應(yīng)對(duì)策略。
但是,“大數(shù)據(jù)”每次都靈驗(yàn)嗎?
2014年6月28日是世界杯小組賽后的休戰(zhàn)日,國(guó)際足聯(lián)官網(wǎng)趁此推出了小組賽階段的球員最佳陣容11人名單。這份名單讓人看了摸不著頭腦,占據(jù)射手榜前三位的內(nèi)馬爾、梅西和穆勒竟無(wú)一上榜,名單上幾乎每個(gè)位置的人選都能引發(fā)爭(zhēng)議。
這份名單是國(guó)際足聯(lián)和贊助商用數(shù)據(jù)采集、電腦分析的方式“計(jì)算”出來的。從全球球迷的一致吐槽聲來看,機(jī)器給人打的分、評(píng)的榜,無(wú)人認(rèn)同。
國(guó)際足聯(lián)官網(wǎng)對(duì)這套評(píng)分系統(tǒng)的運(yùn)作原理有一番解釋。第一步是采集比賽中每一位球員的動(dòng)作數(shù)據(jù),包括傳球、射門、搶斷、跑動(dòng)距離等,然后將數(shù)據(jù)代入一套設(shè)計(jì)好的程式,分析球員的每一個(gè)動(dòng)作對(duì)球隊(duì)得分起到的作用是正面還是負(fù)面的。
比如內(nèi)馬爾射門,打在門框范圍內(nèi)能加分,射偏了就要減分;梅西跑動(dòng)距離高于前鋒平均值能加分,反過來也要減分。
這套程式以一種理想化的設(shè)定,將球員的動(dòng)作行為簡(jiǎn)單判定為“+”與“-”,再有特點(diǎn)的球星,在0和1的計(jì)算機(jī)二維世界中也失去了個(gè)性。判定誰(shuí)是好球員,實(shí)際上就是比比誰(shuí)是謹(jǐn)遵電腦評(píng)分標(biāo)準(zhǔn)踢球的好孩子。
有球迷吐槽說,本澤馬都是在禁區(qū)內(nèi)射門,只要不打偏都能加分,逮著機(jī)會(huì)不講理冷射的梅西就沒戲了;拉姆不送威脅球,保證不出錯(cuò)能加分,克洛斯那種長(zhǎng)傳,只要隊(duì)友沒接到就算失誤,所以上榜機(jī)會(huì)也沒了。就連國(guó)際足聯(lián)官網(wǎng)自己也解釋說,內(nèi)馬爾沒上榜的原因,就是在禁區(qū)外射門過多導(dǎo)致減分。
這很容易讓人聯(lián)想到世界杯期間在各種屏幕上反復(fù)“轟炸”的一則運(yùn)動(dòng)品牌廣告 —— 世界杯版“克隆人的進(jìn)攻”??茖W(xué)家制造出世界頂尖球星的克隆人,“世界上最偉大的球星也可能犯錯(cuò),因?yàn)樗麄兲咔蛱^冒險(xiǎn)”,而克隆人根據(jù)電腦程序踢球,永遠(yuǎn)不會(huì)犯錯(cuò)。然而最終球星們從克隆人手里奪回了球場(chǎng),辦法就是勇于冒險(xiǎn),不按常理出牌,結(jié)果讓電腦錯(cuò)亂了。
真實(shí)的世界杯賽場(chǎng),梅西在禁區(qū)外射穿伊朗“大巴陣”的那腳射門,那道弧線不是經(jīng)過電腦計(jì)算出來的,是他被逼入絕境后的放手一搏;如果布林德?lián)淖约耗怯洸豢孔V的50米斜長(zhǎng)傳會(huì)導(dǎo)致減分,后面也就沒有范佩西頭球破門被惡搞成各種飛人形象的故事了。
世界杯之所以精彩,就是因?yàn)椴淮嬖陬A(yù)先設(shè)定的程式,無(wú)論是穆勒第一場(chǎng)球就上演“帽子戲法”,還是蘇亞雷斯咬人被逐,所有的故事都在主角們的一念之間,是一瞬間的一蹴而就,這是屬于全人類的大冒險(xiǎn)。一百個(gè)球迷心中有一百套最佳陣容,但一定沒有電腦替你做主的那一套。
【練一練】
(1) 下列關(guān)于國(guó)際足聯(lián)官網(wǎng)評(píng)分系統(tǒng)的相關(guān)表述,不符合文意的一項(xiàng)是
A. 采集包括球員傳球、射門、搶斷等在內(nèi)的每一個(gè)動(dòng)作數(shù)據(jù),是評(píng)分系統(tǒng)進(jìn)行運(yùn)作的第一步。
B. 球員每一個(gè)動(dòng)作對(duì)球隊(duì)得分起到正面或負(fù)面作用的數(shù)據(jù),被代入設(shè)計(jì)好的程式進(jìn)行計(jì)算。
C. 將球員的每一個(gè)動(dòng)作簡(jiǎn)單判定為“+”與“-”的程式,是基于一種理想化的預(yù)先設(shè)定。
D. 根據(jù)評(píng)分系統(tǒng)對(duì)世界杯足球隊(duì)員進(jìn)行評(píng)判的結(jié)果,內(nèi)馬爾、梅西和穆勒都沒入選最佳陣容榜單。
(2) 概括球迷吐槽國(guó)際足聯(lián)官網(wǎng)推出的球員最佳陣容11人名單的主要原因。
【參考答案】
(1) B [代入的不是已知的“起正面或負(fù)面作用的數(shù)據(jù)”,而是球員的動(dòng)作數(shù)據(jù),起正面還是負(fù)面作用要經(jīng)過評(píng)分系統(tǒng)計(jì)算才能得知]
(2) ①足球賽不是被預(yù)先設(shè)定的程式,其過程和結(jié)果都不是可以用電腦分析的方式“計(jì)算”出來的。
②世界杯足球賽的精彩恰恰在于突破程式的大冒險(xiǎn)。
③每個(gè)球迷心中都有一套最佳陣容,肯定與電腦計(jì)算得出的不一樣。
中學(xué)生天地·高中學(xué)習(xí)版2014年9期