⊙趙 鵬[太原師范學(xué)院文學(xué)院影視藝術(shù)系,山西 晉中 030619]
縱觀電影史,技術(shù)的進(jìn)步一次次地推動電影的發(fā)展,帶來了新的主義與新的浪潮,產(chǎn)生了新的流派與新的體驗(yàn)。近些年以來,“大數(shù)據(jù)”一詞在各個領(lǐng)域都異常的火熱。在新聞報(bào)道中會不斷地出現(xiàn),例如“某某產(chǎn)品利用大數(shù)據(jù)改良了新的產(chǎn)品”,“某某行業(yè)利用大數(shù)據(jù)產(chǎn)生了新的模式”等類似的消息。對于電影行業(yè)來說,大數(shù)據(jù)更是被捧得火熱,很多人對其視如珍寶,但被視若珍寶的大數(shù)據(jù)有時(shí)卻讓人們大跌眼鏡。
2013 年被業(yè)界稱之為“大數(shù)據(jù)元年”,自此之后大數(shù)據(jù)這一新興的媒介技術(shù)便被影視行業(yè)所深度裹挾。2014 年百度公司與中影股份、中信信托和北京德恒律師事務(wù)所聯(lián)合發(fā)布了國內(nèi)首個電影大眾消費(fèi)平臺——百發(fā)有戲。一期產(chǎn)品選定由湯唯、馮紹峰主演的影片《黃金時(shí)代》。選擇《黃金時(shí)代》作為一期產(chǎn)品,除了考慮到該片的題材以及豪華的主創(chuàng)班底外,也充分利用了百度即將上線的票房預(yù)測產(chǎn)品提供的數(shù)據(jù)支持。當(dāng)時(shí)百度大數(shù)據(jù)部產(chǎn)品規(guī)劃負(fù)責(zé)人表示,從即將上線的百度票房預(yù)測數(shù)據(jù)可知,電影《黃金時(shí)代》的票房有望一路飄紅,預(yù)計(jì)票房為2 億至2.3 億,但實(shí)際票房僅為5000 多萬,預(yù)計(jì)票房與實(shí)際票房相差達(dá)到了75%之多。在電影《后會無期》上映前,片方購買了一種數(shù)據(jù)預(yù)測服務(wù),簡單來說就是根據(jù)電影首映日的票房,預(yù)測最終的票房成績。承擔(dān)預(yù)測服務(wù)的公司為ABD 愛夢娛樂,這家公司對《后會無期》的票房預(yù)測為4.3 億到4.8 億,但實(shí)際票房為6.5 億。相差2 億。
與《黃金時(shí)代》和《后悔無期》不同,搜狗與Netflix 這兩家公司對于“大數(shù)據(jù)”的應(yīng)用,呈現(xiàn)出一種“時(shí)靈時(shí)不靈”的狀態(tài)。當(dāng)年1 月份,搜狗公司的助理研究員在微博上稱,搜狗預(yù)測小黃人《神偷奶爸2》的票房為1.53 億,隨后的結(jié)果顯示,這與實(shí)際結(jié)果幾乎完全一致,這引起了一些電影界人士的驚呼。但是在預(yù)測《熊出沒》時(shí),搜狗公司就出現(xiàn)了較大的失誤,預(yù)測票房為0.64 億,最終首周票房就達(dá)到了1.48 億。另外,當(dāng)年年初《紙牌屋》迅速走紅,依據(jù)Netflix 公司的說法,Netflix 在美國有2700 萬訂閱用戶,每天用戶在Netflix 上產(chǎn)生3000 萬多個行為,Netflix 的訂閱用戶每天還會給出400 萬個評分,還會有300 萬次搜索請求,正是基于此原因《紙牌屋》才會取得如此成功。但是接下來,該公司推出的另一部自制劇《鐵杉樹叢》也遭遇了滑鐵盧,被譽(yù)為是“2013 年年度最爛美劇”。
面對讓百度與ABD 愛夢娛樂公司讓人大跌眼鏡的預(yù)測結(jié)果,面對時(shí)靈時(shí)不靈的Netflix 和搜狗公司,“大數(shù)據(jù)”作為一種新興的媒介技術(shù)手段被電影行業(yè)所深度裹挾。大數(shù)據(jù)技術(shù)作為一種實(shí)現(xiàn)手段,其本質(zhì)與原始社會中人類捕獵時(shí)使用的石頭無異。正確使用新興技術(shù)的前提應(yīng)為追本溯源、厘清對象與方法得當(dāng)。
縱觀電影史,對數(shù)據(jù)最早、最成功的運(yùn)用應(yīng)當(dāng)為《亂世佳人》這部影片,它的制作雖然起始于20 世紀(jì)30 年代,但是它對今天的電影行業(yè)來說還是有很大的借鑒意義的。
20 世紀(jì)30 年代,美國電影制片廠體系已經(jīng)初步建立,商業(yè)法則的競爭與工業(yè)化方式的制作已經(jīng)滲透到了好萊塢電影制作、發(fā)行、放映的各個環(huán)節(jié),此時(shí)的電影采取一種分工合作的方式制作電影,制片人對電影的各個環(huán)節(jié)起到一種把控和監(jiān)督的作用,對影片有著絕對的控制力。在此背景下,1936 年,小說《亂世佳人》在美國十分暢銷,暢銷的同時(shí)也引起了好萊塢的關(guān)注,但是因?yàn)樵诖酥?,好萊塢所出品的與南北戰(zhàn)爭為題材的影片接連虧本,對于要不要把這部小說改變?yōu)閯”九某捎捌?,在好萊塢的內(nèi)部產(chǎn)生了分歧。當(dāng)時(shí)好萊塢的大佬們找到了一個叫做喬治·蓋洛普的人,問他到底這本書有多流行,他的回答是此書非常流行。得到這個答案后,當(dāng)時(shí)著名的好萊塢制片人大衛(wèi)·塞爾茲尼克就高價(jià)買下了《亂世佳人》的電影版權(quán)。之后蓋洛普還告訴他,這本書是美國有史以來最流行的小說,其流行程度僅次于《圣經(jīng)》,約有1400 萬美國人讀過此書,塞爾茲尼克聽到這樣的答案之后信心大增。
與制片廠制度并行的另一個制度是明星制度。明星制度就是在影片當(dāng)中突出演員的作用,為演員量身定制影片,在這種制度的作用下,影片的制作都必須圍繞著演員來展開。就在這樣的大背景下,對影片有絕對控制力的制片人塞爾茲尼克提出了讓英國女演員費(fèi)雯·麗來出演影片女主角的方案,但由于這部影片涉及美國獨(dú)立戰(zhàn)爭、南北戰(zhàn)爭等重大歷史事件,讓一個英國女演員來飾演片子的女主角這種做法遭到了一些人的抵制。于是作為制片人的塞爾茲尼克就又找到了蓋洛普,委托他調(diào)查一下民眾對選擇英國女演員來擔(dān)當(dāng)此片的女主角是否贊同。蓋洛普調(diào)查之后告訴塞爾茲尼克支持英國女演員出任主演的人數(shù)要比不支持的人數(shù)多出很多。另外,蓋洛普還告訴塞爾茲尼克大多數(shù)的觀眾想看彩色片,大部分的人不反對影片拍成上下兩集。得到答案的塞爾茲尼克幾乎全部采納了蓋洛普的建議。
在影片上市前,塞爾尼茲克聽取了蓋洛普對于影片廣告要突出“書”元素的建議,因此,首輪影片的廣告設(shè)計(jì)無論是從圖片還是字體都完全模仿了小說書本的封面,在影片上映那天觀影人流如潮。在影片后期的四輪上映中,每次都依據(jù)蓋洛普的建議來調(diào)整影片的營銷策略和電影票價(jià)。影片的最終結(jié)果證明了當(dāng)初蓋洛普所做出的預(yù)測是十分成功的,共有5997 萬人次觀看了這部影片,與之預(yù)測的5650 萬人次相差不到6%,票房毛收入為3400 萬美元,成為美國有時(shí)以來最賣座的影片。
蓋洛普做出精準(zhǔn)的預(yù)測,并促使影片產(chǎn)生巨大的社會反響和票房奇跡,這一切的背后都?xì)w因于其使用了數(shù)據(jù)的科學(xué)抽樣法,這種抽樣方法不一味地追求龐大的數(shù)據(jù)量,而是追求其樣本的代表性?;乜串?dāng)下,如果我們今天脫去偽“大數(shù)據(jù)”的外衣,踏踏實(shí)實(shí)地利用科學(xué)的數(shù)據(jù)抽樣調(diào)查方法來制作、宣發(fā)和研究電影的話,我認(rèn)為,處于網(wǎng)絡(luò)信息時(shí)代的我們一定會比處于第二次工業(yè)革命時(shí)期的蓋洛普預(yù)測得更加精準(zhǔn)。
依據(jù)學(xué)者涂子沛對數(shù)據(jù)的時(shí)代劃分方法,在蓋洛普之前所用的調(diào)查方法處于數(shù)據(jù)的單一量化階段,蓋洛普的調(diào)查方法處于數(shù)據(jù)科學(xué)的抽樣時(shí)代,其本質(zhì)的區(qū)別在于樣本代表性的不同?,F(xiàn)在電影行業(yè)中炙手可熱的“大數(shù)據(jù)”概念與數(shù)據(jù)抽樣時(shí)代的本質(zhì)區(qū)別在于兩點(diǎn),第一點(diǎn)為數(shù)據(jù)的調(diào)查樣本不同,第二點(diǎn)為邏輯關(guān)系的轉(zhuǎn)變。
對《黃金時(shí)代》做出票房預(yù)測的是百度公司的“百度票房預(yù)測”,據(jù)百度大數(shù)據(jù)部產(chǎn)品規(guī)劃負(fù)責(zé)人介紹,百度票房預(yù)測結(jié)合了百度每日60 億次的搜索查詢數(shù)據(jù)、1 億規(guī)模的微博數(shù)據(jù),以及中國電影過去五年的歷史票房數(shù)據(jù),從演員熱度、導(dǎo)演熱度、電影關(guān)注度、上映時(shí)間等維度對一部電影進(jìn)行票房預(yù)估。利用此方法得出的預(yù)測票房為2 億至2.3 億,但實(shí)際票房僅為5000多萬,預(yù)計(jì)票房與實(shí)際票房相差達(dá)到了75%之多,之所以會出現(xiàn)這樣的現(xiàn)象,究其根本是由于調(diào)查的樣本出現(xiàn)了問題。
百度公司的百度票房預(yù)測產(chǎn)品,它的數(shù)據(jù)來源主要是基于互聯(lián)網(wǎng)這一單一平臺,所依據(jù)的數(shù)據(jù)樣本不具有足夠代表性,真正意義上的大數(shù)據(jù)從樣本的覆蓋率上來說,是一種數(shù)據(jù)的全覆蓋,換句話說就是大數(shù)據(jù)的研究樣本為研究對象的全體數(shù)據(jù)。前文中提到過蓋洛普所采用的數(shù)據(jù)的科學(xué)抽樣法,這種方法之所以開啟一個新的數(shù)據(jù)時(shí)代是因?yàn)樗褦?shù)據(jù)樣本的代表性問題提高到了一個新的層次。在數(shù)據(jù)的量化時(shí)代,人們對于樣本代表性的追求體現(xiàn)在單純數(shù)量的疊加;到了抽樣時(shí)代,人們對于樣本代表性的追求體現(xiàn)在了依據(jù)樣本的差異性進(jìn)行科學(xué)的抽樣;那么到了大數(shù)據(jù)時(shí)代,對于樣本代表性的追求我們已經(jīng)可以利用現(xiàn)如今的科技手段在某些方面達(dá)到一種樣本的全覆蓋,也就是說大數(shù)據(jù)時(shí)代是在研究全體樣本而不是經(jīng)過抽樣以后得到的樣本。和大多數(shù)的數(shù)據(jù)公司一樣,百度票房預(yù)測在面對電影這一復(fù)雜的藝術(shù)領(lǐng)域時(shí),它單純地依靠互聯(lián)網(wǎng)平臺所擁有的數(shù)據(jù)顯然不能稱之為“大數(shù)據(jù)”。
大數(shù)據(jù)時(shí)代區(qū)別于前大數(shù)據(jù)時(shí)代的另一重要的不同在于認(rèn)知關(guān)系的轉(zhuǎn)變,簡單來說就是大數(shù)據(jù)是利用事物的相關(guān)性來代替因果性。由于人的認(rèn)知在一定程度上是存在誤差的,所以人所理解的因果關(guān)系其實(shí)在某種程度上來說并不一定是一種真正的因果關(guān)系,換句話說就是人所看到和聽到的并不一定就是真的。大數(shù)據(jù)不一味地追求這種事物間的因果聯(lián)系,而是轉(zhuǎn)而尋找事物間的相關(guān)聯(lián)系,找出一個或多個對研究對象相關(guān)的變量,從而達(dá)到影響或者預(yù)測未來的研究對象。
目前大多的電影數(shù)據(jù)公司,對電影的研究還只是單一的對關(guān)于電影的數(shù)據(jù)進(jìn)行研究,其實(shí)這是遠(yuǎn)遠(yuǎn)不夠的。從數(shù)據(jù)搜集的角度來看,對于預(yù)測電影票房來說,除了與電影相關(guān)的導(dǎo)演、演員、視聽、檔期、影院拍片等與電影相關(guān)的因素有關(guān)以外,文化的認(rèn)同、地域的差異,甚至是氣候的改變等都可能會對電影的票房產(chǎn)生影響,大數(shù)據(jù)要做的就是找到事物之間的這種相關(guān)性。從數(shù)據(jù)真實(shí)度的角度來看,在對電影受眾進(jìn)行調(diào)查的時(shí)候,獲得的并不一定都是真實(shí)的數(shù)據(jù)。例如,網(wǎng)絡(luò)上充斥著大量的水軍,微博上有著大量的僵尸粉,就算找到真人面對面地填寫調(diào)查問卷,也許礙于某些原因得到的答案也不一定是真實(shí)的。在這種情況下,大數(shù)據(jù)也可以找到其他一些相關(guān)的因素來代替某一類不容易辨別真?zhèn)蔚臄?shù)據(jù)。
在電影行業(yè)中,被綁架了的“大數(shù)據(jù)”始終不缺乏現(xiàn)象級的話題與喧鬧后的質(zhì)疑。無論是從數(shù)據(jù)樣本上來講,還是從邏輯關(guān)系上來講,電影行業(yè)離真正的大數(shù)據(jù)還存在一定的距離,距離的存在是由于我們現(xiàn)在其實(shí)是正在邁向大數(shù)據(jù)時(shí)代,而并沒有真正跨入大數(shù)據(jù)時(shí)代。大數(shù)據(jù)的興起是基于信息時(shí)代的互聯(lián)網(wǎng)平臺,大數(shù)據(jù)的成熟是基于云技術(shù)的成熟與普及,我們現(xiàn)在已經(jīng)擁有了前者,正在擁抱后者。對于研究電影的數(shù)據(jù)公司來說,在現(xiàn)有的技術(shù)條件下我們完全可以利用科學(xué)的數(shù)據(jù)抽樣方法來進(jìn)行多維度的研究,得出可靠的結(jié)論,那么“《亂世佳人》式”的成功也一定會不斷地涌現(xiàn)出來。
①肖揚(yáng):《黃金時(shí)代:帶觀眾掙錢》,《北京青年報(bào)》2014年9月22日,第B08版.
② 張曦:《黃金時(shí)代上映10天票房未過5千萬 文藝片如何突圍》,中國新聞網(wǎng),2014年10月12日,http://www.chinanews.com/yl/2014/10-12/6669020.shtml
③④ 鄭道森:《不要因?yàn)槠狈款A(yù)測失靈就全盤否定大數(shù)據(jù)》,虎嗅網(wǎng),2014年19月23日,http://www.huxiu.com/article/45114/1.html.
⑤ 范曉東:《〈紙牌屋〉的大數(shù)據(jù)爭議:革命還是包裝?》,騰訊網(wǎng),2014年02月19日,http://tech.qq.com/a/20140219/014987.htm
⑥⑦ 涂 子沛:《數(shù)據(jù)之巔:大數(shù)據(jù)革命,歷史、現(xiàn)實(shí)與未來》,中信出版社2014年5月 第1版,第180—181頁,第182—183頁。
⑧ 數(shù) 據(jù)的時(shí)代劃分“量化時(shí)代、抽樣時(shí)代、開放時(shí)代、大數(shù)據(jù)時(shí)代”參見涂子沛:《數(shù)據(jù)之巔:大數(shù)據(jù)革命,歷史、現(xiàn)實(shí)與未來》,中信出版社2014年5月第1版.
⑨⑩〔奧〕 維克托·邁爾-舍恩伯格 肯尼斯·庫克耶 :《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》,浙江人民出版社2013年1月第1版,第27頁,第67頁。