胡心言(南京藝術學院 傳媒學院,江蘇 南京 210013)
數(shù)據(jù)的面孔①
——西方電影評價體系研究中的主客觀博弈
胡心言(南京藝術學院 傳媒學院,江蘇 南京 210013)
西方電影評價體系在長期的理論和實踐探索中已逐漸形成三個層級:大眾口碑和用戶評分、專業(yè)電影評價組織獎項或榜單以及立足于數(shù)據(jù)統(tǒng)計的評價之研究。其中每一層級的評價,都涉及了客觀方法和主觀問題之間的彼此優(yōu)化、互為論證、相互博弈。該體系很好地糅合了電影評價行為的主客兩面,且通過不同評價層級之間的參照和指導,將西方電影平衡在藝術與商業(yè)、大眾與小眾、品質(zhì)與傳播之間。
電影評價體系;分層評價;數(shù)據(jù)分析;主客觀博弈
1990年代中后期,隨著互聯(lián)網(wǎng)技術迅猛普及,網(wǎng)絡用戶幾何式增長,人類社會在隨后短短二十年內(nèi)就進入了數(shù)字時代?;ヂ?lián)網(wǎng)瞬息萬變的聯(lián)絡速度,兼之電子計算機強大的存儲功能,使人類對既往社會文化生活資料的調(diào)動能力、處理能力和分析能力都空前提高。在電視電影行業(yè)的觀眾研究領域,最顯著的變化就是貫穿線上線下的,更加豐富多元的電影評價行為的產(chǎn)生。
但是,目前國內(nèi)電影評價行為尚未形成完整、科學、自洽的體系。而西方學界則已對電影評價行為進行過較為嚴謹和詳細的梳理研究。本文參考了近二十篇當代西方學者基于各式電影評價行為的研究論文,意圖梳理出西方電影評價行為的層級和體系,作為國內(nèi)電影評價體系的建立提供借鑒。
本文所觀察到的西方電影評價主要圍繞三層級的評價行為展開的:
第一層級:口碑,個人評分,專家影評等;第二層級:奧斯卡獎,Top250 IMDb,Rotten Tomatoes,美國國家電影收藏目錄等;第三層級:間隔年算法,三維評價算法等。
第一層級評價的主體是自然人,無論大眾、專家學者或是AMPAS(美國電影藝術與科學學院)中的電影精英,他們都兼具人性的精髓與局限。這一部分數(shù)據(jù)是隨機而龐雜的,卻也是最為活躍和敏感的。
第二層級評價的主體是那些商業(yè)或非商業(yè)的電影評價組織,可以是線上的電影信息互享平臺,也可以是線下的各色頒獎或榜單。這一層級評價是第一層級的回饋和整合,這些評價體制基于不同的評價標準,然而相對具有某種程序理性,并且在實踐中被不斷打磨和完善。
第三層級評價是在立足于數(shù)據(jù)理性而不斷置疑、創(chuàng)新和檢驗的評價之評價。它能夠隨意調(diào)動下級或平級的數(shù)字資源,在方法論的層面上試驗和檢驗電影評價的“最優(yōu)解”,從而對電影評價,乃至整個電影行業(yè)生態(tài)產(chǎn)生終極作用?!叭卧u價”甚而能夠橫向跨越電影的學科界限,使電影學以標準化、理論化的面目與其他人文、社科、經(jīng)濟或政治學研究對接,未來發(fā)揮出電影作為一種超級媒介的最大效益。
1990年,IMDb (Internet Movie Database)網(wǎng)站的創(chuàng)始工程師Col Needham發(fā)布了一個名為“她們的眼睛”(“Those Eyes”)的腳本,意圖征集一份“擁有最美眼睛的女演員”列表。這份列表很快續(xù)長,并以驚人的速度分列出新的更全面的條目,在極短時間內(nèi)就收到了覆蓋超過10000部電影電視劇的演職人員信息,而這僅是擁有百年歷史的電影電視行業(yè)數(shù)據(jù)化工程的肇始。
IMDb于1996年上線,初期的主要運行目的,就是利用普通用戶的力量,收集和整理過往和當前的電影電視信息,通過網(wǎng)頁之間的超鏈接將它們整合成一個網(wǎng)狀聯(lián)結的數(shù)字信息系統(tǒng)。用戶量越多,采集信息越豐富,網(wǎng)狀結構就越復雜,隨之對整個電影行業(yè)的歸納整理就越趨向科學合理。而與網(wǎng)狀結構同樣日趨復雜化的,是客觀信息中所裹挾的主觀評價:因為建立在網(wǎng)頁和網(wǎng)頁間的超鏈接關聯(lián)是由用戶的每一次點擊行為產(chǎn)生的,而即使是這簡單的“關聯(lián)行為”中也有偏見,有情感,有認同。開發(fā)者意識到,網(wǎng)絡用戶不僅有上網(wǎng)搜集客觀電影資訊的需要,還同時存有主觀意識上的情感認同的需求:共享和評價。IMDb后續(xù)發(fā)布的“推薦系統(tǒng)”(recommended system)或“250部最佳電影”(Top250)便是在客觀數(shù)據(jù)逐漸完善起來之后自然衍生的。
用戶評價行為本身就包含著主體與客體、主觀與客觀之間二元博弈的特質(zhì)[1]。電影評價的主體是人,面對身為客體的某部影片,可謂“仁者見仁,智者見智”,是主觀的;而電影評價的理想受眾卻通常是“盡可能多的人”——普世的眼睛,難免苛求其評價“客觀”,這里的“客觀”意味著公正、有序、有效、使人信服。如上所述IMDb網(wǎng)站的發(fā)展,推而廣之看整個電影評價體系的大費周章,如擁有88個條目的奧斯卡獎評獎細則,不難窺見電影評價行為本身的復雜性。越是嚴肅認真的電影評價,由于普適的要求,越是謹慎和兩難。從IMDb的發(fā)展過程可見,帶有主觀色彩的評價行為,是與同樣帶有主觀色彩的認同的需要相互對照的??陀^信息和主觀評價這相互促成的兩者,似乎難以分割[2]。以人為主體的評價行為不能免于主觀性的偏差,需要更高層級的理性梳理行為去不斷規(guī)避和調(diào)整,方可能使評價結果無限接近于公理。
1998年上線的Rotten Tomatoes(“爛番茄”)網(wǎng)站的創(chuàng)舉,是將專業(yè)電影評論中的正面/負面態(tài)度計量化,據(jù)此生成從0%到100%不等的“番茄新鮮度”來反映電影質(zhì)量;一位電影人(C)推薦一部電影(M),則該電影計2分,不推薦計1分,未評論計0分,“番茄新鮮度”Y=C★M。所有影評人打分相權衡則為該電影的最終評分[3]?!癛otten Tomatoes”網(wǎng)站的做法,很像是基于一次評價(專家影評)的二次評價(新鮮度評價)。作為影評人個人寫作的“一次評價”從數(shù)據(jù)庫宏觀所見是龐雜的、不可控的,然而數(shù)據(jù)庫從中提煉觀點,將觀點轉(zhuǎn)化為數(shù)據(jù),則相當于是將個人的評價行為進行新一次編碼:其標準統(tǒng)一,結果簡潔,輸入主觀,輸出客觀,且可快速量產(chǎn)。它保留了“一次評價”中自然人嬉笑怒罵之性情,符合用戶(讀者)情感認同的需求,又同時對“一次評價”中的曖昧多義進行了優(yōu)化重組,使之更接近電影評價的公尺,靠近數(shù)字時代自動化、可視化的需求。
IMDb網(wǎng)站雖然面向的是普通電影觀眾,卻也在不斷完善電影評分中的主客觀矛盾。如IMDb網(wǎng)站中關于“250部最佳電影”的算法(貝葉斯統(tǒng)計算法),其公式為:
其中,“最小投票數(shù)”是有資格進入“250部電影”評選的最低準入資格,如投票人數(shù)低于1250人則不能參選。加權得分設置為兩個數(shù)值相加的總和,這保證了在投票人數(shù)較少的情況下,第一個數(shù)值無限接近于0,則加權得分無限接近于目前所有電影的平均分,而在投票人數(shù)足夠多的情況下,第二個數(shù)值無限趨近于0,則觀眾所打出的該電影的平均分才更有可能影響甚至決定加權得分。同時,網(wǎng)站設置只有被評定為“經(jīng)常投票者”的用戶方有資格對“250部電影”進行評分。我們看到,IMDb用加權評分的方式篩去了可能“不客觀”的評價,保留了可能“客觀”的共識。作為“二次評價”,它通過對三個因變量(打分、打分人數(shù)以及每個打分主體的權重)的控制把握評分的客觀穩(wěn)定,預防表達態(tài)度的盲目、減輕盲目表達的后果,達到更好更及時地反映電影品質(zhì)的目的。
與Rotten Tomatoes和IMDb迥異,奧斯卡獎評獎是全然人為的評價行為,雖然不比前兩種評價行為的自動化和時效性,但也體現(xiàn)了十分相似的結果優(yōu)化方式。奧斯卡獎的評獎主體必須為獎項主辦單位AMPAS(美國電影藝術與科學學院)的會員,全球僅有六千多名會員,按專業(yè)門類被細分于十五個行業(yè)協(xié)會,每個專業(yè)獎項是由每個對應行會的會員選出的,只有“最佳影片”是全院共選。這與IMDb中關于用戶投票準入門檻的設置如出一轍。再者,奧斯卡評獎由遵循“優(yōu)先系統(tǒng)”(preferential system)的決策原則,即大多數(shù)獎項采用可轉(zhuǎn)移單票制的形式投票,每一個會員都可以選擇五個入圍者,以優(yōu)先順序形式排序。兩種票選的決策方式呈現(xiàn)出高度的程序理性,與IMDb和Rotten Tomatoes算法本質(zhì)上是有相似之處的。具體算法為:假設540人共投出12種排序方式,其中選C為第一順位的人數(shù)最多,為272位,則C入選。去掉C,剩下選票中以B為第一順位的人數(shù)最多,為202位,則B入選,以此類推,直到最高票數(shù)項總數(shù)小于136者淘汰(540/(3+1)+ 1=136)。
過程演繹如圖1[4]:
圖1
若該計票方法不能得出最優(yōu)結果,則再遵循排序復選制選出最優(yōu)結果如圖2[4]:
圖2
在奧斯卡獎的這份“算法”中,投票的“是”與“否”如同被編為程序中的“0”與“1”,而一切復雜的計票方式都是為了得出可能范圍內(nèi)的“最優(yōu)解”。它可以看作是一套人為設計出的科學算法在對主觀投票行為進行“二次評價”。
綜上兩點,本文認為,IMDb、Rotten Tomatoes以及奧斯卡獎評選之間,看似有“客觀機器”和“主觀人為”的差別,其背后訴求卻都是尋求評價電影的“最優(yōu)”方式,其所面臨的主觀評價與客觀評價的矛盾困境是相似的,解決問題的方向也是基本一致的:優(yōu)化統(tǒng)籌龐雜的個體的聲音,匯成清晰客觀的閱讀界面,并在意見的共性中凸顯每部電影的個性,這些都是優(yōu)秀的“二次評價”的共有功能 。
在“二次評價”對個體的評價意見進行優(yōu)化整合的基礎上,電影的優(yōu)劣位次不斷地被梳理和重認:如電影《肖申克的救贖》,在面向不同群體的不同榜單和評分中都位列前茅。又如電影《公民凱恩》,因為開創(chuàng)性的敘事展開和理念革新被各類電影教材奉為圭臬。宏觀上,各類“二次評價”所聚合而成的“電影評價生態(tài)”本身就是對電影學及電影產(chǎn)業(yè)極重要的議題。微觀上,某一部電影從制作到公映,再到若干年后的影響,其過程似社會文化從精英生產(chǎn)到大眾閱讀,無論是從時間的經(jīng)歷還是從空間的輻射,都值得被記錄和研究[5]。
瀏覽近十年來西方多個領域?qū)W者針對電影評價的回顧性研究,同樣會發(fā)現(xiàn)其中主觀內(nèi)容和客觀內(nèi)容交叉斡旋的事實。具體來說,涉及的是電影評價“定量”和“定性”兩個問題。“定量”問題是統(tǒng)計學問題,是這類研究所立足的主要方法和工具;而“定性”問題是真理與標準的問題,常與“電影觀”等電影學的主觀議題息息相關。與商業(yè)網(wǎng)站所運行的“二級評價”不同,這些學術研究承擔了更多高屋建瓴的責任,因此它們所關注的定性問題、定量問題也就更加宏觀和多元。研究一般先對電影作品提出一條或數(shù)條評價標準,或?qū)﹄娪霸u價的行為主體(大眾/專家/行業(yè)評獎/票房)提出問題或者見解,接著,根據(jù)研究對象選擇合適的數(shù)據(jù)庫。研究者會根據(jù)所采集數(shù)據(jù)建立數(shù)學模型進行統(tǒng)計學分析,形成可視的、直觀的數(shù)學結果,最后將結果與前提標準或問題相比對,檢驗問題,得出結論,或給出新的建議。
在電影評價的問題上,主觀標準較客觀標準顯現(xiàn)出更高的優(yōu)先級,因為大多數(shù)針對電影評價的研究都選擇從定性問題開宗明義。主觀標準體現(xiàn)是評價主體對一部好電影的要求和預期。不同主體的評價目的不同,對電影的觀察也會各有側重,但總要存有一個一以貫之的、內(nèi)部自洽的評價要旨。如奧斯卡獎的評價要旨是:“嘉獎該年度電影的杰出成就”,“杰出成就”(outstanding achievements)即是其評價的主觀標準[4]。研究表明,奧斯卡選票機制在那些設定符合“杰出”要旨的獎項評選中表現(xiàn)更好、更少受群眾呼聲等外部因素的影響,可證奧斯卡獎的評選機制契合其評選要旨,是精英導向而不是民粹導向的[5;6]。
又如,美國國家電影目錄是美國1989年通過《國家電影保護法》之后建立起來的國家電影評價體制,該體制旨在選出“對美國具有文化,歷史或美學上的重要影響的世界電影”。相比“杰出”“質(zhì)量優(yōu)異”這些相對基于當下觀感的評價標準,電影的“重要性”傾向于其歷史的、持久的影響力,側重的是電影的經(jīng)典程度。其評價過程是保密的[7]。以此為啟發(fā),美國西北大學2014年的一份聯(lián)合研究《Cross-evaluation of metrics to estimate the significance of creative works》針對電影的“持久影響力”這一評價要旨設計了相符的“間隔年”算法[3]。
間隔年算法試圖將歷史上每一部公映電影按公映時序排列并聯(lián)結成一張相互參照、不斷援引的電影關聯(lián)網(wǎng)絡[3]。算法規(guī)定,如果公映時間在先的影片在場景、人物、臺詞等部分借鑒、引用或模仿了公映時間在先的影片,則將它們的公映年份的間隔數(shù)t計入公映在前的影片的影響力評分。統(tǒng)計發(fā)現(xiàn),隨著電影公映年限增長,其引用次數(shù)一般會下降,那些經(jīng)歷數(shù)十年仍被不斷引用重提的電影便是經(jīng)典電影。其中,A算法可以成功預測間隔年在22年以上的NFR收錄電影,B算法則可以成功預測間隔年在18年以內(nèi)的收錄電影。結論為,首先“間隔年”算法能有效地預測和驗證美國國家電影收藏名錄所選電影;其次,經(jīng)過科學設計的算法,能夠比外圍專家的意見更精確地甄別出“重要電影”。在這項研究中,主觀標準是可以用客觀算法表達的,主觀標準經(jīng)過客觀算法的驗證更加合理和可信,兩者之間被證實為高度的正相關關系。
“間隔年”算法得益于研究者和一般大眾之于“重要性”的主觀理解,然而其記數(shù)方法是將“重要”這一帶有主觀色彩的評判標準量化為單部電影的影響因子,使每一部電影的表現(xiàn)清晰可觀。這項研究中不僅有對于電影評價標準的主觀定性,也有對于“如何篩選出重要電影”的客觀定量。如果說美國國家電影收藏目錄的電影評價機制是基于專家個體意見所統(tǒng)籌出的“二次評價”,那么發(fā)明“間隔年”算法的學術研究則是基于該評價機制的二次評價行為所進行的“三次評價”。它能把握該評價體的評價要旨,在數(shù)理上作出預測和解釋,能以信服的方式給出主觀評價標準的客觀依據(jù)。此種評價應該是更高級的。
Yong Liu于2006年所作《Word of Mouth for Movies: Its Dynamics and Impact on Box Office Revenue》通過測量電影在網(wǎng)絡上的口碑訊息所含的正/負訊息的百分比來確定口碑的正面/負面程度,跟蹤口碑活動對票房收益的影響[2],其研究發(fā)現(xiàn)口碑訊息對電影的票房表現(xiàn)(尤其是公映前幾周的票房表現(xiàn))具有解釋力; 該作者另一項研究《The different Effects of Online Words-Of-Mouth and Critic’s Reviews On Pre-release Movie Evaluation》[8]對電影愛好者和非電影愛好者進行比對研究,發(fā)現(xiàn)在映前非電影愛好者受負面口碑影響大于電影愛好者,而相比大眾口碑,電影愛好者更易受專家評論的影響。另一份研究《Film Awards as Indicators of Cinematic Creativity and Achievement》[9]則以電影“創(chuàng)造力”為指標,對比奧斯卡獎和其他六個國際電影獎的評選結果,通過取樣1132部英語電影,依據(jù)導/表/編/攝/曲五大國家行業(yè)協(xié)會對每部電影的評分(1-5分),以反觀各獎項頒發(fā)的可信度。根據(jù)Coefficient Alphas算法,奧斯卡獎在其中表現(xiàn)最優(yōu),與“創(chuàng)造力”評價符合度最高[9]:
客觀算法除了能對電影評價做出評價和預測,在某些情況下,還能夠證實研究者的合理猜測,如上述“奧斯卡與創(chuàng)造力”和“口碑與票房績效”兩份研究中,研究者所設計的問題帶有比較明顯指向性。而有些情況下,統(tǒng)計學所得結論數(shù)據(jù)則可能與一般大眾預期有所出入。如前文所例舉的“間隔年”算法研究,在將結果與各大評分系統(tǒng)進行擬合的時候,發(fā)現(xiàn)IMDb網(wǎng)站“總投票數(shù)”和“投票均分”兩項與“間隔年”算法的結果重合度很高,甚至超過了某些專家評分網(wǎng)站。該作者還詳細論證了用于“間隔年”算法中的“電影關聯(lián)網(wǎng)”模型,是如何借鑒了IMDb網(wǎng)站龐大的網(wǎng)頁關聯(lián)結構的,IMDb在這里為其建模提供了重要參考。這些研究可有力證明,一些電影愛好者對IMDb評分的詬病是缺乏正當依據(jù)的。
主觀定性與客觀定量所結合的統(tǒng)計學研究,有些情況下甚至可以自行演繹出新的評價系統(tǒng),設計并論證出新的評價要旨。聯(lián)合研究《The Wisdom of the Few》[10]對大眾評分體系置疑,于是借由“篩選算法”(Filtering Approach)創(chuàng)建了一個僅基于互聯(lián)網(wǎng)影評專家的評分推薦系統(tǒng),并詳細論證了它的優(yōu)劣得失。Peress.M 和Spiring.A 2010年針對電影評價體系的研究《Scaling the Critics: Uncovering the Latent Dimensions of Movie Criticism With an Item Response Approach》[11],用空間構建的方式,模擬了以“質(zhì)量”“主題”和“屬性”為評價標準的電影評價體系?!百|(zhì)量”“主題”和“屬性”被看做三個維度的三個潛在變量,放在同一數(shù)學平面中,再模擬它們之間的空間位置關系,得出某部電影的評價結果。通過空間標注,每一部影片都會在立體空間中找到自己的“位置”(location)。而眾多電影空間標注的集散數(shù)據(jù),將會在矢量圖上形成不同陣營,便于后來者比照自己的作品,提前鎖定受眾人群,預測其成功的可能性,預評其藝術價值。
本文看到,高質(zhì)量的“三層評價”都經(jīng)歷了主觀置疑、客觀建模演繹以及科學論證結果這三步過程??陀^方法和主觀問題互為論證,互有優(yōu)化,對于整個電影評價體系以及各層級的電影評價行為有預測、指導和創(chuàng)造的價值,有可能對于電影評價的規(guī)范化、體系化有所裨益。這三級評價是互賴為生,互惠互利的。
貫穿于這三層評價之中的,或許仍然是許許多多此消彼長的矛盾議題。短期的票房數(shù)據(jù)或許可以反映商業(yè)的成敗,然而長期的社會文化影響如何衡量?需要厘清“是何影響”,同時也需要試驗“如何衡量”。電影是以商業(yè)標準為好,還是以藝術標準為好?商業(yè)標準相對易用硬性指標衡量,藝術標準則需要更多的探討,更小心的檢驗,更直觀的論證。代表精英的專家評判與代表民眾的大眾評判相互指摘,如何溝通協(xié)調(diào)這兩者,電影屬于大眾還是精英?數(shù)據(jù)可以讓我們在短期內(nèi)看清一件事,然而僅憑這些數(shù)據(jù)卻不足以回答這些問題。評估電影的長期影響需要艱苦的追蹤素材的過程、將素材再量化的過程。而當處于第一層級的個人、第二層級的評價組織和第三層級的專家學者都嘗試在主觀與客觀的二元轉(zhuǎn)化中去思考這些問題的時候,將是從不同維度體察、理解和表述問題的社會力量。未來,主觀定性評價和客觀定量評價相結合的結果紅利或許會逐漸在西方電影行業(yè)中顯現(xiàn)出來。
[1] Seshadrinathan K, Soundararajan R, Bovik A C, et al. Study of subjective and objective quality assessment of video[J]. IEEE transactions on image processing, 2010, 19(6): 1427-1441.
[2] Liu Y. Word of mouth for movies: Its dynamics and impact on box office revenue[J]. Journal of marketing, 2006, 70(3): 74-89.
[3] Wasserman M, Zeng X H, Amaral L A. Cross-evaluation of metrics to estimate the significance of creative works[J]. Proc Natl Acad Sci U S A, 2015,112(5): 1281-6.
[4] Gehrlein W V, Kher H V. Decision Rules for the Academy Awards Versus Those for Elections[J]. Interfaces, 2004, 34(3): 226-234.
[5] Dodds K. Popular geopolitics and audience dispositions: James Bond and the internet movie database (IMDb)[J]. Transactions of the Institute of British Geographers, 2006, 31(2): 116-130.
[6] Holbrook M B. Popular Appeal versus Expert Judgments of Motion Pictures[J]. Journal of Consumer Research, 1999, 26(2): 144.
[7] Allen M P, Lincoln A E. Critical discourse and the cultural consecration of American films[J]. Social Forces, 2004, 82(3): 871-894.
[8] Chakravarty A, Liu Y, Mazumdar T. The Differential Effects of Online Word-of-Mouth and Critics’ Reviews on Pre-release Movie Evaluation[J].Journal of Interactive Marketing, 2010, 24(3): 185-197.
[9] Simonton D K. Film Awards as Indicators of Cinematic Creativity and Achievement: A Quantitative Comparison of the Oscars and Six Alternatives[J].Creativity Research Journal, 2004, 16(2-3): 163-172.
[10] Amatriain X, Lathia N, Pujol J M, et al. The wisdom of the few: a collaborative filtering approach based on expert opinions from the web[C].Proceedings of the 32nd international ACM SIGIR conference on Research and development in information retrieval, 2009: 532-539.
J902;J905
A
1008-9667(2017)03-0137-05
2017-04-13
胡心言(1992— ),女,江蘇南京人,南京藝術學院傳媒學院2016級博士研究生,紫金文創(chuàng)項目組成員,研究方向:戲劇與影視學。
① 本文為紫金文創(chuàng)研究院項目《影視作品影響力的評價體系研究》(項目編號:KTSYZ20160701)階段性成果;江蘇省“十三五”重點學科項目“戲劇與影視學”階段性成果。
(責任編輯:李小戈)