王芳?田龍過
【摘 要】隨著信息數(shù)據(jù)抓取、篩選、清洗及應用技術的日漸成熟,數(shù)據(jù)新聞在新聞業(yè)嶄露頭角。如今,數(shù)據(jù)新聞的數(shù)據(jù)真實性與人的意志矛盾初顯,亟待媒介進行認知與改善。因此,從受者與傳者角度分析數(shù)據(jù)新聞在人的意志左右下的偽客觀成為必要。
【關 鍵 詞】信源污染;經(jīng)驗主義;數(shù)據(jù)深度;數(shù)據(jù)初衷;受眾選擇
【作者單位】王芳,陜西科技大學設計與藝術學院;田龍過,陜西科技大學設計與藝術學院。
【中圖分類號】 G201 【文獻識別碼】A
數(shù)據(jù)新聞是基于數(shù)據(jù)的抓取、挖掘、統(tǒng)計、分析和可視化呈現(xiàn)的新聞報道方式,并以數(shù)據(jù)為核心所組織的新聞報道[1]。目前,眾多學者提出要重新反思和厘清新聞與大數(shù)據(jù)之間的關系,因為它們本質(zhì)上并不是精密的因果聯(lián)系,而是對“假設—證明”統(tǒng)計學技巧的粗淺運用。
數(shù)據(jù)的價值在于其客觀性、針對性、可統(tǒng)計性和可分析性,而新聞的價值在于社會共情、熱點分析、輿論引導,為人民的利益做出正能量示范。因此,數(shù)據(jù)新聞從理論上來講應是嚴格區(qū)分“觀點”與“事實”的存在,對信息的發(fā)布、傳遞與預測有絕對科學性的事實傳播。但新聞是“人”的新聞,傳者與受者“人”的屬性必會卷入其中,故在數(shù)據(jù)選取時,是否沾染數(shù)據(jù)的客觀、可統(tǒng)計等特性,或沾染多少“人的意志”則有待思考,以客觀數(shù)據(jù)出發(fā)尋求主觀解讀的數(shù)據(jù)新聞更需謹慎對待。
一、數(shù)據(jù)新聞生產(chǎn)反思
關于數(shù)據(jù)新聞的生產(chǎn),德國記者勞倫斯認為,數(shù)據(jù)新聞的生產(chǎn)過程就是數(shù)據(jù)經(jīng)過過濾和視覺化后形成故事[2]。英國伯明翰城市大學教授布拉德肖提出數(shù)據(jù)新聞生產(chǎn)的雙金字塔結(jié)構(gòu):倒金字塔自上而下是編輯、清理、情境與綜合;正金字塔自上而下是視覺化、敘事、社交化、人性化、個性化、應用化,二者通過“傳播”來實現(xiàn)連接[3]。結(jié)合2010年第一屆國際數(shù)據(jù)新聞圓桌會議的相關概念界定,文章將對數(shù)據(jù)新聞制作流程的數(shù)據(jù)抓取、數(shù)據(jù)清洗、數(shù)據(jù)解讀三個步驟進行分析。
1.數(shù)據(jù)抓取——信源不可控
(1)數(shù)據(jù)邏輯的“原罪”
首先,討論一個數(shù)據(jù)抓取的先后問題:數(shù)據(jù)抓取時,是先假設論題,再獲取相關數(shù)據(jù),還是先獲取相關數(shù)據(jù),再生成論點?
按照科學研究態(tài)度,對于未知的事件,我們會先提出假設,然后進行相關數(shù)據(jù)的分析、統(tǒng)計、檢驗;對已知現(xiàn)象要遵循客觀事實,對相關數(shù)據(jù)進行分類、組合、拆解。這是任何一種遵循“科學主義”研究的底線[4]。但數(shù)據(jù)新聞在搜集數(shù)據(jù)時,數(shù)據(jù)對于論點是否存在嚴密的邏輯性?比如,一所骨病醫(yī)院旁有一家川味飯店,該飯店物美價廉,很多病人及家屬前來就餐。病人和家屬常來川味飯店就餐的數(shù)據(jù)是事實,但不能說骨病患者愛吃川味料理,更不能說川味料理對骨病有促進療效,二者不具備因果關系。數(shù)據(jù)邏輯與行為邏輯、思維邏輯、事實邏輯不存在等式關系。數(shù)據(jù)能發(fā)現(xiàn)事件發(fā)展的必然,但事件并不都是固定結(jié)果,還有偶然因素。
(2)信源的客觀性反思
政府、媒體、高校、企業(yè)、數(shù)據(jù)研究機構(gòu)等均響應國家“互聯(lián)網(wǎng)+”計劃的號召,成為數(shù)據(jù)的信源。但無論是政府、媒體還是高校,其數(shù)據(jù)只能部分公開,因此數(shù)據(jù)的獲取具有局限性。同時,在信源調(diào)查中,信源自身、信源操作、信源壁壘和突發(fā)性信源的機動性導致了數(shù)據(jù)自身存在的事實局限。但這些信源往往直接參與新聞選題,在一定程度上會干擾新聞的客觀性。如《紐約時報》《華盛頓郵報》每天仍有四分之三的報道來源于政府,美國白宮每天都召開會議決定“今天想讓媒體報道什么,怎么報道”[5]。
就目前來看,數(shù)據(jù)的客觀性來源于信源的客觀性和全面性。若信源不客觀,數(shù)據(jù)呈現(xiàn)的則是不客觀現(xiàn)實;若信源片面,數(shù)據(jù)呈現(xiàn)的則是局部客觀,整體是不客觀、不真實的。
2.數(shù)據(jù)清洗——意志而為
數(shù)據(jù)清洗是指對數(shù)據(jù)進行分析、篩選和過濾,拋棄過去的因果,轉(zhuǎn)為分析相關關系,承認了數(shù)據(jù)的混雜性。菲利普·梅耶教授認為:“在信息量不足的時代,記者主要的精力在于尋找和獲取信息。”
數(shù)據(jù)新聞的清洗過程要先通過行業(yè)常規(guī)數(shù)據(jù)的自動化篩選,再經(jīng)過新聞人對數(shù)據(jù)的多次篩選、交叉驗證、細化分類。因此,數(shù)據(jù)新聞的客觀性和真實性是對編輯、把關人的能力考驗。數(shù)據(jù)的來源多樣對新聞權(quán)利人的能力產(chǎn)生了極大的考驗,但這也使權(quán)利人掌握比以前“小數(shù)據(jù)”或“無數(shù)據(jù)”時期更高的權(quán)利。換言之,這樣的數(shù)據(jù)清洗是在更高的個人意志下產(chǎn)生的清洗。同時,數(shù)據(jù)新聞編輯團隊需要調(diào)查記者、數(shù)據(jù)分析師、可視化設計者等的有機配合。雖然在某種程度上搜集的數(shù)據(jù)會更專業(yè),但越多人參與信源的調(diào)查會導致信源污染。
以某公司抓取網(wǎng)絡用戶的數(shù)據(jù)為例,假設其抓取的數(shù)據(jù)準確、全面,時效性強,具有分析意義,那么通過所謂精確的數(shù)據(jù)清洗,就能證明受眾的多方行為具有相關性的意義嗎?賴特·米爾斯在《社會學的想象力》一書中對抽象經(jīng)驗主義進行批判:這種經(jīng)驗研究醉心于統(tǒng)計方法和數(shù)據(jù)信息,過分強調(diào)方法和形式的精確,卻無力揭示真實的因果關系。因為數(shù)據(jù)的精確不等于問題的真實,因此,許多看似確鑿的數(shù)據(jù)關系不過是牽強附會罷了[6]。
3.數(shù)據(jù)解讀——尋找初衷
英國《衛(wèi)報》報道數(shù)據(jù)新聞開啟了新聞模式新篇章。數(shù)據(jù)新聞以數(shù)據(jù)為元素,形成圖解新聞、數(shù)據(jù)地圖、時間軸、交互性圖表等方式,在一定程度上跨越了時間和空間的維度。受眾可以自由觀賞新聞的價值,也可以從數(shù)據(jù)的表達解讀深意。如伊拉克戰(zhàn)爭中,《衛(wèi)報》刊登了一篇《伊拉克戰(zhàn)爭日志》的數(shù)據(jù)新聞,利用維基解密數(shù)據(jù)和谷歌地圖軟件,將每一名在伊拉克陣亡的士兵作為一個紅點,標注在地圖的相應陣亡地點上,點擊每一個紅點都會有陣亡士兵的陣亡時間、陣亡原因等顯示。遠看地圖,紅點覆蓋了整個伊拉克,人們在新聞的視覺沖擊下渴望社會和平。
數(shù)據(jù)新聞的初衷是信息的解釋能力,其最大的意義不是數(shù)據(jù)新聞的結(jié)果,而是數(shù)據(jù)新聞對人產(chǎn)生的影響和作用。西蒙·羅杰斯在《數(shù)據(jù)新聞大趨勢 釋放可視化報道的力量》中強調(diào):數(shù)據(jù)新聞不只是形形色色的圖表,而是盡可能用數(shù)據(jù)的方式講故事。如果新聞只是數(shù)據(jù)的羅列和拼湊,沒有主題、中心和意義,那么它就失去了數(shù)據(jù)新聞的初衷。目前,國內(nèi)數(shù)據(jù)新聞作品的質(zhì)量參差不齊,少有能做到用數(shù)據(jù)解釋和應用,并挖掘深刻原因和意義的作品,依靠數(shù)據(jù)講新聞故事的方式尚不成熟。
4.表象還是真相——數(shù)據(jù)新聞的局限
數(shù)據(jù)產(chǎn)生于自然環(huán)境和社會環(huán)境。自然環(huán)境中的數(shù)據(jù)存在于自然界,可以憑借技術手段直接獲取,是具有相對穩(wěn)定規(guī)律的客觀存在;社會環(huán)境的數(shù)據(jù)是人的社會活動的總和,是不具有規(guī)律性的主觀存在。因此,憑借技術獲得或主觀臆斷的數(shù)據(jù),如何定義所獲數(shù)據(jù)的層次、深度、真實性和客觀性,數(shù)據(jù)是表象還是真相,仍需定義。
在自然環(huán)境中,地震所產(chǎn)生的一系列數(shù)據(jù)可用技術捕捉和公式運算,在極短時間內(nèi)了解到震源、震級、范圍、損失等,但對于地震的精確預測還需突破局限,對數(shù)據(jù)進行更深度的挖掘以及實踐的檢驗。在社會環(huán)境中,通過用戶行為的捕捉可做到廣告的“精準”投放,但這些數(shù)據(jù)痕跡的背后,是“對人的主觀活動準確測量”的命題?!叭说闹饔^活動”是對用戶產(chǎn)生行為之時的數(shù)據(jù)捕捉,是用戶在特定的一點或一段時空下操作的行為習慣,它對用戶未來可能產(chǎn)生的行為存在滯后性。威廉·斯蒂芬森創(chuàng)造的Q方法,即“提出一種處理主觀性的定量方法以處理個體和大眾研究的定性方法”,但目前也只是“使單樣本或小樣本的因素研究成為可能”的程度[7]。因此,有時數(shù)據(jù)呈現(xiàn)的只是表層現(xiàn)象,并不能反映事物或人的客觀本質(zhì),更不能反映人的內(nèi)心及精神世界。這是數(shù)據(jù)新聞在生產(chǎn)過程中不可回避的現(xiàn)實漏洞。
二、受眾信息選擇被動性
現(xiàn)代新聞受眾在全媒體視域下主要分為五種類型:新媒體型、移動新媒體型、非移動新媒體型、傳統(tǒng)媒體型、過渡媒體型[8]。除了傳統(tǒng)媒體型受眾,其余四種受眾都會在知情或不知情的情況下,或多或少被網(wǎng)絡互動數(shù)據(jù)捕捉,并被其加以利用,如好友推薦、廣告推送乃至信息泄露下的短信和電話詐騙。雖然傳統(tǒng)媒體型受眾沒有主動與數(shù)據(jù)互動,但也會深受其影響。
威廉·斯蒂芬森在《大眾傳播的游戲理論》中說道:“在社會研究史中,人們通常將大眾媒介視作一種說服機構(gòu)而非娛樂機構(gòu),這是一個非常有趣的事情?!盵9]至今,受眾態(tài)度仍未改變。傳統(tǒng)媒體時代,電視、報紙、廣播作為權(quán)威內(nèi)容的輸出渠道,數(shù)據(jù)引用的客觀性不可知;新媒體環(huán)境下,自媒體的內(nèi)容傳達也并未在數(shù)據(jù)客觀性上做出改善,某些自媒體甚至濫用數(shù)據(jù)以博人關注。
伊萊休·卡茨在《個人對大眾傳播的使用》中首次提出“使用與滿足”理論,他將受眾與媒介的接觸行為總結(jié)成一個因果連鎖,受眾從社會因素或心理因素出發(fā),在媒介期待與媒介接觸后完成需求滿足。在卡茨的模型中我們可以看出,受眾以需求滿足作為媒介接觸的結(jié)果?,F(xiàn)代新聞受眾對于需求滿足的理解不再停留于生理需求滿足(如兇殺、色情、災難、愛情等新聞信息),而是追求更高層次的精神需求滿足,關注新聞的真實性和事件背后的深意。因此,受眾在使用數(shù)據(jù)新聞為自己服務時,需要進行更多的思考,不能因自身可能存在的隱性參與(數(shù)據(jù)與自身相關或涉及自身領域)或單純按照“統(tǒng)覺”選擇而放棄對數(shù)據(jù)新聞的思考。
三、數(shù)據(jù)新聞的新假設
1.數(shù)據(jù)的人性假設
數(shù)據(jù)是人們把握世界、認識世界的一種方式或途徑,但數(shù)據(jù)不能代表世界,也不能真實、全面地反映世界。數(shù)據(jù)是一種持續(xù)固定的狀態(tài),而人文是時刻變動的多邊發(fā)展網(wǎng)絡。數(shù)據(jù)贏得的是一種表達力,體現(xiàn)準確性、客觀性和真實性;而新聞是一種情懷和人文輸出,無論數(shù)據(jù)新聞技術如何超前,它的主語仍然是“新聞”。
數(shù)據(jù)新聞的制作過程不可避免地夾雜人的意志,因此,我們需要認真思考人性對數(shù)據(jù)新聞如何起到積極作用,而不是回避或者詭辯。當程序員和新聞記者的思維與目的統(tǒng)一時,將數(shù)據(jù)新聞存在的主觀性轉(zhuǎn)化為人文性,便是數(shù)據(jù)新聞的意義。比如,美國調(diào)查報告新聞網(wǎng)RevealNews推出《尋人啟事》作品,利用聯(lián)邦政府數(shù)據(jù),記錄1900年以來美國記錄在冊的失蹤人口和尚未確認身份的死者,提供了性別、種族、州、區(qū)域、時間、年齡等多樣分類搜索項。同時,每一個案例提供的信息也盡可能細致到失蹤地、衣著、物理特征、DNA、指紋信息等,創(chuàng)造“找到”的最大可能性。不可否認,這都是人的意志與數(shù)據(jù)新聞的正能量產(chǎn)物,數(shù)據(jù)新聞在積極引導下可服務于議程設置??陀^數(shù)據(jù)只有配合人的積極意志,才能真正預測事情的發(fā)展??陀^數(shù)據(jù)介入人文關懷是數(shù)據(jù)新聞的初衷,也是國內(nèi)數(shù)據(jù)新聞應不斷追尋的方向[10]。
2.數(shù)據(jù)新聞的深度假設
數(shù)據(jù)的本意是事實或觀察的結(jié)果,用于客觀事物未經(jīng)加工的原始表達。數(shù)據(jù)新聞就是要用更多的數(shù)據(jù),通過賦予數(shù)據(jù)層次、邏輯、環(huán)境等手段增強其說服力。由于數(shù)據(jù)新聞的數(shù)據(jù)清洗過程繁瑣,分工復雜,因而數(shù)據(jù)新聞更適合對話題性事件做深度對比和分析。數(shù)據(jù)新聞持續(xù)時間長,更符合深度調(diào)查、持續(xù)調(diào)查的特質(zhì)。結(jié)合當下受眾的閱讀習慣,新媒體“網(wǎng)閱讀”“短閱讀”“碎閱讀”以及“電子與紙質(zhì)閱讀結(jié)合的雜閱讀”是主要現(xiàn)狀,數(shù)據(jù)新聞的深度調(diào)查借助可視化特點,將復雜的數(shù)據(jù)簡明扼要地呈現(xiàn)出來,以便更好地迎合市場。
3.數(shù)據(jù)與新聞互為補充
《<華爾街日報>是如何講故事的》一書提出:“我們的注意力總是放在了讀者對信息的需求上。于是我們忽視了一個所有讀者最普遍的需求,一個所有要求中最基本的要求:給我講一個故事!”新聞是主觀視角,是事件發(fā)展方向的預測,也是輿論民情的導向。數(shù)據(jù)是新聞的協(xié)作,數(shù)據(jù)的目的是配合新聞講好一個故事。作為新聞的論據(jù),數(shù)據(jù)必須是有血有肉、有理有據(jù)的;作為數(shù)據(jù)的架構(gòu),新聞必須是理智和情感的統(tǒng)一。數(shù)據(jù)與新聞應互為補充。
4.數(shù)據(jù)寓于人類活動
數(shù)據(jù)必須和人類活動的具體情境相結(jié)合,才能真實反映事件發(fā)展的前因后果。新聞是將人類生活的細小部分放大化、規(guī)律化和形式化,是符合社會主義核心價值觀的解讀。新聞點來源于生活,并依托于生活,也應落足于人類活動,存在于對社會生活的客觀分析,以及對事件產(chǎn)生的原因和預測。人類任何時候都不可能窮盡信息,因此,將數(shù)據(jù)寓于特定的、具體的環(huán)境中才具有可操作性。
四、結(jié)語
從理論上講,數(shù)據(jù)新聞應是一門科學研究,嚴格區(qū)分“觀點”與“事實”的界限,才能對于事件的解答、分析、預測做到絕對的公平。但任何技術都是人類的技術,“客觀性”這個術語也可理解為“由他人觀察所得”。不能把數(shù)據(jù)新聞捧為至上之物,而應客觀認識數(shù)據(jù)新聞的缺失與不足。因此,即使難免有人為的信源污染,數(shù)據(jù)新聞依舊可以在人的意志下成為幫助新聞和人類發(fā)展的有力武器,但前提是數(shù)據(jù)新聞制作者素質(zhì)的提高和不忘初心的發(fā)展規(guī)劃。
|參考文獻|
[1]李慧芳. 電視數(shù)據(jù)新聞的可視化表達——以央視財經(jīng)2016雙十一特別報道為例[J]. 新聞世界,2017(1):69-72.
[2]Lorenz Mirko. Data driven journalism:What is there to learn?[J]. Presented at IJ-7 Innovation Journalism Conference, 2010(6).
[3]Paul Bradshaw. The Inverted Pyramid of Data Journalism[EB/OL]. https//onlinejournalismblog. com/2011/07/07/the-inverted-pyramid-of-data-journalism.
[4]潘綏銘. 生活是如何被篡改為數(shù)據(jù)的?——大數(shù)據(jù)套用到研究人類的“原罪”[J]. 新視野,2016(3):32-35.
[5]丁明秀. 數(shù)據(jù)新聞:對傳統(tǒng)新聞價值判斷邏輯的解構(gòu)[J]. 青年記者,2017(2):11-12.
[6][美]賴特·米爾斯. 社會學的想象力[M]. 陳強,張永強,譯. 北京:生活·讀書·新知三聯(lián)書店,2005.
[7]宗益祥. 游戲人、Q方法與傳播學——威廉·斯蒂芬森的傳播游戲理論研究[M]. 北京:中國政法大學出版社,2017.
[8]葛麗莎,張國良. 全媒體環(huán)境下新聞受眾類型研究[J]. 河南社會科學,2016(5):83-94.
[9]William Stephenson. The Play Theory of Mass Communication[M]. New Brunswick: Transaction Books,1988.
[10]郭立,陸地. 數(shù)據(jù)新聞對新聞“客觀性”的重構(gòu)[J]. 中國記者,2017(1):64-65.