莫莉
摘 要 大數(shù)據(jù)時(shí)代的到來使數(shù)據(jù)新聞這一報(bào)道形式應(yīng)運(yùn)而生,技術(shù)的發(fā)展與變革決定了內(nèi)容的生產(chǎn)、傳播呈現(xiàn)出新的特點(diǎn)。本文從技術(shù)發(fā)展視角分析數(shù)據(jù)新聞這一新型新聞報(bào)道形式,并關(guān)注技術(shù)是如何影響人的感知與理解。數(shù)據(jù)新聞以大數(shù)據(jù)技術(shù)為基礎(chǔ),技術(shù)的變革重組了編輯部的生產(chǎn)流程,重塑了政府、媒介、公眾三方權(quán)利,技術(shù)的偏向性凸顯了數(shù)據(jù)新聞的短板,忽略了作為受眾的“人”應(yīng)有的情感內(nèi)核。當(dāng)前形式下,我們必須警惕信息煙塵。
關(guān)鍵詞 大數(shù)據(jù);數(shù)據(jù)新聞;新聞生產(chǎn);技術(shù)視角
中圖分類號(hào) G2
文獻(xiàn)標(biāo)識(shí)碼 A
文章編號(hào)1674-6708(2016) 154-0013-02
大數(shù)據(jù)(mega data),指需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)和多樣化的信息資產(chǎn)。目前業(yè)界普遍認(rèn)同大數(shù)據(jù)具有以下4個(gè)特點(diǎn):數(shù)量巨大( Volume)、速度極快(Velocity)、形式多樣(Variety)、具有價(jià)值(Value)。大數(shù)據(jù)價(jià)值的獲取和實(shí)現(xiàn)與大數(shù)據(jù)處理技術(shù)密不可分,其中關(guān)鍵技術(shù)一般包括:采集篩選、存儲(chǔ)管理、分析挖掘、感知展現(xiàn),這些技術(shù)又基于云計(jì)算技術(shù)和云存儲(chǔ)系統(tǒng)。
數(shù)據(jù)新聞的產(chǎn)生基于大數(shù)據(jù)。大數(shù)據(jù)時(shí)代的興起,使承載著大量信息并可進(jìn)行挖掘的數(shù)據(jù)成為核心競(jìng)爭(zhēng)力,由此給新聞界帶來了新觀念、新改革。數(shù)據(jù)新聞是一種基于數(shù)據(jù)的抓取、挖掘、統(tǒng)計(jì)、分析和可視化敘事化呈現(xiàn)的新型新聞報(bào)道方式。數(shù)據(jù)新聞是隨著數(shù)據(jù)時(shí)代帶來出現(xiàn)的一種新型報(bào)道形態(tài),是數(shù)據(jù)技術(shù)對(duì)新聞業(yè)全面滲透的結(jié)果,它的出現(xiàn)一定程度上改變了傳統(tǒng)新聞生產(chǎn)流程。對(duì)數(shù)據(jù)新聞而言,大量真實(shí)可靠的數(shù)據(jù)是根本,大數(shù)據(jù)分析技術(shù)是關(guān)鍵,挖掘因果聯(lián)系的本質(zhì)是核心,數(shù)據(jù)的可視化表達(dá)是形式。
北美媒介環(huán)境學(xué)派認(rèn)為,技術(shù)/信息載體決定媒介內(nèi)容的生產(chǎn)方式、特點(diǎn)和呈現(xiàn)形態(tài),媒介內(nèi)容的生產(chǎn)、傳播往往帶有技術(shù)的烙印。在政府和行業(yè)數(shù)據(jù)外,互聯(lián)網(wǎng)用戶數(shù)據(jù)、社交媒體UGC、視頻網(wǎng)站的點(diǎn)擊率、移動(dòng)終端的位置信息等都成為海量數(shù)據(jù)庫(kù)中的一個(gè)部分。傳統(tǒng)新聞生產(chǎn)方式講求內(nèi)容嚴(yán)謹(jǐn),注重深度,但隨著低成本數(shù)據(jù)信息的大量涌現(xiàn)、基于云技術(shù)和云存儲(chǔ)的大數(shù)據(jù)運(yùn)算技術(shù)的不斷發(fā)展、受眾對(duì)信息接收的求新求快,傳統(tǒng)新聞生產(chǎn)方式必須要做出一定的變革才能適應(yīng)技術(shù)發(fā)展帶來的變化。數(shù)據(jù)新聞側(cè)重于數(shù)據(jù)本身,新聞線索來源于數(shù)據(jù)之間微妙的聯(lián)系和變化,由于數(shù)據(jù)具有精確性、客觀性,故能在新聞報(bào)道中避免人為、偏見、歧視等主觀因素影響。數(shù)據(jù)隨客觀事實(shí)的發(fā)展而變化,無論是時(shí)間維度還是空間維度,數(shù)據(jù)新聞報(bào)道根據(jù)這一特征,在橫向和縱向上挖掘前因、預(yù)測(cè)后果、挖掘關(guān)聯(lián)、找尋本質(zhì),以不斷變化的可視化方式向受眾表達(dá)傳遞信息,同時(shí)也要求數(shù)據(jù)內(nèi)容呈現(xiàn)向動(dòng)態(tài)、實(shí)時(shí)更新效果轉(zhuǎn)變。
1 大數(shù)據(jù)技術(shù)促使新聞編輯部門的重組
大數(shù)據(jù)技術(shù)給新聞生產(chǎn)流程帶來最大的變化是新聞編輯部門的重組。相比傳統(tǒng)的新聞生產(chǎn)流程,數(shù)據(jù)新聞的生產(chǎn)要求編輯和記者擁有挖掘數(shù)據(jù)、發(fā)現(xiàn)線索和簡(jiǎn)單處理數(shù)據(jù)的能力,在新聞工作流程中融入代碼編寫、程序開發(fā)等工作,促進(jìn)技術(shù)部門和新聞部門之間的溝通和合作。《華盛頓郵報(bào)》和《芝加哥論壇報(bào)》都有著一支這樣的“嵌入進(jìn)編輯部的開發(fā)者”( EmbeddedDevelopers)團(tuán)隊(duì)。程序開發(fā)員根據(jù)新聞報(bào)道過程中實(shí)時(shí)變化的需求,為記者挖掘報(bào)道所需的原始數(shù)據(jù),編寫針對(duì)政府網(wǎng)站進(jìn)行數(shù)據(jù)抓取的工具,解析和轉(zhuǎn)換大量PDF格式文檔,將非數(shù)據(jù)類型的信息轉(zhuǎn)化成可供分析的形式以及為記者最終的新聞報(bào)道提供不同的可視化方案。簡(jiǎn)而言之,新聞?dòng)浾呓o程序員提高數(shù)據(jù)處理技術(shù)帶來了明確要求,數(shù)據(jù)處理和呈現(xiàn)技術(shù)得到簡(jiǎn)化與提升。同時(shí),程序員為新聞?dòng)浾邘慝@取新聞線索的靈感,為新聞?dòng)浾叩膱?bào)道拓寬了時(shí)間和空間的維度。
2 大數(shù)據(jù)技術(shù)使公眾有可能成為新聞內(nèi)容生產(chǎn)制作過程的一個(gè)部分
大數(shù)據(jù)技術(shù)為用戶生成內(nèi)容、實(shí)現(xiàn)自我需求提供了可能,用戶變成了新聞內(nèi)容生產(chǎn)制作過程的一個(gè)部分?!伴_源”是大數(shù)據(jù)時(shí)代興起的一種技術(shù)理念。作為一種開放式的合作機(jī)制,開源提倡在產(chǎn)品開發(fā)設(shè)計(jì)時(shí)擯棄版權(quán)壁壘,以及允許任何人在后期對(duì)產(chǎn)品的設(shè)計(jì)進(jìn)行修改。當(dāng)前運(yùn)用于分析大數(shù)據(jù)的工具如Hadoop HDFS、NoSQL這類技術(shù),都是基于開源大數(shù)據(jù)生態(tài)圈,意即計(jì)算機(jī)程序代碼公開向受眾開放,受眾可以在一定程度內(nèi)進(jìn)行自我后續(xù)開發(fā)?!耙员姲J将@取有價(jià)值的信息”是大數(shù)據(jù)時(shí)代下新聞選題來源之一,“眾包”簡(jiǎn)單而言是利用公眾來發(fā)現(xiàn)線索、提供數(shù)據(jù)、補(bǔ)充缺漏、核實(shí)數(shù)據(jù),將一個(gè)簡(jiǎn)單新聞任務(wù)分包給多個(gè)人組成的社會(huì)網(wǎng)絡(luò)。盡管這一新聞線索來源的客觀性仍存在爭(zhēng)議,但不可否認(rèn)這類做法提高了用戶參與的積極性和關(guān)注度,打破了傳統(tǒng)新聞生產(chǎn)流程中編輯部一統(tǒng)全部的格局。例如《衛(wèi)報(bào)》向讀者開放“議員的開支賬目”這一新聞選題,將來自議員的四十五萬多條經(jīng)過掃面的電話、機(jī)票等各類公開賬單公開給公眾,邀請(qǐng)公眾參與認(rèn)領(lǐng)線索,幫助查找賬單的可疑之處,這種眾包模式讓衛(wèi)報(bào)獲取了許多有價(jià)值的線索,其后采用了可視化呈現(xiàn)方式,讓公眾能一目了然各項(xiàng)開支數(shù)據(jù)。其他簡(jiǎn)單例子如我國(guó)國(guó)內(nèi)的“養(yǎng)老金并軌對(duì)你帶來了什么影響”、“兩會(huì)將如何影響我們的生活”等選題都將平臺(tái)對(duì)公眾開放,公眾可通過平臺(tái)發(fā)表意見和建議,添加和分享故事。
3 大數(shù)據(jù)技術(shù)對(duì)政府、媒體、公眾三方權(quán)利的沖擊與重塑
大數(shù)據(jù)時(shí)代下,技術(shù)的革新對(duì)政府、媒體、公民的社會(huì)權(quán)利進(jìn)行了新的分割與重塑,一方面在一定程度上限制了政府權(quán)力的濫用,另一方面也擴(kuò)大了公共權(quán)力,提高媒體與公眾聯(lián)動(dòng)所產(chǎn)生的輿論影響力。
必須明確的是,大數(shù)據(jù)技術(shù)對(duì)政府權(quán)力只是“相對(duì)性弱化”,而不是削弱。在數(shù)據(jù)的來源和構(gòu)成中,以政府、行業(yè)公開數(shù)據(jù)最多,雖然媒體有自我采集數(shù)據(jù)、公眾能形成和檢查數(shù)據(jù),但相對(duì)于海量的政府開放信息而言只是極小一部分。用戶從免費(fèi)開放平臺(tái)中獲得的數(shù)據(jù)也必須是符合法律規(guī)定的、從某種意義而言經(jīng)過政府權(quán)力審批的數(shù)據(jù),用戶可以對(duì)獲取到的數(shù)據(jù)進(jìn)行自我挖掘和分析。但是面對(duì)公眾監(jiān)督,政府部門必須促進(jìn)政務(wù)信息和數(shù)據(jù)的公開,并提高官方解釋數(shù)據(jù)資料的能力,及時(shí)進(jìn)行溝通和反饋,使政府部門的運(yùn)行更為高效、民主。正如哈貝馬斯在其公共領(lǐng)域理論中所指出的,作為公共領(lǐng)域的媒體的發(fā)展能促進(jìn)私人領(lǐng)域和政治領(lǐng)域的對(duì)話與協(xié)商,從而推動(dòng)民主政治的良性運(yùn)轉(zhuǎn)。
例如柴靜近期推出的公益調(diào)查片“穹頂之下”,片中以大量的數(shù)據(jù)分析為基礎(chǔ),對(duì)霧霾的形成、產(chǎn)生、原因、危害都進(jìn)行了具體、直觀的闡述,同時(shí)將直觀的霧霾議題延伸到政府部門的職能分割、國(guó)家法律的缺失、治理的不作為等等政治議題上,此片一出立馬引起了公眾的討論和思考。從這個(gè)案例我們可以看到,如果沒有大量、精確的數(shù)據(jù)說話,沒有數(shù)據(jù)的關(guān)聯(lián)與挖掘,人們還不能認(rèn)識(shí)到環(huán)保(霧霾)議題的緊迫性和重要性。大數(shù)據(jù)技術(shù)提高了民主的去精英化和普及化,提高了媒介在公共領(lǐng)域形成重要民主議題的能力,擴(kuò)大了公眾的聲音。
4 數(shù)據(jù)新聞存在技術(shù)偏向,易缺失新聞報(bào)道的人文主義情懷
在新聞報(bào)道中,有些事實(shí)可以使用數(shù)據(jù)新聞形式進(jìn)行報(bào)道,但有些事實(shí)的本質(zhì)和內(nèi)涵是無法用數(shù)據(jù)新聞完全展示的。在數(shù)據(jù)新聞實(shí)踐中,數(shù)據(jù)新聞應(yīng)用模板的套用的數(shù)據(jù)寫作機(jī)器人的誕生的確提高了新聞生產(chǎn)效率,例如在2014年3月美國(guó)加利福尼亞州發(fā)生的一起4.4級(jí)地震中,第一個(gè)報(bào)道此條新聞的是一個(gè)名叫Quakebot的機(jī)器人,它將地質(zhì)勘探局發(fā)出的數(shù)據(jù)輸入內(nèi)置的新聞模板,僅3分鐘就報(bào)道了這個(gè)消息。顯然,數(shù)據(jù)新聞存在技術(shù)偏向。但是,過于理性的數(shù)據(jù)呈現(xiàn)和分析將受眾當(dāng)成了機(jī)器,將新聞生產(chǎn)變成了工廠流水線,降低新聞?dòng)浾哌M(jìn)行精神生產(chǎn)的積極性,忽略了新聞報(bào)道的精神內(nèi)核,空洞了受眾的情感世界,缺乏應(yīng)有的人文情懷和道德精神。人之所以為人,是因?yàn)槿司哂衅渌锓N沒有的精神世界,新聞之所以區(qū)別于信息,是因?yàn)樾侣劸哂幸欢ǖ木窳α?。以?shù)據(jù)為中心而忽略精神內(nèi)核,易讓技術(shù)失去平衡與和諧。
5 警惕信息煙塵,避免過分依賴數(shù)據(jù)
《大數(shù)據(jù)時(shí)代》一書的作者維克托,邁爾,舍恩伯格說:“在小數(shù)據(jù)時(shí)代,因數(shù)據(jù)是如此稀少,可以確保自己收集的每一個(gè)數(shù)據(jù)點(diǎn)都是非常準(zhǔn)確的。
相比較而言,大數(shù)據(jù)往往是凌亂和質(zhì)量參差不齊的。但相比以高額代價(jià)來保證測(cè)量和收集少量的精確性,在大數(shù)據(jù)時(shí)代,我們將接受這種雜亂,因?yàn)槲覀兺ǔP枰闹皇且粋€(gè)大方向,而不是努力了解一種現(xiàn)象的細(xì)枝末節(jié)。我們并不是要完全放棄精確度,為的是獲取在宏觀層面上的洞察力?!?/p>
在浩如煙海的數(shù)據(jù)世界里,首先龐大的數(shù)據(jù)量必然難以去偽存真、去粗取精,非真實(shí)、可靠的數(shù)據(jù)不能如實(shí)反映事物和規(guī)律的本質(zhì),擾亂受眾視線,也就意味著這類數(shù)據(jù)是缺乏利用價(jià)值的。其次數(shù)據(jù)來源的可靠程度有待商榷。提供數(shù)據(jù)的主體,在提供時(shí)的目的、動(dòng)機(jī)和嚴(yán)謹(jǐn)程度是無法統(tǒng)一衡量的,特別是大數(shù)據(jù)的來源主體,更多是零散的自由個(gè)體,有時(shí)候出于無意識(shí)的狀態(tài)可能會(huì)提供的不實(shí)數(shù)據(jù),這是連主體本身都是無法意識(shí)到的。而惡意作假的虛假不實(shí)信息的可信度基本為零,這些信息有時(shí)候甚至?xí)斐晒姷目只?。而機(jī)構(gòu)團(tuán)體在提供數(shù)據(jù)時(shí),會(huì)處于利益考慮有選擇性的公開部分?jǐn)?shù)據(jù),這使得在數(shù)據(jù)分析結(jié)果中產(chǎn)生一定偏向。如果缺乏進(jìn)行正確判斷的是非標(biāo)準(zhǔn)和價(jià)值標(biāo)準(zhǔn),則可能會(huì)以是為非、以非為是和選擇隱含價(jià)值偏頗的信息進(jìn)行傳播,從而誤導(dǎo)受眾。
最后,由于數(shù)據(jù)新聞的核心在于對(duì)大數(shù)據(jù)因果聯(lián)系的挖掘,所以數(shù)據(jù)之間的關(guān)系是如何被發(fā)現(xiàn)的,至今沒有統(tǒng)一標(biāo)準(zhǔn),有些無關(guān)聯(lián)的數(shù)據(jù)甚至被強(qiáng)硬的牽扯在一起,例如便利店巧克力銷售數(shù)量和犯罪率的聯(lián)系。納西姆。尼古拉斯。塔勒布提出“干草垛”的概念,即在龐大的“干草垛”中尋找那根被埋藏的針是很不容易的。在急速增長(zhǎng)的大數(shù)據(jù)煙海中,噪音的比重會(huì)越來越大,過濫的信息反而阻礙了人們進(jìn)行正確的判斷,人們搜索精確信息的時(shí)間和精力最終反而增加了。所以,警惕以上信息煙塵,也是大數(shù)據(jù)技術(shù)實(shí)現(xiàn)自身平衡、共生、和諧發(fā)展的必要思考。
不想說一個(gè)人若拒絕大數(shù)據(jù)就失去生命這樣沉重的話題,但大數(shù)據(jù)確實(shí)在深刻改變著你和我的未來。