■陳知春 饒立文
淺談數(shù)據(jù)新聞的報道策劃與實施
■陳知春 饒立文
數(shù)據(jù)新聞是在大數(shù)據(jù)時代興起的一種跨學(xué)科、跨領(lǐng)域的新聞生產(chǎn)方式,它需要新的思維方式與多種能力的支撐。區(qū)別于一般的新聞報道,數(shù)據(jù)新聞以數(shù)據(jù)為中心,帶領(lǐng)讀者將目光延伸,投射到新聞背后的數(shù)據(jù)上,通過對數(shù)據(jù)梳理分析,發(fā)現(xiàn)其中的新信息、新內(nèi)容,再配以可視化圖表、動圖、動新聞、H5頁面等新的產(chǎn)品形態(tài),讓數(shù)據(jù)變得生動,講出新聞背后的故事。
圍繞數(shù)據(jù)新聞的報道策劃,在操作上往往通過從新聞熱點出發(fā),從主動設(shè)置議題出發(fā)和從海量數(shù)據(jù)出發(fā)幾個方面進行組織實施,在數(shù)據(jù)處理上既需要樣本豐富、維度多元等多重因素具備,又需要對海量信息有全面梳理和深度加工的能力。新華社新媒體中心自創(chuàng)立以來一直對數(shù)據(jù)新聞進行不斷的探索,在這里結(jié)合一些相關(guān)報道案例,供大家批評探討。
2013年在新華社新媒體專線創(chuàng)立之初,恰逢全國兩會召開,兩會的重中之重便是政府工作報告。編輯部與清華大學(xué)自然語言處理實驗室合作,以詞頻分析為手段,對當年1.5萬字政府工作報告中出現(xiàn)的詞語進行分詞、篩選、統(tǒng)計后,按出現(xiàn)頻次高低排列展示, 《“發(fā)展”十年居榜首——“詞云”解讀政府工作報告》等稿件,在當時引領(lǐng)了數(shù)據(jù)新聞的浪潮。
在此后的報道中,編輯部立足追蹤新聞熱點,關(guān)注網(wǎng)民關(guān)注度高的新聞事件,以數(shù)據(jù)為依托,挖掘出了更多有意思的新聞。
2013年底,12306網(wǎng)站改版上線,12306手機客戶端也正式開放下載。時值春運,通過網(wǎng)絡(luò)和手機購票給大家?guī)矸奖愕耐瑫r, “搶票難”也遭到了廣大網(wǎng)民的吐槽。一時間 “黃牛用插件 ‘秒刷’千余張票” “車票賣給了名為櫻桃小丸子和東方不敗的用戶”等新聞引起了全國網(wǎng)民的極大關(guān)注,12306無疑成了這一年春運的大熱點。
在12306買票到底有多難?買一張春運回家的火車票要花多少時間?在12306買到回家過年的火車票概率有多大?全國網(wǎng)民的問題該如何解答?2014年初,編輯部在策劃這組報道時首先想到了要采訪中國鐵路總公司和12306網(wǎng)站的負責人,但是官方的表態(tài)似乎并不能完全解開網(wǎng)民心中的疑問,讓12306的后臺數(shù)據(jù)說話,成為編輯部的共識。
通過對12306網(wǎng)站后臺數(shù)據(jù)的梳理,新媒體專線推出的 《火車票去哪了?——帶你走進 “12306”網(wǎng)站火車票購票后臺》 《網(wǎng)民N問 “12306”》 《150多個 “碼農(nóng)”怎樣保證2.58億人次的購票需求》等一組揭秘12306后臺數(shù)據(jù)的稿件。通過報道,讓讀者了解到 “2014年平均每張車票需訪問 ‘12306’近千次才訂上, ‘秒殺’到的火車票有43%無人支付流回票池”等新聞背后有意義的數(shù)據(jù),這組稿件成為了當年春運有趣又實用的一組報道,通過客觀詳實的數(shù)據(jù),讓網(wǎng)民對12306多了些理解少了些吐槽。
作為新華社以生產(chǎn)新媒體內(nèi)容為主要工作職責的部門,新媒體中心的報道策劃更多時候需要圍繞設(shè)定主題,宣傳報道好國家大政方針、反腐倡廉、服務(wù)民生等重點工作,加強輿論引導(dǎo)。
這種方式的難點在于,首先要根據(jù)設(shè)定主題在海量數(shù)據(jù)種類中發(fā)掘出能夠反映議題核心的數(shù)據(jù)領(lǐng)域,之后還要對所有能夠獲得的數(shù)據(jù)進行篩選和分析。
在以 “2015年中國經(jīng)濟發(fā)展成就”為主題的年終報道策劃中,用什么樣的數(shù)據(jù)來反映中國經(jīng)濟的發(fā)展,一度成為編輯部策劃的難點。記者在隨后的調(diào)研中開創(chuàng)性地發(fā)現(xiàn),借助大數(shù)據(jù)和物聯(lián)網(wǎng)技術(shù),我國重點企業(yè)三一重工,以科技創(chuàng)新推動轉(zhuǎn)型升級,他們的挖掘機 “挖”的不僅是土,還有最值錢的數(shù)據(jù)。
“跳動的字節(jié)記錄著挖掘機運行的好壞,也從一個特殊的維度揭示著中國經(jīng)濟運行的 ‘涼熱’?!痹?《“挖掘機指數(shù)”告訴你不一樣的中國經(jīng)濟》一稿中,記者通過對數(shù)據(jù)的比較和對照建立起了 “挖掘機指數(shù)”和中國經(jīng)濟的對應(yīng)關(guān)系。通過對三一重工的數(shù)據(jù)進行詳細的篩選和分析,發(fā)現(xiàn) “挖掘機指數(shù)”能夠反映路橋建設(shè)回暖、核電和風電等新能源引擎啟動、房地產(chǎn)施工下降、 “一帶一路”發(fā)力等多個新聞點。報道生動客觀地對中國經(jīng)濟形勢給予分析和肯定,有網(wǎng)友評價, “這是少有的能讓人讀懂的經(jīng)濟報道。”
在落實中央八項規(guī)定精神的系列報道策劃中,要求反腐報道做出新意,編輯部拿出了數(shù)據(jù)新聞的策劃方案。數(shù)據(jù)源就利用中央紀委監(jiān)察部網(wǎng)站公開通報的反腐案例,記者分別對于每月、每季度、每年甚至一定階段的反腐公開數(shù)據(jù)進行逐條整理,從而提高準確性與可靠性。包括清除不必要的干擾數(shù)據(jù)、清理數(shù)據(jù)中的人為誤差、將數(shù)據(jù)轉(zhuǎn)化為統(tǒng)一的格式,以及對數(shù)據(jù)進行計算和完備性測試等等。最后再運用可視化技術(shù)將經(jīng)過過濾、整理后的數(shù)據(jù)根據(jù) “老虎” “蒼蠅”的年齡、性別、職務(wù)、工作地點、工作領(lǐng)域、犯罪類型等不同維度進行統(tǒng)計計算,再對計算結(jié)果進行說明和解讀。
在這一階段策劃推出的 《“打虎拍蠅”在提速,摸準 “窩案”一鍋端——數(shù)讀中紀委國企 “反腐”之 “最”》 《落馬 “一把手”曾是 “一霸手”?——透視166名 “一把手”腐敗案》 《大數(shù)據(jù)揭秘:哪些 “老虎蒼蠅”上過中紀委官網(wǎng)的頭條?》等稿件,通過對多個中紀委公開的反腐個案進行數(shù)據(jù)統(tǒng)計分析,可以直觀感受到中紀委對于反腐工作正在不斷提速,更能看出中央對于打擊腐敗的力度與決心,這批數(shù)據(jù)新聞成為反腐報道的精品力作。
在移動互聯(lián)網(wǎng)飛速發(fā)展的浪潮下,以手機APP為代表的各類應(yīng)用得到了空前的發(fā)展壯大,不同類型的APP也積累了海量手機用戶,由此產(chǎn)生的幾何級數(shù)的應(yīng)用數(shù)據(jù),對于這些數(shù)據(jù)的處理、分析、挖掘,也讓新聞報道的觸角進入到了全新的領(lǐng)域。
《大數(shù)據(jù)揭秘:高溫天部委加班大比拼》一稿,就是新華社新媒體中心聯(lián)合滴滴媒體研究院,基于實時生成的移動出行大數(shù)據(jù)進行分析,將氣溫和新聞數(shù)據(jù)疊加,通過統(tǒng)計分析來自公安部、監(jiān)察部、民政部、司法部、財政部、人力資源和社會保障部、國土資源部等17個部委基于手機應(yīng)用滴滴出行的出租車、快車、專車使用數(shù)據(jù)進行分析,勾勒出 “國土資源部加班最狠” “公安部24小時無休”等多個圖景。
《美味也在 “漂流”——大數(shù)據(jù)告訴你2015“舌尖上的遷徙”》一稿,是新媒體中心依托百度糯米和百度搜索等應(yīng)用,對線上飲食消費進行全網(wǎng)數(shù)據(jù)挖掘、分析,用覆蓋全國40余個主要城市、近百萬家門店、上億用戶的2015年全年的大數(shù)據(jù),為讀者呈現(xiàn)數(shù)據(jù)版 “舌尖上的中國”。 《民航何時才能 “非常準”?——數(shù)說2015年那些遲到的 “空中約會”》一稿,是對航空數(shù)據(jù)服務(wù)商飛常準的數(shù)據(jù)進行分析挖掘,得出 “七八月份的航班正點率為全年最低,僅為65%左右”等關(guān)鍵信息。
在 《00后日常表達數(shù)據(jù)大揭秘: “寶寶”來自哪個星球?》一稿的創(chuàng)作中,利用百度輸入法后臺獲取的海量數(shù)據(jù),完成了輸入法和00后表達方式之間的數(shù)據(jù)關(guān)聯(lián),得出 “00后新生代擁有不同的表達方式”這一主題,從中總結(jié)出了00后 “無表情不會聊天” “追星追漫更愛萌” “討厭單調(diào)愛分享”這三大特點。
由于數(shù)據(jù)新聞來源于數(shù)據(jù),并且由數(shù)據(jù)組成,所以它與新媒體化呈現(xiàn)之間有著天生的契合。數(shù)據(jù)的可視化歷史久遠,但數(shù)據(jù)新聞對其提出了更高的要求。不僅要把枯燥難懂的數(shù)據(jù)變?yōu)槎嗖室鬃x的可視化產(chǎn)品,而且要讓這些產(chǎn)品的表現(xiàn)形式符合數(shù)據(jù)的基本內(nèi)容。在上文提到的案例中,大部分數(shù)據(jù)新聞產(chǎn)品都采用了文字稿配可視化圖表的形式,這也是目前最常見的形式之一。
在數(shù)據(jù)新聞的實際操作中,記者扮演了多重角色,他是數(shù)據(jù)統(tǒng)計員,主要通過數(shù)據(jù)統(tǒng)計、數(shù)據(jù)分析、數(shù)據(jù)挖掘等技術(shù)手段或是從海量數(shù)據(jù)中發(fā)現(xiàn)新聞線索;他也是數(shù)據(jù)分析員,在抓取大量數(shù)據(jù)后,分析各新聞要素之間的必然聯(lián)系,拓展既有新聞主題的廣度與深度;他還是半個美編,要撰寫可視化圖表或視頻腳本,依靠可視化技術(shù)將經(jīng)過過濾后的數(shù)據(jù)進行融合,以形象化、藝術(shù)化的方式加以呈現(xiàn),為讀者提供客觀、系統(tǒng)的報道以及良好的閱讀體驗。
隨著技術(shù)手段的日新月異,讀者對于數(shù)據(jù)新聞的呈現(xiàn)方式也有了越來越高的要求。由于GIF動圖的流行,動態(tài)圖表也逐漸代替普通圖表成為了數(shù)據(jù)新聞的 “標配”之一。在數(shù)據(jù)新聞 《2015年 “象牙塔”反腐:平均每周一名校領(lǐng)導(dǎo)被通報》中,用循環(huán)動態(tài)圖表來展現(xiàn)關(guān)鍵的數(shù)據(jù)內(nèi)容,將有趣的動態(tài)效果與嚴肅的主題相結(jié)合,打破了原本相對無趣的話題,創(chuàng)造出一種全新的報道效果。
《滴滴大數(shù)據(jù)揭秘:高溫天部委加班大比拼》一稿,則在使用數(shù)據(jù)圖表的同時又配發(fā)了動新聞,用動畫的形式展現(xiàn)了報道內(nèi)容,仿佛讓文字擁有了全新的生命。這種形式優(yōu)勢很明顯,讓讀者在輕松幽默的動畫中獲取新聞內(nèi)容,非常利于傳播。但缺點也凸顯,那就是生產(chǎn)成本較高,制作周期較長,短時間內(nèi)很難創(chuàng)作出優(yōu)秀的作品。
由于HTML5語言逐步代替FLASH動畫,越來越多的交互式H5展現(xiàn)形式也進入了人們的視野。在 《00后日常表達數(shù)據(jù)大揭秘: “寶寶”來自哪個星球?》中,記者和百度合作,共同推出調(diào)查小測驗H5《蛋蛋后日常大揭秘——測測你比蛋蛋后大幾歲?》。一時間,朋友圈中的70、80、90后們都躍躍欲試,測試結(jié)果更是刷屏朋友圈,可見H5的魅力之大。
數(shù)據(jù)新聞是更適合通過網(wǎng)絡(luò)、客戶端展示的新媒體報道,它抽離于新聞現(xiàn)場,又與報道主題有著千絲萬縷的聯(lián)系,它豐富多元的呈現(xiàn)形態(tài),是傳統(tǒng)媒體很難做到的。隨著科學(xué)技術(shù)的發(fā)展與滲透,機器人寫作、人工智能等新的技術(shù)會更多地應(yīng)用在新聞報道中,科技會令新聞更加精彩。
(作者分別系新華社新媒體中心總編室副主任,編輯)