周笑漩
[關(guān)鍵詞]大數(shù)據(jù);新聞;分析
“大數(shù)據(jù)新聞”是大數(shù)據(jù)時代的產(chǎn)物,是一個有別于“精確新聞”、“數(shù)據(jù)新聞”的概念。科學(xué)運(yùn)用“大數(shù)據(jù)新聞”,可以充分挖掘新聞價值,提升新聞的客觀性、可讀性。
一、概念淺析
美國學(xué)者尼葛洛龐帝在1996年出版了《數(shù)字化生存》一書,在書中提出了“數(shù)字化生存(Being Digital)”的概念。這一概念認(rèn)為“人類生存于一個虛擬的、數(shù)字化的生存活動空間,在這個空間里人們應(yīng)用數(shù)字技術(shù)(信息技術(shù))從事信息傳播、交流、學(xué)習(xí)、工作等活動”,即是數(shù)字化生存的核心含義。
隨著對數(shù)字化生存的深入認(rèn)識。人們注意到數(shù)字的存在和其巨大的力量。有著“互聯(lián)網(wǎng)之父”之稱的蒂姆·伯納斯·李(Tim Berners—Lee)有一句名言,他說“新聞的未來,是分析數(shù)字”。這一觀點(diǎn)引起了廣泛的注意,成為數(shù)字化生存時代新聞突圍的方向之一。
數(shù)字化生存時代,一個最顯著的特征是人類的生活被數(shù)字包裝和裹挾。海量的數(shù)字構(gòu)成了人們生活中的一個極其重要的側(cè)面?!按髷?shù)據(jù)”的概念越來越深入人心,有分析認(rèn)為,近幾年來,人們在互聯(lián)網(wǎng)留下的信息和運(yùn)用各種社交媒體留下的信息痕跡,甚至超過了自有記載以來人類保留的信息總和。有統(tǒng)計表明,早在2011年,全球的數(shù)字量就已經(jīng)達(dá)到1.8Z,目前沒有看到2015年乃至2016年的數(shù)字總量,不過可以推測,也將是一個極其海量的數(shù)字。面對新的新時代,傳統(tǒng)的信息處理模式以及新聞生產(chǎn)方式已經(jīng)無法滿足時代的要求,所以變革正在迅速發(fā)生,我們有必要定睛看看這個信息化時代的新聞生產(chǎn)。
大數(shù)據(jù)對于新聞報道的影響產(chǎn)生于新聞采集、制作、傳播、反饋的全過程。從原始數(shù)字的收集,到對數(shù)字的分解,直至條分縷析之后將數(shù)字可視化、形成具體的新聞報道,這也就是“大數(shù)據(jù)新聞”的全過程。
對于“大數(shù)據(jù)新聞”的概念,學(xué)術(shù)界有著不同的看法。比較權(quán)威的說法,見于中國人民大學(xué)方潔的定義。他認(rèn)為。“大數(shù)據(jù)新聞”是基于數(shù)字的掘取、統(tǒng)計、分析和可視化呈現(xiàn)的新型新聞報道方式?!按髷?shù)據(jù)新聞”的核心是對數(shù)字的處理這一定義涵蓋了多重定義中的共通部分。
但是應(yīng)該注意到:“大數(shù)據(jù)新聞”與“精確新聞”和“數(shù)據(jù)新聞”的區(qū)別。在20世紀(jì)60年代,美國學(xué)者菲利普·邁耶提出了“精確新聞”的概念,他提出“記者在采訪新聞時運(yùn)用調(diào)查、實驗和內(nèi)容分析等社會科學(xué)研究方法來收集資料、查證事實,從而報道新聞?!奔礊椤熬_新聞”。精確新聞用精確的具體數(shù)字分析新聞事件,以避免主觀的、人為的錯誤。它側(cè)重于微觀的具體調(diào)查、實驗和內(nèi)容分析。而數(shù)據(jù)新聞,則指以數(shù)字、公式、字母等靜態(tài)形式來輔助文字報道?,F(xiàn)在所說“大數(shù)據(jù)新聞”。顯現(xiàn)的是對大數(shù)據(jù)的挖掘與處理的結(jié)果,可以通過復(fù)雜的交互式、動態(tài)化的圖片和視頻來呈現(xiàn)這類新聞。
二、運(yùn)用“大數(shù)據(jù)新聞”需要注意的幾個問題
大數(shù)據(jù)不等于全數(shù)字。記者既要保證從不同信息源拿到足夠多的數(shù)字,也要對這些數(shù)字的客觀性進(jìn)行考察。與傳統(tǒng)的抽樣統(tǒng)計相比,大數(shù)據(jù)的優(yōu)勢在于擁有足夠多的原始數(shù)字?;ヂ?lián)網(wǎng)時代的人際關(guān)系、社會活動、地理位置等一切信息都可以被轉(zhuǎn)換為數(shù)字。因而為全面獲取數(shù)字提供了可能性。大數(shù)據(jù)的來源有很多,新聞報道、門戶網(wǎng)站、搜索引擎、社交網(wǎng)站、政府和企業(yè)的統(tǒng)計、物聯(lián)網(wǎng)和傳感器的檢測,都是獲得數(shù)字的來源。全面獲取數(shù)字,是將大數(shù)據(jù)分析運(yùn)用于新聞報道的必要基礎(chǔ)。獲取了足夠多的數(shù)字之后,要對數(shù)字做客觀的判斷。數(shù)字的定義和界定、統(tǒng)計方法、統(tǒng)計范圍等等,包含和傳遞著某方面的價值判斷,也決定著數(shù)字反映真實的程度。
數(shù)字并不完全是客觀的,如果用新浪微博的數(shù)字分析社會事件或者社會動態(tài).記者要注意到微博的用戶主要為高收入的年輕群體,它并不能反映社會各階層所有人的全貌。如果報道調(diào)用公安部門的數(shù)據(jù)庫,要同時記錄的偏向,比是否存在受警員績效考核制度的影響而導(dǎo)致某些案件病沒有被記錄在案。因此記者在獲取數(shù)字時,一定要注意幾個問題:來源在哪、記錄者是誰、記錄方式是什么、記錄的目的是什么、記錄者的立場是什么、有無遺漏、相關(guān)問題是否應(yīng)該用定量的方法解決?這些數(shù)據(jù)中是否有隨意的成分等等。
同時要注意分析模型的科學(xué)性。數(shù)字是冷冰冰的,記者需要借助某種模型挖掘價值。模型不等于科學(xué)判斷,以數(shù)字判斷現(xiàn)實需要小心翼翼地操作,模型是否合理?其他模型有無參考價值?邏輯上是否嚴(yán)密、判斷結(jié)論是否有主觀因素的強(qiáng)烈影響?這都要求記者有較強(qiáng)的數(shù)據(jù)素養(yǎng)和科研精神。
三、科學(xué)使用“大數(shù)據(jù)新聞”,要做幾方面的工作
打開思路,挖掘新聞事件。要求新聞從業(yè)者從舊有的新聞報道流程中擺脫出來,從舊有的新聞采集、呈現(xiàn)、傳播方式中擺脫出來。
打開技術(shù)的閘門,善于運(yùn)用新技術(shù)。使用靜態(tài)圖表、動態(tài)圖表和交互式圖表,生動展現(xiàn)新聞事件全貌。提高用戶參與度和界面友好度,是“大數(shù)據(jù)新聞”呈現(xiàn)的核心優(yōu)勢。
提升新聞工作者的數(shù)據(jù)素養(yǎng)。以人文類學(xué)科的學(xué)術(shù)背景為主的新聞從業(yè)隊伍,天然有種對數(shù)據(jù)的陌生感和恐懼感,要努力克服,形成愛數(shù)據(jù)、善用數(shù)據(jù)的思維習(xí)慣和氛圍。 (編輯/周洋)