胡佩
關(guān)鍵詞:數(shù)據(jù)新聞;數(shù)據(jù)采集;倫理問題;應(yīng)對(duì)策略
隨著信息的快速發(fā)展,大數(shù)據(jù)也隨之出現(xiàn),在大數(shù)據(jù)背景之下,數(shù)據(jù)新聞的所采集的數(shù)據(jù)量已經(jīng)遠(yuǎn)遠(yuǎn)不只是幾個(gè)數(shù)據(jù)庫或者是若干個(gè)圖表這么簡單,而是基于社交網(wǎng)絡(luò)和移動(dòng)互聯(lián)網(wǎng)終端的海量信息采集[1]。在此情況下,在數(shù)據(jù)新聞生產(chǎn)與制作過程中,對(duì)于數(shù)據(jù)新聞中過的數(shù)據(jù)采集來說,也面臨著數(shù)據(jù)采集來源的片面性、對(duì)用戶數(shù)據(jù)隱私的失范、數(shù)據(jù)新聞從業(yè)者的數(shù)據(jù)采集技能不足等問題。
依據(jù)數(shù)據(jù)新聞中數(shù)據(jù)的來源進(jìn)行分類,數(shù)據(jù)新聞可以分成自我采集數(shù)據(jù)型和現(xiàn)有數(shù)據(jù)再利用型 [2]。由于自我采集型數(shù)據(jù)對(duì)新聞從業(yè)人員素質(zhì)的要求和投入的時(shí)間、資金較高,因而帶來了一定的操作風(fēng)險(xiǎn),所以自我采集型的數(shù)據(jù)新聞在目前媒體的數(shù)據(jù)新聞實(shí)踐中所占的比例并不高。但在使用頻率較高的現(xiàn)有數(shù)據(jù)再利用型的數(shù)據(jù)采集中,由于部分?jǐn)?shù)據(jù)的采集屬于二手?jǐn)?shù)據(jù),而非原創(chuàng)的一手?jǐn)?shù)據(jù),其數(shù)據(jù)的真實(shí)性、權(quán)威性、可信度是數(shù)據(jù)采集者需要注意的。在如今大數(shù)據(jù)背景下,信息的存儲(chǔ)以及挖掘方式多種多樣,數(shù)據(jù)新聞中的數(shù)據(jù)采集也面臨著困境。
(一)數(shù)據(jù)采集中的“數(shù)據(jù)片面化”
從數(shù)據(jù)采集量上來說,數(shù)據(jù)新聞所采集的數(shù)據(jù)量已經(jīng)遠(yuǎn)遠(yuǎn)不只是幾個(gè)數(shù)據(jù)庫或者是若干個(gè)圖表這么簡單,而是基于社交網(wǎng)絡(luò)和移動(dòng)互聯(lián)網(wǎng)終端的海量信息采集在數(shù)據(jù)新聞中,數(shù)據(jù)來源的局限性會(huì)直接導(dǎo)致新聞報(bào)道的片面化,甚至是虛假新聞。造成數(shù)據(jù)來源局限性的原因除了數(shù)據(jù)開放程度不夠以及受眾參與眾包新聞的積極性不高等外部因素之外,內(nèi)部因素更不容忽視。
數(shù)據(jù)來源的單一化。新聞媒體以及新聞從業(yè)者為了控制人力、時(shí)間和資金成本,會(huì)傾向于選擇數(shù)據(jù)易得的采集渠道,比如開放數(shù)據(jù)以及官方數(shù)據(jù),而舍棄自我采集型數(shù)據(jù)、調(diào)查泄漏數(shù)據(jù)等方式。這就很容易造成數(shù)據(jù)來源較為單一,數(shù)據(jù)新聞的內(nèi)容也由此受到一定的影響。
假設(shè)數(shù)據(jù)新聞的數(shù)據(jù)來源只有企業(yè)的數(shù)據(jù),或者是說只有官方的數(shù)據(jù),那么該數(shù)據(jù)新聞一定是站在企業(yè)或者官方的立場上所得出來的結(jié)論,新聞的真實(shí)性就有待考究。那如果數(shù)據(jù)新聞作品中既有官方的數(shù)據(jù)又有企業(yè)的數(shù)據(jù)也有眾包數(shù)據(jù),那么這個(gè)新聞作品的數(shù)據(jù)來源就更加全面,更足以支撐數(shù)據(jù)新聞的可信度。
數(shù)據(jù)采集技能缺失。數(shù)據(jù)新聞?dòng)浾叩臄?shù)據(jù)采集的技能缺失體現(xiàn)在搜集數(shù)據(jù)素養(yǎng)的不足,在數(shù)據(jù)采集過程中只采取了報(bào)道的數(shù)據(jù)而沒有對(duì)數(shù)據(jù)進(jìn)行分析。同時(shí),在大數(shù)據(jù)時(shí)代下,許多新聞從業(yè)者存在大數(shù)據(jù)至上的思維,認(rèn)為跑新聞現(xiàn)場耗時(shí)耗力,因此基于大數(shù)據(jù)時(shí)代,單純的從網(wǎng)上搜集報(bào)告、抓取數(shù)據(jù)。這就容易導(dǎo)致數(shù)據(jù)新聞的片面性,從而造成數(shù)據(jù)新聞的權(quán)威性和可靠性的弱化。
數(shù)據(jù)源的模糊描述。學(xué)者方潔通過對(duì)新華網(wǎng)《數(shù)據(jù)折聞》、搜狐網(wǎng)《數(shù)字之道》、網(wǎng)易《數(shù)讀》、財(cái)新《數(shù)字說》和澎湃新聞《美數(shù)課》等五個(gè)國內(nèi)知名數(shù)據(jù)新聞欄目的定量研究,發(fā)現(xiàn)在總體樣本中,除了7.4%的數(shù)據(jù)新聞沒有對(duì)數(shù)據(jù)來源進(jìn)行描述以外,尚有73.0%的樣本描述模糊,這個(gè)數(shù)據(jù)遠(yuǎn)遠(yuǎn)超過描述清晰的19.6%。
例如,新華網(wǎng)報(bào)道的數(shù)據(jù)新聞——唐詩宋詞系列,在該作品的最后,僅僅通過列舉三處來說明數(shù)據(jù)來源,沒有具體指明新聞中的數(shù)據(jù)采集分別來源于這三處中的哪一個(gè)地方,數(shù)據(jù)來源描述得十分模糊。在《衛(wèi)報(bào)》——中國經(jīng)濟(jì)放緩如何影響世界其他國家,在這則數(shù)據(jù)新聞報(bào)道中,一個(gè)較為明顯的問題是對(duì)數(shù)據(jù)來源的交代不夠清晰,僅僅只是在末尾列出了數(shù)據(jù)來源分別是聯(lián)合國商品貿(mào)易數(shù)據(jù)庫、中國海關(guān)總署和世界銀行的統(tǒng)計(jì)數(shù)據(jù),但并未詳細(xì)標(biāo)注相應(yīng)的數(shù)據(jù)文件名或相關(guān)鏈接,淡化了數(shù)據(jù)獲取的途徑與方式,只是對(duì)“結(jié)果”的簡單呈現(xiàn),因此讀者無法查驗(yàn)其數(shù)據(jù)來源是否真實(shí)可靠。
(二)數(shù)據(jù)采集中的“數(shù)據(jù)竊取”
我國目前信息公開制度尚不健全,隱私權(quán)的保護(hù)特別是信息時(shí)代隱私權(quán)的保護(hù)存在很大漏洞。而中國鐵道部官網(wǎng)就曾因用戶數(shù)據(jù)泄露而給人們帶來麻煩,而泄露的信息是否存在隱藏的威脅尚未可知。[3]個(gè)人數(shù)據(jù)利用中的隱私侵犯是數(shù)據(jù)新聞生產(chǎn)面臨的現(xiàn)實(shí)問題,因?yàn)樵跀?shù)據(jù)開放和數(shù)據(jù)新聞生產(chǎn)實(shí)踐中存在隱私權(quán)與表達(dá)自由、個(gè)人數(shù)據(jù)保護(hù)與數(shù)據(jù)新聞報(bào)道的矛盾[4]。當(dāng)下隱私保護(hù)法以個(gè)人為中心的思想:數(shù)據(jù)收集者必須告知個(gè)人,他們收集了哪些數(shù)據(jù)、作何用途,也必須在收集工作開始之前征得個(gè)人的同意。[5]雖然這不是生產(chǎn)數(shù)據(jù)新聞過程中合法采集數(shù)據(jù)的唯一方式,但“告知與許可”這一共識(shí)性基礎(chǔ)已經(jīng)是世界各地都在執(zhí)行的隱私政策。但是,隨著杜交媒體的發(fā)展,數(shù)據(jù)集越來越大,在使用數(shù)據(jù)時(shí)獲得每個(gè)人的知情同意是不可能的,很難保證載據(jù)對(duì)象的自主原則。
大數(shù)據(jù)時(shí)代,數(shù)據(jù)的價(jià)值不再單純來源于它的基本用途,而更多源于它的二次利用和N次利用,因此,將隱私權(quán)的保護(hù)責(zé)任從民眾轉(zhuǎn)移到數(shù)據(jù)使用者,這就會(huì)出現(xiàn)數(shù)據(jù)初始采集目的與數(shù)據(jù)使用目的不相容的問題,即使數(shù)據(jù)采集時(shí)已獲得載據(jù)對(duì)象的知情同意,新聞?dòng)浾呔庉嬙谛侣勆a(chǎn)中對(duì)數(shù)據(jù)的循環(huán)利用也很難每次都做到“告知與許可”。
在現(xiàn)如今“告知與許可”已經(jīng)失效的大數(shù)據(jù)時(shí)代下,新聞傳播專業(yè)還沒有采取有效措施,使得數(shù)據(jù)使用與載據(jù)對(duì)象隱私保護(hù)之間達(dá)到干衡。因此,在大數(shù)據(jù)時(shí)代下,數(shù)據(jù)新聞既要做到數(shù)據(jù)公開,以此來獲取所需的新聞來源和必要的新聞數(shù)據(jù)支撐,又需要對(duì)受眾提供的數(shù)據(jù)負(fù)責(zé),尤其是保護(hù)受眾的隱私權(quán)。
大數(shù)據(jù)時(shí)代背景下,對(duì)于數(shù)據(jù)新聞中的數(shù)據(jù)采集,無論是自我采集型還是現(xiàn)有數(shù)據(jù)再利用型,在政府完善數(shù)據(jù)隱私監(jiān)管及法律法規(guī)的約束下,最重要的還是數(shù)據(jù)新聞?dòng)浾咦鳛閿?shù)據(jù)采集人員自主承擔(dān)責(zé)任,應(yīng)遵循以下幾個(gè)原則:
(一)數(shù)據(jù)來源多樣化原則
數(shù)據(jù)作為數(shù)據(jù)新聞的核心,是支撐數(shù)據(jù)新聞完整呈現(xiàn)的基礎(chǔ),其來源的權(quán)威性、準(zhǔn)確性以及可信度對(duì)數(shù)據(jù)新聞的生產(chǎn)產(chǎn)生了重要作用。這就要求新聞從業(yè)者在數(shù)據(jù)采集時(shí),提升自己的數(shù)據(jù)采集技能,做到數(shù)據(jù)來源全面、數(shù)據(jù)種類多樣、數(shù)據(jù)真實(shí)可靠。在數(shù)據(jù)新聞中,所采集到的數(shù)據(jù)來源多樣化才能夠克服數(shù)據(jù)來源的片面性。
例如,央視晚間新聞推出的數(shù)據(jù)新聞節(jié)目——據(jù)說春運(yùn),它的數(shù)據(jù)來源,不僅有央視與百度合作通過LBS開放平臺(tái)分析手機(jī)用戶的定位信息,映射出手機(jī)用戶的遷徙軌跡,構(gòu)成了一張實(shí)時(shí)變化的動(dòng)態(tài)圖,而且還有記者去到火車站現(xiàn)場采訪火車站的一線工作人員并且在現(xiàn)場拍攝了圖片進(jìn)行了現(xiàn)場的采訪與報(bào)道。在這一新聞作品中即涵蓋了大數(shù)據(jù)又有現(xiàn)場的小數(shù)據(jù)采集,其數(shù)據(jù)來源是多樣化的,使得報(bào)道更加豐富,避免了新聞報(bào)道的片面性。
(二)數(shù)據(jù)采集的自負(fù)原則
在數(shù)據(jù)新聞報(bào)道過程中,新聞從業(yè)者對(duì)新聞數(shù)據(jù)的采集既存在使用用戶的隱私數(shù)據(jù),同時(shí)也存在泄漏用戶個(gè)人的隱私信息的可能。所以在數(shù)據(jù)新聞的生產(chǎn)過程中,為了避免在數(shù)據(jù)采集過程中用戶的個(gè)人信息的侵犯和濫用,作為一名數(shù)據(jù)新聞?dòng)浾咴谥橥馊蔽坏拇髷?shù)據(jù)時(shí)代下要遵循用者自負(fù)原則,在保護(hù)數(shù)據(jù)對(duì)象時(shí)要把握好隱私保護(hù)和數(shù)據(jù)使用之間的一個(gè)平衡。在對(duì)個(gè)人數(shù)據(jù)進(jìn)行再利用時(shí),記者可利用技術(shù)手段對(duì)個(gè)人隱私進(jìn)行“脫敏”,采用“匿名化”的策略,通過代號(hào)化或加密處理,切斷信息與特定個(gè)人之間的辨識(shí)要素,實(shí)現(xiàn)信息的“去個(gè)人化”。
需要指出的是,傳統(tǒng)上通過匿名化的方式可以避免數(shù)據(jù)主體被識(shí)別的情況,但在大數(shù)據(jù)時(shí)代,單項(xiàng)信息的匿名化并不足以起到避免識(shí)別的作用,通過多個(gè)匿名單項(xiàng)個(gè)人信息的組合依然可能識(shí)別出數(shù)據(jù)主體,因此需要數(shù)據(jù)新聞?dòng)浾咴谀涿幚頃r(shí)綜合評(píng)價(jià)匿名個(gè)人數(shù)據(jù)的潛在風(fēng)險(xiǎn),采取應(yīng)對(duì)措施,保護(hù)數(shù)據(jù)主體的合法權(quán)益[6]。
大數(shù)據(jù)時(shí)代背景下,在數(shù)據(jù)新聞在日趨完善的同時(shí),學(xué)界和業(yè)界有必要在數(shù)據(jù)新聞生產(chǎn)和制作過程中的數(shù)據(jù)采集倫理問題上進(jìn)行充分討論、達(dá)成共識(shí)。同時(shí),為了減少數(shù)據(jù)采集倫理問題給社會(huì)帶來的潛在風(fēng)險(xiǎn)系數(shù),要加強(qiáng)法律和專業(yè)倫理規(guī)范的制約,促進(jìn)數(shù)據(jù)新聞的實(shí)踐進(jìn)一步深入。
參考文獻(xiàn)
[1]喻國明.從精確新聞到大數(shù)據(jù)新聞——關(guān)于大數(shù)據(jù)新聞的前世今生[J].青年記者,2014(36):43-44.
[2]數(shù)據(jù)新聞概論[M].中國人民大學(xué)出版社,方潔,2015
[3]鄒方.大數(shù)據(jù)時(shí)代新聞業(yè)的革新與困境——以央視《據(jù)說春運(yùn)》《據(jù)說過年》為例[J].東南傳播,2016(09):10-13.
[4] VOORHOOF D.ECtHR decision: right of privacy vs. data journalism in Finland[EB/OL].https://ecpmf.eu/news/legal/archive/ecthr-decision-right-of-privacy-vs-data-journalism-in-finland.
[5]丁曉東.論個(gè)人信息法律保護(hù)的思想淵源與基本原理——基于“公平信息實(shí)踐”的分析[J].現(xiàn)代法學(xué),2019,41(03):96-110.
[6]張超.試析數(shù)據(jù)新聞生產(chǎn)中的個(gè)人數(shù)據(jù)濫用與規(guī)避[J].編輯之友,2018(08):66-70.