□文│張志安 曹艷輝
隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、傳感器、云計算等信息技術的發(fā)展,人類進入數(shù)字化生存時代,個人的表達行為、搜索行為、交易行為、移動行為等都被數(shù)字化記錄和存儲,構成海量、多樣、變動、真實的大數(shù)據(jù)。2012 年格雷布林克在《紐約時報》的一篇專欄中宣稱,“大數(shù)據(jù)時代”已經(jīng)來臨。自此,大數(shù)據(jù)迅速升溫成全球性話題,甚至上升到各國發(fā)展的國家戰(zhàn)略層面。哈佛大學教授加里·金更是預言,大數(shù)據(jù)是一場“革命”,它將改變社會各個領域的發(fā)展方式和進程,“無論學術界、商界還是政府,所有領域都將開始這種進程”。
大數(shù)據(jù)資源和技術能否帶來新的研究范式,給“理論貧困,內(nèi)卷化嚴重”(李金銓語)的新聞傳播研究提供理論與方法上的創(chuàng)新?在實務層面,大數(shù)據(jù)將如何影響新聞生產(chǎn)、廣告營銷等實踐,是否會給處于焦慮轉(zhuǎn)型期的新聞業(yè)帶來新的發(fā)展機遇?倚重數(shù)據(jù)挖掘的認知思維和實務操作是否會引發(fā)新的法律倫理風險?針對這些問題,我們以“大數(shù)據(jù)”(big data)作為檢索關鍵詞,對 2011-2016年間發(fā)表在新聞傳播學領域 SSCI、CSSCI 期刊及少數(shù)專業(yè)期刊上的相關研究成果進行回顧,評述大數(shù)據(jù)語境下的新聞傳播學研究熱點并進行反思,以期為大數(shù)據(jù)時代的新聞傳播研究創(chuàng)新提供一些啟示。
帕克指出,“大數(shù)據(jù)方法和資源變得日益重要,是因為它能提供其他方法無法獲得的數(shù)據(jù)和洞察”。[1]理論驅(qū)動的大數(shù)據(jù)實證研究是指運用大規(guī)模數(shù)據(jù)和大數(shù)據(jù)方法所進行的實證研究,其目的是為了理論檢驗或理論修正,而非對大數(shù)據(jù)進行解釋、背書、批判,或?qū)Υ髷?shù)據(jù)在新聞傳播實務中的運用進行點評、預測。相關研究集中發(fā)表在新聞傳播類 SSCI 期刊上,研究對象涵蓋傳播主體、傳播內(nèi)容、傳播過程、傳播效果等范疇,涉及政治傳播、健康傳播、風險傳播、跨文化傳播、組織傳播等研究議題,而國內(nèi)期刊上鮮有相關研究。
互聯(lián)網(wǎng)的興起正在重構人們的連接、表達與交流方式,也激發(fā)了研究者對公共領域、民主協(xié)商的想象與爭議。許多學者在探討,網(wǎng)絡新媒體是在復興自由討論的“公共領域”,還是在強化同質(zhì)化聯(lián)結的“回音壁”(Echo Chamber)效應?網(wǎng)絡傳播究竟是去中心化,還是再中心化?針對這些爭議性問題,一些學者突破以往基于有限樣本或單個事件的研究范式,嘗試利用推特、論壇等平臺上的大數(shù)據(jù)對傳播主體及關系網(wǎng)絡進行研究。
政治同質(zhì)化問題非常重要,關系到網(wǎng)絡媒體是支持公共領域的形成還是助長黨派的群體極化,但以往研究聚焦于個案研究??迫R奧尼等人[2]根據(jù)美國推特用戶分享的內(nèi)容來識別其政治立場,然后創(chuàng)新性地根據(jù)民主黨用戶(n=782,371)、共和黨用戶(n=72,302)、民主黨官方賬號(n=108)、共和黨官方賬號(n=130)之間的社交關系網(wǎng)絡分析(每一個節(jié)點代表一個推特用戶,連線代表推特用戶之間的粉絲關系)來計算推特用戶的政治同質(zhì)化(指推特用戶的社交關系網(wǎng)絡中,與之具有相同政治立場的推特用戶所占的比例)程度。研究發(fā)現(xiàn),民主黨人的社交關系網(wǎng)絡呈現(xiàn)出更高的政治同質(zhì)化現(xiàn)象,共和黨人對共和黨官方賬號的關注程度高于民主黨人。而在具有互粉關系的網(wǎng)絡中,推特用戶的政治同質(zhì)化程度更高。由此,研究者建議應該考慮政治文化、用戶行為對網(wǎng)絡政治同質(zhì)化的影響。該研究突破了以往個案研究的局限,呈現(xiàn)了主流社交媒體平臺上的政治同質(zhì)化全景、解釋了影響政治同質(zhì)化現(xiàn)象的重要因素,這對中國網(wǎng)民的同質(zhì)化研究同樣具有啟示作用。
另有一些研究表明,互聯(lián)網(wǎng)確實改變了傳播主體的權力結構,但占中心位置的傳播者不一定導致實質(zhì)性話語壟斷,這對精確測量網(wǎng)絡意見領袖和辯證看待網(wǎng)絡傳播中的權力結構具有借鑒意義。例如,弗里龍和卡普夫[3]以 2012 年美國總統(tǒng)競選電視辯論有關的 190 萬條推文作為研究對象,將評論人分為傳統(tǒng)政治精英(政客、主流媒體及記者)、橋接型精英(娛樂明星、運動員及其他名人)、非精英(戲謔賬號和普通賬號)三大類。通過對評論人之間的轉(zhuǎn)發(fā)關系進行網(wǎng)絡分析后,發(fā)現(xiàn)非傳統(tǒng)政治精英在網(wǎng)絡中處于中心位置,尤其是針對羅姆尼的評論,非精英賬戶的評論遠比政治精英受歡迎。另外,格雷厄姆和賴特[4]分析了一個論壇的發(fā)帖主體,發(fā)現(xiàn)該論壇有 2052 名高級發(fā)帖者(superposters),僅占發(fā)帖者人數(shù)的 0.4% ,卻貢獻了 47%的帖子(n=25,000,000)。但進一步對其中 25 名高級發(fā)帖者的發(fā)帖內(nèi)容(n=40,044)進行質(zhì)化分析后發(fā)現(xiàn),大部分帖子并沒有阻止其他用戶發(fā)帖或攻擊別人。
社交媒體日益成為公開表達、輿論演變的重要場域。社交媒體上的自我表達或內(nèi)容生產(chǎn)呈現(xiàn)哪些規(guī)律?社交媒體平臺的政治傳播遵循什么邏輯?如何通過社交媒體大數(shù)據(jù)獲知公眾對風險議題的情緒態(tài)度?一些研究者試圖通過對大規(guī)模的社交媒體文本數(shù)據(jù)分析來回答這些問題。
已有研究發(fā)現(xiàn),社交媒體上的自我呈現(xiàn)、內(nèi)容生產(chǎn)受文化因素、發(fā)布終端等因素影響,這些研究不僅突破了以往小樣本調(diào)研和實驗法的局限性,而且使文化、表情、情緒等抽象或難以測量的概念得以精準量化。例如,帕克等人[5]基于“傳播中的文化差異理論”和“面部表情的心理學研究”提出研究假設,然后通過推特大數(shù)據(jù)比較了不同文化群體在表情符號使用中的差異。該研究采集了 2006~2009 年間 78 個國家 5400 多萬推特用戶發(fā)表的 17 億多條推文,研究證明來自個體主義文化的用戶更喜歡使用水平型的表情符號(如 :)或:-))來表達情緒,而來自集體主義文化的用戶更喜歡使用垂直型的表情符號(如 ^_^ 或 ^.^)。默西等人[6]的研究顯示,社交媒體上的內(nèi)容生產(chǎn)與使用行為具有相關性。他們以 2.35 億條推文作為研究樣本,運用社會心理學理論比較了不同平臺上推文的語言風格差異,研究表明通過移動終端發(fā)布的推文在語言風格上更以自我為中心、消極情緒的詞匯使用比例更高,但在語言的性別類型和公共性方面沒有顯著的差異。
已有研究還發(fā)現(xiàn),社交媒體上的政治評論遵循混合媒介系統(tǒng)(a hybrid media system)模式。容赫爾從時間和內(nèi)容兩個維度比較了 2009 年德國聯(lián)邦大選期間推特上的政治評論和傳統(tǒng)新聞媒體的政治報道,研究發(fā)現(xiàn) :推特用戶對政黨的評論與傳統(tǒng)媒體報道遵循不同的時間動態(tài),但對政客的評論與傳統(tǒng)媒體報道呈現(xiàn)相似時間動態(tài) ;推特上的政治評論內(nèi)容時而像傳統(tǒng)新聞媒體的報道那樣,突出個性化、競爭性等新聞價值取向,時而遵循網(wǎng)絡表達邏輯,如突出非傳統(tǒng)黨派的動員、質(zhì)疑和諷刺政客等。[7]該研究的創(chuàng)新之處是將大數(shù)據(jù)量化研究和小樣本質(zhì)化研究相結合,從時間和內(nèi)容兩個維度呈現(xiàn)了傳統(tǒng)媒體和社交媒體上政治評論生產(chǎn)的差異性。
在風險傳播研究方面,Kim(金)等學者認為有必要通過推特用戶的情感表達來衡量公眾對爭議性風險議題的態(tài)度。他們對 2010 年 10 月~ 2013年 9 月 3 年間與核能有關的 2900 多萬條推文進行分析。研究表明,2011 年日本福島核事故發(fā)生后,帶有外部信息鏈接(如網(wǎng)絡新聞)的推文數(shù)量遠遠超過不帶鏈接的推文數(shù)量 ;而計算機輔助的語義分析結果顯示,對核能的悲觀情緒一直是公眾輿論的主基調(diào)。[8]該研究的主要貢獻有兩點 :一是宏觀呈現(xiàn)了公眾在社交媒體上的信息分享特征,二是通過社交媒體文本的情感分析來測量公眾的情緒態(tài)度。
在新的傳媒生態(tài)下,研究者總是在試圖回答“傳統(tǒng)新聞媒體是否仍然能夠顯著影響公眾輿論”“社交媒體平臺的公共對話是否具有設置媒體議程的潛力”“受眾反映是否可以通過更有效的方式測量與評估”等問題。[9]近年來,一些學者開始利用大數(shù)據(jù)來檢驗政治和健康傳播領域的傳播效果。
“議程設置”一直是傳播學效果研究中的經(jīng)典理論,諸多研究已對不同議題、不同媒體、不同受眾的議程設置效果進行檢驗,但受制于自我報告數(shù)據(jù)所導致的一致性偏差。而用戶在社交媒體上的表達行為反映了公眾真實的議題關注,由此一些學者借助網(wǎng)絡大數(shù)據(jù)對政治傳播中的議程設置動態(tài)和效果進行研究。例如,紐曼等學者通過對 2012 年美國社交媒體和傳統(tǒng)媒體中 29 個政治議題文本的時間序列分析后發(fā)現(xiàn),議程設置是一個多元、復雜的互動過程,而非傳統(tǒng)媒體與社交媒體之間的單向流動。該研究采集了 1 億活躍推特用戶、1.6 億活躍博客用戶、30 萬論壇用戶的社交媒體數(shù)據(jù)和在線報刊、廣播電視上的傳統(tǒng)媒體數(shù)據(jù)。[10]同樣,瓦戈等學者利用 2012 年美國總統(tǒng)競選期間的推特大數(shù)據(jù)檢驗了議程融合(agenda melding)和網(wǎng)絡議程設置(Network Agenda Setting)理論,該研究發(fā)現(xiàn)“垂直型”媒體中的議題網(wǎng)絡能更好地預測奧巴馬支持者關注的議題網(wǎng)絡,“水平型”媒體中的議題網(wǎng)絡能更好地預測羅姆尼支持者關注的議題網(wǎng)絡。[11]這些研究不僅避免了自我報告數(shù)據(jù)的缺陷,還通過議題之間的社會關系網(wǎng)絡分析豐富了議程設置的測量維度。
在健康傳播領域,美國疾病控制與預防中心在2012 年發(fā)起一場名為“來自戒煙者的忠告”的全國性控煙運動,廣告宣傳幾乎覆蓋美國所有的媒體。盡管一些證據(jù)表明控煙運動能夠改變目標對象的態(tài)度和行為,但恐懼訴求的說服效果卻一直存在爭議。針對這一爭議,埃梅里等學者以懷特提出的“擴展平行過程模型”(Extended Parallel Process Model)作為理論框架,以推特用戶在自然、真實情境中發(fā)表的與該運動有關的非重復推文作為研究對象。該研究發(fā)現(xiàn)高達 87% (167,867) 的文本顯示接受恐懼訴求信息,7% (14,281) 的文本表明拒絕信息,僅有 6% (11,521) 的文本忽視恐懼信息。[12]由此可見,恐懼訴求在戒煙宣傳中確實具有顯著的說服效果,對理論的檢驗和傳播實踐都具有指導意義。
從已有的大數(shù)據(jù)實證研究來看,研究者主要的數(shù)據(jù)來源是推特、YouTube、臉書等社交媒體,絕大部分研究都使用了推特這一開放性社交平臺的數(shù)據(jù)。與以往的研究范式不同,研究者不再通過問卷調(diào)查、訪談等方式獲取調(diào)查對象的“自我報告”數(shù)據(jù),[13]而是以精練的“關鍵詞”和編程算法來建立數(shù)據(jù)集 ;原有的抽樣邏輯被顛覆,研究者關注的焦點從“代表性的小樣本”轉(zhuǎn)向“選擇性的全樣本”;而最為顯著的變化莫過于數(shù)據(jù)規(guī)模的激增和數(shù)據(jù)類型的變化,盡管學界對“大數(shù)據(jù)”的量級并未達成共識,但已有研究中樣本規(guī)模多則上億,少則數(shù)萬,且多為非結構化的文本、鏈接、表情符號等。正因為數(shù)據(jù)采集方式的改變、抽樣方式的顛覆和數(shù)據(jù)分析難度的大幅度提升,研究者的思維與方法也在改變。一些學者甚至認為大數(shù)據(jù)將改變我們對“研究”的認知。[14]
舍恩伯格在其所著的《大數(shù)據(jù)時代》一書中明確指出大數(shù)據(jù)顛覆了人類傳統(tǒng)的思維方式,具體包括 :總體樣本取代隨機樣本、對不精確的容忍度增加、相關關系取代因果關系。他的觀點被許多學者奉為圭臬,鮮有學者深究其背后的商業(yè)邏輯和認知誤區(qū)。
例如,喻國明[15]在《大數(shù)據(jù)方法 :新聞傳播理論與實踐的范式創(chuàng)新》中指出 :“新聞傳播的理論與實踐正在經(jīng)受大數(shù)據(jù)思維的改變……大數(shù)據(jù)思維只關注‘相關性’,而不再關注‘因果’關系……對大數(shù)據(jù)的研究,發(fā)生了從‘隨機樣本’到‘總體’的研究范式改變,對其研究的重點正從‘理論’向‘算法’與‘規(guī)則’轉(zhuǎn)換……‘理論’的指導價值正在下降?!敝叵嚓P、輕因果的大數(shù)據(jù)思維也體現(xiàn)在實證研究中,如一些研究結果顯示,不同終端上發(fā)布的推文在語言風格上存在差異[16]、不同文化地理位置發(fā)布的推文在表情符號的使用上存在差異等。[17]事實上,這些研究只是驗證了相關性,因為缺乏對其他重要變量的控制而不能證明因果關系。還有一些學者認為,利用大數(shù)據(jù)研究傳播現(xiàn)象首先關注相關關系,主要用于商業(yè)預測,如網(wǎng)民的搜索量和電影票房之間并無因果邏輯關系,只存在相關關系。但這種思維范式的轉(zhuǎn)變導致基于大數(shù)據(jù)的傳播學研究“重數(shù)據(jù)輕理論、重相關輕因果、重挖掘輕闡釋、重軟件輕開發(fā)。[18]
用相關關系取代因果關系,主要是基于時間成本考慮的商業(yè)邏輯,另一方面也得益于多維度的海量數(shù)據(jù)能夠廣泛建立各種相關性分析。必須認識到學術研究與商業(yè)預測的價值追求不同,搜索量與票房之間的相關性對于商業(yè)預測來說已經(jīng)很有意義,但對學術研究來說還缺少理論深度。當然,相關性常常隱含因果關系,如“搜索量”可以理解為“關注度高”,關注度與購票行為之間存在因果關系。尤其是具有準確預測力的相關性,更有可能隱藏某些深層次的因果關系。此外,一些學者質(zhì)疑大數(shù)據(jù)樣本的代表性,指出大數(shù)據(jù)的“全樣本”不等同于人口普查中的“總體”,其代表性和可信度存在嚴重問題。[19]筆者認為,大數(shù)據(jù)雖不是傳統(tǒng)意義上的“總體”,但數(shù)據(jù)的代表性和可信度并非不可解決的問題。首先,不是所有的研究都需要對社會全體公眾進行分析,很多研究只需要采集某一事件、某一話題、某一平臺的全部數(shù)據(jù)進行分析 ;其次,隨著網(wǎng)絡普及率和使用程度的提升,互聯(lián)網(wǎng)大數(shù)據(jù)的現(xiàn)實意義和理論價值將不斷提升 ;再者,大數(shù)據(jù)的樣本規(guī)模大,一定比例的個體信息噪音不會影響總體結果,且通過數(shù)據(jù)抓取關鍵詞的精準設置、算法優(yōu)化及數(shù)據(jù)清洗,可以大大提高信效度。此外,多維度的信息匹配可以增加精確性。
龐大的數(shù)據(jù)規(guī)模和非結構化的數(shù)據(jù)類型已經(jīng)遠遠超過人工分析能力,傳統(tǒng)的統(tǒng)計分析工具和人工編碼方式顯得捉襟見肘。而過去 10 年里,計算科學和工程學已經(jīng)發(fā)展出一系列算法來自動處理大規(guī)模數(shù)據(jù),這些方法正在被本學科的大數(shù)據(jù)實證研究所吸納。[20]正如帕克所言,大數(shù)據(jù)運動通常和大規(guī)模社會網(wǎng)絡分析、自動化的數(shù)據(jù)挖掘、可視化的數(shù)據(jù)集呈現(xiàn)、計算機輔助內(nèi)容分析相聯(lián)系。[21]筆者將根據(jù)國內(nèi)外大數(shù)據(jù)實證研究和大數(shù)據(jù)方法探討的相關文獻,梳理新聞傳播研究領域常用的大數(shù)據(jù)分析方法。
第一類是基于詞典的文本分析工具(Dictionary-Based Text Analysis),是當前社會科學研究領域中最為流行、便捷的計算機輔助內(nèi)容分析方法,可以根據(jù)詞典中關鍵詞所屬類別自動對文本內(nèi)容進行編碼。[22]國外常用的分析工具有 LIWC(語言查詢和詞匯統(tǒng)計)、WordStat(詞匯統(tǒng)計)、IAT(內(nèi)隱聯(lián)想測驗)、SentiStrength(情感傾向分析)、General Inquirer(通用查詢)、 Opinion Finder(意見發(fā)覺者)、GPOMS(Google-Profile of MoodStates 谷歌情緒記錄畫像)等,可用于在線文本的議題分析、情感分析、語言風格分析等。例如,康威等學者采用WordStat 對推文中的傳播議題進行內(nèi)容編碼;[23]默西等學者借助 IAT 對推文的語言風格進行自動編碼 ;[24]由彭尼貝克教授開發(fā)的LIWC 可以對文本中的認知、情緒等 64 項基礎指標進行編碼,且有中文版 C-LIWC。詞典、詞表是該類分析工具的核心,研究者經(jīng)常根據(jù)具體的分析文本進行更新,有時還根據(jù)研究目的創(chuàng)建新的詞典。例如,Guo(郭氏)等人對美國總統(tǒng)競選期間提及“奧巴馬”或“羅姆尼”的推文議題進行編碼時,首先根據(jù)已有研究成果和部分推文的人工內(nèi)容編碼確立 16 個議題,接著由編碼員精練設定每個議題的關鍵詞清單,然后根據(jù)關鍵詞清單來識別每一條推文是否包括一些或所有的議題,最后分別計算提及“奧巴馬”和“羅姆尼”的議題比例。[25]
第二類是機器學習(machine learning),包括無監(jiān)督的機器學習和有監(jiān)督的機器學習,是基于數(shù)據(jù)經(jīng)驗來識別提取數(shù)據(jù)類型、做出決策的算法。從本質(zhì)上說,無監(jiān)督的機器學習算法是試圖識別數(shù)據(jù)中“隱藏的結構”,最常用的工具是 “潛在話題分析算法”(LDA)。有學者通過實證研究的方式,比較了基于詞典的分析工具和 LDA 無監(jiān)督機器學習兩種計算機輔助內(nèi)容分析方法的信效度,其研究發(fā)現(xiàn)后者的信效度更高。[26]有監(jiān)督的機器學習能在監(jiān)督訓練過程中判別分類正確與否,常見的操作流程是 :先由人工編碼一定規(guī)模的樣本作為機器學習的范例,對人工編碼結果進行信效度檢驗后再訓練機器學習模型對文本進行自動分類。例如,一些研究者在訓練算法對推特文本進行情感分析時,先讓10個訓練有素的編碼員對 248 條推文樣本進行人工編碼,分為樂觀、悲觀、中立三類,檢驗信效度后再監(jiān)督機器準確分類。[27]也有的是根據(jù)數(shù)據(jù)庫中的大量樣本作為機器學習范例,比如科萊奧尼等人選用了 59,757 條政治新聞標題和 166,337 條非政治新聞標題作為機器學習判別推特內(nèi)容政治性的范例。[28]
第三類是復雜社會網(wǎng)絡分析,常用的分析工具有 Ucinet、Gephi、Pejak。復雜性主要表現(xiàn)為結構復雜、節(jié)點數(shù)目巨大、節(jié)點和鏈接會隨著時間變化而產(chǎn)生或消失。就分析工具本身而言,Ucinet 是目前社會網(wǎng)絡分析中使用最廣的軟件,但其上限只能處理 3 萬多個數(shù)據(jù)點,而 Gephi、Pajek 的數(shù)據(jù)處理能力能達到百萬級;Gephi 的可視化效果最好,Pejak 便于輸出統(tǒng)計圖表。在大數(shù)據(jù)實證研究中,社會網(wǎng)絡分析常用于傳播者之間的關系、傳播議題之間的關系分析。譬如,有研究基于推特上的民主黨用戶、共和黨用戶、民主黨官方賬號、共和黨官方賬號之間的社交關系網(wǎng)絡分析,以此計算不同黨派推特用戶的政治同質(zhì)化程度。[29]瓦戈等學者在研究網(wǎng)絡議程設置時,對推特上每天同時出現(xiàn)的議題進行網(wǎng)絡分析。[30]筆者認為,復雜社會網(wǎng)絡分析還可以清晰勾勒網(wǎng)絡傳播圖譜和識別網(wǎng)絡意見領袖,在新聞傳播領域的大數(shù)據(jù)實證研究中將越發(fā)受到重視。
從本質(zhì)上說,大數(shù)據(jù)分析工具的使用是為了將非結構的大數(shù)據(jù)轉(zhuǎn)化為結構化的小數(shù)據(jù)。在大數(shù)據(jù)實證研究中,一些研究者先通過機器學習等方式獲得結構化編碼數(shù)據(jù)后,再使用時間序列分析、t 檢驗等傳統(tǒng)社會科學統(tǒng)計方法進行分析。此外,網(wǎng)絡大數(shù)據(jù)同樣包含了新聞傳播研究所需要的大量結構化數(shù)據(jù),如網(wǎng)頁訪問量、微博轉(zhuǎn)發(fā)量、微博評論量、微信閱讀量、點贊量、粉絲數(shù)等。這些數(shù)據(jù)的統(tǒng)計相對簡單,但也可作為受眾需求和傳播效果分析的重要指標,可以借助傳統(tǒng)的 spss、excel 等統(tǒng)計分析軟件即可。
一般而言,學術研究包括理論研究、應用研究和歷史研究三個方面。在大數(shù)據(jù)語境下,新聞傳播實踐會發(fā)生哪些變化?一些研究者以實務為導向,探討了大數(shù)據(jù)對新聞生產(chǎn)、廣告營銷的影響。
受大數(shù)據(jù)思潮影響,國內(nèi)外學者都高度重視和普遍看好數(shù)據(jù)新聞的發(fā)展趨勢和前景。正如劉義昆、彭蘭等學者指出,數(shù)據(jù)新聞是新聞界在大數(shù)據(jù)時代應對時代變遷的重要舉措,是新聞業(yè)未來的發(fā)展趨勢,大數(shù)據(jù)技術正在對今天的新聞業(yè)形成沖擊,主要體現(xiàn)在大數(shù)據(jù)技術將滲透到新聞生產(chǎn)的核心環(huán)節(jié)、重樹新聞質(zhì)量標桿、提升受眾反饋等。[31][32]從發(fā)表情況來看,張帆和吳俊對 2011 -2015 年英美大數(shù)據(jù)新聞研究的 29 篇文獻進行梳理,其研究發(fā)現(xiàn)國外學者的研究議題集中在“新聞生產(chǎn)流程、報道內(nèi)容、數(shù)據(jù)素養(yǎng)和倫理道德” 四個方面。[33]國內(nèi)學者除了引介和評述國外相關研究成果外,還對大數(shù)據(jù)時代的數(shù)據(jù)新聞生產(chǎn)、數(shù)據(jù)新聞案例、可視化傳播路徑以及大數(shù)據(jù)與新聞理念創(chuàng)新等進行研究。
許多學者認為,大數(shù)據(jù)將重構新聞生產(chǎn)流程與傳播形態(tài)。國內(nèi)學者指出,大數(shù)據(jù)技術將滲透到新聞生產(chǎn)的核心環(huán)節(jié),包括新聞線索的發(fā)現(xiàn)、信息采集、對新聞稿件的篩選等。[34]國外學者對數(shù)據(jù)新聞生產(chǎn)流程的研究主要集中在數(shù)據(jù)采集、數(shù)據(jù)處理和數(shù)據(jù)可視化三個方面,數(shù)據(jù)的主要來源有政府機構、非政府機構、社交媒體等,但也受到數(shù)據(jù)保護法的諸多限制。[35]從新聞形態(tài)來看,數(shù)據(jù)新聞改變了以文字為中心的傳統(tǒng)新聞敘事方式,數(shù)據(jù)新聞的可視化呈現(xiàn)日益受到業(yè)界重視。劉義昆歸納了數(shù)據(jù)新聞可視化呈現(xiàn)的主要方式,包括信息圖、動態(tài)地圖、靜態(tài)地圖、曲線圖或圖表、HTML5(超文本標記語言)等,指出目前國內(nèi)新聞媒體使用最多的是靜態(tài)信息圖,而國外數(shù)據(jù)新聞報道相對更多使用交互性動態(tài)圖表形式。[36]
對于數(shù)據(jù)新聞的報道理念,學者們既有共識,也存在分歧。一般認為,數(shù)據(jù)驅(qū)動的調(diào)查性報道將重塑新聞報道標桿。如彭蘭指出,“與記者在某一個視野有限的觀察點上對事物進行的觀察與分析不同的是,有效加工的大規(guī)模數(shù)據(jù)可以揭示更大范圍內(nèi)的或更接近事實的情狀,從而也為報道的深入提供了基礎”。[37]錢進和周俊認為,“數(shù)據(jù)新聞與調(diào)查性新聞報道有著一定的相似,即強調(diào)通過對數(shù)據(jù)(對后者來說是事實)的分析來挖掘現(xiàn)象背后意義,這恰恰承載著新聞業(yè)在社會化媒體時代重塑其權威的期望”。[38]王斌也指出,數(shù)據(jù)驅(qū)動的調(diào)查性新聞給媒體帶來工作層面的一個躍遷,即從關注社會表層現(xiàn)實到發(fā)掘社會深層現(xiàn)實,這在一定程度提高了媒體對社會現(xiàn)象的把握能力、改進了客觀性的具體踐行方式。[39]
但學界對大數(shù)據(jù)新聞的“預測性”卻有著不同的見解。不少學者對大數(shù)據(jù)預測性新聞寄予厚望,認為“數(shù)據(jù)正變得越來越重要,這并不是因為數(shù)據(jù)的量大,而是我們擁有了工具和能力去分析數(shù)據(jù),找出模式、結構并揭示趨勢”。[40]有學者認為,目前媒體報道中關于某一事物走向的判斷主要來自于個別專家的分析,這種方法的局限性顯而易見,如果媒體能廣泛借助大數(shù)據(jù)技術來進行重大趨勢的預測與分析,其預測的準確程度及新聞的有用性可能得到有效提升。[41]但有些學者批判性地指出不要迷信數(shù)據(jù)權威和防范數(shù)據(jù)陷阱。如左艷紅強調(diào),大可不必將大數(shù)據(jù)過于神化,大數(shù)據(jù)質(zhì)量、新聞從業(yè)者的數(shù)據(jù)分析能力及價值判斷力等都會制約新聞內(nèi)容生產(chǎn),對數(shù)據(jù)產(chǎn)生誤讀。[42]羅弦梳理了網(wǎng)絡新聞生產(chǎn)中大數(shù)據(jù)運用的各類亂象,包括數(shù)據(jù)保護、數(shù)據(jù)殘缺與數(shù)據(jù)污染等,這些都會制約數(shù)據(jù)新聞的公信力。[43]
另一個爭議點是數(shù)據(jù)新聞的“敘事性”。王強指出,數(shù)據(jù)新聞正在僭越新聞的敘事價值,新聞生產(chǎn)正面臨著敘事危機。[44]丁柏銓同樣認為,數(shù)據(jù)新聞業(yè)并不擅長講生動的和有意味的故事,數(shù)據(jù)新聞在能顯示新聞價值的地方常常捉襟見肘,表現(xiàn)不了事實的復雜內(nèi)涵,如各種力量之間的暗中博弈或幕后交易。[45]常江等學者對央視“據(jù)說”系列報道的研究發(fā)現(xiàn),“盡管大數(shù)據(jù)技術在總體上提升了電視新聞的可觀賞性并直接帶來了收視率的提升,但數(shù)據(jù)呈現(xiàn)并未成為有機的新聞敘事元素”。[46]但有些學者卻認為,數(shù)據(jù)新聞雖缺少生動有趣的細節(jié),但在中觀、宏觀敘事上具有獨特的優(yōu)勢,可以彌補傳統(tǒng)新聞宏觀敘事的不足。[47]
大數(shù)據(jù)正在從數(shù)據(jù)和技術層面重構新的營銷體系,[48]廣告投放方式及產(chǎn)業(yè)鏈變革乃重要組成部分。大數(shù)據(jù)驅(qū)動的精準廣告投放主要通過目標消費者的精準定位、消費需求的精準挖掘、廣告投放的精準可控、廣告效果的精準評估 4 個方面來實現(xiàn)。[49]廣告的精準投放依賴于精準的受眾分析。大數(shù)據(jù)的出現(xiàn)為我們把握新媒體時代消費者屬性提供了一個全新的視角,分析結果具有預測性、評價性(受眾反饋與評價)和可視化等。[50]以海量、非結構化為特征的用戶及其行為軌跡的數(shù)據(jù),成為新媒體場域中擁有巨大廣告價值的特殊“資本”。[51]基于大數(shù)據(jù)的精準廣告不僅驅(qū)動廣告走向“精準”“可預測性”及“個性化”的新階段,而且還將從產(chǎn)業(yè)基礎、產(chǎn)業(yè)鏈條、產(chǎn)業(yè)業(yè)態(tài)、運作模式等維度重構未來廣告產(chǎn)業(yè)。例如數(shù)據(jù)和技術成為廣告業(yè)的核心要素,大量技術背景的廣告需求方平臺公司(DSP,Demand-Side Platform)、 廣 告 供 應 方 平 臺 公司(SSP,Supply-Side Platform)、數(shù)據(jù)管理公司已經(jīng)成為廣告產(chǎn)業(yè)的新型市場參與主體。[52]
基于大數(shù)據(jù)的受眾研究還將服務于媒體的內(nèi)容布局和盈利模式。楊迪雅、劉旸以美國視頻網(wǎng)站網(wǎng)飛(Netflix)為例,發(fā)現(xiàn)該網(wǎng)站記錄觀眾從登錄到結束的全部觀影過程,包括每一次點擊、播放、暫停次數(shù)、觀看時間等多維大數(shù)據(jù),分析結果可應用于排行榜單、指導購片、挑選劇集的演員和導演等。一個經(jīng)典案例是網(wǎng)飛通過大數(shù)據(jù)分析預先發(fā)現(xiàn)喜歡觀看 1990 版《紙牌屋》的影迷們同時喜歡看導演大衛(wèi)·芬奇(David Fincher)與奧斯卡影帝凱文·斯派恩(Kevin Spacey)的作品,因此新版紙牌屋邀請了二位加盟,播出后果然大獲成功。[53]
綜上所述,大數(shù)據(jù)正在從廣告?zhèn)鞑?、受眾分析、?nèi)容布局、盈利模式等維度建構全新的精準營銷體系。但也有一些學者對此提出質(zhì)疑。例如,富爾戈尼在《大數(shù)據(jù) :數(shù)字廣告的朋友,還是敵人》一文中指出,實時大數(shù)據(jù)是一把“雙刃劍”,為消費者、零售商和市場營銷人員提供了有效率的信息、新的能力和從未有過的機會,但傾向于培養(yǎng)短期決策的心態(tài),從長期來看會損害品牌資產(chǎn)。[54]
不少對大數(shù)據(jù)進行批判性思考的學者都喜歡引用克蘭茲貝格的觀點,即“技術既不是好的,也不是壞的,更不是中立的……技術發(fā)展對社會生態(tài)的影響常常超越技術設備和實踐本身”。[55]在眾多研究者憧憬和探索大數(shù)據(jù)應用的美好前景時,一些學者批判性地審視大數(shù)據(jù)可能引發(fā)的法律倫理風險,追問“大數(shù)據(jù)的使用是在幫助我們創(chuàng)造更好的工具、服務和公共產(chǎn)品,還是迎來新一波的侵犯隱私和侵入營銷浪潮?或者說是用于追蹤抗議和壓制言論的手段?大數(shù)據(jù)會提升對社會現(xiàn)象認知和傳播文化的研究,還是會限制對真相的認知或改變我們對研究的理解?大數(shù)據(jù)預測權威是賦予個體更多自主選擇權力,還是在干預個體自主性和社會現(xiàn)實?”等問題。[56][57]
田新玲和黃芝曉學者指出,“大數(shù)據(jù)時代,公共數(shù)據(jù)開放作為一種自由、平等、開放、協(xié)作的人類開源精神,卻在公共云端侵害了個人數(shù)據(jù)隱私權”。[58]尼爾從數(shù)據(jù)的采集、存儲、分享、使用四個方面,詳細分析了大數(shù)據(jù)對隱私、安全和消費者權益的消極影響。[59]
濫用大數(shù)據(jù)侵犯個人隱私的主體眾多。這種情況在商業(yè)領域更為濫用,谷歌、亞馬遜、臉書,中國的百度、阿里、騰訊等企業(yè)主導著全球的數(shù)據(jù),在大數(shù)據(jù)精準營銷、即刻分析、智能決策模式下,用戶的行為心理、興趣愛好等內(nèi)心領域被一一窺見。[60]邱林川發(fā)現(xiàn),中國的數(shù)據(jù)挖掘公司不需要像西方同行那樣聘請律師就可以獲取大量數(shù)據(jù),像百度這樣的公司在大數(shù)據(jù)抓取中扮演重要角色,他們將用戶的資料、活動和 UGC(用戶生產(chǎn)內(nèi)容)內(nèi)容轉(zhuǎn)化為公司資產(chǎn),盡管部分數(shù)據(jù)開放給了公眾,但真正的目的為了實現(xiàn)個性化的廣告推送和精準營銷。[61]
法律維權難度大。為保護個人數(shù)據(jù)隱私和信息安全,不少國家與地區(qū)頒布了“個人數(shù)據(jù)保護法”,將隱私權的邊界從“私密領域”擴展到“信息自主”“信息隱私”,并提出“被遺忘權”的概念。[62]但在實踐中,哪些信息屬于個人隱私、哪些信息可以公開、如何公開等問題頗具爭議,缺乏相應的道德標桿和精細化的法律準則,且大數(shù)據(jù)環(huán)境下搜索和濫用個人信息的主體眾多,渠道隱蔽,導致舉證難度極大,即便舉證成功,也很難保證勝算和評估損失。[63]例如,楊秀的研究發(fā)現(xiàn),《中國互聯(lián)網(wǎng)定向廣告用戶信息保護行業(yè)框架標準》雖將身份關聯(lián)信息作為隱私權保護的重點對象,但在文件中使用了“合理”“適當”“有效”等諸多表述模糊的詞語,且沿用了“告知—同意”這一國際上普遍的做法,難以落實用戶對個人信息的決定權。[64]
大數(shù)據(jù)引發(fā)了烏托邦與反烏托邦的話語:一方面被視為強大的工具,具有解決社會弊病的潛能,諸如癌癥研究、恐怖主義和氣候變化等;另一方面,大數(shù)據(jù)又被視為令人不安的“獨裁者”,諸如侵犯隱私、減少公民自由、增加國家和公司的控制能力等。[65]大數(shù)據(jù)對公民自由、社會公正的干預,主要體現(xiàn)在不同主體的數(shù)據(jù)獲取能力差異,大數(shù)據(jù)正在建構新的數(shù)據(jù)鴻溝和社會監(jiān)控體系。邱林川指出,到目前為止,大數(shù)據(jù)只是增加了有錢人和有權人獲取數(shù)據(jù)的能力,大數(shù)據(jù)私有化、商業(yè)化的倫理問題與資本主義的原始積累并無二致。斯諾登之類的事件表明,無論是民主國家還是非民主國家,政府總是以最快速、最便捷、最有策略的方式掌握數(shù)據(jù),用于監(jiān)控和社會控制,而互聯(lián)網(wǎng)用戶則不斷喪失自己對線上活動的控制權。[66]
另外,“國內(nèi)外新聞與傳播前沿問題跟蹤研究”課題組引介了 2014 年以來歐美學刊中關于大數(shù)據(jù)研究的 7 篇反思性文章,這些研究反思了大數(shù)據(jù)監(jiān)控的模式、后果和風險,指出我們將處在一個監(jiān)控無所不在的“傳感器社會”,應該反思權力、監(jiān)視、隱私、控制、社會分類等問題,有文章同樣提及了棱鏡事件美國政府對民眾數(shù)據(jù)的大規(guī)模監(jiān)視。[67]
近年來,大數(shù)據(jù)儼然成為社會各界追捧的熱點議題,業(yè)界、學界、政界共建“大數(shù)據(jù)變革神話”。在新聞傳播研究領域,理論驅(qū)動的大數(shù)據(jù)實證研究、數(shù)據(jù)驅(qū)動的研究范式創(chuàng)新、實務導向的大數(shù)據(jù)應用研究以及大數(shù)據(jù)引發(fā)的倫理風險研究成為本學科新的研究熱點,但總的來說還處于未成熟的初期階段。
已有的大數(shù)據(jù)實證研究為新聞傳播領域的研究范式創(chuàng)新提供了可供借鑒的范例和想象的空間。這些研究創(chuàng)新性地運用網(wǎng)絡大數(shù)據(jù),不僅突破了傳統(tǒng)數(shù)據(jù)采集方式和抽樣方法的局限性,豐富了政治傳播、健康傳播、跨文化傳播、風險傳播、組織傳播方面的研究成果,更重要的是引入了計算機輔助內(nèi)容分析、復雜社會網(wǎng)絡分析等大數(shù)據(jù)方法,拓展了傳播主體關系網(wǎng)絡、傳播內(nèi)容和公眾輿論、傳播信息流、傳播效果等領域的研究路徑,這對本學科的研究范式創(chuàng)新起到了示范性作用。但這些大數(shù)據(jù)實證研究也存在局限:一是分析變量單一,缺少控制變量 ;二是數(shù)據(jù)抓取的精準性和代表性、計算機輔助內(nèi)容分析的信效度檢驗還有待進一步提升 ;三是雖有理論對話,但多用于檢驗和修正已有的經(jīng)典理論,在理論創(chuàng)新方面仍顯不足。因此,未來的大數(shù)據(jù)實證研究應進一步重視數(shù)據(jù)的代表性和純凈性、優(yōu)化計算機輔助分析的詞典和算法,以及充分發(fā)揮大數(shù)據(jù)方法在傳播關系研究和傳播過程信息流研究中的優(yōu)勢。
大數(shù)據(jù)實證研究鮮有發(fā)表在國內(nèi)期刊上,國內(nèi)的大數(shù)據(jù)研究熱潮目前還是“虛熱”狀態(tài),還處在為大數(shù)據(jù)背書和想象大數(shù)據(jù)應用的初期階段。為何國內(nèi)學者少有應用大數(shù)據(jù)來創(chuàng)新研究路徑?最大的困難在于大數(shù)據(jù)方法的掌握和運用,一是如何從海量的網(wǎng)絡數(shù)據(jù)中抽取有價值的傳播信息,二是如何對大規(guī)模的非結構化大數(shù)據(jù)進行統(tǒng)計分析。由此,本文綜述了學界有關大數(shù)據(jù)思維的探討,并詳細歸納了目前社會科學研究中常用的大數(shù)據(jù)方法。在筆者看來,“用相關性取代因果關系”是商業(yè)邏輯對學術研究價值取向的誤導,網(wǎng)絡大數(shù)據(jù)雖非傳統(tǒng)意義上的總體,但處理得當依然具有很高的學術研究價值。從已有的實證研究來看,常用的大數(shù)據(jù)研究方法可以歸為三大類 :一是基于詞典的文本分析,如 LIWC(語言查詢和詞匯統(tǒng)計)、WordStat(詞匯統(tǒng)計)、IAT(內(nèi)隱聯(lián)想測驗)等;二是機器學習,包括無監(jiān)督的機器學習和有監(jiān)督的機器學習 ;三是社會網(wǎng)絡分析,常用的工具有Ucinet、Gephi、Pejak。
實務層面,學者們深刻意識到大數(shù)據(jù)資源和技術將重構新聞生產(chǎn)、營銷體系,尤其重視大數(shù)據(jù)時代數(shù)據(jù)新聞、精準營銷的發(fā)展。許多學者認為數(shù)據(jù)新聞是新聞界在大數(shù)據(jù)時代應對時代變遷的重要舉措,大數(shù)據(jù)技術將重構新聞生產(chǎn)流程和重塑深度報道標桿,但學界對大數(shù)據(jù)新聞的“預測性”和“敘事性”卻存在不同的見解。在大數(shù)據(jù)與精準營銷的研究中,學者們認為大數(shù)據(jù)正在從受眾分析、廣告投放、內(nèi)容布局、盈利模式等維度建構新的精準營銷體系,但也有國外學者對大數(shù)據(jù)的商業(yè)應用邏輯提出質(zhì)疑,警示基于大數(shù)據(jù)的實時精準營銷傾向于培養(yǎng)短期決策心態(tài),長期來看會損害品牌資產(chǎn)。從已有的應用研究來看,學者們建構了許多大數(shù)據(jù)應用的神話,但普遍缺少實證材料,未來應該進一步實地考察新聞媒體、廣告公司、視頻網(wǎng)站等機構是如何采納大數(shù)據(jù)技術,以及新聞傳播從業(yè)者人才如何適應大數(shù)據(jù)時代的變革。
和所有新傳播技術的興起一樣,大數(shù)據(jù)同樣引發(fā)了烏托邦和反烏托邦的話語修辭,一方面被視為創(chuàng)新研究范式、重構新聞生產(chǎn)和營銷傳播體系的強大工具,另一方面也引起一些學者對大數(shù)據(jù)運用可能引發(fā)的法律倫理問題進行批判與反思。由此,已有研究在“變革”與“反思”的雙重語境下展開,憧憬“變革”的話語占據(jù)主導地位,“重構”“變革”“激蕩”“革命”“改變”“范式創(chuàng)新”等詞匯高頻率出現(xiàn)在論文標題中,而有關大數(shù)據(jù)的反思性研究國內(nèi)外都比較少。從已有研究來看,學者們主要擔憂大數(shù)據(jù)應用侵犯個人隱私和信息安全、干預公民自由和社會公平、數(shù)據(jù)殘缺污染導致認知陷阱等。如何規(guī)避和化解大數(shù)據(jù)運用的倫理風險,特別是如何平衡數(shù)據(jù)開放與個人隱私、數(shù)據(jù)權威與數(shù)據(jù)陷阱、數(shù)據(jù)鴻溝與社會公平、數(shù)據(jù)服務與個體自主、數(shù)據(jù)預測與社會現(xiàn)實等悖論關系將是未來的研究重點之一。
注釋 :
[1][21]Parks, M.R.Big Data in CommunicationResearch: Its Contents and Discontents[J].Journal ofCommunication, 2014(64)
[2][28][29]Colleoni,E.,Rozza A., & Arvidsson, A.Echo Chamber or Public Sphere? Predicting PoliticalOrientation and Measuring Political Homophily in TwitterUsing Big Data[J].Journal of Communication,2014 (64)
[3]Freelon,D & Karpf,D. Of big birds and bayonets:hybrid Twitter interactivity in the 2012[J].Presidentialdebates,Information, Communication & Society, 2015(18)
[4]Graham,T & Wright,S. Discursive Equality and EverydayTalk Online: The Impact of “Super participants”[J].Journal of Computer-Mediated Communication, 2014(19)
[5][17]Park,J.,Baek,Y.M, & Cha,M. Cross-CulturalComparison of Nonverbal Cues in Emoticons on Twitter:Evidence from Big Data Analysis[J].Journal ofCommunication, 2014(64)
[6][16][24] Murthy,D., Bowman,S., Gross,A., & McGarry,M.Do We Tweet Differently From Our Mobile Devices? A Studyof Language Differences on Mobile and Web-Based TwitterPlatforms[J].Journal of Communication, 2015 (65)
[7]Jungherr,A.The Logic of Political Coverage onTwitter:Temporal Dynamics and Content[J].Journal ofCommunication,2014(64)
[8][27]Kim,J.,Brossard,D.,Scheufele,D.A., &Xenos,M.“Shared”Information in the Age of Big Data:Exploring Sentiment Expression Related to NuclearEnergy on Twitter[J].Journalism & Mass CommunicationQuarterly,2016(2)
[9][20][22][25][26]Guo,L., Vargo,C.J., Pan,Z., Ding,W.,&Ishwar,P. Big Social Data Analytics in Journalism andMass Communication: Comparing Dictionary-Based TextAnalysis and Unsupervised Topic Modeling[J].Journalism &Mass Communication Quarterly,2016,93(2)
[10][13]Neuman,W.R.,Guggenheim,L.,Jang,S.M., & Bae,S.Y.The Dynamics of Public Attention: Agenda-Setting TheoryMeets Big Data[J].Journal of Communication,2014(64)
[11][30]Vargo,C.L.,Guo, L.,McCombs,M., & Shaw,D.L.Network Issue Agendas on Twitter During the 2012 U.S.Presidential Election[J].Journal of Communication,2014(64)
[12]Emery,S.L.,Szczypka, G.,Abril,E.P., Kim,Y., &Vera,L.Are You Scared Yet? Evaluating Fear AppealMessages in Tweets About the Tips Campaign[J].Journal ofCommunication,2014(64)
[14][56][65]boyd d and Crawford K (2012) Critical questions forBig Data:provocations for a cultural,technological, andscholarly phenomenon[J].Information, Communication &Society,2015(5),20
[15]喻國明.大數(shù)據(jù)方法:新聞傳播理論與實踐的范式創(chuàng)新[J].新聞與寫作,2014(12)
[18][19]蘇林森,易偉芳.大數(shù)據(jù)技術對傳播研究方法的影響與挑戰(zhàn)[J].現(xiàn)代傳播,2014(11)
[23]Conway,B.A., Kenski,K., & Wang, D. The Rise ofTwitter in the Political Campaign: Searching forIntermedia Agenda-Setting Effects in the PresidentialPrimary[J].Journal of Computer-Mediated Communication,2015(20)
[31][36]劉義昆.大數(shù)據(jù)時代的數(shù)據(jù)新聞生產(chǎn):現(xiàn)狀、影響與反思[J].現(xiàn)代傳播,2014(11)
[32][34][37][41]彭蘭.“大數(shù)據(jù)”時代:新聞業(yè)面臨的新震蕩[J].編輯之友,2013(1)
[33][35]張帆,吳俊.2011-2015:大數(shù)據(jù)背景下英美數(shù)據(jù)新聞研究述評[J].國際新聞界,2016(1)
[38]錢進,周俊.從出現(xiàn)到擴散:社會實踐視角下的數(shù)據(jù)新聞[J].新聞記者,2015(2)
[39]王斌.大數(shù)據(jù)與新聞理念創(chuàng)新——以全球首屆“數(shù)據(jù)新聞獎”為例[J].編輯之友,2013(6)
[40]方潔,顏冬.全球視野下的“數(shù)據(jù)新聞”:理念與實踐[J].國際新聞界,2013(6)
[42]左艷紅.大數(shù)據(jù)對新聞內(nèi)容生產(chǎn)的局限[J].編輯之友,2014(8)
[43]羅弦.網(wǎng)絡新聞生產(chǎn)中大數(shù)據(jù)運用的倫理問題及編輯對策[J].科技與出版,2015(1)
[44]王強.“數(shù)據(jù)驅(qū)動”與“敘述驅(qū)動”:數(shù)據(jù)新聞生產(chǎn)的雙重動力[J].編輯之友,2015(3)
[45]丁柏銓.數(shù)據(jù)新聞:價值與局限[J].編輯之友,2014(7)
[46]常江,文家寶,劉詩瑤.電視數(shù)據(jù)新聞報道的探索與嘗試——以中央電視臺《晚間新聞》“據(jù)”說系列報道為例[J].新聞記者,2014(5)
[47]郎勁松,楊海.數(shù)據(jù)新聞:大數(shù)據(jù)時代新聞可視化傳播的創(chuàng)新路徑[J].現(xiàn)代傳播,2014(3)
[48]黃升民,劉珊.“大數(shù)據(jù)”背景下營銷體系的解構與重構[J].現(xiàn)代傳播,2012(11)
[49][51]倪寧,金韶.大數(shù)據(jù)時代的精準廣告及其傳播策略——基于場域理論視角[J].現(xiàn)代傳播,2014(2)
[50]聶磊.新媒體環(huán)境下大數(shù)據(jù)驅(qū)動的受眾分析與傳播策略[J].新聞大學,2014(2)
[52]鞠宏磊,黃琦翔,王宇婷.大數(shù)據(jù)精準廣告的產(chǎn)業(yè)重構效應研究[J].新聞與傳播研究,2015(8)
[53]楊迪雅,劉旸.以美國Netflix為例看大數(shù)據(jù)時代視頻網(wǎng)站內(nèi)容布局[J].現(xiàn)代傳播,2013(12)
[54]Fulgoni G.Big Data:Friend or Foe of DigitalAdvertising?Five Ways Marketers Should Use DigitalBig Data to Their Advantage[J].Journal of AdvertisingResearch, 2013, 53(4)
[55]Kranzberg,M.Technology and history: kranzberg’slaws[J].Technology and Culture, 1986,27(3)
[57][61][66] Qiu,J.L.Reflections on Big Data:“Justbecause it is accessible does not make it ethical”Media[J].Culture & Society, 2015, 37(7)
[58][60]田新玲,黃芝曉.“公共數(shù)據(jù)開放”與“個人隱私保護”的悖論[J].新聞大學,2014(6)
[59]Nir, K. Big data’s impact on privacy, security andconsumer welfare[J].Telecommunications Policy,2014,38(11):1134-1145
[62]周麗娜.大數(shù)據(jù)背景下的網(wǎng)絡隱私法律保護:搜索引擎、社交媒體與被遺忘權[J].國際新聞界,2015(8)
[63]劉小霞,陳秋月.大數(shù)據(jù)時代的網(wǎng)絡搜索與個人信息保護[J].現(xiàn)代傳播,2014(5)
[64]楊秀.大數(shù)據(jù)時代定向廣告中的個人信息保護——《中國互聯(lián)網(wǎng)定向廣告用戶信息保護行業(yè)框架標準》分析[J].國際新聞界,2015(5)
[67]“國內(nèi)外新聞與傳播前沿問題跟蹤研究”課題組.大數(shù)據(jù)實踐與硏究:批判性反思與研究推動[J].新聞與傳播研究,2015(8)