(黑龍江新媒體集團(tuán) 哈爾濱 150010)
根據(jù)The Media Briefing發(fā)布的《2017年傳媒生態(tài)報(bào)告》(The State of Media 2017),在30個(gè)國家的逾千名調(diào)查對(duì)象中,有67%的傳媒業(yè)高管對(duì)自己所有媒體持樂觀態(tài)度,縱觀傳媒的整體環(huán)境,有幾大特點(diǎn)值得關(guān)注,一是視頻成為媒體的投入重點(diǎn)。在中國,2017年網(wǎng)絡(luò)視頻用戶、移動(dòng)網(wǎng)絡(luò)視頻用戶持續(xù)增長,移動(dòng)互聯(lián)網(wǎng)成為觀眾觀看視聽內(nèi)容的首選。截至2017年6月,中國網(wǎng)絡(luò)視頻用戶數(shù)量達(dá)5.65億,較2016年底增長3.7%,其中手機(jī)視頻用戶規(guī)模為5.25億,與2016年底相比增長5.1%[1]。二是互聯(lián)網(wǎng)廣告已經(jīng)成為我國市場的主導(dǎo),根據(jù)艾瑞咨詢的數(shù)據(jù),2017年第一季度,我國網(wǎng)絡(luò)廣告季度市場規(guī)模為698.9億元,同比增長31.1%;第二季度為861.6億元,同比增長28.5%[2],即根據(jù)贊助商的需求量身打造并精準(zhǔn)推送的廣告內(nèi)容。三是互聯(lián)媒體已經(jīng)成為主導(dǎo),隨著大數(shù)據(jù)、人工智能、云計(jì)算等新技術(shù)的發(fā)展,興趣細(xì)分、個(gè)性推薦、內(nèi)容分發(fā)已經(jīng)成為眾多媒體的重要戰(zhàn)略方向,包括網(wǎng)易、今日頭條、搜狐、UC等都實(shí)現(xiàn)了基于算法的個(gè)性化、精準(zhǔn)化的分發(fā)方式。
“大數(shù)據(jù)”在物理、生物、環(huán)境生態(tài)、自動(dòng)控制等科學(xué)領(lǐng)域存在已久,但與新媒體的融合尚待挖掘,大數(shù)據(jù)技術(shù),從本質(zhì)上來說就是從類型各異、內(nèi)容龐大的數(shù)據(jù)中快速獲得有價(jià)值信息的技術(shù),而對(duì)于大數(shù)據(jù)所處理的兩種數(shù)據(jù)類型來說,非結(jié)構(gòu)化數(shù)據(jù)規(guī)模是結(jié)構(gòu)化數(shù)據(jù)的100倍以上,很顯然,非結(jié)構(gòu)化數(shù)據(jù)對(duì)新媒體的大數(shù)據(jù)應(yīng)用更具新價(jià)值,這些價(jià)值主要體現(xiàn)于幾個(gè)方面。一是語義價(jià)值,即非結(jié)構(gòu)化的語義理解,通過最大似然估計(jì)計(jì)算出各個(gè)符號(hào)的頻率分布[3],從越來越多的語音、圖像、視頻等非結(jié)構(gòu)化數(shù)據(jù)中挖掘出有價(jià)值信息的數(shù)據(jù),實(shí)現(xiàn)人工智能的培養(yǎng),最終的目標(biāo)是人工智能能夠理解并模仿人類的語言。二是社交價(jià)值,當(dāng)前的社會(huì)媒體形成了一個(gè)極為龐大而又錯(cuò)綜復(fù)雜的社會(huì)網(wǎng),“大數(shù)據(jù)推動(dòng)了傳媒行業(yè)的縱向垂直整合,用戶數(shù)據(jù)和客戶群成為整個(gè)產(chǎn)業(yè)鏈中最為重要的因素”[4],而非結(jié)構(gòu)化數(shù)據(jù)則是描繪了整個(gè)傳媒行業(yè)之內(nèi)用戶輪廓、客戶群輪廓的重要工具。三是決策價(jià)值,大數(shù)據(jù)在媒體中的運(yùn)作是尋找隱藏在數(shù)據(jù)中的模式、趨勢和相關(guān)性,包括“今日頭條”“網(wǎng)易新聞”等媒體客戶端都在利用非結(jié)構(gòu)化數(shù)據(jù)來進(jìn)行內(nèi)容分發(fā)。因此,對(duì)于新媒體的決策者來說,非結(jié)構(gòu)化數(shù)據(jù)正是根據(jù)各類趨勢進(jìn)行決策,進(jìn)而實(shí)現(xiàn)精準(zhǔn)行文、精準(zhǔn)投放及精準(zhǔn)營銷。
今天的大數(shù)據(jù)除了統(tǒng)計(jì)功能外,還包括了云計(jì)算、深度學(xué)習(xí)等先進(jìn)的技術(shù),大數(shù)據(jù)技術(shù)讓我們?cè)絹碓蕉嗟貜臄?shù)據(jù)中觀察到人類社會(huì)的復(fù)雜行為模式,不斷增加著我們的可用知識(shí),使人們有了傳統(tǒng)手段所無法比擬的分析能力,這也從幾個(gè)維度為新媒體帶來了前所未有的機(jī)遇。首先,是自媒體應(yīng)用的機(jī)遇,“自媒體和大數(shù)據(jù)在實(shí)際發(fā)展中都將受到‘相關(guān)性’的影響,這也促成了兩者直接的契合”[5]。微博、微信等自媒體平臺(tái)的廣泛應(yīng)用實(shí)現(xiàn)了“人人都是信息的傳播者”,根據(jù)《2017年中國自媒體從業(yè)人員生存狀況調(diào)查報(bào)告》顯示,2017年全國自媒體人數(shù)量為260萬人,其中有38.8%的自媒體人月收入超過5000元。其次,是挖掘潛在渠道的機(jī)遇,隨著新媒體時(shí)代傳播渠道的多樣化,定制化渠道及個(gè)性化需求將成為新媒體運(yùn)營者在細(xì)分市場的核心競爭力,包括了新舊媒體之間渠道的轉(zhuǎn)換及打通,這些都可以實(shí)現(xiàn)渠道的創(chuàng)新與受眾的觸達(dá)。第三,是大數(shù)據(jù)營銷的機(jī)遇,大數(shù)據(jù)營銷的核心是讓網(wǎng)絡(luò)廣告在合適的時(shí)間,通過合適的載體,以合適的方式,投放給合適的人。付安紅提出了相較于傳統(tǒng)營銷,新媒體營銷具有產(chǎn)品個(gè)性化定制、價(jià)格策略更加柔性化、增強(qiáng)企業(yè)與消費(fèi)者的交互性、提高“顧客讓渡價(jià)值”、節(jié)約營銷成本、提高營銷效率等優(yōu)點(diǎn)[6]。
大數(shù)據(jù)的發(fā)展為整個(gè)行業(yè)帶來了巨大的紅利,但同時(shí)也引發(fā)了一系列挑戰(zhàn)與難題。首先是算法瓶頸的挑戰(zhàn),一方面算法使新媒體的推送更加精準(zhǔn),觸達(dá)率更高;另一方面,2017年9月人民日?qǐng)?bào)連續(xù)三天發(fā)表評(píng)論文章,提出了以今日頭條為代表,單純依靠算法推薦的平臺(tái)存在價(jià)值觀缺失、制造信息繭房、競爭手段屢破底線三大問題,同時(shí)提出了“信息繭房”這一概念,主張算法主導(dǎo)下的內(nèi)容分發(fā)模式會(huì)產(chǎn)生“自我封閉”的危險(xiǎn)。其次是劣質(zhì)內(nèi)容挑戰(zhàn),新媒體被理解為“在獨(dú)立的私人空間內(nèi),向特定或不特定的個(gè)人和群體傳達(dá)和分享相關(guān)信息的新型媒體”[7],因此很多自媒體缺少傳統(tǒng)媒體所承擔(dān)的一些義務(wù)與束縛,比如未經(jīng)科學(xué)驗(yàn)證的健康知識(shí)、夸大其詞的廣告、只為博眼球的標(biāo)題黨、過于情緒化的觀點(diǎn)乃至毫無用處的信息,都時(shí)常出現(xiàn)在智能平臺(tái)首頁的推薦當(dāng)中。這些問題,也許最終還是要從大數(shù)據(jù)技術(shù)本身入手解決,需要開發(fā)出更先進(jìn)的技術(shù)和算法,采取“人機(jī)互補(bǔ)”的方式來加強(qiáng)新媒體的把關(guān)或管理。
數(shù)據(jù)化指一切內(nèi)容都通過量化的方法轉(zhuǎn)為數(shù)據(jù),而網(wǎng)絡(luò)則實(shí)現(xiàn)了數(shù)據(jù)的實(shí)時(shí)交換,人們可以從其中找出各個(gè)數(shù)據(jù)之間的關(guān)聯(lián)性,輔助自己的判斷以實(shí)現(xiàn)有效決策,對(duì)于媒體運(yùn)營來說,最有價(jià)值的數(shù)據(jù)包括了用戶數(shù)據(jù)(讀者數(shù)據(jù))、內(nèi)容數(shù)據(jù)與營銷數(shù)據(jù),大數(shù)據(jù)經(jīng)過收集、分類、聚類后所提供的信息可以幫助新媒體運(yùn)營者了解用戶需求、閱讀偏好及客戶細(xì)分,找出傳播的元素,分析讀者喜歡或反感某類或某篇內(nèi)容的原因,預(yù)測趨勢及用戶行為,實(shí)現(xiàn)媒體運(yùn)營者的精準(zhǔn)決策。
用戶畫像也即用戶標(biāo)簽化(User Labeling),它是現(xiàn)代媒體領(lǐng)域重要的研究方向之一,即通過用戶性別年齡、興趣愛好、閱讀習(xí)慣等的分析,實(shí)現(xiàn)個(gè)性化的推薦與精準(zhǔn)的營銷。而用戶畫像正是以大數(shù)據(jù)為基礎(chǔ)的,當(dāng)前所有的新媒體平臺(tái)幾乎都集成了用戶數(shù)字化蹤跡的記錄功能,而無論是范圍、效果還是效率都要遠(yuǎn)遠(yuǎn)高于傳統(tǒng)的調(diào)查問卷方式。該方式利用大數(shù)據(jù)建立SVM(Support Vector Ma?chine)向量權(quán)重模型,根據(jù)用戶的歷史數(shù)據(jù)建立起運(yùn)營者自己的網(wǎng)絡(luò)資源庫。
對(duì)于數(shù)據(jù)的呈現(xiàn),除了微信等平臺(tái)自帶的流量監(jiān)測之外,國內(nèi)很多公司已經(jīng)探索出了多種集群化、圖標(biāo)化的呈現(xiàn)模式,例如,“西瓜數(shù)據(jù)”提供全網(wǎng)優(yōu)質(zhì)公眾號(hào)查詢、監(jiān)控及診斷等功能,可以幫助運(yùn)營者迅速獲悉公眾號(hào)最新運(yùn)營數(shù)據(jù),實(shí)現(xiàn)公眾號(hào)運(yùn)營及廣告投放效果的監(jiān)控。可以查看地方公眾號(hào)排名并按22個(gè)垂直領(lǐng)域進(jìn)行細(xì)分,可以查看閱讀增長趨勢圖,點(diǎn)贊數(shù)、公眾號(hào)年齡分布、性別分布、發(fā)文習(xí)慣等等。同時(shí),大數(shù)據(jù)可以呈現(xiàn)網(wǎng)絡(luò)化的可視化分析結(jié)果,智能化實(shí)現(xiàn)包括用戶分析、圖文分析、競爭對(duì)手分析、活動(dòng)/媒體合作分析等多維度的分析關(guān)系并以直觀的形式展現(xiàn)出來。
隨著人工智能與深度學(xué)習(xí)算法的不斷發(fā)展,寫稿機(jī)器人已經(jīng)實(shí)現(xiàn)了第一時(shí)間自動(dòng)生成稿件,瞬時(shí)輸出分析和研判的功能。早在2009年美國職業(yè)棒球大聯(lián)盟的季后賽上,一款名為StatsMondey的人工軟件就已經(jīng)成為了新聞撰稿人,而且已經(jīng)達(dá)到30秒內(nèi)即可生成一篇新聞稿件的“極速效率”。在國內(nèi),騰訊開發(fā)的Dreamwriter自動(dòng)化新聞寫作機(jī)器人實(shí)現(xiàn)了內(nèi)容的編輯;里約奧運(yùn)會(huì)期間,今日頭條研發(fā)的寫稿機(jī)器人張小明,16天撰寫了450多篇體育新聞,并以和直播同步的速度發(fā)布;第一財(cái)經(jīng)的“DT稿王”,1900篇/天的產(chǎn)出速度,相當(dāng)于同時(shí)100位資深證券編輯1個(gè)小時(shí)的產(chǎn)量。盡管在涉及思維、情感、立場、判斷、文化、藝術(shù)等方面,當(dāng)前的人工智能仍然與人類存在著較大的差距,但可以預(yù)見的是,大數(shù)據(jù)和人工智能技術(shù)是機(jī)器人寫稿的技術(shù)基礎(chǔ)。尤其是隨著大數(shù)據(jù)技術(shù)的發(fā)展,機(jī)器人寫稿能力會(huì)越來越強(qiáng)。[8]
在大數(shù)據(jù)時(shí)代,任何行業(yè)都無法與數(shù)據(jù)完全“割裂”,在“冷冰冰”的數(shù)據(jù)背后存在的卻是人口統(tǒng)計(jì)信息、興趣、偏好各不相同的讀者、觀眾與網(wǎng)友,但如何用這些數(shù)據(jù)來產(chǎn)生“有態(tài)度”的內(nèi)容,實(shí)現(xiàn)“有溫度”的營銷,創(chuàng)造“有深度”的產(chǎn)品,仍然需要人的努力。本文在研究大數(shù)據(jù)在新媒體傳播中的運(yùn)用的過程中,不僅對(duì)新媒體傳播與大數(shù)據(jù)發(fā)展的現(xiàn)狀進(jìn)行了分析,探討了其在社會(huì)中的應(yīng)用,更提出了具體的策略,筆者也希望在該領(lǐng)域能夠有更多的實(shí)例研究,深入到大數(shù)據(jù)的算法及從社會(huì)科學(xué)的框架加以探討,同時(shí),對(duì)新媒體領(lǐng)域大數(shù)據(jù)研究應(yīng)緊跟其它領(lǐng)域的形勢,為新媒體運(yùn)營者提供更多的技術(shù)手段與思路。