□文│白燕燕 董二林
(作者單位:渤海大學(xué)文學(xué)院)
大數(shù)據(jù)環(huán)境下的數(shù)字閱讀體現(xiàn)了一種基于數(shù)據(jù)思維和數(shù)據(jù)邏輯的思維方式,在這種思維方式的幫助下人們開始重新認(rèn)識閱讀的邏輯規(guī)律。在傳統(tǒng)紙媒閱讀時代,閱讀的邏輯規(guī)律是圖書出版發(fā)行機構(gòu)規(guī)劃選題、出版印發(fā),讀者再從已發(fā)售的圖書中選擇自己想要閱讀的內(nèi)容。而大數(shù)據(jù)環(huán)境下的數(shù)字閱讀蘊含著對閱讀規(guī)律的重新界定,數(shù)字閱讀的出版發(fā)行規(guī)律與傳統(tǒng)紙媒時代的發(fā)行規(guī)律正好是逆向的,數(shù)字閱讀出版發(fā)行機構(gòu)可以根據(jù)讀者的閱讀需求來確定發(fā)行閱讀資源,這種按需分配的發(fā)行策略,能夠有效地杜絕資源浪費。
大數(shù)據(jù)就像一個神奇的鉆石礦,當(dāng)它的首要價值被發(fā)掘后仍然不斷給予。它的真實價值就像漂浮在海洋上的冰山,第一眼看到的是冰山的一角,而絕大部分都隱藏在表面之下。[1]大數(shù)據(jù)對數(shù)字閱讀產(chǎn)生的影響可以從以下幾個方面進(jìn)行解讀。但我們有理由相信在不久的將來會有更多更有價值的作用被挖掘出來。
在大數(shù)據(jù)思維的攪動下,人們漸漸開始轉(zhuǎn)變數(shù)字閱讀領(lǐng)域的思維觀念。數(shù)字閱讀并不等于閱讀的數(shù)字化,它將是一場深刻的閱讀革命。大數(shù)據(jù)環(huán)境下的數(shù)字閱讀轉(zhuǎn)變了我們的閱讀理念,在傳統(tǒng)的紙媒時代,閱讀處于一種“人找信息”的狀態(tài)。傳統(tǒng)的書店、圖書館都具有典型的“人找信息”特質(zhì),人們在海量的圖書中翻閱自己感興趣的閱讀資源,在廣泛涉獵的同時也耗費了大量的時間與精力。在互聯(lián)網(wǎng)高速發(fā)展的今天,人們依然熱衷于用各種搜索引擎在海量的網(wǎng)絡(luò)信息中檢索自己想要的資源。當(dāng)然,網(wǎng)絡(luò)時代這種近乎精準(zhǔn)的檢索相比紙媒時代瀏覽式的查找已經(jīng)具有了相當(dāng)大的進(jìn)步。
數(shù)字時代的到來促使人們每天都在產(chǎn)生數(shù)據(jù),只要你使用任何可以與互聯(lián)網(wǎng)連接的電子設(shè)備就會留下數(shù)據(jù),用戶的每一次點擊、轉(zhuǎn)發(fā)、收藏、評論、上拉、下滑的網(wǎng)絡(luò)活動都會生成數(shù)據(jù)。這些數(shù)據(jù)記錄了個人喜好、閱讀傾向、行為特點等非常個人化的行為數(shù)據(jù),通過對這些數(shù)據(jù)的整合分析就能夠?qū)τ脩暨M(jìn)行綜合的評價,分析系統(tǒng)可以根據(jù)以往的閱讀情況推送用戶感興趣的相關(guān)閱讀資源。大數(shù)據(jù)環(huán)境下數(shù)字閱讀已經(jīng)實現(xiàn)了從“人找信息”到“信息找人”的逆轉(zhuǎn)。
在傳統(tǒng)紙媒閱讀時代,出版社想要了解讀者的個人信息和閱讀情況往往只能采用抽樣調(diào)查的方式進(jìn)行市場調(diào)查分析,這種通過用小數(shù)據(jù)取樣調(diào)查分析的結(jié)果來判斷整體的方法往往受到相當(dāng)多的客觀因素的制約,結(jié)果的準(zhǔn)確性和精確度存在很大的爭議和誤差。而大數(shù)據(jù)環(huán)境下的數(shù)字閱讀所獲得的反饋數(shù)據(jù)都是由每一位讀者產(chǎn)生的,這些數(shù)據(jù)不但客觀、準(zhǔn)確,而且非常全面,所采集的數(shù)據(jù)就是所有讀者閱讀產(chǎn)生的數(shù)據(jù),這種從抽樣到總量的變化實現(xiàn)了樣本等于總量的突破。
樣本等于總量的優(yōu)勢是顯而易見的,計算機系統(tǒng)通過統(tǒng)計學(xué)、人工智能等方法,不但可以深入了解每個讀者的個性化信息,還能夠全面而豐富地監(jiān)測數(shù)字閱讀的總體趨勢和發(fā)展方向。大數(shù)據(jù)環(huán)境實現(xiàn)了數(shù)字閱讀從全方位到個性化的發(fā)展。
受大數(shù)據(jù)思維的影響,數(shù)字閱讀出版企業(yè)也在積極尋求內(nèi)部變革,一些數(shù)字出版企業(yè)已經(jīng)開始轉(zhuǎn)變思想,積極探索新的商業(yè)模式。目前備受行業(yè)內(nèi)廣泛關(guān)注的四種商業(yè)模式——自助出版模式、電子書借閱模式、單篇作品售賣模式和眾籌出版模式——就凸顯了作者與讀者的地位。同時,在數(shù)字閱讀內(nèi)容資源的研發(fā)與推廣過程中也在積極探索垂直整合、細(xì)分內(nèi)容和細(xì)分受眾等新型模式。大數(shù)據(jù)背景下的數(shù)字出版企業(yè)在注重內(nèi)容質(zhì)量的同時,也充分認(rèn)識到細(xì)分內(nèi)容和細(xì)分受眾的重要性。細(xì)分內(nèi)容有利于對內(nèi)容的歸類整理,細(xì)分受眾有利于對受眾進(jìn)行個性化服務(wù)。
我國數(shù)字閱讀資源總量巨大,但是用戶面對海量的數(shù)字閱讀資源如何選擇成了一個難度很大的問題,許多優(yōu)秀的數(shù)字閱讀資源未能得到有效地傳播。利用大數(shù)據(jù)的高效分析計算能夠有效的對用戶數(shù)據(jù)進(jìn)行分析,在細(xì)分受眾的基礎(chǔ)上有針對性地篩選數(shù)字閱讀資源,為用戶提供需要的內(nèi)容和服務(wù)。亞馬遜通過利用大數(shù)據(jù)成功實現(xiàn)優(yōu)化銷售的案例值得借鑒。亞馬遜通過對網(wǎng)絡(luò)銷售記錄的分析,將與讀者購買相似性的作品推薦給讀者,同時以電子郵件的形式進(jìn)行輔助推銷,并收集讀者的郵件瀏覽量和點擊率等指標(biāo)。在大數(shù)據(jù)的幫助下,亞馬遜的網(wǎng)絡(luò)圖書銷量有了大幅提升。
大數(shù)據(jù)對數(shù)字閱讀的影響才剛剛開始,但已經(jīng)引起了數(shù)字閱讀領(lǐng)域的深刻變革。隨著數(shù)字閱讀產(chǎn)業(yè)的發(fā)展,數(shù)據(jù)量的積聚必將推動數(shù)字閱讀產(chǎn)業(yè)的快速發(fā)展和進(jìn)一步的深刻變革。受到大數(shù)據(jù)在全領(lǐng)域范圍內(nèi)的啟示,目前我們可以大膽預(yù)測,大數(shù)據(jù)環(huán)境下數(shù)字閱讀將有如下幾個發(fā)展趨勢。
隨著數(shù)字閱讀與數(shù)字出版的不斷普及與發(fā)展,數(shù)字閱讀領(lǐng)域所積累的數(shù)據(jù)量會不斷增多,這些數(shù)據(jù)既包括了數(shù)字出版資源中作者、文章、書籍等基本的結(jié)構(gòu)化信息,又包含了出版內(nèi)容、版式和元數(shù)據(jù)等半結(jié)構(gòu)化信息,當(dāng)然也會包含圖像、視音頻等非結(jié)構(gòu)化信息;同時更會產(chǎn)生大量的讀者信息,其中既包括讀者通過搜索、瀏覽、點擊、閱讀、翻閱等過程留下的行為信息,又包括由機器生成的瀏覽量、瀏覽時間、頁面停留時間等設(shè)備反饋信息。通過對這些海量信息的統(tǒng)計分析能夠?qū)崿F(xiàn)對數(shù)字閱讀的全過程的量化管理。
在不久的將來,大數(shù)據(jù)的信息匯聚和分析管理將貫穿于數(shù)字閱讀領(lǐng)域的全流程。數(shù)字出版發(fā)行機構(gòu)完全可以通過大數(shù)據(jù)反饋信息確定需要發(fā)行什么內(nèi)容,甚至計算機系統(tǒng)可以根據(jù)大數(shù)據(jù)統(tǒng)計結(jié)果,在自己的海量存儲系統(tǒng)中自動生成數(shù)字閱讀資源。當(dāng)然,根據(jù)目前的算法和結(jié)構(gòu),我們還無法保證所生成內(nèi)容的科學(xué)性、合理性與可讀性,但是,我們有理由相信在大數(shù)據(jù)的驅(qū)動下人工智能技術(shù)會得到不斷的完善和長足的發(fā)展。大數(shù)據(jù)會為數(shù)字閱讀領(lǐng)域的發(fā)展帶來更多的支持與驚喜。
在大數(shù)據(jù)環(huán)境下各種數(shù)字閱讀資源增長迅速,知識的生產(chǎn)和更新速度更是呈指數(shù)形式增長。而數(shù)字閱讀資源面向的服務(wù)對象是廣泛的,不同類型的用戶有不同的需求,如何讓用戶在互聯(lián)網(wǎng)中獲得所需的知識體系,而不是一個知識點和相關(guān)知識點的堆砌,是當(dāng)下困擾數(shù)字閱讀發(fā)展的一個關(guān)鍵問題。隨著大數(shù)據(jù)環(huán)境的快速發(fā)展、技術(shù)的不斷成熟、算法的不斷改進(jìn),未來基于大數(shù)據(jù)的知識圖譜將得到不斷完善。知識圖譜是基于大數(shù)據(jù)環(huán)境的一個典型應(yīng)用,通過一系列的不同圖形以可視化方式描述資源,能夠顯示知識發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系。2012 年谷歌推出知識圖譜,根據(jù)用戶的搜索關(guān)鍵詞返回多種媒體樣式,多種知識點形成的知識關(guān)聯(lián)結(jié)果,用戶可以有效獲得基本信息的匯總,而不再是單一知識點。[2]近年來國內(nèi)的一些搜索引擎公司和科技公司也在積極探索以知識圖譜形式呈現(xiàn)信息的方式,相信在不久的將來,一個基于大數(shù)據(jù)環(huán)境的動態(tài)的高效的知識圖譜體系將會形成。
基于大數(shù)據(jù)的知識圖譜的建立和完善有利于改善數(shù)字閱讀“淺閱讀”的現(xiàn)狀。當(dāng)下的數(shù)字閱讀資源給讀者帶來的是資源相對過剩和優(yōu)質(zhì)資源匱乏的雙重困擾。和傳統(tǒng)的紙質(zhì)閱讀資源相比,數(shù)字閱讀資源極大豐富,尤其是近年來隨著移動互聯(lián)技術(shù)和智能終端技術(shù)的快速發(fā)展,各種面向手機媒體同時能夠?qū)崿F(xiàn)多屏共享的APP、公眾號等閱讀資源被源源不斷地創(chuàng)建、分享和推送出來。人們每天都要或主動或被動的接收大量的數(shù)字閱讀信息,這些令讀者眼花繚亂的“過?!辟Y源漸漸讓人產(chǎn)生了無所適從甚至是迷茫的感覺。學(xué)者們開始感嘆在如此豐富多彩的閱讀資源中卻很難找到能讓讀者靜下心來認(rèn)真、持續(xù)閱讀的資源。知識圖譜的建立有利于引導(dǎo)讀者建立整體的知識結(jié)構(gòu),系統(tǒng)地學(xué)習(xí)和閱讀,亦或能夠幫助讀者走出數(shù)字閱讀“淺閱讀”的誤區(qū)。
大數(shù)據(jù)環(huán)境下的多平臺聚合能夠?qū)崿F(xiàn)數(shù)字閱讀產(chǎn)業(yè)的快速發(fā)展。從數(shù)字閱讀的發(fā)展現(xiàn)狀來看,單一的媒體形式和媒體信息很難受到讀者的青睞,內(nèi)容資源應(yīng)該是同時兼顧互聯(lián)網(wǎng)、智能手機終端以及其他智能終端并同時收容圖文、視音頻等多媒體內(nèi)容才能夠更受讀者的持續(xù)關(guān)注。多平臺的聚合發(fā)展有利內(nèi)容資源的整合呈現(xiàn),提升數(shù)字閱讀質(zhì)量,增加企業(yè)的整體競爭力和抗風(fēng)險能力。
大數(shù)據(jù)環(huán)境下的多平臺聚合發(fā)展符合大數(shù)據(jù)的運營規(guī)律。從我國目前數(shù)字閱讀資源平臺來看,平臺種類繁多、數(shù)量巨大。根據(jù)艾媒咨詢(iiMedia Research)發(fā)布的《2016年APP與微信公眾號市場研究報告》顯示,2016年全球手機應(yīng)用軟件(APP)數(shù)量達(dá)到519.8萬個,較2015年增長19.1%。2016年中國微信公眾號數(shù)量超過1200萬個,再加上通訊運營商的閱讀平臺,各門戶網(wǎng)站、社交網(wǎng)站和數(shù)字出版企業(yè)的網(wǎng)絡(luò)平臺,等等,保守估計我國現(xiàn)有的數(shù)字閱讀資源平臺總量不少于2000萬個,這樣龐大的數(shù)字閱讀平臺數(shù)量,不但閱讀資源質(zhì)量難以保障,還拉低了用戶的閱讀興趣,更影響了數(shù)據(jù)采集的有效性。多平臺的聚合發(fā)展能夠?qū)⑵脚_間的優(yōu)勢資源有效整合起來,發(fā)揮各種優(yōu)勢,實現(xiàn)共贏的同時,也會為提高全民的數(shù)字化閱讀水準(zhǔn)做出貢獻(xiàn)。
從美國、英國等發(fā)達(dá)國家的大數(shù)據(jù)應(yīng)用與發(fā)展現(xiàn)狀來看,數(shù)據(jù)公開是一個必然趨勢,事實證明大數(shù)據(jù)的擁有者并不一定能夠有效利用這些大數(shù)據(jù),大部分?jǐn)?shù)據(jù)的價值都是潛在的,需要通過創(chuàng)新性分析來釋放,而大數(shù)據(jù)的擁有者由于受到專業(yè)素養(yǎng)和固有思維的制約很難從固有思維中跳躍出來。2008年美國總統(tǒng)奧巴馬在就職的第一天就發(fā)表了一份總統(tǒng)備忘錄,要求政府部門盡可能多的公布數(shù)據(jù)。[3]無獨有偶,英國政府也頒布了相關(guān)鼓勵信息公開的規(guī)定。近年來,我國也在積極鼓勵各級職能部門開放政府掌握的大數(shù)據(jù),深化大數(shù)據(jù)在各行各業(yè)的應(yīng)用,催生新業(yè)態(tài)和新模式。
數(shù)字閱讀領(lǐng)域的數(shù)據(jù)公開有利于擴(kuò)大統(tǒng)計分析總量范圍和總數(shù)據(jù)量,能夠有效提升統(tǒng)計分析結(jié)果的精準(zhǔn)度,更大范圍地了解讀者情況、閱讀情況和數(shù)字閱讀的發(fā)展趨勢,能夠促進(jìn)交叉學(xué)科的數(shù)據(jù)共享,能夠充分發(fā)揮具有數(shù)據(jù)挖掘能力的學(xué)者和科技公司挖掘數(shù)字閱讀這座寶藏的積極性和主動性,推動數(shù)字閱讀的不斷發(fā)展。
任何事物的發(fā)展都具有兩面性,大數(shù)據(jù)環(huán)境給數(shù)字閱讀帶來便利、機遇和挑戰(zhàn)的同時,也存在著一定的隱患:大數(shù)據(jù)環(huán)境下存在著一定的安全隱患,一些讀者的信息具有私密性,一旦數(shù)據(jù)丟失或者在數(shù)據(jù)共享過程中被不法分子利用,很可能會對讀者造成一定的損失;機器畢竟有它與生俱來的缺陷,任何算法和統(tǒng)計結(jié)果都可能有它不合理的地方,都需要人為地去干預(yù)和糾錯,從大數(shù)據(jù)統(tǒng)計出來的被熱捧的閱讀資源不一定具有正能量和推廣價值。在這個由大數(shù)據(jù)開啟的數(shù)字閱讀新時代的十字路口,我們要堅定信念,利用好大數(shù)據(jù)推動數(shù)字閱讀不斷發(fā)展。
注釋:
[1][3](英)邁爾-舍恩伯格,(英)庫克耶.大數(shù)據(jù)時代[M].杭州:浙江人民出版社,2013
[2]張博,喬歡,李武.基于大數(shù)據(jù)的出版內(nèi)容價值發(fā)現(xiàn)與應(yīng)用[J].出版發(fā)行研究,2014(3)