国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)在出版產(chǎn)業(yè)的實(shí)踐與展望

2014-08-11 23:56劉立玲張群力
出版廣角 2014年12期
關(guān)鍵詞:數(shù)字出版大數(shù)據(jù)技術(shù)數(shù)據(jù)分析

劉立玲 張群力

[摘要] 大數(shù)據(jù)技術(shù)背景下,思維和技術(shù)發(fā)生了巨大改變,數(shù)字出版則在同步感受著大數(shù)據(jù)的脈a搏。2013年大數(shù)據(jù)在數(shù)字出版產(chǎn)業(yè)中的應(yīng)用還處于起步階段,在2014年則進(jìn)入數(shù)字出版實(shí)用領(lǐng)域,實(shí)現(xiàn)了出版商由內(nèi)容提供商逐漸向綜合信息服務(wù)商轉(zhuǎn)型,數(shù)據(jù)資源整合和管理、多媒介融合,以及通過對(duì)用戶數(shù)據(jù)的挖掘提供內(nèi)容聚合服務(wù)、實(shí)現(xiàn)個(gè)性化信息定制服務(wù)、精準(zhǔn)策劃和精準(zhǔn)營銷等是大數(shù)據(jù)技術(shù)在出版業(yè)的主要應(yīng)用。

[關(guān)鍵詞]大數(shù)據(jù)技術(shù);數(shù)字出版;數(shù)據(jù)資源整合;數(shù)據(jù)分析

[作者簡(jiǎn)介]劉立玲,張群力,北京城市學(xué)院。

當(dāng)下,大數(shù)據(jù)的概念受到高度關(guān)注,已經(jīng)滲透多個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,逐漸成為重要的生產(chǎn)要素。但大數(shù)據(jù)在數(shù)字出版產(chǎn)業(yè)中的應(yīng)用還處于起步階段,或在2014年進(jìn)入數(shù)字出版實(shí)用領(lǐng)域。為了更好地實(shí)現(xiàn)大數(shù)據(jù)在數(shù)字出版領(lǐng)域的應(yīng)用,有必要首先了解大數(shù)據(jù)的特點(diǎn)及其在思維方面帶來的變革。

一、大數(shù)據(jù)時(shí)代的新思維、新技術(shù)

大數(shù)據(jù)指的是所涉及的資料規(guī)模巨大到無法通過傳統(tǒng)軟件工具,在合理時(shí)間內(nèi)擷取、管理、處理并整理成為幫助企業(yè)經(jīng)營決策的資訊。大數(shù)據(jù)是由數(shù)量巨大、結(jié)構(gòu)復(fù)雜、類型眾多數(shù)據(jù)構(gòu)成的數(shù)據(jù)集合,是基于云計(jì)算的數(shù)據(jù)處理與應(yīng)用模式,通過數(shù)據(jù)的整合共享,交叉復(fù)用形成的智力資源和知識(shí)服務(wù)能力。

大數(shù)據(jù)往往以數(shù)據(jù)流的形式實(shí)時(shí)快速地產(chǎn)生,其價(jià)值的高低隨著時(shí)空的變化而發(fā)生變化,海量數(shù)據(jù)在經(jīng)過精確分析后的確具有巨大的價(jià)值。在數(shù)字化時(shí)代,數(shù)據(jù)處理變得更加容易,更加快速,人們能夠在瞬間處理成千上萬的數(shù)據(jù)。大數(shù)據(jù)帶來了三個(gè)重大的思維轉(zhuǎn)變。

1. 要分析與某事物相關(guān)的所有數(shù)據(jù),而不是依靠分析少量的數(shù)據(jù)樣本

在信息處理能力受限的時(shí)代,需要數(shù)據(jù)分析,卻缺少用來分析所有數(shù)據(jù)的工具,因此隨機(jī)采樣應(yīng)運(yùn)而生。現(xiàn)在經(jīng)常會(huì)放棄樣本分析這條捷徑,而是收集全面完整的數(shù)據(jù),并對(duì)其進(jìn)行存儲(chǔ)、處理、分析。

大數(shù)據(jù)是建立在掌握所有數(shù)據(jù),至少是盡可能多的數(shù)據(jù)基礎(chǔ)上的,在任何細(xì)微的層面,都可以用大數(shù)據(jù)去論證新的假設(shè)。雖然在某些情況下,依然可以使用樣本分析法,但這不再是分析數(shù)據(jù)的主要方式。

2. 接受數(shù)據(jù)的紛繁復(fù)雜,而不再追求精確性

執(zhí)迷于精確性是信息缺乏時(shí)代和模擬時(shí)代的產(chǎn)物,只有5%的數(shù)據(jù)是結(jié)構(gòu)化且能適用于傳統(tǒng)數(shù)據(jù)庫的,如果不接受混亂,剩下95%的非結(jié)構(gòu)化數(shù)據(jù)都無法被利用。如今在信息時(shí)代,數(shù)據(jù)庫越來越全面,它包括與這些現(xiàn)象相關(guān)的大量甚至全部數(shù)據(jù),大數(shù)據(jù)不再需要精確性。

要想獲得大規(guī)模數(shù)據(jù)帶來的好處,混亂應(yīng)該是一種標(biāo)準(zhǔn)途徑。不精確已經(jīng)深入數(shù)據(jù)庫設(shè)計(jì)這個(gè)最不能容忍錯(cuò)誤的領(lǐng)域,在傳統(tǒng)的數(shù)據(jù)庫,索引是事先設(shè)定好的,限制了搜索,這種數(shù)據(jù)存儲(chǔ)和分析的方法越來越和現(xiàn)實(shí)相沖突,促成新的數(shù)據(jù)庫誕生,它們打破了關(guān)于記錄和預(yù)設(shè)場(chǎng)域的成規(guī),出現(xiàn)了非關(guān)系型數(shù)據(jù)庫。

相對(duì)依賴于小數(shù)據(jù)和精確性的時(shí)代,大數(shù)據(jù)因?yàn)楦鼜?qiáng)調(diào)數(shù)據(jù)的完整性和混雜性,所以更進(jìn)一步接近事實(shí)的真相。

3. 不再探求難以捉摸的因果關(guān)系,轉(zhuǎn)而關(guān)懷事物的相互關(guān)系

相互關(guān)系的核心是量化兩個(gè)數(shù)據(jù)值之間的數(shù)理關(guān)系,相關(guān)關(guān)系是指當(dāng)一個(gè)數(shù)據(jù)值增加時(shí),另一個(gè)數(shù)據(jù)值很有可能也會(huì)隨之增加。相互關(guān)系沒有絕對(duì),只有可能性,如果相關(guān)關(guān)系強(qiáng),一個(gè)相關(guān)鏈接成功的概率是很高的,如并非亞馬遜推薦的每本書都是顧客想買的,但是很多人書架上不少書都是因?yàn)閬嗰R遜推薦而購買的。

通過找到一個(gè)現(xiàn)象的良好關(guān)聯(lián)物,相關(guān)關(guān)系可以幫助我們捕捉現(xiàn)在和預(yù)測(cè)未來。大數(shù)據(jù)的相關(guān)關(guān)系分析法更準(zhǔn)確、更快,而且不易受偏見的影響,建立在相關(guān)關(guān)系分析法基礎(chǔ)上的預(yù)測(cè)是大數(shù)據(jù)的核心。

二、大數(shù)據(jù)背景下出版業(yè)的數(shù)據(jù)資源

1. 出版社的資源

出版社的資源是一個(gè)內(nèi)涵非常廣泛的概念,包括出版手段資源、出版范圍資源、作者資源、人力資源、市場(chǎng)資源等。整合管理出版社的資源對(duì)出版社來說具有重要意義。

2. 用戶生成內(nèi)容

網(wǎng)絡(luò)環(huán)境下,用戶生成內(nèi)容成為一種新興的網(wǎng)絡(luò)信息資源創(chuàng)作與組織模式。用戶生成內(nèi)容(User-Generated Content,簡(jiǎn)稱UGC),泛指以任何形式在網(wǎng)絡(luò)上發(fā)表的由用戶創(chuàng)作的文字、圖片、音頻、視頻等內(nèi)容。用戶通過微博、博客、視頻分享網(wǎng)站、SNS等社會(huì)化媒體發(fā)布的相關(guān)內(nèi)容。

大數(shù)據(jù)背景下,把用戶生成內(nèi)容的內(nèi)涵擴(kuò)展為用戶在網(wǎng)絡(luò)上登記和發(fā)表的內(nèi)容,以及相關(guān)行為產(chǎn)生的所有數(shù)據(jù),即用戶基本信息、發(fā)布內(nèi)容、用戶行為數(shù)據(jù)和關(guān)聯(lián)數(shù)據(jù)。用戶基本信息包括個(gè)人姓名、年齡、職業(yè)、區(qū)域等基本信息,以及注冊(cè)名稱、網(wǎng)站中的訂閱欄目等注冊(cè)信息;用戶發(fā)布內(nèi)容主要包括原創(chuàng)、轉(zhuǎn)發(fā)以及對(duì)應(yīng)的評(píng)論和回復(fù)等。用戶行為數(shù)據(jù)主要包括網(wǎng)絡(luò)瀏覽購買數(shù)據(jù)、閱讀過程和行為數(shù)據(jù)。用戶在生產(chǎn)內(nèi)容的過程中,會(huì)形成用戶和內(nèi)容之間的關(guān)聯(lián),用戶與用戶之間關(guān)聯(lián)以及內(nèi)容之間也會(huì)產(chǎn)生關(guān)聯(lián)。

通過對(duì)用戶生成內(nèi)容及其相互關(guān)系的深度挖掘和應(yīng)用,可以了解用戶的個(gè)體、群體特征,分析其閱讀興趣,也能進(jìn)一步獲得作品內(nèi)容特征、發(fā)布頻率和閱讀、傳播狀況等規(guī)律。挖掘和分析用戶生成內(nèi)容是進(jìn)一步探索用戶需求,充分發(fā)揮內(nèi)容價(jià)值,豐富出版模式的必然趨勢(shì)。

三、大數(shù)據(jù)在出版業(yè)的實(shí)踐與展望

大數(shù)據(jù)時(shí)代已經(jīng)到來,思維和技術(shù)發(fā)生了巨大改變,數(shù)字出版則在同步感受著大數(shù)據(jù)的脈搏。

1. 出版社數(shù)據(jù)資源整合和管理

大數(shù)據(jù)時(shí)代,隨著數(shù)據(jù)存儲(chǔ)、管理、分析技術(shù)的提高,為出版社整合管理數(shù)據(jù)資源提供了技術(shù)保證。

2. 多媒介融合

利用大數(shù)據(jù)技術(shù),進(jìn)一步推動(dòng)更為廣闊的傳媒版圖中的媒介融合和新媒體發(fā)展,使得包括數(shù)字出版、數(shù)字影視、數(shù)字音樂等傳媒領(lǐng)域因大數(shù)據(jù)趨勢(shì)而更為緊密地結(jié)合在一起。

2012年8月,美國學(xué)樂出版社(Sc

holastic Press)推出的“圖書+游戲”經(jīng)營模式取得成功。它推出的《無限環(huán)》系列,面向8~12歲的孩子,集合了圖書、互動(dòng)游戲和值得收藏的《歷史學(xué)家指導(dǎo)手冊(cè)》,這個(gè)系列通過多平臺(tái)進(jìn)行操作,圖書本身只是整個(gè)創(chuàng)作中的一部分。學(xué)樂出版社將圖書設(shè)計(jì)成與歷史相關(guān)的小道具來幫助玩家揭秘,通過透徹地閱讀圖書找到線索,根據(jù)提供的攻略地圖幫助玩家完成網(wǎng)上游戲。此外,這個(gè)系列的論壇受到孩子們的歡迎,通過這個(gè)論壇可以跟其他同齡人進(jìn)行互動(dòng),給學(xué)樂出版社提供了很有價(jià)值的信息反饋:如通過論壇上的留言板做一些調(diào)查和小測(cè)驗(yàn);發(fā)布有關(guān)作者的消息,讓小玩家和作者在一定時(shí)間內(nèi)互動(dòng),成為很有創(chuàng)意的社區(qū);同時(shí)可以通過這個(gè)平臺(tái)進(jìn)行其他的宣傳活動(dòng),推廣傳統(tǒng)書籍等。

3. 利用用戶生成內(nèi)容,提供內(nèi)容聚合服務(wù)

當(dāng)前代表性的聚合模式包括ZAKER資訊聚合與互動(dòng)分享閱讀應(yīng)用、Flipboard移動(dòng)閱讀應(yīng)用等。ZAKER是一款優(yōu)秀的資訊聚合與互動(dòng)分享閱讀應(yīng)用,擁有資訊、娛樂、科技、財(cái)經(jīng)、汽車、體育、本地新聞等十幾個(gè)板塊,上千條媒體、新媒體、自建頻道內(nèi)容資源。用戶可根據(jù)個(gè)人喜好訂閱相應(yīng)內(nèi)容,也可通過ZAKER智能推送功能獲取自己感興趣的信息。對(duì)于感興趣的內(nèi)容,用戶可以在ZAKER內(nèi)直接與好友分享互動(dòng),也可以通過微博、微信等社交平臺(tái)將圖文分享、收藏。Flipboard是一款免費(fèi)的應(yīng)用程序,靈感源于雜志的精致布局設(shè)計(jì),將Facebook和新浪微博等社交媒體上的內(nèi)容整合起來以雜志的形式呈現(xiàn)給用戶閱讀。如果用戶對(duì)一些特定話題感興趣,可以在搜索欄中鍵入該話題,程序會(huì)自動(dòng)將博客、微博、指定新聞源中與該關(guān)鍵詞有關(guān)的內(nèi)容聚合為雜志形態(tài),供用戶閱讀。

4. 挖掘用戶生成內(nèi)容,實(shí)現(xiàn)“精準(zhǔn)策劃”與“智能策劃”

“精準(zhǔn)策劃”是指通過對(duì)主流的閱讀平臺(tái)和電商平臺(tái)提供的記錄用戶行為(瀏覽記錄、購買記錄、發(fā)表的言論等)的海量數(shù)據(jù)進(jìn)行分析,篩選出當(dāng)前熱點(diǎn)議題作為備選選題,同時(shí)對(duì)其相關(guān)用戶的性別、年齡、職業(yè)、地理位置等信息進(jìn)行分析,以準(zhǔn)確定位目標(biāo)讀者群和測(cè)量市場(chǎng)容量的選題策劃方法。

大數(shù)據(jù)的核心功能之一就是預(yù)測(cè),當(dāng)數(shù)據(jù)聚合、分析功能向更智能化方向發(fā)展時(shí),基于內(nèi)容的選題策劃甚至?xí)跀?shù)據(jù)系統(tǒng)中自發(fā)形成,內(nèi)容從策劃到生產(chǎn)的階段更加自動(dòng)化、智能化。

京東圖書2014年3月19日發(fā)布其新品牌“京東出版”的首部圖書《大衛(wèi)·貝克漢姆》時(shí),京東集團(tuán)副總裁石濤表示,憑借大數(shù)據(jù)分析,根據(jù)消費(fèi)者需求進(jìn)行策劃和供給,為特定消費(fèi)群體“私人定制”相關(guān)圖書,在未來圖書出版市場(chǎng)將是一個(gè)方向。

5. 分析用戶生成內(nèi)容,實(shí)現(xiàn)“精準(zhǔn)營銷”和“精準(zhǔn)推送”

數(shù)據(jù)智能分析技術(shù)的不斷發(fā)展使得對(duì)個(gè)人和群體的實(shí)時(shí)觀察成為可能,這就為預(yù)測(cè)群體行為和了解個(gè)體偏好提供了強(qiáng)有力的工具。如果能充分挖掘大數(shù)據(jù)的深層次價(jià)值,就可以開發(fā)出更能滿足消費(fèi)者需求的新產(chǎn)品和新服務(wù),也能實(shí)現(xiàn)精確而個(gè)性化的廣告推送。

隨著數(shù)字出版的發(fā)展,閱讀轉(zhuǎn)變?yōu)槟撤N可以測(cè)量的半公開行為。如今,電子閱讀器不僅能夠顯示某些書吸引了多少購買者,還能揭示他們的閱讀強(qiáng)度。通過盡量多地采集數(shù)據(jù),盡量合理、及時(shí)優(yōu)化數(shù)據(jù)分析模型,得到相對(duì)準(zhǔn)確的預(yù)測(cè)。利用大數(shù)據(jù)進(jìn)行精準(zhǔn)營銷將會(huì)極大地提高數(shù)字出版企業(yè)的競(jìng)爭(zhēng)能力。

ZAKER作為流行的社會(huì)化閱讀平臺(tái),除提供高效、互動(dòng),有良好體驗(yàn)的閱讀服務(wù)外,還利用海量數(shù)據(jù)和特定算法創(chuàng)新廣告模式,它可以根據(jù)人們的居住地點(diǎn)、瀏覽偏好,挖掘出哪些產(chǎn)品更受到哪一類群體喜歡,從而將品牌廣告的投放范圍、時(shí)間和差異化的資訊結(jié)合起來。比如,喜歡“第一財(cái)經(jīng)周刊+GQ男士網(wǎng)+《世界國家地理》”的用戶,可能會(huì)更偏向于追求高質(zhì)量的生活方式,愛好旅游,關(guān)注奔馳、奧迪等高級(jí)汽車的新車型。

四、結(jié)語

大數(shù)據(jù)背景下,出版商將成為數(shù)據(jù)服務(wù)公司,讀者將成為用戶,出版商由內(nèi)容提供商逐漸向綜合信息服務(wù)商轉(zhuǎn)型。出版單位不再將發(fā)展數(shù)字出版僅僅停留在數(shù)字化內(nèi)容的提供上,而是開始從網(wǎng)絡(luò)經(jīng)濟(jì)的商業(yè)模式來建構(gòu)內(nèi)容產(chǎn)業(yè)。改變傳統(tǒng)出版以內(nèi)容銷售為目標(biāo)、“以產(chǎn)品為中心”的經(jīng)營模式,轉(zhuǎn)向數(shù)字出版以滿足用戶需求為目標(biāo)、“分析讀者信息進(jìn)行有效數(shù)據(jù)推送”的經(jīng)營模式。

[1] [英] 維克托·邁爾-舍恩伯格, 肯尼思·庫克耶. 大數(shù)據(jù)時(shí)代[M] . 盛楊燕,周濤譯.浙江:浙江人民出版社,2013(1).

[2] 劉鯤翔,杜麗娟,丁雪. 大數(shù)據(jù)技術(shù)在數(shù)字出版中的應(yīng)用前景展望[J] . 出版發(fā)行研究,2013(4).

[3] [德] 比約·布勞卿,拉斯·拉克,托馬斯·拉姆什. 大數(shù)據(jù)變革:讓客戶數(shù)據(jù)驅(qū)動(dòng)利潤奔跑[M] . 北京:機(jī)械工業(yè)出版社,2013(12).

[4] 郝振省,魏玉山,張立. 2012-2013[M] . 北京:中國書籍出版社,2013(7).

[5] 周志軍. 業(yè)界關(guān)注大數(shù)據(jù)時(shí)代出版業(yè)轉(zhuǎn)型[N] . 中國文化報(bào),2013-09-18.

[6]張博,任殿順. 大數(shù)據(jù)背景下UGC的價(jià)值研究和出版應(yīng)用[J] . 科技與出版,2014(3).

猜你喜歡
數(shù)字出版大數(shù)據(jù)技術(shù)數(shù)據(jù)分析
淺析大數(shù)據(jù)時(shí)代對(duì)企業(yè)營銷模式的影響
淺談新媒體在美術(shù)類圖書出版中的應(yīng)用
做一個(gè)全民閱讀時(shí)代的“悅”讀人
國際圖書出版市場(chǎng)現(xiàn)狀及趨勢(shì)分析