劉茂林 張小強(qiáng)
摘要:大數(shù)據(jù)分析正在改變出版企業(yè)的運(yùn)營方式,出版業(yè)對內(nèi)容的搜集、儲存與傳播方式也將因大數(shù)據(jù)分析的出現(xiàn)而發(fā)生深刻變化,大數(shù)據(jù)分析將促進(jìn)出版業(yè)深度信息化。
關(guān)鍵詞:大數(shù)據(jù);出版;數(shù)字出版
一、大數(shù)據(jù)分析的價值在于預(yù)測
大數(shù)據(jù)(big data),又稱巨量資料,一般指的是所涉及的資料信息量巨大到無法通過目前主流軟件工具在合理時間內(nèi)實(shí)施抓取、管理和處理的數(shù)據(jù)集合。大數(shù)據(jù)環(huán)境下,一批世界級的互聯(lián)網(wǎng)公司如亞馬遜等在大數(shù)據(jù)應(yīng)用上不斷推陳出新,電商、社交網(wǎng)站及智能搜索、網(wǎng)絡(luò)廣告等網(wǎng)絡(luò)服務(wù)也紛紛借助大數(shù)據(jù)分析提升應(yīng)用和服務(wù)能力。
大數(shù)據(jù)分析的核心技術(shù)是數(shù)據(jù)挖掘算法,最重要的應(yīng)用領(lǐng)域是預(yù)測性分析,從大數(shù)據(jù)中挖掘出特點(diǎn)并建立模型,再通過模型帶入新的數(shù)據(jù),從而預(yù)測未來的數(shù)據(jù)。近年來,大數(shù)據(jù)分析已經(jīng)滲透到諸多行業(yè),逐漸成為重要的生產(chǎn)因素。出版實(shí)質(zhì)上是一個搜集、選擇、加工、發(fā)布信息與知識供用戶使用的過程,大數(shù)據(jù)的出現(xiàn),對出版的各個環(huán)節(jié)都產(chǎn)生了重要影響。大數(shù)據(jù)分析的價值在于預(yù)測,通過海量數(shù)據(jù)的分析,提取有價值的數(shù)據(jù)關(guān)系,從而對選題分析、復(fù)制數(shù)量、銷售渠道和銷售行為提供幫助。大數(shù)據(jù)環(huán)境下,出版業(yè)是否轉(zhuǎn)型和如何轉(zhuǎn)型值得業(yè)界同仁深入思考。
二、大數(shù)據(jù)分析給出版業(yè)帶來新機(jī)遇
1.出版業(yè)的大數(shù)據(jù)
大數(shù)據(jù)的構(gòu)成基礎(chǔ)是“小”數(shù)據(jù)。單個出版社的數(shù)據(jù)信息,一般可分成兩類。一類包含出版社歷年的經(jīng)營數(shù)據(jù)即品種、出書碼洋、銷售碼洋、銷售實(shí)洋、回款、利潤等,以及作者數(shù)據(jù)、讀者數(shù)據(jù)、經(jīng)銷商數(shù)據(jù)等。這類數(shù)據(jù)一般是結(jié)構(gòu)化數(shù)據(jù),可以用數(shù)字或統(tǒng)一的結(jié)構(gòu)加以表示。另一類數(shù)據(jù)信息是出版內(nèi)容,包含以各種介質(zhì)發(fā)布的數(shù)字化出版內(nèi)容。這類數(shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù),無法用數(shù)字或統(tǒng)一的結(jié)構(gòu)表示。單個出版社的數(shù)據(jù)信息量,一般在TB級別,很少能到PB級別(1TB=1024GB,1PB=1024TB)。這些數(shù)據(jù)信息可以用企業(yè)ERP管理系統(tǒng)和內(nèi)容管理系統(tǒng)CMS加以管理,因而筆者稱其為“小”數(shù)據(jù)。
就整個出版行業(yè)而言,除了包含行業(yè)經(jīng)營數(shù)據(jù)和出版物內(nèi)容數(shù)據(jù)這種結(jié)果數(shù)據(jù)外,還包含交易數(shù)據(jù)、專家推薦和讀者評論信息這種過程數(shù)據(jù)。整個出版行業(yè)的數(shù)據(jù)信息量已經(jīng)非常巨大,達(dá)到EB甚至ZB級別(1EB=1024PB,1ZB=1024EB)。同時,據(jù)有關(guān)機(jī)構(gòu)分析,這些數(shù)據(jù)80%以上為非結(jié)構(gòu)化數(shù)據(jù),并且是快速增加的。整個出版行業(yè)的數(shù)據(jù)很難用一個或幾個軟件系統(tǒng)加以管理和分析,因而屬于典型的大數(shù)據(jù)。
2.大數(shù)據(jù)分析創(chuàng)新出版模式
大數(shù)據(jù)分析有利于提高出版經(jīng)營活動的績效,創(chuàng)新出版模式,促進(jìn)出版業(yè)的轉(zhuǎn)型升級,加快數(shù)字出版的發(fā)展。通過數(shù)字閱讀與交易平臺以及內(nèi)容數(shù)據(jù)庫、用戶信息數(shù)據(jù)庫和銷售信息數(shù)據(jù)庫,出版機(jī)構(gòu)能收集大量的用戶數(shù)據(jù),能夠更方便、更精準(zhǔn)地分析用戶內(nèi)容偏好和用戶購買行為,從而做出產(chǎn)品開發(fā)與銷售方面的合理預(yù)測和判斷。
在傳媒文化產(chǎn)業(yè)中,大數(shù)據(jù)分析帶來新的生產(chǎn)機(jī)制早有先例。比如出品方兼播放平臺Netflix的一部《紙牌屋》,讓全世界的文化產(chǎn)業(yè)界都意識到了大數(shù)據(jù)的力量。據(jù)統(tǒng)計(jì),2013年《紙牌屋》的數(shù)據(jù)庫包含了約3000萬用戶的收視選擇、400萬條評論、300萬次主題搜索。最終,拍什么、誰來拍、誰來演、怎么播,都由數(shù)千萬觀眾的喜好統(tǒng)計(jì)決定,每一步都由精準(zhǔn)的數(shù)據(jù)引導(dǎo),從而獲得了極高的收視率??梢哉f,這是部用大數(shù)據(jù)“算”出來的電視劇,實(shí)現(xiàn)了由用戶需求決定生產(chǎn)。
與此相似,出版業(yè)也產(chǎn)生了名為“粗剪”的出版模式。粗剪是出版商提供的一種服務(wù),這種服務(wù)讓讀者在圖書正式出版前就可以看到書稿的內(nèi)容。只要讀者購買了某一本書的粗剪服務(wù),他就可以獲取編輯正在編輯加工或作者正在修改的書稿,可以通過在線閱讀,或下載書稿的PDF文件,或按需打印書稿。通過對正在編撰或校對的書稿的閱讀,讀者可以提出對書稿的建議、評論或指出書稿中的錯誤。這樣讀者可以直接影響書稿正式出版后的內(nèi)容。出版商根據(jù)讀者反饋的數(shù)據(jù),不斷調(diào)整內(nèi)容,從而使得正式出版的產(chǎn)品獲得更廣泛的市場認(rèn)同。
出版機(jī)構(gòu)利用大數(shù)據(jù)分析進(jìn)行定制出版的例子還有美國Coliloquy公司。Coliloquy公司專注于亞馬遜Kindle平臺產(chǎn)品研發(fā),該公司推出了“動態(tài)小說”,讀者可以對小說人物和故事主線進(jìn)行選擇,編輯或作者再根據(jù)大量讀者對人物或情節(jié)的選擇數(shù)據(jù)調(diào)整小說的人物或情節(jié)發(fā)展,從而實(shí)現(xiàn)動態(tài)定制出版,定制內(nèi)容主要集中在愛情小說、科幻小說等類別,被稱為大數(shù)據(jù)背景下的“快銷書”。
三、大數(shù)據(jù)分析急需出版信息化
大數(shù)據(jù)分析最為重要的基礎(chǔ)是數(shù)據(jù),最重要的作用是預(yù)測。出版企業(yè)要通過大數(shù)據(jù)實(shí)現(xiàn)對選題的分析、媒體形態(tài)的選擇和實(shí)現(xiàn)精準(zhǔn)營銷,首先需要有企業(yè)自身的數(shù)據(jù)和整個行業(yè)的數(shù)據(jù)。換句話說,大數(shù)據(jù)分析要求出版企業(yè)和出版行業(yè)必須進(jìn)行深度的信息化。
1. 大數(shù)據(jù)分析要求出版企業(yè)深度信息化
首先出版企業(yè)內(nèi)部的管理數(shù)據(jù)、生產(chǎn)數(shù)據(jù)、銷售數(shù)據(jù)、作者數(shù)據(jù)、客商數(shù)據(jù)要有一套完整的管理信息系統(tǒng)進(jìn)行管理。目前一部分出版企業(yè)實(shí)施了ERP管理,把選題論證、庫房物流、營銷、財(cái)務(wù)等全部整合在一個平臺上,數(shù)據(jù)信息互通、共享。但仍有相當(dāng)多的出版企業(yè)在用多個系統(tǒng)管理各個生產(chǎn)環(huán)節(jié)和數(shù)據(jù),存在信息孤島,信息不能共享互通。
其次是出版企業(yè)要建立基于數(shù)字出版的軟硬件系統(tǒng)。新聞出版廣電總局、財(cái)政部《關(guān)于推動新聞出版業(yè)數(shù)字化轉(zhuǎn)型升級的指導(dǎo)意見》(新廣出發(fā)〔2014〕52號)明確支持傳統(tǒng)出版企業(yè)構(gòu)建和完善內(nèi)容資源數(shù)字化、版權(quán)資產(chǎn)管理等軟硬件系統(tǒng)。但目前只有極少數(shù)的出版企業(yè)具有完整的從數(shù)字內(nèi)容采集、加工、存儲管理到發(fā)布的平臺。
最后,還需要出版企業(yè)把管理流程和數(shù)字出版流程相結(jié)合,以數(shù)字環(huán)境下出版業(yè)務(wù)流程再造實(shí)現(xiàn)多形態(tài)出版業(yè)務(wù)流程的協(xié)同管理。當(dāng)然,由于出版企業(yè)財(cái)、物所限,需要逐步實(shí)施和完善上述系統(tǒng)來實(shí)現(xiàn)深度信息化。
2. 大數(shù)據(jù)分析要求出版行業(yè)深度信息化
出版業(yè)作為信息內(nèi)容產(chǎn)業(yè),目前已經(jīng)普遍利用信息處理技術(shù)、計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)來進(jìn)行生產(chǎn)加工、行政管理和提供服務(wù)。但新聞出版行業(yè)的信息化還落后于金融、電信甚至制造業(yè),目前還沒有達(dá)到應(yīng)該具有的應(yīng)用水平。出版行業(yè)實(shí)現(xiàn)深度信息化當(dāng)前需做好以下工作。
首先是需要盡快推進(jìn)行業(yè)信息標(biāo)準(zhǔn)化建設(shè)。目前,我國新聞出版行業(yè)的信息化標(biāo)準(zhǔn)工作大大滯后于行業(yè)信息化建設(shè)的實(shí)踐,特別是在行業(yè)宏觀方面、產(chǎn)業(yè)鏈條之間信息交換方面、同一產(chǎn)業(yè)鏈條內(nèi)不同單位之間的互聯(lián)互通方面,所需的基礎(chǔ)性、共性的信息化標(biāo)準(zhǔn)的嚴(yán)重不足已成為行業(yè)信息化建設(shè)的主要瓶頸。在大數(shù)據(jù)強(qiáng)勢來襲影響各行各業(yè)的當(dāng)下,管理部門與行業(yè)協(xié)會、生產(chǎn)企業(yè)應(yīng)形成合力,推動出版行業(yè)標(biāo)準(zhǔn)制訂和標(biāo)準(zhǔn)執(zhí)行工作。2014年10月正式出臺的《深化新聞出版體制改革實(shí)施方案》中的一大措施就是“建立全國統(tǒng)一的出版產(chǎn)品信息交換平臺,著力推動出版信息標(biāo)準(zhǔn)化建設(shè)”。
其次,出版行業(yè)鏈條上的各環(huán)節(jié),特別是出版與銷售兩個環(huán)節(jié),需要盡快加強(qiáng)信息互通。首先要做好企業(yè)自身內(nèi)部的信息化管理,然后在推行行業(yè)信息標(biāo)準(zhǔn)的基礎(chǔ)上,以開放、合作、共贏的姿態(tài),促進(jìn)行業(yè)信息互通。長時間以來,出版社與實(shí)體店商之間由于數(shù)據(jù)不能有效及時溝通,出版社不能掌握社外在銷庫存的數(shù)據(jù),屢屢造成追加印數(shù)決策失誤。近幾年圖書電商渠道崛起,不少出版社電商銷售量占銷售總額的一半以上,而出版社可以實(shí)時查看自己的品種在各大電商的銷售情況和庫存情況,這對于出版社的選題決策和印數(shù)追加都能起到重要的參考作用。
最后,出版行業(yè)行政管理部門的工作也需要隨之轉(zhuǎn)型。管理部門若不盡快使用網(wǎng)絡(luò)技術(shù)等手段加強(qiáng)對出版行業(yè)的管理,將越來越難以起到及時有效的指導(dǎo)、管理監(jiān)督和服務(wù)作用。
四、大數(shù)據(jù)分析有待出版企業(yè)轉(zhuǎn)變思維
1. 因果關(guān)系向相關(guān)關(guān)系轉(zhuǎn)變
大數(shù)據(jù)時代最大的轉(zhuǎn)變就是放棄對因果關(guān)系的探究,取而代之關(guān)注相關(guān)關(guān)系,即只要知道“是什么”,而不需要知道“為什么”。比如,我們通過各個專業(yè)網(wǎng)站或數(shù)據(jù)庫的數(shù)據(jù)分析,得出某一類選題的出版物銷售呈快速上升趨勢,那么就可以跟進(jìn)出版這一類選題,而不用去探究為什么這一類選題會受到追捧。又比如電商網(wǎng)站往往能夠在顧客買書的時候,推薦顧客剛好喜歡的其他書籍,網(wǎng)站可能不知道顧客“為什么”喜好那些書,其實(shí)網(wǎng)站也不在乎“為什么”。
2. 經(jīng)驗(yàn)判斷向數(shù)據(jù)驅(qū)動轉(zhuǎn)變
數(shù)據(jù)驅(qū)動,即出版企業(yè)以即時的方式獲取、處理和使用數(shù)據(jù)(內(nèi)部數(shù)據(jù)、外部數(shù)據(jù)),并以此來驅(qū)動企業(yè)的管理和運(yùn)營。企業(yè)一切的預(yù)測、判斷、決策依靠數(shù)據(jù)說話,有別于“拍腦袋”和“經(jīng)驗(yàn)式”的主觀判斷,相對客觀、科學(xué)。特別需要注意的是,數(shù)據(jù)驅(qū)動的出版企業(yè)的業(yè)務(wù)流程應(yīng)是閉環(huán),即“選題策劃-內(nèi)容生產(chǎn)-營銷-服務(wù)-互動平臺-客戶需求-選題策劃”式的閉環(huán)營運(yùn),各個環(huán)節(jié)之間有數(shù)據(jù)傳遞,相互間提供數(shù)據(jù)支撐。
3.產(chǎn)品生產(chǎn)向信息加工轉(zhuǎn)變
傳統(tǒng)出版企業(yè)一般重點(diǎn)關(guān)注產(chǎn)品生產(chǎn)流程與生產(chǎn)周期。事實(shí)上出版企業(yè)是傳播知識、觀念和思想的企業(yè),本質(zhì)上說也是在傳遞信息。因此,我們的關(guān)注點(diǎn)需要轉(zhuǎn)移到信息把關(guān)、信息加工、信息呈現(xiàn)方式和信息傳遞的快慢上來。這樣的好處在于數(shù)據(jù)分析可以貫穿在出版全過程之中,并能不斷優(yōu)化企業(yè)的生產(chǎn)與運(yùn)營。
4. 客戶關(guān)系向用戶關(guān)系轉(zhuǎn)變
客戶關(guān)系于企業(yè)的重要性不言而喻,不少出版企業(yè)都有自己的CRM系統(tǒng)。于出版企業(yè)而言,一般重點(diǎn)關(guān)注的客戶就是經(jīng)銷商、書店和各大電商,客戶關(guān)系的維護(hù)往往需要較高的成本投入。然而,在目前圖書市場飽和、產(chǎn)品同質(zhì)化嚴(yán)重的當(dāng)下,只注重客戶關(guān)系是完全不夠的,我們更需要了解終端用戶即讀者的需求、意見和建議。這要通過搭建讀者與出版社之間溝通的平臺來獲取用戶信息。出版社通過對獲取的用戶信息及行業(yè)數(shù)據(jù)進(jìn)行分析,可以提供更高的內(nèi)容質(zhì)量,以更適合讀者接受的載體形式來傳遞讀者最需要的內(nèi)容。
大數(shù)據(jù)分析既是一種技術(shù),也是一種思維方式。大數(shù)據(jù)將考驗(yàn)出版業(yè)的數(shù)據(jù)采集、分析與整合能力。大數(shù)據(jù)時代,出版企業(yè)必須具有大數(shù)據(jù)思維,不斷積累、沉淀數(shù)據(jù),打通獲取行業(yè)數(shù)據(jù)的通道,培養(yǎng)數(shù)據(jù)分析的習(xí)慣,主動開展數(shù)字化轉(zhuǎn)型升級,以實(shí)現(xiàn)跨越與發(fā)展。
(劉茂林,重慶大學(xué)出版社有限公司副社長,副編審;張小強(qiáng),重慶大學(xué)新聞學(xué)院副教授,碩士生導(dǎo)師,法學(xué)博士)
參考文獻(xiàn):
[1] 吳赟.產(chǎn)業(yè)重構(gòu)時代的出版與閱讀——大數(shù)據(jù)背景下出版業(yè)應(yīng)深度思考的五個關(guān)鍵命題[J].出版廣角,2013(12)上:32-36.
[2] 李薇.大數(shù)據(jù)時代,數(shù)字出版需要關(guān)注什么[J].出版參考,2013(11)上:17.
[3] 孫玉玲.大數(shù)據(jù)時代數(shù)字出版產(chǎn)業(yè)的發(fā)展趨勢[J].出版發(fā)行研究,2013(4):5-8.
[4] 宋永剛.大數(shù)據(jù)時代加快出版業(yè)轉(zhuǎn)型升級的思考[J].中國編輯,2013(5):13-17.
[5] 石佳靚.大數(shù)據(jù):出版產(chǎn)業(yè)的機(jī)遇與實(shí)踐[J].中國出版,2014(6)上:44-47.
[6] 劉茂林.粗剪——一種開放的數(shù)字出版模式[J].編輯之友,2010(11):
65-66.