国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)技術(shù)在出版產(chǎn)業(yè)中的應(yīng)用

2019-11-11 13:14蔣芳
電腦知識(shí)與技術(shù) 2019年27期
關(guān)鍵詞:傳統(tǒng)出版知識(shí)服務(wù)出版

蔣芳

摘要:目前,出版行業(yè)正處在傳統(tǒng)出版與數(shù)字出版融合發(fā)展的階段,大數(shù)據(jù)技術(shù)在出版體系中的應(yīng)用加速了融合發(fā)展的步伐。通過(guò)大數(shù)據(jù)技術(shù),對(duì)用戶的消費(fèi)數(shù)據(jù)、行為數(shù)據(jù)進(jìn)行分析,可以為出版體系提供支持,在信息分析、選題策劃、市場(chǎng)需求、精準(zhǔn)營(yíng)銷等過(guò)程中提供助力,更好地促進(jìn)我國(guó)新時(shí)代出版事業(yè)的跨越式發(fā)展。

關(guān)鍵詞:大數(shù)據(jù);出版;數(shù)字出版;傳統(tǒng)出版;融合發(fā)展;知識(shí)服務(wù)

中圖分類號(hào):TP393? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1009-3044(2019)27-0003-03

Abstract:At present, the publishing industry is in the stage of integration development between traditional publishing and digital publishing. The application of big data technology in the publishing system accelerates the pace of integration development. Through big data technology, the analysis of user's consumption data and behavior data can provide support for the publishing system, and help in the process of information analysis, topic planning, market demand, precision marketing, so as to better promote the leap-forward development of publishing industry in the new era in China.

Key words:big data;publishing;digital publishing;traditional publishing;integration and development;knowledge service

1 大數(shù)據(jù)技術(shù)及其應(yīng)用流程

1.1核心概念

關(guān)于大數(shù)據(jù),至今尚未出現(xiàn)廣為接受的統(tǒng)一適用定義。學(xué)術(shù)界比較認(rèn)可的是2012年由Gartner機(jī)構(gòu)對(duì)大數(shù)據(jù)進(jìn)行的定義:大數(shù)據(jù)是指需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的數(shù)量大、高增長(zhǎng)率和多樣化的信息資產(chǎn)。通常認(rèn)為大數(shù)據(jù)具有規(guī)模性、多樣性、高速性和價(jià)值性的特點(diǎn)。而大數(shù)據(jù)技術(shù),則是指從各種類型的數(shù)據(jù)中快速獲得有價(jià)值信息的技術(shù)。目前,大數(shù)據(jù)技術(shù)應(yīng)用廣泛,在各行各業(yè)中得到了實(shí)際的應(yīng)用,為行業(yè)的決策提供了科學(xué)指導(dǎo),推動(dòng)了行業(yè)的發(fā)展。

1.2應(yīng)用流程

大數(shù)據(jù)的應(yīng)用流程一般分為數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析和數(shù)據(jù)挖掘四個(gè)階段。

1.2.1數(shù)據(jù)采集

隨著互聯(lián)網(wǎng)的快速發(fā)展,特別是移動(dòng)互聯(lián)網(wǎng)的普及,人們通過(guò)網(wǎng)絡(luò)可以進(jìn)行發(fā)布、瀏覽、查詢信息等操作,每天網(wǎng)絡(luò)上都會(huì)產(chǎn)生海量的數(shù)據(jù)。數(shù)據(jù)采集就是通過(guò)合理的方法快速、高效地獲取有效的數(shù)據(jù),并且能夠?qū)?shù)據(jù)進(jìn)行處理操作。傳感器的出現(xiàn),實(shí)現(xiàn)了自動(dòng)化系統(tǒng)的采集,可以不用人工控制全天候自動(dòng)地獲取需要的數(shù)據(jù)。對(duì)于出版產(chǎn)業(yè)來(lái)說(shuō),可以采集圖書、讀者、作者等多方面的信息,用以指導(dǎo)出版工作的開(kāi)展。

1.2.2數(shù)據(jù)預(yù)處理

采集的數(shù)據(jù)量龐大,往往種類多樣、結(jié)構(gòu)復(fù)雜,不但包括有效的數(shù)據(jù),還會(huì)有錯(cuò)誤的、無(wú)效的數(shù)據(jù)。數(shù)據(jù)預(yù)處理就需要從這些數(shù)據(jù)中排除錯(cuò)誤的、無(wú)效的數(shù)據(jù),提取有效的數(shù)據(jù)。數(shù)據(jù)預(yù)處理,要盡可能做好數(shù)據(jù)清洗工作,它將會(huì)直接影響到挖掘到的有效信息。在出版工作中,同樣需要重視數(shù)據(jù)預(yù)處理,比如,對(duì)于獲取的作者信息,哪些特征數(shù)據(jù)是需要保留的,并對(duì)數(shù)據(jù)進(jìn)行分類處理。

1.2.3數(shù)據(jù)分析

單純的大量數(shù)據(jù)并沒(méi)有實(shí)際的意義,只有通過(guò)數(shù)據(jù)分析,將數(shù)據(jù)轉(zhuǎn)化成有效的信息,才能夠體現(xiàn)數(shù)據(jù)的價(jià)值。大數(shù)據(jù)的特點(diǎn)之一就是數(shù)據(jù)量大,并且數(shù)據(jù)是不斷更新的,隨著時(shí)間的推移,數(shù)據(jù)量不斷增加變化。借助計(jì)算機(jī)技術(shù),對(duì)大數(shù)據(jù)進(jìn)行分析,就需要找到數(shù)據(jù)之間的相關(guān)性,發(fā)現(xiàn)事物發(fā)生的規(guī)律,來(lái)指導(dǎo)人們的實(shí)踐。在出版體系中,數(shù)據(jù)分析就是通過(guò)出版方面的數(shù)據(jù),找到隱藏在數(shù)據(jù)后面的市場(chǎng)空白或市場(chǎng)需求,指導(dǎo)選題策劃及市場(chǎng)營(yíng)銷工作。

1.2.4數(shù)據(jù)挖掘

數(shù)據(jù)挖掘主要是指通過(guò)設(shè)計(jì)的各種算法,進(jìn)行高級(jí)別的數(shù)據(jù)分析。數(shù)據(jù)挖掘一般涉及的數(shù)據(jù)量和計(jì)算量都非常大,設(shè)計(jì)的算法也很復(fù)雜。在出版體系中,數(shù)據(jù)挖掘,需要打通作者、讀者、編輯之間的信息屏障,找到各自的需求點(diǎn)并進(jìn)行滿足,從而更好地服務(wù)出版產(chǎn)業(yè)。

2 出版體系中的大數(shù)據(jù)來(lái)源

出版體系中涉及的數(shù)據(jù)很多,有來(lái)自出版內(nèi)部的數(shù)據(jù),也有來(lái)自出版外部的數(shù)據(jù)。在整個(gè)出版流程中,如選題策劃、內(nèi)容編校、印刷發(fā)行、售后服務(wù)等各個(gè)環(huán)節(jié),都會(huì)產(chǎn)生大量的數(shù)據(jù),其主要來(lái)源于內(nèi)容、讀者、平臺(tái)三個(gè)方面。出版外部的數(shù)據(jù),有來(lái)自行業(yè)數(shù)據(jù)機(jī)構(gòu)的數(shù)據(jù),還有來(lái)自政府、企業(yè)、個(gè)人的調(diào)研數(shù)據(jù)。這里主要從內(nèi)容、讀者、平臺(tái)三個(gè)方面闡述。

2.1 內(nèi)容

在“內(nèi)容為王”的時(shí)代,無(wú)論是對(duì)于傳統(tǒng)出版,還是數(shù)字出版,內(nèi)容都是出版公司的核心競(jìng)爭(zhēng)力。出版是將作品編輯加工后,經(jīng)過(guò)復(fù)制向公眾發(fā)行,這之中本身就會(huì)產(chǎn)生大量的數(shù)據(jù)。人類從印刷術(shù)發(fā)明以來(lái),經(jīng)歷幾千年積累下來(lái)的各種圖書、期刊、報(bào)紙等,涵蓋科學(xué)、人文、藝術(shù)等各個(gè)方面,是大數(shù)據(jù)的重要來(lái)源。目前,我國(guó)每年出版的圖書超過(guò)30萬(wàn)種,并且數(shù)量每年還在遞增,這些都是人類優(yōu)秀科技文化成果的集結(jié),包含豐富的數(shù)據(jù)信息。

猜你喜歡
傳統(tǒng)出版知識(shí)服務(wù)出版
“互聯(lián)網(wǎng)+出版”的融合發(fā)展路徑探討
從西方國(guó)家保護(hù)消費(fèi)者權(quán)益政策看用戶信息消費(fèi)的安全管理