【摘要】CNONIX 標(biāo)準(zhǔn)的建立,旨在為我國出版產(chǎn)業(yè)鏈上的出版商、發(fā)行商、數(shù)據(jù)集成商等各類機(jī)構(gòu)提供標(biāo)準(zhǔn)的圖書信息交換格式,實(shí)現(xiàn)產(chǎn)業(yè)鏈上圖書信息的互聯(lián)互通,既可通過加速產(chǎn)品信息的流動,促進(jìn)圖書產(chǎn)品的流通效率,又可通過產(chǎn)品信息一次制作、多方應(yīng)用的方式,降低行業(yè)信息的應(yīng)用成本,提高行業(yè)各機(jī)構(gòu)的信息系統(tǒng)應(yīng)用效率。文章以上海新華傳媒為例,探索CNONIX在新聞出版發(fā)行行業(yè)的應(yīng)用。
【關(guān)鍵詞】CNONIX國家標(biāo)準(zhǔn);服務(wù)平臺;上海新華傳媒
【作者單位】李列群,上海新華傳媒連鎖有限公司。
一、CNONIX(中國出版物在線信息交換)介紹
Online Information Exchange 的縮寫ONIX(在線信息交換),是一種以元數(shù)據(jù)描述圖書產(chǎn)品信息的數(shù)據(jù)交換協(xié)議。包括ONIX for Books(圖書在線信息交換)、ONIX for serials (連續(xù)出版物在線信息交換)、ONIX for Publications Licenses(出版許可在線信息交換)、Licensing Terms & Rights Information(許可條款和版權(quán)信息)等多項(xiàng)協(xié)議。該協(xié)議是1999年由美國出版者協(xié)會(AAP)提出并開發(fā)的一份產(chǎn)品信息交換協(xié)議,旨在讓各個出版者能以一致的格式發(fā)送豐富的產(chǎn)品元數(shù)據(jù)給零售商,特別是開展網(wǎng)上零售業(yè)務(wù)的電商。該協(xié)議主要解決圖書產(chǎn)品信息的在線交換問題。
在該協(xié)議中,圖書是個廣義的概念,包括單行本的圖書、電子出版物、系列書、套書等。該標(biāo)準(zhǔn)由四個部分組成:ONIX代碼表、ONIX概述和數(shù)據(jù)元素目錄、ONIX產(chǎn)品信息記錄格式、ONIX XML信息交換規(guī)則。它提供了圖書產(chǎn)品全面、準(zhǔn)確、網(wǎng)絡(luò)化、數(shù)字化、動態(tài)描述、維護(hù)和交換規(guī)范信息,能使圖書產(chǎn)品信息和供應(yīng)信息整合在一個平臺,滿足書業(yè)對信息共享和供應(yīng)鏈管理的需求。
2014年,經(jīng)中國國家標(biāo)準(zhǔn)化管理委員會頒布的《中國出版物在線信息交換(CNONIX)》國家標(biāo)準(zhǔn)采用了ONIX for Books的元數(shù)據(jù)描述體系和結(jié)構(gòu)。CNONIX標(biāo)準(zhǔn)基于XML語言進(jìn)行描述。CNONIX 標(biāo)準(zhǔn)的建立,旨在為我國出版產(chǎn)業(yè)鏈上的出版商、發(fā)行商、數(shù)據(jù)集成商等各類機(jī)構(gòu)提供標(biāo)準(zhǔn)的圖書信息交換格式,實(shí)現(xiàn)產(chǎn)業(yè)鏈上圖書信息的互聯(lián)互通,既可通過加速產(chǎn)品信息的流動,促進(jìn)圖書產(chǎn)品的流通效率,又可通過產(chǎn)品信息一次制作、多方應(yīng)用的方式,降低行業(yè)信息的應(yīng)用成本,提高行業(yè)各機(jī)構(gòu)的信息系統(tǒng)應(yīng)用效率。
2014年,國家新聞出版廣電總局同財政部一起將CNONIX國家標(biāo)準(zhǔn)應(yīng)用示范工作納入文化產(chǎn)業(yè)發(fā)展資金的扶持范圍,通過項(xiàng)目資金的支持,帶動行業(yè)各單位積極實(shí)施CNONIX國家標(biāo)準(zhǔn)。目前,已有12家示范單位的13個CNONIX應(yīng)用項(xiàng)目獲得財政支持,7家單位的CNONIX項(xiàng)目被納入國家新聞出版廣電總局的改革發(fā)展項(xiàng)目庫,22家出版單位、發(fā)行單位、圖書館、研究機(jī)構(gòu)等成為應(yīng)用示范單位。
二、CNONIX在新聞出版發(fā)行行業(yè)中的應(yīng)用
上海新華傳媒作為22家示范單位的一員,正努力探索CNONIX在新聞出版發(fā)行行業(yè)的應(yīng)用。
之前,由于圖書產(chǎn)品信息的標(biāo)準(zhǔn)不統(tǒng)一,上海新華傳媒實(shí)施的ERP圖書書目信息數(shù)據(jù)來源分散、格式多樣,有來自B2B出版社提供的書目信息,有ERP補(bǔ)錄的數(shù)據(jù),有館配的圖書征訂信息,有大學(xué)教材的征訂信息,有MARK/CALIS數(shù)據(jù)等,形成了各種信息相互獨(dú)立的系統(tǒng)孤島。在數(shù)據(jù)規(guī)范化上,由于各種原因,ERP的產(chǎn)品重復(fù)信息達(dá)到了幾萬條,不完整和不規(guī)范的數(shù)據(jù)充斥在標(biāo)準(zhǔn)的數(shù)據(jù)中,成為信息系統(tǒng)的負(fù)擔(dān)甚至是垃圾。同時,上海新華傳媒的一城書集等線上業(yè)務(wù)也在逐步發(fā)展,需要標(biāo)準(zhǔn)化并符合網(wǎng)上銷售特點(diǎn)的產(chǎn)品信息。因此,圖書產(chǎn)品信息的標(biāo)準(zhǔn)化和規(guī)范化已成為上海新華傳媒圖書業(yè)務(wù)整體發(fā)展的技術(shù)關(guān)鍵。上海新華傳媒在CNONIX標(biāo)準(zhǔn)實(shí)施中充分考慮CNONIX國家標(biāo)準(zhǔn)的落地,在貫徹CNONIX國標(biāo)的企業(yè)信息系統(tǒng)建設(shè)中,計劃在以下幾方面嘗試具體應(yīng)用。
1.構(gòu)建企業(yè)的CNONIX云服務(wù)平臺
總體建設(shè)框圖如(圖1):
企業(yè)CNONIX云服務(wù)平臺是企業(yè)內(nèi)的服務(wù)平臺,行業(yè)CNONIX數(shù)據(jù)服務(wù)平臺上接原新聞出版總署信息中心的出版發(fā)行信息公共服務(wù)平臺,共享和下載使用行業(yè)的CNONIX元數(shù)據(jù)內(nèi)容;下接企業(yè)和各個業(yè)務(wù)信息系統(tǒng),是企業(yè)連接和共享行業(yè)CNONIX元數(shù)據(jù)內(nèi)容的通道和橋梁。同時,平臺提供錄入、采集、整理、加工基于CNONIX標(biāo)準(zhǔn)圖書產(chǎn)品信息的元數(shù)據(jù)內(nèi)容工具,為圖書出版發(fā)行行業(yè)建立符合CNONIX標(biāo)準(zhǔn)的圖書書目信息服務(wù)。
無論是在戶內(nèi)環(huán)境下,還是在“云”里,我們認(rèn)為,一個應(yīng)用平臺應(yīng)包含以下三個部分。
一個基礎(chǔ):幾乎所有應(yīng)用平臺都會用到一些在機(jī)器上運(yùn)行的平臺軟件。它們的各種支撐功能(如標(biāo)準(zhǔn)的庫與存儲,以及基本操作系統(tǒng)等)均屬此部分。
一組基礎(chǔ)設(shè)施服務(wù):在現(xiàn)代分布式環(huán)境中,應(yīng)用平臺經(jīng)常要用到由其他計算機(jī)提供的基本服務(wù)。比如遠(yuǎn)程存儲服務(wù)、集成服務(wù)及身份管理服務(wù)等。
一套應(yīng)用服務(wù):隨著越來越多的應(yīng)用平臺面向服務(wù)化,這些平臺提供的功能可為新應(yīng)用所使用。盡管這些新應(yīng)用主要是為最終用戶提供服務(wù)的,但這同時也令它們成為應(yīng)用平臺的一部分。
云平臺是由搭載了云平臺服務(wù)器端軟件的云服務(wù)器、搭載了云平臺客戶端軟件的云電腦以及網(wǎng)絡(luò)組件所構(gòu)成的,用于提高低配置或老舊計算機(jī)的綜合性能,使其達(dá)到現(xiàn)有流行速度的效果。
彈性虛擬計算:根據(jù)企業(yè)不斷變化的組織架構(gòu)、管控模式和業(yè)務(wù)需求,云平臺能為企業(yè)云應(yīng)用服務(wù)快速提供動態(tài)、靈活、彈性、虛 擬、共享和高效的計算資源服務(wù)。
智能監(jiān)控運(yùn)維:云平臺能實(shí)現(xiàn)對計算資源、存儲資源、網(wǎng)絡(luò)資源、云應(yīng)用服務(wù)7×24小時全時區(qū)、多地域、全方位、立體式、智能化的IT運(yùn)維監(jiān)控,保障IT系統(tǒng)安全、穩(wěn)定、可靠運(yùn)行。
云服務(wù)平臺中數(shù)據(jù)服務(wù)包括錄入、采集、整理、加工基于CNONIX標(biāo)準(zhǔn)的圖書產(chǎn)品信息元數(shù)據(jù)內(nèi)容工具。而系統(tǒng)具有以下功能。
(1)具有CNONIX數(shù)據(jù)的錄入加工功能
(2)具有CNONIX數(shù)據(jù)的校對功能和有效性檢查功能
(3)具有數(shù)據(jù)向CNONIX的轉(zhuǎn)檔功能
(4)具有數(shù)據(jù)安全性保護(hù)和備份功能
(5)具有多級用戶管理功能
上海新華傳媒在CNONIX云平臺的建設(shè)上,采用了目前先進(jìn)的高性能和高可用構(gòu)架的數(shù)據(jù)分析系統(tǒng),運(yùn)用Hadoop分布式數(shù)據(jù)庫、Spark集群計算環(huán)境和Nginx輕量級的Web服務(wù)器/反向代理服務(wù)器。此外,其還使用zabbix實(shí)現(xiàn)了對系統(tǒng)和網(wǎng)絡(luò)的有效監(jiān)控。
2.CNONIX標(biāo)準(zhǔn)數(shù)據(jù)采集、加工、轉(zhuǎn)換、交換、驗(yàn)證的目標(biāo)
書目CNONIX標(biāo)準(zhǔn)數(shù)據(jù)采集系統(tǒng)的建設(shè)目標(biāo)是建立一套架構(gòu)合理、功能齊全、運(yùn)行穩(wěn)定的CNONIX標(biāo)準(zhǔn)數(shù)據(jù)加工系統(tǒng)。該系統(tǒng)除了應(yīng)具備ERP原新書目補(bǔ)錄功能,還需要與企業(yè)內(nèi)的ERP、WMS、Mark/Calis數(shù)據(jù),企業(yè)外的圖書供應(yīng)商、圖書館等進(jìn)行全面的無縫對接,滿足實(shí)時高效、安全穩(wěn)定的要求。系統(tǒng)需具備良好的可擴(kuò)展性,同時能根據(jù)公司現(xiàn)有ERP系統(tǒng)的現(xiàn)實(shí)情況和對內(nèi)對外的各種數(shù)據(jù)源整體制訂相應(yīng)的流程。
書目數(shù)據(jù)的CNONIX數(shù)據(jù)轉(zhuǎn)換設(shè)計目標(biāo)是實(shí)現(xiàn)書目數(shù)據(jù)按照中國出版物在線信息交換圖書產(chǎn)品信息格式規(guī)范(GB/T 30330-2013)的要求,實(shí)現(xiàn)標(biāo)準(zhǔn)CNONIX格式數(shù)據(jù)的輸出。數(shù)據(jù)交換的要求為建立相應(yīng)的數(shù)據(jù)接口,高效安全地和上下游進(jìn)行CNONIX標(biāo)準(zhǔn)數(shù)據(jù)的交換。數(shù)據(jù)驗(yàn)證的要求為采集、加工、轉(zhuǎn)換、交換的數(shù)據(jù)符合國家CNONIX實(shí)驗(yàn)室的驗(yàn)證要求,并通過驗(yàn)證。
3.探索拓展符合CNONIX標(biāo)準(zhǔn)的“數(shù)字出版物業(yè)務(wù)數(shù)據(jù)系統(tǒng)”建設(shè)
(1)搭建符合CNONIX標(biāo)準(zhǔn)的數(shù)字出版物數(shù)據(jù)庫。上海新華傳媒以已有的數(shù)字出版物中心書庫為基礎(chǔ),結(jié)合CNONIX格式文件,增加數(shù)字圖書新的元數(shù)據(jù)字段,擴(kuò)充原有中心書庫數(shù)據(jù)的圖書記錄信息。主要數(shù)字圖書相關(guān)的擴(kuò)充信息包括:數(shù)字產(chǎn)品技術(shù)保護(hù);數(shù)字產(chǎn)品使用限制;數(shù)字產(chǎn)品使用類型(預(yù)覽、印制、復(fù)制/粘貼、共享、文本朗讀、借出);數(shù)字產(chǎn)品使用狀態(tài);數(shù)字產(chǎn)品使用限度(復(fù)合元素)(無限許可、有限許可、禁止使用);數(shù)字產(chǎn)品數(shù)量;數(shù)字產(chǎn)品使用單位(份數(shù)、字符數(shù)、單詞數(shù)、頁數(shù)、百分比、設(shè)備量、并發(fā)用戶、不同時間段的內(nèi)容百分比、天數(shù)、次數(shù))等。其他一些非數(shù)字圖書相關(guān)的元數(shù)據(jù)將同時建立,以便我們未來可以根據(jù)數(shù)字書號直接查詢到對應(yīng)紙質(zhì)書籍相關(guān)的圖書信息。此模塊搭建完成后,出版社可直接在平臺中按照CNONIX標(biāo)準(zhǔn)填入數(shù)字圖書相關(guān)信息數(shù)據(jù)。
(2)調(diào)整現(xiàn)有系統(tǒng)及流程,以滿足新標(biāo)準(zhǔn)數(shù)據(jù)的錄入和轉(zhuǎn)出。為了滿足符合CNONIX數(shù)據(jù)格式標(biāo)準(zhǔn)的需求,公司原有的轉(zhuǎn)檔流程以及相關(guān)系統(tǒng)將升級改造。對于一些數(shù)字產(chǎn)品需要輸入的字段,我們將開發(fā)新的輸入程式以供轉(zhuǎn)檔人員在轉(zhuǎn)檔環(huán)節(jié)增加錄入。如未來CNONIX的云服務(wù)平臺搭建完成后,一些圖書的基本信息(如作者、書名、簡介等)不再需要通過掃描電子書后獲取,而是直接由接口訪問CNONIX云服務(wù)平臺,根據(jù)數(shù)字圖書的唯一編號獲取可訪問信息后下載使用,如此,不僅減少了掃描過程中數(shù)據(jù)的錯誤率,而且極大地提升了轉(zhuǎn)檔效率。
對企業(yè)已有的數(shù)字圖書銷售數(shù)據(jù)以及各閱讀器所采集的用戶閱讀行為數(shù)據(jù),我們也將開發(fā)新系統(tǒng),將數(shù)據(jù)整合后導(dǎo)入本地CNONIX數(shù)據(jù)庫,再由上傳接口上傳到企業(yè)CNONIX云服務(wù)平臺,達(dá)到和紙質(zhì)書結(jié)合分析統(tǒng)計的目的。
在CNONIX標(biāo)準(zhǔn)下,我們計劃搭建企業(yè)內(nèi)的數(shù)據(jù)服務(wù)云平臺的數(shù)據(jù)接口,從而實(shí)現(xiàn)數(shù)字圖書的完整數(shù)據(jù)統(tǒng)計目標(biāo)。接口部分將采用Microsoft .NET框架建立跨平臺的Web Service服務(wù),將數(shù)據(jù)格式轉(zhuǎn)成標(biāo)準(zhǔn)的XML格式加密傳遞。平臺接口搭建完成后,只需將標(biāo)準(zhǔn)的格式化數(shù)據(jù)提供給企業(yè)內(nèi)部的數(shù)據(jù)服務(wù)云平臺即可,例如ISBN編號、圖書定價等。
4.CNONIX將應(yīng)用在圖書行業(yè)數(shù)據(jù)分析系統(tǒng)中
統(tǒng)一、標(biāo)準(zhǔn)的元數(shù)據(jù)有利于出版發(fā)行行業(yè)的大數(shù)據(jù)分析。CNONIX標(biāo)準(zhǔn)的推廣應(yīng)用,給出版發(fā)行行業(yè)一個良好的契機(jī)來推動本行業(yè)的大數(shù)據(jù)發(fā)展。上海新華傳媒的云服務(wù)平臺將利用大數(shù)據(jù)技術(shù)定期提供包含出版數(shù)據(jù)、流通(零售)數(shù)據(jù)、數(shù)字圖書館閱讀數(shù)據(jù)的分析和研究。為出版發(fā)行的大數(shù)據(jù)分析開發(fā)出更加智能化的行業(yè)大數(shù)據(jù)平臺,實(shí)時提供包括購買行為分析平臺、閱讀行為分析平臺、預(yù)測模型建立等,成為專業(yè)型大數(shù)據(jù)庫。通過大數(shù)據(jù)分析,我們可以為行業(yè)和政府管理部門定期提供以下報告。
(1)圖書市場監(jiān)測報告
(2)圖書監(jiān)測銷量排行
(3)書店采購指南
(4)出版社/集團(tuán)報告
(5)區(qū)域市場分析報告
(6)數(shù)字圖書閱讀分析報告
(7)圖書館讀者行為分析報告
通過以上報告,我們可以對行業(yè)進(jìn)行大數(shù)據(jù)分析,包括出版的大數(shù)據(jù)、發(fā)行的大數(shù)據(jù)、零售的大數(shù)據(jù)等。
出版的大數(shù)據(jù),意味著出版已經(jīng)不再是靠經(jīng)驗(yàn)和直覺,而是需要大量的數(shù)據(jù)支持。圖書在出版階段,包括策劃、編輯、營銷的各個過程中都需要相關(guān)云端數(shù)據(jù)的支持。企業(yè)利用已有的信息平臺,已匯集了300萬種圖書出版數(shù)據(jù),和自2004以來的25個省、自治區(qū)、直轄市1500多家大中型書店的零售數(shù)據(jù),以及數(shù)字圖書的大量圖書館借閱原始數(shù)據(jù)。這個云平臺可以為出版社提供海量的信息,包括誰在看書、看什么書、年齡構(gòu)成、特定圖書的歷史銷售、地區(qū)銷售差別、定價策略等。CNONIX標(biāo)準(zhǔn)的應(yīng)用,使圖書出版數(shù)據(jù)、流通數(shù)據(jù)、借閱數(shù)據(jù)三個云數(shù)據(jù)庫標(biāo)準(zhǔn)統(tǒng)一、信息關(guān)聯(lián)更加方便。圖書數(shù)據(jù)CNONIX標(biāo)準(zhǔn)化將為出版大數(shù)據(jù)分析提供更加詳細(xì)的信息,例如參與者信息不僅包含作者信息,還會有前言、插圖、封面設(shè)計等各類相關(guān)內(nèi)容。出版營銷也可以從粗放式轉(zhuǎn)向數(shù)字時代的精準(zhǔn)營銷,做到有的放矢。
發(fā)行的大數(shù)據(jù),意味著發(fā)行工作已經(jīng)不能簡單地依靠傳統(tǒng)經(jīng)驗(yàn),而是“謀定而后動”,即分析相關(guān)圖書的歷史銷售數(shù)據(jù),圖書發(fā)行的數(shù)量、時機(jī)都將是科學(xué)的決策。交易中心云數(shù)據(jù)平臺提供的實(shí)時信息反饋,會及時修正發(fā)行策略,提供具體信息,包括及時增印、調(diào)整庫存、區(qū)域調(diào)整等,幫助發(fā)行真正做到“隨機(jī)應(yīng)變”。
隨著圖書零售O2O模式的建立、圖書閱讀O2O模式的建立,交易中心采集的這些數(shù)據(jù)將更加及時、詳細(xì)。用戶的購書行為,包括什么時間、地點(diǎn)、出于什么目的而購買、同時買了什么、持續(xù)的購買行為等將建立更加詳細(xì)的購買行為數(shù)據(jù)。用戶的閱讀行為,包括什么時間,在哪兒,看了哪本書的哪一頁,甚至每一頁的停留時間等信息,我們都可通過大數(shù)據(jù)技術(shù)精準(zhǔn)獲取。
我們的中心核心數(shù)據(jù)庫和分析系統(tǒng)的CNONIX也將擴(kuò)容系統(tǒng),為出版發(fā)行的大數(shù)據(jù)分析開發(fā)出更加智能化的行業(yè)大數(shù)據(jù)平臺,包括購買行為分析平臺、閱讀行為分析平臺、預(yù)測模型建立等。通過系統(tǒng)集成,我們集合服務(wù)器、網(wǎng)絡(luò)、存儲硬件,使用商用數(shù)據(jù)庫軟件、系統(tǒng)中間件和自主開發(fā)的行業(yè)數(shù)據(jù)管理軟件,為行業(yè)提供高效有用的信息。
上海新華傳媒的CNONIX國家標(biāo)準(zhǔn)實(shí)施的整體目標(biāo)是建成新華傳媒CNONIX云服務(wù)平臺數(shù)據(jù)中心和滬版圖書CNONIX標(biāo)準(zhǔn)書目的加工服務(wù)平臺。此外,我們還希望公司的圖書產(chǎn)品及相關(guān)信息的數(shù)據(jù)中心及服務(wù)平臺,通過數(shù)據(jù)清洗等技術(shù)手段,成為上海地區(qū)的CNONIX數(shù)據(jù)應(yīng)用中心。