張弛
[摘 要] 構(gòu)建因應(yīng)工業(yè)4.0的精準(zhǔn)出版,既需要大數(shù)據(jù)技術(shù)支持,也需要大數(shù)據(jù)哲學(xué)視域。精準(zhǔn)出版所表現(xiàn)的“量身定做”和“私人定制”是基于數(shù)字人類(lèi)學(xué)和文化組學(xué)的“量子人性”概念,大數(shù)據(jù)“一切皆可量化”的價(jià)值功能通過(guò)數(shù)據(jù)挖掘與量化分析進(jìn)行用戶畫(huà)像,使精準(zhǔn)出版進(jìn)入“圖書(shū)基因組計(jì)劃”的文化基因量化分析層面。精準(zhǔn)出版對(duì)讀者用戶群中“可能讀者”或“潛在讀者”的關(guān)注和開(kāi)發(fā)是基于大數(shù)據(jù)“第四范式”的“一切皆可預(yù)測(cè)”的價(jià)值功能,依據(jù)大數(shù)據(jù)分析為讀者推薦產(chǎn)品,使出版能為讀者用戶提供更加貼身的個(gè)性化服務(wù)。精準(zhǔn)出版所依據(jù)的全媒體閱讀方式是基于語(yǔ)義分析意義上的“超文本”原理,全媒體的移動(dòng)化、社交化、互動(dòng)式、網(wǎng)絡(luò)化的趨勢(shì)給精準(zhǔn)出版創(chuàng)造了個(gè)性化、定制化的機(jī)遇。
[關(guān)鍵詞]精準(zhǔn)出版 大數(shù)據(jù) 大數(shù)據(jù)哲學(xué)
[中圖分類(lèi)號(hào)] G237[文獻(xiàn)標(biāo)識(shí)碼] A[文章編號(hào)] 1009-5853 (2019) 03-0091-06
[Abstract] In response to industry 4.0, lean publishing demands big data technology support as well as big data philosophy field of vision. The private ordering of the lean publishing is based on digital anthropology and culture comics. Every thing can be measured in big data, which can create lean publishing personas by data mining and quantitative analysis. Thus, the lean publishing is at the level of quantitative analyse of Book Genome Projects culture comics.The lean publishing can recommend products to potential readers according to personas based on big data analysis,which can guide the ordering. The readers can get more comfortable personalized service. The Omani media reading realizes that the lean publishing does semantic analysis by hyper-text. Hence,the lean publishing expects the trend to the mobilization,socialization,interaction and networking.
[Key words] Lean publishing Big data Big data philosophy
目前,對(duì)于中國(guó)出版業(yè)來(lái)說(shuō),因應(yīng)工業(yè)4.0和大數(shù)據(jù)潮流盡快構(gòu)建基于大數(shù)據(jù)的滿足用戶個(gè)性化需求的精準(zhǔn)出版服務(wù)新業(yè)態(tài)已是大勢(shì)所趨。所謂精準(zhǔn)出版是粗放出版的對(duì)稱,是指針對(duì)不同讀者對(duì)象量身定制精確營(yíng)銷(xiāo)的出版模式。作為出版業(yè)發(fā)展的新業(yè)態(tài)和新模式,基于大數(shù)據(jù)的精準(zhǔn)出版既是一種技術(shù)應(yīng)用,也是一種思想方法和哲學(xué)方法。只有充分理解精準(zhǔn)出版的哲學(xué)思想方法,才能高屋建瓴地加快推進(jìn)精準(zhǔn)出版新業(yè)態(tài)建設(shè)。精準(zhǔn)出版的大數(shù)據(jù)哲學(xué)向度主要有以下幾個(gè)方面:在主體論意義上“量化人性”的“數(shù)字人類(lèi)學(xué)”和“文化組學(xué)”;在科學(xué)認(rèn)識(shí)論意義上“一切皆可預(yù)測(cè)”的“第四范式”;在語(yǔ)義分析意義上“一切可連接”的“超文本”和非結(jié)構(gòu)性數(shù)據(jù)分析。
1 基于“數(shù)字人類(lèi)學(xué)”和“文化組學(xué)”的精準(zhǔn)出版
英國(guó)當(dāng)代數(shù)學(xué)家及人類(lèi)學(xué)家托馬斯·克倫普(Thomas Crump)在《數(shù)字人類(lèi)學(xué)》一書(shū)中指出:“數(shù)字的本質(zhì)是人,數(shù)據(jù)挖掘就是在分析人類(lèi)族群自身”;處于一定時(shí)間、地點(diǎn)條件下的人類(lèi)族群活動(dòng)是一個(gè)動(dòng)態(tài)系統(tǒng),“所有特定的聚居人群的經(jīng)濟(jì)、社會(huì)和政治都是一些動(dòng)態(tài)系統(tǒng)”。而數(shù)字人類(lèi)學(xué)就是關(guān)于“這種系統(tǒng)是如何運(yùn)作的假設(shè)”。從這個(gè)意義上說(shuō),“人人都是建模者(modeller)”[1]。按照托馬斯·克倫普的觀點(diǎn),數(shù)字本質(zhì)上是人的行為和客觀世界運(yùn)動(dòng)的記錄,是人類(lèi)行為和客觀世界的數(shù)字符號(hào)化或者定量化。只是在小數(shù)據(jù)時(shí)代,人類(lèi)行為數(shù)字化只限于處理具有嚴(yán)格邏輯性的結(jié)構(gòu)化數(shù)據(jù),難以量化處理雜亂無(wú)章瞬息萬(wàn)變的人的情感和心理行為數(shù)據(jù),而大數(shù)據(jù)改變了人類(lèi)掌控?cái)?shù)據(jù)的能力,大數(shù)據(jù)MapReduce和Hadoop等非關(guān)系數(shù)據(jù)分析技術(shù),使人們分析處理海量的雜亂無(wú)章的非結(jié)構(gòu)性數(shù)據(jù)的能力發(fā)生了質(zhì)的飛躍。大數(shù)據(jù)“一切皆可量化”的功能和價(jià)值使“量化人性”成為現(xiàn)實(shí)。被稱為大數(shù)據(jù)預(yù)測(cè)專家的埃里克·西格爾(Eric Seagal )因此提出了“量子人性”概念[2]。他認(rèn)為,在大數(shù)據(jù)時(shí)代,人們對(duì)人性的認(rèn)識(shí)已經(jīng)由傳統(tǒng)定性分析的經(jīng)驗(yàn)層面進(jìn)入到精準(zhǔn)量化分析的量子層面。
基于“數(shù)字人類(lèi)學(xué)”的精準(zhǔn)出版不僅是一種業(yè)態(tài)模式,更是一個(gè)洞悉分析人性的邏輯過(guò)程。離開(kāi)人來(lái)討論精準(zhǔn)出版,其結(jié)論肯定缺乏精準(zhǔn)性。精準(zhǔn)出版是一個(gè)全程出版概念,既包括出版選題策劃環(huán)節(jié)的“量身定做”和“私人訂制”,也包括出版印制環(huán)節(jié)的“按需印刷”,還包括銷(xiāo)售環(huán)節(jié)的“精準(zhǔn)營(yíng)銷(xiāo)”和“精準(zhǔn)服務(wù)”。云南出版集團(tuán)曾開(kāi)展為期一年的“精準(zhǔn)出版年”活動(dòng),提出 “十個(gè)精準(zhǔn)”:定位精準(zhǔn)、導(dǎo)向精準(zhǔn)、策劃精準(zhǔn)、作者精準(zhǔn)、讀者精準(zhǔn)、編輯精準(zhǔn)、校稿精準(zhǔn)、印刷精準(zhǔn)、發(fā)行精準(zhǔn)、效益精準(zhǔn)”[3]。在這十個(gè)精準(zhǔn)中,最重要的是讀者精準(zhǔn),其他的精準(zhǔn)都是圍繞讀者精準(zhǔn)展開(kāi)的,而讀者精準(zhǔn)是基于大數(shù)據(jù)的用戶畫(huà)像?!坝脩舢?huà)像是用戶數(shù)據(jù)的標(biāo)簽化,是真實(shí)用戶的虛擬代表,是建立在一系列數(shù)據(jù)之上的目標(biāo)用戶模型”[4]。用戶畫(huà)像要求洞悉讀者行為軌跡和讀者心智,通過(guò)數(shù)據(jù)挖掘?qū)崿F(xiàn)讀者數(shù)據(jù)標(biāo)簽化。由此可見(jiàn),實(shí)現(xiàn)精準(zhǔn)出版必須對(duì)讀者進(jìn)行用戶畫(huà)像,讀者用戶畫(huà)像必須運(yùn)用大數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,數(shù)據(jù)挖掘的背后一定要還原為人,這就是“數(shù)字人類(lèi)學(xué)”之于精準(zhǔn)出版的哲學(xué)意義所在。
“數(shù)字人類(lèi)學(xué)”強(qiáng)調(diào)“數(shù)據(jù)挖掘就是在分析人類(lèi)族群自身”,而“文化組學(xué)”(cultureomics)可以說(shuō)是“分析人類(lèi)族群自身”的具體體現(xiàn)。
“文化組學(xué)” [5]從產(chǎn)生開(kāi)始就與圖書(shū)出版存在著天然聯(lián)系,其創(chuàng)始人艾略茲·利波曼·埃頓(Erez Liebeman Aiden)在2007年3月訪問(wèn)谷歌研究部主任彼特·諾維格(Peter Norvig)時(shí),其初始目的是能進(jìn)入谷歌圖書(shū)系統(tǒng)以獲得一些數(shù)據(jù),而谷歌圖書(shū)正雄心勃勃地試圖掃描人類(lèi)出版的每一本書(shū)的每一頁(yè)。通過(guò)與谷歌合作,對(duì)1000多萬(wàn)種圖書(shū)進(jìn)行數(shù)據(jù)挖掘,埃頓發(fā)現(xiàn)幾個(gè)世紀(jì)以來(lái),文字或單詞在出版物上的增長(zhǎng)和減少,反映了人類(lèi)文化的演變。2010年,埃頓與其助手米歇爾聯(lián)合設(shè)計(jì)出“n-grams”軟件,并由谷歌推出。這種研究方法用類(lèi)似基因組分析的方法研究圖書(shū)數(shù)據(jù)庫(kù),他們將這種方法稱為“文化組學(xué)”。“通過(guò)對(duì)世界各類(lèi)書(shū)籍的數(shù)據(jù)挖掘,艾略茲·利波曼·埃頓正嘗試實(shí)現(xiàn)絕大多數(shù)的人文研究的自動(dòng)化”[6]??梢?jiàn),“文化組學(xué)”是將文字或單詞等關(guān)鍵詞作為文化基因,利用大數(shù)據(jù)挖掘整理出隨時(shí)間推移文化如何發(fā)生改變的量化指標(biāo)。例如,通過(guò)數(shù)據(jù)挖掘發(fā)現(xiàn),在19世紀(jì),技術(shù)進(jìn)步平均需要66年才能被主流文化所接受容納,而在1880年至1920年間,這一過(guò)程只需要27年。
“文化組學(xué)”通過(guò)數(shù)據(jù)挖掘和量化分析來(lái)揭示人類(lèi)心理行為和文化發(fā)展趨勢(shì),這是在原有的純邏輯模式下難以實(shí)現(xiàn)的。一直以來(lái),閱讀作為一種文化體驗(yàn),個(gè)人讀書(shū)時(shí)的心境狀態(tài)和思考過(guò)程具有很強(qiáng)的個(gè)體性,這種私密性是外人無(wú)從體會(huì)的。在全媒體時(shí)代,出版商和作者不僅可以通過(guò)信息互動(dòng)掌握出版物的銷(xiāo)售額,而且可以一窺讀者的閱讀強(qiáng)度。交互創(chuàng)作出版公司交互創(chuàng)作出版公司的聯(lián)合創(chuàng)始人麗莎·盧瑟福(Lisa Rutherford)堅(jiān)信“書(shū)籍應(yīng)該可以是互動(dòng)的”這一觀念。她和亞馬遜“Kindle互動(dòng)型內(nèi)容開(kāi)發(fā)者計(jì)劃”合作,在交互創(chuàng)作出版公司出版的網(wǎng)絡(luò)版電子書(shū)中允許讀者自己設(shè)計(jì)人物角色和情節(jié)線索,經(jīng)數(shù)據(jù)分析,讓作家調(diào)整故事以迎合大眾口味”。 “文化組學(xué)”在圖書(shū)出版中的具體運(yùn)用案例是蘋(píng)果公司收購(gòu)書(shū)燈(Booklamp)的“圖書(shū)基因組計(jì)劃”(Book Genome Project)[7]。該計(jì)劃根據(jù)不同讀者閱讀興趣和購(gòu)書(shū)記錄的大數(shù)據(jù)分析,對(duì)每個(gè)讀者進(jìn)行“智能分組”,對(duì)每個(gè)讀者進(jìn)行基于“圖書(shū)基因組計(jì)劃”的“量身定做”和“私人定制”。“圖書(shū)基因組計(jì)劃”根據(jù)不同人群的文化屬性進(jìn)行用戶畫(huà)像和智能分組,具有鮮明的“文化組學(xué)”基因。
“文化組學(xué)”和“圖書(shū)基因組計(jì)劃”都聚焦人的文化屬性,把洞悉人性放在中心位置,正如圖靈獎(jiǎng)獲得者理查德·衛(wèi)斯里·漢明(Richard Wesley Hamming)所說(shuō),計(jì)算的目的不在于數(shù)據(jù),而在于洞察人和事物。同樣,“出版的目的也不在于‘出版,因?yàn)楦鼮閺V闊的利益回饋是通過(guò)出版衍生更多的關(guān)系和交流”[8]。互聯(lián)網(wǎng)巨頭之一的騰訊一直把洞悉人性作為關(guān)注焦點(diǎn),從關(guān)注廣告,到關(guān)注人與人脈,關(guān)注人群背后的數(shù)據(jù)與需求,并通過(guò)騰訊強(qiáng)大的用戶平臺(tái)、關(guān)系鏈及營(yíng)銷(xiāo)工具,為生產(chǎn)提供高效的社會(huì)化營(yíng)銷(xiāo)解決方案。圍繞人脈這一核心要素,在大數(shù)據(jù)時(shí)代,騰訊社會(huì)化營(yíng)銷(xiāo)平臺(tái)提供打通的用戶產(chǎn)品、數(shù)據(jù)庫(kù)的營(yíng)銷(xiāo)工具;而騰訊MIND 3.0則通過(guò)對(duì)用戶行為數(shù)據(jù)的洞察、分析和挖掘,深描每一個(gè)用戶族群,通過(guò)差異化標(biāo)簽在品牌和受眾之間建立社會(huì)化的營(yíng)銷(xiāo)關(guān)聯(lián)[9]。對(duì)于出版業(yè)來(lái)說(shuō),“通過(guò)精確的數(shù)據(jù)分析、方便快捷的個(gè)性化服務(wù),去鎖定用戶、增強(qiáng)忠誠(chéng)感,對(duì)于學(xué)術(shù)出版、專業(yè)出版,尤其賦予意義”[10]。因此,精準(zhǔn)出版不是傳統(tǒng)的經(jīng)驗(yàn)式的抽樣調(diào)查分析,而是建立在“數(shù)字人類(lèi)學(xué)”和“文化組學(xué)”基礎(chǔ)上的量化分析和人性洞悉。
2 基于“第四范式”的精準(zhǔn)出版
“范式”一詞最早出現(xiàn)在科學(xué)哲學(xué)家托馬斯·庫(kù)恩(Thomas Kuhn)的《科學(xué)革命的結(jié)構(gòu)》一書(shū)中,哲學(xué)意義上的范式通常是指關(guān)于科學(xué)研究的一系列基本觀念和實(shí)踐規(guī)范。這些基本觀念和規(guī)范包括3方面內(nèi)容:“(1)共同的基本理論、觀點(diǎn)和方法;(2)共同的信念;(3)某種自然觀(包括形而上學(xué)假定)。”[11]由此可見(jiàn),范式涉及哲學(xué)本體論、認(rèn)識(shí)論和方法論問(wèn)題。作為本體論的范式回答研究對(duì)象的本質(zhì)為何以及其真實(shí)性何在的問(wèn)題;作為認(rèn)識(shí)論的范式回答認(rèn)識(shí)者與被認(rèn)識(shí)者的相互關(guān)系問(wèn)題;作為方法論的范式回答認(rèn)識(shí)者如何獲得知識(shí)及研究方法的理論體系問(wèn)題。庫(kù)恩認(rèn)為:“常規(guī)科學(xué)即解難題(puzzle)”[12];研究范式對(duì)科學(xué)家共同體起規(guī)范的作用,規(guī)范他們共同的思想觀念和研究方法,科學(xué)共同體的任務(wù)是在范式的規(guī)范下開(kāi)展研究,進(jìn)而推動(dòng)科學(xué)發(fā)展。
“第四范式”是已故圖靈獎(jiǎng)得主吉姆·格雷提出的,2007年1月他在《科學(xué)方法的一次革命》中提出:“用于這種數(shù)據(jù)密集型科學(xué)的技術(shù)和方法是如此迥然不同,所以,從計(jì)算科學(xué)中把數(shù)據(jù)密集型科學(xué)區(qū)分出來(lái)作為一個(gè)新的、科學(xué)探索的第四種范式頗有價(jià)值?!盵13]吉姆·格雷之所以將大數(shù)據(jù)密集型范式作為獨(dú)立的第四范式與實(shí)驗(yàn)型第一范式、理論型第二范式、計(jì)算型第三范式區(qū)別開(kāi)來(lái),是因?yàn)橐郧叭N范式的共同特點(diǎn)是研究需要模型和假設(shè),而第四范式處理PB級(jí)以上大數(shù)據(jù)的能力使人們能做到?jīng)]有模型和假設(shè)也可以分析處理數(shù)據(jù)。中國(guó)工程院倪光南院士指出,科學(xué)研究的實(shí)踐型范式、理論型范式、計(jì)算型范式都是在已知規(guī)律的情況下發(fā)現(xiàn)新的規(guī)律,而大數(shù)據(jù)“則是在未知規(guī)律的情況下,運(yùn)用計(jì)算機(jī)能力從大數(shù)據(jù)中發(fā)現(xiàn)規(guī)律并發(fā)揮規(guī)律的作用”[14]。能夠基于“未知”來(lái)探求“未知”進(jìn)而發(fā)現(xiàn)規(guī)律,這是大數(shù)據(jù)第四范式的方法論革命,其意義在于從“未知”中發(fā)現(xiàn)問(wèn)題和規(guī)律,進(jìn)而精準(zhǔn)預(yù)測(cè)。而公認(rèn)的大數(shù)據(jù)的核心價(jià)值就是精準(zhǔn)預(yù)測(cè)。埃里克·西格爾指出:“有若干因素將會(huì)推動(dòng)預(yù)測(cè)技術(shù)的不斷發(fā)展:爆炸式的數(shù)據(jù)增長(zhǎng)、功能更加強(qiáng)大的計(jì)算機(jī)、更加廣泛深入的理解以及科學(xué)的發(fā)展。組織與個(gè)人之間越來(lái)越多的交互行為將受到預(yù)測(cè)的驅(qū)動(dòng)。”[15]
基于大數(shù)據(jù)的精準(zhǔn)預(yù)測(cè)導(dǎo)致兩個(gè)重要的認(rèn)識(shí)論轉(zhuǎn)變:第一,從小數(shù)據(jù)時(shí)代的經(jīng)驗(yàn)式預(yù)測(cè)到大數(shù)據(jù)時(shí)代的精準(zhǔn)性預(yù)測(cè)轉(zhuǎn)變。在小數(shù)據(jù)時(shí)代,因?yàn)槿狈A康摹⑷娴?、?zhǔn)確的數(shù)據(jù)作為支撐。人們對(duì)事物發(fā)展趨勢(shì)的認(rèn)識(shí)往往是以經(jīng)驗(yàn)為基礎(chǔ)的,日常表現(xiàn)為“大概”性的猜測(cè)。胡適曾將這種習(xí)慣“大概”的中國(guó)人稱為“差不多先生”[16]。顯然,“大概”“差不多”是與小數(shù)據(jù)時(shí)代相聯(lián)系的。在大數(shù)據(jù)時(shí)代,海量、實(shí)時(shí)、準(zhǔn)確的數(shù)據(jù)收集及其挖掘技術(shù)轉(zhuǎn)變了人類(lèi)認(rèn)識(shí)事物的路徑,即涂子沛在他的著作《大數(shù)據(jù)》提到的“將計(jì)算機(jī)運(yùn)用于數(shù)據(jù),而不是數(shù)據(jù)用于計(jì)算”。大數(shù)據(jù)挖掘中“Hadoop處理數(shù)據(jù)是以數(shù)據(jù)為中心,而不是傳統(tǒng)的以程序?yàn)橹行摹盵17]。因此,“大數(shù)據(jù)的洪流也在改變著人們對(duì)數(shù)據(jù)及其作用的認(rèn)識(shí)”?!皵?shù)據(jù)不再僅僅是科學(xué)研究的結(jié)果,而且變成科學(xué)研究的活的基礎(chǔ)和工具”[18]。大數(shù)據(jù)的實(shí)時(shí)性、整體性、高效性、相關(guān)性成為精準(zhǔn)預(yù)測(cè)的主要科學(xué)基礎(chǔ)。第二,社會(huì)科學(xué)認(rèn)識(shí)方式從“非科學(xué)”到“科學(xué)”的轉(zhuǎn)變。在小數(shù)據(jù)時(shí)代,量化人性和定量人的行為是困難的,而大數(shù)據(jù)時(shí)代賦予“定量人性”以現(xiàn)實(shí)可行性?!盁o(wú)尺度網(wǎng)絡(luò)”概念的提出者艾伯特·拉斯洛·巴拉巴西(Albert-LászlóBarabási)指出,“人類(lèi)行為93%是可以預(yù)測(cè)的”,“人類(lèi)大部分行為都受制于規(guī)律、模型以及原理法則,而且它們的可重現(xiàn)性和可預(yù)測(cè)性與自然科學(xué)不相上下”[19]。巴拉巴西由此提出人類(lèi)社會(huì)發(fā)展呈現(xiàn)冪律式周期爆發(fā)運(yùn)動(dòng)。雅虎的首席科學(xué)家沃茨(Watts)更進(jìn)一步指出,由于大數(shù)據(jù)出現(xiàn),社會(huì)科學(xué)將脫下“準(zhǔn)科學(xué)”的外衣,真正走進(jìn)科學(xué)的殿堂[20]。從哲學(xué)意義上講,大數(shù)據(jù)第四范式從“未知”發(fā)現(xiàn)“未知”的認(rèn)知方式改變了傳統(tǒng)哲學(xué)關(guān)于“可能與現(xiàn)實(shí)”的關(guān)系,大數(shù)據(jù)的核心價(jià)值在于發(fā)現(xiàn)潛在價(jià)值和防范潛在風(fēng)險(xiǎn),大數(shù)據(jù) “一切皆可預(yù)測(cè)”的功能和價(jià)值大大提高了人類(lèi)行為的前瞻性和防范風(fēng)險(xiǎn)的能力。
從精準(zhǔn)出版的意義上講,“一切皆可預(yù)測(cè)”和“可能與現(xiàn)實(shí)”關(guān)系的改變要求我們改變關(guān)注點(diǎn),即從關(guān)注“現(xiàn)實(shí)讀者用戶”轉(zhuǎn)變?yōu)橥瑫r(shí)要關(guān)注“可能讀者用戶”或“潛在讀者用戶”,過(guò)去我們通常強(qiáng)調(diào)“讀者是上帝”,但關(guān)注的只是存在著現(xiàn)實(shí)買(mǎi)賣(mài)關(guān)系的“讀者”,而不關(guān)注對(duì)“潛在讀者用戶”的挖掘。主要原因是缺乏對(duì)讀者用戶數(shù)據(jù)的挖掘。在出版領(lǐng)域,將可能的“潛在用戶”挖掘、發(fā)展成“現(xiàn)實(shí)用戶”的常見(jiàn)措施是基于智能分組的出版物推薦系統(tǒng),讀者用戶只要在淘寶、京東、拼多多、當(dāng)當(dāng)和亞馬遜有過(guò)購(gòu)買(mǎi)出版物或者瀏覽過(guò)出版物的記錄,都會(huì)同時(shí)伴隨出現(xiàn)相關(guān)出版物的推薦。運(yùn)用這種推薦系統(tǒng)的成功案例是2013年推出新版《紙牌屋》的奈飛公司(Netflix),它改變了過(guò)去單純依靠算法來(lái)優(yōu)化推薦系統(tǒng)的傳統(tǒng)模式,而是通過(guò)模擬人的大腦活動(dòng)建構(gòu)更接近人的個(gè)性化需要的智能化出版物推薦系統(tǒng)。埃里克·西格爾指出:“Netflix是預(yù)測(cè)分析應(yīng)用的先行者,它租借出去的70%的影碟都通過(guò)預(yù)測(cè)分析在網(wǎng)絡(luò)得到推薦。推薦對(duì)于零售業(yè)來(lái)說(shuō)越來(lái)越重要。這不僅僅是商家單方面的銷(xiāo)售指數(shù),如果能精準(zhǔn)地為客戶推薦產(chǎn)品,那也是為消費(fèi)者提供的貼身化和個(gè)性化服務(wù)。”[21]滿足讀者用戶個(gè)性化需要的精準(zhǔn)出版本質(zhì)上也是智能出版,而智能出版是大數(shù)據(jù)時(shí)代的必然產(chǎn)物。從人類(lèi)精神生產(chǎn)和智能活動(dòng)的進(jìn)步來(lái)看,數(shù)據(jù)是信息的基礎(chǔ),信息是知識(shí)的基礎(chǔ),知識(shí)是智能的基礎(chǔ)。人類(lèi)的智力活動(dòng),就是將數(shù)據(jù)轉(zhuǎn)化為信息,將信息轉(zhuǎn)化為知識(shí),將知識(shí)轉(zhuǎn)化為智能的邏輯過(guò)程。
3 基于“超文本”的精準(zhǔn)出版
“超文本”一詞最早由美國(guó)學(xué)者特德·納爾遜(Ted Nelsom)在1965年提出,雖然在他之前,范尼瓦·布什(Vannevar Bush)在1930年代就提出了存儲(chǔ)擴(kuò)充器(memory extender,Memex)的想法,他設(shè)想了文本的一種非線性結(jié)構(gòu),但第一次正式使用“超文本”一詞的是特德·納爾遜。“超文本”既是一種超鏈接的,將不同空間和不同格式的信息數(shù)據(jù)組織起來(lái)的網(wǎng)狀文本,更是一種用戶界面范式。網(wǎng)狀非線性是其結(jié)構(gòu)特點(diǎn),多通道并行傳輸是其傳播特點(diǎn)。
從哲學(xué)意義上研究“超文本”的主要是羅蘭·巴特(Roland Barthes)和德里達(dá)(Derrida)等解構(gòu)主義語(yǔ)言學(xué)家,他們從語(yǔ)義分析角度出發(fā),指出語(yǔ)言表達(dá)過(guò)程中言語(yǔ)所表達(dá)的意義既不是線性的,也不是單一的,其原因在于語(yǔ)言中能指與所指之間的對(duì)應(yīng)關(guān)系會(huì)受到“第三者”的干擾,或者由于語(yǔ)境變化而產(chǎn)生意義分裂,能指會(huì)滑向另一層所指,所指也會(huì)滑向另一層能指。語(yǔ)言的意義由此會(huì)從原來(lái)的線性單一結(jié)構(gòu)演變成非線性的、復(fù)雜的、無(wú)邊的網(wǎng)狀結(jié)構(gòu)。羅蘭·巴特在《S/Z》一書(shū)中指出:當(dāng)讀者閱讀文本時(shí),意識(shí)中“理性的邏輯方式與象征的邏輯扭作一團(tuán)。這象征的邏輯不是演繹的,而是聯(lián)合的:它與另外的觀念、另外的意象、另外的意指作用具體之文聯(lián)合起來(lái)我們被告知唯一的文本不存在”[22]。羅蘭·巴將對(duì)文本閱讀的設(shè)計(jì)只是“理想文本”。但其“理想文本”概念一直被視為超文本的理論基礎(chǔ)。而真正意義上“超文本”是直到計(jì)算機(jī)和網(wǎng)絡(luò)普及,特別是大數(shù)據(jù)、云計(jì)算、新一代人工智能蓬勃發(fā)展起來(lái)以后才得以實(shí)現(xiàn)的。在泛互聯(lián)和大數(shù)據(jù)條件下,讀者的閱讀已經(jīng)由以往單一的文本閱讀擴(kuò)展為文字、圖片、音頻、視頻等多媒體甚至全媒體交互式閱讀,閱讀介質(zhì)也由以往的平面媒介擴(kuò)展為立體媒介閱讀,以至于“媒介不再是訊息,它是訊息本身”[23]。
從哲學(xué)方法論意義上說(shuō),基于大數(shù)據(jù)的“超文本”改變了科學(xué)主義的決定論觀點(diǎn)。科學(xué)主義認(rèn)為只有自然界是決定論的,只有自然現(xiàn)象是遵循必然規(guī)律并可以預(yù)測(cè)的;而人類(lèi)社會(huì)是非決定論的,是雜亂無(wú)章,無(wú)規(guī)律可循的。顯然,這種決定論觀點(diǎn)是與小數(shù)據(jù)時(shí)代相聯(lián)系的。在小數(shù)據(jù)時(shí)代,人們的社會(huì)活動(dòng)錯(cuò)綜復(fù)雜,人的社會(huì)活動(dòng)數(shù)據(jù)變動(dòng)不居,千頭萬(wàn)緒;特別是個(gè)人情感數(shù)據(jù)、人群社會(huì)交往數(shù)據(jù)等,大都是非結(jié)構(gòu)性數(shù)據(jù),既難以收集,更難以分析整理。正如中國(guó)工程院院士李國(guó)杰所說(shuō):“人們?nèi)粘I钪兴a(chǎn)生和獲取的數(shù)據(jù)85%以上是非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)無(wú)法勝任這些數(shù)據(jù)的處理,因?yàn)殛P(guān)系數(shù)據(jù)庫(kù)系統(tǒng)的出發(fā)點(diǎn)是追求高度的數(shù)據(jù)一致性和容錯(cuò)性?!盵24]在大數(shù)據(jù)條件下,以Hadoop和MapRduce為代表的非關(guān)系數(shù)據(jù)分析技術(shù),使人類(lèi)獲得了處理非結(jié)構(gòu)性數(shù)據(jù)的強(qiáng)大能力。通過(guò)社交網(wǎng)絡(luò)服務(wù)(SNS)獲取人們的網(wǎng)聊記錄,通過(guò)在線支付獲得人們的消費(fèi)記錄,通過(guò)LBS獲得地理位置信息,通過(guò)視頻監(jiān)控、電子郵件獲取人們的言談舉止數(shù)據(jù)。這些“超文本”數(shù)據(jù)大大擴(kuò)展了對(duì)人的認(rèn)知范圍和認(rèn)知深度。出版作為符號(hào)信息的社會(huì)化工作,“隨著符號(hào)的精細(xì)化、準(zhǔn)確化、形象化,同時(shí)也伴隨著人類(lèi)精神的自我認(rèn)知與發(fā)展,人類(lèi)精神活動(dòng)得以在其中直觀展開(kāi)”[25]。
從精準(zhǔn)出版的意義上講,“超文本”對(duì)傳統(tǒng)出版有兩個(gè)重要改變:一是“超文本”的網(wǎng)絡(luò)全媒體結(jié)構(gòu)改變了人們傳統(tǒng)的、單一的、線性閱讀方式,交互式、體驗(yàn)式閱讀大大提高了人的閱讀參與性和閱讀興趣。由于全媒體閱讀的發(fā)展,中國(guó)三大電信運(yùn)營(yíng)商都投入巨資進(jìn)入圖書(shū)閱讀市場(chǎng),中國(guó)移動(dòng)推出“和閱讀”,中國(guó)電信推出“天翼閱讀”,中國(guó)聯(lián)通則推出“沃·讀者”。還有一些網(wǎng)絡(luò)文學(xué)運(yùn)營(yíng)商不斷拓展閱讀體驗(yàn)新空間,如塔讀文學(xué)推出“富媒體互動(dòng)閱讀計(jì)劃”,其網(wǎng)上運(yùn)營(yíng)的“閱space”客戶端,圍繞互動(dòng)閱讀提供圖文并茂、音頻視頻交互、頁(yè)面多樣套用的閱讀內(nèi)容。時(shí)代出版?zhèn)髅酵瞥觥皶r(shí)光流影TimeFace”閱讀社交化計(jì)劃,“QQ閱讀”把閱讀和社交結(jié)合起來(lái),其精彩內(nèi)容可以在朋友圈鏈接、傳遞、分享。這種閱讀方式移動(dòng)化、社交化、互動(dòng)式、網(wǎng)絡(luò)化的趨勢(shì)是“超文本”帶給出版精準(zhǔn)化、個(gè)性化、定制化的機(jī)遇。二是“超文本”的網(wǎng)絡(luò)無(wú)邊、即時(shí)特性改變了傳統(tǒng)單一的學(xué)習(xí)方式,在線學(xué)習(xí)大大提高了人們學(xué)習(xí)的便捷性和選擇性。中央電視臺(tái)曾以“慕課來(lái)了”作過(guò)專題報(bào)道,“慕課”作為一種基于互聯(lián)網(wǎng)和大數(shù)據(jù)的教學(xué)模式,其“線上+線下”的資源整合模式比傳統(tǒng)單一線下教學(xué)更有優(yōu)勢(shì)?!澳秸n”的迅猛發(fā)展使得課程教材出版也出現(xiàn)了“紙質(zhì)版教材+光電網(wǎng)絡(luò)教材”的價(jià)值構(gòu)造。美國(guó)高等教育在線學(xué)習(xí)公司Sipx副總裁海瑟·魯蘭·斯特圖斯(Heather Rez Stratus)指出,“ 慕課對(duì)于出版產(chǎn)業(yè)拓展出版空間具有重要價(jià)值。‘慕課需要內(nèi)容,學(xué)術(shù)出版商應(yīng)該抓住這一機(jī)會(huì)為‘慕課提供內(nèi)容,從而拓展新的市場(chǎng)”[26]。從體量上說(shuō),慕課是面向億萬(wàn)人的超大課堂;從個(gè)人需求來(lái)說(shuō),慕課又是私人定制、按需組合的精準(zhǔn)課堂??梢哉f(shuō),“慕課”既拓展了傳統(tǒng)的課堂學(xué)習(xí)方式,也拓展了傳統(tǒng)的線下出版方式。
當(dāng)然,“超文本”不僅僅只是改變了傳統(tǒng)的出版格式和格局,更重要的是改變了出版?zhèn)鞑サ睦砟詈退伎挤绞健J聦?shí)上,基于羅蘭·巴特的“理想文本”理念和計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的發(fā)展,全球出版業(yè)在幾十年前就已經(jīng)開(kāi)始從紙媒體時(shí)代向多媒體時(shí)代的轉(zhuǎn)型。中國(guó)很多出版機(jī)構(gòu)不僅擁有紙質(zhì)出版物的出版權(quán),還擁有電子音像和網(wǎng)絡(luò)出版物的出版權(quán),在出版?zhèn)鹘y(tǒng)紙質(zhì)圖書(shū)基礎(chǔ)上,不少出版機(jī)構(gòu)還推出電子版、手機(jī)版、網(wǎng)絡(luò)版以及應(yīng)用程序(App)等多種媒體出版物。但是,幾十年過(guò)去后,多媒體出版的效果并不盡如人意。分析其原因主要有兩個(gè)。
第一,只轉(zhuǎn)變媒體方式而沒(méi)有轉(zhuǎn)變出版理念。很多出版機(jī)構(gòu)還是沿用老式的出版理念來(lái)運(yùn)營(yíng)新媒體,像搬家一樣將老的、紙質(zhì)的內(nèi)容拷貝到新媒體上,而并不在意這些內(nèi)容的簡(jiǎn)單搬家式移植是否符合讀者用戶的個(gè)性化需要,這種用老思維嫁接新技術(shù)的做法本質(zhì)上是沒(méi)有理解新媒體的價(jià)值和意義。其實(shí),新媒體之新,不僅僅表現(xiàn)在技術(shù)上和形式上將文字、圖表、音頻、視頻等多種格式的文本集于一身,更重要的是它從傳播學(xué)意義上消解了傳播者和接受者主客二分的二元身份,使傳播者能變成接受者,使接受者能變成傳播者。同時(shí),新媒體特別是網(wǎng)絡(luò)媒體的應(yīng)用還改變了傳統(tǒng)傳播的時(shí)空特性。而在線閱讀、移動(dòng)閱讀打破了以往傳播時(shí)間和傳播空間的局限性,使閱讀成為可以實(shí)時(shí)、實(shí)地進(jìn)行的個(gè)性化選擇。顯然,新媒體突破了傳統(tǒng)媒體的主客二分和時(shí)空局限性,具有個(gè)性化、互動(dòng)性、精準(zhǔn)性、及時(shí)性、移動(dòng)性、開(kāi)放性、海量性、低成本等特點(diǎn),而其中精準(zhǔn)傳播和互動(dòng)傳播是新媒體最本質(zhì)的特征。美國(guó)《在線》(OnLine)雜志在對(duì)新媒體進(jìn)行定義時(shí)指出:“新媒體是所有人對(duì)所有人的傳播。從這個(gè)意義上說(shuō),傳播受眾不再是單純的、被動(dòng)的信息接受者,受眾同時(shí)也是轉(zhuǎn)播主體?!泵绹?guó)學(xué)者J·A·巴倫(J.A.Barron)在20世紀(jì)60年代提出的受眾參與理論在互聯(lián)網(wǎng)、移動(dòng)互聯(lián)時(shí)代日益變成日常傳播實(shí)踐。正因?yàn)槿绱?,新聞傳播學(xué)界有人提出以“用戶”概念替代“受眾”概念[27]。
第二,缺乏大數(shù)據(jù)思維,不注重讀者用戶的數(shù)據(jù)收集、數(shù)據(jù)挖掘和數(shù)據(jù)利用,只是把新媒體當(dāng)做簡(jiǎn)單的傳播工具。目前,很多紙媒出版的App都不注意分析用戶行為數(shù)據(jù),很少有運(yùn)用“用戶網(wǎng)絡(luò)行為畫(huà)像”的成功運(yùn)作案例。用戶畫(huà)像是一種能將定性與定量方法很好地結(jié)合在一起的載體,定性的方法通過(guò)對(duì)用戶的生活情境、使用場(chǎng)景、用戶心智進(jìn)行分析,對(duì)用戶的性質(zhì)和特征做出抽象與概括;定量的方法可以對(duì)特征做精細(xì)的統(tǒng)計(jì)分析與計(jì)算,獲得對(duì)于用戶較為精準(zhǔn)的認(rèn)識(shí),便于在數(shù)值排序的基礎(chǔ)上實(shí)現(xiàn)核心用戶的發(fā)掘與突出[28]。但遺憾的是,出版行業(yè)目前在運(yùn)用“用戶畫(huà)像”實(shí)現(xiàn)精準(zhǔn)出版方面還沒(méi)有真正起步。最突出的表現(xiàn)是,移動(dòng)用戶的閱讀高峰一般出現(xiàn)在晚上十點(diǎn)至凌晨一點(diǎn)這一時(shí)間段,這一時(shí)間段很多出版媒體的App反而不再更新內(nèi)容,因?yàn)轶w制原因,這一高峰段傳統(tǒng)媒體員工都下班了。媒體既然面對(duì)的是讀者和用戶,就要知己知彼,讀懂用戶的消費(fèi)需求。為了精準(zhǔn)了解用戶行為,美國(guó)創(chuàng)業(yè)公司海馬(Hiptype)推出一套專門(mén)的電子閱讀分析工具,既能統(tǒng)計(jì)讀者的試讀次數(shù)和購(gòu)買(mǎi)次數(shù),還能統(tǒng)計(jì)讀者的年齡、職業(yè)、性別、收入、居住地址及閱讀愛(ài)好,并通過(guò)對(duì)數(shù)據(jù)分析繪制“讀者圖譜”。當(dāng)今的社會(huì)化閱讀,早已將大眾傳播的內(nèi)容移植到人際交往平臺(tái)上,社交平臺(tái)產(chǎn)生的大量“超文本”非結(jié)構(gòu)性數(shù)據(jù),一般都是通過(guò)音頻、視頻、網(wǎng)絡(luò)日志、圖片、聊天記錄等非邏輯形式表現(xiàn)出來(lái)的。過(guò)去由于缺乏大數(shù)據(jù)技術(shù),這些非結(jié)構(gòu)性數(shù)據(jù)大都被當(dāng)做“數(shù)據(jù)垃圾”和“數(shù)據(jù)廢氣”舍棄。在大數(shù)據(jù)時(shí)代,處理“黑暗數(shù)據(jù)”和“數(shù)據(jù)廢氣”已不是太大的技術(shù)難題,出版行業(yè)要真正建立基于讀者用戶個(gè)性化需要的精準(zhǔn)出版新業(yè)態(tài),亟需進(jìn)行出版理念和思維方式的革命。
注 釋
[1] [美]托馬斯·克倫普.數(shù)字人類(lèi)學(xué)[M].北京:中央編譯出版社,2007:110-111
[2] [15] [21][美]埃里克·西格爾(Eric Siegel)著;周昕譯.大數(shù)據(jù)預(yù)測(cè)[M].北京:中信出版社,2014:259,235,149
[3] 孫海悅.云南出版集團(tuán)開(kāi)展“精準(zhǔn)出版年”活動(dòng)[N].中國(guó)新聞出版廣電報(bào),2016-03-29
[4] 曾鴻,吳蘇倪.基于微博的大數(shù)據(jù)用戶畫(huà)像與精準(zhǔn)營(yíng)銷(xiāo)[J]現(xiàn)代經(jīng)濟(jì)信息,2016(16):306-308
[5] [美]艾略茲,利波曼,埃頓.數(shù)字化圖書(shū)的定量文化分析[J].科學(xué),2011(1):176-182
[6]楊鑫倢.終有一天,大數(shù)據(jù)會(huì)“顛覆”出版業(yè)[N].IT時(shí)報(bào),2013-08-16
[7]愛(ài)德華·諾沃特卡.極具創(chuàng)意的圖書(shū)基因組計(jì)劃[EB/OL].[2018-06-11].http://www.bookdao.com/article/27706/.htm
[8] 白志如.國(guó)內(nèi)眾籌出版項(xiàng)目的內(nèi)容分析與發(fā)展建議[J].出版科學(xué),2014(5):74
[9] 麻震敏.大數(shù)據(jù)時(shí)代:營(yíng)銷(xiāo)智慧的進(jìn)化論[J].成功營(yíng)銷(xiāo),2012(7):82-83
[10]蔡 翔.傳統(tǒng)出版融合發(fā)展 :進(jìn)程、規(guī)律、模式與路徑[J].出版科學(xué),2019(2):10
[11] 鄧仲華,李志芳.科學(xué)研究范式的演化:大數(shù)據(jù)時(shí)代的科學(xué)研究第四范式[J].情報(bào)資料工作,2013(4):19-23
[12]T.S.庫(kù)恩著;李寶恒,紀(jì)樹(shù)立譯.科學(xué)革命的結(jié)構(gòu)[M].上海:上??茖W(xué)出版社,1980:29
[13]Tony Hey Stewart Tansley Kristin Tolle著;潘教峰,張曉林譯.第四范式:數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)[M].北京:科學(xué)出版社,2012:11
[14]黃曉艷,單曉釗.關(guān)于大數(shù)據(jù):訪中國(guó)工程院院士倪光南[J].高科技與產(chǎn)業(yè)化,2013(5):40-45
[16]涂子沛.大數(shù)據(jù)[M].桂林:廣西師范大學(xué)出版社,2013:329
[17]陳明.數(shù)據(jù)密集型科研第四范式[J].計(jì)算機(jī)教育,2013(9):103-106
[18]梁娜,曾燕.推進(jìn)數(shù)據(jù)密集科學(xué)發(fā)現(xiàn)提升科技創(chuàng)新能力:新模式、新方法、新挑戰(zhàn):《第四范式:數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)》譯著出版[J].中國(guó)科學(xué)院院刊,2013(1):115-121
[19][美]艾伯特·拉斯洛·巴拉巴西著;馬慧譯.爆發(fā):大數(shù)據(jù)時(shí)代預(yù)見(jiàn)未來(lái)的新思維[M].北京:中國(guó)人民大學(xué)出版社出版,2012:Ⅲ
[20]D.J.Watts.“A twenty-first century science”[J].Nature,2007,volune445:489
[22][法]羅蘭·巴特著;屠友祥譯. S/Z[M].上海:人民出版社,2000:136
[23][美]尼葛洛龐帝著;胡泳,范海燕譯.數(shù)字化生存[M].??冢汉D铣霭嫔?,1996:68
[24]李國(guó)杰.大數(shù)據(jù)研究的科學(xué)價(jià)值[J].中國(guó)計(jì)算機(jī)學(xué)會(huì)通訊,2012(9):10
[25]侯亞丁.媒介產(chǎn)業(yè)的價(jià)值生態(tài)[J].出版科學(xué),2015(1):53
[26]孫牧. 大數(shù)據(jù)推動(dòng)學(xué)術(shù)出版革新[N]. 中國(guó)出版?zhèn)髅缴虉?bào),2013-10-08
[27]曹疆.從內(nèi)容為王到用戶至上[N],中國(guó)產(chǎn)經(jīng)新聞報(bào),2013-04-14
[28]牛溫佳,劉吉強(qiáng),石川,等.用戶網(wǎng)絡(luò)行為畫(huà)像:大數(shù)據(jù)中的用戶網(wǎng)絡(luò)行為畫(huà)像分析與內(nèi)容推薦應(yīng)用[M].北京:電子工業(yè)出版社,2016:3
(收稿日期: 2019-04-04)