国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向數(shù)字人文的知識(shí)服務(wù)出版模式探索

2018-04-26 12:02:09薛志紅
中國(guó)出版 2018年5期
關(guān)鍵詞:知識(shí)庫(kù)人文學(xué)術(shù)

□文│薛志紅

近年來(lái),隨著信息技術(shù)發(fā)展及其在科學(xué)研究領(lǐng)域的應(yīng)用,數(shù)據(jù)收集和處理方式發(fā)生了巨大變化,科學(xué)研究的方式也發(fā)生了革命性的變化,于是出現(xiàn)了基于數(shù)據(jù)密集型的科學(xué)發(fā)現(xiàn)新模式。美國(guó)計(jì)算機(jī)專(zhuān)家、圖靈獎(jiǎng)得主吉姆·格雷(Jim Gray)2007年提出數(shù)據(jù)密集型科學(xué)類(lèi)型,2009 年微軟研究院出版了《第四范式: 數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)》(The Fourth Paradigm: Data-intensive Scientific Discovery),提出了基于數(shù)據(jù)密集型計(jì)算的科學(xué)研究“第四范式”。數(shù)據(jù)驅(qū)動(dòng)的科研發(fā)現(xiàn)和基于研究數(shù)據(jù)的知識(shí)管理,已經(jīng)成為許多領(lǐng)域的重要基石,包括人文社會(huì)科學(xué)領(lǐng)域。[1]基于數(shù)據(jù)計(jì)算和應(yīng)用的數(shù)字人文(Digital Humanities)成為人文領(lǐng)域的創(chuàng)新研究范式并得到廣泛關(guān)注。

人文學(xué)界紛紛開(kāi)展數(shù)字人文研究,哈佛大學(xué)、北京大學(xué)和中國(guó)臺(tái)灣“中研院”三方合作建立“中國(guó)歷代人物傳記數(shù)據(jù)庫(kù)”(China Biographical Database,簡(jiǎn)稱(chēng)CBDB),復(fù)旦大學(xué)歷史地理研究中心開(kāi)發(fā)中國(guó)歷史地理信息系統(tǒng)(CHGIS),南京大學(xué)雙語(yǔ)詞典研究中心利用語(yǔ)料庫(kù)開(kāi)展辭典編纂和翻譯學(xué)研究等;歐美國(guó)家的一些大學(xué)已經(jīng)建立了跨學(xué)科的數(shù)字人文研究中心,如美國(guó)喬治梅森大學(xué)歷史與新媒體中心、加州大學(xué)洛杉磯分校數(shù)字人文中心、劍橋大學(xué)文字與語(yǔ)言學(xué)計(jì)算中心、美國(guó)斯坦福人文實(shí)驗(yàn)室、倫敦國(guó)王學(xué)院數(shù)字人文研究中心,等等;國(guó)際上的數(shù)字人文研究聯(lián)盟也已經(jīng)出現(xiàn),各種數(shù)字人文主題會(huì)議在全球頻繁召開(kāi),南京大學(xué)于2017年6月舉辦了“數(shù)字人文:大數(shù)據(jù)時(shí)代人文研究前沿與探索”學(xué)術(shù)研討會(huì)。

人文學(xué)術(shù)出版作為科學(xué)研究的重要支撐,必須支持?jǐn)?shù)字人文這種研究范式。2016年10月,國(guó)家新聞出版廣電總局提倡“關(guān)注知識(shí)挖掘與發(fā)現(xiàn)、知識(shí)關(guān)聯(lián)與重組、知識(shí)應(yīng)用與管理、自然語(yǔ)言理解與深度學(xué)習(xí)等技術(shù);關(guān)注主題詞表、敘詞表、本體建設(shè)等工具;關(guān)注知識(shí)資源加工、資源管理、產(chǎn)品運(yùn)營(yíng)與服務(wù)管理等系統(tǒng);關(guān)注知識(shí)服務(wù)模式創(chuàng)新”。[2]2018年1月9日,中國(guó)出版協(xié)會(huì)常務(wù)副理事長(zhǎng)鄔書(shū)林在第八屆中國(guó)學(xué)術(shù)出版年會(huì)演講時(shí)指出:“信息技術(shù)的進(jìn)步對(duì)學(xué)術(shù)出版提出了新的要求,……國(guó)際上學(xué)術(shù)出版已從單純的出書(shū)、出刊、出數(shù)據(jù)庫(kù),到現(xiàn)在自覺(jué)把出版工作融入科學(xué)研究、經(jīng)濟(jì)發(fā)展和社會(huì)生活當(dāng)中,為其提供知識(shí)和信息的解決方案,為科學(xué)家、經(jīng)濟(jì)決策人、讀者更好地從事科學(xué)研究、經(jīng)濟(jì)發(fā)展和社會(huì)生活提供知識(shí)和信息服務(wù),這已經(jīng)成為出版的新的重要理念。近年來(lái),中國(guó)出版業(yè)也響亮地提出了知識(shí)服務(wù)的出版理念?!盵3]當(dāng)前,國(guó)外數(shù)據(jù)庫(kù)出版商蓋爾公司的蓋爾學(xué)術(shù)平臺(tái)(Gale Scholar)和谷歌公司的谷歌圖書(shū)搜索(Google Book Search)等在功能上支持?jǐn)?shù)字人文;中國(guó)知網(wǎng)2017年首頁(yè)改版,不再突出信息資源特色,而是通過(guò)“大數(shù)據(jù)研究平臺(tái)”“協(xié)同研究平臺(tái)”“行業(yè)知識(shí)服務(wù)與知識(shí)管理平臺(tái)”“中國(guó)經(jīng)濟(jì)社會(huì)大數(shù)據(jù)研究平臺(tái)”等入口突出對(duì)科學(xué)研究全方位的支持;中華書(shū)局通過(guò)“二十四史”本體創(chuàng)新性地支持歷史領(lǐng)域的數(shù)字人文研究,南京大學(xué)出版社“基于引文索引數(shù)據(jù)庫(kù)的人文社會(huì)科學(xué)雙語(yǔ)術(shù)語(yǔ)庫(kù)”項(xiàng)目,為面向數(shù)字人文的知識(shí)服務(wù)提供術(shù)語(yǔ)保障。

人文學(xué)界和包括學(xué)術(shù)出版社在內(nèi)的知識(shí)服務(wù)領(lǐng)域的探索為數(shù)字人文的發(fā)展提供了經(jīng)驗(yàn),但不可否認(rèn)的是,數(shù)字人文和面向數(shù)字人文的知識(shí)服務(wù)才剛剛起步。學(xué)術(shù)出版社要深入研究面向數(shù)字人文的知識(shí)服務(wù):數(shù)字人文究竟是怎樣的研究過(guò)程,需要哪些知識(shí)服務(wù)來(lái)支持?當(dāng)前語(yǔ)義出版、數(shù)據(jù)出版、增強(qiáng)出版等新的出版形態(tài)是否完全支持?jǐn)?shù)字人文這種研究范式?面向數(shù)字人文的知識(shí)服務(wù)有哪些特點(diǎn)?面向數(shù)字人文的知識(shí)服務(wù)的生存和發(fā)展模式是什么,社會(huì)效益和經(jīng)濟(jì)效益如何?本文擬探析上述問(wèn)題。

一、數(shù)字人文及其研究過(guò)程

數(shù)字人文的前身是“人文計(jì)算”,由20世紀(jì)40年代意大利著名人文學(xué)者羅伯特·布撒(Robert Busa)神父提出,其目的是:將學(xué)者從繁雜瑣碎的資料收集整理工作中解脫出來(lái);專(zhuān)注于提出問(wèn)題和學(xué)術(shù)發(fā)現(xiàn);極大地提高研究效率,促進(jìn)學(xué)科發(fā)展。20世紀(jì)60年代,數(shù)字人文在語(yǔ)言學(xué)領(lǐng)域獲得較多研究和應(yīng)用,產(chǎn)生了大量基于語(yǔ)料庫(kù)語(yǔ)言學(xué)的理論和實(shí)踐。大數(shù)據(jù)時(shí)代,數(shù)據(jù)足夠豐富,計(jì)算能力足夠強(qiáng)大,通信交流足夠方便,數(shù)字人文研究范式以全新的形態(tài)受到廣泛關(guān)注。

盡管數(shù)字人文在很多領(lǐng)域有豐富的實(shí)踐,但學(xué)界一直未對(duì)“數(shù)字人文”給出準(zhǔn)確定義。約翰·昂斯沃思(John Unsworth)2002年提出的“‘人文計(jì)算’是一種代表性的實(shí)踐、一種建模/模擬的方式,一種推理、一個(gè)本體論約定。這種代表性的實(shí)踐可分為兩個(gè)方面,一方面是高效的計(jì)算,另一方面是人文溝通”是一種比較經(jīng)典的表述。計(jì)算的目的是為了知識(shí)發(fā)現(xiàn),溝通的目的是為了知識(shí)表達(dá)并輔助知識(shí)發(fā)現(xiàn)。比如,黃敏聰對(duì)55組基本漢字的簡(jiǎn)繁體進(jìn)行“人文計(jì)算”,獲得了其從1946~1990年間在書(shū)籍上的使用頻率,從而發(fā)現(xiàn)漢字簡(jiǎn)繁體的演變過(guò)程;[4]又如,CBDB項(xiàng)目通過(guò)社交網(wǎng)絡(luò)方式給出朱熹的通信網(wǎng)絡(luò)[5](見(jiàn)圖1),以視覺(jué)溝通形式進(jìn)行知識(shí)表達(dá);其對(duì)朱熹通信網(wǎng)絡(luò)的計(jì)算,給出朱熹人際交往中的親疏關(guān)系和社群關(guān)系,并進(jìn)一步發(fā)現(xiàn)影響朱熹思想的人物,這就是知識(shí)發(fā)現(xiàn)。

劉煒總結(jié)了數(shù)字人文研究與傳統(tǒng)人文研究的不同之處(見(jiàn)表1)。[6]

圖1 朱熹通信網(wǎng)絡(luò)

表1 人文研究的兩種范式比較

數(shù)字人文的研究過(guò)程如圖2所示。人文學(xué)科的文獻(xiàn)經(jīng)過(guò)數(shù)字化儲(chǔ)備,形成以版權(quán)作品為單元的文獻(xiàn)型數(shù)據(jù)庫(kù);綜合若干學(xué)術(shù)需求進(jìn)行知識(shí)組織,設(shè)計(jì)知識(shí)單元,依此對(duì)數(shù)字化文獻(xiàn)進(jìn)行碎片化的知識(shí)單元抽取,形成包含實(shí)體和實(shí)體關(guān)系的領(lǐng)域知識(shí)庫(kù);針對(duì)人文學(xué)科問(wèn)題構(gòu)建模型,結(jié)合具體算法研制平臺(tái)工具,形成模型工具庫(kù);利用模型工具對(duì)知識(shí)庫(kù)中的知識(shí)單元進(jìn)行知識(shí)表達(dá)或知識(shí)計(jì)算,知識(shí)表達(dá)的形式為知識(shí)圖譜,知識(shí)計(jì)算的形式為數(shù)據(jù)報(bào)告;這些數(shù)據(jù)報(bào)告和知識(shí)圖譜經(jīng)人文專(zhuān)業(yè)學(xué)者分析解釋后,用于發(fā)現(xiàn)或印證相關(guān)知識(shí),形成人文成果;相關(guān)成果進(jìn)入科學(xué)交流體系,經(jīng)過(guò)同行評(píng)價(jià),部分成果成為有價(jià)值的新知識(shí)。

圖2 數(shù)字人文的研究過(guò)程

上述研究過(guò)程,除了“學(xué)術(shù)需求”提出和數(shù)據(jù)報(bào)告的“分析解釋”由人文學(xué)者獨(dú)立完成,其他過(guò)程都離不開(kāi)知識(shí)服務(wù)的支持,可以說(shuō),知識(shí)服務(wù)融入整個(gè)數(shù)字人文的研究周期。

二、面向數(shù)字人文的知識(shí)服務(wù)內(nèi)容

從數(shù)字人文的研究過(guò)程可以看出,面向數(shù)字人文的知識(shí)服務(wù)應(yīng)該包含以下內(nèi)容:①數(shù)字化文獻(xiàn)儲(chǔ)備,②知識(shí)組織,③模型構(gòu)建和工具研制,④知識(shí)表達(dá)和知識(shí)計(jì)算,⑤知識(shí)交流和知識(shí)評(píng)價(jià)。這些內(nèi)容有的包含在語(yǔ)義出版、增強(qiáng)出版、優(yōu)先出版等新型服務(wù)中,有的還需要新的出版業(yè)態(tài)來(lái)完善。

1.數(shù)字化文獻(xiàn)儲(chǔ)備

以版權(quán)作品為單元的高質(zhì)量、全面完整的文獻(xiàn)型數(shù)據(jù)庫(kù)是數(shù)字人文的基礎(chǔ),離開(kāi)大量原始文獻(xiàn)的數(shù)字化積累,數(shù)字人文將成為無(wú)源之水。這些文獻(xiàn)包括電子書(shū)、期刊、音頻視頻圖像作品,文獻(xiàn)型數(shù)據(jù)庫(kù)通過(guò)版權(quán)元數(shù)據(jù)進(jìn)行組織,其服務(wù)功能主要是提供篇章層次的檢索。數(shù)字化文獻(xiàn)儲(chǔ)備是當(dāng)前學(xué)術(shù)出版提供服務(wù)的主要領(lǐng)域。

2.知識(shí)組織

知識(shí)組織通過(guò)知識(shí)單元的提取和結(jié)構(gòu)化構(gòu)建知識(shí)庫(kù),為知識(shí)表達(dá)和知識(shí)計(jì)算做準(zhǔn)備。這里的知識(shí)單元包括各種粒度的結(jié)構(gòu)性知識(shí)和概念性知識(shí),如細(xì)粒度的術(shù)語(yǔ)、實(shí)體、公式、圖像,中粒度的句子和段落,以及粗粒度的章節(jié)、數(shù)據(jù)集、附加資料等。知識(shí)組織體系,如主題詞表等,本身是輕量級(jí)基礎(chǔ)知識(shí)庫(kù),同時(shí)支持領(lǐng)域知識(shí)庫(kù)構(gòu)建。

語(yǔ)義出版是當(dāng)前知識(shí)服務(wù)的主要形式,在語(yǔ)義出版領(lǐng)域,根據(jù)構(gòu)建目標(biāo)和知識(shí)組織方式不同,又有納米出版物和微型出版物[7]兩種形式。需要說(shuō)明的是,隨著原生數(shù)字化文獻(xiàn)的產(chǎn)生和知識(shí)服務(wù)的需求不斷提出,文獻(xiàn)型數(shù)據(jù)庫(kù)和知識(shí)庫(kù)融合出版加強(qiáng),研究型數(shù)據(jù)庫(kù)不斷出現(xiàn)。

知識(shí)庫(kù)包含人機(jī)共讀的結(jié)構(gòu)化數(shù)據(jù),其用戶(hù)有兩種,一是用戶(hù),二是機(jī)器。這種人和機(jī)器都能讀懂的編碼化知識(shí)被稱(chēng)為“智慧數(shù)據(jù)”。[8]當(dāng)前語(yǔ)義出版的功能主要為用戶(hù)提供基于知識(shí)單元的檢索,在服務(wù)數(shù)字人文研究方面,其作用有待進(jìn)一步開(kāi)發(fā)。語(yǔ)義出版要服務(wù)于數(shù)字人文,被機(jī)器使用,必須借助相關(guān)模型和工具。

3.模型構(gòu)建和工具研制

模型和工具的使用是數(shù)字人文研究范式與傳統(tǒng)人文研究范式的最大區(qū)別。以下為數(shù)字人文研究常用的模型:①自動(dòng)分類(lèi)聚類(lèi)模型,用于梳理文獻(xiàn)熱點(diǎn)前沿;②自動(dòng)摘要模型,實(shí)現(xiàn)海量文本“遙讀(Distant Reading)”;③統(tǒng)計(jì)分析模型,發(fā)現(xiàn)人文要素之間的關(guān)聯(lián);④GIS分析模型,發(fā)現(xiàn)空間與人文要素的關(guān)聯(lián);⑤社交網(wǎng)絡(luò)模型,研究重要人物的社交關(guān)系和思想淵源。

工具是實(shí)現(xiàn)模型的計(jì)算手段,與算法有關(guān),直接面向終端用戶(hù),模型與算法之間存在1:n關(guān)系,不同算法實(shí)現(xiàn)的模型有所區(qū)別。

在數(shù)字人文研究中,用戶(hù)根據(jù)需求自主自助選擇模型工具進(jìn)行知識(shí)生成,模型工具庫(kù)是知識(shí)服務(wù)的新內(nèi)容。模型工具庫(kù)構(gòu)建是語(yǔ)義出版的延伸,是面向數(shù)字人文的知識(shí)服務(wù)的必然趨勢(shì),它促使檢索服務(wù)走向計(jì)算服務(wù),從而實(shí)現(xiàn)“智慧服務(wù)”。中國(guó)知網(wǎng)在“中國(guó)經(jīng)濟(jì)社會(huì)大數(shù)據(jù)研究平臺(tái)”[9]中提供了若干相關(guān)分析模型、統(tǒng)計(jì)預(yù)測(cè)模型等,值得借鑒。

4.知識(shí)表達(dá)和知識(shí)計(jì)算

知識(shí)表達(dá)的方式可以是可視化知識(shí)圖譜,也可以是GIS地圖,還可能是詞云等;知識(shí)計(jì)算的結(jié)果是相關(guān)數(shù)據(jù)報(bào)告,這些報(bào)告也可能以圖譜形式表達(dá)。這種知識(shí)服務(wù)借助平臺(tái),是數(shù)字人文成果的一種形式,可以成為增強(qiáng)出版的一部分內(nèi)容。

5.知識(shí)交流和知識(shí)評(píng)價(jià)

無(wú)論是傳統(tǒng)人文還是數(shù)字人文,其研究成果都要進(jìn)入科學(xué)交流和評(píng)價(jià)體系,才能彰顯其價(jià)值所在。學(xué)術(shù)出版的最初使命就是促進(jìn)科學(xué)交流。數(shù)字人文更加促進(jìn)人文成果的生產(chǎn),優(yōu)先出版這種形式突破傳統(tǒng)出版的周期約束,成為必然趨勢(shì)。數(shù)字人文作為數(shù)據(jù)驅(qū)動(dòng)的研究范式,其成果的來(lái)源數(shù)據(jù)和研究過(guò)程應(yīng)該被學(xué)界重復(fù)檢驗(yàn)。當(dāng)前增強(qiáng)出版服務(wù)主要是數(shù)據(jù)出版,面向數(shù)字人文的知識(shí)服務(wù)應(yīng)該進(jìn)一步支持計(jì)算過(guò)程的公開(kāi),便于學(xué)界對(duì)數(shù)字人文成果進(jìn)行客觀評(píng)價(jià)。另外,目前學(xué)界流行的基于文獻(xiàn)計(jì)量的評(píng)價(jià)體系不再適應(yīng),新的評(píng)價(jià)體系有待探索。

三、面向數(shù)字人文的知識(shí)服務(wù)特點(diǎn)

面向數(shù)字人文的知識(shí)服務(wù)呈現(xiàn)出以下特點(diǎn)。

1.平臺(tái)化趨勢(shì)

面向數(shù)字人文的知識(shí)服務(wù)是基于智慧數(shù)據(jù)的服務(wù),可以看作是“智慧服務(wù)”,用戶(hù)使用平臺(tái)自助完成知識(shí)生產(chǎn)是必然趨勢(shì)。在2014中文數(shù)字出版與數(shù)字圖書(shū)館國(guó)際研討會(huì)上, 時(shí)任國(guó)家新聞出版廣電總局副局長(zhǎng)的鄔書(shū)林在談及我國(guó)知識(shí)與信息生產(chǎn)傳播業(yè)未來(lái)走向時(shí),用了一個(gè)形象的比喻——從“超市”模式向“餐館”模式轉(zhuǎn)型。[10]隨著“信息時(shí)代正在走向數(shù)據(jù)時(shí)代、數(shù)據(jù)時(shí)代同時(shí)在走向計(jì)算時(shí)代”,[11]面向數(shù)字人文的知識(shí)服務(wù)可以比喻為自助式“學(xué)術(shù)廚房”,在這個(gè)廚房中,知識(shí)服務(wù)者準(zhǔn)備了經(jīng)過(guò)清洗、分類(lèi)、編碼的食材(知識(shí)庫(kù)),提供各種煎炒烹炸的廚具(模型工具庫(kù)),還有各種餐具容器(知識(shí)表達(dá)和知識(shí)計(jì)算結(jié)果陳列),最后廚房實(shí)現(xiàn)全透明裝修(知識(shí)交流和評(píng)價(jià))。針對(duì)不同學(xué)科和問(wèn)題,“學(xué)術(shù)廚房”預(yù)設(shè)各種菜譜,各種廚具可搭配使用,也可自行組裝生成新的廚具。這個(gè)“學(xué)術(shù)廚房”提供知識(shí)生產(chǎn)的環(huán)境,在內(nèi)容上更加重視知識(shí)庫(kù)出版和模型工具庫(kù)出版,在形式上表現(xiàn)為融檢索功能、計(jì)算功能、可視化功能、自助訂制功能于一體的平臺(tái)出版。

2.融入式服務(wù)

面向數(shù)字人文的知識(shí)服務(wù)是一種融入式服務(wù),一方面,從知識(shí)服務(wù)內(nèi)容可以看出,這種知識(shí)服務(wù)是一種全生命周期的學(xué)術(shù)支持,與僅提供科學(xué)交流服務(wù)的傳統(tǒng)出版有根本區(qū)別;另一方面,這種知識(shí)服務(wù)也離不開(kāi)人文學(xué)界的支持和參與,人文學(xué)界的學(xué)科特色和問(wèn)題導(dǎo)向直接影響知識(shí)庫(kù)的構(gòu)建和模型工具庫(kù)的構(gòu)建。

在知識(shí)組織中,不同學(xué)科有不同的學(xué)術(shù)指向。比如,同樣是歷史領(lǐng)域知識(shí)庫(kù),中國(guó)古代史、中國(guó)近代史與中國(guó)當(dāng)代史知識(shí)庫(kù)的概念模型有很大差別。中國(guó)古代是家天下,中國(guó)古代史知識(shí)庫(kù)重視歷史人物之間的血緣關(guān)系表達(dá);中國(guó)近代史中戰(zhàn)爭(zhēng)戰(zhàn)役頻繁,近代史知識(shí)庫(kù)必須將戰(zhàn)爭(zhēng)戰(zhàn)役作為一個(gè)大類(lèi)并詳細(xì)設(shè)定其屬性;當(dāng)代中國(guó)史以國(guó)家建設(shè)為主要內(nèi)容,戰(zhàn)爭(zhēng)戰(zhàn)役的屬性設(shè)置可以簡(jiǎn)單些,人物之間的血緣關(guān)系也不再是重要的關(guān)聯(lián)。

在人文領(lǐng)域,由于知識(shí)的時(shí)空依賴(lài)性、主觀性、不確定性、模糊性和爭(zhēng)議性,[12]知識(shí)庫(kù)的構(gòu)建必須依賴(lài)人文領(lǐng)域?qū)<?,無(wú)論是通過(guò)機(jī)器深度學(xué)習(xí)抽取知識(shí)還是人工標(biāo)注知識(shí),知識(shí)單元的專(zhuān)業(yè)性和知識(shí)關(guān)聯(lián)的準(zhǔn)確性一定要經(jīng)專(zhuān)家認(rèn)可。

在模型構(gòu)建和工具研制中,同樣的分詞工具,依據(jù)通用詞表所作的分詞和詞頻統(tǒng)計(jì)基本不可靠,文本挖掘結(jié)果不能發(fā)揮“遙讀”的功能,學(xué)科專(zhuān)家必須參與詞表研制。

隨著知識(shí)服務(wù)成為需求,中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心最早提出“融入一線(xiàn)、嵌入過(guò)程”的“嵌入式”學(xué)科服務(wù)模式。[13]北京大學(xué)圖書(shū)館連續(xù)兩年舉辦數(shù)字人文論壇,主題分別是 “跨界與融合:全球視野下的數(shù)字人文”和“互動(dòng)與共生:數(shù)字人文與史學(xué)研究”。學(xué)術(shù)出版和圖書(shū)館都要支持面向數(shù)字人文的知識(shí)服務(wù),二者應(yīng)相互配合。圖書(shū)館有組織上的優(yōu)勢(shì),能夠?qū)崟r(shí)嵌入研究過(guò)程,學(xué)科館員對(duì)人文學(xué)科有足夠的了解;學(xué)術(shù)出版有資源和資金上的優(yōu)勢(shì),能夠解決版權(quán)問(wèn)題和調(diào)動(dòng)社會(huì)力量。學(xué)術(shù)出版一方面要從圖書(shū)館了解學(xué)科需求,另一方面與圖書(shū)館在學(xué)科知識(shí)組織體系等方面進(jìn)行合作,共同推動(dòng)數(shù)字人文研究。

四、面向數(shù)字人文的知識(shí)服務(wù)生存發(fā)展模式

中華書(shū)局的“二十四史”本體項(xiàng)目于2014年結(jié)項(xiàng),是出版界最早構(gòu)建的知識(shí)庫(kù),目前一直未成為產(chǎn)品形態(tài),其原因就是盈利模式不清。學(xué)術(shù)出版也是一種市場(chǎng)行為,面向數(shù)字人文的知識(shí)服務(wù)必須考慮生存模式,才能形成良性循環(huán)。鑒于整個(gè)知識(shí)服務(wù)都處于培育和探索階段,本文僅做一定的分析,認(rèn)為業(yè)態(tài)可能出現(xiàn)如下特征。

1.經(jīng)濟(jì)效益與社會(huì)效益并行,外力支持啟動(dòng)服務(wù)創(chuàng)新

面向數(shù)字人文的知識(shí)服務(wù)是一種新型人文學(xué)術(shù)出版,仍然遵從學(xué)術(shù)出版的經(jīng)濟(jì)效益與社會(huì)效益并行的特點(diǎn),當(dāng)前階段應(yīng)是以社會(huì)效益為主、經(jīng)濟(jì)效益為輔。2015年3月,國(guó)家新聞出版廣電總局下發(fā)《關(guān)于開(kāi)展專(zhuān)業(yè)數(shù)字內(nèi)容資源知識(shí)服務(wù)模式試點(diǎn)工作的通知》,并在經(jīng)過(guò)專(zhuān)家評(píng)選之后,選取28家單位作為知識(shí)服務(wù)模式探索的試點(diǎn)單位;[14]2018年年初又公布了第二批27家試點(diǎn)單位。[15]語(yǔ)義出版是面向數(shù)字人文的知識(shí)服務(wù)的重要內(nèi)容,政府的引導(dǎo)和支持就是希望通過(guò)項(xiàng)目產(chǎn)生社會(huì)效益,從而培育市場(chǎng),促成經(jīng)濟(jì)效益的產(chǎn)生。在這種情形下,通過(guò)縱向政府扶持或橫向與科研機(jī)構(gòu)合作項(xiàng)目,成為很多出版社面向數(shù)字人文開(kāi)展知識(shí)服務(wù)的起點(diǎn)。有實(shí)力的出版社,建議可獨(dú)立開(kāi)展此類(lèi)服務(wù)的探索。另外,鑒于面向數(shù)字人文的知識(shí)服務(wù)投入大、風(fēng)險(xiǎn)高,因此應(yīng)在項(xiàng)目初期進(jìn)行原型系統(tǒng)設(shè)計(jì),并將原型系統(tǒng)提交學(xué)界討論,一是充分聽(tīng)取學(xué)者的意見(jiàn),二是擴(kuò)大社會(huì)影響力。

2.資源出版與數(shù)據(jù)工具出版并行,開(kāi)放出版與版權(quán)出版同步

面向數(shù)字人文的知識(shí)服務(wù)凸顯數(shù)據(jù)和工具的價(jià)值。人文學(xué)科尤其重視所引用知識(shí)的出處,為保障知識(shí)單元的有據(jù)可查,應(yīng)該建立知識(shí)單元與來(lái)源文獻(xiàn)之間的關(guān)聯(lián)。一般情況下,用戶(hù)點(diǎn)擊知識(shí)圖譜中的知識(shí)單元或關(guān)聯(lián)關(guān)系時(shí),平臺(tái)應(yīng)給出來(lái)源文獻(xiàn)。也就是說(shuō),在面向數(shù)字人文的知識(shí)服務(wù)中,資源出版與數(shù)據(jù)工具出版并行。在當(dāng)前用戶(hù)體驗(yàn)不足的情況下,知識(shí)庫(kù)和模型工具庫(kù)應(yīng)該開(kāi)放出版,而文獻(xiàn)資源庫(kù)可有償使用。

3.大眾出版與定制出版并行,產(chǎn)品形態(tài)豐富多樣

面向數(shù)字人文的知識(shí)服務(wù)是需求驅(qū)動(dòng)型服務(wù)。人文學(xué)者的研究旨趣影響著知識(shí)庫(kù)的文獻(xiàn)來(lái)源、知識(shí)單元粒度、概念關(guān)系模型和模型工具庫(kù)的設(shè)計(jì)。知識(shí)庫(kù)和模型工具庫(kù)的構(gòu)建是一個(gè)不斷迭代的過(guò)程,無(wú)論當(dāng)前如何深挖用戶(hù)的潛在需求,知識(shí)庫(kù)的設(shè)計(jì)總有不完善之處,工具算法總有不滿(mǎn)足的地方。知識(shí)庫(kù)的設(shè)計(jì)一旦定型,再次修訂投入會(huì)很大,出版商應(yīng)首先滿(mǎn)足大眾出版的需求,再在有條件支持的情況下開(kāi)展定制出版。

寶寶看到新奇事物,總想知道這是什么、為什么這樣?所以就會(huì)去動(dòng)動(dòng)摸摸、敲敲打打。讓他按照自己的意愿去進(jìn)行,才能滿(mǎn)足他的學(xué)習(xí)需要,因此,不堵塞寶寶進(jìn)行自主學(xué)習(xí)的路是原則。

五、結(jié)語(yǔ)

數(shù)字人文作為一個(gè)以跨界與融合為特點(diǎn)的新興領(lǐng)域,還將不斷變化和再定義,無(wú)論是數(shù)字人文的學(xué)理研究,還是數(shù)字人文的實(shí)踐應(yīng)用都還處于初級(jí)階段。對(duì)于學(xué)術(shù)出版社面向數(shù)字人文的知識(shí)服務(wù)來(lái)說(shuō),更是面臨諸如學(xué)界需求方向、技術(shù)支持程度和商業(yè)模式的挑戰(zhàn),本文僅就其中的部分問(wèn)題進(jìn)行嘗試性的探析,有待學(xué)界和業(yè)界的進(jìn)一步理論研究和實(shí)踐探索。

注釋?zhuān)?/p>

[1]Hey T,Tansley S,Tolle K.第四范式: 數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)[M].潘教峰,張曉林,等,譯.北京: 科學(xué)出版社,2012

[2]關(guān)于開(kāi)展首批新聞出版業(yè)科技與標(biāo)準(zhǔn)重點(diǎn)實(shí)驗(yàn)室申報(bào)工作的通知[EB/OL].http://www.sapprft.gov.cn/sapprft/contents/6588/306381.shtml

[3]鄔書(shū)林.抓住信息技術(shù)進(jìn)步機(jī)遇,提升學(xué)術(shù)出版水平[EB/OL].http://www.sohu.com/a/216991262_692521

[4]黃敏聰.基于人文計(jì)算的漢字簡(jiǎn)繁體演變定量分析[J].科技視界,2012(18)

[5]中國(guó)歷代人物傳記資料庫(kù)——從軼事到資料[EB/OL].https://projects.iq.harvard.edu/cbdb/presentations-and-papers

[7]王曉光,宋寧遠(yuǎn).語(yǔ)義出版物的內(nèi)容組織架構(gòu)研究——基于納米出版物和微型出版物的比較分析[J].出版科學(xué),2017,25(4)

[8]曾蕾,王曉光,范煒.圖檔博領(lǐng)域的智慧數(shù)據(jù)及其在數(shù)字人文研究中的角色[J].中國(guó)圖書(shū)館學(xué)報(bào),2018(1)

[9]來(lái)源于中國(guó)知網(wǎng)http://data.cnki.net/

[10]知識(shí)服務(wù)或?qū)⒊晌覈?guó)數(shù)字出版產(chǎn)業(yè)新拐點(diǎn)[EB/OL].http://culture.people.com.cn/n/2014/0708/c87423-25254827.html

[11]張曉林.顛覆性變革與后圖書(shū)館時(shí)代——推動(dòng)知識(shí)服務(wù)的供給側(cè)結(jié)構(gòu)性改革[J].中國(guó)圖書(shū)館學(xué)報(bào),2018(1)

[12]董慧,余傳明,楊寧.基于本體的數(shù)字圖書(shū)館檢索模型研究(Ⅲ)——?dú)v史領(lǐng)域資源本體構(gòu)建[J].情報(bào)學(xué)報(bào),2006(5)

[13]初景利,張冬榮.第二代學(xué)科館員與學(xué)科化服務(wù)[J].圖書(shū)情報(bào)工作,2008(2)

[14]國(guó)家新聞出版廣電總局.關(guān)于開(kāi)展專(zhuān)業(yè)數(shù)字內(nèi)容資源知識(shí)服務(wù)模式試點(diǎn)工作的通知[EB/OL].http://www.gapp.gov.cn/news/1663/247536.shtml

[15]國(guó)家新聞出版廣電總局.第二批專(zhuān)業(yè)數(shù)字內(nèi)容資源知識(shí)服務(wù)模式試點(diǎn)單位遴選結(jié)果公告[EB/OL].http://mp.weixin.qq.com/s/X-iCP8d wKZ6W0EwwOcSAzw

猜你喜歡
知識(shí)庫(kù)人文學(xué)術(shù)
人文
如何理解“Curator”:一個(gè)由翻譯引發(fā)的學(xué)術(shù)思考
基于TRIZ與知識(shí)庫(kù)的創(chuàng)新模型構(gòu)建及在注塑機(jī)設(shè)計(jì)中的應(yīng)用
對(duì)學(xué)術(shù)造假重拳出擊
商周刊(2019年2期)2019-02-20 01:14:22
人文紹興
人文社科
高速公路信息系統(tǒng)維護(hù)知識(shí)庫(kù)的建立和應(yīng)用
基于Drupal發(fā)布學(xué)者知識(shí)庫(kù)關(guān)聯(lián)數(shù)據(jù)的研究
讓人文光輝照耀未來(lái)
學(xué)術(shù)
津市市| 林口县| 定边县| 永丰县| 华阴市| 利津县| 呼玛县| 新竹市| 鄄城县| 沧州市| 巩义市| 和政县| 南岸区| 木里| 永新县| 灵台县| 托克逊县| 安化县| 洛南县| 九龙城区| 乾安县| 东安县| 醴陵市| 泸溪县| 普定县| 古丈县| 诏安县| 禄劝| 丰都县| 双桥区| 修武县| 彰武县| 土默特左旗| 昌邑市| 科尔| 和顺县| 江孜县| 铜梁县| 晋州市| 池州市| 长宁县|