張品慧,李 旺,許 鑫
近年來信息技術(shù)迅速發(fā)展,新工具、新方法的出現(xiàn)與計(jì)算能力的提升對人文社會科學(xué)產(chǎn)生了深刻影響,數(shù)據(jù)密集型研究范式促進(jìn)傳統(tǒng)人文研究的轉(zhuǎn)型與嬗變。新范式為復(fù)雜科學(xué)問題帶來新技術(shù)和新的解決思路,理論和方法的移植與創(chuàng)新加快了自然科學(xué)向人文和社會科學(xué)滲透,學(xué)科融合成為必然趨勢,進(jìn)而產(chǎn)生了一批交叉學(xué)科。在此背景下,促進(jìn)學(xué)科融合成為我國重要的學(xué)科發(fā)展戰(zhàn)略目標(biāo)。
2019年教育部等13個部門聯(lián)合啟動“六卓越一拔尖”計(jì)劃2.0[1],提出全面推進(jìn)新文科建設(shè),數(shù)字人文作為人文與社會科學(xué)領(lǐng)域最具代表性的交叉學(xué)科之一,被看作新文科建設(shè)的重要抓手。2020年國務(wù)院學(xué)位委員會、教育部將交叉學(xué)科設(shè)置為第14個學(xué)科門類[2],意在提升交叉學(xué)科的認(rèn)同度,為交叉學(xué)科提供發(fā)展通道,在此政策下,“集成電路科學(xué)與工程”“國家安全學(xué)”兩個學(xué)科已被認(rèn)定為一級學(xué)科。
當(dāng)下國外已有不少開設(shè)數(shù)字人文專業(yè)或項(xiàng)目的實(shí)踐,而由于國內(nèi)外學(xué)科設(shè)立方式存在差異,數(shù)字人文在我國的專業(yè)化嘗試還很少。國外學(xué)科設(shè)立整體呈現(xiàn)重引導(dǎo)、輕計(jì)劃的特點(diǎn)。以美國為例,高等院校具有自主設(shè)立學(xué)科專業(yè)的權(quán)力,其學(xué)科專業(yè)分類系統(tǒng)(CIP)根據(jù)高校已設(shè)立專業(yè)由下而上地整合編制而成。我國專業(yè)管理更看重計(jì)劃性,教育部發(fā)布學(xué)科門類目錄,由上而下設(shè)立學(xué)科門類和一級學(xué)科,高校僅能自行確定二級學(xué)科[3]。數(shù)字人文研究在快速膨脹,同時也處于迷茫期,存在泛化危機(jī)[4],其是否完全具備一門獨(dú)立學(xué)科的資格一直存在爭議[5]。由于尚未正式劃定學(xué)科歸屬,若以獨(dú)立學(xué)科視角來看數(shù)字人文,其基礎(chǔ)、成長性如何?學(xué)術(shù)共同體呈現(xiàn)何種模態(tài)?距離成為交叉學(xué)科門類下的一級學(xué)科還有多遠(yuǎn)?本研究希望以中外文相關(guān)研究的融合數(shù)據(jù)為基礎(chǔ),回答數(shù)字人文的學(xué)科性問題,為未來數(shù)字人文在我國的發(fā)展與相關(guān)學(xué)科制度的建設(shè)提供參考。
從研究熱點(diǎn)到獨(dú)立學(xué)科的轉(zhuǎn)變,須有扎實(shí)的理論體系與研究方法、完善的基礎(chǔ)設(shè)施與人才培養(yǎng)方案等條件作為支撐。諸多學(xué)者從理論角度對數(shù)字人文的研究對象、研究方法的界定與歸納展開探討。John Unsworth將數(shù)字人文研究的特性用發(fā)現(xiàn)、注釋、比較、參考、抽樣、說明、表示來概括[6]。2001年David Robey提出數(shù)字人文的研究全景圖[7],2002年Willard McCarty對全景圖作了闡釋,并總結(jié)出數(shù)字人文的研究方法共同體(MethodologicalCommons)[8]。Tobias Blanke等沿此路徑,將方法共同體的概念進(jìn)行抽象化、理論化,得到5種數(shù)字人文的基本原語:發(fā)現(xiàn)、收集、比較、發(fā)布和協(xié)作,以及若干二級原語[9-10]。劉煒等總結(jié)出數(shù)字人文的技術(shù)體系、理論結(jié)構(gòu)與應(yīng)用展現(xiàn)[11]。朱本軍等回顧了全球范圍內(nèi)的數(shù)字人文實(shí)踐,提出數(shù)字人文將成為圖書館可實(shí)踐的新方向[12]。
一般而言,學(xué)科指包含制度層面、理智層面的系統(tǒng)化知識[13],是一定的科學(xué)領(lǐng)域或科學(xué)分支[14]。對學(xué)科界定標(biāo)準(zhǔn)的研究古已有之。Leo Apostel亦提出人、活動、內(nèi)部或外部的相互作用、更新的方法、歷史性學(xué)習(xí)方法5個獨(dú)立的學(xué)科成立的必要條件[15]。綜合諸多觀點(diǎn),長期以來學(xué)界已經(jīng)形成“三獨(dú)立”學(xué)科標(biāo)準(zhǔn),即需要同時具備獨(dú)有的研究對象、獨(dú)特的研究方法、獨(dú)立的理論體系方能稱之為獨(dú)立的學(xué)科[16]。《學(xué)位授予和人才培養(yǎng)學(xué)科目錄設(shè)置與管理辦法》基于“三獨(dú)立”標(biāo)準(zhǔn)提出4個基本條件設(shè)立一級學(xué)科[17]。但隨著當(dāng)代知識生產(chǎn)方式向跨學(xué)科模式轉(zhuǎn)變,學(xué)界也出現(xiàn)了對傳統(tǒng)學(xué)科界定標(biāo)準(zhǔn)的審思[16]。方澤強(qiáng)提出新的學(xué)科標(biāo)準(zhǔn)——明確的研究對象與獨(dú)特而不可替代的規(guī)律[13]。付八軍等認(rèn)為要從功用(Uses)和思想(Idea)雙翼來檢視學(xué)科的合理性與合法性[16]。而針對交叉學(xué)科的持續(xù)性特點(diǎn),張琳等主張?jiān)黾咏徊鎸W(xué)科的開放性,為尚在發(fā)展中的交叉學(xué)科提供發(fā)展空間[14]。
數(shù)字人文領(lǐng)域的獨(dú)立學(xué)科界定一直存在爭論。1990年代后期,Willard McCarty認(rèn)為人文計(jì)算已是一個獨(dú)立學(xué)科,需要設(shè)計(jì)制度、規(guī)范為人文計(jì)算研究提供保障與支持,他還指出數(shù)字人文的學(xué)科界定需考慮不同國家學(xué)術(shù)文化之間的差異性[18]。Svensson將數(shù)字人文比喻為給不同學(xué)科領(lǐng)域的研究者提供討論場所而搭建的“大帳篷”(big-tent DigitalHumanities),指出其存在過多的異質(zhì)性(Heterogeneity)而缺乏制度的穩(wěn)定性,更應(yīng)被看作一個領(lǐng)域而非學(xué)科[19]。但作為人文計(jì)算的延承,數(shù)字人文在國際上已被大多數(shù)學(xué)者當(dāng)做一門獨(dú)立學(xué)科進(jìn)行研究。
從人才培養(yǎng)視角看,數(shù)字人文領(lǐng)域在國外高校已有諸多實(shí)踐。除設(shè)立數(shù)字人文研究機(jī)構(gòu)外,許多高校開設(shè)數(shù)字人文專業(yè)及課程,如英國倫敦大學(xué)學(xué)院、倫敦國王學(xué)院以及美國威斯康星大學(xué)麥迪遜分校、印第安納大學(xué)伯明頓分校。國內(nèi)高校也在陸續(xù)開展數(shù)字人文教育實(shí)踐。專業(yè)設(shè)立方面,中國人民大學(xué)信息資源管理學(xué)院在圖書情報與檔案管理一級學(xué)科下自設(shè)數(shù)字人文二級學(xué)科。課程方面,北京大學(xué)、南京大學(xué)分別開設(shè)面向數(shù)據(jù)素養(yǎng)和面向歷史研究的數(shù)字人文課程。
當(dāng)下對數(shù)字人文內(nèi)涵的探討已不鮮見,已有研究中亦不乏對學(xué)術(shù)共同體識別的嘗試與對獨(dú)立學(xué)科判定標(biāo)準(zhǔn)的審思。但一方面由于語言、地理邊界限制,以及單一合著指標(biāo)在挖掘深層次研究興趣耦合方面的局限,學(xué)術(shù)共同體的識別效果不盡人意;另一方面也少有將學(xué)科內(nèi)涵、學(xué)術(shù)共同體等要素與獨(dú)立學(xué)科的判別標(biāo)準(zhǔn)相結(jié)合,對學(xué)科性進(jìn)行探討的研究。據(jù)此,本文嘗試融合多源數(shù)據(jù),從學(xué)科成長性、學(xué)科研究主題、學(xué)科共同體模態(tài)等多個維度對數(shù)字人文的學(xué)科性進(jìn)行分析,探究數(shù)字人成為獨(dú)立學(xué)科的潛力。
某一交叉學(xué)科領(lǐng)域能被認(rèn)定為獨(dú)立一級學(xué)科,需要兼顧科學(xué)性與靈活性的判定標(biāo)準(zhǔn),既要參考《學(xué)位授予和人才培養(yǎng)學(xué)科目錄設(shè)置與管理辦法》與相關(guān)研究中的核心要素,又不能忽視交叉學(xué)科具有的問題導(dǎo)向、跨學(xué)科合作等特點(diǎn)。結(jié)合二者,本文給出4個評價獨(dú)立學(xué)科可供參考的標(biāo)準(zhǔn):(1)學(xué)科范疇,指是否具有創(chuàng)新、明確的學(xué)科研究范疇,是否已演進(jìn)整合出可歸屬的二級學(xué)科或成熟的研究方向;(2)研究者角度,基于共同主題、通過特定學(xué)術(shù)行為而自然耦合的學(xué)術(shù)共同體是否已經(jīng)形成,并具有成長性;(3)學(xué)科基礎(chǔ)建設(shè)情況,包括期刊設(shè)置、機(jī)構(gòu)開設(shè)、人才培養(yǎng)機(jī)制是否完善;(4)問題導(dǎo)向,社會是否有相對應(yīng)需求,以驅(qū)動該交叉學(xué)科的發(fā)展[20]。
文獻(xiàn)系既定領(lǐng)域最直接的研究產(chǎn)出載體,以文獻(xiàn)的內(nèi)容屬性如題名、關(guān)鍵詞等為著眼點(diǎn)可以梳理歸納出學(xué)科研究范疇,研究者的增長態(tài)勢與學(xué)術(shù)共同體模態(tài)由著者的統(tǒng)計(jì)信息、學(xué)者-關(guān)鍵詞網(wǎng)絡(luò)反映,學(xué)科基礎(chǔ)建設(shè)情況則可以通過研究機(jī)構(gòu)、期刊、各校人才培養(yǎng)情況透視。在文獻(xiàn)數(shù)據(jù)之外,數(shù)字人文具有很強(qiáng)的應(yīng)用導(dǎo)向特征,結(jié)合對數(shù)字人文項(xiàng)目的調(diào)研與統(tǒng)計(jì),可以了解當(dāng)下數(shù)字人文的應(yīng)用需求。本文希望以數(shù)字人文相關(guān)文獻(xiàn)融合數(shù)據(jù)為核心,結(jié)合中外已有的數(shù)字人文相關(guān)學(xué)科制度,從上述4個維度分析數(shù)字人文在我國成為獨(dú)立交叉學(xué)科的可能性。
對數(shù)字人文的學(xué)科性研究應(yīng)當(dāng)立足于本土,又著眼于國際,不僅要了解我國數(shù)字人文研究的發(fā)展概況,也要關(guān)注、參考國際上數(shù)字人文領(lǐng)域的發(fā)展演變趨勢。因此,本研究分別從中外文引文數(shù)據(jù)庫獲取數(shù)據(jù),并將多源異構(gòu)數(shù)據(jù)進(jìn)行融合。外文方面選取Web of Science核心數(shù)據(jù)集為數(shù)據(jù)源,中文方面選取CNKI數(shù)據(jù)庫中哲學(xué)與人文科學(xué)、社會科學(xué)I刊、社會科學(xué)Ⅱ刊、信息科技、經(jīng)濟(jì)與管理科學(xué)5個專輯內(nèi)容為數(shù)據(jù)源,以“digital humanities”(數(shù)字人文),“humanity computing”(人文計(jì)算)為檢索詞進(jìn)行試檢索,文獻(xiàn)類型限定為“學(xué)術(shù)期刊”(article)。在兼顧查全率和查準(zhǔn)率的情況下,最后確定外文檢索式為:TS="digital humanities"or TS="humanities computing"or TS="digitalhumanity"or TS="humanity computing"or TS=("digital"NEAR humanities)or TS=("humanities"NEAR computing)or TS=("digital"NEAR humanity)or TS=("humanity"NEAR computing)or TS="literary and linguistic computing"or TS="humanist informatics"or TS="humanities computer science"or TS="cultural and heritage informatics";相對應(yīng)的中文檢索式為:SU="數(shù)字人文"or SU="人文計(jì)算"or SU="計(jì)算人文"??紤]到2021年數(shù)據(jù)尚不完整,因此將發(fā)文年份限制在2020年及以前。檢索時間為2021年4月16日,英文文獻(xiàn)檢索數(shù)量為1,754,中文文獻(xiàn)數(shù)量為872。經(jīng)過數(shù)據(jù)去重、去除無效文章、逐一篩選等初步清洗后,共得到2,626條文獻(xiàn)題錄數(shù)據(jù),以此作為本研究的基礎(chǔ)數(shù)據(jù)。
本研究主要采用文獻(xiàn)計(jì)量、文本聚類、社會網(wǎng)絡(luò)分析方法,對外文題錄數(shù)據(jù)中的作者字段進(jìn)行對齊消歧,再將外文關(guān)鍵詞進(jìn)行批翻譯。由于外文文獻(xiàn)的作者關(guān)鍵詞往往粒度較細(xì),結(jié)合Python的Jieba分詞庫與人工核對的方式將關(guān)鍵詞粒度與語義與中文文獻(xiàn)對齊,最終統(tǒng)一數(shù)據(jù)格式,將多源數(shù)據(jù)進(jìn)行融合。
研究路線上,從相關(guān)研究的數(shù)量、機(jī)構(gòu)、期刊等透視出數(shù)字人文領(lǐng)域研究的外部概況,再進(jìn)一步從作者角度分析數(shù)字人文領(lǐng)域的成長性。為探究數(shù)字人文領(lǐng)域的研究主題及研究熱點(diǎn),運(yùn)用關(guān)鍵詞聚類方法對數(shù)字人文的研究方向進(jìn)行分析。為了解數(shù)字人文領(lǐng)域的學(xué)術(shù)共同體構(gòu)成,構(gòu)建作者-關(guān)鍵詞二模網(wǎng)絡(luò),參考生成的關(guān)鍵詞聚類對數(shù)字人文的學(xué)術(shù)共同體進(jìn)行識別與分析。在此基礎(chǔ)上,對我國數(shù)字人文成為獨(dú)立的一級交叉學(xué)科的可能性與潛力進(jìn)行總結(jié),如圖1所示。
圖1 本文研究路線
(1)發(fā)文年份。論文數(shù)量的時序變化是衡量某一領(lǐng)域發(fā)展的重要指標(biāo)之一。通過對數(shù)字人文領(lǐng)域發(fā)表論文的逐年統(tǒng)計(jì),得到圖2所示的時間分布曲線。數(shù)字人文發(fā)展歷程大致分為3個階段:人文計(jì)算階段(2004年前)、數(shù)字人文初始階段(2004-2012)、數(shù)字人文增長階段(2013-2020)。2004年前,人文計(jì)算概念出現(xiàn),相關(guān)研究較少且停留于人文學(xué)科的傳統(tǒng)研究范式。2004年《人文計(jì)算指南》改名為《數(shù)字人文指南》,象征著人文計(jì)算進(jìn)入數(shù)字人文時代。在數(shù)字資源發(fā)展、數(shù)字化及富媒體等信息技術(shù)成熟的環(huán)境下,人文計(jì)算的研究對象、研究方法實(shí)現(xiàn)了從文本到所有數(shù)字資源的范圍拓展[21],計(jì)算機(jī)、人文等多個學(xué)科領(lǐng)域廣泛掀起討論與研究數(shù)字人文的熱潮。2013年數(shù)字人文領(lǐng)域的發(fā)文量顯著躍升,此后數(shù)字人文領(lǐng)域的研究保持增長迅猛的勢頭,研究熱度持續(xù)增加,研究產(chǎn)出碩果累累。
圖2 數(shù)字人文發(fā)文年份分布
(2)發(fā)文機(jī)構(gòu)。研究機(jī)構(gòu)是承載研究者與研究項(xiàng)目的平臺,對學(xué)科建設(shè)起重要支持作用,能快速聚集高校優(yōu)勢資源,實(shí)現(xiàn)學(xué)科的研究深化、人才培養(yǎng)與隊(duì)伍建設(shè)。在迅猛發(fā)展態(tài)勢下,數(shù)字人文研究機(jī)構(gòu)遍布65個國家和地區(qū),國際數(shù)字人文中心網(wǎng)絡(luò)(Center Net)收錄的研究中心逾200個[22]。從發(fā)文量來看,數(shù)字人文的研究產(chǎn)出集中于中國(910)、美國(553)、英國(195)、德國(165)。具體到研究機(jī)構(gòu),發(fā)文量前15位的研究機(jī)構(gòu)以中國、英國和美國的高校及研究中心為主。南京大學(xué)被引次數(shù)最多,2018年設(shè)立數(shù)字人文創(chuàng)研中心[23],在歷史地理信息化、數(shù)字史學(xué)、人文社科數(shù)據(jù)庫等方面進(jìn)行建設(shè),系國內(nèi)最具學(xué)術(shù)影響力的數(shù)字人文研究機(jī)構(gòu)之一。武漢大學(xué)在數(shù)字人文領(lǐng)域亦成果斐然,早在2011年便建立了中國大陸首家數(shù)字人文研究中心[24],致力于研究文化遺產(chǎn)資源數(shù)字化、文化領(lǐng)域知識圖譜建設(shè)、古籍文本挖掘與可視化等方面的理論、方法與技術(shù)。
就國外看,倫敦大學(xué)發(fā)文量與h指數(shù)均為最高,在領(lǐng)域中具有廣泛影響力。倫敦大學(xué)系統(tǒng)中,倫敦大學(xué)學(xué)院和倫敦國王學(xué)院在數(shù)字人文領(lǐng)域亦有廣泛研究。倫敦大學(xué)學(xué)院設(shè)立UCL數(shù)字人文中心(UCLDH)[25],致力于科學(xué)技術(shù)在藝術(shù)、人文和文化遺產(chǎn)方面的研究和應(yīng)用。倫敦國王學(xué)院在數(shù)字人文領(lǐng)域有比較悠久的研究傳統(tǒng),其人文藝術(shù)學(xué)院下成立的數(shù)字人文系(Department of Digital Humanities)[26],前身是1992年成立的“人文計(jì)算中心(Centre for Computing in the Humanities)”,在人文大數(shù)據(jù)、數(shù)字文化與數(shù)字社會、數(shù)字勞動力等領(lǐng)域都有廣泛研究。在美國,包括常春藤盟校在內(nèi)的諸多知名院校在數(shù)字人文領(lǐng)域積開展了諸多實(shí)踐。加州大學(xué)系統(tǒng)中,以加州大學(xué)洛杉磯分校為代表在學(xué)校層面成立了獨(dú)立的數(shù)字人文研究中心——數(shù)字科研與教學(xué)研究所(Institute for Digital Research and Education,IDRE)[27],研究方向集中在數(shù)字文化地圖、媒介理論系譜學(xué)、文本技術(shù)以及全球媒體研究。
表1 數(shù)字人文領(lǐng)域的主要研究機(jī)構(gòu)(Top15)
(3)刊載期刊分析。期刊設(shè)置上,國內(nèi)外收錄數(shù)字人文文獻(xiàn)的期刊在學(xué)科分類上有所差異。國際上,數(shù)字人文具有一批獨(dú)立的學(xué)術(shù)期刊,據(jù)統(tǒng)計(jì)共有19種[28],大量數(shù)字人文研究集中于此類期刊,歐洲數(shù)字人文協(xié)會主辦的《數(shù)字人文學(xué)刊》(DigitalScholarshipintheHumanities),國際數(shù)字人文組織聯(lián)盟贊助出版的《數(shù)字人文季刊》(Digital Humanities Quarterly)系其中代表。領(lǐng)域?qū)I(yè)期刊外,其他學(xué)科期刊也收錄少量數(shù)字人文文獻(xiàn),如德國歷史學(xué)期刊《歷史社會研究》(Historical Social Research)以及《檔案學(xué)期刊》(Journal of Documentation)分別收錄25和21篇數(shù)字人文相關(guān)文獻(xiàn)。
在國內(nèi),數(shù)字人文交流的主要陣地是圖書情報類期刊,數(shù)字人文專業(yè)期刊僅有近年新創(chuàng)刊的《數(shù)字人文》《數(shù)字人文研究》《數(shù)位典藏與數(shù)位人文》3種。數(shù)字人文專業(yè)期刊的空缺導(dǎo)致國內(nèi)數(shù)字人文研究主要刊載于《圖書館論壇》《圖書館雜志》《圖書情報工作》等圖書情報類期刊,小部分則發(fā)表于檔案學(xué)及其他人文學(xué)科期刊。
表2 數(shù)字人文主要發(fā)表期刊(Top15)
(1)研究者沉淀。衡量一個學(xué)術(shù)領(lǐng)域是否適應(yīng)社會需求、是否具有成長性的重要要素是該領(lǐng)域的研究者,研究者是構(gòu)建學(xué)科領(lǐng)域的最核心資源,學(xué)術(shù)研究是研究者知識的外在體現(xiàn)。一個領(lǐng)域具有成長性、滿足社會需求直接體現(xiàn)為該領(lǐng)域的整體研究人數(shù)的增長,以及沉淀為該領(lǐng)域?qū)W者,因此對領(lǐng)域作者的持續(xù)研究情況進(jìn)行分析同樣重要。普萊斯指數(shù)中以5年為發(fā)表年限觀察文獻(xiàn)老化的規(guī)律,將5年看作新文獻(xiàn)活躍窗口。因此,以5年為窗口期對作者復(fù)現(xiàn)情況作統(tǒng)計(jì)。圖3顯示了以5年為窗口期的各年份數(shù)字人文研究者復(fù)現(xiàn)情況:2008年前數(shù)字人文研究者復(fù)現(xiàn)增長速度較慢,且由于研究者數(shù)量較少,復(fù)現(xiàn)率波動較大,數(shù)字人文尚未進(jìn)入穩(wěn)定發(fā)展階段,研究者難以形成穩(wěn)定、延續(xù)的研究;2010年后數(shù)字人文領(lǐng)域的研究者復(fù)現(xiàn)數(shù)量和復(fù)現(xiàn)率都相對平穩(wěn),作者復(fù)現(xiàn)數(shù)量在2018年前穩(wěn)步增長,復(fù)現(xiàn)率在15%上下波動。由此看出,數(shù)字人文領(lǐng)域已經(jīng)逐漸沉淀了一批學(xué)者,且呈增長態(tài)勢。
圖3 數(shù)字人文研究者增長、復(fù)現(xiàn)情況分布
(2)主要研究者。數(shù)字人文融合多個學(xué)科的理論、方法與技術(shù),吸引不同學(xué)科學(xué)者的關(guān)注。根據(jù)前15位作者總發(fā)文量和數(shù)字人文領(lǐng)域發(fā)文數(shù)看出,將數(shù)字人文作為主要研究方向的學(xué)者較少,僅有陳濤的數(shù)字人文論文占比超過50%,其自2018年從事數(shù)字人文研究,屬于新晉研究者,在16篇論文中有62.5%為數(shù)字人文論文。此外,國內(nèi)數(shù)字人文研究多由圖書情報研究領(lǐng)域的作者發(fā)表,一定數(shù)量的學(xué)者從圖書情報學(xué)向數(shù)字人文領(lǐng)域轉(zhuǎn)移,但總體上數(shù)字人文僅為學(xué)者的研究主題或細(xì)分方向之一。與國內(nèi)學(xué)者相比,國外學(xué)者在數(shù)字人文的研究上更為專注。Warwick,C和Terras,M早期即投身數(shù)字人文領(lǐng)域,之后長期躬耕于數(shù)字人文研究,數(shù)字人文相關(guān)論文分別占其所有發(fā)文數(shù)的37.84%與28.85%。
表3 數(shù)字人文領(lǐng)域主要作者(Top15)
關(guān)鍵詞聚類分析可以揭示某一領(lǐng)域的研究范圍以及研究熱點(diǎn),一方面可用作評估學(xué)科是否具有一定規(guī)模以及若干研究方向,另一方面也可以透視領(lǐng)域未來可能形成的子學(xué)科(或二級學(xué)科)。使用VOSviewer對數(shù)字人文研究的作者關(guān)鍵詞進(jìn)行聚類,為展示效果考慮,篩選出現(xiàn)頻次較高的關(guān)鍵詞193個。在得到初步聚類結(jié)果后對部分聚類效果不理想的詞進(jìn)行清理對齊與手動分類,最終得到180個關(guān)鍵詞聚類結(jié)果,如圖4所示。
圖4 數(shù)字人文研究主題聚類
從圖4可以看出,高頻關(guān)鍵詞普遍集中于2015年以后,顯示了近5年來數(shù)字人文領(lǐng)域研究主題、研究方向的多樣化。研究主題基本可分為4個類別:數(shù)字人文技術(shù)基礎(chǔ)、地理與可視化、數(shù)字化與文本、數(shù)字人文公共文化服務(wù),分別顯示技術(shù)的堅(jiān)實(shí)程度、表現(xiàn)形式的多樣化、研究內(nèi)容的深化程度、研究成果的傳播廣度。
(1)數(shù)字人文技術(shù)基礎(chǔ)研究。數(shù)字人文依托的技術(shù)研究關(guān)鍵詞有“知識圖譜”“關(guān)聯(lián)數(shù)據(jù)”“大數(shù)據(jù)”“計(jì)算”“基礎(chǔ)設(shè)施”等,數(shù)字化使得一切研究對象都成為了可計(jì)算的數(shù)字實(shí)體,其存儲、計(jì)算和分析都需要數(shù)據(jù)技術(shù)的支持。掃描技術(shù)提供大量源數(shù)據(jù),分布式存儲與計(jì)算提供存儲與計(jì)算能力,知識圖譜、關(guān)聯(lián)數(shù)據(jù)等提供算法支持,三者協(xié)作支持,構(gòu)建出數(shù)字人文未來智慧化的遠(yuǎn)景。圖4的聚類結(jié)果顯示,技術(shù)基礎(chǔ)研究在數(shù)字人文發(fā)展中長期活躍,早期數(shù)字人文研究集中于數(shù)字人文的計(jì)算、通信等技術(shù)手段,近年來本體論、關(guān)聯(lián)數(shù)據(jù)、機(jī)器學(xué)習(xí)、知識圖譜等技術(shù)手段為數(shù)字人文未來規(guī)范發(fā)展提供堅(jiān)實(shí)的框架與逐步完善的范式。
(2)地理與可視化研究。其代表關(guān)鍵詞有“地理信息系統(tǒng)”(GIS)、“城市”“中心”“可視化分析”等。此類研究將地理科學(xué)中GIS理論與方法移植于歷史研究領(lǐng)域,為人文信息的可視化研究提供了方法路徑。聚類結(jié)果中可以看出,在2016年后GIS相關(guān)的數(shù)字人文可視化研究受到了相當(dāng)關(guān)注,以GIS為基礎(chǔ)的空間分析法在歷史研究中已有大量成功案例,國內(nèi)外數(shù)字人文研究機(jī)構(gòu)積極推進(jìn)人文數(shù)據(jù)庫及其可視化平臺建設(shè)。此外,三維建模、虛擬現(xiàn)實(shí)(VR)、動作捕捉、計(jì)算機(jī)視覺(CV)的發(fā)展和廣泛應(yīng)用為數(shù)字人文的可視化項(xiàng)目落地進(jìn)行技術(shù)賦能。
(3)數(shù)字化與文本研究。此研究包含“人文學(xué)者”“古籍?dāng)?shù)字化”“歷史”“語言”“編碼”等高頻關(guān)鍵詞,其研究主題包括歷史人文資源的數(shù)字化處理、歸檔、編碼、計(jì)算等過程。歷史人文資源包含古籍檔案、文物書畫等多種實(shí)體類型,其收藏位置分散、易損壞等特性限制了人文學(xué)者數(shù)字化、批量化分析的可能性。當(dāng)下的新興技術(shù)催生出音頻、視頻等數(shù)據(jù)形式,為多維度建立人文資源的數(shù)字孿生體提供了可能性。聚類視圖中也可看出數(shù)字人文領(lǐng)域近年來對文本中的國家、歷史、文化等深層次語義內(nèi)容的關(guān)注。
(4)數(shù)字人文公共文化服務(wù)研究。該類研究關(guān)鍵詞有“圖書館”“博物館”“檔案館”“文獻(xiàn)計(jì)量”等,涉及博物館、檔案館、圖書館等機(jī)構(gòu)主體提供數(shù)字人文公共文化服務(wù)的研究。數(shù)字人文展現(xiàn)形式多樣,天然具有公共傳播屬性,逐漸成為聯(lián)通學(xué)界與公眾的一條公共文化長廊,打破公眾與人文資源間的信息鴻溝。以圖書館為代表的各公共文化服務(wù)機(jī)構(gòu)不斷推進(jìn)數(shù)字人文的開放傳播研究,探索公共文化機(jī)構(gòu)在數(shù)字人文環(huán)境下的定位、策略,成為推動數(shù)字人文項(xiàng)目建設(shè)的中堅(jiān)力量。
學(xué)術(shù)共同體是指在一定范圍內(nèi)研究興趣或方向具有或潛在具有耦合性,能共同推動學(xué)術(shù)發(fā)展的研究者群體。穩(wěn)定且具有活力的學(xué)科共同體是學(xué)科發(fā)展的驅(qū)動力量。通過對數(shù)字人文領(lǐng)域?qū)W術(shù)共同體的識別,能探究數(shù)字人文的研究結(jié)構(gòu),反映學(xué)者間顯性或隱性的聯(lián)系,衡量學(xué)科的發(fā)展?jié)摿Α?/p>
本文融合題錄數(shù)據(jù),篩選出數(shù)字人文相關(guān)關(guān)鍵詞數(shù)大于15的研究者以及出現(xiàn)頻次大于20的高頻關(guān)鍵詞,經(jīng)過篩選獲得165個核心研究者與115個高頻關(guān)鍵詞,使用社會網(wǎng)絡(luò)可視化軟件NetDraw生成學(xué)者-關(guān)鍵詞共現(xiàn)的二模網(wǎng)絡(luò)。圖5展示了高頻關(guān)鍵詞與數(shù)字人文核心作者的共現(xiàn)關(guān)系。目前數(shù)字人文的學(xué)術(shù)共同體已經(jīng)相當(dāng)清晰,核心作者已經(jīng)形成有共同研究主題且具有合作關(guān)系的數(shù)字人文共同體,但由于學(xué)者學(xué)科背景差異,又劃分為若干子群。結(jié)合數(shù)字人文研究主題聚類結(jié)果,可以將數(shù)字人文的研究者與研究關(guān)鍵詞劃分至圖5所示的4個子群中,其中地理與可視化研究、數(shù)字化與文本研究、技術(shù)基礎(chǔ)研究等子群的核心作者以國外作者為主,國內(nèi)學(xué)者則集中在公共文化服務(wù)研究子群中。技術(shù)基礎(chǔ)研究子群是該二模網(wǎng)絡(luò)的基礎(chǔ),起到聯(lián)通其它子群的作用,大量研究者通過該子群連接其他共同體,“數(shù)據(jù)管理”“基礎(chǔ)設(shè)施”“網(wǎng)絡(luò)”“計(jì)算”等數(shù)字技術(shù)關(guān)鍵詞連接了大量作者節(jié)點(diǎn)。公共文化服務(wù)子群的組成主要為國內(nèi)圖書情報學(xué)、檔案學(xué)等專業(yè)的研究者,該子群與其他方法、技術(shù)的子群相聯(lián)通,強(qiáng)調(diào)利用技術(shù)賦能公共文化服務(wù)。
圖5 基于“學(xué)者-關(guān)鍵詞”二模網(wǎng)絡(luò)的共同體
本文通過對數(shù)字人文多源融合數(shù)據(jù)的多維度分析,得到以下結(jié)論:
(1)學(xué)科交叉融合背景下,數(shù)字人文研究具有成長性和發(fā)展空間。新的數(shù)字技術(shù)予力各人文學(xué)科,計(jì)算機(jī)、文學(xué)、歷史、圖書情報等學(xué)科的研究者跨越學(xué)科藩籬匯集于此,國內(nèi)外涌現(xiàn)大量數(shù)字人文學(xué)者和研究機(jī)構(gòu),不斷豐富數(shù)字人文研究成果。數(shù)字人文在當(dāng)下是研究熱點(diǎn),未來亦將成為研究者持續(xù)深耕的沃土。隨著積累與沉淀的深化,數(shù)字人文的底蘊(yùn)與內(nèi)涵將愈發(fā)深厚。
(2)數(shù)字人文下的子學(xué)科具備成為二級學(xué)科的潛質(zhì)。技術(shù)基礎(chǔ)研究作為數(shù)字人文研究領(lǐng)域中的基礎(chǔ),以其為支撐,地理與可視化、數(shù)字化與文本研究分別從表現(xiàn)形式、內(nèi)涵深度兩個維度探索數(shù)字人文“重塑人文”的可能性,國內(nèi)學(xué)者則尤為關(guān)注數(shù)字人文作為公共文化服務(wù)在傳播文化、推動教育方面的潛力,未來數(shù)字人文或可區(qū)分研究方向設(shè)立若干二級學(xué)科進(jìn)行細(xì)化研究。
(3)數(shù)字人文的學(xué)術(shù)共同體已經(jīng)形成,但理論基礎(chǔ)仍較為薄弱。數(shù)字人文學(xué)術(shù)研究已經(jīng)形成清晰的共同體,根據(jù)研究方向也已經(jīng)形成若干互相關(guān)聯(lián)又有所區(qū)分的子群。但當(dāng)下數(shù)字人文仍缺乏獨(dú)特的研究方法與范式,已有研究方法往往來自于其他學(xué)科。比如,目前數(shù)字人文項(xiàng)目中廣泛使用的知識圖譜構(gòu)建技術(shù)、自然語言處理與文本挖掘技術(shù)均來自于計(jì)算機(jī)科學(xué),而GIS等可視化技術(shù)亦非數(shù)字人文首創(chuàng)。
(4)數(shù)字人文以實(shí)踐與應(yīng)用為導(dǎo)向,應(yīng)著重建設(shè)人才培養(yǎng)體系。當(dāng)下國內(nèi)外數(shù)字人文研究機(jī)構(gòu)已經(jīng)開發(fā)出一批高質(zhì)量的數(shù)字人文項(xiàng)目,在學(xué)術(shù)傳播、資源共享、加強(qiáng)教學(xué)實(shí)踐方面展現(xiàn)出良好效果。數(shù)字人文的項(xiàng)目建設(shè)需要大量人才,為了加強(qiáng)數(shù)字人文人才儲備,國際上已經(jīng)建立起較為完善的數(shù)字人文人才培養(yǎng)體系,倫敦大學(xué)、加州大學(xué)等高校都已設(shè)立數(shù)字人文專業(yè)或相關(guān)課程。
總結(jié)上述觀點(diǎn),本文認(rèn)為數(shù)字人文具有獨(dú)立學(xué)科的研究基礎(chǔ)和成長性,亦形成了清晰的學(xué)術(shù)共同體,但理論基礎(chǔ)薄弱、權(quán)威學(xué)科期刊缺失。數(shù)字人文在國際上已被認(rèn)為是一門獨(dú)立交叉學(xué)科,在我國有成為獨(dú)立學(xué)科的潛力與趨勢,但仍需時間積累。未來我國數(shù)字人文研究者應(yīng)確立學(xué)科意識與學(xué)科規(guī)范,加強(qiáng)國際交流合作與數(shù)字人文學(xué)科基礎(chǔ)理論方面的研究;相關(guān)研究機(jī)構(gòu)與各高等教育機(jī)構(gòu)應(yīng)借鑒國外數(shù)字人文學(xué)科建設(shè)經(jīng)驗(yàn),加快高質(zhì)量的專業(yè)學(xué)術(shù)期刊建設(shè),在數(shù)字人文學(xué)科人才培養(yǎng)方面作更多探索。
本文基于多源異構(gòu)的文獻(xiàn)題錄數(shù)據(jù),結(jié)合多種定量方法對數(shù)字人文領(lǐng)域的學(xué)科概貌和發(fā)展趨勢進(jìn)行了客觀分析,認(rèn)為數(shù)字人文在中國具有成為獨(dú)立的一級交叉學(xué)科的潛力,但在學(xué)科基礎(chǔ)建設(shè)方面存在不足之處。文章存在之局限可供后續(xù)研究參考,包括并不限于:其一,數(shù)字人文研究成果形式不限于文獻(xiàn),以數(shù)據(jù)庫或其他非學(xué)術(shù)期刊形式存在的成果難以度量;其二,部分研究雖未冠以數(shù)字人文之題名或關(guān)鍵詞,但本質(zhì)實(shí)為數(shù)字人文領(lǐng)域的研究,此類文獻(xiàn)數(shù)據(jù)未納入基礎(chǔ)數(shù)據(jù)中;其三,國際上的數(shù)字人文期刊并非完全被Web of Science收錄。后續(xù)研究可考慮補(bǔ)充此三類數(shù)據(jù),更完整地揭示數(shù)字人文學(xué)科作為獨(dú)立交叉學(xué)科的的發(fā)展?jié)摿Α?/p>