劉 芳 余望枝
(1.三峽大學(xué) 湖北宜昌 443002;2.武漢大學(xué) 武漢 430020)
近年來,國內(nèi)外數(shù)字人文研究逐漸興起。2021年1月15日,“圖像學(xué)視域下的文學(xué)藝術(shù)研究”被列入2020年度“中國十大學(xué)術(shù)熱點(diǎn)”[1]。數(shù)字人文(Digital Humanities)將信息技術(shù)應(yīng)用于人文社會科學(xué)研究,通過信息挖掘、文本分析、關(guān)聯(lián)數(shù)據(jù)等分析非結(jié)構(gòu)化研究對象之間的時空關(guān)系、社會關(guān)系,展現(xiàn)宏觀、系統(tǒng)、多元、開放的知識圖譜,為人文研究者提供了全新的思維方式和研究方法。
隨著信息技術(shù)的發(fā)展,數(shù)字人文的研究機(jī)構(gòu)不斷增多,研究應(yīng)用領(lǐng)域日趨豐富。目前國內(nèi)外多所高校設(shè)立了數(shù)字人文研究中心,國際上已成立數(shù)字人文中心網(wǎng)絡(luò)(CenterNet)[2]、人文中心和研究所(CHCI,Consortium of Humanities Centers and Institutes)[3]以及數(shù)字人文組織聯(lián)盟 (ADHO,Alliance of Digital Humanities Organizations)[4]等多個數(shù)字人文研究聯(lián)盟。這些數(shù)字人文研究聯(lián)盟主要分布在北美洲與歐洲,多以高校和圖書館為依托,涉及人文社會科學(xué)、媒體研究、數(shù)字藝術(shù)和其他相關(guān)領(lǐng)域。文章通過調(diào)研數(shù)字人文中心網(wǎng)絡(luò)(CenterNet)、人文中心和研究所(CHCI)、數(shù)字人文組織聯(lián)盟(ADHO)及國內(nèi)相關(guān)機(jī)構(gòu)數(shù)字人文項(xiàng)目建設(shè)的情況,對數(shù)字人文研究環(huán)境下的圖書館資源建設(shè)與服務(wù)模式提出了幾點(diǎn)思考及建議。
文章調(diào)研的國外數(shù)字人文研究聯(lián)盟中,由高校數(shù)字人文中心、人文計(jì)算與媒體中心、數(shù)字人文實(shí)驗(yàn)室及相關(guān)學(xué)院主辦或協(xié)作參與的部分?jǐn)?shù)字人文中國項(xiàng)目建設(shè),突破人文學(xué)科的傳統(tǒng)研究方式,特別關(guān)注數(shù)字資源保存、數(shù)據(jù)挖掘關(guān)聯(lián)、古籍文本分析、地理信息可視化、技術(shù)服務(wù)支持等工作,開展技術(shù)標(biāo)準(zhǔn)、基礎(chǔ)設(shè)施組件、語義技術(shù)和文本技術(shù)方法等研究,促進(jìn)不同領(lǐng)域?qū)<抑g的跨學(xué)科協(xié)作。
數(shù)字資源保存項(xiàng)目主要是對重要的歷史檔案、珍貴的作品手稿及聲像資料進(jìn)行數(shù)字化處理,采用詞頻分析、語義挖掘等技術(shù)進(jìn)行深度分析和呈現(xiàn),目的在于保護(hù)歷史文化遺產(chǎn)。美國弗吉尼亞大學(xué)人文高等技術(shù)學(xué)院“峽口:四川山村的道德景觀(Xiakou : Moral Landscape in a Sichuan Mountain Village)”項(xiàng)目以中國四川省西部雅安市天全縣山區(qū)的峽口村作為研究對象,對其地理歷史、村民信仰及生計(jì)狀態(tài)等進(jìn)行探索研究[5];美國密歇根州立大學(xué)數(shù)字人文社會科學(xué)中心“林夸之謎:1836—1855年中國醫(yī)學(xué)肖像畫(Mystery of Lam Qua: Medical Portraiture in China, 1836—1855)”項(xiàng)目由系列油畫及其元數(shù)據(jù)組成,記錄了美國長老會牧師兼醫(yī)師彼得·帕克牧師(Peter Parker)在中國廣東省為其病人繪制的系列油畫肖像,幫助公眾了解中國醫(yī)學(xué)史[6];新西蘭坎特伯雷大學(xué)數(shù)字人文系藝術(shù)數(shù)字實(shí)驗(yàn)室“中國,藝術(shù)與文化外交(China, Art and Cultural Diplomacy)”項(xiàng)目展示了坎特伯雷博物館中收藏的中國藝術(shù)品,并對這些藝術(shù)品在促進(jìn)新西蘭與中國文化外交上的作用進(jìn)行研究[7]。
數(shù)據(jù)挖掘關(guān)聯(lián)項(xiàng)目是對非結(jié)構(gòu)化資源進(jìn)行聚類整合,通過文本挖掘整理有價值的知識。美國哈佛大學(xué)費(fèi)正清中國研究中心、“中央研究院”歷史語言研究所、北京大學(xué)中國古代史研究中心合作開展的“中國歷代人物傳記資料庫(CBDB,China Biographical Database)”項(xiàng)目[8],截至 2021年5月收錄了約49萬個人物的傳記資料,由人物、親屬、非親屬社會關(guān)系、社會區(qū)分、入仕途徑、宦歷、地址、著述等部分組成,項(xiàng)目為人文學(xué)者開放源代碼平臺,使用Gephi開展社會網(wǎng)絡(luò)分析;美國普林斯頓大學(xué)數(shù)字人文中心“中文交流詩——中世紀(jì)晚期中國的社會網(wǎng)絡(luò)分析(Chinese Exchange Poems:A Social-Network Analysis of Late Medieval China)”項(xiàng)目從9世紀(jì)到10世紀(jì)中國的一萬多首交流詩中挑選元數(shù)據(jù),創(chuàng)建在線數(shù)據(jù)集和交互式的文學(xué)關(guān)系社會網(wǎng)絡(luò)圖,幫助人文學(xué)者研究唐朝(公元618—907年)的文學(xué)史[9]。
古籍文本分析項(xiàng)目是在歷史古籍文獻(xiàn)數(shù)字化的基礎(chǔ)上發(fā)展而來。美國耶魯大學(xué)數(shù)字人文實(shí)驗(yàn)室“萬間房(Ten Thousand Rooms)”項(xiàng)目建設(shè)開放獲取平臺,以眾包方式開展古代漢語資源文本轉(zhuǎn)錄、翻譯和注釋等工作[10];美國普林斯頓大學(xué)數(shù)字人文中心“新、舊唐史比較數(shù)據(jù)庫(Building a Comparative Database for the Study of the Old and New Tang Histories)”項(xiàng)目通過可視化技術(shù)對比分析《舊唐史》和《新唐史》兩個編年史,幫助研究人員從宏觀層面分析兩個編年史之間的差異,并在語義層面建立唐朝人名與地名之間的關(guān)聯(lián)[11];美國弗吉尼亞大學(xué)人文高等技術(shù)學(xué)院“模范女性的傳統(tǒng):劉向的《列女傳》(Traditions of Exemplary Women:Liu Xiang'sLienü zhuan)”項(xiàng)目通過翻譯《列女傳》原文,研究中國古代歷史上婦女的社會及法律地位[12]。
地理信息可視化項(xiàng)目將實(shí)際地理空間和檔案歷史文獻(xiàn)資料互相關(guān)聯(lián),展現(xiàn)歷史事件的時空軌跡。加拿大瑞爾森大學(xué)數(shù)字人文中心“柜臺文化:作為全球經(jīng)驗(yàn)的中國‘店鋪’研究數(shù)字資源庫(Counter Culture Network: A Digital Repository for Research on Chinese "Shopkeeping" as a Global Experience)”項(xiàng)目使用在線地圖記錄華人在加勒比地區(qū)經(jīng)營中國商店的故事和圖像,研究店鋪經(jīng)營在中國僑民遷徙軌跡中的重要作用[13];美國普林斯頓大學(xué)數(shù)字人文中心“中國檔案館手冊(Chinese Archival Handbooks)”項(xiàng)目研究中國檔案館的館藏情況,創(chuàng)建館藏檢索工具,便于研究人員通過地圖查看器查找中國省級、地級和縣級的檔案手冊[14];美國弗吉尼亞大學(xué)人文高等技術(shù)學(xué)院“絲綢之路:觀音的傳播之路(Silk Road: The Path of Transmission of Avalokitesvara)”項(xiàng)目以絲綢之路為空間背景,比較研究不同地域和不同時間的觀音菩薩,探討宗教文化交流中的觀音信仰及其傳播路徑[15]。
文章調(diào)研了美國普林斯頓大學(xué)數(shù)字人文中心(CDH,Center for Digital Humanities)、澳大利亞國立大學(xué)數(shù)字人文研究中心(CDHR,Center for Digital Humanities Research)、英國劍橋大學(xué)藝術(shù)社會科學(xué)和人文科學(xué)研究中心(CRASSH,Centre for Research in Arts,Social Sciences and Humanities)等機(jī)構(gòu),其項(xiàng)目建設(shè)主旨表現(xiàn)出以下特點(diǎn)。
筆者調(diào)研的大部分?jǐn)?shù)字人文中心是跨學(xué)科的研究中心,匯集了從事人文科學(xué)和技術(shù)交叉工作的研發(fā)人員,其通過與圖書館開展深度合作,加大館藏資源揭示力度,共同建設(shè)數(shù)字人文知識基礎(chǔ)設(shè)施。如美國弗吉尼亞大學(xué)人文高等技術(shù)學(xué)院于1992年成立,長期與大學(xué)圖書館、出版商、信息技術(shù)公司、學(xué)術(shù)組織合作開展數(shù)字人文研究[16];美國明尼蘇達(dá)大學(xué)數(shù)字藝術(shù)、科學(xué)和人文中心是由教育創(chuàng)新中心、信息技術(shù)設(shè)計(jì)學(xué)院、高等研究所、大學(xué)圖書館等九個部門共同組成的聯(lián)盟,以推進(jìn)明尼蘇達(dá)大學(xué)的數(shù)字人文項(xiàng)目[17];英國劍橋大學(xué)藝術(shù)、社會科學(xué)和人文科學(xué)研究中心的行政辦公室位于大學(xué)圖書館內(nèi),大學(xué)圖書館是其主要合作伙伴,該中心與南加州大學(xué)亨廷頓圖書館早期現(xiàn)代研究所合作建設(shè)“早期現(xiàn)代視覺與物質(zhì)文化(Seeing Things: Early Modern Visual and Material Culture)”項(xiàng)目[18];美國加利福尼亞州立大學(xué)北嶺分校數(shù)字人文中心與Oviatt圖書館合作建設(shè)的“早期美國暢銷書數(shù)字計(jì)劃(The Early American Bestseller Digital Initiative)”項(xiàng)目,展示了19世紀(jì)美國流行的暢銷書和通俗作品[19]。
調(diào)研的各數(shù)字人文中心項(xiàng)目圍繞明確的主題,交叉融合歷史、文學(xué)、語言等學(xué)科,并與數(shù)字技術(shù)共同推進(jìn)數(shù)字人文研究與應(yīng)用實(shí)踐。如美國普林斯頓大學(xué)數(shù)字人文中心“太平洋西北海上貿(mào)易(Pacific Northwest Maritime Trade)”項(xiàng)目記錄了美國太平洋西北區(qū)普吉特海灣的海關(guān)官員保存的手寫賬本,內(nèi)容包括船只到達(dá)和離開普吉特海灣的日期,以及船名、國籍、噸位、類型、建造地點(diǎn)、登記、進(jìn)出港、船長、船員、貨物和乘客等信息,利用地圖和數(shù)據(jù)可視化技術(shù)繪制了海運(yùn)貿(mào)易網(wǎng)絡(luò)、客流和貨運(yùn)量在十年中的變化情況,探討海上貿(mào)易對美國太平洋西北區(qū)發(fā)展的作用[20];“選舉集會地圖(Mapping the Suffrage Metropolis)”項(xiàng)目根據(jù)美國紐約火災(zāi)保險地圖(1870年、1890年、1910年、1915年和1917年)中建筑環(huán)境的細(xì)節(jié),重建1870—1917年紐約選舉集會地圖,探索城市景觀和政治運(yùn)動之間的關(guān)系[21];“查士丁尼鼠疫(The Justinianic Plague)”項(xiàng)目記錄了公元541—542年地中海爆發(fā)的第一次大規(guī)模鼠疫,該項(xiàng)目是普林斯頓大學(xué)跨學(xué)科氣候變化和歷史研究計(jì)劃的一部分[22];“五世紀(jì)英國墓地(Finding the Fifth Century in Britain)”項(xiàng)目分析了100多個五世紀(jì)英國墓地的考古數(shù)據(jù),用考古學(xué)的方法研究中世紀(jì)早期英國的歷史[23]。
調(diào)研的各數(shù)字人文中心為合作開發(fā)和主持研究項(xiàng)目構(gòu)建數(shù)字人文研究環(huán)境,提供場所、技術(shù)支持和咨詢服務(wù),培養(yǎng)跨學(xué)科專業(yè)人才。美國普林斯頓大學(xué)數(shù)字人文中心成立人文計(jì)算課程委員會(HC3,The Humanities Computing Curriculum Committee),為本科生和研究生開設(shè)“數(shù)字人文導(dǎo)論(Introduction to Digital Humanities)”“媒體和數(shù)據(jù)的人文方法(Humanistic Approaches to Media and Data)”等課程[24];美國阿拉巴馬大學(xué)數(shù)字人文中心為大學(xué)教師、員工和研究生提供項(xiàng)目案例、研究工具和技術(shù)標(biāo)準(zhǔn)等數(shù)字人文學(xué)科資源,開展研討會、講座和午餐討論等活動[25];澳大利亞國立大學(xué)數(shù)字人文研究中心建立數(shù)字人文實(shí)驗(yàn)室,開設(shè)48學(xué)時的本科生主修或輔修課程“數(shù)字人文(Digital Humanities)”[26];美國耶魯大學(xué)圖書館成立數(shù)字人文實(shí)驗(yàn)室,與耶魯大學(xué)計(jì)算研究中心、文化遺產(chǎn)保護(hù)研究所等部門合作,提供空間、社區(qū)和資源服務(wù),幫助研究人員使用文本挖掘、圖像計(jì)算、空間分析和網(wǎng)絡(luò)分析等數(shù)字工具研究藝術(shù)、人文和文化遺產(chǎn)保護(hù)等方面的問題[27]。
在項(xiàng)目化、合作化的大趨勢下,國內(nèi)部分高校、公共圖書館、圖書館學(xué)會等機(jī)構(gòu)都相繼以特色文獻(xiàn)資源建設(shè)、歷史文化遺產(chǎn)保護(hù)、古籍?dāng)?shù)字化為契機(jī),成立數(shù)字人文研究中心,為加強(qiáng)國內(nèi)外專家、學(xué)者之間的合作交流搭建科研協(xié)作平臺。
2007年,臺灣大學(xué)成立“數(shù)位典藏研究發(fā)展中心”,2012年更名為“數(shù)位人文研究中心”[28];2011年,武漢大學(xué)成立“數(shù)字人文研究中心”,成員來自武漢大學(xué)信息資源研究中心、遙感信息工程國家重點(diǎn)實(shí)驗(yàn)室、信息管理學(xué)院、計(jì)算機(jī)學(xué)院等多個學(xué)術(shù)機(jī)構(gòu),2018年,該中心正式成為國際數(shù)字人文中心網(wǎng)絡(luò)(CenterNet)成員單位[29];2014年,香港公開大學(xué)人文社會科學(xué)院成立“數(shù)碼文化與人文學(xué)科研究所”,下設(shè)數(shù)碼人文研究中心和數(shù)碼文化研究中心,定期舉行各類公開講座、研討會和不同類型的學(xué)術(shù)活動[30];2017年,上海市圖書館學(xué)會學(xué)術(shù)委員會成立“數(shù)字人文專業(yè)委員會”[31],為上海圖情界和人文社科界的研究人員提供討論交流的平臺;2018年,南京大學(xué)成立“人文社會科學(xué)高級研究院數(shù)字人文創(chuàng)研中心”[32];2019年,中國人民大學(xué)組建“數(shù)字人文研究中心”[33];北京師范大學(xué)成立“數(shù)字出版與數(shù)字人文研究中心”,面向粵港澳和國家戰(zhàn)略,致力于“新文科”建設(shè),組建交叉學(xué)科的高水平國際化研究團(tuán)隊(duì),開展數(shù)字出版和數(shù)字人文等前沿學(xué)科研究[34];2020年5月,北京大學(xué)成立“數(shù)字人文研究中心”[35];7月,中國索引學(xué)會增設(shè)“數(shù)字人文專業(yè)委員會”[36],秘書處設(shè)在上海圖書館;8月,上海大學(xué)圖書情報檔案系成立“數(shù)字人文研究與發(fā)展中心”[37];10月,南京師范大學(xué)哲學(xué)系成立“數(shù)字與人文”研究中心[38];11月,上海師范大學(xué)成立“數(shù)字人文研究中心”[39]。
近年來,國家社科基金對數(shù)字人文項(xiàng)目資助的比例在逐年提高,研究涉及數(shù)字人文視域下檔案文獻(xiàn)數(shù)據(jù)化、數(shù)字方志館建設(shè)、非遺知識圖譜構(gòu)建、網(wǎng)絡(luò)基礎(chǔ)設(shè)施、圖書館參與模式、開放數(shù)據(jù)、異構(gòu)特藏資源、古籍文獻(xiàn)開發(fā)等圖書館·情報與文獻(xiàn)學(xué)領(lǐng)域,以及中國網(wǎng)絡(luò)文學(xué)英譯、中國民間故事英譯、《詩經(jīng)》德譯等中國文學(xué)、外國文學(xué)和語言學(xué)領(lǐng)域。
從國內(nèi)數(shù)字人文項(xiàng)目發(fā)展態(tài)勢來看,部分高校及公共圖書館在古籍文獻(xiàn)、民國報刊、唐宋文學(xué)、家譜、名人檔案、歷史文獻(xiàn)、書畫碑帖等方面,開展資源數(shù)字化、OCR識別、元數(shù)據(jù)著錄、規(guī)范控制、史料挖掘、關(guān)聯(lián)數(shù)據(jù)、信息可視化等工作,推進(jìn)“新文科”建設(shè)的創(chuàng)新發(fā)展。
臺灣大學(xué)數(shù)位人文研究中心已陸續(xù)建設(shè)35個數(shù)字典藏資料庫,內(nèi)容涵蓋臺灣歷史、政治、社會、法律、經(jīng)濟(jì)等各方面。該中心開發(fā)了“中西歷轉(zhuǎn)換對照查詢”“清代臺灣文官官職表查詢系統(tǒng)”“蘇州碼——阿拉伯?dāng)?shù)字轉(zhuǎn)換器”等數(shù)位研究工具,幫助研究人員更好地檢索、理解、利用史料;“海外博物館臺灣民族學(xué)藏品資料”項(xiàng)目與美國自然史博物館、大英博物館、英國劍橋大學(xué)考古人類學(xué)博物館等機(jī)構(gòu)合作,開展流落在海外的珍貴臺灣器物、文化資料及紀(jì)錄影像的收集、整理和數(shù)字建檔工作[28]。
武漢大學(xué)數(shù)字人文研究中心“敦煌莫高窟壁畫內(nèi)容理解、組織與展示”項(xiàng)目通過研究壁畫高精度數(shù)字化采集技術(shù)、壁畫圖像語義描述規(guī)范、壁畫知識圖譜構(gòu)建技術(shù),以及壁畫風(fēng)格的演變歷史,以推動“數(shù)字敦煌”項(xiàng)目的發(fā)展;“中文詩歌知識圖譜”項(xiàng)目以大規(guī)模詩歌文本為研究對象,全景式地分析并呈現(xiàn)詩歌、詩人的內(nèi)在關(guān)聯(lián)[29]。
華東師范大學(xué)數(shù)字人文研究中心包括數(shù)字人文研究支撐平臺、數(shù)字人文人工智能平臺和人文社科大數(shù)據(jù)實(shí)驗(yàn)室,為數(shù)據(jù)驅(qū)動下的人文社會科學(xué)研究提供各類數(shù)據(jù)、工具支撐,推動文科創(chuàng)新和跨學(xué)科研究。其中,數(shù)字人文研究支撐平臺匯集了Tourpedia、Sinopedia、上海圖書館開放數(shù)據(jù)集等中國數(shù)據(jù)庫集,英國檔案中心數(shù)據(jù)、英國教育開放數(shù)據(jù)等英國數(shù)據(jù)庫集,氣象數(shù)據(jù)、西班牙經(jīng)濟(jì)數(shù)據(jù)、西班牙國家圖書館書目數(shù)據(jù)等西班牙數(shù)據(jù)庫集[40]。數(shù)字人文人工智能平臺通過OCR識別、眾包協(xié)作等技術(shù),實(shí)現(xiàn)了《揚(yáng)州夢傳奇》、刻本《李忠肅公集》《下河集要》、蕭懷德手抄本《讀書樂趣集語》《元豐九域志》等古籍文獻(xiàn)的抄錄及句讀[41]。
南京大學(xué)人文社會科學(xué)高級研究院數(shù)字人文創(chuàng)研中心建設(shè)“中國商業(yè)廣告檔案庫(1870—1940)”,對上?!渡陥蟆贰⑻旖颉洞蠊珗蟆?、沈陽《盛京時報》、漢口《漢口中西報》、廣州《越華報》等五個城市報紙中的187 100多張商業(yè)廣告進(jìn)行圖像數(shù)字化,基于元數(shù)據(jù)標(biāo)準(zhǔn)對廣告的標(biāo)題、關(guān)鍵詞、全文文本、插圖場景、品牌圖標(biāo)、商品類別、地圖信息、廣告代理、發(fā)行機(jī)構(gòu)、制造公司、出版信息等44個數(shù)據(jù)進(jìn)行規(guī)范描述[42]。
復(fù)旦大學(xué)歷史地理研究中心的“中國歷史地理信息平臺”,提供上海道契檔案數(shù)據(jù)庫、明清官修方志總目檢索系統(tǒng)等數(shù)據(jù)庫的查詢檢索[43]。
北京大學(xué)數(shù)字人文開放實(shí)驗(yàn)室(原北京大學(xué)信息管理系KVision實(shí)驗(yàn)室)以《宋元學(xué)案》(中華書局1986年12月版)數(shù)字化文本為基礎(chǔ),利用中國歷代人物傳記數(shù)據(jù)庫(CBDB)、WorldMap等工具,從2018年開始設(shè)計(jì)研發(fā)“宋元學(xué)案知識圖譜可視化系統(tǒng)”,對宋元時期學(xué)術(shù)史中的關(guān)系圖譜、學(xué)術(shù)流變、師承關(guān)系、學(xué)派傳承進(jìn)行梳理,構(gòu)建完整的學(xué)術(shù)史衍化脈絡(luò)全景[44]。其中,“語義檢索”和“關(guān)系發(fā)現(xiàn)”版塊可幫助讀者實(shí)現(xiàn)語義查詢,并提供知識化、語義化的分析和研究工具。
中南民族大學(xué)王兆鵬教授與搜韻網(wǎng)合作開發(fā)“唐宋文學(xué)編年地圖”數(shù)據(jù)庫,收錄唐宋時期大部分重要作家及其作品的相關(guān)史料[45]。截至2021年11月,數(shù)據(jù)庫已收錄公元603—1315年148位作者的作品,并以編年地圖的方式呈現(xiàn)唐宋時期文學(xué)人物、事件的時空分布及作品關(guān)系。
上海交通大學(xué)李政道圖書館于2013 年推出“李政道數(shù)字資源中心”,通過時間線與主題詞云圖展現(xiàn)李政道相關(guān)論文、手稿、信函、講義、圖書、音視頻、圖像等珍貴資料,揭示李政道先生的科研軌跡和多彩人生[46]。
上海博物館以明代著名書畫家董其昌為主體,依托館藏資源推出“董其昌書畫藝術(shù)大展”專題[47]。該平臺參照歐洲大事記、明朝大事記中的史事和藝術(shù)發(fā)展節(jié)點(diǎn),呈現(xiàn)董其昌生平書法和繪畫等成果;以可視化工具及歷史地理信息的方式呈現(xiàn)其作品年表、社會網(wǎng)絡(luò)關(guān)系和藝術(shù)流變脈絡(luò)。
上海圖書館“盛宣懷檔案知識庫”以時間軸、地圖瀏覽等方式呈現(xiàn)盛宣懷檔案文獻(xiàn),展現(xiàn)28 234個人物列表和盛宣懷參與創(chuàng)辦公司的大事記,揭示其信函電報收發(fā)關(guān)系圖[48];“歷史文獻(xiàn)眾包平臺”對郭師敦和盛宣懷往來信函、溥儀宮廷祭祀諭旨、通商條約信函、盛宣懷關(guān)稅奏折等檔案文獻(xiàn)采用眾包方式開展抄錄工作[49];基于《中國家譜總目》推出的“中國家譜知識服務(wù)平臺”,以知識組織方法和關(guān)聯(lián)數(shù)據(jù)技術(shù),展現(xiàn)家譜在全球各機(jī)構(gòu)的收藏情況,梳理608個姓氏家族的遷徙圖[50];“中文古籍聯(lián)合目錄及循證平臺”通過關(guān)聯(lián)語義技術(shù)對數(shù)字化古籍內(nèi)容進(jìn)行時空、社會關(guān)系分析和可視化展示[51]。
近年來,國內(nèi)部分高校開設(shè)“數(shù)字人文”課程,舉辦數(shù)字人文訓(xùn)練營,幫助學(xué)生掌握數(shù)字人文研究的基本概念和研究前沿,開展相關(guān)技術(shù)、工具及方法的專業(yè)培訓(xùn)。
北京大學(xué)數(shù)字人文研究中心(籌)推出“北京大學(xué)數(shù)字人文工作坊”,聯(lián)合國內(nèi)外學(xué)者組成授課團(tuán)隊(duì)開展“DocuSky的數(shù)字人文研究范式”“利用python進(jìn)行數(shù)字人文研究”“一圖勝千言——在地圖上展現(xiàn)數(shù)據(jù)”“資訊技術(shù)與歷史文獻(xiàn)分析”等在線培訓(xùn)課程[52]。
2018年,北京大學(xué)開設(shè)公選課“數(shù)字人文”[53];南京師范大學(xué)數(shù)字與人文研究中心立項(xiàng)建設(shè)校級精品博雅通識課程“‘?dāng)?shù)字與人文’導(dǎo)論”[54];上海外國語大學(xué)圖書館開設(shè)在線課程“數(shù)字人文方法論”[55];上海師范大學(xué)數(shù)字人文研究中心采用線上線下課堂和實(shí)驗(yàn)室混合教學(xué)方式,開設(shè)“數(shù)字人文導(dǎo)論”課程[56];南京農(nóng)業(yè)大學(xué)開設(shè)研究生專業(yè)課程“數(shù)字人文方法論”[57];天津大學(xué)開設(shè)研究生選修課程“空間人文與數(shù)字人文”[58],指導(dǎo)學(xué)生學(xué)習(xí)數(shù)字化技術(shù)在史學(xué)、考古、文化遺產(chǎn)、社會文化與行為等方面應(yīng)用的前沿理論和方法。
2020年,中國人民大學(xué)信息資源管理學(xué)院在圖書情報與檔案管理一級學(xué)科下增設(shè)數(shù)字人文碩士學(xué)位點(diǎn)(專業(yè)代碼:1205Z3),進(jìn)一步推動數(shù)字人文教育教學(xué)和學(xué)術(shù)研究的發(fā)展,促進(jìn)數(shù)字時代的人文學(xué)術(shù)創(chuàng)新與知識生產(chǎn)轉(zhuǎn)型[59]。
文獻(xiàn)資源是數(shù)字人文研究的基礎(chǔ)。近年來隨著數(shù)字圖書館的發(fā)展,特色數(shù)據(jù)庫建設(shè)、資源數(shù)據(jù)化管理、元數(shù)據(jù)標(biāo)準(zhǔn)化研究為圖書館參與數(shù)字人文項(xiàng)目奠定了堅(jiān)實(shí)基礎(chǔ)。同時,圖書館構(gòu)建數(shù)字人文服務(wù)平臺,保存數(shù)字人文研究成果,成為數(shù)字人文項(xiàng)目研究與實(shí)踐過程的重要合作方,充分發(fā)揮了圖書館保存人類文化遺產(chǎn)、文化傳承創(chuàng)新及提供社會教育服務(wù)等功能。調(diào)研的部分國內(nèi)外圖書館深入探索人文學(xué)者的科研需求,從多個維度開展數(shù)字人文服務(wù)的實(shí)踐活動,給我國圖書館數(shù)字人文資源建設(shè)與服務(wù)模式創(chuàng)新帶來深刻啟示。
近年來,部分圖書館地方特色文獻(xiàn)數(shù)據(jù)庫的建設(shè)卓有成效,文獻(xiàn)類型齊全、學(xué)科覆蓋面廣、研究特色鮮明、評價體系完善,具有較高的學(xué)術(shù)價值。這些地方特藏、歷史文獻(xiàn)和珍貴古籍等資源是數(shù)字人文學(xué)者的研究對象,是圖書館參與數(shù)字人文研究的重要基礎(chǔ)。以“抗日戰(zhàn)爭與近代中日關(guān)系文獻(xiàn)數(shù)據(jù)平臺”為例,該平臺逐步完善文獻(xiàn)數(shù)字化技術(shù)標(biāo)準(zhǔn)和著錄標(biāo)準(zhǔn),推出“中國共產(chǎn)黨歷史資料叢書專題庫”“冀中人民抗日斗爭專題庫”“吳川抗戰(zhàn)史料專輯”“崔永元私人珍藏日文資料專題庫”“張林池陳舜玉抗戰(zhàn)文獻(xiàn)專題庫”“江定仙抗戰(zhàn)音樂專題庫”“陳田鶴抗戰(zhàn)音樂專題庫”等紅色專題數(shù)據(jù)庫,向社會公眾提供永久免費(fèi)檢索與閱覽服務(wù),成為廣大民眾了解我國抗日戰(zhàn)爭和近代中日關(guān)系歷史的重要窗口[60]。香港浸會大學(xué)圖書館與視覺藝術(shù)院合作開展“消失中的藝術(shù):藏書票與香港”項(xiàng)目,在線展出900種藏書票,包括文學(xué)作品、歷史事件、肖像、風(fēng)景等題材,成為研究書籍來源及印刷歷史的重要資料[61];“長洲太平清醮飄色巡游”項(xiàng)目記錄了香港長洲島居民獨(dú)有的民間節(jié)慶,2011年被列入第三批國家級非遺代表性項(xiàng)目名錄[62]。
但當(dāng)前我國圖書館特色資源數(shù)據(jù)庫存在著資源分散、內(nèi)容重復(fù)、無統(tǒng)一的格式規(guī)范、缺乏深度標(biāo)引、數(shù)據(jù)分析能力不足等問題,制約著圖書館在數(shù)字人文研究與實(shí)踐中發(fā)揮更大的作用。圖書館需以“共建共享”為理念進(jìn)一步加強(qiáng)手稿、日記、函電、歌曲、照片、書畫、電影、石刻、題詞、傳單、憶述、宣傳標(biāo)語、口述資料、民間故事、小說戲劇和詩詞歌謠等多種類型資料的征集,突出資源收集的多元化、差異化及特色化;強(qiáng)化學(xué)術(shù)研究支撐功能,將特色文獻(xiàn)數(shù)據(jù)建設(shè)與相關(guān)研究工作結(jié)合起來,形成邊研究、邊建設(shè)、邊共享的良性互動模式;增強(qiáng)文獻(xiàn)資源揭示的細(xì)粒度,實(shí)現(xiàn)資源組織的系統(tǒng)性、集成化和資源數(shù)據(jù)的規(guī)范控制、深度標(biāo)引、文本識別、開放獲取及語義化和關(guān)聯(lián)性,為數(shù)字人文項(xiàng)目研究提供數(shù)據(jù)支持。
傳統(tǒng)文獻(xiàn)之間的知識網(wǎng)絡(luò)計(jì)量分析是通過主題、分類、作者、引用、出版機(jī)構(gòu)、出版時間、基金等外部特征展現(xiàn)文獻(xiàn)之間的相關(guān)性和分布特征。數(shù)字人文研究利用語義網(wǎng)、關(guān)聯(lián)數(shù)據(jù)等技術(shù),對文獻(xiàn)內(nèi)部特征進(jìn)行文本、社會網(wǎng)絡(luò)關(guān)系分析,利用數(shù)據(jù)的空間屬性信息和GIS的地圖服務(wù),在地圖上展示數(shù)據(jù)的時空分布,形成多維度的可視化分析網(wǎng)絡(luò),以支撐不同人文學(xué)科研究的應(yīng)用場景。臺灣大學(xué)數(shù)位人文研究中心與臺灣大學(xué)圖書館合作開發(fā)的“歷代寶案脈絡(luò)分析系統(tǒng)”,選取《歷代寶案》中的重要時間、物名、官名、人名、地名等關(guān)鍵信息,為研究人員建立集檢索、分類、統(tǒng)計(jì)、GIS視覺分析等功能于一體的數(shù)字人文脈絡(luò)分析系統(tǒng)[63];香港浸會大學(xué)圖書館與歷史系合作建設(shè)“中山公園”項(xiàng)目,研究分析1925年至今中山公園的歷史背景、發(fā)展沿革、空間設(shè)計(jì)、建設(shè)特色與內(nèi)涵特征[64];“朝廷貢品”項(xiàng)目記錄了中國黑龍江東北部及鄰近俄國地區(qū)部落的貢品情況,設(shè)計(jì)了貢品種類演變、各朝代貢品數(shù)量、送贈方時序、交易地點(diǎn)分布、參考文獻(xiàn)引用率等五個圖表,通過對進(jìn)貢群體的身份、貢品的種類及數(shù)量、朝廷回贈的禮物等567組數(shù)據(jù)進(jìn)行挖掘分析,幫助研究人員了解清朝時期黑龍江的經(jīng)濟(jì)、環(huán)境及政治狀況[65]。
目前,我國尚無國家或地區(qū)層面的數(shù)字人文相關(guān)發(fā)展規(guī)劃、建設(shè)指南。上海圖書館開放數(shù)據(jù)平臺公布該館數(shù)字人文項(xiàng)目所用的人名規(guī)范庫、華人姓氏列表、中國歷史紀(jì)年表、歷史地理名詞表、收藏機(jī)構(gòu)名錄、上海年華知識圖譜、印章知識庫、避諱字知識庫、古籍刻工名錄等基礎(chǔ)知識庫,家譜知識服務(wù)平臺、盛宣懷檔案知識庫、中文古籍聯(lián)合目錄及循證平臺等文獻(xiàn)知識庫,CBDB本體、古籍本體、關(guān)聯(lián)書目數(shù)據(jù)、上海年華本體和人名規(guī)范庫本體等詞表,及歷史文獻(xiàn)眾包平臺、家譜聯(lián)合編目系統(tǒng)等自建工具[66]。
為促進(jìn)數(shù)字人文平臺的合作建設(shè)、數(shù)據(jù)的開放存取,圖書館需聯(lián)合檔案館、博物館、高校及相關(guān)研究機(jī)構(gòu),在數(shù)據(jù)采集、存儲使用、質(zhì)量保證等方面建立行業(yè)都應(yīng)遵循的技術(shù)標(biāo)準(zhǔn)規(guī)范和協(xié)議,提高數(shù)據(jù)資源整合效率,合作建設(shè)具有中國特色的歷史人文數(shù)據(jù)中心;對原有的分類主題詞表、文獻(xiàn)類型及歷史、地理、人物、機(jī)構(gòu)、事件、名稱、目錄等進(jìn)行歸檔,構(gòu)建完整系統(tǒng)、統(tǒng)一規(guī)范、靈活可擴(kuò)展、開放互聯(lián)的基本數(shù)據(jù)集,充分利用中國歷史人物傳記資料庫(CBDB)、中國歷史地理信息系統(tǒng)(CHGIS)、社會化網(wǎng)絡(luò)在線資源的FOAF、CTextProject、佛學(xué)規(guī)范資料庫、上海圖書館“人名規(guī)范庫”等開放的API接口,加強(qiáng)與BIB-FRAME、DBpedia、Wiktionary和GeoNames等數(shù)據(jù)源的關(guān)聯(lián),為數(shù)字人文項(xiàng)目提供技術(shù)支持。
隨著智慧圖書館的發(fā)展,讀者每天在利用圖書館資源與服務(wù)的過程中產(chǎn)生了許多行為軌跡,積累了大量數(shù)據(jù),包括借閱預(yù)約薦購數(shù)據(jù)、電子資源利用數(shù)據(jù)、無線WiFi訪問數(shù)據(jù)、空間利用數(shù)據(jù)、自助設(shè)備使用數(shù)據(jù)等,這些數(shù)據(jù)對于學(xué)者全面、深入地了解讀者閱讀需求、閱讀傾向、閱讀喜好和學(xué)術(shù)研究方向具有重要意義。如普林斯頓大學(xué)數(shù)字人文中心與普林斯頓大學(xué)圖書館合作建設(shè)的“莎士比亞和同伴(The Shakespeare and Company)”項(xiàng)目,通過分析二戰(zhàn)期間巴黎“莎士比亞和同伴”圖書館的讀者借閱記錄,獲取讀者閱讀內(nèi)容及身份信息,研究二戰(zhàn)期間普通大眾生活的變化及該圖書館對讀者生活的影響[67];澳大利亞國立大學(xué)數(shù)字人文研究中心的“澳大利亞普通讀者(The Australian Common Reader)”項(xiàng)目記錄了澳大利亞7個圖書館在1860年至1918年間的數(shù)千條借閱記錄,以此探索研究19世紀(jì)以來澳大利亞人的閱讀習(xí)慣[68]。
圖書館需進(jìn)一步強(qiáng)化數(shù)據(jù)意識,在建設(shè)資源與服務(wù)讀者的過程中不斷挖掘數(shù)據(jù)價值,開展數(shù)據(jù)管理服務(wù),提高數(shù)據(jù)存取效率,保證數(shù)據(jù)安全,促進(jìn)數(shù)據(jù)共享,提高知識發(fā)現(xiàn)和數(shù)據(jù)決策的能力;加強(qiáng)數(shù)字人文學(xué)者需求調(diào)研,及時收集反饋信息,提供資源數(shù)字化、數(shù)據(jù)收集、元數(shù)據(jù)管理、知識產(chǎn)權(quán)、開放存取、數(shù)據(jù)存檔、成果展示等培訓(xùn)及咨詢,提升人文學(xué)者數(shù)據(jù)素養(yǎng)及數(shù)字人文的研究能力;圖書情報學(xué)、計(jì)算機(jī)科學(xué)與歷史文獻(xiàn)學(xué)、考古學(xué)、經(jīng)濟(jì)學(xué)、社會學(xué)、政治學(xué)等多學(xué)科領(lǐng)域?qū)W者合作共建資源共享平臺、學(xué)術(shù)交流平臺及協(xié)同創(chuàng)新研究中心;與博物館、檔案館、出版社等相關(guān)機(jī)構(gòu)開展學(xué)術(shù)研討與合作,推進(jìn)跨地區(qū)、跨國家的數(shù)字技術(shù)與人文領(lǐng)域的結(jié)合,營造友好的數(shù)字人文環(huán)境,促進(jìn)科研成果的產(chǎn)出;開展館員培訓(xùn)工作,激發(fā)其探索數(shù)字人文研究領(lǐng)域的學(xué)術(shù)熱情,增強(qiáng)其文化傳承的責(zé)任意識與擔(dān)當(dāng)。
隨著大數(shù)據(jù)、人工智能等信息技術(shù)的發(fā)展,“數(shù)字人文”已成為人文社會科學(xué)研究領(lǐng)域的新熱點(diǎn),為圖書館服務(wù)創(chuàng)新提供了全新的實(shí)踐方向和廣闊的發(fā)展空間。圖書館應(yīng)密切關(guān)注數(shù)字人文建設(shè)的發(fā)展態(tài)勢,不能僅局限于文化遺產(chǎn)和歷史檔案等研究命題,還應(yīng)關(guān)注當(dāng)前時代研究熱點(diǎn),把握人文學(xué)者數(shù)據(jù)驅(qū)動創(chuàng)新研究和高校新文科建設(shè)需求,明確自身定位,利用自身資源、技術(shù)及服務(wù)優(yōu)勢,積極參與數(shù)字人文基礎(chǔ)設(shè)施建設(shè)和項(xiàng)目研究實(shí)踐,擔(dān)當(dāng)傳承優(yōu)秀傳統(tǒng)文化的使命,提升圖書館的社會影響力。