尚奮宇 任文文
(1.山西醫(yī)科大學檔案館 晉中 030600;2.山西醫(yī)科大學管理學院 晉中 030600)
數字人文已在全球實踐中取得豐碩成果。在檔案學領域,數字人文實踐主要集中在檔案資源開發(fā)和數字記憶構建兩個層面。檔案資源開發(fā)旨在檔案資源數字化的基礎上對其內容進行深度挖掘和價值開發(fā),實現由提供文件級的信息服務向提供數據級的知識服務的轉變[1],數字記憶通過數字技術在虛擬空間打造記憶宮殿,為人類遺產的傳承、保護與創(chuàng)新提供新的方法路徑[2],相關實踐包括國家圖書館的中國記憶項目、上海圖書館的家譜知識服務平臺、美國弗吉尼亞大學數字歷史研究中心的影谷項目(The Valley of The Shadow)等。數字人文宣言2.0指出,在數字人文生態(tài)中,高校不再是知識與文化唯一的生產者、管理者和傳播者,而應是新興領域學術話語的數字模型建模者和全球及本地的知識生產、交流與傳播網絡的建設促進者;檔案館的定位不再是次要的、支持性的部門,而必須是教學和學術實踐的主要場所[3]。在這一背景下,高校檔案館如何積極響應檔案開放需求,充分組織利用數字檔案資源,開展面向校內及公眾的知識服務,參與到數字人文項目中來,是本文意在探討的問題。
在檔案學領域,開放檔案指將保密期滿和其他可以公開的檔案解除保密限制,經過一定的手續(xù)向社會公眾提供利用[4],由于檔案的利用受到《檔案法》、《保密法》以及隱私權保護等法律的制約,在傳統(tǒng)的檔案管理工作中,檔案保管的重要性遠大于檔案開放。在開放政府和開放存取運動背景下,關于開放檔案的討論逐步增多,其內涵由最初的檔案館自上而下解除保密限制向更加多元的檔案共建共享發(fā)展。
開放檔案倡議(Open Archives Initiative, OAI)將開放檔案定義為可通過網絡訪問并開放獲取的數字檔案庫,其中“開放”是指定義并推進實現數據傳輸與調用的API,以提升各類數據提供者所提供內容的可用性,并不意味著無限或免費訪問[5],“數字檔案庫”包括但不限于學術論文等各類數字資料。當前已有不少高校及學術組織制定了相關的檔案開放政策,對檔案數據共享進行指導和規(guī)范,如法國科學傳播中心(CCSD)建立了開放檔案平臺HAL,旨在實現法國及其他國家的科研機構檔案、學科檔案及科研文獻的開放共享及永久保存[6];北京大學建立了開放研究數據平臺,為校內及全社會的各學科研究者開展研究數據的保存、分享與再利用活動提供信息服務[7]。
然而,當前我國高校檔案的開放還面臨著相關法規(guī)政策不完善、開放鑒定程序不明確、實施工作標準不統(tǒng)一等挑戰(zhàn),早在2008年,教育部令第27號《高等學校檔案管理辦法》就明確規(guī)定高校檔案機構應開展檔案的開放和利用工作,同時規(guī)定不得對外公布涉及國家秘密、專利或技術秘密、個人隱私或限制使用的檔案,但并未對可開放的檔案內容及其開放途徑和要求做詳細部署[8]。2010年,教育部令第29號《高等學校信息公開辦法》對高校應主動公開的信息的內容、途徑和要求做了具體規(guī)定,但并未提及高校檔案公開的相關措施[9]。這導致高校開放檔案的發(fā)展并不平衡,在一定程度上存在著開放范圍小、更新速度慢、利用效率低等問題,開放檔案類型僅包括學術論文資源,其他類型的檔案則較少出現。高校檔案資源有必要在合法合規(guī)的前提下實現開放利用,向大眾展現其豐富的人文價值。
《高等學校檔案管理辦法》將高校檔案定義為高等學校從事招生、教學、科研、管理等活動直接形成的對學生、學校和社會有保存價值的各種文字、圖表、聲像等不同形式、載體的歷史記錄。高校檔案需經開放鑒定通過后方可成為開放檔案。結合檔案公布的相關要求,高校開放檔案可以定義為由檔案機構及相關部門合理組織與再開發(fā)的且能夠實現開放數據訪問的高校檔案。
依據高校檔案的公布要求,可以將高校開放檔案分為教學檔案、科研檔案、教務檔案和校務檔案四類。教學檔案是高校教師和學生在教育教學及實踐過程中形成的有保存價值的真實記錄,其中,教師教學檔案是通常由教師提供的能夠體現教學質量與教學范圍的教學成果總結,允許通過超文本鏈接收集、組織和發(fā)布多媒體類型文件[10];學生教學檔案是反映學生在校期間學習和實踐的真實記錄,包括學業(yè)成績、獎懲、學籍變更、肄業(yè)及授予學位情況??蒲袡n案是指高校在科研立項、研究及驗收活動中直接形成的,具有一定學術價值的文字材料、計算材料、實驗數據、圖表等各種形式和載體的材料,是評估高??蒲兴降闹匾獞{證[11]。教務檔案是教務管理部門在教學管理、教學實踐和教學研究等活動過程中形成的真實記錄,包括教學計劃、招生計劃、教材目錄、評估材料等。校務檔案是高校行政部門在行政決策、基本建設、儀器采購及維修等管理和經濟活動中形成的文字、圖冊、賬簿、報表、音視頻等各種載體的材料。
高校檔案是新老高校了解該校在不同時代的教育理念、教育方式等活動的重要依據,是高校傳承人文記憶、弘揚人文精神的重要載體,具有一定的人文價值與社會價值。如教學檔案能夠為高校師資力量評估、教師職稱晉升及教學質量評估、學生就業(yè)入職及學位認證等活動提供憑證;科研檔案能夠為科研人員知識產權和著作權的認定提供憑證,也可為學術不端行為的追蹤提供協(xié)助;教務檔案能夠促進高校教學工作高效進展,為學科專業(yè)設計和教育教學改革提供依據;校務檔案是高校廉政治校的重要憑證,在為上級部門檢查、法律糾紛等事務中有較大用途。
檔案館為數字人文研究提供全方位支持,是數字人文研究的必要支點,更是新時代檔案館的生存方式之一。高校檔案館作為數字人文教學和學術實踐的主要場所,應深入了解數字人文發(fā)展歷程與核心特征,加大檔案資源開放力度,滿足數字人文研究的不同層次需求,共同孵化研究成果。
數字人文源起于1949年的人文計算,其核心是通過自然科學嚴謹、系統(tǒng)、明確的程序方法論,來解決迄今常以偶然方式處理的人文科學問題[12]。數字人文的發(fā)展主要歷經三個階段?!稊底秩宋男?.0》指出,數字人文1.0的主要工作是定量研究、提升數據庫檢索能力、基于自動化語料庫的語言學分析等,發(fā)展目標是使用信息技術照亮人類記錄,并使對人類記錄的理解影響到信息技術的發(fā)展和使用;數字人文2.0在定量研究的基礎上,強調定性研究、經驗解釋和情感生成,將數字工具服務于長復雜性、批判性、媒介特性、歷史背景和深度分析的人文學科,通過新的研究實踐模型和技術工具促進新的耦合拓展[3]。數字人文3.0在數字化與傳統(tǒng)社會公共社群結構融合的趨勢下,研究方案的主要任務是利用信息技術補償和重組人文工作,提供人文學科自由資源,重新構想人文學科的組織范式[13]。
從價值觀念、研究方法和研究領域來看,數字人文具有如下核心特征。其一,數字人文擁有烏托邦式的價值觀念,肯定開放、無邊界、學術民主和知識共享,支持無墻的高校、圖書館、博物館和檔案館,注重批判和反思,強調文化記錄的振興和知識的“去殖民化”,設想了任何人都可以在任何時間、任何地點參與話語表達的未來[14]。其二,數字人文擁有人文思辨與數字技術并重的研究方法,同時認同跨媒介論證與設計的重要性,其技術體系包括數字化技術、數據管理技術、數據分析技術、可視化技術、VR/AR技術和機器學習技術六個方面,分別對應構建數字人文的資源基礎、服務系統(tǒng)、應用平臺、直觀形象、交互環(huán)境和智慧服務[15]。其三,數字人文涉及眾多研究領域,除歷史學、文學、社會學、語言學、考古與藝術學之外,有時也包括平臺研究、軟件研究、媒介研究、文本編碼、數據挖掘和數據分析等新領域。
數字人文的研究實踐內容分為人文數據庫或數據集的建設、人文數字工具的開發(fā)使用、創(chuàng)新人文研究方法和研究范式、人文領域的創(chuàng)造性破壞與建設四個層次[16]。高校檔案館應充分利用現有檔案資源,滿足上述需求。一是優(yōu)化數字檔案資源組織體系。高校檔案自高校成立起就真實全面地記載了高校教學、科研及管理活動的成果變遷,檔案數字化工作將各類載體的檔案資源轉化為數字檔案,并構建了相應管理系統(tǒng)。但早期數字化工作注重載體轉換和檔案保密,構建的管理系統(tǒng)僅可面向校內部分人員進行檢索、下載,應適當擴大檔案開發(fā)力度,進一步優(yōu)化數字資源組織體系,構建數字人文資源服務平臺。二是參與數字人文工具開發(fā)。高校檔案館應與數字人文中心合作,參與數字人文工具的開發(fā)、應用和推廣,針對校史研究等與檔案工作融合緊密的數字人文項目進行合作,開發(fā)大量專門領域的應用系統(tǒng),為特定專題研究提供平臺支持;深入掌握各類數字人文研究工具的應用功能,為用戶提供工具或數據庫使用培訓,同時可以評測數字人文工具使用體驗,提出改進意見。三是提供數字人文研究指導。高校檔案館深刻理解檔案的內在形成及資源結構,可以承擔數字人文項目的研究中介角色,協(xié)助多學科領域的研究者理解檔案資源結構,協(xié)助搭建數字人文項目的本體論基礎。四是構建數字校園記憶。加小雙指出數字記憶將數字人文和文件檔案管理的方法進行了融合,屬于數字人文的第四個層次[2]。高校檔案館作為校史研究的主體,在校園的數字記憶構建和保存上擁有先天優(yōu)勢。
將高校開放檔案資源轉化為計算機可讀、可處理、可理解、可利用的優(yōu)質數字資源,是開展數字人文研究的首要需求。本節(jié)從資源采集、語義描述和知識展示三個層面提出了高校開放檔案資源的組織策略,在對數字檔案資源進行文本化和數據化操作的基礎上,通過本體、關聯(lián)數據和可視化等技術實現高校檔案的知識揭示和應用。
數字人文追求“構建無人被排斥在外的公共領域”、“向所有人徹底開放話語圈”的核心人文主義價值[14],追求以權力中心為代表的優(yōu)勢集體與去權力化的非精英異質群體的聯(lián)合。傳統(tǒng)高校檔案的采集依據檔案材料形成單位、課題組立卷的歸檔制度,由學校各部門的檔案工作負責人員按照歸檔要求對本部門的教學、科研和管理等檔案進行整理、立卷并向高校檔案機構移交。這樣的采集方式從高校管理層角度出發(fā),對各類材料的重要性進行判別并決定其是否應該歸入檔案,雖利于檔案資源采集工作的有效開展,但在某種程度上忽視了學生或教師等高校主體的意見。面向數字人文的高校開放檔案資源采集方式應當在繼承原有歸檔制度的基礎上有所拓展,具體包括以下幾種方式,一是存量檔案的數字化,二是由管理層主導的電子文件移交與接收,三是構建由高校師生自主決定歸檔內容的社群檔案。以人文北京研究中心的“北京記憶”項目為例,其多樣化的資源采集包括由基礎資源、衍生資源、眾籌資源三類,基礎資源指現有檔案、圖書、音視頻等不同類型的北京歷史文化資源,衍生資源指課題組圍繞基礎資源編寫的摘要和大事記等參考資料,眾籌資源指“我的北京記憶”互動網站,該網站是為北京居民、海內外北京文化愛好者建立的互動交流平臺,旨在捕捉、記錄與北京有關的記憶,記憶貢獻者可以是在北京生活(過)的每個人,也可以是組織、機構、企業(yè)和團體[17]。
將已采集的高校數字檔案轉化為計算機可理解的數字資源,是數字人文研究中需要解決的重要問題。高校檔案機構通常依據《DA/T18-1999檔案著錄規(guī)則》、《DA/T46-2009文書類電子文件元數據方案》、《DAT54-2014照片類電子檔案元數據方案》、《DAT63-2017錄音錄像類電子檔案元數據方案》等行業(yè)標準,采用著錄項和元數據進行資源描述。對于大體量的數據集合,粗粒度的著錄與元數據描述工作難度低,更便于資源的集成與內部利用,但對于需要進行數字人文研究的高校開放檔案資源來說,一方面,有必要進一步采用細粒度、深層次的語義描述模型以解決數據格式異構、實體名稱歧義、語義信息不一致等問題,進而揭示更豐富的信息內容,另一方面,有必要采用相關數據發(fā)布技術實現高校檔案資源的開放共享,進而提供面向公眾的知識服務。本體作為語義網環(huán)境下知識組織和數據語義化表達的關鍵技術,能夠實現不同格式和類型的元數據的語義互操作,解決資源描述中的語義異構問題,實現資源內部的語義關聯(lián)、權限控制和接口管理。關聯(lián)數據是一種數據發(fā)布和關聯(lián)的方法,采用RDF和HTTP在Web上發(fā)布結構化信息,采用RDF鏈接技術在不同數據源中的數據之間建立計算機可理解的互連關系[18]。
目前已有較多數字人文項目構建了相關領域本體模型和關聯(lián)數據集,可以為面向數字人文的高校開放檔案語義描述提供參考。上海圖書館數字人文項目團隊在繼承和復用BIBFRAME、FOAF、PROV、Schema.Org等本體模型和詞表的基礎上,定義了人、機構、地、時、事、物等類和屬性,構建了一體化的上海圖書館本體模型和詞表,包含130萬余人物的人名規(guī)范庫和2000余收藏機構的機構名錄、地名詞表、中國歷史紀年表等內容,為上海圖書館的家譜、古籍、老電影、手稿檔案、紅色文獻等文獻知識庫提供跨網域的數據連接,并在開放數據平臺以關聯(lián)數據的方式向互聯(lián)網公開發(fā)布,同時提供各種數據消費接口供開發(fā)人員調用[19]。高校開放檔案領域本體的構建可在借鑒已有本體模型的基礎上,結合檔案領域專家智慧,采用自然語言處理等技術從檔案信息中獲取相關實體、屬性和概念,對高校檔案進行細粒度的內容揭示;關聯(lián)數據的構建需要配置私有關聯(lián)層和公有關聯(lián)層,根據實際的檔案開放鑒定情況對尚未開放的檔案資源進行保護。
對高校開放檔案進行語義描述、數據關聯(lián)等有序組織后,需搭建高校開放檔案利用平臺并面向用戶提供服務。傳統(tǒng)的高校檔案服務平臺僅著眼于針對校內用戶的文件查詢與下載,面向數字人文的開放檔案知識展示平臺構建應當注重用戶友好的設計理念和動態(tài)交互的數字技術,向公眾提供資源導航、語義檢索、成果發(fā)布、內容集展等服務。在數字人文領域,集展指的是為了創(chuàng)造價值、影響和質量,對人類文化記錄進行組織和再現的一系列廣泛的實踐,高校開放檔案的內容集展可從專題集展與互動集展兩個方面入手,專題集展以時間為線索,采用VR(虛擬現實)/AR(增強現實)、GIS(地理信息系統(tǒng))等可視化技術真實靈活地向用戶展示高校在某一時間段、某一地域發(fā)展歷程及相應成果;互動集展以高校教學、科研等活動的歷史記錄為基礎創(chuàng)建沉浸式環(huán)境,使用戶根據定位親身感受高校歷史與現實,允許用戶瀏覽及增加記憶標簽,增強用戶學習樂趣以及對高校的認同感。此外,知識展示平臺亦可引入移動端(包括手機、平板等)和數據大屏等形式作為補充與豐富,搭建全媒體跨平臺多形式的數據可視化展示系統(tǒng)[20]。以英國泰恩·威爾郡檔案博物館和紐卡斯爾圖書館共同開發(fā)的“隱藏的紐卡斯爾(Hidden Newcastle APP)”為例,該APP運用GIS技術,可根據用戶的定位采用音頻幻燈片、歷史攝影、老報紙等多種內容和形式推送與城市歷史相關的故事,向用戶展現紐斯卡爾市800多年的發(fā)展歷史[21]。
在高校開放檔案資源有序組織的基礎上,本節(jié)借鑒活態(tài)檔案館(Living Archives)有關理念對高校開放檔案資源利用模式進行探討,以期通過整合內外部資源帶動數字檔案館信息服務方式的變革,深入開發(fā)檔案的人文功能與社會功能,從全面改善和提升用戶服務體驗的角度出發(fā)重新規(guī)劃設計檔案館服務形態(tài)[22]。
開發(fā)存取是國際各界為促進科學信息自由傳播而發(fā)起的運動,在開放存取下任何用戶都可通過公共網絡免費獲取所需文獻,高校檔案資源的開放可助力數字人文展開更加多元的研究。如中央昆士蘭大學利用教學檔案對建筑環(huán)境專業(yè)學生升學率的影響因素進行研究,通過分析學生的性別、地理位置、社會經濟地位、出生國家、課程得分等變量與學生升學進度的相關性,發(fā)現課程得分對學生升學進度有顯著的促進作用,其他因素相關性則較弱[23]。同時應當注意到,數字人文涉及的學科范圍從傳統(tǒng)人文學科逐漸向社會學、經濟學和文化研究等領域滲透,其研究對象已不再局限于檔案資源。圖書館、檔案館和博物館作為數字人文研究的信息資源數據庫,三者資源融合既有利于各機構知識服務數據庫的共享,又有利于社會記憶的完善。因此,高校開放檔案資源的利用,一方面需要對本館資源進行深度挖掘,另一方面需要加快與圖書館、博物館資源的融合,滿足不同數字人文項目跨邊界的知識服務需求。
數字人文研究需要既能廣博也能深究的“刺猬狐”人才,即像刺猬那樣深度鉆研,接受人文分支學科領域的縱深性培訓,又像狐貍一樣充滿好奇心,具備來自設計、計算科學、媒體工作、信息保管和圖書館學等方面的綜合技能[14]。高校檔案館作為教育資源的集中地,擁有豐富的教育活動記錄與科學的檔案管理經驗,可協(xié)助承擔高校育人責任,其教學形式除了傳統(tǒng)的開設課程與設立實習基地之外,也可加入教育性游戲等強調用戶參與互動的形式,引導學生自下而上地完成對高校檔案資源的編研利用,在增強學生對人文資源的鑒別、重組和價值創(chuàng)造能力的同時,加深其對高校歷史及品牌形象的理解與認可。教育性游戲通常采用沉浸與模擬的形式建立虛擬的學習環(huán)境,擁有復雜敘事、豐富互動、自愿參與等特點,高校檔案館可以與高校教學單位展開合作,利用檔案的真實性與游戲的獨特性來建設探索互動式的教學模型。以達特茅斯大學檔案館采用的由Tiltfactor實驗室創(chuàng)建的元數據游戲(Metadata Games)為例,該游戲以獨特的方式展示檔案資料,學生在參與學習自身感興趣的高校檔案的同時,也為數字化檔案資料提供了元數據,協(xié)助檔案館更加準確、多元地描述檔案資源[24]。
數字人文研究倡導知識產出的多樣化,其成果既可通過程式化的學術文本型論文等學術成果來體現,也可通過在線訪問的信息系統(tǒng)和數據庫、多媒體交互式的歷史地理信息系統(tǒng)等大眾文化產品的形式呈現[25]。2017年4月,文化部出臺《關于推動數字文化產業(yè)創(chuàng)新發(fā)展的指導意見》,提出推進數字文化產業(yè)創(chuàng)新創(chuàng)業(yè),引導領軍企業(yè)聯(lián)合中小企業(yè)和科研單位布局創(chuàng)新鏈,依托重點高校等多元主體系統(tǒng)性開展數字文化產業(yè)創(chuàng)新實踐[26]。動力不足一直是高校檔案資源開放利用的瓶頸,在數字人文時代,采用一定商業(yè)化方式,與其他高校及科研機構、企業(yè)、數字文化產業(yè)創(chuàng)新中心等多元主體合作,一方面可以激發(fā)檔案資源開放活力,調動館員積極性,充分發(fā)揮高校檔案資源價值,另一方面可以開拓校企合作渠道,提升高校產學研轉化水平。當前我國工業(yè)遺產的價值再創(chuàng)造已有較好成果,其路徑高校檔案館可以參考,如常州市“運河五號”創(chuàng)意園區(qū)以“園中建館”為特色,內設常州市工商檔案博覽中心,檔案機構入駐文創(chuàng)園區(qū),與規(guī)劃設計者、地方政府、開發(fā)商與社會組織、檔案機構、文創(chuàng)企業(yè)與商業(yè)店鋪等多元主體協(xié)同合作,在履行一般性檔案館例行職責的同時,積極融入園區(qū)業(yè)態(tài)中,在保護檔案完整與安全的前提下,與文創(chuàng)企業(yè)合作共同打造特色品牌,充分實現檔案資源的市場價值[27]。
數字人文是人文研究與數字技術溝通碰撞的產物,強調在人的創(chuàng)新性思維上融入數字技術,在數字時代下促使人文學科研究煥發(fā)新的生機與活力。數字人文研究作為檔案資源組織利用的重要應用方向,其烏托邦式的價值觀念為高校檔案資源的開放、組織與利用提出新的可能,但同時也顯露出高校檔案資源開發(fā)過程中的諸多問題,法規(guī)政策不完善、管理力度不到位、歸檔內容不全面、檔案資源結構分散、檔案工作人員觀念保守、高精尖開發(fā)團隊缺乏等主客觀原因制約了高校檔案資源的開放進度。面對這種情況,高校檔案館有責任在規(guī)章制定與檔案實踐中做出優(yōu)化設計,與數字人文團隊、校內師生及社會公眾等多元主體進行跨界協(xié)作,加快促進與圖書館、博物館的資源融合,盡快推出詳細具體的開放檔案鑒定程序與方法,共建共享基于各類高校檔案資源的知識服務平臺,實現數字人文實踐與檔案開放的協(xié)同發(fā)展。