趙生輝 胡瑩
(1.西藏民族大學(xué)管理學(xué)院 咸陽 712082;2.云南大學(xué)歷史與檔案學(xué)院 昆明 650091)
中國是統(tǒng)一的多民族國家,由定居于我國境內(nèi)的56個民族(Ethnic Groups)緊密聯(lián)結(jié)而成的穩(wěn)定的民族共同體通常被統(tǒng)稱為“中華民族(Chinese Nation)”[1]。“中華民族”并不單純的社會學(xué)術(shù)語,而是具有意識形態(tài)內(nèi)涵的重要社會政治概念,是一種將國民凝聚起來實現(xiàn)整體性的組織方式、機制和形式[2]。作為一個自在的民族實體,“中華民族”源遠流長,一部中華民族史,就是一部各民族互動交融、團結(jié)凝聚、共同奮進的歷史;作為一個自覺的民族實體,“中華民族”的觀念則是近百年來中國與西方列強的對抗中才開始出現(xiàn)的[3]。通常認為,“中華民族”一詞最早由晚清學(xué)者梁啟超于1902年提出,經(jīng)過民主革命先驅(qū)孫中山“五族共和”理論的豐富與發(fā)展,在中國的抗日救亡運動和之后的反帝斗爭中發(fā)揮了強大的凝聚人心作用,釋放出難以估量的巨大能量,成為深植于億萬中國人內(nèi)心深處,牢固不可動搖的政治觀念[4]。新中國成立以來,除過文革時期走過的曲折道路之外,歷屆黨和國家領(lǐng)導(dǎo)人都高度重視民族團結(jié)問題,針對民族團結(jié)問題提出過諸多經(jīng)典論述,根據(jù)當(dāng)時的社會實際制定了促進民族地區(qū)經(jīng)濟社會發(fā)展的政策措施,為各民族團結(jié)繁榮發(fā)展良好局面的形成奠定了堅實基礎(chǔ)。1989年,已故著名社會學(xué)家、人類學(xué)家費孝通先生應(yīng)邀在香港中文大學(xué)發(fā)表學(xué)術(shù)演講,提出了著名的“中華民族多元一體格局”理論[3],為我國的民族理論研究和民族工作政策提供了富有創(chuàng)見的戰(zhàn)略框架體系,對“中華民族共同體”理論的提出也產(chǎn)生了直接的影響。
黨的十八大以來,習(xí)近平總書記提出“中華民族是具有多元一體特征的命運共同體”的觀點,并將中華民族多元一體格局的關(guān)系描述為“一體包含多元,多元組成一體,一體離不開多元,多元也離不開一體,一體是主線和方向,多元是要素和動力,兩者辯證統(tǒng)一”[5]。黨的十九大將“鑄牢中華民族共同體意識”寫入黨章,使這項工作正式上升為事關(guān)中國56個民族共同命運的國家戰(zhàn)略[6]。2019年9月27日,在中央民族工作會議暨全國第六次民族團結(jié)進步表彰大會上,習(xí)近平總書記做出“以鑄牢中華民族共同體意識為主線,將民族團結(jié)進步事業(yè)作為一項基礎(chǔ)性事業(yè)抓緊抓好”的重要指示[7]。2019年10月,中共中央辦公廳、國務(wù)院辦公廳聯(lián)合印發(fā)《關(guān)于深入持久開展民族團結(jié)進步創(chuàng)建工作,鑄牢中華民族共同體意識的意見》[8]?!拌T牢中華民族共同體意識”是新時期我國民族工作的主線,也是亟需進行深入研究的重大戰(zhàn)略性學(xué)術(shù)課題。2019年底以來,國內(nèi)多所高校先后成立了與鑄牢中華民族共同體意識相關(guān)的研究機構(gòu),其中比較代表性的機構(gòu)主要有中央民族大學(xué)“鑄牢中華民族共同體意識研究院”[9]、中南民族大學(xué)“中華民族共同體研究院”[10]、西南民族大學(xué)“鑄牢中華民族共同體意識研究中心”[11]、西北民族大學(xué)“鑄牢中華民族共同體意識研究院”[12]、廣西民族大學(xué)“中華民族共同體研究院”[13]、暨南大學(xué)“中華民族凝聚力研究院”[14]、華中科技大學(xué)“鑄牢中華民族共同體意識國家研究基地”[15]、東南大學(xué)“中華民族視覺形象研究基地”[16]等,此外還有多所高校成立了中華民族共同體意識相關(guān)的科研團隊、工作室等研究機構(gòu)。伴隨著眾多研究機構(gòu)的相繼成立,為相關(guān)領(lǐng)域?qū)<覍W(xué)者的學(xué)術(shù)研究提供基礎(chǔ)檔案文獻支持,服務(wù)“鑄牢中華民族共同體意識”國家戰(zhàn)略,彰顯檔案工作在國家重大戰(zhàn)略中的作用和價值,助力國家民族團結(jié)進步事業(yè)的成為新時期我國民族地區(qū)各級各類檔案管理機構(gòu)的重大政治任務(wù),也對民族地區(qū)檔案服務(wù)工作的模式提出了全新的挑戰(zhàn)。
近年來,我國學(xué)者就檔案與中華民族文化之間的關(guān)系發(fā)表了多篇研究成果。黃才源通過分析周朝的“石室金匱”、西漢的“石渠閣”、明朝的“黃冊庫”、明清兩代的“皇史宬”等檔案保管機構(gòu)的演進,得出“重視保護檔案是中華民族的優(yōu)秀傳統(tǒng)”的結(jié)論[17]。譚仁杰認為,“檔案的重實精神,檔案較強的政治性和權(quán)威性,檔案的穩(wěn)定性的統(tǒng)一性,在維護中國古代政治結(jié)構(gòu)的穩(wěn)定性、統(tǒng)一性,維護中華民族的統(tǒng)一和增強中華民族的凝聚力方面起著重要作用”[18],并據(jù)此得出“檔案文化是中華民族傳統(tǒng)文化的基石”的觀點[19]。徐擁軍認為,“中華民族自古就是一個重視歷史記錄、尊重傳統(tǒng)文化、珍惜集體記憶的民族。集體記憶是維系中華民族的精神紐帶,是實現(xiàn)中華民族偉大歷史復(fù)興的精神動力。檔案記憶觀理論的提出,為我國在技術(shù)經(jīng)濟飛速發(fā)展,社會、文化急劇變遷的當(dāng)下中國,有效得傳承和保護中華民族集體記憶提供了一種新的思路”[20]。楊毅、何瓦特認為,廣義的“民族檔案”可以分為“中華民族共同體檔案”和“少數(shù)民族檔案”兩個不同的層次,要站在國家的高度對民族檔案做一個基本的思想認識方向的思考,回應(yīng)時代提出的構(gòu)建中華民族共同體的要求,并以此為契機,倡導(dǎo)發(fā)揮民族檔案獨特的歷史記錄、集體記憶、文化積淀等功能,發(fā)揮中華民族共同體檔案在凝聚共識,聚集國力,維護統(tǒng)一方面的強大支撐作用[21]。此外,楊毅認為,“中華民族檔案”是56個民族的檔案在國家化整合進程中的既定存在,與歷史上眾多族類群體的歷史記錄具有歷史連續(xù)性的同時,還具有民族國家特定歷史所賦予的整體性特征[22]。上述研究為“鑄牢中華民族共同體意識”國家戰(zhàn)略背景下,從國家整體視角進行的檔案服務(wù)模式創(chuàng)新提供了理論基礎(chǔ)。
“鑄牢中華民族共同體意識”是一個視角極為宏大、內(nèi)涵極其豐富的命題,要從“中華民族共同體”視角提供檔案信息資源服務(wù),就必須建立全局觀、整體觀,能夠從宏觀層面整合各類相關(guān)檔案資源,實現(xiàn)微觀層面檔案服務(wù)所不能實現(xiàn)的服務(wù)能力,主要體現(xiàn)在以下方面:第一,“中華民族共同體”視角之下,檔案的來源區(qū)域覆蓋整個國家甚至?xí)婕安糠志惩鈪^(qū)域。任何一個檔案管理機構(gòu)所收藏的檔案文獻都只是中華民族檔案資源的組成部分,要從“共同體”的全局視角進行分析和研究,就必須實現(xiàn)跨地區(qū)、跨層級檔案信息資源的整合共享。第二,“中華民族共同體”研究涉及的時間跨度長達數(shù)千年,要進行大時間尺度學(xué)術(shù)問題研究,就必須盡可能多地整合各個歷史時期的檔案資源,以便研究人員能夠從長期歷史演進的視角發(fā)現(xiàn)之前依靠直覺和主觀判斷難以發(fā)現(xiàn)的深層次規(guī)律;第三,“中華民族共同體”研究涉及的檔案文獻極為多樣,其內(nèi)容通常是各個民族對特定時間段、特定地區(qū)社會狀況的真實記錄,要進行整體性分析,就需要建立統(tǒng)一的時空坐標體系,對各民族文獻當(dāng)中的紀年數(shù)據(jù)、地名數(shù)據(jù)、人名數(shù)據(jù)、物名數(shù)據(jù)等基礎(chǔ)資料進行歸一化處理,在不同民族對同一時間、地點、人物的不同表述方式之間建立語義關(guān)聯(lián),減少學(xué)者在基礎(chǔ)資料整理方面付出的重復(fù)性勞動,使其可以將精力集中于學(xué)術(shù)問題的創(chuàng)造性思考。第四,“中華民族共同體”研究涉及多種語言文字,而通常情況下特定研究人員所能熟悉和掌握的語言文字的數(shù)量是有限的,加之語言文字古今形式演變造成的差別,客觀上對涉及多種語言文字的學(xué)術(shù)研究工作造成非常大的障礙。要從“中華民族共同體”視角提供檔案信息服務(wù),就必須減少語言文字差異性對研究人員所造成的各類制約,盡可能使學(xué)者能夠以熟悉的語言文字為工具,概要了解其他語言文字檔案文獻的內(nèi)容信息,獲取對同一主題更為全面系統(tǒng)的認識。第五,“中華民族共同體”檔案資源的載體形式呈現(xiàn)出高度多樣化特征,在紙張和印刷術(shù)出現(xiàn)之前,檔案的載體形式豐富多樣,除了檔案機構(gòu)館藏的紙質(zhì)檔案之外,金石、簡牘、絹帛、碑刻、壁畫等形式載體如果具有檔案價值,也應(yīng)該納入資源采集的范疇。因此,在“中華民族共同體專題檔案資源庫”建設(shè)的視角下,檔案管理機構(gòu)需要與圖書館、博物館、文史館、古籍所等公共文化機構(gòu)的開展協(xié)作,圍繞同一主題共享檔案信息資源。上述需求的出現(xiàn),意味著以分散形式提供少量文獻查閱服務(wù)的傳統(tǒng)檔案服務(wù)模式已經(jīng)不能滿足“鑄牢中華民族共同體意識”國家戰(zhàn)略背景下的檔案信息服務(wù)需要,借助科學(xué)的理念和方法進行服務(wù)體系重組成已經(jīng)為當(dāng)前迫切需要研究的戰(zhàn)略性問題。
“中華民族共同體專題檔案資源庫”是指圍繞“多民族共創(chuàng)中華”這一宏大主題[23],以分散保存在我國各級各類檔案管理機構(gòu)及相關(guān)公共文化機構(gòu)的多種來源、多種類型、多種載體、多種語言文字的檔案文獻為基礎(chǔ),參照統(tǒng)一的時空坐標體系和標準體系進行整體性邏輯整合與重組之后,可以為相關(guān)領(lǐng)域全景式、大時間尺度、大空間范圍學(xué)術(shù)問題的研究提供基礎(chǔ)史料證據(jù)服務(wù)的檔案資源體系?!爸腥A民族共同體專題檔案資源庫”建設(shè)是我國檔案管理機構(gòu)對接“鑄牢中華民族共同體意識”國家戰(zhàn)略,服務(wù)國家重大戰(zhàn)略需求的重要舉措,對“中華民族共同體”相關(guān)問題研究的支撐作用體現(xiàn)在以下方面:第一,打破時間、空間、語言的限制,使全國各地的研究人員可以足不出口訪問到全國各地檔案管理機構(gòu)收藏和保存的相關(guān)主題的檔案文獻資源,并可以在相關(guān)工具的支持下完成多語種檔案文獻資源的查找和利用;第二,應(yīng)用數(shù)字化方法進行大規(guī)模檔案文獻的內(nèi)容信息融合,使得用戶可以借助數(shù)字化工具快速完成部分長時間跨度、大地理空間和全方位等大尺度研究問題的研究和分析;第三,可以從“中華民族共同體”的整體視角建立統(tǒng)一的時空坐標體系,實現(xiàn)多民族檔案文獻的深度整合,使原本分散保存在各級各類檔案管理機構(gòu)當(dāng)中的大量檔案文獻資源經(jīng)過系統(tǒng)性整理與聚合之后,在數(shù)字化環(huán)境當(dāng)中建立起“中華民族”的檔案“鏡像”,使之前只存在于大眾觀念當(dāng)中的“中華民族”擁有相對更為具體的表現(xiàn)形式?!爸腥A民族共同體專題檔案資源庫”可以滿足國內(nèi)“中華民族共同體”相關(guān)學(xué)術(shù)研究的檔案需求,同時也可以為中華民族共同體意識教育、民族地區(qū)公共文化服務(wù)、民族地區(qū)影視文藝作品創(chuàng)作等領(lǐng)域提供基礎(chǔ)資源支持,其本身也是多民族協(xié)作建設(shè)的結(jié)果,對我國民族團結(jié)進步事業(yè)的發(fā)展將會產(chǎn)生積極而深遠的影響。
“中華民族共同體專題檔案資源庫”根據(jù)“鑄牢中華民族共同體意識”國家戰(zhàn)略的需要,以各級各類檔案管理機構(gòu)征集和保存的檔案文獻為基礎(chǔ),經(jīng)過選擇、抽取和整合,按照整體性邏輯重新組織起來的專題型檔案信息資源服務(wù)體系,其內(nèi)涵和本質(zhì)的理解主要體現(xiàn)在以下方面。
檔案是人類在社會實踐中形成的原始記錄,可以為研究人員推測特定歷史時期社會活動原貌提供證據(jù)支持。在中國遼闊的疆域內(nèi)和漫長的歷史進程中,漢族和各少數(shù)民族在各自的社會實踐中產(chǎn)生了反映其活動信息的大量記錄性文獻。凡是能夠從中華民族整體視角出發(fā),反映各民族交流融合、共創(chuàng)中華文明的記錄文獻都可以篩選為“中華民族檔案資源”的組成部分?!爸腥A民族共同體專題檔案資源庫”的主題通常涉及以下方面:第一,反映漢族和各少數(shù)民族族體上相互吸納的檔案文獻;第二,反映漢族和各少數(shù)民族共同開拓祖國疆域的檔案文獻;第三,反映漢族和各少數(shù)民族物資和經(jīng)濟交流的檔案文獻;第四,反映歷代中央王朝政權(quán)與少數(shù)民族地方政權(quán)政治聯(lián)系的檔案文獻;第五,反映漢族和各少數(shù)民族進行文化藝術(shù)交流活動,共同豐富中華民族文化寶庫的檔案文獻;第六,反映漢族和各少數(shù)民族反對外地侵略,維護中華民族利益的檔案文獻;第七,反映漢族和各少數(shù)民族參與中國的歷次民主革命的檔案文獻;第八,反映漢族和各少數(shù)民族共同崇尚愛國主義,追求祖國統(tǒng)一的中華民族精神的檔案文獻;第九,反映漢族和各少數(shù)民族之間相互幫助、相互扶持,自強不息、奮發(fā)進取的檔案文獻。由此可見,“中華民族共同體專題檔案資源庫”并不能等同于中國56個民族檔案的總和,而是從全局和整體的視角展示中華民族的演進過程,強調(diào)組成中華民族的56個民族在共建中華文明進程中的貢獻,強調(diào)56個民族不可分割的歷史聯(lián)系。無論“中華民族共同體專題檔案資源庫”文獻來源于哪個民族,反映了何種主題,都必須以現(xiàn)實存在的檔案文獻為依據(jù),尤其是將大量檔案文獻內(nèi)容整合為領(lǐng)域本體時,必須確保每一條錄入本體的數(shù)據(jù)都有確切可靠的文獻作為依據(jù),確保用戶從本體獲取整體性的檔案數(shù)據(jù)線索之后,可以通過回溯找到原始檔案文獻作為印證。
“中華民族共同體”是存在于國民觀念當(dāng)中的人群的集合,人們可以感知到這一共同體的存在,在現(xiàn)實中卻找不到與這一概念完全對應(yīng)的實體形式。這就意味著檔案管理體系當(dāng)中,按照“來源原則”進行中華民族共同體檔案的整理與服務(wù)是不可行的?!爸腥A民族共同體檔案資源”通常是需要以某種具體民族檔案的形式來體現(xiàn)的,例如“漢族檔案”“藏族檔案”“蒙古族檔案”等。然而,即使是具體的某一民族的檔案,其歸檔管理也不會時候以該民族為全宗為單元,而是通常依托某一現(xiàn)實當(dāng)中的實體機構(gòu)進行。例如,西藏自治區(qū)舉辦的雪頓節(jié)慶典活動的相關(guān)檔案屬于藏族檔案,但是其歸檔管理必須依托西藏自治區(qū)民族宗教事務(wù)管理機構(gòu)、旅游文化服務(wù)機構(gòu)進行。因此,“中華民族共同體專題檔案資源庫”具有鮮明的“建構(gòu)特性”,是按照一定的原則從大量現(xiàn)實檔案文獻當(dāng)中選擇出的部分檔案并對其內(nèi)容信息進行重新組織之后的結(jié)果?!爸腥A民族共同體專題檔案資源庫”本質(zhì)上屬于專題檔案資源,其建設(shè)并不以最大限度還原歷史細節(jié)為目標,而是從專題的核心主題出發(fā),追求檔案文獻資源對主題的支撐和印證作用。強調(diào)“中華民族共同體專題檔案資源庫”的建構(gòu)特性,并不能否定其真實性,只要構(gòu)成中華民族共同體專題檔案資源庫的來源文獻本身是真實可靠的,整個專題檔案資源就具有真實性。實際上,“建構(gòu)特性”是所有檔案管理機構(gòu)都具有的特性,決定將那些類型的檔案可以長期保存,哪些類型的檔案不能歸檔,本身就是一種“建構(gòu)”。此外,作為專題檔案資源,通常不能將某份檔案文獻從原有的檔案管理體系當(dāng)中抽離,而是使用復(fù)制件或者經(jīng)過光學(xué)掃描形成的數(shù)字化副本。這就意味著,盡管抽取到專題檔案資源體系當(dāng)中的檔案文獻并不是全集,卻不能影響該文獻在原有檔案管理體系當(dāng)中繼續(xù)發(fā)揮作用,并沒有破壞原有檔案體系的完整性,只是通過專題形式對強調(diào)和凸顯抽取出的部分文獻與專題之間的關(guān)系進行而已。
“中華民族共同體專題檔案資源”圍繞“多民族共創(chuàng)中華”這一主題,盡最大可能搜集整理所有可能的檔案文獻資源,致力于構(gòu)建在邏輯上具有“多元一體”特征的檔案資源體系。“中華民族共同體專題檔案資源庫”對各種類型檔案文獻資源進行的整合主要體現(xiàn)在以下方面:第一,跨越地理位置、行政層級、機構(gòu)類型對檔案查找行為造成的制約,基于互聯(lián)網(wǎng)實現(xiàn)同一主題檔案文獻資源的“一站式利用”?!爸腥A民族共同體專題檔案資源庫”建設(shè)以主題為導(dǎo)向,所有相關(guān)檔案管理機構(gòu)圍繞統(tǒng)一的數(shù)據(jù)平臺進行檔案文獻上傳和著錄,盡最大可能減少研究人員為查找資料所付出的時間、精力和經(jīng)濟成本。為了提高專題檔案資源的質(zhì)量,必要時檔案管理機構(gòu)需要通過協(xié)作方式從圖書館、博物館、紀念館、美術(shù)館、文史館、古籍所等公共文化機構(gòu)獲得具有檔案價值的藏品信息,并整合到統(tǒng)一的數(shù)據(jù)平臺當(dāng)中。第二,跨越檔案存儲介質(zhì)的差異性,基于數(shù)字化的服務(wù)平臺實現(xiàn)檔案文獻內(nèi)容整合,使用戶可以忽略檔案存儲介質(zhì)的區(qū)別,專注于對檔案內(nèi)容分析和研究。第三,跨越語言文字的差異性對檔案閱讀造成的制約,以國家通用語言文字為中介語,實現(xiàn)多民族語言檔案文獻資源的信息共享體系。少數(shù)民族語言文字檔案文獻在向“中華民族共同體專題檔案資源庫”上傳時,原則上要求以民漢雙語方式進行元數(shù)據(jù)著錄,并盡可能實現(xiàn)檔案內(nèi)容的漢語翻譯并將雙語版本上傳。此外,系統(tǒng)可以通過各少數(shù)民族語言文字與國家通用語言文字機器翻譯系統(tǒng),實現(xiàn)各語種檔案文獻內(nèi)容的快速機器翻譯,為跨語言概要了解檔案文獻主題提供技術(shù)支持。第四,跨越各民族時空坐標體系的差異性,解決不同民族紀年與計時方案造成的時間表述方式額差異性、不同民族對同一地理位置的不同稱呼、同一地理位置古今地名演進的差異性等因素,盡可能使“中華民族共同體專題檔案資源庫”當(dāng)中關(guān)于同一實體的多種表述方式之間能夠建立語義關(guān)聯(lián),為跨越符號系統(tǒng)差異性實現(xiàn)文化推理和計算奠定邏輯基礎(chǔ)??傊?,“中華民族共同體專題檔案資源庫”建設(shè)就是要盡可能通過信息技術(shù)減少時間、空間、語言、符號差異性對檔案查詢、閱讀和利用行為的制約和影響,在形式上將原本高度多元的檔案文獻體系整合為統(tǒng)一的整體,實現(xiàn)專題檔案文獻的便捷獲取和利用。
數(shù)字人文(Digital Humanities)是伴隨著人類社會由“信息社會”進入“智能社會”,學(xué)術(shù)服務(wù)由“文獻服務(wù)”轉(zhuǎn)向“知識服務(wù)”,在全球人文社會科學(xué)出現(xiàn)的一種新的學(xué)術(shù)潮流。目前學(xué)界對數(shù)字人文的概念還沒有完成達成共識,但是普遍認可數(shù)字人文是一種可以依托信息技術(shù)手段,完成傳統(tǒng)人文研究模式難以完成的復(fù)雜性研究任務(wù)的新型研究范式。例如,由哈佛大學(xué)費正清東亞研究中心建設(shè)的“中國歷代人物傳記資料庫(Chinese Biographical Database, CBDB)”系統(tǒng)收集中國歷史相關(guān)史料,并將其內(nèi)容描述為關(guān)系型數(shù)據(jù)進行關(guān)聯(lián)保存,迄今已經(jīng)收錄超過422600人的傳記資料數(shù)據(jù),可以基于地理信息全景展示和挖掘各個朝代歷史人物社會活動的深層次規(guī)律[24]。由瑞士洛桑理工學(xué)院Frederic Kaplan教授主持的“威尼斯時光機(Time Machine Project)”項目,從意大利威尼斯城市檔案館的海量檔案中提取歷史大數(shù)據(jù),通過計算機模擬再現(xiàn)威尼斯整座城市在過去1000多年間的演化過程,支持社會大眾對歷史上各個階段的細節(jié)事實進行知識檢索[25]。在數(shù)字人文成為全球性潮流的背景下,“中華民族共同體專題檔案資源庫”建設(shè)應(yīng)當(dāng)超越傳統(tǒng)的“文獻服務(wù)”模式,建立與人工智能時代“知識服務(wù)”相適應(yīng)的新型檔案信息資源服務(wù)模式。數(shù)字人文理論與方法在“中華民族共同體專題檔案資源庫”當(dāng)中的應(yīng)用主要體現(xiàn)在以下方面:第一,通過構(gòu)建“中華民族共同體領(lǐng)域本體”,實現(xiàn)各類檔案文獻資源內(nèi)容信息的深度融合,使用戶可以直接通過訪問領(lǐng)域本體獲取聚合態(tài)的檔案內(nèi)容信息,而不必一一查閱分散保存的檔案文獻,并且可以實現(xiàn)對特定實體“全景式”檔案信息的一次性獲?。坏诙?,通過建立跨越古今的時間坐標體系,為部分基于大時間尺度的學(xué)術(shù)研究提供技術(shù)支持;第三,基于歷史地理信息系統(tǒng)(Historical Geographic Information System, HGIS)實現(xiàn)實體對象分布的可視化呈現(xiàn),為部分大空間尺度的學(xué)術(shù)研究提供技術(shù)支持。第四,基于大體量數(shù)據(jù)和可視化分析技術(shù),發(fā)現(xiàn)依靠小規(guī)模文獻和研究人員直覺判斷難以發(fā)現(xiàn)的深層次規(guī)律和問題??傊爸腥A民族共同體專題檔案資源庫”已經(jīng)超越了檔案文獻庫的范疇,演變?yōu)橐环N具有智能化特征的中華民族專題研究數(shù)字人文基礎(chǔ)設(shè)施。
基于上述對“中華民族共同體專題檔案資源庫”內(nèi)涵所做分析,將其體系架構(gòu)總體上分為技術(shù)架構(gòu)、組織架構(gòu)和管理架構(gòu)三個組成部分。其中,技術(shù)架構(gòu)是指“中華民族共同體專題檔案資源庫”技術(shù)運行體系,組織架構(gòu)是指支撐“中華民族共同體專題檔案資源庫”運行的組織機制;“管理架構(gòu)”是指為了向用戶提供高質(zhì)量檔案文獻服務(wù)和知識服務(wù)而對資源庫進行整體性控制的管理措施。
圖1所示的“中華民族共同體專題檔案資源庫”總體上分為“檔案征集”“檔案文獻服務(wù)”“檔案知識服務(wù)”“專題數(shù)字人文服務(wù)”“語言支持體系”等模塊組成。“檔案征集”模塊是指從我國各級各類檔案館及圖書館、博物館等公共文化機構(gòu)征集“中華民族共同體”相關(guān)主題檔案文獻,由平臺管理機構(gòu)或者各檔案來源機構(gòu)將征集范圍內(nèi)檔案文獻的數(shù)字化掃描件通過平臺上傳到后臺存儲庫,同時對文獻進行元數(shù)據(jù)著錄。“檔案文獻服務(wù)模塊”是通過元數(shù)據(jù)向用戶提供檔案文獻檢索和閱讀服務(wù)的體系,是以文獻為基本管理和服務(wù)單元的傳統(tǒng)檔案信息服務(wù)模式;“檔案知識服務(wù)模塊”是指將專題檔案文獻存儲庫當(dāng)中由全國各地征集而來的大量檔案文獻的內(nèi)容信息進行知識抽取,并將其通過數(shù)據(jù)三元組形式融入到領(lǐng)域本體庫當(dāng)中,從而使用戶可以通過檢索本體庫就獲得檔案文獻的主要內(nèi)容信息,而不再需要去閱讀檔案文獻。同時,在知識推理等技術(shù)的支持下,系統(tǒng)可以為用戶提供領(lǐng)域知識問答服務(wù),由用戶通過自然語言方式向系統(tǒng)提出問題,系統(tǒng)給出問題的精確答案,而不是提供一堆相關(guān)文獻供用戶選擇。“領(lǐng)域數(shù)字人文服務(wù)”是指領(lǐng)域本體信息與地理信息系統(tǒng)相結(jié)合所構(gòu)建的歷史地理信息系統(tǒng)可以為用戶的大時間尺度、大空間范圍學(xué)術(shù)問題的研究和探索提供支持?!岸嗝褡逭Z言支持體系”是指在實現(xiàn)“中華民族共同體專題檔案資源庫”的所有環(huán)節(jié),為了減少語言文字差異性的制約,而對各類檔案文獻或者元數(shù)據(jù)進行的翻譯工作。此處的翻譯工作可以由人工方式完成,也可以有機器翻譯系統(tǒng)低精度高速翻譯,人工進行確認修正的方式完成。
圖1 “中華民族共同體專題檔案資源庫”的技術(shù)架構(gòu)
“中華民族共同體專題檔案資源庫”是需要多部門協(xié)同工作才能完成的任務(wù),其組織架構(gòu)設(shè)計是否合理,對于資源庫建設(shè)各項目標能否順利達成有著直接的影響。通常情況下,“中華民族共同體專題檔案資源庫”建設(shè)涉及以下幾類主體機構(gòu):第一,國家民族事務(wù)管理機構(gòu)。鑒于“中華民族共同體專題檔案資源庫”是貫徹落實“鑄牢中華民族共同體意識”國家戰(zhàn)略的重要舉措,資源庫建成以后也主要是為國家民族事務(wù)管理委員會、各民族自治地方以及各類民族理論研究機構(gòu)提供基礎(chǔ)文獻和數(shù)字人文基礎(chǔ)設(shè)施服務(wù),國家民委事務(wù)委員會應(yīng)該成為“中華民族共同體專題檔案資源庫”建設(shè)最主要的推動力量。第二,國家檔案行政機關(guān)。國家檔案行政機關(guān)和各級各類檔案管理機構(gòu)是“中華民族共同體專題檔案資源庫”建設(shè)當(dāng)中的第二大責(zé)任主體。“中華民族共同體專題檔案資源庫”的基礎(chǔ)檔案資源來源于我國各級各類檔案館,尤其是民族地區(qū)各類檔案館,在檔案征集環(huán)節(jié)需要國家檔案局的協(xié)調(diào),只有在國家檔案行政機關(guān)以行政公文方式要求下屬機關(guān)配合執(zhí)行的情況下,專題檔案資源征集工作的質(zhì)量才能得到保障。第三,國家文化行政機關(guān)?!爸腥A民族共同體專題檔案資源庫”的檔案征集范圍并不局限于檔案管理機構(gòu),圖書館、博物館、文化館、古籍所等機構(gòu)也涉及部分征集任務(wù),需要國家文化與旅游部等行政機關(guān)的協(xié)調(diào)和溝通。第四,“中華民族共同體”領(lǐng)域各類相關(guān)研究機構(gòu)。我國眾多高校近年來成立的“鑄牢中華民族共同體意識”研究機構(gòu)是“中華民族共同體專題檔案資源庫”主要用戶,需要在其建設(shè)過程中全程參與,尤其是在資源庫服務(wù)體系設(shè)計環(huán)節(jié)需要將相關(guān)服務(wù)需求明確進行表達,以便將相關(guān)功能嵌入到系統(tǒng)當(dāng)中。此外,在將檔案文獻內(nèi)容抽取為語義三元組數(shù)據(jù)形式時,除了部分較為明確的關(guān)系可以由計算機自動抽取之外,大多數(shù)隱含的復(fù)雜語義關(guān)系需要借助領(lǐng)域?qū)<胰斯こ槿〔拍芡瓿?,在多份檔案文獻對同一事實記錄數(shù)據(jù)不一致時,還需要由領(lǐng)域?qū)<疫M行評議和確認。因此,中華民族共同體領(lǐng)域各類專家需要參與到“中華民族共同體專題檔案資源庫”建設(shè)的全過程,并對于本體庫建設(shè)質(zhì)量有著重要的影響。第五,少數(shù)民族語言文字研究機構(gòu)?!爸腥A民族共同體專題檔案資源庫”建設(shè)需要對完成多種語言文字檔案文獻的知識整合,因而需要語言文字工作機構(gòu)和部分少數(shù)民族語言文字研究機構(gòu)的參與,尤其是對部分古文字檔案文獻進行數(shù)據(jù)抽取時,必須依靠熟悉該文種的專業(yè)機構(gòu)和專業(yè)人士的識讀和理解才能完成。
“中華民族共同體專題檔案資源庫”的管理架構(gòu)是指保障資源庫建設(shè)和服務(wù)質(zhì)量的各項管理措施。根據(jù)圖1所示的技術(shù)架構(gòu),“中華民族共同體專題檔案資源庫”的管理架構(gòu)主要涉及以下方面:第一,檔案征集工作管理。檔案征集工作需要在國家檔案管理法規(guī)制度框架內(nèi),根據(jù)“中華民族共同體專題檔案資源分類表”,從我國各級各類檔案管理機構(gòu)館藏檔案當(dāng)中進行征集。在實踐中,可以公布相關(guān)征集標準,由各級檔案管理機構(gòu)自行篩選和提交,也可以通過對各類檔案館館藏目錄的檢索,確定明確的檔案文獻清單之后由相關(guān)檔案管理機構(gòu)按照要求提交。專題檔案征集工作力求全面,應(yīng)該盡最大的努力使所有符合征集范圍的檔案文獻都納入到專題資源庫當(dāng)中。與此同時,資源庫建設(shè)機構(gòu)應(yīng)該對于元數(shù)據(jù)著錄、檔案文獻數(shù)字化加工、少數(shù)民族語言文字檔案翻譯、少數(shù)民族語言文字檔案雙語元數(shù)據(jù)著錄等問題做出明確規(guī)定,確保各地征集獲得檔案資源有統(tǒng)一的格式和質(zhì)量。第二,檔案數(shù)據(jù)抽取工作管理。數(shù)據(jù)抽取是將檔案文獻內(nèi)容轉(zhuǎn)化為領(lǐng)域本體的關(guān)鍵步驟,需要制定明確的工作流程和抽取規(guī)則,確保從文獻當(dāng)中抽取的數(shù)據(jù)能夠真實反映作者原意,且盡最大可能增加數(shù)據(jù)抽取的數(shù)量,減少由文獻向數(shù)據(jù)轉(zhuǎn)換時的“語義消耗”。只有在數(shù)據(jù)抽取工作嚴格遵循相關(guān)規(guī)范時,檔案文獻所具有的真實性屬性才能衍生和傳遞到檔案領(lǐng)域本體數(shù)據(jù)集,領(lǐng)域本體才能具有被用戶所信任的屬性。在部分應(yīng)用當(dāng)中,用戶可以只檢索本體,并將以聚合態(tài)出現(xiàn)的檔案數(shù)據(jù)集作為證據(jù)使用。第三,檔案信息服務(wù)工作管理。“中華民族共同體專題檔案資源庫”按照數(shù)字人文理念進行資源組織,滿足計算機自動推理和計算的需求,允許用戶以自然語言方式獲取領(lǐng)域相關(guān)問題的答案。為了達到上述目標,資源庫建設(shè)方就需要以“中華民族共同體領(lǐng)域本體”建設(shè)為核心,推動領(lǐng)域本體的完善與進化,通過語義推理技術(shù)補全人工建模未能發(fā)現(xiàn)的隱含關(guān)系,根據(jù)用戶常見問題倒推資源體系。如果發(fā)現(xiàn)用戶需求比較明顯的高頻領(lǐng)域檔案文獻資源數(shù)量較少,覆蓋范圍有限,則應(yīng)該主動通過各類途徑反向征集該領(lǐng)域的檔案資源,從而使資源體系可以滿足絕大多數(shù)用戶的利用需求。
“中華民族共同體專題檔案資源庫”是指圍繞“多民族共創(chuàng)中華”這一宏大主題,以分散保存在我國各級各類檔案管理機構(gòu)及相關(guān)公共文化機構(gòu)的多種來源、多種類型、多種載體、多種語言文字的檔案文獻為基礎(chǔ),參照統(tǒng)一的時空坐標體系和標準體系進行整體性邏輯整合與重組之后,可以為相關(guān)領(lǐng)域全景式、大時間尺度、大空間范圍學(xué)術(shù)問題的研究提供基礎(chǔ)史料證據(jù)服務(wù)的檔案資源體系?!爸腥A民族共同體專題檔案資源庫”建設(shè)是我國檔案管理機構(gòu)對接“鑄牢中華民族共同體意識”國家戰(zhàn)略,服務(wù)國家重大戰(zhàn)略需求的重要舉措。“中華民族共同體專題檔案資源庫”具有鮮明的“建構(gòu)特性”,是按照一定的原則從大量現(xiàn)實檔案文獻當(dāng)中選擇出的部分檔案并對其內(nèi)容信息進行重新組織之后的結(jié)果,其建設(shè)并不以最大限度還原歷史細節(jié)為目標,而是從專題的核心主題出發(fā),追求檔案文獻資源對主題的支撐和印證作用?!爸腥A民族共同體專題檔案資源庫”建設(shè)應(yīng)當(dāng)超越傳統(tǒng)的“文獻服務(wù)”模式,建立與人工智能時代“知識服務(wù)”相適應(yīng)的新型檔案信息資源服務(wù)模式?!爸腥A民族共同體專題檔案資源庫”總體上分為“檔案征集”“檔案文獻服務(wù)”“檔案知識服務(wù)”“專題數(shù)字人文服務(wù)”“語言支持體系”等模塊組成?!爸腥A民族共同體專題檔案資源庫”的建設(shè)應(yīng)該由國家民族事務(wù)管理機構(gòu)作為主要推動機構(gòu),通過與國家檔案行政機關(guān)、國家文化行政機關(guān)、語言文字工作機構(gòu)的協(xié)作完成資源庫項目的申報、立項、實施和運行維護等工作,建設(shè)過程中需要各類中華民族共同體研究領(lǐng)域?qū)I(yè)機構(gòu)、少數(shù)民族語言文字專業(yè)研究機構(gòu)的全程參與?!爸腥A民族共同體專題檔案資源庫”建設(shè)需要強化對檔案拯救、數(shù)據(jù)抽取和信息服務(wù)環(huán)節(jié)的管理,通過各類措施保障工作質(zhì)量,確保進入資源庫的檔案文獻能夠覆蓋絕大多數(shù)領(lǐng)域問題,能夠滿足用戶的智能化服務(wù)需求。