華 林 馮安儀 譚雨琦
(云南大學(xué)歷史與檔案學(xué)院,云南昆明,650091)
2022年10月,黨的二十大報(bào)告提出加快建設(shè)海洋強(qiáng)國(guó)。[1]我國(guó)各個(gè)歷史時(shí)期形成了大量的海洋歷史檔案,內(nèi)容涵蓋海洋經(jīng)濟(jì)、政治、文化、社會(huì)、安全、生態(tài)等,在保護(hù)海洋傳統(tǒng)文化、傳承海洋記憶方面發(fā)揮了重要作用。在數(shù)字環(huán)境下,檔案數(shù)字資源呈現(xiàn)出迅猛增長(zhǎng)的趨勢(shì),資源的分散性、異構(gòu)性、無(wú)序性和冗余性等特點(diǎn),限制了檔案內(nèi)容的集成利用。借助LAM資源整合理論、技術(shù)與方法,探討海洋歷史檔案數(shù)字資源整合問題,有利于廣泛聚合數(shù)字資源,為開展海洋治理、維護(hù)國(guó)家海洋權(quán)益提供檔案信息支持。
我國(guó)海洋歷史檔案是指1949 年新中國(guó)成立以前各個(gè)歷史時(shí)期的中央政府、地方機(jī)構(gòu)和個(gè)人等在海洋經(jīng)略、海疆保衛(wèi)、維護(hù)權(quán)益、捕撈生產(chǎn)、航海貿(mào)易、文化建設(shè)、宗教信仰、生態(tài)保護(hù)等活動(dòng)中直接形成的,對(duì)研究我國(guó)海洋治理歷史、構(gòu)建海洋記憶、維護(hù)海洋權(quán)益等方面有參考憑證價(jià)值的各種文字、圖表、音像與實(shí)物等不同形式的歷史記錄。從整合對(duì)象看,其數(shù)字資源具有以下顯著特征:
其一,數(shù)量的豐富性。我國(guó)現(xiàn)存海洋歷史檔案極其豐富,如中國(guó)海洋檔案館已征集文書檔案6 萬(wàn)余卷,聲像檔案20TB,紙質(zhì)照片近4 萬(wàn)張,大幅圖件1.5萬(wàn)余幅,包含了大量不同歷史時(shí)期形成的海洋歷史檔案。[2]中國(guó)第二歷史檔案館珍藏有豐富的近代海洋檔案,僅2009 年啟動(dòng)的“海疆檔案整理”項(xiàng)目,就收錄了民國(guó)時(shí)期海疆歷史檔案6 萬(wàn)多畫幅。[3]這些豐富的檔案文獻(xiàn)遺存,為開展數(shù)字資源整合奠定了基礎(chǔ)。其二,檔案的異構(gòu)性。海洋歷史檔案種類繁多,從現(xiàn)存檔案類型看,主要有歷史文書、海洋輿圖、遺址遺物、口述歷史、音像材料等,從存儲(chǔ)格式劃分,主要有文本、圖片、音頻、視頻等;從數(shù)據(jù)結(jié)構(gòu)化程度分類,主要有無(wú)結(jié)構(gòu)化、半結(jié)構(gòu)化和結(jié)構(gòu)化數(shù)據(jù)。檔案的異構(gòu)性為開展數(shù)字資源整合帶來了困難。其三,分布的廣泛性。海洋歷史檔案分布廣泛,主要保存地點(diǎn)一是內(nèi)地(大陸)相關(guān)政府部門與文化機(jī)構(gòu),主要有中國(guó)第一、第二歷史檔案館,國(guó)家圖書館、博物館,國(guó)家海洋信息中心、海洋檔案館,中科院圖書館,海洋科研院校圖書資料室,以及沿海省市檔案館、圖書館、博物館、方志辦和海洋管理部門等。二是香港特別行政區(qū)、澳門特別行政區(qū)和臺(tái)灣地區(qū)的政府部門與文化機(jī)構(gòu)。三是國(guó)外相關(guān)檔案館、圖書館、博物館、研究機(jī)構(gòu)、歷史協(xié)會(huì)等。檔案資源分布的廣泛性對(duì)開展跨機(jī)構(gòu)、跨領(lǐng)域與跨地域的資源整合造成較大影響。
LAM資源整合理論是國(guó)內(nèi)外廣泛興起的探討圖書館、檔案館與博物館資源整合理論、技術(shù)與方法,以滿足公眾對(duì)文化資源需求的一種資源共建共享理論,理論研究主要集中在3個(gè)方面:一是整合機(jī)制構(gòu)建,如建立機(jī)構(gòu)數(shù)字化協(xié)作D-LAM戰(zhàn)略框架[4],構(gòu)建政策保障、組織協(xié)調(diào)、利益驅(qū)動(dòng)機(jī)制推進(jìn)LAM合作[5]等。二是資源整合方法,如以重點(diǎn)項(xiàng)目推進(jìn)LAM資源整合[6]、基于關(guān)聯(lián)數(shù)據(jù)的LAM館藏資源整合實(shí)現(xiàn)流程[7]等。三是資源服務(wù)方面,如LAM數(shù)字資源一體化檢索平臺(tái)構(gòu)建[8]、基于本體的LAM數(shù)字資源服務(wù)融合可視化展示[9]等。LAM資源整合內(nèi)容涵蓋社會(huì)需求、機(jī)制構(gòu)建、模式設(shè)計(jì)、整合方式、服務(wù)融合與技術(shù)支持等方面,其理論成果為海洋歷史檔案數(shù)字資源多機(jī)構(gòu)協(xié)同整合的機(jī)制構(gòu)建提供了啟示,而且從模式設(shè)計(jì)、技術(shù)應(yīng)用與實(shí)現(xiàn)路徑等方面,為開展數(shù)字資源整合提供了借鑒,并為開展檔案資源一站式檢索、融合服務(wù)與創(chuàng)新服務(wù)等資源共享開發(fā)提供了參考。
《“十四五”全國(guó)檔案事業(yè)發(fā)展規(guī)劃》提出,要“加大相關(guān)檔案資源跨領(lǐng)域、跨區(qū)域、跨層級(jí)整合力度”。[10]海洋歷史檔案數(shù)字資源整合要以黨和國(guó)家建設(shè)海洋強(qiáng)國(guó)方針為指導(dǎo),利用LAM資源整合的理論、技術(shù)與方法,依托國(guó)家“數(shù)字海洋”建設(shè)工程,以海洋數(shù)字檔案館為牽頭單位,聯(lián)合相關(guān)檔案館、圖書館、博物館、社科院、高校等,通過構(gòu)建協(xié)同機(jī)制,歸集散存在國(guó)內(nèi)外相關(guān)政府部門、文化機(jī)構(gòu)與社會(huì)組織的海洋歷史檔案,從設(shè)計(jì)資源整合體系、統(tǒng)一資源建設(shè)標(biāo)準(zhǔn)、建設(shè)基礎(chǔ)性數(shù)據(jù)庫(kù)、構(gòu)建資源共享平臺(tái)等維度,實(shí)現(xiàn)海洋歷史檔案數(shù)字資源的多維聚合與多向融合服務(wù),為構(gòu)建海洋記憶、開展海洋治理、建設(shè)美麗海洋、維護(hù)海洋權(quán)益提供檔案數(shù)據(jù)資源支持(參見圖1)。
圖1 海洋歷史檔案數(shù)字資源整合示意圖
其一,相關(guān)數(shù)字項(xiàng)目建設(shè)。如2006 年國(guó)務(wù)院批準(zhǔn)實(shí)施的中國(guó)“數(shù)字海洋”項(xiàng)目,通過“908專項(xiàng)”調(diào)查、國(guó)際合作與交換等多種手段,收集到海洋歷史、水文、氣象、地理等大量數(shù)據(jù),尤其是完成了“908 專項(xiàng)”資料和歷史資料的整合[11],為海洋歷史檔案資源建設(shè)提供了條件。又如福建“海上絲綢之路數(shù)字文化長(zhǎng)廊”建成“一庫(kù)”(海絲文化資源庫(kù))、“二網(wǎng)”(海絲文化資源建設(shè)協(xié)作網(wǎng)、服務(wù)網(wǎng))、“二平臺(tái)”(資源展示、文化電商平臺(tái)),為海洋歷史檔案數(shù)字資源整合提供了借鑒。[12]其二,檔案數(shù)據(jù)資源建設(shè)。我國(guó)相關(guān)檔案館、圖書館與高校等單位建成的重要數(shù)據(jù)庫(kù)有:中國(guó)第二歷史檔案館“民國(guó)時(shí)期海疆檔案”資源數(shù)據(jù)庫(kù)、海南師范大學(xué)“南海及南海諸島”特色數(shù)據(jù)庫(kù)、中國(guó)南海研究院“南海檔案及歷史文獻(xiàn)庫(kù)”、廈門大學(xué)圖書館“東南海疆研究數(shù)據(jù)庫(kù)”等,這些專題數(shù)據(jù)庫(kù)建設(shè),為開展海洋歷史檔案資源整合奠定了資源基礎(chǔ)。
(1)體制方面:檔案收藏單位多方管理問題
我國(guó)海洋歷史檔案主要散存在相關(guān)檔案館、圖書館、博物館、社科院、方志辦和海事管理部門等,由于這些機(jī)構(gòu)分屬不同部門管理,宏觀上缺乏一個(gè)協(xié)調(diào)不同管理系統(tǒng)的部門,機(jī)構(gòu)之間也沒有建立一種可平衡各方利益的合作機(jī)制[13],且檔案工作者在檔案數(shù)字資源整合過程中的主體地位并不突出[14],這就導(dǎo)致了各機(jī)構(gòu)缺乏合作協(xié)調(diào),產(chǎn)生了“信息孤島”“管理差異”等問題,嚴(yán)重阻礙了海洋歷史檔案數(shù)字資源的整合與共享。
(2)資源方面:各單位檔案數(shù)字化失衡問題
從海洋歷史檔案數(shù)字資源建設(shè)看,中國(guó)第一、第二歷史檔案館,國(guó)家海洋檔案館,以及部分沿海地區(qū)檔案館、圖書館、高校等,基于利用需求與信息化建設(shè)的驅(qū)動(dòng),在檔案數(shù)字資源建設(shè)方面取得了成果。由于地區(qū)經(jīng)濟(jì)差異與信息化發(fā)展水平的不同,部分經(jīng)濟(jì)發(fā)達(dá)地區(qū),如江蘇省、浙江省、廣東省等地的檔案館、圖書館、社科院、高校、海洋管理單位等大多已啟動(dòng)館藏海洋歷史檔案的數(shù)字化建設(shè),而遼寧省、廣西壯族自治區(qū)等地的部分縣(區(qū))級(jí)檔案館、方志辦等的檔案數(shù)字化建設(shè)尚處于起步階段,數(shù)字化建設(shè)基礎(chǔ)薄弱,數(shù)字資源較少,不利于檔案數(shù)字資源有效利用與整合共享。[15]
(3)標(biāo)準(zhǔn)方面:檔案管理標(biāo)準(zhǔn)差異問題
我國(guó)海洋歷史檔案保存單位眾多,多以異構(gòu)信息為主,各機(jī)構(gòu)由于管理體制與對(duì)象的差異,多源類型信息資源的數(shù)字化建設(shè)標(biāo)準(zhǔn)不一,必然對(duì)數(shù)字資源整合共享產(chǎn)生影響。如在元數(shù)據(jù)標(biāo)準(zhǔn)方面,圖書館常用的元數(shù)據(jù)格式主要有MARC、Dublic Core等,博物館常用的是CIMI、CDWA、VRA Core等,檔案館則主要是EAD。[16]機(jī)構(gòu)之間元數(shù)據(jù)結(jié)構(gòu)及其格式的差異,不僅影響了各機(jī)構(gòu)之間數(shù)據(jù)資源的互操作效率,也為進(jìn)一步創(chuàng)建與發(fā)布關(guān)聯(lián)數(shù)據(jù)帶來了一定困難。
從國(guó)內(nèi)外LAM整合項(xiàng)目看,合作模式主要有政府主導(dǎo)、機(jī)構(gòu)合并、跨機(jī)構(gòu)合作與項(xiàng)目驅(qū)動(dòng)等方式。其中,項(xiàng)目驅(qū)動(dòng)模式發(fā)起者可以是政府、協(xié)會(huì)或文化機(jī)構(gòu),其特色是合作目標(biāo)明確,強(qiáng)調(diào)資源的互補(bǔ)和共建共享。[17]鑒于海洋歷史檔案資源整合參與主體眾多,可采用政府主導(dǎo)下的項(xiàng)目驅(qū)動(dòng)模式,依托“數(shù)字海洋”項(xiàng)目,以海洋數(shù)字檔案館為牽頭單位,協(xié)同相關(guān)檔案館、圖書館、博物館、社科院、高校等機(jī)構(gòu),構(gòu)建協(xié)作共建機(jī)制。主要職責(zé)為:一是以召開聯(lián)席會(huì)議的方式,從方針政策、建設(shè)目標(biāo)、整合原則、制度建設(shè)、權(quán)益保護(hù)、任務(wù)安排與經(jīng)費(fèi)保障等方面,組織協(xié)調(diào)檔案數(shù)字資源整合工作。二是積極與“數(shù)字海洋”建設(shè)項(xiàng)目聯(lián)系與溝通,以獲得國(guó)家數(shù)字海洋建設(shè)政策、經(jīng)費(fèi)、資源與技術(shù)的支持。三是以制定或推薦國(guó)家數(shù)字化標(biāo)準(zhǔn)的方式,從信息采集、數(shù)字化、數(shù)據(jù)描述、數(shù)據(jù)庫(kù)構(gòu)建和平臺(tái)建設(shè)等方面,統(tǒng)一數(shù)字資源整合標(biāo)準(zhǔn)。四是兼顧各方信息利益,從檔案信息價(jià)值評(píng)估、資源整合義務(wù)、建設(shè)成果共享等方面,建立信息資產(chǎn)權(quán)益保護(hù)制度,維護(hù)共建單位信息資產(chǎn)權(quán)益與知識(shí)產(chǎn)權(quán)。
(1)設(shè)計(jì)檔案資源整合框架體系。依據(jù)海洋歷史檔案遺存情況,可從歷史文書、海洋輿圖、遺址遺物、口述歷史、音像材料等類型構(gòu)建資源框架體系,為開展檔案資源歸集、分類整理,及其資源庫(kù)建設(shè)提供理論指導(dǎo)。構(gòu)建資源框架體系對(duì)整合工作的作用在于:一是從征集范圍、具體類型、技術(shù)標(biāo)準(zhǔn)、征集對(duì)象等方面,建立海洋歷史檔案整合規(guī)程,用以規(guī)劃指導(dǎo)其檔案文獻(xiàn)征集整合工作。二是從DC元數(shù)據(jù)、SKOS規(guī)范、關(guān)聯(lián)數(shù)據(jù)流程規(guī)范、數(shù)據(jù)存儲(chǔ)標(biāo)準(zhǔn)等方面,制定數(shù)字資源分類與組織規(guī)范,開展資源組織與管理工作。三是構(gòu)建海洋歷史檔案數(shù)據(jù)庫(kù)資源建設(shè)體系,以規(guī)范其數(shù)據(jù)庫(kù)建設(shè)工作,實(shí)現(xiàn)檔案數(shù)字資源的整合共享。
(2)統(tǒng)一檔案信息資源建設(shè)標(biāo)準(zhǔn)。其一,構(gòu)建資源建設(shè)標(biāo)準(zhǔn)體系??梢罁?jù)我國(guó)檔案數(shù)字化建設(shè)規(guī)范,參照?qǐng)D書館、博物館與海洋信息數(shù)字標(biāo)準(zhǔn),從信息采集、著錄格式、數(shù)據(jù)標(biāo)引、專業(yè)符號(hào)、檢索技術(shù),以及數(shù)據(jù)庫(kù)構(gòu)建等方面,構(gòu)建海洋歷史檔案數(shù)字資源建設(shè)標(biāo)準(zhǔn)體系。如我國(guó)“數(shù)字海洋”建設(shè)已在數(shù)據(jù)標(biāo)準(zhǔn)化處理、數(shù)據(jù)庫(kù)建設(shè)、信息系統(tǒng)建設(shè)等方面形成了《海洋信息元數(shù)據(jù)標(biāo)準(zhǔn)》《海洋專題圖要素圖式圖例及符號(hào)》《海洋綜合管理專題數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)》等13 項(xiàng)標(biāo)準(zhǔn)規(guī)范[18],為構(gòu)建檔案數(shù)字資源標(biāo)準(zhǔn)體系奠定了基礎(chǔ)。其二,引入關(guān)聯(lián)數(shù)據(jù)創(chuàng)建標(biāo)準(zhǔn)。關(guān)聯(lián)數(shù)據(jù)是由互聯(lián)網(wǎng)協(xié)會(huì)(W3C)推出的用于發(fā)布與聯(lián)接各種數(shù)據(jù)、信息和知識(shí)的標(biāo)準(zhǔn),可視為一種建立在Web網(wǎng)絡(luò)標(biāo)準(zhǔn)之上的結(jié)構(gòu)化數(shù)據(jù)發(fā)布與共享方法,可以通過各種邏輯關(guān)系將一個(gè)個(gè)資源孤島整合為統(tǒng)一的數(shù)據(jù)空間,提高Web網(wǎng)絡(luò)的智能化水平。[19]引入關(guān)聯(lián)數(shù)據(jù)的URI復(fù)用原則、RDF(資源描述框架)鏈接機(jī)制和LOD發(fā)布規(guī)范等,可創(chuàng)建與發(fā)布海洋歷史檔案關(guān)聯(lián)數(shù)據(jù),連接、聚合與共享檔案數(shù)字資源。
(3)構(gòu)建基礎(chǔ)性檔案資源數(shù)據(jù)庫(kù)。參與數(shù)字資源整合的LAM機(jī)構(gòu)與相關(guān)社科院、高校等單位,按照一定的主題,挖掘聚合國(guó)內(nèi)外相關(guān)機(jī)構(gòu)保存的海洋歷史檔案,構(gòu)建專題數(shù)據(jù)庫(kù),為其數(shù)字資源整合提供基礎(chǔ)性數(shù)據(jù)支持。建庫(kù)方法如下:其一,征集散存檔案文獻(xiàn)。首先,采用購(gòu)買、復(fù)制、交換或數(shù)字化等方式,征集官方或民間的散存歷史檔案。其次,采用實(shí)物征集,以及文字記錄、拍照、錄音、錄像或三維掃描等方式,建檔形成海洋口述檔案與海洋遺址遺物檔案。再次,通過復(fù)制、交換,以及購(gòu)買縮微品和相關(guān)數(shù)據(jù)庫(kù)數(shù)據(jù)資源等方式,征集國(guó)外LAM機(jī)構(gòu)散存數(shù)字資源。其二,統(tǒng)一數(shù)據(jù)資源描述標(biāo)準(zhǔn)。建議以DC元數(shù)據(jù)為主,結(jié)合《海洋信息元數(shù)據(jù)標(biāo)準(zhǔn)》,以及MARC(機(jī)讀編目格式標(biāo)準(zhǔn))、VRA(視覺資料核心類目)、CDWA(藝術(shù)作品)、EAD(編碼檔案描述)、teI(電子文本編碼與交換)等規(guī)范,建立統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn),以更為精準(zhǔn)地描述不同類型檔案數(shù)據(jù)資源的外部與內(nèi)容特征。其三,檔案數(shù)據(jù)規(guī)劃存儲(chǔ)。可依據(jù)海洋歷史檔案資源體系規(guī)劃,構(gòu)建三級(jí)資源存儲(chǔ)體系。其中,一級(jí)是歷史文書、海洋輿圖、遺址遺物、口述歷史、音像材料等欄目。二級(jí)目錄可依據(jù)不同標(biāo)準(zhǔn)設(shè)置,如海洋輿圖按性質(zhì)可分為:航海專圖、海防用圖、形勢(shì)海圖、海疆域圖等。三級(jí)目錄呈現(xiàn)具體信息內(nèi)容,如特定內(nèi)容的文本、圖片、音視頻或?qū)嵨锏?。其四,?chuàng)建發(fā)布檔案關(guān)聯(lián)數(shù)據(jù)。即在元數(shù)據(jù)規(guī)范的基礎(chǔ)上,用規(guī)范化的RDF進(jìn)行資源描述,按照關(guān)聯(lián)數(shù)據(jù)的4 個(gè)基本原則發(fā)布數(shù)字資源,利用RDF所具有的機(jī)制建立數(shù)據(jù)之間的語(yǔ)義關(guān)聯(lián)。[20]創(chuàng)建與發(fā)布關(guān)聯(lián)數(shù)據(jù)可將檔案數(shù)據(jù)資源以數(shù)據(jù)集的形式發(fā)布在萬(wàn)維網(wǎng)上,實(shí)現(xiàn)LAM機(jī)構(gòu)數(shù)據(jù)資源的關(guān)聯(lián)聚合與充分利用。
(4)實(shí)現(xiàn)LAM數(shù)據(jù)資源聚合共享。其一,構(gòu)建共享平臺(tái),提供“一站式”檢索服務(wù)。這是LAM檔案數(shù)字資源匯集服務(wù)的基礎(chǔ)方式,其目的就是根據(jù)用戶所提供的檢索需求,將來自協(xié)作機(jī)構(gòu)的數(shù)據(jù)資源,通過共享網(wǎng)站平臺(tái)反饋給用戶。首先,可按歷史文書、海洋輿圖、遺址遺物、口述歷史、音像材料等設(shè)置分類導(dǎo)航。同時(shí),在網(wǎng)頁(yè)主頁(yè)和各級(jí)目錄之下設(shè)置檢索入口,提供欄目?jī)?nèi)和跨欄目的分類檢索、目錄檢索、全文檢索、關(guān)鍵詞檢索和二次檢索等多種信息檢索方式。其次,選取能代表數(shù)字對(duì)象內(nèi)容的標(biāo)志性圖片,以靜態(tài)圖片或滾動(dòng)展示的形式,為用戶提供縮略圖導(dǎo)航檢索服務(wù)。再次,設(shè)置可鏈接國(guó)外相關(guān)LAM資源整合項(xiàng)目網(wǎng)站的檢索端口,通過簽署信息共享協(xié)議,或購(gòu)買使用權(quán)等方式,查詢利用國(guó)外散存檔案數(shù)據(jù)資源。其二,基于資源聚合,開展多元化檔案利用服務(wù)。依托共享平臺(tái),即可通過關(guān)聯(lián)聚合,匯集海洋歷史檔案數(shù)據(jù)資源,開展多元化檔案利用服務(wù)。一是開發(fā)海洋輿圖和照片等資源,按照特定主題,編制電子畫冊(cè)、圖文期刊等,向公眾提供形象生動(dòng)的專題性海洋圖像檔案信息。二是利用Web3D、H5、VR/AR等技術(shù),挖掘海洋檔案數(shù)據(jù)資源,制作線上專題虛擬展覽,還原專題海洋地圖模型、遺址遺物、海防炮臺(tái)以及歷史場(chǎng)景等。用戶可以借助視聽設(shè)備,在虛擬網(wǎng)絡(luò)空間實(shí)現(xiàn)沉浸式體驗(yàn),從三維虛擬空間感官感受的緯度,開展海洋意識(shí)教育。三是發(fā)掘音像檔案數(shù)據(jù)資源,將同一主題的照片、音視頻等進(jìn)行編輯加工,剪輯編制海洋歷史檔案微視頻、專題片等,從文化宣示主權(quán)的政治高度,維護(hù)我國(guó)領(lǐng)海主權(quán)完整與安全。