孫安寧/中國(guó)計(jì)量大學(xué)
校史編研在高校檔案工作中具有重要價(jià)值,是基于檔案史料挖掘,弘揚(yáng)辦學(xué)精神,講好大學(xué)故事,實(shí)現(xiàn)檔案育人的重要手段,內(nèi)容精彩、影響深遠(yuǎn)?!吨袊?guó)檔案》刊登的一篇專訪中指出:應(yīng)該把更多的時(shí)間和精力放在開(kāi)展編研上,因?yàn)闄n案部門(mén)開(kāi)展編研所具備的條件是其他任何部門(mén)所不具備的,而做好編研工作又是提高檔案工作服務(wù)水平的重要舉措[1]。
回顧高校校史編研的發(fā)展歷程,呈現(xiàn)出三方面的特點(diǎn)。一是機(jī)構(gòu)專門(mén)化,從清華大學(xué)1959年成立校史研究室的前身“校史編寫(xiě)組”,到如今各高?;蛞劳袡C(jī)關(guān)部門(mén)或依托檔案館或依托歷史系成立的校史編研機(jī)構(gòu),校史編研工作正逐步走向常態(tài)化。二是隊(duì)伍穩(wěn)定化,早期可以追溯到1988年,群眾性學(xué)術(shù)團(tuán)體“中國(guó)高等教育學(xué)會(huì)校史研究分會(huì)”成立;經(jīng)過(guò)20年的發(fā)展,“浙江大學(xué)校史研究會(huì)”這一高校校史研究學(xué)術(shù)組織也在2009年應(yīng)運(yùn)而生,可見(jiàn)無(wú)論從國(guó)家層面還是高校層面,校史研究隊(duì)伍逐步壯大。三是內(nèi)容專題化,既有志書(shū)、年鑒等資料性工具書(shū)的編寫(xiě),又有人物、事件等個(gè)案研究;既有革命史、發(fā)展史的視角,又有社會(huì)學(xué)、教育學(xué)的切入,校史編研的內(nèi)容日趨豐富。
校史編研越來(lái)越受到重視的同時(shí),反觀學(xué)術(shù)界和理論界卻對(duì)其研究甚少。在中國(guó)知網(wǎng)總庫(kù)中,以校史編研為主題進(jìn)行搜索,共搜索到學(xué)術(shù)期刊、學(xué)位論文和會(huì)議交流94篇,其中近3年刊發(fā)的文章只有7篇。對(duì)研究成果進(jìn)行分析,不難發(fā)現(xiàn)研究?jī)?nèi)容多集中在校史編研的功能、特點(diǎn)和啟示,校史編研與校園文化傳承的關(guān)系,口述檔案興起及對(duì)校史編研的推動(dòng)等?!墩憬瓩n案》2022年第1期《基于Spark技術(shù)的高校校史編研系統(tǒng)研究與實(shí)現(xiàn)》一文是數(shù)字技術(shù)應(yīng)用于校史編研的較新的研究成果,可見(jiàn)理論研究滯后工作實(shí)踐較為突出。
校史編研取得積極的進(jìn)展,但是傳統(tǒng)的眾手成書(shū)的編研形式,依然面臨著館藏檔案查找效率低下,關(guān)鍵信息重復(fù)核對(duì)內(nèi)耗嚴(yán)重,編研成果呈現(xiàn)形式單一、利用率不高等困境。在數(shù)字浙江建設(shè)深入推進(jìn)的大背景下,截至2021年4月,浙江省已有16家高校檔案館達(dá)到省高校示范數(shù)字檔案室(館)建設(shè)要求。80%以上館藏永久、長(zhǎng)期檔案的數(shù)字化率給高校校史編研提供了新的機(jī)遇,也帶來(lái)新的挑戰(zhàn)。本文依托協(xié)同辦公基本原理,在檔案管理系統(tǒng)中嵌入校史協(xié)同編研平臺(tái),以期構(gòu)建高效整合校史資源、多形式展示校史編研成果的高校數(shù)字化校史協(xié)同編研體系。
紙質(zhì)檔案在高校館藏檔案中占比95%以上,數(shù)字賦能校史編研,必須要對(duì)紙質(zhì)檔案進(jìn)行數(shù)字化加工,這是檔案資源共享共用的基礎(chǔ)環(huán)節(jié)。首先,要對(duì)館藏紙質(zhì)檔案進(jìn)行全面梳理,按照應(yīng)數(shù)盡數(shù)的原則,部署紙質(zhì)檔案的數(shù)字化加工工作,如果無(wú)法一次性全面完成的,按照共享性強(qiáng)、利用率高、保管期限長(zhǎng)等原則分步實(shí)施。其次,要注重檔案數(shù)字化過(guò)程管理,保障數(shù)據(jù)質(zhì)量??梢栽跀?shù)字化全過(guò)程采取“三核對(duì)”檢查辦法,通過(guò)人、機(jī)雙重校對(duì),全面核查館藏檔案數(shù)據(jù),具體為:第一,數(shù)字化前對(duì)實(shí)體檔案的頁(yè)號(hào)、題名等著錄信息進(jìn)行核對(duì),保證原始檔案的正確性和完整性;第二,數(shù)字化過(guò)程中對(duì)形成的電子文件進(jìn)行核對(duì),保證掃描圖像端正、清晰,還原度高;第三,數(shù)字化結(jié)束后對(duì)電子文件的目錄和檔號(hào)進(jìn)行二次核對(duì),確保電子文件的檔號(hào)和檔案管理系統(tǒng)中的檔號(hào)一致,順利實(shí)現(xiàn)成果與目錄的 100%掛接。
紙質(zhì)檔案數(shù)字復(fù)制件光學(xué)字符識(shí)別(OCR)是管控?cái)?shù)據(jù)質(zhì)量的關(guān)鍵環(huán)節(jié),對(duì)檔案資源的開(kāi)發(fā)利用至關(guān)重要。2019年12月16日,檔案行業(yè)標(biāo)準(zhǔn)《紙質(zhì)檔案數(shù)字復(fù)制件光學(xué)字符識(shí)別(OCR)工作規(guī)范》(DA/T 77—2019)由國(guó)家檔案局發(fā)布,并于2020年5月1日起正式實(shí)施。該標(biāo)準(zhǔn)對(duì)檔案OCR工作進(jìn)行規(guī)范,明確其組織、實(shí)施和管理要求。由于人員限制,現(xiàn)階段高校紙質(zhì)檔案OCR工作基本采用外包形式,因此在對(duì)外包企業(yè)的選擇上要嚴(yán)格把關(guān),全方位考量企業(yè)的相關(guān)資質(zhì)和業(yè)內(nèi)服務(wù)情況。一些自主開(kāi)發(fā)能力強(qiáng)的高校檔案館,也可以通過(guò)在檔案數(shù)字化生產(chǎn)平臺(tái)中開(kāi)發(fā)相應(yīng)的模塊,采取抽檢的方式對(duì)檔案OCR圖像導(dǎo)入、圖像預(yù)處理、比對(duì)識(shí)別、修改校正、成果整理輸出等業(yè)務(wù)環(huán)節(jié)的全過(guò)程進(jìn)行有效控制[2]。
聲像檔案在客觀、準(zhǔn)確還原歷史場(chǎng)景上,有著紙質(zhì)檔案難以企及的優(yōu)勢(shì)。隨著時(shí)間的推移,高校館藏電影膠片、錄音帶、錄像帶、幻燈片、照片等聲像檔案慢慢損壞,其依賴的存儲(chǔ)載體、數(shù)據(jù)傳輸模式也逐漸被淘汰,很多聲像檔案面臨著無(wú)法利用,或是信息丟失的現(xiàn)狀,迫切需要聲像檔案的修復(fù)和數(shù)字化轉(zhuǎn)存。在聲像檔案數(shù)字化的基礎(chǔ)上,可以對(duì)學(xué)校發(fā)展歷程中的重大事件、重要人物、標(biāo)志性景觀等數(shù)字資源進(jìn)行圖像特征提取,為后續(xù)校史編研的有效利用提供素材。當(dāng)然,如果條件允許,則可以對(duì)所有的數(shù)字化聲像檔案資源進(jìn)行圖像特征提取,通過(guò)計(jì)算機(jī)算法,對(duì)數(shù)字化聲像檔案進(jìn)行分類或聚類,為校史編研挖掘更多的信息,提供更豐富的素材。
協(xié)同是數(shù)字化時(shí)代組織效率的本質(zhì),協(xié)同編研則是推進(jìn)數(shù)字化校史編研的核心。數(shù)字化校史協(xié)同編研與傳統(tǒng)的人工或是半自動(dòng)編研最大的區(qū)別在于,其是以主題為中心,提供基于工作流的多人協(xié)同編研平臺(tái),以進(jìn)一步提高編研效率。流程大致可以分為六步:一是確定編研主題,分為年鑒等常態(tài)化編研和根據(jù)高校階段性的工作中心任務(wù)或是特定的時(shí)間節(jié)點(diǎn)提出的特定主題編研兩部分。二是設(shè)計(jì)編研模板,對(duì)于常態(tài)化編研,可通過(guò)固定的編研模塊來(lái)重復(fù)實(shí)現(xiàn),而特定主題編研則需要編研人員根據(jù)主題定制不同的模板。三是明確編研規(guī)則,包括行文規(guī)范、成果體現(xiàn)、審校流程等,并將規(guī)則轉(zhuǎn)化為計(jì)算機(jī)語(yǔ)言。四是設(shè)定數(shù)據(jù)調(diào)用范圍,根據(jù)編研主題進(jìn)行數(shù)據(jù)挖掘和分析,再結(jié)合人工比對(duì),判斷數(shù)據(jù)的準(zhǔn)確性。五是人工編研,在前期數(shù)據(jù)收集、校對(duì)的基礎(chǔ)上,編寫(xiě)人員分塊協(xié)作加工,包括語(yǔ)言組織、重點(diǎn)凝練、結(jié)構(gòu)優(yōu)化、幾審幾校等。六是終審發(fā)布,編委會(huì)終審?fù)ㄟ^(guò)后,根據(jù)編研內(nèi)容,確定發(fā)布形式和公開(kāi)范圍,通過(guò)相應(yīng)的數(shù)據(jù)接口進(jìn)行成果展示。
數(shù)字化校史協(xié)同編研必定依托檔案數(shù)字化編研系統(tǒng)實(shí)現(xiàn),因而設(shè)計(jì)、提供一個(gè)能滿足多人協(xié)同編研需求的平臺(tái)是建設(shè)核心。當(dāng)然,建立合理的組織機(jī)構(gòu)是第一步,是科學(xué)、高效搭建平臺(tái)的前提條件。以年鑒編寫(xiě)為例,這項(xiàng)工作涉及高校每個(gè)部門(mén),要根據(jù)部門(mén)編寫(xiě)人員、部門(mén)審核人員、年鑒編寫(xiě)辦公室編輯、副主編、主編和年鑒編委會(huì)委員、副主任、主任等不同角色搭建好組織機(jī)構(gòu),賦予不同的職責(zé)和權(quán)限。在編研過(guò)程中,所有流程的實(shí)施與管理都要能在編研系統(tǒng)中體現(xiàn)。模塊按性質(zhì)可以分為兩類:第一類是工作模塊,第二類是管理模塊。工作模塊主要實(shí)現(xiàn)調(diào)用、編輯和輸出功能。具體而言,調(diào)用功能主要指的是檔案數(shù)字化編研系統(tǒng)與檔案管理系統(tǒng)相銜接,并從中讀取館藏?cái)?shù)字檔案資源,提取既定編研模板;編輯功能是校史協(xié)同編研的核心環(huán)節(jié),一方面實(shí)現(xiàn)調(diào)取數(shù)字資源的校對(duì)、整合、利用,另一方面可以進(jìn)行自主錄入編輯,從而完成計(jì)算機(jī)原始數(shù)據(jù)整理到人工智能開(kāi)發(fā)的轉(zhuǎn)化;輸出功能是編研最終成果的展示,可以多元化的、多類型的呈現(xiàn),滿足不同編研成果的展示需求。管理模塊則包括系統(tǒng)管理、規(guī)則管理、數(shù)據(jù)流管理和工作流管理。簡(jiǎn)而言之:系統(tǒng)管理主要保證檔案數(shù)字化編研系統(tǒng)安全、穩(wěn)定、高效、有序運(yùn)行,確保數(shù)據(jù)安全;規(guī)則管理則是盡可能實(shí)現(xiàn)編研過(guò)程標(biāo)準(zhǔn)化,包括數(shù)據(jù)規(guī)范、模板統(tǒng)一、編研規(guī)則一致等,提高校對(duì)效率;數(shù)據(jù)流管理,旨在實(shí)時(shí)記錄編研的過(guò)程,協(xié)同編研操作者調(diào)用、修改、審校所有數(shù)據(jù)被一一記錄并可以回溯,實(shí)現(xiàn)數(shù)據(jù)層面的有效管理;工作流管理主要針對(duì)編研流程的管控,可以根據(jù)進(jìn)度和計(jì)劃引導(dǎo)編研工作有序開(kāi)展。
基于校史編研實(shí)踐,在數(shù)字化校史協(xié)同編研系統(tǒng)中建議增加三項(xiàng)功能。一是數(shù)字資源來(lái)源回溯功能。在調(diào)用檔案管理系統(tǒng)中的數(shù)據(jù)時(shí),不但調(diào)用具體內(nèi)容,建議同時(shí)提供調(diào)用鏈接。為編研過(guò)程中反復(fù)回溯查考提供便利。二是智能檢索功能。相對(duì)于傳統(tǒng)的手動(dòng)檢索,智能檢索功能可以為協(xié)同編研提供強(qiáng)大的數(shù)據(jù)支撐。數(shù)字化校史編研的優(yōu)勢(shì)在于對(duì)館藏檔案資源的全方位便捷利用,相較傳統(tǒng)載體檔案,智能檢索可以通過(guò)數(shù)據(jù)分析比對(duì)梳理檔案之間的內(nèi)在聯(lián)系,為編研人員提供新的思路、視角以及豐富的素材。智能檢索應(yīng)用于聲像檔案,可以通過(guò)以圖搜圖、以圖搜視頻、以人搜圖、以人搜視頻等檢索手段,全面高效挖掘整合館藏資源,凸顯編研特色和亮點(diǎn)。三是模板定制功能?;诰幯兄黝},開(kāi)發(fā)不同類型的協(xié)同編研模板,其目的是使主題編研更加便捷、規(guī)范,展示效果更強(qiáng)。比如科研獲獎(jiǎng)情況,可以用表格的形式進(jìn)行梳理;大事記,則用時(shí)間軸的形式來(lái)體現(xiàn)更直觀;班級(jí)、活動(dòng)圖片,用相冊(cè)來(lái)體現(xiàn)視覺(jué)沖擊力更強(qiáng)等等。
兩微一端動(dòng)態(tài)展示是目前采用最多的數(shù)字化校史編研成果展示方式,能夠較為便捷的實(shí)現(xiàn),為大多數(shù)閱讀者接受。高校檔案館大多擁有自己的公眾微信號(hào),一般都設(shè)有校史編研專欄,有的學(xué)校還有自己的校史網(wǎng)站。重大校史編研成果不但在高校檔案館微信公眾號(hào)發(fā)布,高校官方公眾微信號(hào)和官方微博也會(huì)及時(shí)轉(zhuǎn)發(fā)。比如:浙江大學(xué)檔案館在其公眾微信號(hào)上與檔案編研相關(guān)的主題欄目設(shè)置了校史編研、求是學(xué)人、系科發(fā)展、發(fā)現(xiàn)檔案、影史鉤沉等五大板塊;上海交通大學(xué)檔案文博管理中心,在疫情期間推出云游文博系列活動(dòng),發(fā)布《云上文博劇場(chǎng),伴你抗疫且行,靜心雅意待春歸》主題推送,讓讀者與歷史、文化、藝術(shù)對(duì)話中感受優(yōu)秀文化的無(wú)限魅力;中國(guó)計(jì)量大學(xué)42周年校慶時(shí),在學(xué)校官方公眾微信號(hào)和官方微博中發(fā)布“歲月如歌!李樂(lè)山與中國(guó)計(jì)量大學(xué)”推文,深度解讀分享李樂(lè)山同志與中國(guó)計(jì)量大學(xué)的深厚歷史淵源。兩微一端平臺(tái)為校史編研成果的實(shí)時(shí)動(dòng)態(tài)展示提供了有效的平臺(tái)。
采用SQLite+H5靜態(tài)展示,可以使校史編研成果脫離編研系統(tǒng),解決了離線環(huán)境或是沒(méi)有系統(tǒng)支持的編研成果展示需求。部署過(guò)程中,編研成果脫離系統(tǒng)以壓縮包形式導(dǎo)入各種展示平臺(tái),使展示速度更快,部署更便捷,安全性更高。比如:一些高校在校史館展示的校友學(xué)籍查詢平臺(tái),就是在前期整理歷屆校友成績(jī)單、畢業(yè)照、活動(dòng)照片的基礎(chǔ)上,導(dǎo)入學(xué)籍查詢系統(tǒng),實(shí)現(xiàn)靜態(tài)展示。
通過(guò)云端VR技術(shù),使參觀者打破時(shí)間、空間的限制,在視覺(jué)、聽(tīng)覺(jué)等立體化運(yùn)用的基礎(chǔ)上,全方位沉浸式感受校史編研成果。VR虛擬場(chǎng)館展示主要運(yùn)用于兩個(gè)方面:一是臨時(shí)展館因時(shí)間、場(chǎng)地等原因拆除后,開(kāi)通虛擬場(chǎng)館,滿足長(zhǎng)期的參觀需求;二是作為長(zhǎng)期展館現(xiàn)場(chǎng)參觀的補(bǔ)充,使參觀者足不出戶就能在電腦上或通過(guò)手機(jī)掃描便捷參觀。目前,吉林大學(xué)、河海大學(xué)、上海師范大學(xué)、合肥工業(yè)大學(xué)等諸多高校建設(shè)了VR全景校史館,中國(guó)計(jì)量大學(xué)則在“王大珩與中國(guó)計(jì)量大學(xué)”展實(shí)體展廳拆除后,自主開(kāi)發(fā)了VR展廳。這些都是VR虛擬場(chǎng)館展示校史編研成果的具體實(shí)踐。
讀屏概念展示,將傳統(tǒng)紙質(zhì)編研成果電子化,適應(yīng)讀屏?xí)r代閱讀者的閱讀需求。全媒體時(shí)代,閱讀的平臺(tái)和載體改變巨大、更新加速。電腦屏、IPAD屏、手機(jī)屏,使閱讀可以隨時(shí)隨地進(jìn)行。紙質(zhì)書(shū)、電子書(shū)、有聲書(shū)正成為主流的三類知識(shí)載體,“忙時(shí)讀屏,閑時(shí)讀書(shū)”已成為越來(lái)越多人的選擇。校史編研成果適應(yīng)讀屏?xí)r代的閱讀,首先要求編研工作者在編研成果的標(biāo)題上下功夫,擬定一個(gè)準(zhǔn)確、傳神的標(biāo)題來(lái)吸引閱讀者;其次要在內(nèi)容上下功夫,編研內(nèi)容盡可能精煉化、生動(dòng)化,結(jié)合圖文、視頻、音頻,吸引閱讀者的快閱讀和碎片化閱讀。