周林興 殷名
關鍵詞:智慧檔案館;檔案數(shù)據(jù);潛在價值;知識管理;知識發(fā)現(xiàn);知識復用;知識再生產(chǎn)
數(shù)智時代檔案信息資源的“智慧性開發(fā)”已是大勢所趨,數(shù)字化轉型、知識化應用已成為一種常態(tài),檔案館建設的新目標必然是朝著智慧檔案館方向發(fā)展,[1]對數(shù)字檔案的信息管理將向知識管理躍遷。[2]針對數(shù)字檔案館和智慧檔案館的關系,國內學者大多持“升級論”和“并行交叉論”兩種觀點。第一種觀點認為智慧檔案館是數(shù)字檔案館的延續(xù)和升華,[3]它是應用智慧管理技術的信息化形態(tài)檔案館,[4]是數(shù)字檔案館的高級形態(tài)[5]、高級階段[6];第二種觀點則將數(shù)字檔案館和智慧檔案館視為并行存在的兩種事物,二者既有聯(lián)系、又有差別,[7]后者為前者提供技術服務,前者為后者提供基礎數(shù)據(jù)支持。[8]筆者贊同升級論,認為二者的差異在于檔案信息感知與協(xié)同處置能力的強弱,[9]具體表現(xiàn)為智慧檔案館在知識管理視角上的變化,對現(xiàn)有知識的持續(xù)開發(fā)和創(chuàng)新,核心在于針對數(shù)據(jù)集中有效、新穎、具有潛在價值和可理解性子集的識別,[10]使用現(xiàn)有知識來解決新問題或創(chuàng)建新解決方案的能力,[11 ]以及對知識形式、內容、意義的再生產(chǎn)。[12]
1 洞察數(shù)據(jù)價值,提升檔案數(shù)據(jù)“智性”
在“三態(tài)”(模擬態(tài)、數(shù)字態(tài)和數(shù)據(jù)態(tài))與“兩化”(數(shù)字化和數(shù)據(jù)化)的既有發(fā)展軌跡及未來演變趨勢[13]下,智慧檔案館作為檔案館的高階形態(tài),具有較高程度的自動化與智能特征,基本處于數(shù)據(jù)驅動與模型驅動形態(tài),呈現(xiàn)出典型的數(shù)據(jù)化模態(tài)和數(shù)據(jù)態(tài)范式。其知識組織粒度也隨之降低,以不可再分割的、具有完備知識表達的知識單位——知識元[14]為知識操作與管理單元,實現(xiàn)“知識元—知識鏈—知識域—知識網(wǎng)”多層次知識體系的建構,[15]以知識化組織賦能信息資源的關聯(lián)利用,優(yōu)化資源關聯(lián)模式和知識發(fā)現(xiàn)模式。[16]
1.1 以數(shù)據(jù)思維和結構轉變深化檔案數(shù)據(jù)價值認知。數(shù)據(jù)要素作為最具時代特征的生產(chǎn)要素,[17]為智慧檔案館提供“數(shù)字引擎”。在數(shù)據(jù)思維的框架下,傳統(tǒng)的信息組織單元已無法滿足數(shù)據(jù)態(tài)檔案的單元操作與管理需求,“知識元”因其唯一性、獨立性、完整性和易用性成為檔案知識化組織的全新單位,[18]實現(xiàn)數(shù)據(jù)生產(chǎn)要素引導下檔案資源組織的結構性轉變。此種轉變下,以知識元為基本單位的“數(shù)據(jù)化”檔案釋放數(shù)據(jù)要素價值,激活數(shù)據(jù)要素潛能,[19]并以數(shù)據(jù)為基礎、以技術環(huán)境為導向實施數(shù)據(jù)驅動決策,推動檔案數(shù)據(jù)價值的深化和凸顯,促進檔案情報價值的更大實現(xiàn),[20]進而對檔案內容進行智慧性攝取和知識管理、智慧管理。[21]
在“開發(fā)與計算語境”[22]下,知識管理過程中數(shù)據(jù)態(tài)檔案的數(shù)據(jù)價值包括小數(shù)據(jù)價值和大數(shù)據(jù)價值。作為“大數(shù)據(jù)的最后一公里”,[23]檔案以數(shù)據(jù)形態(tài)實施知識元的提取和知識單元的呈現(xiàn),以小數(shù)據(jù)模態(tài)成為數(shù)據(jù)科學的資源基礎,[24]具有作為基礎數(shù)據(jù)的小數(shù)據(jù)價值。此價值是“檔案數(shù)據(jù)”的自然屬性,是不隨檔案信息資源組織形式變化而轉移的。檔案的大數(shù)據(jù)價值是檔案通過大數(shù)據(jù)技術處理、挖掘和應用而獲得的價值,[25]其通過數(shù)據(jù)共享、交叉復用和關聯(lián)分析而產(chǎn)生,以量變推動質變,實現(xiàn)數(shù)據(jù)到知識的躍升。此價值是“檔案數(shù)據(jù)”的社會屬性,因數(shù)據(jù)管理方式而發(fā)生變化。檔案的數(shù)據(jù)價值要求智慧檔案館從經(jīng)驗驅動轉向循數(shù)管理,以知識發(fā)現(xiàn)為方式,讓“數(shù)據(jù)說出未來”。[26]
1.2 以知識提取和關聯(lián)揭示促進檔案隱性知識顯性化。顯性知識指能以一定符碼系統(tǒng)加以完整表述,以正式、系統(tǒng)化的語言傳播的知識,而隱性知識是未編碼、非結構化、非格式化的、“未被表述的知識”,[27]又被稱為主觀知識。傳統(tǒng)認知中,檔案館的隱性知識往往以檔案館內的知識主體——檔案館員為載體,由檔案館員來決定隱性知識的發(fā)揮和運用,[28]而智慧檔案館因其“智慧”特征,具有綜合數(shù)據(jù)、信息、情報和知識來解決問題的意識和能力,[29]也應作為知識主體發(fā)揮自身主體責任能力,[30]挖掘、發(fā)現(xiàn)檔案中具有內隱性、難以表達的內容,促進檔案隱性知識的顯性化。
檔案隱性知識的顯性化主要依賴于系統(tǒng)化的知識提取和關聯(lián)揭示。智慧檔案館作為“知識工程師”,對知識源進行知識識別和知識表示,通過溝通機制和可視化技術對知識的內容、結構以及可行性等進行評價,完成知識建構,形成顯性知識,存入知識庫。[31]不僅如此,其還聚焦于碎片化的知識間關聯(lián)組織,實現(xiàn)隱性知識到顯性知識的轉化。[32]隱性知識的顯性化使得未被表述的檔案知識脫離客體,經(jīng)由知識主體的交互和加工實現(xiàn)知識呈現(xiàn)和價值顯性化。
1.3 以數(shù)據(jù)挖掘和語義分析主導檔案顯性知識整合。挖掘功能的完全和徹底實現(xiàn)是知識管理中知識發(fā)現(xiàn)的終極目標。[33]智慧檔案館的檔案知識發(fā)現(xiàn)以大數(shù)據(jù)為驅動力,以數(shù)據(jù)挖掘和語義分析技術為主導,將檔案數(shù)據(jù)規(guī)范化、關聯(lián)化、語義化,使顯性的無序知識有序化,最大特點是能夠極速、精確實現(xiàn)對規(guī)模大、流轉快、類型多、價值密度低數(shù)據(jù)的統(tǒng)計性分析歸納。[34]此過程中,數(shù)據(jù)挖掘技術以聚類分析、分類算法等方法解決海量數(shù)據(jù)處理問題,具有強大的特征提取和學習能力,而語義分析能夠有針對性地處理自然語言高維度稀疏數(shù)據(jù),[35]實現(xiàn)文本的微觀化個體處理,完成實體識別和情感分析。二者結合以利用數(shù)據(jù)聯(lián)系將挖掘深入化,同時適應自然語言的靈活性,實現(xiàn)檔案顯性知識的自動化整合。
檔案顯性知識的整合過程因數(shù)據(jù)結構分類的不同而有所差異。對非結構化數(shù)據(jù),須通過文本挖掘、圖像識別、時間序列分析等技術提取其中關鍵信息和主題,形成結構化/半結構化數(shù)據(jù);針對半結構化數(shù)據(jù),須通過XML/JSON解析、主題建模等技術提取其中元數(shù)據(jù),再經(jīng)過數(shù)據(jù)清洗、預處理和特征工程等步驟,形成結構化數(shù)據(jù);針對結構化數(shù)據(jù),須通過回歸分析、決策樹、隨機森林等技術提取其中關鍵指標和統(tǒng)計數(shù)據(jù);隨后采用關系抽取、語義依存分析、語義角色標注等技術形成語義角色鏈/樹,最終實現(xiàn)數(shù)據(jù)報告、知識圖譜、知識庫的構建,完成檔案數(shù)據(jù)中顯性知識的整合。
1.4 案例:敦煌莫高窟以智慧數(shù)據(jù)建設探索“數(shù)據(jù)驅動”新范式。敦煌研究院聯(lián)合國內外多家科研機構于2011年共同建成并投入運行綜合性虛擬現(xiàn)實項目“數(shù)字敦煌”,通過三維激光掃描、近景攝影測量等一整套適合石窟不可移動特點的文物數(shù)字化技術和規(guī)范體系技術對洞窟、彩塑與壁畫進行數(shù)字化處理,再利用三維圖形圖像技術進行還原展示,形成包括虛擬現(xiàn)實、增強現(xiàn)實和交互現(xiàn)實三部分的完整數(shù)字檔案和數(shù)據(jù)庫,呈現(xiàn)立體、直觀、逼真的敦煌石窟世界。截至2018年,該項目已開展221個洞窟的高保真壁畫數(shù)字化采集,141個洞窟的整窟高保真數(shù)字化圖像處理,壁畫數(shù)字化攝影采集精度達到300DPI,特殊應用采用600DPI;并已開展143個洞窟結構三維重建,45身重點彩塑的三維重建,莫高窟、榆林窟兩處大遺址的三維重建數(shù)據(jù),144個洞窟全景漫游節(jié)目制作;共獲取45 000張檔案底片的數(shù)字化資源,數(shù)據(jù)總量超過1 000TB。[36]
以智慧數(shù)據(jù)理念為背景,依托海量的敦煌研究文獻和數(shù)字資源,武漢大學聯(lián)合敦煌研究院挖掘敦煌數(shù)據(jù)要素和數(shù)據(jù)價值,建構敦煌文化遺產(chǎn)智慧數(shù)據(jù)集,探索“數(shù)據(jù)驅動”下數(shù)據(jù)資源的語義化處理和應用服務,并通過集成平臺開展數(shù)據(jù)共享和智慧服務。[37]其以人機協(xié)同進行領域主題詞發(fā)現(xiàn)與歸類,基于關聯(lián)數(shù)據(jù)技術開發(fā)敦煌壁畫主題詞表關聯(lián)數(shù)據(jù)服務平臺;根據(jù)敦煌石窟文化遺產(chǎn)的特征構建領域本體模型,明確表達并結構化處理非形式化知識,深度描述和揭示相關資源的語義特征、資源間的語義關聯(lián);構建圖像多維語義描述框架,提出面向文化遺產(chǎn)圖像資源的通用性深度語義標注框架,對圖像進行組織層、標引層、元素層、圖像層的多層語義標注,描述圖像內部的細粒度對象與語義單元;同時建設圖像數(shù)字資產(chǎn)管理系統(tǒng)、敦煌壁畫圖像交互式數(shù)字敘事系統(tǒng),朝著高質量、大規(guī)模的領域知識圖譜構建與應用邁進。這是對領域數(shù)據(jù)的挖掘、設計、組織和利用,以智慧數(shù)據(jù)構建細粒度知識、大規(guī)模知識圖譜,最終開發(fā)智慧化服務。
2 保障知識利用,發(fā)揮檔案知識“智用”
知識的高效利用是實現(xiàn)數(shù)字政府智能化治理的前提和必要條件,能夠提高機構決策能力和效率、降低成本、最大化發(fā)揮知識效用,[38]已然成為檔案館由數(shù)字化向智慧化轉型的關鍵因素。智慧檔案館一方面作為知識生產(chǎn)者(知識挖掘和知識記錄者),挖掘、整合、組織/編碼和存儲顯/隱性知識,為知識利用提供前提準備;一方面承擔知識獲取/集成和知識加工的環(huán)節(jié)責任,作為知識中介者對知識進行篩選、索引、抽取、清洗、評估、包裝等操作,為知識利用提供物質基礎;另一方面承擔知識傳播、知識重用的環(huán)節(jié)責任,作為知識消費者檢索知識內容并進行同質化或異質化的應用,完成自主知識復用并提供知識服務,為知識利用提供需求保障。
2.1 以數(shù)據(jù)質量和知識集成保障檔案知識可復用性??尚诺臄?shù)據(jù)源和高質量的數(shù)據(jù)是進行準確知識利用、知識復用并獲得可靠結果的前提和必要條件,[39]知識的有效集成是信息要素高度集合、知識組織最優(yōu)化、知識可復用的基礎。[40]智慧檔案館用以知識利用的數(shù)據(jù)和知識主要來源于4個方面:一是圖書館、檔案館、博物館(Library、Archives、Museum,LAM)合作共享的初始性數(shù)字信息資源;二是LAM數(shù)字資源中抽取而出的海量知識元;三是未經(jīng)過知識發(fā)現(xiàn)的隱性資源;四是其他領域的外圍數(shù)字資源。[41]針對不同來源的數(shù)據(jù)和知識,應當以明確的元數(shù)據(jù)質量標準進行統(tǒng)一管理,同時增強數(shù)據(jù)描述的深度和精細度,依照信息元素特征對數(shù)據(jù)進行多層級的整合和集成。
單維資源層面上,針對具有可靠來源的數(shù)據(jù)進行數(shù)據(jù)清洗、數(shù)據(jù)轉換、數(shù)據(jù)規(guī)約等手段的形式結構化處理,再利用分類、聚類、關聯(lián)規(guī)則、序列模式挖掘等知識抽取手段對其進行內容結構化處理,形成單業(yè)務知識庫。多維資源層面上,將單維資源進行關聯(lián),以關鍵特征提取和業(yè)務知識關聯(lián)形成多系統(tǒng)關聯(lián)的知識網(wǎng)絡,通過關聯(lián)數(shù)據(jù)、關聯(lián)關系等引入外圍資源,形成多源融合的關聯(lián)網(wǎng)絡。[42]通過單維和多維資源的重組集成,以統(tǒng)一的元數(shù)據(jù)標準和本體結構形成具有相同特征、類似粒度的信息單元,能夠實現(xiàn)面向對象層次、活動過程、應用主題的多方位信息集成,[43]形成知識元網(wǎng)絡和基礎資源網(wǎng)絡有機統(tǒng)一、外圍數(shù)字資源有效賦能的資源體系,以高質量數(shù)據(jù)和高集成度知識保障知識可復用性。
2.2 以專家資源和模塊存儲拓展檔案知識深度廣度。知識的有效利用建立在擁有完善的知識庫和高效的知識管理系統(tǒng)基礎之上。依照知識形態(tài),可將知識庫分為文檔知識庫和數(shù)據(jù)知識庫;依照知識類型,可將知識庫分為領域知識庫和領域專家?guī)?。[44]不同類型的知識庫可以模塊存儲模式進行聚類存儲,其允許單獨添加、刪除或替換存儲模塊,能夠及時對所儲知識進行調整、優(yōu)化和廣度拓展,并對所需知識片段進行快速定位和訪問,提高知識復用的效率和靈活性。不僅如此,各領域的專家資源還能與智慧檔案館形成良好的社群協(xié)作關系,以專家信息、專家知識建構領域專家?guī)?,加大領域顯/隱性知識縱深,促進領域知識傳播和共享。
經(jīng)過對原始數(shù)據(jù)的清理和預處理(去除重復值、處理缺失值、歸一化等),智慧檔案館能夠自動根據(jù)數(shù)據(jù)特點選定適配的聚類算法(如K-means、DBSCAN、層次聚類等),將相似的數(shù)據(jù)點聚在一起,形成一個個簇,再以可視化方式展現(xiàn)關鍵詞聚類、主題聚類、圖像聚類、社交網(wǎng)絡聚類等聚類結果,并以聚類內部和之間的相似性等指標對聚類結果進行評估調整,最終組成知識模塊。這一過程中,針對專家資源進行專門架構設計和表單制作,經(jīng)過整合的人力資源和專家知識應分領域分模塊存入領域專家?guī)?。這些知識模塊可以直接存入關系型數(shù)據(jù)庫、圖形數(shù)據(jù)庫、文檔數(shù)據(jù)庫和NoSQL數(shù)據(jù)庫等多種類型數(shù)據(jù)庫中,也可以通過知識圖譜技術將其以節(jié)點和邊的形式組織起來,形成圖譜庫。
2.3 以情境匹配和檢索可視提升檔案知識服務能力。泛在知識環(huán)境下,檔案用戶需求呈現(xiàn)立體多維的復雜結構,用戶情感易變性增強,個人、群體表現(xiàn)出多元化的知識需求。[45]智慧檔案館以用戶為核心,以知識情境匹配和可視化技術為基礎,以檔案資源的交互式與推送式服務實施資源的精準推送,形成多維感知的知識服務模式,同時實現(xiàn)檔案知識內化和檔案用戶社群間的知識外化與傳遞,[46]是知識復用的典型場景。在此背景下,可采用SaaS(軟件即服務)知識服務模式整合單維復用流程、多系統(tǒng)知識關聯(lián)、知識庫,實現(xiàn)單模態(tài)知識復用,以及采用PaaS(平臺即服務)知識服務模式形成基礎平臺及可復用的插件、工具和接口,構建不同的知識主題和知識場景,實現(xiàn)多模態(tài)知識復用。[47]
情境建模和圖像可視化是實現(xiàn)以知識服務為導向的知識利用和復用的有效手段。知識情境是知識產(chǎn)生和應用過程中可能出現(xiàn)的所有元素及其關系所構成的有序序列的集合,以問題、任務、過程、資源、產(chǎn)品/服務、領域等為節(jié)點形成類屬關系、部分整體關系、實例關系、屬性關系等節(jié)點關系,可由節(jié)點相似度計算得出維度相似度,加權而得情境相似度,并以相似度分析和情境查找實現(xiàn)知識利用和知識復用。[48]而本體、知識圖譜、復用圖神經(jīng)網(wǎng)絡等基于圖的技術是知識分布位置的可視化表達方式,是以有序方式對用戶進行知識呈現(xiàn)的典型手段。[49]除此之外,由元數(shù)據(jù)、圖像、標注內容組成的圖像知識體系也可形成圖像知識復用鏈,通過SPARQL檢索便可快速抽取并重塑圖像復用過程。[50]
2.4 案例:江西省檔案館以信息特征分析建構檔案開放鑒定模型。江西省檔案館承擔的2019年度國家檔案局科技項目計劃《基于結構化和文本數(shù)據(jù)的輔助開放鑒定模型》以文獻研究、德爾菲法、實驗和實證等方法針對館藏的中華人民共和國成立后文書檔案進行研究,建構輔助檔案開放鑒定模型,并通過本省檔案館的檔案大數(shù)據(jù)分析應用系統(tǒng)與數(shù)字檔案集成管理系統(tǒng)對接,業(yè)已正式通過驗收。2022年,江西省檔案館利用課題成果完成26.526萬件檔案二分類預測與運用工作,鑒定模型預測率為100%,總準確率為70.68%,總精確率為67.6%;減少了25%以上人工一審工作量、20%以上人工二審工作量,單維直接鑒定模塊分析13萬件沒有應用預測成果、二審未開放的檔案數(shù)據(jù),將6 958件檔案修正為控制使用。[51]
該課題首先以全宗為對象、以件為基本單位上線、掛接數(shù)字檔案資源,針對其進行開放信息特征分析和敏感信息特征分析,選用特定關鍵詞特征、開放詞與敏感詞特征、敏感全宗特征、基于法規(guī)的開放鑒定分類信息特征、片段信息特征等5類檔案信息特征,轉化形成用于開放方向的特定開放詞、特定敏感詞等7個鑒定模型維度,用于控制方向的開放詞數(shù)、敏感詞數(shù)等8個鑒定模型維度和兩個方向兼有的情感分析1個鑒定模型維度。[52]經(jīng)過對數(shù)據(jù)質量、信息集成及分析質量的把控,該課題以“檔案數(shù)據(jù)化”和“數(shù)據(jù)分析算法”兩項為數(shù)據(jù)挖掘關鍵技術,選用Paddle OCR識別工具、LAC中文分詞工具、LSI文本聚類算法、BERT+ Dense文本分類與情感分析算法等,構建了遞進式輔助開放鑒定雙模塊、算法模型和檔案知識庫,對于檔案文件進行針對性、專門性知識匹配和可視化結果顯示,實現(xiàn)多維度、可解釋、語義化的智能鑒定。元數(shù)據(jù)方面,其基于檔案文件的背景信息(包含文件元數(shù)據(jù)信息、系統(tǒng)中業(yè)務數(shù)據(jù)等)進行綜合性審查;句方面,其通過對句語義的閱讀理解判定檔案文件中段落/句子的正負面語義及涉敏程度和類別;字詞方面,其結合上下文語境對敏感詞進行識別標注;圖像方面,其進行圖像特征辨別;篇章內容方面,其進行完整文本審讀,深入挖掘上下文文本語境關聯(lián)。
3 升級檔案資源,彰顯檔案生命“智效”
從話語分析的角度來看,智慧檔案館因其在知識管理過程中的反復性和加工性實現(xiàn)了形式再生產(chǎn)、內容再生產(chǎn)、意義再生產(chǎn)[53]:形式再生產(chǎn)指知識形態(tài)/形式的內部轉化和相互轉化;內容再生產(chǎn)指對知識內容的加工和再建過程,也是知識發(fā)現(xiàn)、知識復用的基本過程;意義再生產(chǎn)指對知識象征意義、功能意義的闡釋,是知識生命力的象征和體現(xiàn)。知識再生是對檔案資源的活化,是檔案資源在人的社會活動、思維方式中加以繼承和發(fā)展的直接體現(xiàn),是智慧檔案館對檔案資源的活性保護和活態(tài)傳播,彰顯了檔案的生命力和可持續(xù)性。
3.1 以主體協(xié)同和多維對話形成檔案多元知識結構。智慧檔案館的知識再生主體包括生產(chǎn)者主體和消費者主體,其中前者是檔案知識的形成者和加工者,包括具有“智慧”特征和能動性的智慧檔案館本身和檔案工作者,后者是融文本認知、內容理解、意義闡發(fā)為一體的受眾,如檔案用戶、社會公眾。[54]生產(chǎn)者各主體和消費者主體的新定位將導致話語秩序的變更,主體間多維度的話語交換會改變知識生產(chǎn)與分布的話語權和多樣性,[55]進而形成一元知識到多元知識、確定性知識到模糊限制性知識、陳述性知識到程序性知識的知識轉變,以及個體知識和公共知識、專家知識與常識性知識共重生產(chǎn)的知識特征。[56]
知識的融合、共享和共創(chuàng)需要知識再生主體的協(xié)同合作,形成以智慧檔案館為執(zhí)行主體、以檔案工作者為把控對象、以滿足消費者主體需求為目標導向的檔案知識生產(chǎn)共同體,并通過固定的權力關系網(wǎng)絡和話語秩序建構、維持和穩(wěn)定知識再生產(chǎn)關系與運作架構。檔案工作者是具有權威發(fā)言權的知識再生決策者,針對智慧檔案館的知識生產(chǎn)各環(huán)節(jié)進行宏觀指導和調控;智慧檔案館是知識再生的執(zhí)行者,以其知識基礎和技術支持實施知識生產(chǎn)的具體環(huán)節(jié);檔案用戶、社會公眾則對知識產(chǎn)物進行利用和反饋。不同維度間的主體進行建設性的互動與滲透,通過對話實現(xiàn)知識再生的全過程多主體參與,最終形成多元、開放、動態(tài)、可用的檔案知識結構和知識有機體。
3.2 以知識融匯和交互涵化加速檔案動態(tài)知識演進。知識是在涵化過程中不斷演進的。知識涵化指多元實踐共同體對于多元知識形態(tài)的知識交流、交鋒和交融而產(chǎn)生新知識的過程,其要義在于學習借鑒、溝通互融和理論創(chuàng)新,是知識生產(chǎn)和再生產(chǎn)的根本路徑。[57]智慧檔案館知識再生的理想狀態(tài)是經(jīng)由單向涵化、雙向(以及多向)涵化走向以知識融匯為主要特征、實現(xiàn)深度知識融合的交互涵化;理想模式是由知識的多元性賦予知識再生活力和動力,由知識的辯論和對話提升知識的質量和深度、促成知識的升華,形成不斷生成、變化、演進的知識模態(tài)和多元一體的知識體系。[58]知識的匯集和融合是多元主體之間交互涵化的基礎,二者共同組成了知識再生的原動力。
知識的集成整合、關聯(lián)提取和模塊存儲是智慧檔案館知識融匯的主要方式,是智能技術的直接使用。知識主體的交互涵化則是跨學科、跨領域的合作和交流,是在知識交流過程中知識形態(tài)的轉變和思想理念的啟示,是智慧檔案館因其“智慧”成為檔案知識主體的內推作用。在此語境下,知識客體不再有界、以固定形態(tài)和內容為限度,而是形成多面、多重的知識模態(tài),在一定的因素推動下可無限延伸;知識主體也不再是獨立存在、彼此分離、邊界明晰,而是呈現(xiàn)出流動性、交融性,從分離向交互演化。知識客體的融匯和多變要求知識主體的不斷交互,知識主體的交互和涵化又進一步賦能知識客體的動態(tài)演變,這是社會液態(tài)化背景下知識再生產(chǎn)發(fā)生固態(tài)到液態(tài)形態(tài)嬗變的具體表征。[59]
3.3 以智慧累積和媒介傳播延續(xù)檔案豐厚知識脈絡。知識再生的形式、內容和意義都是累積性的。形式上,知識再生的技術手段不斷更新迭代,新舊技術相輔相成、依具體情境選用;內容上,知識再生是知識本身的增量過程,也是知識內涵的創(chuàng)新和升華;意義上,知識再生消解了中心化、扁平化、封閉化的知識關系,持續(xù)多維多位建設檔案知識網(wǎng)絡。技術、量級和含蘊的累積是知識再生過程中“智慧”累積的具象表現(xiàn),也是檔案知識脈絡愈加豐厚的內因所在。同時,現(xiàn)代傳媒作為知識生產(chǎn)成果的表現(xiàn)形式及其傳承體系的構成方式,對知識的加工、傳承行為進行保存和傳播,進而提升檔案館知識再生能力和影響力,是豐富檔案知識脈絡的外在賦能。
智慧檔案館通過“智慧”技術完成知識再生的形式累積和內容累積,又通過“智慧”思維闡釋知識再生的象征意義、功能意義,為知識提供多樣的增值手段、不同的生命形態(tài)和源源不斷的生命動力。利用數(shù)字技術、網(wǎng)絡技術和移動傳播技術進行信息傳播的新興媒體則提取、活化、傳遞知識再生過程,已然成為其外界參與主體,并增添其意義再生內涵。在這一過程中,現(xiàn)代媒體因肇始于技術發(fā)展,與智慧檔案館直接形成技術關聯(lián),同時作為中介和過程要素為檔案知識的意義再生構建情境殊異的數(shù)字傳播場域,強化其源頭價值,進而導向網(wǎng)絡化擴散的生產(chǎn)行動和效果,推動并傳播智慧檔案館知識生產(chǎn)、再生產(chǎn)進程。[60]智慧檔案館的智慧累積和現(xiàn)代媒介的參與式傳播延續(xù)了檔案知識的脈絡和生命力。
3.4 案例:中國人民大學以文化資源整合闡釋“新老”北京記憶。中國人民大學數(shù)字人文研究院、人文北京研究中心主持建設的“北京記憶”數(shù)字記憶項目綜合運用多學科多領域的方法、技術與工具,按照北京城的地理空間和歷史發(fā)展脈絡,對原生和再生的數(shù)字資源進行存儲和整合。針對不同的記憶對象和記憶場景,其分別采用數(shù)字敘事、地理信息系統(tǒng)、3D建模、VR/AR、交互游戲等多種方式呈現(xiàn),從整體上展示和溝通“老北京”的歷史魅力與“新北京”的精神風貌,以“兩站一庫”(專題網(wǎng)站群、互動網(wǎng)站、數(shù)字資源庫)為主體,構建了一座城市(3000年北京建模)、一條胡同(北京史家胡同網(wǎng)站)、一條河流(京杭大運河網(wǎng)站)、一棟建筑(清陸軍衙署網(wǎng)站)、一段童謠(北京童謠網(wǎng)站)的北京數(shù)字記憶迭代知識譜系,至今仍在持續(xù)更新。[61]
該項目以首創(chuàng)的“前站后庫”架構實現(xiàn)記憶資源的科學存儲、知識再生和充分共享。[62]前站承擔展示功能,即以網(wǎng)站為窗口面向社會公眾提供交互式服務,以豐富的多媒體資源展示和互動體驗功能高質量優(yōu)體驗地輸出北京文化、記憶資源,包括北京城市文化、金石輿圖、民俗風情、口述歷史、非遺傳承、紅色文脈等;同時以“北京+您=北京記憶”為口號開啟檔案資源收集的專門通道,以眾籌資源—眾構記憶—眾創(chuàng)空間—眾享文化4個維度進行北京記憶資源的可持續(xù)補充與管理。后庫則側重數(shù)據(jù)保存和知識組織,是記憶資源的完整數(shù)據(jù)庫,各類資源經(jīng)規(guī)范加工后存儲于此;同時以數(shù)據(jù)挖掘和智能分析對大量信息進行深度研究和挖掘。在后庫中設計智能檢索還可以打通各類資源的知識關聯(lián),以著名人物、著名地點、著名建筑物為重要的串聯(lián)線索構建專題網(wǎng)絡,把歷史事件、學術思想與數(shù)字地點進行有機結合,從中獲得新的信息和結論。以首都圖書館北京地方文獻中心為主要主體,北京市各級領導機關、各科研和企事業(yè)單位及社會公眾為共同主體的北京記憶項目以多主體協(xié)同方式展開北京文化資源整合,隨著資源豐富不斷加深、拓展知識融匯和涵化,以新興媒體展現(xiàn)北京檔案文化資源縱深,形成多資源互補、多媒體聯(lián)通、迭代式生長、開放式構建的“新老”北京記憶。
4 結語
知識管理是信息管理適應知識經(jīng)濟時代的發(fā)展的必然結果,是信息科學發(fā)展中新的增長點。[63]從知識管理視角看待數(shù)字檔案館到智慧檔案館的變遷,能夠直觀感受其在檔案信息感知與協(xié)同處置能力方面的飛躍。知識管理視角下,智慧檔案館因其高程度的數(shù)據(jù)態(tài)和智慧化特征,以數(shù)據(jù)思維和結構轉變?yōu)榛鶞?,應用知識提取、關聯(lián)分析、數(shù)據(jù)挖掘和語義分析等大數(shù)據(jù)技術,探索知識發(fā)現(xiàn)的高效路徑,智慧洞察檔案數(shù)據(jù)價值;同時作為知識生產(chǎn)者、知識中介者、知識消費者的共同體,以數(shù)據(jù)質量和知識集成為保障,以專家資源和模塊存儲為基本操作,以情景匹配化和檢索可視化為手段,自主把控知識復用全程,智慧導航檔案館知識服務;以多元主體協(xié)同和對話為前提,以智慧累積和現(xiàn)代媒介傳播為方式,其還進行知識融匯和交互涵化,進一步賦能檔案知識的動態(tài)演進和脈絡豐厚,實現(xiàn)檔案知識的形式、內容、意義三維再生產(chǎn),保障檔案知識生命力。對智慧檔案館知識管理層次的剖析,有助于挖掘其知識管理內涵,為智慧檔案館的建設和發(fā)展提供參考。