何玉顏/上海大學(xué)圖書情報檔案系
2015年8月國務(wù)院頒布《促進大數(shù)據(jù)發(fā)展行動綱要》,標志著大數(shù)據(jù)發(fā)展從此納入國家發(fā)展戰(zhàn)略?!毒V要》特別指出:“建立‘用數(shù)據(jù)說話、用數(shù)據(jù)決策、用數(shù)據(jù)管理、用數(shù)據(jù)創(chuàng)新’的管理機制,實現(xiàn)基于數(shù)據(jù)的科學(xué)決策,將推動政府管理理念和社會治理模式進步?!闭髷?shù)據(jù)治理是指政府運用大數(shù)據(jù)治理理念、手段與技術(shù),充分挖掘海量政府大數(shù)據(jù)中蘊含的價值,實現(xiàn)政府治理能力提升的過程,是國家治理能力現(xiàn)代化的體現(xiàn)。如今,檔案界逐漸開始接納數(shù)據(jù)管理理念與技術(shù)并付諸實踐,檔案工作在大數(shù)據(jù)的背景下如何創(chuàng)新發(fā)展已成為界內(nèi)熱點話題;國家治理體系與治理能力現(xiàn)代化建設(shè)也要求檔案工作實現(xiàn)從傳統(tǒng)管理向現(xiàn)代化治理的轉(zhuǎn)型。大數(shù)據(jù)治理給檔案部門帶來了新的發(fā)展機遇,檔案部門在政府大數(shù)據(jù)治理中的意義與參與路徑,值得我們關(guān)注和思考。
據(jù)國家檔案局統(tǒng)計,截至2016年底全國共有檔案行政管理部門3127個,各級各類檔案館4237個,主要以國家綜合檔案館、國家專門檔案館和部門檔案館為主。全國各級國家綜合檔案館館藏檔案65062.5萬卷,館藏電子檔案218.4萬GB,館藏檔案數(shù)字化副本2243萬GB[1]。通過以上數(shù)據(jù)可以看出,檔案部門是政府?dāng)?shù)據(jù)的聚集地,各部門的檔案都首先匯集到部門內(nèi)部的檔案室,并將有長久保存價值的檔案向國家各級綜合檔案館移交。檔案部門還擁有海量的歷史數(shù)據(jù),能夠記錄和反映政府各部門在不同歷史時期的工作動態(tài),為政府部門總結(jié)發(fā)展規(guī)律、優(yōu)化工作決策等提供了數(shù)據(jù)資源保障。
檔案部門掌握大量政府?dāng)?shù)據(jù)資源,政府大數(shù)據(jù)治理不斷深化促使檔案工作模式發(fā)生變化,檔案工作逐漸由傳統(tǒng)的業(yè)務(wù)驅(qū)動向數(shù)據(jù)融合轉(zhuǎn)變,進而轉(zhuǎn)向數(shù)據(jù)驅(qū)動。在業(yè)務(wù)驅(qū)動階段,檔案工作流程緊跟檔案處理業(yè)務(wù)流程,信息系統(tǒng)也多以業(yè)務(wù)為中心構(gòu)建。隨著政府大數(shù)據(jù)治理要求的提出,檔案工作將逐漸走向數(shù)據(jù)融合和數(shù)據(jù)驅(qū)動階段,檔案部門要融合其他政府部門的數(shù)據(jù),基于這些數(shù)據(jù)提供更多的數(shù)字檔案資源增值服務(wù);同時也向數(shù)據(jù)驅(qū)動轉(zhuǎn)型,真正做到以數(shù)據(jù)為中心構(gòu)建信息系統(tǒng),并進行跨部門、跨行業(yè)、跨領(lǐng)域的綜合數(shù)據(jù)分析與挖掘。
檔案部門參與政府大數(shù)據(jù)治理,為檔案學(xué)理論研究帶來了新的機遇與挑戰(zhàn)。當(dāng)前已經(jīng)有一部分學(xué)者開始關(guān)注大數(shù)據(jù)的發(fā)展對檔案學(xué)理論研究的影響,但檔案學(xué)與政府大數(shù)據(jù)治理相結(jié)合的研究目前仍是空白,傳統(tǒng)檔案學(xué)理論研究主要依靠理論思辨或?qū)嵶C研究的方法,而檔案部門參與政府大數(shù)據(jù)治理有助于從大數(shù)據(jù)技術(shù)、理念等方面推動檔案學(xué)理論研究,拓寬檔案學(xué)的研究范圍,為檔案學(xué)理論研究注入新的活力。
檔案數(shù)據(jù)資源的收集完備和有效融合是檔案數(shù)據(jù)得以開放和共享的前提。檔案部門要想?yún)⑴c政府大數(shù)據(jù)治理,首先應(yīng)將政府各部門和組織的各類數(shù)據(jù)收集進館。美國曾以立法的形式確定“最小數(shù)據(jù)集”制度,在各個領(lǐng)域強制收集必要的數(shù)據(jù),并據(jù)此進行科學(xué)決策,從而推動了治理的精細化和透明化[2]。檔案部門所收集的數(shù)據(jù)既包括傳統(tǒng)數(shù)據(jù)資源,也包括大數(shù)據(jù)環(huán)境下產(chǎn)生的新型數(shù)據(jù)資源,如來自傳感器、RFID等的物聯(lián)網(wǎng)感知數(shù)據(jù);來自微博、Web日志、點擊流等的社交媒體交互數(shù)據(jù)[3]。數(shù)據(jù)的多源性使得資源的異構(gòu)性普遍存在,主要體現(xiàn)為數(shù)字檔案資源格式、類型、標準、運行平臺等方面的異構(gòu)。為此,檔案部門應(yīng)提升對異構(gòu)數(shù)據(jù)的處理能力,進行深度數(shù)據(jù)融合。
數(shù)據(jù)融合是對各種異構(gòu)數(shù)據(jù)提供統(tǒng)一的表示、存儲和管理,以實現(xiàn)邏輯或物理上有機地集中,即以一種統(tǒng)一的數(shù)據(jù)模式描述各數(shù)據(jù)源中的數(shù)據(jù),屏蔽其平臺、數(shù)據(jù)結(jié)構(gòu)等異構(gòu)性,實現(xiàn)數(shù)據(jù)的無縫集成[4]。實現(xiàn)檔案數(shù)據(jù)的融合是檔案部門參與政府大數(shù)據(jù)治理的前提,檔案部門應(yīng)擔(dān)當(dāng)起解決數(shù)據(jù)異構(gòu)問題的協(xié)調(diào)責(zé)任。首先檔案館應(yīng)協(xié)調(diào)館內(nèi)資源的融合工作,實現(xiàn)館內(nèi)檔案數(shù)據(jù)的共享與集成化;對多樣化的存儲格式進行處理,實現(xiàn)文本、圖形、圖像等多種數(shù)據(jù)格式、結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)一。其次要統(tǒng)一數(shù)據(jù)格式等相關(guān)要素,實現(xiàn)檔案館館際之間的數(shù)據(jù)共享。最后還需要深入形成數(shù)據(jù)的各政府部門,對數(shù)據(jù)形成進行前端控制。
政府?dāng)?shù)據(jù)開放與共享是政府大數(shù)據(jù)治理的核心,各國紛紛從政策、法規(guī)、技術(shù)等方面探索政府?dāng)?shù)據(jù)開放的創(chuàng)新發(fā)展。目前我國正按照“統(tǒng)一平臺、互聯(lián)互通,存量共享、增量共建,物理分散、邏輯集中”的原則,整合各政府部門之間的數(shù)據(jù)。
檔案部門在政府?dāng)?shù)據(jù)開放和共享中扮演著重要角色,其一是協(xié)調(diào)者的角色。在政務(wù)信息公開的進程中,政府職能部門各自為政,“數(shù)據(jù)孤島”現(xiàn)象普遍存在。檔案部門應(yīng)當(dāng)積極參與整合各部門政務(wù)信息公開的數(shù)據(jù)資源、基礎(chǔ)設(shè)施,并發(fā)布數(shù)據(jù)共享規(guī)范,利用云計算等新興技術(shù)建立數(shù)據(jù)資源共享平臺,與政府各職能部門通力合作對于政府大數(shù)據(jù)的捕獲、存儲、開發(fā)利用和長期保存至關(guān)重要。其二是把關(guān)者的角色,檔案部門多年來積累了豐富的檔案開放鑒定的經(jīng)驗,在政府?dāng)?shù)據(jù)資源的公開工作中更具有中立立場,因此檔案部門應(yīng)承擔(dān)起審查和把握政府?dāng)?shù)據(jù)開放與共享范圍的重任。
數(shù)據(jù)粒度指的是數(shù)據(jù)細化和綜合的程度,數(shù)據(jù)的細化程度越高,數(shù)據(jù)粒度越小。我國檔案館積累了大量的政府?dāng)?shù)據(jù),但“重館輕用”“重證據(jù)輕知識”的思想一直存在,檔案館傾向于采取粗顆粒度的方式進行管理。對檔案數(shù)據(jù)資源進行細顆?;拈_發(fā),是檔案工作參與政府大數(shù)據(jù)治理乃至大數(shù)據(jù)戰(zhàn)略的前提。
其一,檔案館保存著大量有極高價值的政府?dāng)?shù)據(jù),對這些信息進行挖掘和利用有助于政府進行科學(xué)決策。檔案部門在整合政府大數(shù)據(jù)的基礎(chǔ)上,應(yīng)對館藏數(shù)據(jù)進行語義級細顆?;_發(fā),從以往的全宗級、案卷級和文件級管理轉(zhuǎn)向語詞級的管理,以此實現(xiàn)政府大數(shù)據(jù)治理中的知識挖掘和檔案數(shù)據(jù)資產(chǎn)的增值。其二,檔案部門應(yīng)積極主動樹立新思維、應(yīng)用新技術(shù)。文本挖掘、本體建構(gòu)、語義關(guān)聯(lián)、知識圖譜、可視化等技術(shù)進入檔案領(lǐng)域,為提高檔案數(shù)據(jù)資源開發(fā)水平帶來了契機。以語義關(guān)聯(lián)技術(shù)為例,語義關(guān)聯(lián)的鏈接性可以實現(xiàn)數(shù)據(jù)資源的有效整合,也可以對不同類型的數(shù)據(jù)資源進行深層次關(guān)聯(lián)挖掘和展示。綜合運用這些技術(shù),可以使數(shù)據(jù)最大限度地發(fā)揮效用,如歐洲文化遺產(chǎn)CLARIN項目將歐洲的大學(xué)、圖書館和其他公共機構(gòu)的檔案信息進行整合,包括文字、音像、工藝品等,通過添加注釋和標記并通過永久標識符得以長期保存,任何有需要的公民或公共機構(gòu)都可以訪問所有數(shù)據(jù)集、建造屬于自己的虛擬館藏,對數(shù)據(jù)進行探索和增值[5]。
政府大數(shù)據(jù)治理的核心任務(wù)之一是利用大數(shù)據(jù)提升政府科學(xué)決策水平,而檔案部門具備為政府決策提供支持的先天優(yōu)勢。2014年,時任國家檔案局局長楊冬權(quán)在全國檔案局長館長會議上指出:“要充分發(fā)揮檔案為中央決策服務(wù)的作用,要有先行思維提前介入管理者決策?!盵6]當(dāng)前,檔案部門在國家智庫建設(shè)中扮演的主要還是提供資料的輔助性角色,致使檔案數(shù)據(jù)資源的開發(fā)和利用受到一定制約。檔案部門參與政府大數(shù)據(jù)治理的路徑之一就是將檔案館打造成重要的智庫,發(fā)揮檔案館咨政建言的作用。
為此,檔案部門應(yīng)發(fā)揮兩方面作用:其一是為政府部門的各項政策制定建言獻策。檔案部門的工作人員要培養(yǎng)參與社會治理的意識,一方面要熟知館藏資源內(nèi)容,并在對館藏資源細顆粒化開發(fā)的基礎(chǔ)上,掌握館藏資源中蘊含的信息和知識;另一方面要放眼社會治理,聚焦社會治理中的各項問題,并與館藏資源相對接,把豐富的知識和信息運用到服務(wù)公共事務(wù)中去,為政策制定提供建議或報告。其二是加強檔案部門與社會公眾的互動。公共檔案館是社會服務(wù)的窗口,應(yīng)該將檔案館打造成政府部門與公眾溝通的橋梁,通過檔案部門廣泛收集民意,并從中探索和總結(jié)出社會公共事務(wù)中民眾關(guān)心的、亟待解決的問題,檔案部門從自身的資源建設(shè)與服務(wù)供給方面給出局部問題的解決方案,并向政府職能部門提出建議與對策。
政府大數(shù)據(jù)治理是一項復(fù)雜的系統(tǒng)工程,需要多方通力合作才能取得最佳效果。檔案部門在參與政府大數(shù)據(jù)治理過程中,也應(yīng)該摒棄以往“以我為主”的舊觀念,營造各方協(xié)同參與的生態(tài)系統(tǒng),實現(xiàn)數(shù)據(jù)治理效果的最大化。
其一是尋求專業(yè)可靠的服務(wù)外包供應(yīng)商。隨著技術(shù)的變革和社會分工的逐步細化,單純依靠檔案部門自身力量,難以進一步提升檔案數(shù)據(jù)管理與資源開發(fā)利用的成效。在政府大數(shù)據(jù)治理的背景下,業(yè)務(wù)外包不應(yīng)局限于數(shù)字化掃描等初級業(yè)務(wù),更應(yīng)將系統(tǒng)開發(fā)、數(shù)據(jù)遷移、長期保存與數(shù)據(jù)云服務(wù)、數(shù)據(jù)挖掘等技術(shù)含量較高的業(yè)務(wù)納入外包服務(wù)范圍,尋求有資質(zhì)和經(jīng)驗的承包商進行合作。其二是發(fā)動社會公眾廣泛參與,鼓勵大眾參與數(shù)字檔案資源的收集、開發(fā)等工作。眾包模式在西方國家已經(jīng)有廣泛的實踐,以美國的“市民檔案員”[7]項目為典型,美國國家檔案館吸納公眾參與館藏檔案的貼標簽、轉(zhuǎn)錄內(nèi)容編輯等多項內(nèi)容中,目前“市民檔案員”已經(jīng)成為美國國家檔案館的特色項目之一[8]。檔案部門可以鼓勵市民積極參與政府?dāng)?shù)據(jù)的開發(fā)利用中去,激發(fā)政府?dāng)?shù)據(jù)的更大價值。通過公民的參與形成政府與公民良性互動的局面,有利于政府與公民之間增進了解、加強溝通。
綜上,檔案部門的參與是政府大數(shù)據(jù)治理的重要一環(huán),檔案部門作為數(shù)據(jù)資源與基礎(chǔ)設(shè)施的提供者、數(shù)據(jù)開放和共享的參與者、政策制定的協(xié)助者、公民與政府互動的協(xié)調(diào)者,能夠幫助提升政府大數(shù)據(jù)治理能力、創(chuàng)新政府大數(shù)據(jù)治理方式等。但無論從理論研究還是實踐發(fā)展上來看,目前檔案部門參與政府大數(shù)據(jù)治理的水平和能力還有待提高。檔案部門需從頂層設(shè)計、技術(shù)與管理標準規(guī)范建設(shè)、人才培養(yǎng)等多方面著力,加強自身數(shù)據(jù)管理能力,并積極尋求與政府各職能部門的合作,開創(chuàng)參與政府大數(shù)據(jù)治理的新局面。