方曉麗
引言
2019年年末新型冠狀病毒肺炎(以下簡稱“新型肺炎”)疫情在中國爆發(fā),再次引起人們對突發(fā)公共衛(wèi)生事件的關(guān)注。突發(fā)公共衛(wèi)生事件是指突然發(fā)生,造成或者可能造成社會公眾健康嚴(yán)重?fù)p害的重大傳染病疫情、群體性不明原因疾病、重大食物和職業(yè)中毒以及其他嚴(yán)重影響公眾健康的事件[1]。在突發(fā)公共衛(wèi)生事件(以下簡稱“突發(fā)事件”)中形成了大量的文字、聲像、電子等各種載體的檔案資源,真實(shí)記錄了社會各個行業(yè)、階層同疾病災(zāi)害英勇抗?fàn)幍娜^程,對于突發(fā)事件過程的回顧、經(jīng)驗(yàn)教訓(xùn)的總結(jié)都有著極其重要的作用。建設(shè)檔案數(shù)據(jù)庫是比較常用的一種突發(fā)事件檔案管理方式。它能將傳統(tǒng)的紙質(zhì)檔案信息轉(zhuǎn)化為數(shù)字化信息,即將檔案實(shí)現(xiàn)虛擬化,從而使檔案信息與實(shí)體相分離,從這個層面上來講就是將檔案信息更好地實(shí)現(xiàn)網(wǎng)絡(luò)共享,便于利用者進(jìn)行復(fù)制、收集、整理以及利用,一定程度上促進(jìn)了檔案事業(yè)的發(fā)展。
關(guān)于突發(fā)事件檔案數(shù)據(jù)庫的研究,蔡盈芳[2]、曹燕紅[3]、趙鑫強(qiáng)[4]、黃新榮[5]等人分別從數(shù)據(jù)庫的內(nèi)容、功能、組織、建設(shè)策略等方面進(jìn)行了相關(guān)探索。蔡盈芳對突發(fā)事件檔案專題數(shù)據(jù)庫的內(nèi)容、建設(shè)步驟及利用方案進(jìn)行了具體的探討。曹燕紅提出建立突發(fā)事件專題數(shù)據(jù)庫來解決同一突發(fā)事件檔案資料分散管理、利用不方便的問題,并對突發(fā)事件檔案專題數(shù)據(jù)庫的在線檢索功能進(jìn)行分析。趙鑫強(qiáng)從用戶需求、平臺建設(shè)、信息安全、動態(tài)維護(hù)、建設(shè)標(biāo)準(zhǔn)等五個方面提出建立新型冠狀病毒疫情檔案專題數(shù)據(jù)庫的具體策略。黃新榮建議在進(jìn)行專題數(shù)據(jù)庫的組織時對數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行分層:基礎(chǔ)層——原始數(shù)據(jù)、中間層——聚合加工數(shù)據(jù)、展示層——作品故事。與上述作者的思路不同,本文從大數(shù)據(jù)技術(shù)的角度出發(fā)構(gòu)建突發(fā)事件檔案數(shù)據(jù)庫系統(tǒng)框架。
一、突發(fā)事件檔案數(shù)據(jù)庫概述
檔案數(shù)據(jù)庫是以檔案的本體管理為基礎(chǔ),兼顧數(shù)據(jù)庫設(shè)計(jì)和應(yīng)用發(fā)展的需要,將包括檔案實(shí)體信息、管理信息、應(yīng)用環(huán)境信息在內(nèi)的各種類型數(shù)據(jù)按照特定數(shù)據(jù)模型進(jìn)行組織的數(shù)據(jù)集合[6]。突發(fā)事件檔案數(shù)據(jù)庫則是將在突發(fā)事件過程中直接形成的,具有保存價值的文字、圖像、聲像、影像等不同載體和形態(tài)的原始數(shù)據(jù)按照特定數(shù)據(jù)模型進(jìn)行整合的數(shù)據(jù)集合,實(shí)現(xiàn)突發(fā)事件檔案資源在不同專業(yè)領(lǐng)域、基層檔案部門的資源匯集,并為突發(fā)事件檔案資源在全國范圍內(nèi)的有效整合提供可能。
突發(fā)事件檔案數(shù)據(jù)庫的建設(shè)應(yīng)具有特色性、安全性、可擴(kuò)展性和服務(wù)性。其中,特色性是指在建設(shè)突發(fā)事件檔案數(shù)據(jù)庫過程中,要緊緊圍繞突發(fā)事件開展工作,精準(zhǔn)選材,要充分考慮到突發(fā)事件檔案的作用和用戶的利用需求,突出數(shù)據(jù)庫的特色,避免盲目性;安全性是指突發(fā)事件檔案數(shù)據(jù)庫的建設(shè)要以數(shù)據(jù)安全和系統(tǒng)安全為基本前提,保障突發(fā)事件檔案數(shù)據(jù)的安全和完整;可擴(kuò)展性是指突發(fā)事件檔案數(shù)據(jù)庫在系統(tǒng)設(shè)計(jì)、功能延展、數(shù)據(jù)更新等方面預(yù)留一定的擴(kuò)展和優(yōu)化空間,提高數(shù)據(jù)庫的動態(tài)管理能力;服務(wù)性是指突發(fā)事件檔案數(shù)據(jù)庫應(yīng)以實(shí)現(xiàn)突發(fā)事件檔案的社會價值、滿足公眾服務(wù)需求為重要導(dǎo)向,要確保界面友好、實(shí)用可靠、功能齊全,保證突發(fā)事件檔案的查全率和查準(zhǔn)率,提升用戶的服務(wù)體驗(yàn)。
二、突發(fā)事件檔案數(shù)據(jù)庫建設(shè)的意義
1.釋放檔案價值,支撐應(yīng)對處置工作
突發(fā)事件檔案數(shù)據(jù)建設(shè)的目的之一就是實(shí)現(xiàn)一定區(qū)域或者全國范圍內(nèi)突發(fā)事件檔案資源的優(yōu)化整合,所謂整合就是將各個機(jī)構(gòu)部門在突發(fā)公共衛(wèi)生事件中形成的檔案資源進(jìn)行優(yōu)化選擇、整理、組合,使其一體化、系統(tǒng)化。突發(fā)事件檔案資源的整合利用可以使有關(guān)部門短時間、高效率開展應(yīng)急管理工作,減少不必要的人員傷亡,降低國家經(jīng)濟(jì)損失。比如,新冠肺炎疫情爆發(fā)后,10天建成的武漢火神山醫(yī)院就是在2003年北京小湯山醫(yī)院建設(shè)施工圖紙檔案的基礎(chǔ)上進(jìn)行建設(shè)。此外,在疫情期間雷神山醫(yī)院的配套供電項(xiàng)目建設(shè)中,建設(shè)團(tuán)隊(duì)利用2019年世界軍運(yùn)會專題檔案中相關(guān)供電路徑圖等檔案資料,快速制定了供電方案,助力雷神山醫(yī)院以3天3夜的超快速度完成了配套供電工程建設(shè)任務(wù);洪山體育館、武漢體育中心等被確定為“方艙醫(yī)院”的重點(diǎn)場所,也是通過查閱軍運(yùn)會“一戶一案”電子檔案,借鑒其中的有益實(shí)踐經(jīng)驗(yàn),為節(jié)約醫(yī)院改造時間、挽救病人生命創(chuàng)造了有利條件[7]。大數(shù)據(jù)時代,突發(fā)事件檔案資源跨主體、跨地區(qū)的整合利用不僅能夠及時充分釋放檔案價值,使相關(guān)部門短時間、高效率開展應(yīng)對處置工作,減少不必要的人員傷亡,降低國家經(jīng)濟(jì)損失,同時為今后突發(fā)事件的應(yīng)對工作積累大量經(jīng)驗(yàn),具有重要的參考和借鑒價值。
2.發(fā)揮檔案作用,正確引導(dǎo)社會輿論
面對突發(fā)事件,公眾只有及時獲得了權(quán)威可靠的信息,才能消除不必要的顧慮,更好配合政府的應(yīng)急工作。在社交網(wǎng)絡(luò)平臺快速發(fā)展的今天,信息傳播十分便捷,各種或真或假的消息在網(wǎng)上網(wǎng)下傳播,給突發(fā)事件的應(yīng)對工作帶來許多阻礙。在被繁雜信息轟炸的情況下,公眾需要來自專業(yè)機(jī)構(gòu)、權(quán)威部門的系統(tǒng)完整、真實(shí)可靠的信息,幫助他們科學(xué)正確應(yīng)對突發(fā)事件。譬如,擁有龐大用戶量的社交平臺——新浪微博在新冠肺炎疫情期間建立“抵制疫情謠言,助力科學(xué)防控”的微博辟謠話題,針對在微博上傳播的關(guān)于疫情的虛假信息進(jìn)行澄清并私信推送給每位微博用戶,有利于減輕社會恐慌感。檔案作為人類活動中直接形成的原始記錄,其真實(shí)性、客觀性、原始性等特點(diǎn)符合公眾獲取信息的要求。安全管理檔案,保證檔案的原始性、真實(shí)性是檔案部門的職責(zé)所在。突發(fā)事件檔案數(shù)據(jù)的存在,可以有效實(shí)現(xiàn)突發(fā)事件檔案的提供利用工作,及時向有關(guān)部門提供真實(shí)的檔案資源,阻斷相關(guān)謠言的傳播,起到正確引導(dǎo)社會輿論的效果。
3.構(gòu)建集體記憶,展示集體抗疫精神
檔案本身是不可再生的記憶資源,蘊(yùn)含豐富的社會記憶[8]。突發(fā)公共衛(wèi)生事件檔案資源包括醫(yī)護(hù)人員的請戰(zhàn)書,各地制作的宣傳橫幅、宣傳單,親歷者的日記、回憶錄,公眾在特殊時期的生活影像等等。這些檔案資源全面記錄了各省、市在突發(fā)事件中的應(yīng)對處置工作及公眾的生活狀態(tài),是特殊時期的重要記憶。對國家以及個人而言,突發(fā)事件都是十分重要、不能忘卻的集體記憶。檔案是建構(gòu)集體記憶的不可替代要素,檔案工作是建構(gòu)集體記憶的受控選擇機(jī)制,檔案工作者是建構(gòu)集體記憶的能動主體[9]。此外,在應(yīng)對突發(fā)公共衛(wèi)生事件的過程中,從醫(yī)務(wù)工作者到人民子弟兵,從公安民警到基層干部,從志愿者到快遞人員……他們用行動展現(xiàn)了不怕犧牲、勇于擔(dān)當(dāng)、甘于奉獻(xiàn)的抗疫精神,他們的英雄故事被檔案所記錄。構(gòu)建突發(fā)事件檔案數(shù)據(jù)庫不僅可以極大豐富記憶資源,發(fā)揮檔案在構(gòu)建集體記憶中的重要作用,同時公眾通過對記憶的深化和思考,被抗疫英雄的故事觸動和鼓舞,深刻感受和學(xué)習(xí)他們的抗疫精神,引發(fā)情感認(rèn)同與共鳴,進(jìn)一步增強(qiáng)民族凝聚力。
4.推動檔案開放,滿足公眾信息需求
大數(shù)據(jù)時代,隨著“數(shù)據(jù)開放”、“數(shù)據(jù)共享”成為社會討論熱點(diǎn),公眾的信息需求也發(fā)生了變化。面對突發(fā)事件,公眾不僅想知道應(yīng)對處置狀況、自我保護(hù)知識、國家相關(guān)政策等,還想獲得權(quán)威可靠、詳細(xì)全面、更新及時的數(shù)據(jù)。比如在新冠肺炎疫情期間,公眾最關(guān)注的就是國家衛(wèi)生健康委員會等相關(guān)部門每天公布的肺炎疫情數(shù)據(jù),即各省、市、區(qū)(縣)的確診病例、疑似病例等等。在“開放是原則、不開放是例外”的社會環(huán)境下,圍繞公眾迫切、多元的信息需求,依托信息技術(shù),采用科學(xué)的方法,在保證不危害國家安全、個人隱私等情況下開放突發(fā)事件檔案數(shù)據(jù),使公眾不受限制地獲取、再利用和再開發(fā)檔案數(shù)據(jù),實(shí)現(xiàn)檔案數(shù)據(jù)供給側(cè)與需求側(cè)的直接對接,既能滿足公眾知情權(quán),實(shí)現(xiàn)信息惠民,又能提升政府公信力,消除公眾恐慌,維護(hù)社會穩(wěn)定。同時,公眾也可以根據(jù)自己的專業(yè)知識對開放數(shù)據(jù)進(jìn)行深層次挖掘和利用,獲得的研究成果反過來可以幫助政府解決一些問題,節(jié)省資金和人力資源。當(dāng)前,檔案部門需要及時建設(shè)突發(fā)事件檔案數(shù)據(jù)庫,提高突發(fā)事件應(yīng)對能力,進(jìn)一步推動檔案開放,滿足公眾信息需求,從而提高檔案公共服務(wù)水平。
三、突發(fā)事件檔案數(shù)據(jù)庫的系統(tǒng)框架
當(dāng)前,人們對大數(shù)據(jù)已經(jīng)形成基本共識:大數(shù)據(jù)源于互聯(lián)網(wǎng)及其延伸所帶來的無處不在的信息技術(shù)應(yīng)用以及信息技術(shù)的不斷低成本化,具有海量性、多樣性、時效性及可變性等特征,需要可伸縮的計(jì)算體系結(jié)構(gòu)以支持其存儲、處理和分析[10]。大數(shù)據(jù)時代,突發(fā)事件檔案數(shù)據(jù)價值的實(shí)現(xiàn)不再僅限于數(shù)據(jù)本身,而是擴(kuò)展到數(shù)據(jù)組合;突發(fā)事件檔案的收集從被動的數(shù)據(jù)收集變?yōu)橹鲃拥臄?shù)據(jù)采集;突發(fā)事件檔案的存儲管理從記錄管理變?yōu)楹A繑?shù)據(jù)集合存儲管理;突發(fā)事件檔案的提供利用服務(wù)從被動式滿足用戶查詢需求變?yōu)橹鲃邮椒?wù)提供,服務(wù)內(nèi)容從查詢擴(kuò)展到統(tǒng)計(jì)、建立平臺等多項(xiàng)內(nèi)容。基于大數(shù)據(jù)技術(shù),筆者提出了突發(fā)事件檔案數(shù)據(jù)庫的系統(tǒng)框架,如圖1所示。
1.檔案數(shù)據(jù)采集層
大數(shù)據(jù)背景下,突發(fā)事件檔案數(shù)據(jù)的內(nèi)容逐漸多元化,顆粒度更細(xì),來源渠道呈現(xiàn)出復(fù)合化特點(diǎn)。當(dāng)前,數(shù)據(jù)采集是實(shí)現(xiàn)突發(fā)事件檔案數(shù)據(jù)存儲管理的基礎(chǔ)。數(shù)據(jù)采集又稱數(shù)據(jù)獲取,是指從傳感器和其它待測設(shè)備等模擬和數(shù)字被測單元中自動采集信息的過程。數(shù)據(jù)采集技術(shù)包括數(shù)據(jù)源篩選與高質(zhì)量數(shù)據(jù)采集、多源數(shù)據(jù)的有效識別和數(shù)據(jù)的詳細(xì)解析、數(shù)據(jù)自動清洗與修復(fù)、數(shù)據(jù)演化和對數(shù)據(jù)的溯源管理、數(shù)據(jù)加載技術(shù)、數(shù)據(jù)傳輸技術(shù)等。從技術(shù)層面來看,電子檔案的收集和對紙質(zhì)檔案的數(shù)字化處理是檔案數(shù)據(jù)采集的主要途徑。
突發(fā)事件檔案資源不僅包括現(xiàn)代記錄設(shè)備產(chǎn)生的數(shù)字資源,還有大量的紙質(zhì)文獻(xiàn)資源、實(shí)體資源以及存儲于縮微膠片、磁帶、錄像帶中的資源。前者的原始狀態(tài)為數(shù)字形態(tài),按照一定的標(biāo)準(zhǔn)規(guī)范進(jìn)行數(shù)據(jù)采集即可。對于后者,需要先進(jìn)行資源的數(shù)字化轉(zhuǎn)型。一般而言,資源載體類型不同,數(shù)字化的方式也不一樣。針對紙質(zhì)文獻(xiàn)資源,目前主要使用相應(yīng)的掃描設(shè)備進(jìn)行數(shù)字化,但對于著錄項(xiàng)的標(biāo)注采用的是手工錄入的方式。對于實(shí)體資源可采用拍照、數(shù)字圖像處理等方式進(jìn)行數(shù)字化,譬如,手稿檔案可利用類似于Carbo抓圖處理軟件的手寫信息數(shù)字化采集及識別軟件來進(jìn)行數(shù)字化處理,圖紙檔案可采用圖形處理軟件以及工程制圖軟件(CAD制圖)對圖紙進(jìn)行數(shù)字化處理[12]。存儲于縮微膠片、磁帶、錄像帶中資源的數(shù)字化處理方式主要利用模數(shù)轉(zhuǎn)換器等類似設(shè)備將模擬信號轉(zhuǎn)換為數(shù)字信號。完成突發(fā)事件檔案數(shù)字化工作后,即可按照預(yù)先設(shè)定的策略,選擇數(shù)據(jù)采集工具,開展數(shù)據(jù)采集工作,對數(shù)據(jù)信息展開有目的的收集,整合與突發(fā)事件相關(guān)的數(shù)據(jù),為數(shù)據(jù)分析和應(yīng)用打下基礎(chǔ)。
2.檔案數(shù)據(jù)存儲層
檔案數(shù)據(jù)存儲是實(shí)施突發(fā)事件檔案開發(fā)利用的首要條件。面對海量數(shù)據(jù),突發(fā)事件檔案存儲需要解決容量擴(kuò)充、容災(zāi)備份以及數(shù)據(jù)安全等問題。目前,檔案數(shù)據(jù)存儲可采用Hadoop HDFS實(shí)現(xiàn)。HDFS的設(shè)計(jì)思想是將大文件、大批量文件分布式存放在大量服務(wù)器上,以便于采取分而治之的方式對海量數(shù)據(jù)進(jìn)行運(yùn)算分析。在大數(shù)據(jù)系統(tǒng)中可以為各類分布式運(yùn)算框架提供數(shù)據(jù)存儲服務(wù)。HDFS可提供高吞吐量訪問應(yīng)用程序的數(shù)據(jù),適合突發(fā)事件檔案大數(shù)據(jù)集的應(yīng)用系統(tǒng),支持大文件存儲,同時滿足文本信息以及圖片、視頻等媒體信息的存儲需求[13]。
為了加強(qiáng)對突發(fā)事件檔案數(shù)據(jù)的安全存儲,系統(tǒng)可采用MD5算法以及數(shù)據(jù)湖技術(shù)、數(shù)據(jù)加密技術(shù)等。MD5算法的典型應(yīng)用是對一段信息產(chǎn)生信息摘要,以防止被篡改。采用MD5算法對采集的檔案數(shù)據(jù)進(jìn)行檢測,生成唯一的數(shù)字摘要用于數(shù)據(jù)校驗(yàn),保證存儲的有效數(shù)據(jù)不被篡改。數(shù)據(jù)湖是一種新型的數(shù)據(jù)存儲架構(gòu),通過原生格式對原始數(shù)據(jù)進(jìn)行保存,能涵蓋各類結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù),在數(shù)據(jù)需要被使用的情況下可對數(shù)據(jù)進(jìn)行處理[14]。數(shù)據(jù)加密技術(shù)可以將存儲在數(shù)據(jù)庫內(nèi)的數(shù)據(jù)設(shè)立特定存儲空間,通過安全套接層協(xié)議層將數(shù)據(jù)加密處理,保護(hù)數(shù)據(jù)庫與其中的應(yīng)用程序,既能實(shí)現(xiàn)突發(fā)事件檔案數(shù)據(jù)的高效流通和移動,又能夠保護(hù)所有隱私數(shù)據(jù),為數(shù)據(jù)下載和上傳帶來防護(hù)功能,避免數(shù)據(jù)受到網(wǎng)絡(luò)攻擊[15]。
3.檔案數(shù)據(jù)應(yīng)用層
突發(fā)事件檔案數(shù)據(jù)庫系統(tǒng)建立的目的就是檢索利用檔案數(shù)據(jù)。數(shù)據(jù)應(yīng)用層包括數(shù)據(jù)挖掘、數(shù)據(jù)分析、數(shù)據(jù)可視化。數(shù)據(jù)挖掘技術(shù)可以從檔案專題數(shù)據(jù)庫中快速找到有用或者有價值的信息,在數(shù)據(jù)進(jìn)行模糊表達(dá)或者數(shù)據(jù)呈現(xiàn)的含義不清時,還可以對數(shù)據(jù)進(jìn)行深層次的剖析,以便完全掌握數(shù)據(jù)想要表達(dá)的內(nèi)容。通俗的來講數(shù)據(jù)挖掘就是從數(shù)據(jù)中發(fā)現(xiàn)知識,將非凡的、隱含地、事先未知的、具有潛在用途的人們感興趣的模式或者知識從大規(guī)模的海量數(shù)據(jù)中抽取出來[16]。突發(fā)事件檔案資源具有內(nèi)容復(fù)雜、類型多樣的特點(diǎn),正好符合數(shù)據(jù)挖掘技術(shù)的應(yīng)用條件。
數(shù)據(jù)分析是整個數(shù)據(jù)流程最為核心的部分。“相關(guān)性”分析是大數(shù)據(jù)技術(shù)重要的思維模式,通過對數(shù)據(jù)彼此關(guān)聯(lián)性的分析,能夠更清楚地看到隱藏在背后的看似不相關(guān)的數(shù)據(jù)之間彼此的密切聯(lián)系,使檔案數(shù)據(jù)挖掘從常規(guī)分析向廣度、深度分析轉(zhuǎn)變[17]。同時,用戶在突發(fā)事件檔案數(shù)據(jù)庫系統(tǒng)查詢檢索所需檔案時,利用“相關(guān)性”分析對檔案檢索情況、檢索記錄等進(jìn)行分析,為檔案部門提供科學(xué)、合理的分析報(bào)告和預(yù)測報(bào)告,可以為改進(jìn)數(shù)據(jù)庫系統(tǒng)的管理方法以及提高服務(wù)水平,提供前提條件和決策依據(jù)。
突發(fā)事件檔案數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)呈現(xiàn)形式較為豐富多樣,其中很多是可視化數(shù)據(jù),比如視頻、圖片等等。因此在提供數(shù)據(jù)檢索服務(wù)時,可以使用數(shù)據(jù)可視化工具,如WIDAS工具、Echarts2.0等,將檢索結(jié)果通過可視化的形式展現(xiàn)出來,給用戶提供更加全面、直觀的檢索結(jié)果,提高用戶體驗(yàn)感。此外,在運(yùn)用大數(shù)據(jù)進(jìn)行數(shù)據(jù)檢索過程中,數(shù)據(jù)庫系統(tǒng)會自動對用戶的檢索行為進(jìn)行追蹤記錄,其中必然會涉及一些用戶的個人信息。因此就必須運(yùn)用隱私保護(hù)技術(shù),對一些數(shù)據(jù)進(jìn)行篩選和處理,避免在檢索結(jié)果中出現(xiàn)涉及用戶隱私的信息。
參考文獻(xiàn):
[1] 中華人民共和國國務(wù)院.突發(fā)公共衛(wèi)生事件應(yīng)急條例[EB/OL].(2003-03-38)[2020-02-25].http://www.gov.cn/zhengce/content/2008-03/28/content_6399.htm.
[2] 蔡盈芳. 關(guān)于建立國家突發(fā)事件檔案專題數(shù)據(jù)庫的設(shè)想[N]. 中國檔案報(bào),2020-02-20(003).
[3] 曹燕紅.突發(fā)事件檔案的收集與管理——以新型冠狀病毒肺炎突發(fā)事件檔案為例[J].黑龍江檔案,2020(04):32-33.
[4] 趙鑫強(qiáng),方路.新型冠狀病毒疫情檔案專題數(shù)據(jù)庫建設(shè)初探[J].檔案管理,2020(05):56-57.
[5] 黃新榮,楊藝璇.從抗擊新冠病毒肺炎疫情檔案的收集看專題檔案的建設(shè)——基于國內(nèi)31個省級檔案館的網(wǎng)絡(luò)調(diào)研[J].檔案與建設(shè),2020(06):4-9.
[6] 錢毅.檔案數(shù)據(jù)庫的規(guī)范和質(zhì)量控制[J].檔案學(xué)通訊,2007(05):53-56.
[7] 周峰.建立檔案應(yīng)急服務(wù)機(jī)制? 支撐突發(fā)事件應(yīng)對處置[N].中國檔案報(bào),2020-03-16(003).
[8] 丁華東,張燕.論新媒體傳播與檔案記憶的意義再生產(chǎn)[J].檔案學(xué)通訊,2018(03):62-67.
[9] 徐擁軍.在戰(zhàn)“疫”中做一名有溫度的檔案工作者[N].中國檔案報(bào),2020-02-13(003).
[10] 梅宏.大數(shù)據(jù)發(fā)展現(xiàn)狀與未來趨勢[J].交通運(yùn)輸研究,2019(05):1-11.
[11][15] 王維,靳瑞霞,朱云峰.教育大數(shù)據(jù)開放和共享安全戰(zhàn)略研究[J].軟件,2020,41(01):121-124.
[12] 龐莉.手稿與圖紙檔案數(shù)字化過程比較研究[J].檔案與建設(shè),2018(01):26-29+51.
[13] 楊菲菲.基于Hadoop的面向信管專業(yè)的數(shù)據(jù)分析與數(shù)據(jù)挖掘課程群的構(gòu)建研究[J].電腦知識與技術(shù),2018,14(28):95-97.
[14] 曾中原.新時期工程建設(shè)項(xiàng)目檔案數(shù)據(jù)采集與存儲對策研究[J].城建檔案,2019(06):88-89.
[16] 姚娜.大數(shù)據(jù)時代的數(shù)據(jù)挖掘技術(shù)與應(yīng)用分析[J].電腦編程技巧與維護(hù),2019(12):127-128+152.
[17] 張文元,張倩.大數(shù)據(jù)技術(shù)與檔案數(shù)據(jù)挖掘[J].檔案管理,2016(02):33-35.
作者單位:河北大學(xué)管理學(xué)院