国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)視角下高校檔案全生命周期管理

2021-12-28 12:33徐欽梅
蘭臺世界 2021年7期
關鍵詞:生命周期數(shù)字化檔案管理

徐欽梅

信息技術的發(fā)展日新月異,給我們帶來了處理信息的新視角和新工具。方興未艾的大數(shù)據(jù)研究給各行各業(yè)的管理帶來了歷史性的變革,高校檔案管理工作隨之發(fā)展。作為一類特殊而有價值的檔案資源,從大數(shù)據(jù)的視角如何優(yōu)化管理,成為當下高校檔案管理研究的熱門課題。筆者主要從大數(shù)據(jù)視角看待高校檔案全生命周期管理,探討大數(shù)據(jù)對高校檔案管理的啟示和要求,通過大數(shù)據(jù)賦予檔案全生命周期管理理論新的內(nèi)涵。

一、大數(shù)據(jù)的內(nèi)涵

大數(shù)據(jù)一般是指“無法用傳統(tǒng)計算工具或手段處理的數(shù)據(jù)”,最早在航天或者氣象等自然科學領域,由于數(shù)據(jù)不斷大量地產(chǎn)生,且數(shù)據(jù)之間存在著弱關聯(lián)性,需要對一整個集群進行分析。后來有人總結(jié)了大數(shù)據(jù)的4V特性,即:“大量化”(Volume)、“快速化”(Velocity)、“多樣化”(Variety)以及“價值化”(Value)。從時代的發(fā)展來看,大數(shù)據(jù)標志著人類處理數(shù)據(jù)能力的又一次提升,我們發(fā)展了新的數(shù)據(jù)收集、分析和預測工具,包括云計算、人工智能等。大數(shù)據(jù)時代提出的“不是隨機樣本,而盡量是全體數(shù)據(jù)”“不是精確性,而是混雜性”“不是因果關系,而是相關關系”等觀念,既是源于數(shù)據(jù)處理技術發(fā)生了翻天覆地的變化,也是一種看待事物的新視角。

二、大數(shù)據(jù)視角對高校檔案管理的啟示

從大數(shù)據(jù)視角思考高校檔案管理,不難得出以下的啟示。

1.高校檔案確實具有大數(shù)據(jù)的特性。和各行各業(yè)的數(shù)據(jù)增長一樣,高校檔案數(shù)據(jù)也面臨著指數(shù)級別的增長。這主要得益于兩個方面:一是原生電子檔案的快速產(chǎn)生。伴隨著高校管理活動的開展,每天都在產(chǎn)生著大量有價值的檔案信息,例如教學活動中產(chǎn)生的課程教案、科學研究中產(chǎn)生的實驗數(shù)據(jù)、黨政管理中產(chǎn)生的電子公文等。二是傳統(tǒng)載體檔案數(shù)字化的積極推進。技術的進步使高校傳統(tǒng)載體檔案的數(shù)字化成為可能,為了更高效地利用檔案提供服務,高校檔案數(shù)字化工作正在各地如火如荼地進行著。以上海交通大學為例,截至2010年10月15日,上海交通大學檔案館館藏檔案已數(shù)字化3667407頁,數(shù)字化信息資源約為2PB[1]39-40,且還在持續(xù)增長。由此可見,高校檔案資源正邁向大數(shù)據(jù)行列。

2.大數(shù)據(jù)要求更關注高校檔案信息的數(shù)據(jù)化。檔案信息的載體從古至今不斷發(fā)展變化,紙張是被使用最久的檔案信息載體。過去,檔案信息隱藏于字里行間,需要人工去識別。前面提到,不少高校已經(jīng)開展了檔案數(shù)字化工作,但數(shù)字化工作往往只是通過掃描的形式把一些非數(shù)字化信息變成“0”和“1”的數(shù)字化形式以便于計算機閱讀,掃描的數(shù)字化的內(nèi)容還大多是以圖像的形式儲存,不能通過檢索詞進行檢索,也就是數(shù)字文本沒有數(shù)據(jù)化。顯然,只有對檔案信息進行數(shù)據(jù)化后,才談得上對檔案大數(shù)據(jù)的深度分析和整合,才能提供智能化的預測等[2]4-7。因此,大數(shù)據(jù)要求在原有檔案數(shù)字化的基礎上,進一步進行檔案信息的數(shù)據(jù)化工作。

3.大數(shù)據(jù)意味著檔案數(shù)據(jù)收集觀念的改變。過去,高校檔案數(shù)據(jù)的收集往往局限于歸檔范圍,不關注新的檔案形式。而在大數(shù)據(jù)時代,要求“不是隨機樣本,而盡量是全體數(shù)據(jù)”。全數(shù)據(jù)的好處在于:它可以覆蓋整個數(shù)據(jù)集的細節(jié),讓我們從不同的角度,更細致地觀察和研究數(shù)據(jù)的各個方面,從而收獲意想不到的觀點,并且沒有偏見。而刻意篩選,往往讓我們忽略了現(xiàn)象的細節(jié)[3]41。因此,高校檔案與大數(shù)據(jù)的結(jié)合意味未來高校檔案數(shù)據(jù)的收集范圍將大大拓展,更加多元化,更具實時性,包括高校網(wǎng)頁、論壇和新媒體上的各類數(shù)據(jù)也將被列入檔案收集管理的范圍。

三、大數(shù)據(jù)視角下高校檔案全生命周期管理新內(nèi)涵

最早,由美國檔案學者菲利普·布魯克斯等在20世紀文件數(shù)量急劇增長的背景下提出“文件生命周期”的概念,后來,我國檔案學界又提出了“檔案生命周期”的概念,其實這是同一事物在不同發(fā)展階段呈現(xiàn)的不同形態(tài)而已。以歸檔為界,歸檔前為文件,歸檔后為檔案,文件不一定都能歸檔。在大數(shù)據(jù)時代,更應該泛化文件和檔案的概念,因為它們的本質(zhì)都是數(shù)據(jù),應該統(tǒng)一用大數(shù)據(jù)的視角進行分析和處理。

文件生命周期理論(實際上文件生命周期理論的內(nèi)涵已經(jīng)包括檔案)指出,文件的運動具有階段性,文件的運動可以分為現(xiàn)行、半現(xiàn)行和非現(xiàn)行三個階段?,F(xiàn)行階段便是文件的實施階段,文件的信息主要為形成單位服務。半現(xiàn)行階段意味著文件的實際效用已經(jīng)消失,對原有單位的服務功能逐漸減弱。文件運動的非現(xiàn)行階段是檔案階段,文件已經(jīng)轉(zhuǎn)化為檔案,并存放在檔案室(館)以供社會利用。而本文討論的生命周期理論就是研究文件或檔案生成、運動、變化的過程及規(guī)律的理論。

生命周期理論最早關注的是不同階段文件或檔案價值變化的規(guī)律,進而指導文檔管理工作。然而,該理論在大數(shù)據(jù)時代亟待改革。因為,在大數(shù)據(jù)時代,由于新的數(shù)據(jù)處理、分析工具的出現(xiàn),使文件或檔案的價值在各個階段都能有所體現(xiàn)。因此,過去通過人為手段篩選、鑒定檔案價值的行為,應當有所弱化。另外,即使是歷史的數(shù)據(jù),也不代表沒有現(xiàn)行的用處,因為大數(shù)據(jù)分析對未來的預測恰恰是建立在大量歷史數(shù)據(jù)的基礎上的。誰也不能保證當前看起來沒有價值的歷史數(shù)據(jù)將來不會發(fā)揮其價值。加上數(shù)據(jù)存儲和處理的成本日益降低,使得大量歷史數(shù)據(jù)的存放也成為可能。因此,應重新認識高校檔案全生命周期管理的內(nèi)涵。大數(shù)據(jù)視角下高校檔案生命周期管理的新內(nèi)涵應包括以下要點。

1.按“全數(shù)據(jù)”的要求對文件和檔案進行統(tǒng)一管理。過去檔案管理流行“前端控制”理論,即在文件形成階段對其積極介入管理,現(xiàn)在講要在各信息系統(tǒng)中注重元數(shù)據(jù)的采集,其實都是一種“全數(shù)據(jù)”的觀點。即盡可能全面地收集數(shù)據(jù),避免之后由于缺乏相關數(shù)據(jù)而難以管理利用檔案。信息系統(tǒng)中對文件的相應處理都應留下相應的數(shù)據(jù),并積極將文件或檔案中的各類信息轉(zhuǎn)化為可用的數(shù)據(jù),以適應大數(shù)據(jù)時代關注檔案信息數(shù)據(jù)化的要求。

同時,要弱化文件與檔案的區(qū)別,無論是文件還是檔案,對于大數(shù)據(jù)分析、預測都是必需的。傳統(tǒng)的歸檔過程是一個篩選、鑒定的過程,會過濾掉很多未來分析預測所需要的細節(jié)。因此,在可能的情況下,要盡量“全”地將文件歸檔,泛化檔案的概念,并將歸檔作為文件集中的一個手段,為大數(shù)據(jù)分析利用提供便利。

綜上,不論在文件的哪個階段,都應以“全數(shù)據(jù)”的要求統(tǒng)一對文件和檔案進行管理。

2.以數(shù)據(jù)生命周期管理統(tǒng)一文件生命周期和檔案生命周期。數(shù)據(jù)生命周期管理是一種基于不同階段、不同數(shù)據(jù)特性實施的管理模型,以獲取數(shù)據(jù)使用的最大價值,并有效地降低數(shù)據(jù)管理成本。它能對數(shù)據(jù)進行主動管理。數(shù)據(jù)生命周期理論認為,數(shù)據(jù)具有使用的生命周期。隨著時間的推移,它遵循的一個客觀規(guī)律是:數(shù)據(jù)訪問的頻率隨積累的數(shù)據(jù)量而發(fā)生變化。因此,我們需要根據(jù)數(shù)據(jù)的訪問頻率來評估數(shù)據(jù)的價值,并采用低成本的數(shù)據(jù)保存方法對很多低價值的信息進行處理,使數(shù)據(jù)的價值大致與存儲和管理成本相匹配,從而盡可能降低整體的數(shù)據(jù)管理和存儲成本[4]71-75。因此,用數(shù)據(jù)生命周期管理代替?zhèn)鹘y(tǒng)文件與檔案分界的生命周期劃分管理法,不刻意區(qū)分是文件或是檔案,僅僅根據(jù)實際使用頻率來進行區(qū)別管理。對于訪問量或使用頻率較低的數(shù)據(jù),類似計算機將不經(jīng)常訪問的數(shù)據(jù)放在效率較低的存儲器上的策略一樣,可以逐步將其轉(zhuǎn)移至效率較低的存儲介質(zhì)和處理工具上;對于訪問量或使用頻率較高的數(shù)據(jù),通過大數(shù)據(jù)工具進行預判,自動將其轉(zhuǎn)移至效率較高的存儲介質(zhì)和處理工具上。這無疑是一種符合實際需要又能大幅度節(jié)省成本的作法。當然,理論上,應該給每個數(shù)據(jù)平等的存儲空間和處理能力,才符合大數(shù)據(jù)的精神。但實際上,由于數(shù)據(jù)量的增大仍遠遠高于存儲空間和處理能力等的提升,因此仍然需要考慮在盡可能“全”地保存文件和檔案數(shù)據(jù)的情況下為不同數(shù)據(jù)分配不同級別的資源。

3.強化在前端進行數(shù)據(jù)的收集,為大數(shù)據(jù)分析提供充分的素材。數(shù)據(jù)在生成階段是最活躍的,此時收集的成本要比后來收集的成本低。舉例來說,高校的電子文件原文,如果等到歸檔后再進行紙質(zhì)的數(shù)字化工作,既耗費成本,實際效果也不一定好。因此,在數(shù)據(jù)的生成階段,就要充分考慮將來的應用場景,制定相對統(tǒng)一、規(guī)范的元數(shù)據(jù)采集標準,并盡量通過系統(tǒng)自動捕獲元數(shù)據(jù)。同時,對文檔使用和管理人員進行培訓,使其真正將數(shù)據(jù)管理的標準落實。元數(shù)據(jù)的標準應充分考慮數(shù)據(jù)的應用需求,而不能僅僅只考慮檔案部門的歸檔要求,歸檔要求僅僅是數(shù)據(jù)應用需求中的一部分而已,還需要了解數(shù)據(jù)的行業(yè)特性和應用場景等,這樣制定出的元數(shù)據(jù)標準才更有可操作性,而且更有利于數(shù)據(jù)充分發(fā)揮價值。

大數(shù)據(jù)既是高校檔案管理工作的機遇和挑戰(zhàn),又是不可逆轉(zhuǎn)的時代潮流。積極關注高校檔案與大數(shù)據(jù)的結(jié)合,通過大數(shù)據(jù)視角重新理解并實踐檔案全生命周期管理,按“全數(shù)據(jù)”的要求對文件和檔案進行統(tǒng)一管理,以數(shù)據(jù)生命周期管理統(tǒng)一文件生命周期和檔案生命周期,并強化在前端進行數(shù)據(jù)的收集,這將是高校檔案管理工作積極探索實踐,發(fā)揮自身最大價值的必由之路。

猜你喜歡
生命周期數(shù)字化檔案管理
全生命周期下呼吸機質(zhì)量控制
關于企業(yè)檔案管理體制改革的探討
事業(yè)單位檔案管理的難點及對策實踐
家紡業(yè)亟待數(shù)字化賦能
論經(jīng)濟學數(shù)字化的必要性
從生命周期視角看并購保險
高中數(shù)學“一對一”數(shù)字化學習實踐探索
民用飛機全生命周期KPI的研究與應用
高中數(shù)學“一對一”數(shù)字化學習實踐探索
企業(yè)生命周期及其管理
梁平县| 平阴县| 东辽县| 会泽县| 汶川县| 蒙山县| 枝江市| 龙游县| 灵寿县| 马山县| 塔河县| 大新县| 普兰店市| 永福县| 博客| 旌德县| 襄城县| 田阳县| 潞西市| 白水县| 平谷区| 柏乡县| 太谷县| 淳安县| 土默特右旗| 定南县| 定远县| 保德县| 定兴县| 岳池县| 北安市| 井研县| 福建省| 洛扎县| 松阳县| 旬阳县| 洪江市| 海淀区| 收藏| 左云县| 天祝|