曾裕涵 楊立敏 劉小西
摘? 要: 從湖南涉外經(jīng)濟學院檔案管理實際出發(fā),采用B/S架構(gòu),使用Hadoop分布式技術(shù)以及web service技術(shù),結(jié)合Sql Server數(shù)據(jù)庫,設(shè)計并實現(xiàn)了數(shù)字檔案信息管理系統(tǒng),實現(xiàn)了學生信息采集、管理、電子檔案管理等功能,保證了數(shù)據(jù)的高效存取,大大提高了檔案管理的效率。
關(guān)鍵詞: 檔案管理; 信息系統(tǒng); B/S架構(gòu); Hadoop分布式技術(shù)
中圖分類號:TP392? ? ? ? ? 文獻標識碼:A? ? ?文章編號:1006-8228(2020)04-58-03
Design of digital archives information management system using distributed technology
Zeng Yuhan1, Yang Limin2, Liu Xiaoxi1
(1. Hunan International Economics University, Changsha, Hunan 410205, China; 2. Hunan Vocational College of Foreign Languages)
Abstract: Based on the reality of the archives management of Hunan International Economics University, using B/S architecture, Hadoop distributed technology and Web service technology, combined with SQL Server database, a digital archives information management system is designed and implemented, which realizes the functions such as student information collection and management, electronic archives management etc., to ensure the effectiveness of data access, and greatly improve the efficiency of archives management.
Key words: archives management; information system; B/S architecture; Hadoop distributed technology
0 引言
高校數(shù)字檔案信息資源建設(shè),對于高校檔案信息資源的利用、開發(fā)具有重要意義[1-2]。湖南涉外經(jīng)濟學院作為全國最早的民辦本科院校之一,現(xiàn)有全日制本/??茖W生29000余人,累計為社會培養(yǎng)應(yīng)用型人才10萬余人,檔案管理任務(wù)繁重,如何結(jié)合學校實際提高檔案管理信息化水平十分重要。論文采用采用B/S架構(gòu),使用Hadoop分布式技術(shù)以及Web service技術(shù)以及Sql Server數(shù)據(jù)庫,設(shè)計并實現(xiàn)了數(shù)字檔案信息管理系統(tǒng),對提高學校檔案管理效率具有重要的現(xiàn)實意義[3-5]。
1 需求分析
以現(xiàn)代信息技術(shù)為基礎(chǔ),通過利用數(shù)字化手段,將紙質(zhì)檔案數(shù)字化,同時將電子檔案歸檔,管理數(shù)字檔案信息資源,并結(jié)合高速帶寬網(wǎng)絡(luò)等設(shè)施,實現(xiàn)信息的連接和利用,設(shè)計資源共享的分布式、規(guī)模相對較大的數(shù)字檔案管理信息系統(tǒng)。紙質(zhì)檔案工作流程主要包括檔案收集、分類、交接、拆分、掃描、圖像處理、質(zhì)量檢測和案卷整理等流程,電子檔案工作流程主要包括檔案捕獲、遷移、歸檔、鑒定和索引著錄等流程。系統(tǒng)用戶大致可劃分為檔案管理員、系統(tǒng)管理員和普通用戶三種。
2 數(shù)字檔案信息系統(tǒng)設(shè)計
2.1 系統(tǒng)體系架構(gòu)設(shè)計
該系統(tǒng)體系結(jié)構(gòu)圖如圖1所示。系統(tǒng)主要包括檔案采集、檔案管理、檔案利用和系統(tǒng)管理四個部分。
檔案采集主要是在本系統(tǒng)中實現(xiàn)對不同渠道文件的導入,并自動對上述文件進行編目操作。結(jié)合數(shù)據(jù)接口,按照相應(yīng)的采集流程,采用數(shù)據(jù)交換平臺,實現(xiàn)OA等信息系統(tǒng)文件向統(tǒng)一格式轉(zhuǎn)換,并最終導入到系統(tǒng)內(nèi)。當對統(tǒng)一格式檔案進行獲取以后,需要自動對檔案進行編目,在完成編目操作以后,最終在數(shù)據(jù)庫內(nèi)存放。
檔案管理對實現(xiàn)檔案統(tǒng)計、銷毀及鑒定。其中,統(tǒng)計是統(tǒng)計檔案以及分析和整理數(shù)據(jù);鑒定則是結(jié)合相應(yīng)規(guī)范,針對檔案開展歸檔、技術(shù)、內(nèi)容鑒定等相關(guān)操作;檔案銷毀,則是結(jié)合相關(guān)規(guī)定,銷毀已超過期限、或者是無效的檔案。
檔案利用主要包括檔案的檢索以及借閱管理。檢索是能夠讓不同系統(tǒng)均可便捷的對檔案信息進行提取并可結(jié)合相應(yīng)要求展現(xiàn)。借閱管理具體包括借閱檔案、催還等功能;
系統(tǒng)管理主要是對系統(tǒng)相關(guān)的權(quán)限、角色等進行增加、刪除、查看和修改等功能。
2.2 總體功能結(jié)構(gòu)設(shè)計
圖2是系統(tǒng)功能結(jié)構(gòu)圖,總體功能主要包括后端檔案業(yè)務(wù)管理和前端信息服務(wù)網(wǎng)站兩個部分。檔案業(yè)務(wù)管理部分主要涵蓋檔案采集、檔案管理以及系統(tǒng)管理三個部分,主要涉及到一些基礎(chǔ)數(shù)據(jù)的維護以及系統(tǒng)維護等內(nèi)容。信息服務(wù)網(wǎng)站主要涉及到檔案利用方面的內(nèi)容。圖3是系統(tǒng)存儲功能結(jié)構(gòu)圖。高校檔案數(shù)字化管理信息系統(tǒng)對數(shù)據(jù)的存儲運用的體系結(jié)構(gòu)為目錄—文件,采取目錄數(shù)據(jù)的形式,對檔案屬性信息進行存儲,而與之對應(yīng)的原文件,則在相應(yīng)的服務(wù)器內(nèi)存儲。二者一一對應(yīng)。結(jié)合如上的存儲體系結(jié)構(gòu),各類型的信息,可在相應(yīng)的存儲位置中存放。結(jié)合這一方式,看實現(xiàn)對日漸增長的檔案信息的擴充要求的滿足。
圖4是檔案管理系統(tǒng)數(shù)據(jù)E-R模型,在開發(fā)過程中,對檔案信息表、用戶信息表、檔案管理制度信息表等在內(nèi)的多種表進行了設(shè)計。數(shù)據(jù)庫邏輯設(shè)計選用的邏輯結(jié)構(gòu),和DBMS產(chǎn)品支持的模型相符,以此實現(xiàn)對數(shù)據(jù)冗余的去除、數(shù)據(jù)需求等,以便于實現(xiàn)高效、便捷的存取。結(jié)合需求分析,系統(tǒng)中涉及的數(shù)據(jù)庫表包括如下,用于在線借閱、查詢檔案、存儲數(shù)字檔案光盤的查詢、歸檔上架等諸多功能。實體表包括角色表、用戶查看檔案權(quán)限表、用戶表、角色—用戶關(guān)系表、日志表、檔案分類表、文件信息表、檔案狀態(tài)表、館藏地表、檔案信息表、借閱信息表、檔案銷毀表、借閱狀態(tài)表和檔案鑒定表。
3 系統(tǒng)測試
圖5是所設(shè)計的數(shù)字檔案管理信息系統(tǒng)學生信息查詢界面圖,我們對所設(shè)計的數(shù)字檔案管理系統(tǒng)進行了功能測試和性能測試。功能測試主要是測試系統(tǒng)前臺頁面的數(shù)據(jù)展示,以及后臺文件管理模塊、檔案管理模塊、查詢統(tǒng)計模塊和系統(tǒng)圖管理模塊的核心功能是否實現(xiàn)。性能測試主要測試系統(tǒng)并發(fā)用戶數(shù)量較大對系統(tǒng)CPU占用率、響應(yīng)時間等性能指標的壓力測試。對50名用戶的并發(fā)操作進行模擬,最終通過的項目達到1萬多,僅有1項事務(wù)失敗,響應(yīng)的平均時間為3秒,最長的為9秒,CPU的使用率達到16%;在對100名用戶的并發(fā)操作進行模擬時,通過的事項達到1.2萬多項,僅有4項失敗;響應(yīng)的平均時間是7秒,最長需要14秒,CPU使用率達到68%。結(jié)合性能測試結(jié)果,系統(tǒng)具有較好的事務(wù)成功執(zhí)行率,響應(yīng)時間約為5秒到10秒,最大響應(yīng)時間超過20秒,CPU可正常運行,達到了預(yù)期。
4 結(jié)論
本文對高校數(shù)字檔案管理體系結(jié)構(gòu)進行了深入研究,采用B/S架構(gòu),使用Hadoop分布式技術(shù)以及Web service技術(shù)以及Sql Server數(shù)據(jù)庫技術(shù),設(shè)計并實現(xiàn)了數(shù)字檔案信息管理系統(tǒng),并通過了功能測試和性能測試。本文僅以分布式架構(gòu)為基礎(chǔ)提出了信息交互協(xié)議,若能將區(qū)塊鏈技術(shù)等新技術(shù)應(yīng)用到數(shù)字檔案管理系統(tǒng)中來,實現(xiàn)真正的分布式信息交互,必將極大地推動高校檔案數(shù)字化工作的發(fā)展。
參考文獻(References):
[1] 張慎武,高艷霞,王玉霞.電子公文檔案管理系統(tǒng)方案設(shè)計[J].蘭臺世界,2013.20:48-59
[2] 劉英俊.我國數(shù)字檔案室建設(shè)研究[D]安徽大學,2017.
[3] 譚培勇,王晶,史蓓蕾,郭晶晶.基于.NET平臺的通信器材檔案管理系統(tǒng)的設(shè)計與實現(xiàn)[J].計算機與數(shù)字工程,2012.12:42-57
[4] 陳卸女,屠友軍.基于ASP.NET平臺的新警檔案管理系統(tǒng)的設(shè)計[J].計算機光盤軟件與應(yīng)用,2012.20:43-56
[5] 何蒲,于戈,張巖峰等.區(qū)塊鏈技術(shù)與應(yīng)用前瞻綜述[J].計算機科學,2017.44(4):1-7