程東生++俞雯靜++黃偉
摘要:近幾年來,隨著電力企業(yè)的快速發(fā)展,電子文件數(shù)量急劇增長,價(jià)值不斷顯現(xiàn),對其實(shí)行有效管理的要求日益迫切。本文結(jié)合電力企業(yè)的業(yè)務(wù)特性,從統(tǒng)一的集成服務(wù)、大數(shù)據(jù)大并發(fā)支撐改造、業(yè)務(wù)功能完善三個(gè)方面介紹了電子文件數(shù)字管理系統(tǒng)在電力企業(yè)中的應(yīng)用完善,對電子文件系統(tǒng)在電力企業(yè)應(yīng)用中的提升及在其他行業(yè)的推廣應(yīng)用具有重要指導(dǎo)意義。
關(guān)鍵詞:電子文件 電力企業(yè) 數(shù)字管理系統(tǒng) 深化應(yīng)用
中圖分類號:TP3 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2016)12-0122-02
Abstract:This paper, combined with the business characteristics of electric power enterprises, introduced the application and improvement of electronic file system in electric power enterprise from three aspects of the unified integrated services, big data and concurrency ,and business perfect function improvement,has important guiding significance to promote the application in the electric power enterprise in electronic file system and Application in other industries.
Key Words: Digital records;Electric power enterprise;Information systems; Deep application
引言
電子文件是信息時(shí)代公司各項(xiàng)生產(chǎn)經(jīng)營管理活動的重要記錄,是核心的信息資源[1][2],電力企業(yè)電子文件管理系統(tǒng)研發(fā)與應(yīng)用具有重大意義。
本文結(jié)合電力企業(yè)的業(yè)務(wù)特性,從統(tǒng)一的集成服務(wù)、大數(shù)據(jù)大并發(fā)支撐改造、業(yè)務(wù)功能完善三個(gè)方面介紹了電子文件系統(tǒng)在電力企業(yè)中的應(yīng)用完善,有助于指導(dǎo)電子文件系統(tǒng)在電力企業(yè)應(yīng)用中的提升,以及在其他行業(yè)的推廣應(yīng)用。
1 統(tǒng)一的集成服務(wù)
電力企業(yè)電子文件系統(tǒng)的統(tǒng)一集成服務(wù)包括數(shù)據(jù)抓取、結(jié)構(gòu)化轉(zhuǎn)非結(jié)構(gòu)化、緩沖池、數(shù)據(jù)封裝、容錯(cuò)機(jī)制等幾個(gè)方面。
1.1 數(shù)據(jù)抓取服務(wù)
數(shù)據(jù)抓取服務(wù)是平臺需提供捕獲面向公司各類基于不同技術(shù)開發(fā)平臺所開發(fā)的業(yè)務(wù)應(yīng)用系統(tǒng)所管理的電子文件服務(wù)。主要包括,捕獲基于ERP(如SAP成熟套裝軟件)、Ariba(如電子商務(wù)系統(tǒng))、SoTower(如綜合管理系統(tǒng))、PI3000(如生產(chǎn)管理系統(tǒng))、Java App(如能效管理平臺等)開發(fā)的業(yè)務(wù)應(yīng)用系統(tǒng)所管理的電子文件,文件捕獲服務(wù)為電子文件管理提供數(shù)據(jù)源,電子文件管理系統(tǒng)可以針對各業(yè)務(wù)系統(tǒng)定義捕獲規(guī)則,自動抓取對應(yīng)的數(shù)據(jù)信息。
1.2 結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)非結(jié)構(gòu)化數(shù)據(jù)
結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)非結(jié)構(gòu)化數(shù)據(jù)在各業(yè)務(wù)系統(tǒng)中實(shí)現(xiàn)的方式差異性可能比較大,但整個(gè)結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換處理的過程基本相同,只是采用的具體實(shí)現(xiàn)技術(shù)有所差異。如圖1所示。
1.3 緩沖池
緩沖池主要是用來存儲待推送或推送失敗的電子文件的相關(guān)信息,包括:電子文件元數(shù)據(jù)經(jīng)封裝后形成的XML文件;文檔內(nèi)容為結(jié)構(gòu)化數(shù)據(jù),經(jīng)封裝后形成的XML文件;非結(jié)構(gòu)化格式的電子文件文檔;電子文件及文檔的描述信息。
為適應(yīng)電子文件數(shù)據(jù)信息緩存的要求,緩沖池采用“數(shù)據(jù)庫+文件目錄”的方式來實(shí)現(xiàn)。數(shù)據(jù)庫存儲電子文件及文檔的描述信息,文件目錄存儲封裝后形成的XML文件和非結(jié)構(gòu)化格式的電子文檔。
1.4 數(shù)據(jù)封裝
將轉(zhuǎn)換好的非結(jié)構(gòu)化文件和元數(shù)據(jù)信息一起進(jìn)行封裝,并傳入電子文件管理系統(tǒng)。
數(shù)據(jù)封裝對于元數(shù)據(jù)信息,基于W3C標(biāo)準(zhǔn),采用dom4j技術(shù)實(shí)現(xiàn)將抽取到的元數(shù)據(jù)信息封裝為XML文件;同時(shí)將非結(jié)構(gòu)化文件的描述信息(唯一ID、大小、版本等)寫入XML信息;將XML和非結(jié)構(gòu)化文件一起封裝為信息包。
1.5 容錯(cuò)機(jī)制
日志處理:各業(yè)務(wù)系統(tǒng)需要建立完整的日志機(jī)制,對業(yè)務(wù)過程中的各種操作信息進(jìn)行詳細(xì)記錄。需要記錄的日志至少包括:數(shù)據(jù)抓取日志、結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)非結(jié)構(gòu)化數(shù)據(jù)日志、電子文件推送日志、已推送成功和失敗的電子文件日志等。日志記錄的信息需要包括操作的詳細(xì)信息、操作時(shí)間等,日志信息的維護(hù)由各業(yè)務(wù)系統(tǒng)自行決定。
錯(cuò)誤處理:各業(yè)務(wù)系統(tǒng)需要建立完整的錯(cuò)誤處理機(jī)制,對各業(yè)務(wù)過程中產(chǎn)生的錯(cuò)誤進(jìn)行處理,如結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)非結(jié)構(gòu)化數(shù)據(jù)出錯(cuò)、電子文件推送失敗錯(cuò)誤等。錯(cuò)誤處理方式主要有兩種:(1)不需要人工干預(yù)的錯(cuò)誤處理;(2)需要人工干預(yù)的錯(cuò)誤處理。
對于不是因數(shù)據(jù)的問題而產(chǎn)生的錯(cuò)誤,需要能夠調(diào)整配置,由系統(tǒng)自動進(jìn)行重新處理。如電子文件推送失敗后,要能設(shè)定下次自動重新推送的時(shí)間、允許重新推送的次數(shù)等。
對于因數(shù)據(jù)問題而產(chǎn)生的錯(cuò)誤,需要能夠及時(shí)通知維護(hù)人員,由維護(hù)人員及時(shí)對數(shù)據(jù)進(jìn)行處理,數(shù)據(jù)處理完成后由系統(tǒng)重新進(jìn)行處理。如推送的電子文件的元數(shù)據(jù)不符合要求,需要維護(hù)人員對元數(shù)據(jù)信息進(jìn)行處理,處理完成后系統(tǒng)自動重新進(jìn)行推送。
2 系統(tǒng)大數(shù)據(jù)、大并發(fā)支撐改造
由于系統(tǒng)在虛擬化的平臺下進(jìn)行遷移,會對電子文件系統(tǒng)的功能實(shí)現(xiàn)方式和底層結(jié)構(gòu)帶來影響[3],因此電子文件管理系統(tǒng)需要做相應(yīng)的改造工作,其主要改造工作思路如下:
首先,需進(jìn)行虛擬化技術(shù)研究,對電子文件管理系統(tǒng)涉及的基于j2ee架構(gòu)應(yīng)用、鏈路虛擬化等進(jìn)行研究,并找出適合電力企業(yè)電子文件管理系統(tǒng)的合理技術(shù)路線[4]。
其次,需對基于內(nèi)網(wǎng)的應(yīng)用服務(wù)器性能提升進(jìn)行研究,為解決高并發(fā)和高負(fù)載采用的ngnix技術(shù)的應(yīng)用研究。
同時(shí),對數(shù)據(jù)應(yīng)用災(zāi)備、多節(jié)點(diǎn)服務(wù)支撐(weblogic)等高可用技術(shù)進(jìn)行咨詢研究,確保改造方案適應(yīng)電子文件管理系統(tǒng)的大并發(fā)、大數(shù)據(jù)的利用。
最后,對包括服務(wù)器、存儲、內(nèi)部鏈路、網(wǎng)絡(luò)和IO等進(jìn)行重新設(shè)計(jì)優(yōu)化,確保從硬件資源上面適應(yīng)電子文件管理系統(tǒng)的要求。
電力企業(yè)電子文件系統(tǒng)大數(shù)據(jù)、大并發(fā)支撐改造主要體現(xiàn)在以下幾個(gè)方面:
集成接口虛擬化:隨著接入系統(tǒng)和電子文件類型的增多,集成接口壓力較大,需要改造為支持虛擬化環(huán)境,可以自動根據(jù)時(shí)間段、壓力等進(jìn)行分配。
數(shù)據(jù)展現(xiàn)虛擬化:支持虛擬化視圖展示,主要涉及到捕獲登記、分類整理、鑒定處置等模塊。
緩存資源虛擬化:支持虛擬化環(huán)境的多個(gè)來源。
智能整理虛擬化:支持虛擬化環(huán)境中同時(shí)進(jìn)行任務(wù)分配整理,主要涉及到自動分類、自動鑒定、自動捕獲等。
容錯(cuò)機(jī)制虛擬化:支持虛擬化環(huán)境下的容錯(cuò)信息的合并展示。
存儲利用虛擬化:支持隨非結(jié)構(gòu)化數(shù)據(jù)管理平臺的變化而變化。
3 電子文件業(yè)務(wù)功能完善提升
電力企業(yè)電子文件系統(tǒng)業(yè)務(wù)功能完善提升包括專題管理、捕獲服務(wù)優(yōu)化、捕獲登記、自動分類、批量移交、統(tǒng)計(jì)分析、基礎(chǔ)服務(wù)優(yōu)化等幾個(gè)方面。
3.1 專題管理
專題維護(hù):管理員可以從本單位或全部數(shù)據(jù)中定義不同的專題,并可以錄入專題名稱、創(chuàng)建人、應(yīng)用范圍、展示模板等信息,并能進(jìn)行維護(hù)。采用專題可以更好的利用電子文件的數(shù)據(jù)資源,提升電子文件的利用服務(wù)水平。專題維護(hù)的主要功能包括:添加、編輯、刪除。
專題梳理:根據(jù)定義好的專題信息,設(shè)置自動規(guī)則或人工自動關(guān)聯(lián)數(shù)據(jù),實(shí)現(xiàn)跨單位、跨業(yè)務(wù)系統(tǒng)等的數(shù)據(jù)自動抓取和查詢,并定義關(guān)聯(lián)數(shù)據(jù)的展示順序、顯示字段等。專題梳理的主要功能包括:查詢、設(shè)置規(guī)則、手工加入、順序設(shè)置、顯示字段、在線發(fā)布、取消發(fā)布。
專題展示:系統(tǒng)固定幾種專題的展示模板,可以對視頻、音頻、文檔類文件等進(jìn)行展示;并可以根據(jù)不同的專業(yè),顯示不同的業(yè)務(wù)系統(tǒng)、管控點(diǎn)、表單等,可自定義圖形化展示方式、統(tǒng)計(jì)圖形,便于更好的展示專題內(nèi)容。專題展示的主要功能包括:模板定制、樹形結(jié)構(gòu)定制、圖形定制。
文件關(guān)聯(lián):文件關(guān)聯(lián)功能是由管理員設(shè)定數(shù)據(jù)的自動關(guān)聯(lián)規(guī)則或人工設(shè)置關(guān)聯(lián)關(guān)系,用戶查看數(shù)據(jù)的時(shí)候自動顯示相關(guān)聯(lián)的文件信息,提高用戶的利用范圍,提升用戶體驗(yàn)。文件關(guān)聯(lián)的主要功能包括:手工關(guān)聯(lián)、自動關(guān)聯(lián)、多層關(guān)聯(lián)。
3.2 捕獲服務(wù)優(yōu)化
結(jié)構(gòu)化數(shù)據(jù)定版:結(jié)構(gòu)化數(shù)據(jù)定版服務(wù)在各業(yè)務(wù)系統(tǒng)中實(shí)現(xiàn)的方式差異性可能比較大,但整個(gè)結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換處理的過程基本相同,只是采用的具體實(shí)現(xiàn)技術(shù)有所差異。
待轉(zhuǎn)換數(shù)據(jù)可以從數(shù)據(jù)庫或XML中直接抽取,由轉(zhuǎn)換程序應(yīng)用對應(yīng)的轉(zhuǎn)換模版形成所需的非結(jié)構(gòu)化格式文件;也可以從數(shù)據(jù)庫中抽取數(shù)據(jù)按照規(guī)范封裝為XML格式的文件,提交給轉(zhuǎn)換程序應(yīng)用對應(yīng)的轉(zhuǎn)換模版形成所需的非結(jié)構(gòu)化格式文件。電子文件的轉(zhuǎn)換模版要能支持可配置,以便進(jìn)行轉(zhuǎn)換模版的擴(kuò)展變化。
電子文件推送:電子文件推送的時(shí)機(jī)需要能夠進(jìn)行配置,以便根據(jù)需要設(shè)置不同的服務(wù)運(yùn)行時(shí)間。每個(gè)電子文件的推送,無論其最終推送成功或失敗,都需要對所推送電子文件的信息進(jìn)行記錄。如果推送成功,需要在緩沖池信息表中記錄電子文件及文檔推送成功的信息;如果推送失敗,需要在緩沖池信息表中記錄電子文件及文檔推送失敗的信息,并將文檔留存在緩沖池中。
3.3 捕獲登記
在前期的捕獲登記的基礎(chǔ)上,實(shí)現(xiàn)各業(yè)務(wù)系統(tǒng)數(shù)據(jù)的統(tǒng)一抓取、統(tǒng)一轉(zhuǎn)換;擴(kuò)大捕獲范圍,對業(yè)務(wù)系統(tǒng)中產(chǎn)生的相關(guān)流程、日志信息進(jìn)行捕獲,實(shí)現(xiàn)電子文件的全程管理。
3.4 自動分類
自動分類服務(wù)是針對捕獲過來的電子文件,從來源、元數(shù)據(jù)類型、元數(shù)據(jù)內(nèi)容、附件內(nèi)容等多個(gè)維度對電子文件進(jìn)行自動分類,形成一個(gè)電子文件的多個(gè)不同分類維度,更好的展現(xiàn)電子文件。
3.5 批量移交
電子文件管理系統(tǒng)需要對外提供移交功能,需要對某一批包括元數(shù)據(jù)、電子文件附件的數(shù)據(jù)進(jìn)行封裝、校驗(yàn)、打包、下載的過程,主要涉及到以下幾個(gè)環(huán)節(jié):
封裝:根據(jù)用戶選擇的數(shù)據(jù)條目信息,將對應(yīng)的元數(shù)據(jù)封裝為XML,電子文件附件信息進(jìn)行下載。
校驗(yàn):對元數(shù)據(jù)和電子文件附件信息進(jìn)行校驗(yàn),保證元數(shù)據(jù)和電子文件附件的對應(yīng)關(guān)系的正確性。
打包:將元數(shù)據(jù)的XML和電子文件附件進(jìn)行打包,保證元數(shù)據(jù)和電子文件的完整性。
下載:將打包好的批量移交信息包推送到用戶那里,并保證下載的安全性。
3.6 統(tǒng)計(jì)分析
在原來的固定統(tǒng)計(jì)的基礎(chǔ)上,增加自定義統(tǒng)計(jì)功能,可以靈活選擇單位、文件類型、業(yè)務(wù)系統(tǒng)等進(jìn)行統(tǒng)計(jì),并可以展示為列表、圖形化展示(柱圖、曲線圖、餅圖等)。
3.7 基礎(chǔ)服務(wù)優(yōu)化
電子文件管理系統(tǒng)需要提供各種類型的電子文件管理以及各類業(yè)務(wù)系統(tǒng)的接入,采用SOA的技術(shù)架構(gòu),因此需要把對數(shù)據(jù)的捕獲、存儲、利用、格式轉(zhuǎn)換、數(shù)據(jù)封裝、安全控制等封裝為基礎(chǔ)服務(wù),同時(shí)把一些對第三方系統(tǒng)或者軟件的調(diào)用封裝成基礎(chǔ)服務(wù)。基礎(chǔ)服務(wù)由上層的組件服務(wù)或者業(yè)務(wù)服務(wù)調(diào)用。根據(jù)電子文件管理系統(tǒng)的實(shí)際情況,再前期的基礎(chǔ)服務(wù)的基礎(chǔ)上,深化數(shù)據(jù)轉(zhuǎn)版,新增自動分類等基礎(chǔ)服務(wù)。
4 結(jié)語
本文從統(tǒng)一的集成服務(wù)、大數(shù)據(jù)大并發(fā)支撐改造、業(yè)務(wù)功能完善三個(gè)維度,對電子文件系統(tǒng)在電力企業(yè)中的應(yīng)用結(jié)構(gòu)和提升方向進(jìn)行了闡述,通過進(jìn)一步實(shí)現(xiàn)具體應(yīng)用功能,對于整合公司信息資源,實(shí)現(xiàn)資源高效利用,提辦公效率和效益,提高公司管理水平具有重要意義。
參考文獻(xiàn)
[1]庫俊平.大數(shù)據(jù)環(huán)境中企業(yè)文書檔案的信息化管理及利用[J].創(chuàng)新科技,2013(9):50-51.
[2]楊冬權(quán).在全國檔案局長館長會議上的講話[EB/OL].
[3]宋魏巍.大數(shù)據(jù)環(huán)境下電子文件鑒定研究[J].北京檔案,2015(12):16-19.
[4]王蘭成,劉曉亮.網(wǎng)上數(shù)字檔案大數(shù)據(jù)分析中的知識挖掘技術(shù)研究[J].浙江檔案,2013(10):14-19.