国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于大數(shù)據(jù)分析技術(shù)的檔案信息管理成本預(yù)測(cè)

2020-07-23 08:54馮璐
現(xiàn)代電子技術(shù) 2020年14期
關(guān)鍵詞:仿真實(shí)驗(yàn)大數(shù)據(jù)分析

馮璐

摘? 要: 為了克服檔案信息管理成本預(yù)測(cè)過程存在的問題,以提高檔案信息管理成本預(yù)測(cè)精度為目標(biāo),設(shè)計(jì)基于大數(shù)據(jù)分析技術(shù)的檔案信息管理成本預(yù)測(cè)模型。首先分析檔案信息管理成本預(yù)測(cè)的研究現(xiàn)狀,找到引起檔案信息管理成本預(yù)測(cè)誤差大的原因;然后采集檔案信息管理成本的歷史數(shù)據(jù),并引入大數(shù)據(jù)分析技術(shù),即極限學(xué)習(xí)機(jī)對(duì)檔案信息管理成本進(jìn)行建模預(yù)測(cè);最后進(jìn)行檔案信息管理成本預(yù)測(cè)仿真對(duì)比實(shí)驗(yàn)。測(cè)試結(jié)果表明,大數(shù)據(jù)分析技術(shù)可以準(zhǔn)確刻畫檔案信息管理成本的變化規(guī)律,獲得了高精度的檔案信息管理成本預(yù)測(cè)結(jié)果,并且檔案信息管理成本預(yù)測(cè)偏差要小于當(dāng)前其他檔案信息管理成本預(yù)測(cè)模型,具有更高的實(shí)際應(yīng)用價(jià)值。

關(guān)鍵詞: 檔案信息管理; 成本預(yù)測(cè); 大數(shù)據(jù)分析; 建模預(yù)測(cè); 仿真實(shí)驗(yàn); 系統(tǒng)測(cè)試

中圖分類號(hào): TN911?34; TP391? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼: A? ? ? ? ? ? ? ? ? ? ? ?文章編號(hào): 1004?373X(2020)14?0094?03

Archival information management cost prediction based on big data analysis technology

FENG Lu

(MOE Key Laboratory of Engineering Bionics, Jilin University, Changchun 130000, China)

Abstract: A model of archival information management cost prediction based on large data analysis technology is designed to overcome the problems existing in the process of cost prediction of archival information management and improve the accuracy of the cost prediction of archival information management. The research status of the cost prediction of the archival information management is analyzed to find out the reasons why the error of the cost prediction of archival information management is great. The historical data of the cost of archival information management is collected and the big data analysis technology (extreme learning machine) is introduced to perform the modeling forecasting for the cost of archival information management. The simulation comparative experiment of the cost prediction of archival information management was carried out. The testing results show that the big data analysis technology can accurately describe the changes rule of the cost of archival information management, the proposed cost prediction model can obtain high?precision cost prediction results of archival information management, and the deviation of the archival information management cost prediction of the model is smaller than that of the other current archival information management models. It has higher practical application value.

Keywords: archival information management; cost prediction; large data analysis; modeling forecasting; simulation experiment; system testing

檔案信息對(duì)一個(gè)單位或者個(gè)人來說,至關(guān)重要,近年來,人們對(duì)檔案信息管理要求日益提高[1?3]。傳統(tǒng)的檔案信息管理方式為手工方式,工作量大,容易出錯(cuò),無法適應(yīng)檔案信息向大規(guī)模方向發(fā)展要求[4]。隨著信息技術(shù)、計(jì)算機(jī)技術(shù)、自動(dòng)化技術(shù)的不斷發(fā)展和融合,出現(xiàn)了許多檔案信息自動(dòng)管理系統(tǒng)[5?6]。

針對(duì)當(dāng)前檔案信息管理成本預(yù)測(cè)模型存在一些弊端,為了減少檔案信息管理成本,獲得高精度的檔案信息管理成本預(yù)測(cè)結(jié)果,提出基于大數(shù)據(jù)分析技術(shù)的檔案信息管理成本預(yù)測(cè)模型,并通過具體的應(yīng)用實(shí)例分析本文提出的檔案信息管理成本預(yù)測(cè)模型的有效性和優(yōu)越性。

1? 檔案信息管理成本預(yù)測(cè)的研究現(xiàn)狀

檔案信息管理成本預(yù)測(cè)研究可以劃分為兩個(gè)階段:第一個(gè)階段為線性建模階段;第二階段為非線性建模階段[7?9]。線性建模階段的主要方法為:一元線性回歸方法、多元線性回歸方法。它們根據(jù)檔案信息管理成本特點(diǎn),分析影響因素與檔案信息管理成本之間的關(guān)系,對(duì)于簡單檔案信息管理成本預(yù)測(cè)問題,預(yù)測(cè)精度高、時(shí)間短,最為嚴(yán)重的缺陷是沒有考慮檔案信息管理成本的隨機(jī)性變化特點(diǎn),預(yù)測(cè)結(jié)果可靠性低[10?11]。非線性建模階段主要方法包括:貝葉斯網(wǎng)絡(luò)、人工神經(jīng)網(wǎng)絡(luò),尤其是人工神經(jīng)網(wǎng)絡(luò)對(duì)檔案信息管理成本的隨機(jī)性變化特點(diǎn)擬合效果好,成為當(dāng)前檔案信息管理成本預(yù)測(cè)的主要建模工具。在實(shí)際應(yīng)用中,人工神經(jīng)網(wǎng)絡(luò)存在收斂速度慢、計(jì)算機(jī)空間復(fù)雜度高等不足,使得檔案信息管理成本擬合精度高,但是預(yù)測(cè)錯(cuò)誤率卻很高,即預(yù)測(cè)結(jié)果的“過擬合”現(xiàn)象[12]。近年來,隨著大數(shù)據(jù)分析技術(shù)的涌現(xiàn),為檔案信息管理成本預(yù)測(cè)提供了各種可能,其中極限學(xué)習(xí)機(jī)就是一種經(jīng)典的大數(shù)據(jù)分析技術(shù)。為此,本文將其引入到檔案信息管理成本預(yù)測(cè)建模過程中,對(duì)極限學(xué)習(xí)機(jī)存在的問題進(jìn)行解決[13?15]。

2? 模型設(shè)計(jì)

2.1 極限學(xué)習(xí)機(jī)算法

人工神經(jīng)網(wǎng)絡(luò)是一種模擬人大腦傳遞信息的機(jī)器學(xué)習(xí)理論,通常為3層結(jié)構(gòu),能夠?qū)栴}的數(shù)據(jù)之間關(guān)聯(lián)進(jìn)行挖掘。在實(shí)際應(yīng)用中,其存在許多缺陷,如:運(yùn)算速度較慢、容易陷入局部最優(yōu)、難以獲得最佳的預(yù)測(cè)結(jié)果。在前人研究成果的基礎(chǔ)上,有學(xué)者提出極限學(xué)習(xí)機(jī)算法。極限學(xué)習(xí)機(jī)通過隨機(jī)設(shè)置各層之間的連接權(quán)值和閾值,在訓(xùn)練過程中不需要對(duì)連接權(quán)值和閾值進(jìn)行修改,僅只需要設(shè)置隱含層節(jié)點(diǎn)數(shù),就可以對(duì)問題進(jìn)行求解,克服了傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)存在的局限性。與傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)相比,極限學(xué)習(xí)機(jī)的優(yōu)點(diǎn)如表1所示。

設(shè)數(shù)據(jù)為:[{(xi,ti)}Ni=1],[xi=[xi1,xi2,…,xin]T],[ti=[ti1,ti2,…,tim]T],極限學(xué)習(xí)機(jī)算法的隱含層節(jié)點(diǎn)數(shù)為L,極限學(xué)習(xí)機(jī)算法可以表示為:

[tj=i=1lβig(wi?xj+bi),? j=1,2,…,n] (1)

式中:[βi]表示輸出權(quán)值;g()表示激活函數(shù);[wi]和[bi]分別表示連接權(quán)重和閾值。

展開式(1)得到:

[tj=t1jt2j?tmj=i=1lβi1g(wi?xj+bi)i=1lβi2g(wi?xj+bi)? ? ? ? ? ? ??i=1lβimg(wi?xj+bi)]? ? ? ? (2)

式中:[wi=[wi1,wi2,…,win]T];[xj=[xj1,xj2,…,xjn]T]。

將式(2)采用矩陣形式進(jìn)行描述,可變?yōu)椋?/p>

[Hβ=T′]? ? ? ? ? ? ? ? ? ? ? (3)

輸出權(quán)值的計(jì)算公式為:

[β=H-1T′]? ? ? ? ? ? ? ? ? ? ? (4)

當(dāng)滿足式(4)時(shí),需要極限學(xué)習(xí)機(jī)算法的擬合誤差為零,在實(shí)際應(yīng)用中,是可能保證擬合誤差為零的。因此,為了使極限學(xué)習(xí)機(jī)算法的結(jié)果擬合效果更好,使[Hβ-T′]的誤差最小,根據(jù)廣義逆的理論,可以得到:

[β*=H+T′]? ? ? ? ? ? ? ? ? ? ? (5)

式中,H+表示H的廣義逆,其可以通過奇異值分解法得到。

wi和bi的值對(duì)極限學(xué)習(xí)機(jī)的性能影響很大,通常情況下,采用隨機(jī)方式進(jìn)行設(shè)置,導(dǎo)致極限學(xué)習(xí)機(jī)的預(yù)測(cè)精度比較低。本文采用粒子群算法確定wi和bi的值。

2.2 粒子群算法

粒子群算法是一種模擬鳥群覓食的智能優(yōu)化算法。每只鳥在覓食的過程中,會(huì)搜索其周圍區(qū)域,根據(jù)周圍區(qū)域搜索結(jié)果,確定下一步的飛行速度和方向,粒子當(dāng)前發(fā)現(xiàn)的最優(yōu)值和全局最優(yōu)值分別為:Pbest和Gbest。在迭代過程中,粒子根據(jù)這兩個(gè)值更新其速度和位置,具體為

[vk+1i,d=vki,d+c1?rand()(Pbestki,d-xki,d)+? ? ? ? ? ? c2?rand()(Gbestki,d-xki,d)]? ? ?(6)

[xk+1i,d=xki,d+vki,d] (7)

為了獲得更好的全局尋優(yōu)能力,引入慣性權(quán)重w,式(6)變?yōu)椋?/p>

[vk+1i,d=w?vki,d+c1?rand()(Pbestki,d-xki,d)+? ? ? ? ? ? c2?rand()(Gbestki,d-xki,d)]? ? ?(8)

2.3 基于大數(shù)據(jù)分析技術(shù)的檔案信息管理成本預(yù)測(cè)步驟

1) 采集檔案信息管理成本的歷史樣本數(shù)據(jù),并剔除數(shù)據(jù)不全的樣本。

2) 確定極限學(xué)習(xí)機(jī)的各層節(jié)點(diǎn),從而產(chǎn)生極限學(xué)習(xí)機(jī)的拓?fù)浣Y(jié)構(gòu)。

3) 初始化粒子群算法的參數(shù),而且將極限學(xué)習(xí)機(jī)的wi和bi作為粒子位置,并且確定wi和bi的取值范圍。

4) 采用檔案信息管理成本預(yù)測(cè)精度作為粒子群的適應(yīng)度函數(shù),根據(jù)適應(yīng)度函數(shù)值得到Pbest和Gbest。

5) 根據(jù)式(8)更新粒子的位置和速度,并且增加迭代次數(shù)。

6) 如果當(dāng)前迭代已經(jīng)滿足最大迭代次數(shù),根據(jù)粒子群的最優(yōu)位置得到最優(yōu)的wi和bi。

7) 極限學(xué)習(xí)機(jī)根據(jù)最優(yōu)wi和bi建立檔案信息管理成本預(yù)測(cè)模型。檔案信息管理成本預(yù)測(cè)流程見圖1。

3? 大數(shù)據(jù)分析技術(shù)的檔案信息管理成本預(yù)測(cè)實(shí)例分析

3.1? 樣本數(shù)據(jù)及預(yù)處理

為了分析大數(shù)據(jù)分析技術(shù)的檔案信息管理成本預(yù)測(cè)效果,選擇多個(gè)檔案信息管理成本作為研究,將它們組合成一個(gè)樣本集合,具體如圖2所示。選擇BP神經(jīng)網(wǎng)絡(luò)、多元線性回歸的檔案信息管理成本預(yù)測(cè)模型進(jìn)行對(duì)比實(shí)驗(yàn)。

3.2 檔案信息管理成本預(yù)測(cè)精度比較

采用3種模型對(duì)圖3前100個(gè)檔案信息管理成本的樣本數(shù)據(jù)進(jìn)行建模,后面100個(gè)數(shù)據(jù)進(jìn)行測(cè)試,均進(jìn)行5次仿真實(shí)驗(yàn),統(tǒng)計(jì)每一次檔案信息管理成本預(yù)測(cè)精度,結(jié)果如圖3所示。對(duì)圖3的檔案信息管理成本預(yù)測(cè)精度進(jìn)行比較可以發(fā)現(xiàn),本文模型的檔案信息管理成本預(yù)測(cè)精度要明顯高于BP神經(jīng)網(wǎng)絡(luò)、多元線性回歸,減少了檔案信息管理成本預(yù)測(cè)誤差。這主要是因?yàn)橐肓舜髷?shù)據(jù)分析技術(shù)(極限學(xué)習(xí)機(jī))得到更優(yōu)的檔案信息管理成本預(yù)測(cè)模型,可以反映檔案信息管理成本變化特點(diǎn)。

3.3 檔案信息管理成本的建模效率比較

統(tǒng)計(jì)3種模型的檔案信息管理預(yù)測(cè)的建模時(shí)間,包括訓(xùn)練時(shí)間和測(cè)試時(shí)間,結(jié)果如表2所示。從表2可以發(fā)現(xiàn),3種模型的檔案信息管理測(cè)試時(shí)間相差不大,訓(xùn)練時(shí)間相差大。其中多元線性回歸的訓(xùn)練時(shí)間最少,其次為本文模型,最多的為BP神經(jīng)網(wǎng)絡(luò);而多元線性回歸預(yù)測(cè)誤差完全不能滿足實(shí)際應(yīng)用要求。因此,本文模型的檔案信息管理成本預(yù)測(cè)綜合性能更優(yōu)。

表2? 檔案信息管理成本預(yù)測(cè)的建模時(shí)間對(duì)比? s? ? ? ? ?[模型 訓(xùn)練時(shí)間 測(cè)試時(shí)間 本文 7.48 1.710 BP神經(jīng)網(wǎng)絡(luò) 18.224 1.850 多元線性回歸 6.608 1.458 ]

4? 結(jié)? 語

為了提高檔案信息管理成本預(yù)測(cè)精度,本文設(shè)計(jì)基于大數(shù)據(jù)分析技術(shù)的檔案信息管理成本預(yù)測(cè)模型,測(cè)試結(jié)果表明,所設(shè)計(jì)模型獲得了高精度的檔案信息管理成本預(yù)測(cè)結(jié)果,且檔案信息管理成本預(yù)測(cè)效果要優(yōu)于其他模型,是一種速度快、精度高的檔案信息管理成本預(yù)測(cè)模型。

參考文獻(xiàn)

[1] 張倩.區(qū)塊鏈技術(shù)對(duì)高校檔案信息管理方式創(chuàng)新的可行性探究[J].檔案與建設(shè),2017,40(12):21?24.

[2] 劉利.論檔案信息管理平臺(tái)在著作權(quán)集體管理組織中的應(yīng)用[J].浙江檔案,2013,24(8):26?29.

[3] 丁任妹.關(guān)于構(gòu)建高校檔案信息管理系統(tǒng)的思考[J].西南民族大學(xué)學(xué)報(bào)(人文社科版),2003,22(8):360?361.

[4] 喻念念.高校人事檔案信息管理系統(tǒng)模塊的設(shè)計(jì)與實(shí)現(xiàn)[J].山西檔案,2015,9(6):64?66.

[5] 崔海莉,張惠達(dá).云計(jì)算環(huán)境下檔案信息管理系統(tǒng)風(fēng)險(xiǎn)分析[J].檔案學(xué)研究,2013,15(1):56?60.

[6] 周勝利.美國陸軍檔案信息管理系統(tǒng)建設(shè)的原則與特點(diǎn)[J].檔案與建設(shè),2012(10):22?25.

[7] 李殷青,王志星.基于WEB的高校學(xué)生檔案信息管理系統(tǒng)的設(shè)計(jì)開發(fā)[J].蘭臺(tái)世界,2008,22(10):15?16.

[8] 許慧,張立銘.基于Web的圖書館檔案管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代電子技術(shù),2016,39(16):48?51.

[9] 張麗娜,夏慶利.高校人力資源管理的現(xiàn)實(shí)困境與對(duì)策:基于大數(shù)據(jù)思維下高校人事檔案信息化建設(shè)的探討[J].學(xué)術(shù)論壇,2016,39(4):157?161.

[10] 楊加,李笑難,張揚(yáng),等.基于大數(shù)據(jù)分析的校園電子郵件異常行為檢測(cè)技術(shù)研究[J].通信學(xué)報(bào),2018,39(1):116?123.

[11] 王萬良,張兆娟,高楠,等.基于人工智能技術(shù)的大數(shù)據(jù)分析方法研究進(jìn)展[J].計(jì)算機(jī)集成制造系統(tǒng),2019,25(3):529?547.

[12] 陳貴平,王子牛.基于大數(shù)據(jù)分析的用戶信息多重加密存儲(chǔ)技術(shù)[J].計(jì)算機(jī)科學(xué),2018,45(7):150?153.

[13] 余英,朱正國,黃超,等.基于大數(shù)據(jù)分析的配電網(wǎng)絡(luò)故障趨勢(shì)判斷[J].電源技術(shù),2018,42(1):132?134.

[14] 郭平,王可,羅阿理,等.大數(shù)據(jù)分析中的計(jì)算智能研究現(xiàn)狀與展望[J].軟件學(xué)報(bào),2015,26(11):3010?3025.

[15] 張林林,胡熊偉,李鵬,等.基于極限學(xué)習(xí)機(jī)的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估方法[J].上海交通大學(xué)學(xué)報(bào),2019,53(6):749?756.

猜你喜歡
仿真實(shí)驗(yàn)大數(shù)據(jù)分析
仿真軟件在制藥人才培養(yǎng)中的作用分析
大數(shù)據(jù)分析對(duì)提高教學(xué)管理質(zhì)量的作用
基于大數(shù)據(jù)分析的電力通信設(shè)備檢修影響業(yè)務(wù)自動(dòng)分析平臺(tái)研究與應(yīng)用
開展體驗(yàn)式教學(xué)創(chuàng)新研究 提高化學(xué)課堂有效性
面向大數(shù)據(jù)遠(yuǎn)程開放實(shí)驗(yàn)平臺(tái)構(gòu)建研究
面向大數(shù)據(jù)分析的信息管理實(shí)踐教學(xué)體系構(gòu)建
傳媒變局中的人口電視欄目困境與創(chuàng)新
基于多重視閾下的《電子控制技術(shù)》課程的教學(xué)探討
基于ETAP的電氣設(shè)計(jì)仿真實(shí)驗(yàn)