吳君才,劉雪芳
(1.景德鎮(zhèn)學院圖書館,江西 景德鎮(zhèn) 333000; 2.景德鎮(zhèn)學院現(xiàn)代教育技術中心,江西 景德鎮(zhèn) 333000)
隨著大數(shù)據(jù)、云計算、人工智能技術等在高校圖書館應用,高校圖書館的數(shù)字資源管理手段越來越先進。同時圖書館的數(shù)字資源也變得非常豐富,數(shù)字資源合理配置一直是圖書館數(shù)字資源建設中重要的研究課題之一。但是高校圖書館數(shù)字資源合理配置仍然存在效率低和合理性差等一些問題。
云計算技術能為廣大讀者提供一種共享閱讀模式,云平臺能夠聚集海量的數(shù)字資源,實現(xiàn)圖書館數(shù)字資源大聯(lián)盟和大共享,提高資源利用效率。
秦紅軍[1]采用基于粒子群算法的云平臺下數(shù)字圖書館資源合理配置方法,利用數(shù)字圖書館資源節(jié)點的總度數(shù)和連接度來分析相連節(jié)點的概率,并通過聚類函數(shù)計算資源配置總流程時間和數(shù)字圖書館全部資源節(jié)點的平均值,分析資源配置的質(zhì)量指標,然后建立資源配置模型,計算數(shù)字圖書館資源配置的適應度值;資源消耗量可以通過計算資源配置速度向量得出,采用迭代次數(shù)計算資源配置的模塊數(shù)量。但該方法合理性差且有效性低。
叢慧等[2]采用蟻群算法對圖書館數(shù)字資源進行合理配置,首先對圖書館數(shù)字資源構建資源配置結構模型;其次,通過計算資源配置的樣本信息,從樣本信息中得到資源樣本數(shù);最后數(shù)字圖書館資源配置的成功率可以運用蟻群算法計算得出,從而可得到圖書館數(shù)字資源合理配置。但此方法對資源配置的合理性差、可信度低。
上述幾種圖書館資源配置方法都存在可信度低、有效性低和合理性差等一些問題,本文提出一種基于云計算平臺下的深度信念網(wǎng)絡的圖書館資源配置方法。
本文對圖書館資源進行合理配置時,利用云計算技術搭建圖書館數(shù)字資源配置云平臺。采用深度信念網(wǎng)絡對數(shù)字圖書館資源節(jié)點的可信度進行學習,對數(shù)字圖書館資源的資源節(jié)點的權值和資源樣本數(shù)進行計算,并提取出相關的特征來分析判斷。建立云平臺資源配置模型,通過深度信念網(wǎng)絡特征提取得到資源配置優(yōu)化的參數(shù),最后進行資源配置以達到合理配置資源。
云計算技術為圖書館資源配置提供海量的存儲環(huán)境以及強大的數(shù)據(jù)計算能力。云計算技術能夠為圖書館資源合理配置提供數(shù)字資源的儲存、計算以及網(wǎng)絡管理等技術,也給數(shù)字圖書館帶來效益,為讀者提供更好的閱讀服務,所以應當提高資源的合理配置效率[3-8]。
云計算技術是一種并行處理技術,有效地解決了單機運行速度慢的瓶頸問題,主要由物聯(lián)網(wǎng)技術、大數(shù)據(jù)處理技術、分布式技術等集結而成;通過將一個大規(guī)模問題劃分為Map和Reduce模塊,構成Map/Reduce工作框架,有效地解決大規(guī)模數(shù)據(jù)處理問題[9-11]。
深度學習基于層數(shù)較多的大規(guī)模神經(jīng)網(wǎng)絡,云存儲的數(shù)據(jù)存儲方式為深度學習提供了大數(shù)據(jù)存儲的條件[12-13]。只有這樣大數(shù)據(jù)存儲才能實現(xiàn)非常復雜的非線性多分類映射關系,更好地實現(xiàn)智能分析和推斷決策,表現(xiàn)出一定的智能特征。為了獲得資源配置的數(shù)據(jù)特征,本文引入深度信念網(wǎng)絡(Deep Belief Network,DBN),并進行數(shù)字資源的合理配置。
深度信念網(wǎng)絡是通過預訓練和調(diào)優(yōu)這2個關鍵環(huán)節(jié)來實現(xiàn)深度神經(jīng)網(wǎng)絡訓練的。深度信念網(wǎng)絡結構是經(jīng)典的神經(jīng)網(wǎng)絡結構。DBN由多個受限玻爾茲曼機(Restricted Boltzmann Machine,RBM)堆疊而成,訓練過程由預訓練和微調(diào)構成[14-18]。
深度信念網(wǎng)絡可以看作是由一層層的受限玻爾茲曼機堆疊而成的,它取消同層神經(jīng)元之間的互聯(lián),只保留顯見神經(jīng)元與隱見神經(jīng)元之間的雙向連接。而深度信念網(wǎng)絡的預訓練,通常采用的是逐層貪心法的訓練辦法。先訓練最靠近可見層的一層隱層,得到最優(yōu)解后,再將該隱層的輸出作為下一層的訓練集數(shù)據(jù),用于訓練下一個隱層。深度信念網(wǎng)絡結構如圖1所示。
圖1 深度信念網(wǎng)絡結構
受限玻爾茲曼機是一個概率神經(jīng)網(wǎng)絡模型,其中一個神經(jīng)元的輸出或者為0,或者為1,但其為1的概率分布符合Sigmoid函數(shù)形式。本文采用Sigmoid函數(shù),即:
其中,u為一個神經(jīng)元所有輸入的加權和再減去偏置量θ。因此,對于受限玻爾茲曼機的一個隱見神經(jīng)元,它的輸出為在所有顯見神經(jīng)元輸出下的條件概率:
由于受限玻爾茲曼機是一個多層雙向連接的網(wǎng)絡,所以顯見神經(jīng)元的輸出,也可以用所有隱見神經(jīng)元輸出下的條件概率來表示,即:
本文搭建一個由80個節(jié)點構成的資源配置云平臺,該平臺可以較好地分析基于云計算和深度信念網(wǎng)絡的數(shù)字資源配置建模,通過這個平臺可以更好地分析資源配置方法的合理性和有效性。云平臺結構如圖2所示。
圖2 數(shù)字資源配置云平臺
首先使用無監(jiān)督學習模式,逐層對網(wǎng)絡進行預訓練。主要是用大量的數(shù)據(jù)來對每一層的RBM網(wǎng)絡進行訓練,使得網(wǎng)絡能夠發(fā)現(xiàn)原始數(shù)據(jù)本身中蘊含的特征概率分布結構,即將各神經(jīng)元的權值引導到對訓練集數(shù)據(jù)具有最佳特征發(fā)現(xiàn)能力的初始值上。這一步是深度信念網(wǎng)絡最主要的訓練過程,本文所采用的是“對比散度法”的概率學習算法。
在預訓練完成后,需要對網(wǎng)絡參數(shù)進行調(diào)優(yōu)。調(diào)優(yōu)可以繼續(xù)采用無監(jiān)督的“wake-sleep”算法,這樣得到的模型是一個能夠重現(xiàn)訓練集樣本數(shù)據(jù)的“生成模型”;反饋調(diào)整階段是人們常說的第2階段,RBM輸出的特征向量通過最外層的BP神經(jīng)網(wǎng)絡進行接收,根據(jù)誤差信息,對整個網(wǎng)絡的參數(shù)通過有監(jiān)督地反向進行調(diào)節(jié)。
對比散度學習算法的具體步驟如下:
步驟1將訓練集樣本的數(shù)據(jù)作為顯見層的初始數(shù)據(jù),設定2層神經(jīng)網(wǎng)絡的初始參數(shù),包括權值矩陣W和偏置量向量b、c;迭代步數(shù)t=0。
步驟2利用第t步的顯見層v的狀態(tài)數(shù)據(jù)v(t),計算隱見層h的第t步的輸出概率分布P(hj(t)=1|v(t)),再通過吉布斯采樣將其轉(zhuǎn)換為h的具體輸出狀態(tài)h(t)。
步驟3利用步驟2得到的h(t),重構出第t+1步的v(t+1)的輸出概率分布P(vi(t+1)=1|h(t)),同樣通過吉布斯采樣將其轉(zhuǎn)換為具體的輸出狀態(tài)v(t+1)。
步驟4t=t+1,重復k次步驟2與步驟3,因此稱為CD-k算法。
步驟5利用t+1時刻的顯見層v的狀態(tài),計算t+1時刻的隱見層h的條件概率:
P(hj(t+1)=1|v(t+1))
步驟6對權值矩陣W、隱見層偏置向量b和顯見層偏置向量c進行修正。權值矩陣的修正量為:
ΔW=η[P(h(0)=1|v(0))(v(0))T-
P(h(t+1)=1|v(t+1))(v(t+1))T]
隱見層偏置向量的修正量為:
Δb=η[P(h(0)=1|v(0))-P(h(t+1)=1|v(t+1))]
顯見層偏置向量的修正量為:
Δc=η[v(0)-v(t+1)]
式中,η為給定常量,加粗了的數(shù)字1表示基向量。
深度信念網(wǎng)絡從整個網(wǎng)絡來說,最重要的第1步是要在訓練好第1層RBM網(wǎng)絡后,將其隱藏層狀態(tài)作為下一層的輸入;第2步是進行下一層RBM的樣本訓練;最后完成整個網(wǎng)絡的預訓練。在反饋調(diào)整階段,為了達到分類識別、調(diào)優(yōu)的目的,人們通常采用BP神經(jīng)網(wǎng)絡進行有監(jiān)督的訓練。
云計算技術將圖書館系統(tǒng)中眾多的服務器(計算機)組合成資源集群,從而形成一個資源利用率高、運算速度快的圖書館數(shù)字資源服務系統(tǒng),推動圖書館數(shù)字資源服務的發(fā)展[19-23]。
本文首先運用云計算技術構建資源配置的云平臺,每個節(jié)點采用深度信念網(wǎng)絡對圖書館數(shù)字資源的可信度、數(shù)字資源的資源節(jié)點的適應度的特征進行學習,并提取出相關的特征來分析判斷。本文運用多個節(jié)點對圖書館數(shù)字資源進行并行建模和配置,建立云平臺圖書館數(shù)字資源配置模型,如圖3所示。
圖3 資源配置模型
在圖書館數(shù)字資源配置中本文采用資源節(jié)點可信度來進行資源配置成功率的量化,采用W=S/T作為可信度的表達式。其中S表示資源節(jié)點成功執(zhí)行的任務總數(shù),資源節(jié)點接收的任務數(shù)用T表示,圖書館數(shù)字資源節(jié)點的可信度使用W表示,其值越大圖書館數(shù)字資源節(jié)點的可信度越高。
各個圖書館數(shù)字資源粒子都有自己的位置和速度,圖書館數(shù)字資源配置的適應度值可以通過公式計算得到,計算公式為:
p(v)=εp(v+1)+k1p(v+1)+k2p(v+1)
其中,k1、k2代表常數(shù),可以控制圖書館數(shù)字資源配置的收斂速度,v代表速度,ε代表云計算環(huán)境下的比例因子[1]。
通過計算與分析圖書館數(shù)字資源配置的適應度值,以及圖書館數(shù)字資源的可信度,利用圖書館數(shù)字資源模塊集構造訓練樣本,采用深度信念網(wǎng)絡對資源配置的模塊樣本進行訓練,得到配置方案完成配置需要的資源,完成了云平臺下圖書館數(shù)字資源的合理配置。云計算技術下深度信念網(wǎng)絡的圖書館數(shù)字資源配置步驟如下:
步驟1收集圖書館數(shù)字資源的所有數(shù)據(jù),如音視頻資源、圖書館自建特色資源等。
步驟2通過劃分圖書館數(shù)字資源數(shù)據(jù),獲得若干個圖書館數(shù)字資源子數(shù)據(jù)。
步驟3運用深度信念網(wǎng)絡對圖書館數(shù)字資源的每一個子數(shù)據(jù)進行預訓練,建立圖書館數(shù)字資源合理配置模型。
步驟4多個深度信念網(wǎng)絡基于云計算,同時對圖書館數(shù)字資源配置進行建模與配置,得到多個數(shù)字資源合理配置結果。
步驟5將多個數(shù)字資源合理配置結果傳輸?shù)絉educe。
步驟6確定每一個基于深度信念網(wǎng)絡的圖書館數(shù)字資源配置結果的權重,最后圖書館數(shù)字資源合理配置的結果可以通過權值計算得到。
為了驗證云計算和深度信念網(wǎng)絡的數(shù)字資源配置方法的有效性和合理性,本文對其進行實驗,實驗采用Windows 7系統(tǒng),軟件為MATLAB 2019b。在云計算訓練平臺中,為了完成對每個控制段模型的單獨訓練,本文應用單獨的DBN網(wǎng)絡的訓練原理,得到不同的訓練模型集,將其訓練結果存儲在相對應的云平臺存儲的數(shù)據(jù)庫中。本文以云存儲作為數(shù)字資源的存儲。
樣本訓練如圖4所示,本文提出的基于云計算和深度信念網(wǎng)絡的資源配置方法能夠較快地達到穩(wěn)態(tài)范圍,并且具有較小的超調(diào)量。準確度越快達到穩(wěn)定范圍,說明圖書館數(shù)字資源在配置時越合理,整體可以獲得較好的控制效果。
圖4 樣本訓練
為了驗證配置時間對圖書館數(shù)字資源配置的有效性,實驗過程中采用5組圖書館數(shù)字資源進行配置,數(shù)字資源文件的大小分別為1000 kB、900 kB、800 kB、700 kB、600 kB,測試結果如表1所示。
表1 數(shù)字資源配置的有效性測試
表1中,T表示數(shù)字資源配置的時間。數(shù)字資源文件大小為1000 kB時,本文的方法配置時間為21 min,文獻[1]的方法配置時間為51 min,文獻[2]的方法配置時間為45 min;當數(shù)字資源文件大小為600 kB時,本文的方法對應的配置時間為12 min,文獻[1]的方法配置時間為37 min,文獻[2]的方法配置時間為35 min。通過分析比較,可以得出對于同樣大小的數(shù)字資源文件,本文的方法所用的配置時間最短,效率更高。
文獻[1]方法中,文件大小為1000 kB時,圖書館數(shù)字資源的配置時間為51 min,文件大小為600 kB時,資源配置時間為37 min;文獻[2]方法中,文件大小為1000 kB時,圖書館數(shù)字資源的配置時間為45 min,文件大小為600 kB時,資源配置時間為35 min;本文方法中,文件大小為1000 kB時,圖書館數(shù)字資源的配置時間為21 min,文件大小為600 kB時,資源配置時間為12 min。可以看出,隨著圖書館數(shù)字資源文件的大小變小,資源配置所用的時間也變少。
從以上分析可以看出,本文的資源配置方法整體上都比前2種方法的資源配置時間短,效率更高,由此可得出本文的方法更優(yōu)。
為了提高圖書館數(shù)字資源配置的質(zhì)量和效率,本文提出了一種基于云計算和深度信念網(wǎng)絡的圖書館數(shù)字資源配置方法。首先采用云計算技術搭建圖書館數(shù)字資源配置云平臺,然后采用深度信念網(wǎng)絡對圖書館數(shù)字資源節(jié)點的可信度進行學習,對資源配置的模塊樣本進行訓練,最終完成云計算平臺下圖書館數(shù)字資源的合理配置。
最后,與其他方法進行了圖書館數(shù)字資源配置對比測試實驗。實驗結果表明,本文所提方法用于圖書館數(shù)字資源配置時不僅準確性高,而且減少了圖書館數(shù)字資源配置時間,提高了圖書館數(shù)字資源配置效率,實際應用價值更高。