陳 英
(河南農(nóng)業(yè)大學(xué) 馬克思主義學(xué)院,河南 鄭州450002)
在信息社會(huì), 紙質(zhì)圖書的流通頻率對(duì)構(gòu)建學(xué)習(xí)型社會(huì)非常重要,一定周期內(nèi)的不同類型的圖書借閱量反映了該社會(huì)公民的整體素養(yǎng)。借閱趨勢(shì)分析是圖書管理員的日常工作之一, 通過(guò)對(duì)借閱規(guī)律分析,管理員能夠掌握師生的借閱興趣和研究狀況,各類圖書和期刊的采購(gòu)數(shù)量和質(zhì)量,達(dá)到更好的為師生服務(wù)的目的。 建立恰當(dāng)?shù)臄?shù)學(xué)模型能夠預(yù)測(cè)未來(lái)一定時(shí)間段內(nèi)圖書的借閱規(guī)律,常見(jiàn)的借閱規(guī)律預(yù)測(cè)模型建模方法有以下幾種:多變量回歸分析法、神經(jīng)網(wǎng)絡(luò)、灰色系統(tǒng)理論和遺傳算法等[1]。 在上述方法中,多變量回歸分析方法是基礎(chǔ),其它幾種方法都是基于該方法演變而來(lái),是最通用的方法[2]。神經(jīng)網(wǎng)絡(luò)算法也是數(shù)學(xué)建模中常用算法,該算法有很強(qiáng)的非線性擬合能力,可映射任意復(fù)雜的非線性關(guān)系,學(xué)習(xí)規(guī)則簡(jiǎn)單,魯棒性、記憶能力、能力和自學(xué)習(xí)能力強(qiáng)大,但該算法沒(méi)能力來(lái)解釋自己的推理過(guò)程和推理依據(jù),訓(xùn)練模型的數(shù)據(jù)量龐大,計(jì)算過(guò)程容易造成信息的丟失;與神經(jīng)網(wǎng)絡(luò)建模方法相比,灰色系統(tǒng)理論建模過(guò)程清晰簡(jiǎn)單,模型穩(wěn)定性比較好,但預(yù)測(cè)精度有待提高。 遺傳算法屬于全局搜索算法,采用仿生學(xué)原理模擬自然進(jìn)化過(guò)程擇優(yōu)搜索,該方法適用范圍廣,在一定域內(nèi)總能找到目標(biāo)解,但模型容易“早熟”,難以到達(dá)最優(yōu)解,屬于隨機(jī)算法[3-4]。 本文對(duì)上述四種建模方法的建模過(guò)程進(jìn)行分析,對(duì)數(shù)學(xué)模型的優(yōu)缺點(diǎn)進(jìn)行評(píng)價(jià),為圖書管理員和圖書管理科研工作者提供一定的參考。
回歸分析是一種分析變量之間關(guān)系的數(shù)理統(tǒng)計(jì)方法。對(duì)于待分析的數(shù)據(jù)和變量,雖然變量之間沒(méi)有確定的數(shù)學(xué)關(guān)系,但可以找出最能代表它們之間關(guān)系的數(shù)學(xué)表達(dá)式:數(shù)學(xué)模型。 在圖書借閱規(guī)律研究方面,有兩方面的應(yīng)用,一是根據(jù)師生以往和現(xiàn)在的借閱狀況,預(yù)測(cè)圖書將來(lái)的借閱狀況; 二是對(duì)影響借閱狀況的原因進(jìn)行分析, 找出哪些是重要因素, 哪些是次要因素, 這些因素之間又有什么關(guān)系等等。
使用多變量回歸分析方法得到的圖書預(yù)測(cè)模型通常表示為時(shí)間變量的多項(xiàng)式,并利用最小二乘原理求得多項(xiàng)式的系數(shù),主要求解步驟如下:
(1)根據(jù)待借閱預(yù)測(cè)的圖書數(shù)量,預(yù)測(cè)模型通常可表示為下列多項(xiàng)式:
其中:
式中:y 為各種圖書的預(yù)測(cè)借閱量;m 為n×n 維模型系數(shù)矩陣;x為模型計(jì)算參數(shù);c 為n 維待求常數(shù)向量。
(2)將各種圖書歷年的借閱數(shù)據(jù)代入方程式(1)中,計(jì)算出系數(shù)矩陣和常數(shù)項(xiàng)。
(3)將系數(shù)帶入方程(1),計(jì)算借閱預(yù)測(cè)值。
(4)計(jì)算擬合殘差,評(píng)估預(yù)測(cè)結(jié)果的可靠性。
神經(jīng)網(wǎng)絡(luò)建模的基本原理是:各種圖書歷年的借閱樣本數(shù)據(jù)通過(guò)模型的中間層作用于輸出層,經(jīng)過(guò)非線形變換,產(chǎn)生輸出的模擬值,模型訓(xùn)練的數(shù)據(jù)包括輸入矩陣和期望矩陣。模型輸出值和期望值之間的偏差量,通過(guò)調(diào)整輸入層與隱層之間的加權(quán)值、隱層與輸出層之間的加權(quán)值及閾值,使誤差沿梯度方向下降,經(jīng)過(guò)反復(fù)學(xué)習(xí)訓(xùn)練,確定與最小誤差相對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)(加權(quán)值和閾值),訓(xùn)練即告停止。 此時(shí)經(jīng)過(guò)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)即能對(duì)類似樣本的輸入數(shù)據(jù),自行處理輸出誤差最小的經(jīng)過(guò)非線形轉(zhuǎn)換的信息。 神經(jīng)網(wǎng)絡(luò)模型結(jié)果如圖1 所示。
圖1 神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)Fig.1 The structure of a neural network model
(1)模型初始化。給各節(jié)點(diǎn)間賦予一個(gè)初始權(quán)值,一般可以設(shè)為(-1,1),設(shè)定節(jié)點(diǎn)間誤差函數(shù)e 和計(jì)算精度ε,規(guī)定最大學(xué)習(xí)次數(shù)M。
(2)輸入樣本數(shù)據(jù),計(jì)算各隱層神經(jīng)節(jié)點(diǎn)的輸入和輸出數(shù)據(jù)值。
(3)利用模型的輸出期望和實(shí)際輸出,計(jì)算誤差函數(shù)對(duì)模型節(jié)點(diǎn)的偏導(dǎo)數(shù)δm(k);計(jì)算隱層和輸出層對(duì)神經(jīng)節(jié)點(diǎn)的偏導(dǎo)數(shù)δn(k)。
(4)利用神經(jīng)節(jié)點(diǎn)的計(jì)算值修正節(jié)點(diǎn)間的連接權(quán)值。
(5)計(jì)算綜合精度,并判斷預(yù)測(cè)值是否符合要求。
灰色系統(tǒng)模型預(yù)測(cè), 是指對(duì)系統(tǒng)行為特征的發(fā)展變化進(jìn)行預(yù)測(cè),對(duì)既含有白信息又含有灰色信息的系統(tǒng)進(jìn)行預(yù)測(cè)。 很多情況下,樣本數(shù)據(jù)中所顯示的信息具有隨機(jī)性,但隨機(jī)的信息中也包含了時(shí)序的特征,灰色模型預(yù)測(cè)就是利用這種規(guī)律來(lái)進(jìn)行預(yù)測(cè)。 當(dāng)前使用比較多的灰色預(yù)測(cè)模型是一階微分的GM(1,1)模型。它是基于隨機(jī)的原始時(shí)序,經(jīng)累加后所形成的新的時(shí)序,該時(shí)序的規(guī)律用一階線性微分方程的解來(lái)逼近。
(1)樣本數(shù)據(jù)處理和GM(1,1)方程的構(gòu)建
式中:C 為中間值矩陣,Z 為原始樣本矩陣。
(3)預(yù)測(cè)方程精度評(píng)估。 精度評(píng)估主要是對(duì)模型方程的預(yù)測(cè)值和樣本數(shù)據(jù)進(jìn)行比較,計(jì)算預(yù)測(cè)殘差和數(shù)據(jù)間的相對(duì)誤差。
(4)預(yù)測(cè)實(shí)現(xiàn)。
遺傳算法是本質(zhì)上是一種尋優(yōu)方法,該方法借鑒生命學(xué)上的生物優(yōu)勝劣汰原則,不斷的擇優(yōu)搜索系統(tǒng)解。 該方法直接對(duì)待優(yōu)化的系統(tǒng)進(jìn)行求解,不需要對(duì)系統(tǒng)進(jìn)行連續(xù)性限定和對(duì)系統(tǒng)求偏導(dǎo)數(shù),因此在應(yīng)用上更加靈活,并且有較強(qiáng)的全局搜索能力。 能對(duì)所有的樣本數(shù)據(jù)進(jìn)行優(yōu)化處理,并且自適應(yīng)的調(diào)整搜索的方向,在樣本數(shù)據(jù)的漸次迭代中找到最優(yōu)預(yù)測(cè)解, 而且得到的這個(gè)解象生物界的生命體進(jìn)化那樣,有更強(qiáng)的適應(yīng)性。
建模的過(guò)程參看流程圖2。
圖2 遺傳算法預(yù)測(cè)模型基本建模過(guò)程Fig.2 Prediction model of genetic algorithm
表1 顯示的是河南農(nóng)業(yè)大學(xué)文法學(xué)院圖書室2005~2012 年間兩種圖書的借閱量。
表1 2005~2012 年 兩種圖書借閱量Tab.1 Lending condition among 2005-2012 years
(1)表2 顯示的是2013 年的兩種圖書預(yù)測(cè)結(jié)果
表2 回歸分析法年借閱趨勢(shì)預(yù)測(cè)結(jié)果Tab.2 Forecast results of year of variable regression
(2)表3 顯示的兩種圖書的灰色模型預(yù)測(cè)結(jié)果
表3 灰色模型借閱趨勢(shì)預(yù)測(cè)結(jié)果Tab.3 Forecast results of year of grey system theory
(3)表4 顯示的兩種圖書的神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)結(jié)果
表4 神經(jīng)網(wǎng)絡(luò)借閱趨勢(shì)預(yù)測(cè)結(jié)果Tab.4 Forecast results of year of neural network
(4)表5 顯示的兩種圖書的遺傳模型預(yù)測(cè)結(jié)果
表5 遺傳模型借閱趨勢(shì)預(yù)測(cè)結(jié)果Tab.5 Forecast results of year of genetic algorithm
從預(yù)測(cè)結(jié)果可以看出,遺傳算法模型的預(yù)測(cè)結(jié)果比較精確,絕對(duì)誤差和相對(duì)誤差都比較小, 灰色系統(tǒng)理論模型的預(yù)測(cè)結(jié)果相對(duì)比較弱,神經(jīng)網(wǎng)絡(luò)模型和回歸模型的預(yù)測(cè)結(jié)果介于二者之間。 灰色系統(tǒng)理論是對(duì)數(shù)據(jù)進(jìn)行逐次累加,找到數(shù)據(jù)間的線性規(guī)律,當(dāng)原始數(shù)據(jù)間跳躍比較大時(shí),這種疊加出的規(guī)律線性度并不明顯,所以預(yù)測(cè)結(jié)果比較弱。遺傳算法在每一步計(jì)算時(shí),都要進(jìn)行智能擇優(yōu)搜索,而且對(duì)數(shù)據(jù)間的跳躍不敏感,所以在對(duì)這類數(shù)據(jù)進(jìn)行處理和預(yù)測(cè)時(shí),結(jié)果相對(duì)精確。神經(jīng)網(wǎng)絡(luò)模型的精度和中間層的數(shù)量有很大的關(guān)系,對(duì)原始樣本數(shù)據(jù)量的要求也比較大,在不滿足上述條件時(shí),預(yù)測(cè)精度比較弱,而回歸分析對(duì)數(shù)據(jù)的間的線性度要求比較高。
本文分析了多變量回歸、灰色系統(tǒng)理論、神經(jīng)網(wǎng)絡(luò)和遺傳算法在河南農(nóng)業(yè)大學(xué)文法學(xué)院圖書室圖書借閱量預(yù)測(cè)模型構(gòu)建方面的問(wèn)題,對(duì)四種建模方法的建模過(guò)程和建模結(jié)果進(jìn)行了分析。用部分圖書的年借閱量作為樣本數(shù)據(jù),預(yù)測(cè)了2013 年這兩種圖書的借閱量,并與記錄值進(jìn)行了比較。比較得出了遺傳算法更適合于圖書室借閱量預(yù)測(cè)的重要結(jié)論。
[1]劉思峰,等.灰色系統(tǒng)理論及其應(yīng)用[M].3 版.科學(xué)出版社,2007.
[2]陳英,王秀山.基于灰色系統(tǒng)理論的農(nóng)業(yè)院校院系紙質(zhì)圖書借閱管理研究[J].科技視界,2003(3):114-116.
[3]陳英.小型圖書室用的智能型多功能入侵報(bào)警系統(tǒng)設(shè)計(jì)[J].科技信息,2013(25):376-377.
[4]趙海濤.數(shù)控機(jī)床熱誤差實(shí)時(shí)補(bǔ)償關(guān)鍵技術(shù)研究[D].上海交通大學(xué)圖書館,2006.