国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于人工神經(jīng)網(wǎng)絡的圖書需求量模型研究

2018-03-30 05:02王旭明
圖書館界 2018年1期
關鍵詞:權值人工神經(jīng)網(wǎng)絡誤差

丑 楚,王旭明

(1.湖南省少年兒童圖書館,湖南 長沙 410005;2.湖南圖書館,湖南 長沙 410011)

圖書流通工作是圖書館服務效能的重要指標,也是密切反映讀者需求的重要途徑。通過對圖書流通情況的分析,運用計算機將這些指標把圖書在圖書館中被利用的情況反映出來,圖書館可以從中得出圖書館讀者的閱讀傾向與需求目標,在此基礎上的研究對今后的采購與藏書更有指導性的意義。圖書流通量是一個量化的絕對指標,客觀地反映出圖書流通借閱的情況,同時也反映出圖書實際的利用水平和程度,真實地反映了圖書館工作的業(yè)務水平。每一個圖書館都希望能獲得圖書流通量的趨勢,如果能預測圖書流通量,那么對圖書館制定館藏體系、新書采購計劃、借閱流通資源管理以及人員服務管理來說都有著積極的意義。由于圖書需求量變化響應的非線性和不連續(xù)性特征,很難用傳統(tǒng)的數(shù)學模型進行預測,人工神經(jīng)網(wǎng)絡具有強大的非線性映射能力,在模式識別和非線性預測中都有廣泛的應用。

近幾年來,人工神經(jīng)網(wǎng)絡發(fā)展迅速,由于其自身具有學習和強大的適應能力,已成為比較理想的非線性建模方法。在實際應用過程中,一些對象具有復雜的不確定性、實時性、高度的非線性,這些因素必然造成很難建立一個精確的數(shù)學模型,然而人工神經(jīng)網(wǎng)絡卻具有逼近、擬合非線性關系的能力,可以幫助解決存在的問題。當前,由于圖書館流通量預測是一個多變量的問題具有非線性、大滯后性的特點,而人工神經(jīng)網(wǎng)絡具有強大的自適應能力,同時具備很強的非線性映射能力,所以本文采用人工神經(jīng)網(wǎng)絡建模來實現(xiàn)對圖書流通量的預測估計。我們以兩層前徑向基函數(shù)網(wǎng)絡對湖南省少年兒童圖書館2015—2016年相關日期的流通量作為預測樣本。

1 建立基于人工神經(jīng)網(wǎng)絡的圖書需求量模型

1.1 人工神經(jīng)網(wǎng)絡預測模型

從圖書的流通本質出發(fā)認識和解決問題的一種研究模型需要有扎實的基礎知識,并且了解圖書需求量,準確地找出主導變量及有關輔助變量的數(shù)學邏輯關系,以數(shù)學算式的表達方式進行計算。人工神經(jīng)網(wǎng)絡預測模型結構及工作原理是使用Matlab7.0工具箱函數(shù)newrb建立一個徑向基函數(shù)(Radial Basis Function,RBF)網(wǎng)絡,利用該RBF網(wǎng)絡建立一個圖書流通量預測的模型,此模型具備較強的逼近和非線性處理能力。

當然影響圖書流通量的因子很多,主要可以分為兩個方面:定性和定量。定性方面主要包含藏書體系和館藏揭示質量、文獻借閱方式、學科和專業(yè)設置、科研學術氛圍、館員服務與管理水平等;定量方面主要有館藏數(shù)量、讀者用戶數(shù)量、開放時長、年均新書量、借閱冊次和期限等。這些因子從不同的角度和方式影響著圖書的流通次數(shù)。本文用出版社和圖書分類號作為RBF網(wǎng)絡模型的輸入,流通量作為網(wǎng)絡模型的輸出,初步建立一個基于RBF網(wǎng)絡預測圖書館需求量的模型。

1.2 徑向基函數(shù)(RBF)網(wǎng)絡

RBF網(wǎng)絡的神經(jīng)元模型,如圖1。RBF的傳遞函數(shù)就是高斯函數(shù),它是以權值和閾值向量之間的距離作為(‖

dist

‖)為自變量的,‖

dist

‖是通過輸入向量和加權矩陣的行向量的乘積得到的。徑向基網(wǎng)絡傳遞函數(shù)的原函數(shù)為:

radbas

(

n

)=

e

-當輸入自變量為0時,傳遞函數(shù)取最大值為1,隨權值和輸入向量之間距離的減少,網(wǎng)絡的輸出時遞增的,b時閾值,用來調整神經(jīng)元的靈敏度。

圖1 RBF網(wǎng)絡神經(jīng)元模型結構

1.3 徑向基函數(shù)網(wǎng)絡結構

RBF最簡模式包括三個層次。第一層為輸入層,是由信號源節(jié)點而組成;第二層為隱含層,節(jié)點函數(shù)為高斯函數(shù);第三層為輸出層。網(wǎng)絡結構形式如圖2所示。本文的神經(jīng)網(wǎng)絡輸入層節(jié)點為l8個,輸出層有4個結點,隱含層的結點數(shù)需在模型調試后才能確定。各層之間的神經(jīng)元無連接,各層內也沒有連接。

圖2 RBF網(wǎng)絡結構形式

‖dist‖模塊計算輸入R維向量p和輸入權值IW的行向量之間的距離,產(chǎn)生S維向量,然后和閾值b相乘,再通過徑向基傳遞函數(shù)得第一層輸出a,最終輸出層得輸出為:

a

=

purelin

(

LW

a

+

b

)。

1.4 RBF的工作原理

REF神經(jīng)網(wǎng)絡中有兩類待確定的參數(shù),一種是基函數(shù)中心點,另一種是寬度以及網(wǎng)絡的權值。所以,我們模型的學習過程就分為兩步走,第一步確定中心點及寬度,第二步就是權值的學習。當然第一步的確定是網(wǎng)絡模型性能的關鍵一步。本文采用Moody和Darken的學習算法(M&D算法),整個訓練學習過程分為兩個階段:非監(jiān)督學習和監(jiān)督學習。非監(jiān)督學習采用的是K-means聚類方法,這種算法是對訓練樣本的輸入量進行大量的聚類,從中找出聚類中心點Ci及參數(shù)σi,之后再進入監(jiān)督學習的階段。當中心點Ci及參數(shù)σi確立以后,REF網(wǎng)絡就會從輸入到輸出形成一個線性方程組,從而在監(jiān)督學習階段就可以采用最小二乘法,解出網(wǎng)絡模型的輸出權值ωi。

M&D算法中的K-means聚類算法,需要在事前就確立好中心點的個數(shù),這種算法給不熟悉神經(jīng)網(wǎng)絡模型的用戶帶來一些不便,中心點個數(shù)確定不合適,就有可能會對網(wǎng)絡模型造成一定影響。因此本次研究確定中心點是采用無監(jiān)督聚類最近鄰聚類算法(Nearest Neighbor-Clus-tering Algorithm),這種算法并不需要事先確定中心點個數(shù),就可以構建出比較理想的網(wǎng)絡模型,更加適合本次研究,滿足實時樣本數(shù)據(jù)自動構建網(wǎng)絡模型的要求。

2 基于人工神經(jīng)網(wǎng)絡的圖書館需求量模型實驗

2.1 圖書館需求量模型流程

圖3 圖書需求量模型建立流程圖

圖3給出了對圖書流通量預測的流程,從流程上我們看出,首先是要對樣本數(shù)據(jù)進行分析,包括對輸入、輸出量的選擇,數(shù)據(jù)準備及預處理。完成了對樣本數(shù)據(jù)分析后,接下來是網(wǎng)絡模型的建立,也就是確定輸入層、隱含層及輸出層的全部過程,模型建立完成之后,就可以對網(wǎng)絡模型進行學習訓練了,之后再利用訓練好的網(wǎng)絡模型對流通量進行預測估計。

2.2 數(shù)據(jù)的選取

本研究采用湖南省少年兒童圖書館2015—2016逐年平均日流通量,從ILASⅢ(圖書館自動化管理系統(tǒng))的流通管理中獲取流通量原始數(shù)據(jù),對數(shù)據(jù)進行分析后,估計圖書的流通量,指導新書采購的復本量,從而得出圖書的需求量。數(shù)據(jù)從ILASⅢ中的流通管理子系統(tǒng)的圖書排行榜統(tǒng)計流通借閱量。部分流通量數(shù)據(jù)如表1所示。

表1 部分流通量數(shù)據(jù)

由于本文研究的是圖書流通量預測估計問題,模型最后輸出結果為預測的圖書流通量。在實際圖書流通工作中,很多因素都和圖書流通量密切相關。這些因素不僅涉及流通管理中的各個環(huán)節(jié),而且這些環(huán)節(jié)中的各種因素是復雜的非線性關系。在建立網(wǎng)絡模型的過程中,如何選擇輸入變量將直接影響預測估計模型的準確性。

在選擇圖書流通預測估計模型的輸入變量時,首先選擇的輸入變量必須符合流通工作的實際情況,同時根據(jù)圖書采購的特點進行一些選取,減少采購人員的主觀購書。人工神經(jīng)網(wǎng)絡預測模型是個多個輸入、輸出的模型,如果輸入變量過多,導致網(wǎng)絡預測估計效果并不會很好。所以我們在選取輸入變量時,要根據(jù)預測估計模型自身的特點,盡可能選擇一些包含信息量比較大的綜合型變量和對圖書流通量影響較大且客觀的變量。我們最終選擇出版社和圖書分類為網(wǎng)絡的輸入變量,日實際流通量為網(wǎng)絡的輸出變量。

2.3 數(shù)據(jù)的準備

在對圖書流通量預測估計之前,數(shù)據(jù)的準備工作是非常重要。經(jīng)過正確適當處理的數(shù)據(jù),將對預測估計結果的準確性產(chǎn)生良好的效果,相反將會導致預測結果不理想。數(shù)據(jù)準備工作中首先選擇恰當數(shù)量的訓練學習的樣本數(shù)據(jù),如果選取樣本過少,那么模型就得不到訓練所需的足夠信息;但是如果選取太多,那么會導致網(wǎng)絡訓練時間增加,從而導致網(wǎng)絡模型的運行惡化。所以我們要根據(jù)實際情況正確選取訓練樣本數(shù)量。在數(shù)據(jù)準備中還有一個方面也要注意,不能存在互相矛盾的數(shù)據(jù),兩個樣本如果存在影響因素相同,但是目標數(shù)據(jù)不同,那么這說明兩個樣本之間是相互矛盾的,這種矛盾可以通過增加因素或者直接刪除來解決。本次研究將出版社和圖書分類為網(wǎng)絡的輸入變量,月實際流通量為網(wǎng)絡的輸出變量。我們將出版社和圖書分類用數(shù)值代替,處理前進行歸一化處理,隨機選1/2做訓練樣本,訓練網(wǎng)絡,1/4做檢驗數(shù)據(jù),1/4做預測數(shù)據(jù)。

2.4 實驗結果

使用Matlab 7.0工具箱函數(shù)建立一個RBF網(wǎng)絡,從輸入層到隱含層,采用的是一種自我適應聚類的算法,這種算法并不需要事先確定隱單元的個數(shù),完成聚類所得到的RBF網(wǎng)絡是最優(yōu)的算法。此算法選擇一個適合的高斯函數(shù)寬度R,取第1個樣本作為一個聚類中心,令C1=X1計算樣本1與樣本2間的距離,若|X1-X2|≤R,則X2為X1的最近鄰聚類;若|X1-X2|>R,則將X2作為一個新的聚類中心;當取第K個樣本時,已有M個中心了。那么就分別計算XM與這M個樣本的中心距離,若|Xk-Xi|是距離中最小的,那么Xi是Xk的最近鄰聚類,若|Xk-Xi|>R,那么Xk作為一個新聚類中心,設定平方和誤差參數(shù)為0.001,同時完成網(wǎng)絡模型的訓練學習;仿真網(wǎng)絡學習是通過使用sim函數(shù),產(chǎn)生關聯(lián)的網(wǎng)絡輸出值,并繪出相關的曲線圖。訓練前要求要提供輸入矢量、對應目標矢量與徑向基函數(shù)的擴展常數(shù)C。在本次試驗中對徑向基函數(shù)的擴展常數(shù)C值我們選1、3、6、9、14、20、進行比較,以獲得最佳C值,達到較快的速率與較好的精度。目標誤差是0.001,對網(wǎng)絡的輸出矢量與目標矢量進行訓練樣本的誤差分析,用建立的網(wǎng)絡,進行仿真,對網(wǎng)絡的輸出矢量與目標矢量進行檢驗樣本的誤差。分別見下圖。我們比較圖6、8、10、12、14、16,不同C值的檢驗誤差,可以判斷在C為3時的效果最好,其檢驗誤差在0.005左右。

圖5 訓練誤差曲線(C=1)

圖6 檢驗誤差曲線(C=1)

圖7 訓練誤差曲線(C=3)

圖8 檢驗誤差曲線(C=3)

圖9 訓練誤差曲線(C=6)

圖10 檢驗誤差曲線(C=6)

圖11 訓練誤差曲線(C=9)

圖12 檢驗誤差曲線(C=9)

圖13 訓練誤差曲線(C=14)

圖14 檢驗誤差曲線(C=14)

圖15 訓練誤差曲線(C=20)

圖16 檢驗誤差曲線(C=20)

2.5 所建模型的應用

用“save netoknet”,命令把訓練好的神經(jīng)網(wǎng)絡固化到netok.mat中,調用時,用“l(fā)oad netok”,其中環(huán)境中“net”為所訓練的網(wǎng)絡。其網(wǎng)絡結構如下:

結構屬性(architecture):

輸入向量數(shù)目(numInputs):1

網(wǎng)絡層數(shù)(numLayers):2

閾值連接屬性(biasConnect):[1;1]

輸入連接屬性(inputConnect):[1;0]

層連接屬性(layerConnect):[0 0;1 0]

輸出連接屬性(outputConnect):[0 1]

期望輸出向量連接屬性(targetConnect):[0 0]

子對象屬性(subobject structures):

輸入向量(inputs):1x1的細胞矩陣

網(wǎng)絡層layers:2x1的細胞矩陣

輸出層outputs:1x2的細胞矩陣,包含1輸出

期望輸出向量targets:1x2的細胞矩陣

閾值向量biases:2x1的細胞矩陣包含2個閾值

輸入權值inputWeights:2x1的細胞矩陣包含1個輸入權值

層權值layerWeights:2x2的細胞矩陣

權值和閾值屬性(weight and bias values):

輸入權值矩陣IW:2x1的細胞矩陣

層間權值矩陣LW:2x2的細胞矩陣

閾值向量b:2x1的細胞矩陣包含2個閾值向量

由表2可以看出,對高流通的書估計還不準確,對低的流通量的書,預報誤差較小,性能可以滿足實際應用的需要.其對高流通的書估計不準確的原因可能由于樣本的選擇受干擾,而未包括全部可能的模式。設計訓練樣本時。將樣本的模式集中于這一區(qū)城,網(wǎng)絡對這一區(qū)域的預測可達到很高的精度。但是網(wǎng)絡投入使用后,其他使用者可能會發(fā)現(xiàn)網(wǎng)絡對其他區(qū)域的預測精度很低。高流通量的書比例少,如流通量在7次以上,僅占0.083%,我們又采用隨機抽樣,導致含高流通量的書訓練樣本少,導致準確度不高。要注意在選擇訓練樣本時,各種可能模式間的平衡。訓練樣本中不僅要包括每種類型,而且每種類型所具有的訓練樣本數(shù)要平衡,不能偏重于某種類型。

表2 預測誤差

圖書流通量預測是一個復雜的、非線性的過程,我們必須尋找適合非線性的手段來開展研究工作。用徑向基函數(shù)網(wǎng)絡建模來實現(xiàn)對圖書流通量的預測估計,從模型得出的結果與實際觀測值對比,還是具有比較高的預測精度。用人工神經(jīng)網(wǎng)絡法進行預測時,并不需建立復雜的顯性關系,一些非專業(yè)人員只要對數(shù)據(jù)進行簡單的預處理,就可以建立一個預測估計模型,方法非常簡便實用。本文的研究結果僅僅是一個開始,如何在實際流通、采購過程中使網(wǎng)絡模型更加本地化、更具針對性,需進一步的研究,從而進一步提高圖書流通量的預測精度。

3 結 語

本文首先從ILASⅢ提取流通數(shù)據(jù),并隨機選取了湖南省少年兒童圖書館 5 000 種圖書在2015—2016年度的平均日流通量數(shù)據(jù),然后對現(xiàn)有數(shù)據(jù)庫進行了篩選、分析和研究。在此基礎上,把出版社和圖書分類作為網(wǎng)絡的輸入變量,把實際流通量為網(wǎng)絡的輸出變量。將出版社和圖書分類用數(shù)值代替,處理前進行歸一化處理,隨機選1/2做訓練樣本,訓練網(wǎng)絡,1/4做檢驗數(shù)據(jù),1/4做預測數(shù)據(jù)。對網(wǎng)絡的輸出矢量與目標矢量進行訓練樣本的誤差分析,用建立的網(wǎng)絡,進行仿真,對網(wǎng)絡的輸出矢量與目標矢量進行檢驗樣本的誤差分析。我們通過使用圖書流通量的實際數(shù)據(jù),運用RBF網(wǎng)絡進行了圖書需求量模型預測。

從實驗結果來看,取得了比較理想的結果,說明該模型用于圖書需求量預測是可行的,具有一定的參考意義。

[1]朱軼婷,李 霖,韓玉巧.利用流通數(shù)據(jù)指導制定文獻資源建設策略的實證研究——以中國民航大學圖書館為例[J].圖書館雜志,2016(12):48—54.

[2]劉 濤,閆其春.一種基于本體的圖書館績效評價模型[J].情報探索,2016(4):67—70.

[3]李國輝.基于權值直接確定神經(jīng)網(wǎng)絡的采購提前期預測模型[J].科技風,2016(6):24—25.

[4]范一文.基于徑向基函數(shù)神經(jīng)網(wǎng)絡的高校圖書館用戶滿意度評價模型[J].農(nóng)業(yè)圖書情報學刊,2016(3):10—13.

[5]蔣鴻標.我國圖書館紙本藏書評價理論研究述評[J].圖書館,2016(5):55—60.

[6]葉蘭平,劉 鋒,朱二周.基于徑向基神經(jīng)網(wǎng)絡的新型協(xié)同過濾推薦算法[J].計算機應用與軟件,2016(11):180—184.

[7]龍 億,杜志江,王偉東.GA優(yōu)化的RBF神經(jīng)網(wǎng)絡外骨骼靈敏度放大控制[J].哈爾濱工業(yè)大學學報,2015(7):26—30.

[8]劉志剛,許少華,李盼池,等.基于極限學習離散過程神經(jīng)網(wǎng)絡的示功圖識別[J].信息與控制,2016(5):627—633.

猜你喜歡
權值人工神經(jīng)網(wǎng)絡誤差
基于人工神經(jīng)網(wǎng)絡的Ni-ZrO2納米鍍層耐腐蝕性能預測
人工神經(jīng)網(wǎng)絡發(fā)展歷史與訓練算法概述
隧道橫向貫通誤差估算與應用
隧道橫向貫通誤差估算與應用
基于人工神經(jīng)網(wǎng)絡的優(yōu)化配置研究
精確與誤差
財務風險跟蹤評價方法初探
基于洪泛查詢的最短路徑算法在智能交通系統(tǒng)中的應用
基于人工神經(jīng)網(wǎng)絡的經(jīng)濟預測模型
壓力表非線性誤差分析與調整
甘泉县| 恩平市| 定日县| 沅陵县| 呈贡县| 永寿县| 连城县| 新竹县| 麻江县| 彭泽县| 澄迈县| 昌黎县| 崇文区| 嘉祥县| 汶川县| 灯塔市| 禹城市| 乐业县| 平果县| 韶关市| 那坡县| 远安县| 邵东县| 瑞安市| 凉城县| 临猗县| 沁水县| 中阳县| 桓仁| 淮滨县| 兰西县| 黄陵县| 南平市| 罗城| 弋阳县| 荥阳市| 云林县| 蒙阴县| 普兰县| 楚雄市| 乐至县|