国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于最大熵原理的圖書館流通借閱統(tǒng)計(jì)分析

2010-09-20 06:24:42尹曉旭
圖書館學(xué)刊 2010年2期
關(guān)鍵詞:航空航天頻數(shù)原點(diǎn)

尹曉旭 王 彥

(北京航空航天大學(xué)圖書館,北京 100191)

圖書館藏書流通是圖書館工作的重要組成部分,館藏圖書的流通統(tǒng)計(jì)一直是圖書館統(tǒng)計(jì)工作的主要對(duì)象。目前已有的館藏圖書流通統(tǒng)計(jì)研究提出了多種分析方法[1-3],主要采用的方法是:獲取樣本、對(duì)樣本數(shù)據(jù)進(jìn)行處理、假設(shè)分布型式、估計(jì)假設(shè)分布參數(shù)、檢驗(yàn)假設(shè)分布。王健、蔡智澄等學(xué)者[1,2],就圖書館流通讀者統(tǒng)計(jì)數(shù)據(jù)引入概率統(tǒng)計(jì)方法,闡述了數(shù)理統(tǒng)計(jì)的數(shù)據(jù)分析方法和步驟,以上方法都是基于最小方差的統(tǒng)計(jì)分析方法。

筆者以本館2009年上半年航空航天類圖書借閱量為樣本,運(yùn)用統(tǒng)計(jì)學(xué)原理,引入熵的概念,采用基于最大熵原理的方法分析流通借閱數(shù)據(jù),以期探索出一種圖書館流通統(tǒng)計(jì)的新方法。

1 熵的概念及計(jì)算方法

傳統(tǒng)的隨機(jī)分布統(tǒng)計(jì)大多針對(duì)高斯正態(tài)分布,僅考慮其期望和方差。然而,非高斯分布廣泛存在,期望和方差已不能完全反映其特性。作為信息論、通信理論和熱力學(xué)理論的一個(gè)基本概念,熵是一種描述隨機(jī)變量的隨機(jī)性或者不確定性的度量。

香農(nóng)(Shannon CE)認(rèn)為,信息是人們對(duì)事物了解的不確定性的消除或減少。1948年,他把玻爾茲曼熵的概念引入到信息論中,把不確定的程度稱為信息熵。信息熵是描述事物無(wú)序性的參數(shù),熵越大則無(wú)序性越強(qiáng)。

Jaynes證明,對(duì)隨機(jī)事件的所有相容的預(yù)測(cè)(相容預(yù)測(cè)是指符合已知的某些參數(shù)與隨機(jī)事件相關(guān)條件的某種對(duì)隨機(jī)事件分布的預(yù)測(cè))中,熵最大的預(yù)測(cè)出現(xiàn)的概率占絕對(duì)優(yōu)勢(shì)。

Tribus證明,正態(tài)分布、伽瑪分布、指數(shù)分布等都是最大熵原理的特殊情況。最大熵統(tǒng)計(jì)建模是以最大熵理論為基礎(chǔ)的一種選擇模型的方法,即從符合條件的分布中選擇熵最大的分布作為最優(yōu)的分布。

樣本容量為觀測(cè)的總天數(shù)n,對(duì)n個(gè)樣本進(jìn)行分組,組數(shù)為k。樣本值落入第i個(gè)區(qū)間的個(gè)數(shù)稱為頻數(shù)。由頻數(shù)與概率的關(guān)系可知,樣本值落入第i個(gè)區(qū)間內(nèi)的頻數(shù)近似等于隨機(jī)變量X落入第i個(gè)區(qū)間內(nèi)的概率。

隨機(jī)事件的信息熵[4]:設(shè)隨機(jī)變量 ζ,它有 A1,A2,……,An共n種可能的結(jié)局,每個(gè)結(jié)局出現(xiàn)的概率分為p1,p2,……,pn,則其不確定程度,即信息熵為:

一個(gè)系統(tǒng)的熵就是它的無(wú)組織程度的度量,熵越大,事件越不確定,熵等于0,事件是確定的?;陟氐亩x,可以直觀地說(shuō)明最大熵分布原理。最小偏見的概率分布是這樣一種分布,使其熵在根據(jù)已知樣本數(shù)據(jù)信息的一些約束條件下達(dá)到最大值。由概率分布密度函數(shù)的規(guī)范性公理,以及n階原點(diǎn)矩的定義,可得如下優(yōu)化算法:

其中,(fx)為分布密度函數(shù),R為積分限,μn為n階原點(diǎn)矩。最大熵概率分布函數(shù)為原點(diǎn)矩為這實(shí)際上是一個(gè)非線性優(yōu)化問(wèn)題。

利用最優(yōu)化定理,拉格郎日乘子參數(shù) λ(nn=0,1,…,N)滿足如下關(guān)系式:

由樣本值求解原點(diǎn)矩μn,求解λn(n=1,…,N)的聯(lián)立方程組。則所研究的問(wèn)題可轉(zhuǎn)化為如下優(yōu)化算法[5]:

算法實(shí)現(xiàn)流程:

①根據(jù)已知樣本數(shù)據(jù),計(jì)算各階原點(diǎn)矩

②選擇積分限為:R

③建立優(yōu)化模型式

④調(diào)用優(yōu)化算法子程序

⑤判斷,若滿足優(yōu)化條件轉(zhuǎn)⑦;否則轉(zhuǎn)⑥

⑥用另一初始點(diǎn)重新計(jì)算,轉(zhuǎn)④

⑦輸出參數(shù)λn(n=0,1,…,N)

2 借閱量統(tǒng)計(jì)分析方法

北京航空航天大學(xué)是一所具有航空航天特色和工程技術(shù)優(yōu)勢(shì)的多學(xué)科、開放式、研究性大學(xué),圖書館在藏書建設(shè)上注重航空航天特色,匯集了大量關(guān)于航空航天事業(yè)發(fā)展、航空航天工程技術(shù)等方面的圖書資料。航空航天類圖書的利用率和流通情況可以反映出北航主要讀者群對(duì)圖書館的實(shí)際利用情況。因此,該類圖書的借閱量具有一定的代表性。筆者以2009年2月14日至2009年7月16日時(shí)間區(qū)間內(nèi)航空航天類圖書每天的借閱量為樣本進(jìn)行統(tǒng)計(jì)分析。

在此區(qū)間,除公共節(jié)假日以及其他情況的閉館外,借還臺(tái)總共開放134天。每天的借出量最大值為163本,最小值為15本。選擇采樣區(qū)間(8,170)作為樣本的取值區(qū)間,將其等分為18個(gè)小區(qū)間,求出頻數(shù),列出頻數(shù)分布表1。

表1 流通借閱頻次分布表

由優(yōu)化算法可給出隨機(jī)變量的分布函數(shù)為:

對(duì)于所求得的隨機(jī)變量分布函數(shù),可以由期望的借閱量x求出其發(fā)生的頻率f(x)。

根據(jù)表1數(shù)據(jù)畫出頻率的柱狀圖(見圖1),橫坐標(biāo)表示借閱數(shù)據(jù)分組排序,縱坐標(biāo)是借閱頻數(shù),圖中曲線是最大熵?cái)M合分布曲線。

由圖1可見,除第3組數(shù)據(jù)外,該分布較好地?cái)M合了樣本值。這說(shuō)明流通服務(wù)的人員和設(shè)備配置比較科學(xué)合理地滿足了師生的需求。至于第3組存在較大擬合誤差的原因,經(jīng)過(guò)調(diào)查得知,處于該組借閱數(shù)據(jù)的日期,多是節(jié)假日前后,讀者借閱行為與平日有較大不同。

由此可見,最大熵方法可以為圖書館合理配置人員與設(shè)備、提高圖書館流通的管理水平提供科學(xué)依據(jù),從而為廣大師生提供更優(yōu)質(zhì)的服務(wù)。

圖1 流通借閱的最大熵統(tǒng)計(jì)模型

3 結(jié)論

利用最大熵優(yōu)化所得的概率分布函數(shù)能夠表達(dá)不同統(tǒng)計(jì)分布形式的隨機(jī)變量的統(tǒng)計(jì)性,具有廣泛的適應(yīng)性[6]。在圖書館流通統(tǒng)計(jì)中與已有的方法相比,具有適用范圍廣、算法簡(jiǎn)便的特點(diǎn),可為流通統(tǒng)計(jì)提供一種有效的方法。同時(shí),這種方法可以推廣應(yīng)用到圖書館的其他統(tǒng)計(jì)工作中。計(jì)算中也發(fā)現(xiàn),使用最大熵方法時(shí)也需注意以下問(wèn)題:樣本量選取不宜太小,太小將不能完全反映樣本各階矩的特性;積分限選取比較重要;初始值選擇不合適將影響算法的收斂性和收斂速度。此外,如何考慮一些不確定因素、邊界條件不穩(wěn)定等情況對(duì)借閱量統(tǒng)計(jì)分析的影響,也是需要研究的課題。

[1] 王?。咝D書館流通系統(tǒng)讀者分布分析及假設(shè)檢驗(yàn)[J].情報(bào)探索,2008(12):100-102.

[2] 蔡智澄,張根彬.圖書館流通系統(tǒng)讀者分布密度及回歸分析.情報(bào)業(yè)務(wù)研究,2004(3):114-115.

[3] 武晉媛.以流通統(tǒng)計(jì)分析驗(yàn)證館藏結(jié)構(gòu)的合理性[J].晉圖學(xué)刊,2009(3):57-59.

[4] 吳乃龍,袁素云.最大熵方法.長(zhǎng)沙:湖南科學(xué)技術(shù)出版社,1991.

[5] 俞禮軍,嚴(yán)海,嚴(yán)寶杰.最大熵原理在交通流統(tǒng)計(jì)分布模型中的應(yīng)用[J].交通運(yùn)輸工程學(xué)報(bào),2001(3):91-94.

[6] 高翔,鄭建祥.基于最大熵概念的復(fù)雜隨機(jī)變量統(tǒng)計(jì)模型[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2008(2):43-46.尹曉旭 女,1961年生。館員,主要研究方向:圖書館學(xué)、統(tǒng)計(jì)學(xué)。

猜你喜歡
航空航天頻數(shù)原點(diǎn)
第十五屆航空航天月桂獎(jiǎng)
航空世界(2022年10期)2022-12-08 03:02:30
第十五屆航空航天月桂獎(jiǎng)
軍工文化(2022年7期)2022-08-24 11:07:08
Book Pilot 飛行選書師,讓書重新回到原點(diǎn)
重返歷史“原點(diǎn)”的旅程
在原點(diǎn)震蕩的擾動(dòng)Schr?dinger-Poisson系統(tǒng)的無(wú)窮多個(gè)解
中考頻數(shù)分布直方圖題型展示
學(xué)習(xí)制作頻數(shù)分布直方圖三部曲
關(guān)于原點(diǎn)對(duì)稱的不規(guī)則Gabor框架的構(gòu)造
一飛沖天——中國(guó)航空航天史
頻數(shù)和頻率
阿合奇县| 宜川县| 台前县| 黄陵县| 元谋县| 东阳市| 龙州县| 上犹县| 阳山县| 行唐县| 连云港市| 新蔡县| 邵东县| 蓬莱市| 武定县| 淮阳县| 萍乡市| 孙吴县| 黄龙县| 桂平市| 双城市| 海宁市| 翼城县| 梁河县| 曲阜市| 涿鹿县| 利川市| 达尔| 乳山市| 田东县| 德令哈市| 海阳市| 雷州市| 县级市| 清流县| 汕头市| 静乐县| 苏尼特左旗| 阜新市| 浑源县| 体育|