戴曉娟
(寧夏師范學院 數(shù)學與計算機科學學院,寧夏 固原 756000)
基于最大熵原理的人口預測模型的最優(yōu)控制
戴曉娟
(寧夏師范學院 數(shù)學與計算機科學學院,寧夏 固原 756000)
本文提出一種基于最大信息熵的人口預測模型,該模型以熵函數(shù)作為目標函數(shù),以已知數(shù)據(jù)的各階統(tǒng)計距作為約束條件,通過最大化熵來預測人口的發(fā)展狀況.并通過現(xiàn)有數(shù)據(jù),對我國未來人口分布做了相應的預測.
最大熵;預測;模型;最優(yōu)控制
人類社會發(fā)展到今日,面臨著一系列嚴峻的挑戰(zhàn),諸如戰(zhàn)爭與和平、生態(tài)失衡、人口爆炸、環(huán)境污染、資源短缺等.其中尤為突出是人口問題,因為人口的發(fā)展影響和制約著經濟的發(fā)展,而經濟的發(fā)展則關乎社會的進步,人類的文明,它們之間是相輔相成的.
以中國為例,由于我國是一個人口大國,我們所面臨的人口問題,不僅有人口數(shù)量控制的問題,更重要的是面臨著復雜的人口流動、管理、保障和發(fā)展的問題.在這一過程中,如何遵循以人為本的科學發(fā)展觀,遵循經濟規(guī)律和人口變動規(guī)律,最大限度的實現(xiàn)社會公正,是新時期人口發(fā)展和管理面臨的新課題.正確認識人口變動特征,則是解決人口問題的前提.
根據(jù)全國第六次人口普查數(shù)據(jù)的顯示,我國人口有如下顯著特點:
(1)人口增速減緩,經濟社會發(fā)展推動生育率的進一步下降
(2)“未富先老”人口老齡化加劇
(3)城市化水平提速,中國已經進入城市人口快速增長期
(4)出生人口性別比例失衡,制約經濟發(fā)展和社會穩(wěn)定
(5)流動人口成正增長趨勢,影響社會的發(fā)展
此研究報告說明,人口老齡化速度加快,高齡趨勢明顯,這顯然也會影響到將來的人口發(fā)展.因此我們建立偏微分方程對我國將來的人口數(shù)量作出更加合理的估計.即假設人口的數(shù)量不僅和時間t有關,還與年齡x有關.
其中t>0為時間,x為人的年齡,均為連續(xù)變量,p(x,t)為人口密度函數(shù),μ(x,t)為死亡率,F(xiàn)(x,t)為給定時刻t年齡小于x的人口分布函數(shù).這個連續(xù)型人口發(fā)展方程描述了人口的演變過程,從這個方程確定出的密度函數(shù)可以直接得到各個年齡的人口數(shù),即人口分布函數(shù).
本文在此模型的基礎上提出一種基于最大信息熵的人口預測模型,該模型以熵函數(shù)作為目標函數(shù),以已知數(shù)據(jù)的各階統(tǒng)計距作為約束條件,通過最大化熵來預測人口的發(fā)展狀況.
2.1 基本原理
熵最初來源于熱力學.在哲學和統(tǒng)計物理中被解釋為物質系統(tǒng)的混亂和無序程度.信息論則認為它是信息源的狀態(tài)的不確定程度.所謂熵增加原理,是指孤立系統(tǒng)向著微觀狀態(tài)最混亂的方向變化,直到熵達到最大.
1948 年,香農把波爾茲曼熵的概念引入信息論并把熵作為度量一個隨機事件的平均不確定性.因此,信息數(shù)量的大小,可以用被消除的不確定性的多少來表示,而隨機事件的不確定性的大小可以用概率分布函數(shù)來描述.
如果隨機變量為離散型,X的取值為xi,i=1,2,…,n,xi出現(xiàn)的概率為,則包含其中H是p1,p2,…,pn的信息量為的連續(xù)函數(shù),當且僅當p1=p2=…=pn時,H取最大值.
如果隨機變量X是連續(xù)分布的,其分布密度函數(shù)為p(x),X熵定義為
基于熵的定義,可以直觀地說明最大熵分布原理:使其熵在一些約束條件下達可以到最大值,即
maxH(X)=-R∫p(x)logp(x)dx
式中,μn為第n階原點矩,其值可由樣本數(shù)據(jù)計算出來,N為所用原點矩的階數(shù).
2.2 求解方法
最大熵分布就是在保證樣本的統(tǒng)計特性條件下通過調整p(x)使熵H達到最大.現(xiàn)用經典的變分法求解目標函數(shù)的極值問題.
引入拉格朗日乘子λ0,λ1,…,λn,令
3.1 模型選取
由于偏微分方程考慮了年齡對人口增長的影響,能夠更精確地描述人口年齡的結構及發(fā)展趨勢,故選取我國1990年到2010年的人口數(shù)據(jù).
鑒于模型(1)屬二維概率分布,有兩個變量,所以取時間為任意固定值,密度函數(shù)的變化決定人口的分布.我們首先來確定時刻t年齡為x的人口死亡率μ(t,x),由于現(xiàn)階段由于醫(yī)療水平等條件的限制,可以近似地認為在一定時期內人口死亡率是保持不變的,即認為μ(t,x)僅僅是年齡x的函數(shù)μ(x).利用提供的數(shù)據(jù)進行數(shù)據(jù)擬合,得到的年齡與死亡率之間的函數(shù)關系為:
3.3 根據(jù)特征值矩陣求出各個約束條件,應用最大熵原理求出特征估計的分布函數(shù),得到一個預測的人口分布函數(shù)pi,根據(jù)式(1),(2)可得
其中x為人口的年齡變量,是預測問題的變量.通過調整p來使得熵最大,并采用拉格朗日乘子法來求解此問題.
式(10)就是最大熵概率密度函數(shù)的解析形式.將式(10)代入式(3)可得
整理后可得
把(9)式代入(6)式,即可得到此人口的概率密度函數(shù)確定的最大熵.再把(5)與(9)式代入(1)式,可得到人口的結構預測和人口分布結果.
通過以上所述模型的建立過程及相應的算法,運用歷年的統(tǒng)計數(shù)據(jù),借助Matlab軟件對我國人口分布作中長期(2020年~2050年)預測,求得以下結果:
圖1
圖2
由圖1可以看出,我國人口結構老齡化進程加速,在2050年左右達到高峰,隨機趨穩(wěn).圖2得出,到2020年鄉(xiāng)鎮(zhèn)人口大批涌入城市,城市人口飽和.除此,還可以看出,在實現(xiàn)穩(wěn)定低生育水平的前提下,由于人口基數(shù)大,未來相當一個時期人口還將持續(xù)增長,但由于計劃生育政策的執(zhí)行使我國人口得以控制,在40到50年以后將達到零增長.
利用最大熵原理分析人口密度函數(shù),從而確定人口分布函數(shù),得到的對未來人口結構和分布的預測情況.我國人口的年齡變化是一種隨機事件,最大熵方法確定的被測量分布是含有最少主觀假定的分布,因此用最大熵原理來預測其分布是可靠的.
〔1〕朱雪龍.應用信息論基礎[M].北京:清華大學出版社,2001.
〔2〕沈世鎰,吳忠華.信息論基礎與應用[M].北京:高等教育出版社,2004.7.
〔3〕徐宗學.熵極大識別準則及其應用[J].武漢水力電力學院學報,1987.
〔4〕馬力,張學文.最大熵原理與概率分布函數(shù)[M].數(shù)理統(tǒng)計與應用概率,1993.
〔5〕馮利華,張萍.基于最大熵原理的臺風統(tǒng)計預報[J].海洋科學,2003,27(3):47-51.
〔6〕朱成騏,孫宏斌,張伯明.基于最大信息熵原理的短期負荷預測綜合模型[J].中國電機工程學報,2005(l0):1-6.
〔7〕李環(huán),高全勝,李育武,周靜.中國人口增長的狀態(tài)空間預測模型 [J].武漢工業(yè)學院學報,2009,28 (1):101-105.
O232
A
1673-260X(2014)04-0016-03
本文系校科研項目(YB201347)