国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于OMP算法的人口出生率影響因素分析

2020-04-11 02:04:58
關(guān)鍵詞:出生率殘差原子

田 青

(西安財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院 陜西 西安 710100)

一、引言

(一)研究背景

隨著信息技術(shù)的快速發(fā)展,每天都會(huì)產(chǎn)生大量的數(shù)據(jù),如何有效地從中挖掘出有用的信息越來越受到人們的關(guān)注,傳統(tǒng)的數(shù)據(jù)處理技術(shù)已經(jīng)無法滿足實(shí)際需要。因此,研究新的數(shù)據(jù)信號(hào)處理技術(shù)十分必要,很多學(xué)者也十分重視這個(gè)問題的研究。傳統(tǒng)的奈奎斯特(Nyquist)采樣定律要求采樣頻率必須大于原始信號(hào)最高頻率的2倍,這樣才能盡可能多的保留原始信號(hào)的信息,才能更高質(zhì)量、高精確的進(jìn)行信號(hào)無失真?zhèn)鬏?。而現(xiàn)代龐大數(shù)據(jù)量的信號(hào),運(yùn)用奈奎斯特定律進(jìn)行采樣,將需要更大的存儲(chǔ)和傳輸代價(jià)。隨后Donoho[1]、Candes[2]等人提出了一種新型的信號(hào)處理技術(shù)——壓縮感知(CS)。壓縮感知技術(shù)不僅大幅地縮短了信號(hào)的處理時(shí)間,而且也大大降低了傳輸和存儲(chǔ)的成本。壓縮感知技術(shù)很好地解決了奈奎斯特采樣定律的限制問題,且效率更高。因此,壓縮感知在各領(lǐng)域都有很廣泛的應(yīng)用。由于貪婪算法相對(duì)較快,受到學(xué)者們廣泛關(guān)注,本文將用貪婪算法中的OMP(正交匹配追蹤)算法對(duì)人口出生率的影響因素進(jìn)行研究。

自21世紀(jì)以來,隨著計(jì)劃生育工作的開展,中國進(jìn)入了低生育率水平。目前,我國人口結(jié)構(gòu)發(fā)生了很大的轉(zhuǎn)變,勞動(dòng)人口大幅減少,人口老齡化問題日益嚴(yán)重,這很不利于一個(gè)國家的可持續(xù)發(fā)展。在此情況下,我國逐步放開了計(jì)劃生育政策,并在2015年全面放開了二孩生育限制。然而,根據(jù)目前的結(jié)果來看,放開的計(jì)劃生育政策并沒有達(dá)到預(yù)想的結(jié)果。由此可知,目前我國的低生育水平受很多因素影響,因此,研究人口出生率的影響因素至關(guān)重要。

(二)研究現(xiàn)狀

CS理論在信號(hào)處理等多個(gè)領(lǐng)域得到了廣泛的應(yīng)用。

目前,CS理論的發(fā)展主要涉及三個(gè)核心問題:稀疏表示、編碼測(cè)量和信號(hào)重構(gòu),其中重構(gòu)算法是決定信號(hào)是否可以準(zhǔn)確重構(gòu)的關(guān)鍵步驟,因?yàn)橹貥?gòu)算法決定了被恢復(fù)的信號(hào)在各項(xiàng)方面是否能滿足要求。CS重構(gòu)算法的經(jīng)典算法之一是基追蹤算法(Basis pursuit,BP)[3],它將l0極小化問題松弛為l1極小化問題,將非凸優(yōu)化問題轉(zhuǎn)化為凸優(yōu)化問題。貪婪算法也是重構(gòu)算法一個(gè)很好的選擇,其中最優(yōu)秀的一類算法是匹配追蹤(Matching pursuit)類算法,它是根據(jù)匹配追蹤(Matching pursuit,MP)算法延伸而來的[4],之后又有許多研究人員對(duì)其進(jìn)行了更深的研究和改進(jìn),提出了正交匹配追蹤(Orthogonal matching pursuit,OMP)算法[5]。學(xué)者們將CS應(yīng)用于人臉識(shí)別、語音識(shí)別、雷達(dá)定位、遙感成像等諸多領(lǐng)域,對(duì)其展開了廣泛的研究并取得了許多成果。

人口問題與經(jīng)濟(jì)發(fā)展密切相關(guān),是我國現(xiàn)階段面臨的重大問題之一。Friedlander和Silver(1967)[6]通過研究發(fā)現(xiàn),每個(gè)國家在不同的發(fā)展階段,人口出生率與經(jīng)濟(jì)增長(zhǎng)變量具有不同的關(guān)系。彭浩然(2014)[7]認(rèn)為,中國目前低出生率的轉(zhuǎn)變使得中國人口老齡化問題日益顯現(xiàn)。袁小平(2014)[8]等運(yùn)用人口年齡結(jié)構(gòu)系數(shù)及其對(duì)人口出生率變動(dòng)影響的貢獻(xiàn)率指標(biāo)證實(shí)人口年齡結(jié)構(gòu)對(duì)出生率有顯著影響。向超(2016)[9]應(yīng)用逐步回歸方法建立回歸模型,結(jié)果表明負(fù)擔(dān)少年系數(shù)、政府財(cái)政在教育醫(yī)療和社會(huì)保障方面的支出對(duì)人口出生率產(chǎn)生了顯著的影響。張煒和朱家明(2017)[10]采用ARIMA和二次指數(shù)平滑法對(duì)人口進(jìn)行組合預(yù)測(cè)。華瑞和李雙亮(2018)[11]采用逐步回歸法和廣義差分法對(duì)模型的多重共線性和序列相關(guān)性進(jìn)行修正,得出少兒撫養(yǎng)比與老年撫養(yǎng)比是影響人口出生率的主要因素。劉麗萍(2018)[12]采用Lasso回歸法探討影響人口出生率的因素,結(jié)果研究表明,國內(nèi)生產(chǎn)總值、人均薪酬、少年兒童撫養(yǎng)比對(duì)人口出生率有明顯的正向影響。

除了這些已知的影響因素外,還有哪些因素影響著人口出生率呢?本文選取了20個(gè)影響因素,采用OMP算法,從多個(gè)方面來研究影響人口出生率的影響因素。

二、OMP算法的相關(guān)理論

(一)壓縮感知理論模型

假設(shè)有一個(gè)有限長(zhǎng)的一維離散時(shí)間原始信號(hào)向量x∈RN,可以看作是一個(gè)N×1維的列向量,其本身就是稀疏的,非零元素的個(gè)數(shù)為K,即稀疏度為K(K?N),測(cè)量信號(hào)向量y∈RM的長(zhǎng)度為M,Φ∈RM×N是(M×N(M?N))維的測(cè)量矩陣。測(cè)量信號(hào)向量y等于原始信號(hào)向量x乘以測(cè)量矩陣Φ,表達(dá)公式為:

y=Φx

(2.1)

壓縮感知的信號(hào)重建就是用已知的測(cè)量信號(hào)向量y和測(cè)量矩陣Φ來進(jìn)行信號(hào)重建的過程,由式(2.1)可知,用M個(gè)方程可以解出N個(gè)未知數(shù),因此我們可以通過求解一個(gè)最優(yōu)化問題來重建信號(hào)。當(dāng)滿足式(2.2)時(shí),可以利用測(cè)量信號(hào)向量y和測(cè)量矩陣Φ很大概率上實(shí)現(xiàn)信號(hào)重建[13]。

M≥cKlog(N/K)?N

(2.2)

其中,c是一個(gè)極小值。

如果原始信號(hào)x∈RN不是稀疏的,但可以通過稀疏基變換將其轉(zhuǎn)化為另外一個(gè)域的稀疏信號(hào),此時(shí)可以稱x在稀疏基域是稀疏的,即x通過由N個(gè)標(biāo)準(zhǔn)正交基構(gòu)成的M×N維稀疏基矩陣Ψ變換到Ψ域,此時(shí)x可以表示為:

x=Ψs

(2.3)

此時(shí)s是x在Ψ域的表示向量,是一個(gè)長(zhǎng)度為N的列向量,如果這里s是稀疏的,即非零元素的個(gè)數(shù)為K且K?N,則可以說x是一個(gè)在Ψ域上的K-稀疏信號(hào)。如今最常用的稀疏基主要有余弦變換基、小波變換基等。

則式(2.1)可以表示為:

y=Φx=ΦΨs=As

(2.4)

其中A=ΦΨ,是一個(gè)M×N維的矩陣,稱為恢復(fù)矩陣。這里要注意的是基矩陣可以是一個(gè)過完備字典也可以是一個(gè)原子庫[14],也就是說它可以是一個(gè)M×N(Z≥N)維的矩陣,這樣只要非稀疏信號(hào)在過完備字典或原子庫里可以稀疏表示即可。

根據(jù)式(2.4)、(2.1)可以發(fā)現(xiàn),對(duì)本不是稀疏的原始信號(hào)x,同樣也可以通過本就是稀疏信號(hào)的重建方法來進(jìn)行信號(hào)重建,即利用信號(hào)的重建算法重建出s,再用式(2.3)得到信號(hào)x。

(二)OMP算法的基本思想

OMP算法是基于貪婪算法的思想通過每次迭代選擇一個(gè)局部最優(yōu)解來逐步逼近原始信號(hào),基于MP算法的原子選擇準(zhǔn)則來更新原子的支撐集,通過對(duì)原子集合正交化來保證迭代的最優(yōu)性,進(jìn)而減少到達(dá)收斂的迭代次數(shù)[44]。MP算法是最早的一種貪婪迭代算法,但由于每次迭代的結(jié)果可能不是最優(yōu)的,而是次最優(yōu)的。因此需要經(jīng)過多次的迭代才能獲得最優(yōu)的收斂結(jié)果。而OMP算法可以有效地解決這個(gè)問題,它沿用了MP算法中的原子選擇準(zhǔn)則,在重建時(shí)每次迭代可以得到支撐集的一個(gè)原子,通過遞歸對(duì)已選擇的原子集合進(jìn)行正交化來保證迭代的最優(yōu)性,從而加快的收斂的速度并減少了迭代的次數(shù)。

OMP算法的基本思想是:以貪婪迭代的方法來確定傳感矩陣的列,保證在之后每次選取的列和現(xiàn)階段的冗余向量盡可能的接近,將采樣向量中的多余部分去除。在每次迭代時(shí),計(jì)算當(dāng)前殘差與觀測(cè)矩陣的內(nèi)積,選取關(guān)聯(lián)度最大的一個(gè)原子,再加入索引集,更新殘差并判斷迭代次數(shù)。不斷重復(fù)上述過程,通過多次迭代保證該過程一直持續(xù)到迭代次數(shù)和稀疏度相同時(shí),則迭代才停止。

(三)OMP算法的基本步驟

OMP算法的基本步驟如下:

輸入:傳感矩陣Φ∈Rm×n,采樣向量y∈Rm,稀疏度s;

初始化:殘差r0=y,索引集Λ0=φ,迭代計(jì)數(shù)t=1;

Step1:找到殘差r和傳感矩陣的列φj內(nèi)積中的最大值所對(duì)應(yīng)的腳標(biāo)λ,即λt=argmaxj=1,…,N||;

Step2:更新支撐集Λt=Λt-1∪{λt},記錄找到的傳感矩陣中的重建原子集合Φt=[Φt-1,φλt];

Step5:若t

OMP算法的精確度雖不及BP算法,但它迭代次數(shù)少,運(yùn)算復(fù)雜度低,是使用比較廣泛的一種重建算法,此算法需要在稀疏度已知的情況下使用。

三、實(shí)證分析

(一)數(shù)據(jù)來源及指標(biāo)選擇

本文使用的全國2007-2017年關(guān)于人口出生率影響因素的數(shù)據(jù)來源于中國統(tǒng)計(jì)年鑒。

人口出生率(Y)指一年內(nèi)平均每一千人中出生的人數(shù)所占的比例。

出生率=(年出生人數(shù)/年平均人數(shù))×1000%

選取人口死亡率(X1)、自然增長(zhǎng)率(X2)、人口年齡結(jié)構(gòu)0-14歲(X3)、人口年齡結(jié)構(gòu)15-64歲(X4)、人口年齡結(jié)構(gòu)65歲及以上(X5)、少兒撫養(yǎng)比(X6)、老年撫養(yǎng)比(X7)、嬰兒死亡率(X8)、國內(nèi)生產(chǎn)總值(X9)、居民消費(fèi)水平(X10)、離婚率(X11)、人均薪酬(X12)、居民消費(fèi)價(jià)格指數(shù)(X13)、人均可支配收入(X14)、人均消費(fèi)支出(X15)、孕產(chǎn)婦死亡率(X16)、社會(huì)固定資產(chǎn)在教育上的投資(X17)、商品房平均銷售價(jià)格(X18)、性別比(X19)、城鎮(zhèn)登記失業(yè)率(X20)。這20個(gè)涵蓋經(jīng)濟(jì)發(fā)展情況、人口素質(zhì)以及人口結(jié)構(gòu)等方面的指標(biāo),以2007-2016年的數(shù)據(jù)為訓(xùn)練集,再利用2017年的數(shù)據(jù)為測(cè)試集來驗(yàn)證模型的精確度,以此來分析對(duì)人口出生率影響最大的是哪幾個(gè)因素。

(二)模型的建立

首先對(duì)數(shù)據(jù)做預(yù)處理,對(duì)已有數(shù)據(jù)進(jìn)行中心化和歸一化,去除量綱對(duì)回歸方程所帶來的影響。再用MATLAB軟件分別在稀疏度s為3,4和5時(shí)建立回歸模型。

表1 不同稀疏度下的回歸方程

根據(jù)MATLAB軟件計(jì)算出的在不同稀疏度下所生成的回歸方程及其對(duì)應(yīng)的殘差(如表1所示),我們可以用2017年的數(shù)據(jù)進(jìn)行模型驗(yàn)證。

表2 OMP算法中稀疏度的選擇

由表2可知,稀疏度s=5時(shí)殘差最小,預(yù)測(cè)誤差最小,預(yù)測(cè)值最接近實(shí)際值。因此OMP算法所建立的模型為:

y=-0.3690x1-6.1012x6+0.4664x11+2.6525x12-2.2258x13

其方程系數(shù)所對(duì)應(yīng)的圖形如圖1所示。

圖1 模型系數(shù)圖

從OMP算法的回歸模型的估計(jì)結(jié)果可知,解釋變量人口死亡率(X1)、少兒撫養(yǎng)比(X6)、離婚率(X11)、人均薪酬(X12)和居民消費(fèi)價(jià)格指數(shù)(X13)是影響人口出生率的幾個(gè)主要因素。其中人口死亡率、少兒撫養(yǎng)比和居民消費(fèi)指數(shù)都是負(fù)向影響。X6、X12和X13對(duì)人口出生率的影響最明顯。

四、結(jié)論

在我國,由于人口多、經(jīng)濟(jì)發(fā)展不平衡,現(xiàn)階段人口老齡化情況日益嚴(yán)峻,人口出生率問題與經(jīng)濟(jì)發(fā)展密切相關(guān)。本文選取了20個(gè)影響人口出生率的影響因素,采用OMP算法提取了其中影響最大的五個(gè)因素。研究結(jié)果表明,人口死亡率、少兒撫養(yǎng)比、離婚率、人均薪酬和居民消費(fèi)價(jià)格指數(shù)是影響人口出生率最重要的幾個(gè)因素,其中少兒撫養(yǎng)比、人均薪酬和居民消費(fèi)指數(shù)對(duì)人口出生率的影響最為明顯。

猜你喜歡
出生率殘差原子
基于雙向GRU與殘差擬合的車輛跟馳建模
No.5 2020年出生率創(chuàng)新低
出生率創(chuàng)新低,都是壓力惹的禍嗎?
婦女之友(2021年12期)2021-12-15 08:27:37
原子可以結(jié)合嗎?
原子究竟有多小?
帶你認(rèn)識(shí)原子
基于殘差學(xué)習(xí)的自適應(yīng)無人機(jī)目標(biāo)跟蹤算法
基于遞歸殘差網(wǎng)絡(luò)的圖像超分辨率重建
平穩(wěn)自相關(guān)過程的殘差累積和控制圖
河南科技(2015年8期)2015-03-11 16:23:52
考慮釘螺密度依賴出生率的血吸蟲病模型的研究
元谋县| 桂阳县| 兰坪| 阿拉善右旗| 乐昌市| 会昌县| 盐山县| 盐池县| 郓城县| 化德县| 吉安市| 扶风县| 板桥市| 青田县| 腾冲县| 图木舒克市| 南川市| 思南县| 盐亭县| 阜康市| 海淀区| 昌宁县| 南乐县| 玉环县| 鄂伦春自治旗| 滕州市| 永嘉县| 巴林右旗| 花莲县| 海口市| 库车县| 天等县| 英吉沙县| 乡城县| 禄劝| 阜宁县| 阿坝县| 宁城县| 龙江县| 晋江市| 云浮市|