国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

中國外出農(nóng)民工歷史的測算與未來的趨勢

2015-11-23 07:49:56顧樂民
浙江農(nóng)業(yè)科學(xué) 2015年1期
關(guān)鍵詞:冪指數(shù)曲線擬合乘法

顧樂民

(同濟(jì)大學(xué),上海 200092)

中國外出農(nóng)民工歷史的測算與未來的趨勢

顧樂民

(同濟(jì)大學(xué),上海 200092)

由于缺乏成熟的農(nóng)民工統(tǒng)計(jì)制度,對于改革開放30多年來,每年我國外出農(nóng)民工的數(shù)量,約40%年份的數(shù)據(jù)是缺失的。最小一乘解,是在全部數(shù)據(jù)中依據(jù)準(zhǔn)則選取特征數(shù)據(jù)來實(shí)現(xiàn)的。將農(nóng)民工數(shù)量中3個(gè)權(quán)威數(shù)據(jù)作為最小一乘法特征數(shù)據(jù),按照最小一乘準(zhǔn)則,繪制出我國改革開放以來外出農(nóng)民工數(shù)量的變化曲線。結(jié)果表明,30多年來我國外出農(nóng)民工數(shù)量的增長可以用Richards生長模型和一種新的指數(shù)+冪指數(shù)混合生長模型來共同描述;增長過程是一個(gè)沒有峰或谷的連續(xù)遞增,在1995-1998年間出現(xiàn)一個(gè)變化的拐點(diǎn),使加速的增長轉(zhuǎn)變?yōu)闇p速的增長;2014年外出農(nóng)民工數(shù)量將達(dá)到1.71億,按1.6倍率相乘,農(nóng)民工總數(shù)為2.73億;按目前發(fā)展趨勢2021年外出農(nóng)民工數(shù)量將出現(xiàn)高點(diǎn)1.88億,折算成農(nóng)民工總數(shù)為3.0億,之后將呈現(xiàn)緩慢下降趨勢。

外出農(nóng)民工;最小一乘法;曲線擬合;預(yù)測

文獻(xiàn)著錄格式:顧樂民.中國外出農(nóng)民工歷史的測算與未來的趨勢[J].浙江農(nóng)業(yè)科學(xué),2015,56(1):130-136.

DOI 10.16178/j.issn.0528?9017.20150142

農(nóng)民工是中國工業(yè)化、城市化與農(nóng)村人口在非農(nóng)化沒有同步發(fā)展的歷史條件下產(chǎn)生的一個(gè)獨(dú)特的社會(huì)群體[1]。于20世紀(jì)80年代出現(xiàn)的農(nóng)民工,是改革開放進(jìn)程中出現(xiàn)并迅速成長起來的一支新型勞動(dòng)大軍,是現(xiàn)代產(chǎn)業(yè)工人的主體,是中國現(xiàn)代化建設(shè)的重要力量。農(nóng)民工隊(duì)伍的產(chǎn)生和不斷壯大,對改變農(nóng)村面貌做出了特殊的重要貢獻(xiàn),成為推動(dòng)中國經(jīng)濟(jì)發(fā)展和社會(huì)結(jié)構(gòu)變革的巨大力量[2-3]。但是由于沒有成熟的農(nóng)民工統(tǒng)計(jì)制度,對于30多年來我國農(nóng)民工的數(shù)量,約40%年份的數(shù)據(jù)是缺失的,存留的數(shù)據(jù)中也有不少是矛盾的,誤差在15%的居多,有的甚至達(dá)近30%。

關(guān)于農(nóng)民工歷年數(shù)量變化的資料雖然能找到或估算出[4-5],但總體是不全的。農(nóng)民工數(shù)量數(shù)據(jù)的缺失會(huì)造成一些分析難以或無法進(jìn)行,統(tǒng)計(jì)數(shù)據(jù)之間的矛盾也會(huì)使各種分析變得有爭議。因此補(bǔ)全缺失的數(shù)據(jù),糾正矛盾的數(shù)據(jù),可以更好地為分析農(nóng)民工其他問題服務(wù),具有一定的理論和實(shí)用價(jià)值。

數(shù)據(jù)是不能憑空構(gòu)造的,農(nóng)民工數(shù)量的變化規(guī)律也是客觀存在的,將這種規(guī)律用數(shù)據(jù)形式表達(dá)是可能的。如果在存有的數(shù)據(jù)中隱含若干重要數(shù)據(jù),即統(tǒng)計(jì)過程中具有很高置信度、被公認(rèn)的、已被廣泛接受的權(quán)威數(shù)據(jù),發(fā)現(xiàn)并找出它們,以這些數(shù)據(jù)為主線,就能勾勒出一條能較準(zhǔn)確反映農(nóng)民工發(fā)展過程的曲線。它不僅能成為農(nóng)民工數(shù)量變化規(guī)律的一個(gè)很好的近似,還可以用數(shù)學(xué)上的內(nèi)插法,補(bǔ)全缺失的相關(guān)數(shù)據(jù),糾正有矛盾的數(shù)據(jù),并延伸到其他農(nóng)民工的各種分析服務(wù)上。

最小一乘準(zhǔn)則是關(guān)于誤差絕對值之和極小化的準(zhǔn)則,源于18世紀(jì)天文學(xué)子午線長問題的古典研究,從歷史上看比最小二乘準(zhǔn)則還早了40多年。但如何在該準(zhǔn)則基礎(chǔ)上建立并實(shí)現(xiàn)回歸算法是個(gè)難題,成為困擾數(shù)理界200多年未解的難題,也形成了延續(xù)至今的對最小一乘準(zhǔn)則的各種研究,并逐漸形成了以該準(zhǔn)則為基礎(chǔ)的最小一乘法。近年來,由于最小一乘解的實(shí)現(xiàn)問題有了大的突破,使得最小一乘法在各領(lǐng)域中迅速得以應(yīng)用,成為繼最小二乘法之后一個(gè)既古典又新穎的方法[6]。最小一乘解的實(shí)現(xiàn)過程與最小二乘解有很大區(qū)別,最小二乘法是全部數(shù)據(jù)都必須參與的捆綁式的處理方法,而最小一乘法則是通過全部數(shù)據(jù)選出若干個(gè)特征數(shù)據(jù)的代表式的數(shù)據(jù)處理方法。最小一乘法的這種數(shù)據(jù)處理方式,為農(nóng)民工數(shù)量問題的解決提供了一個(gè)極為相近的思路與方法,將最小一乘法需要的特征數(shù)據(jù)與統(tǒng)計(jì)學(xué)中的重要數(shù)據(jù)聯(lián)系起來,就有可能繪出一條最小一乘準(zhǔn)則下的農(nóng)民工數(shù)量的變化曲線。

廣義最小一乘法是最小一乘法的一個(gè)推廣[7],是合理運(yùn)用最小一乘法基于的零誤差原理,并加以推廣至關(guān)鍵數(shù)據(jù)位,使關(guān)鍵點(diǎn)位數(shù)據(jù)成為最小一乘特征數(shù)據(jù)的一種方法。所謂關(guān)鍵點(diǎn)就是特別關(guān)心的重要數(shù)據(jù)點(diǎn),是不希望出現(xiàn)誤差或誤差盡可能小的點(diǎn)。例如力峰值點(diǎn)、機(jī)床加工特殊點(diǎn)、目標(biāo)到達(dá)點(diǎn)、預(yù)測的未知點(diǎn)等。如果將農(nóng)民工數(shù)量統(tǒng)計(jì)中的重要數(shù)據(jù)點(diǎn)視為關(guān)鍵點(diǎn),那么關(guān)于農(nóng)民工數(shù)量變化曲線的建立不僅有了理論依據(jù),也成為可能。

Richards模型是1955年Richards在von Bertalanffy生長模型的基礎(chǔ)上經(jīng)一般化處理后提出的一個(gè)著名的生長模型[8],也常用于人口增長的描述。通過參數(shù)變化可演變?yōu)镸itscherlich、Gompertz、Logistic這3個(gè)生長模型,使之成為Richards模型的3個(gè)特例。Richards曲線是一個(gè)具有漸近線功能的S形曲線,能推算出當(dāng)時(shí)間→∞條件下增長的極限量。數(shù)據(jù)處理表明由于含有4個(gè)參數(shù),使得Richards模型比另外3個(gè)模型具有更小的曲線擬合誤差,在本研究中將Richards模型作為主要的數(shù)學(xué)模型之一。

此外,在本研究中還將介紹一個(gè)新的生長模型,冪指數(shù)+指數(shù)混合型生長模型,一種既有冪指數(shù)功能又有指數(shù)功能,既有漸近線功能也有極值功能的新生長模型,用于克服Richards模型中不具有極值的局限。在廣義的增長、發(fā)展、生長過程中,時(shí)間→∞條件下的極限增長往往不一定都存在,當(dāng)增長趨于停滯往往預(yù)示著外部條件或內(nèi)在因素?zé)o法再起作用,此時(shí)只有2種可能,一種是趨于消亡,例如植物的生長;另一種繼續(xù)維持生存,則必然朝著新的循環(huán)尋找出路,通過表觀下跌找到新的平衡。新模型中這2種趨勢都有可能出現(xiàn),依賴于給定的是什么類型的數(shù)據(jù),所以具有很強(qiáng)的適應(yīng)性和指示性。極大值和極限值的雙重現(xiàn)象可能更符合客觀世界的一般生長規(guī)律,也可能更符合農(nóng)民工未來發(fā)展的趨勢,在本研究中也將該新模型作為主要的數(shù)學(xué)模型之一,與Richards模型一起共同用于分析農(nóng)民工的數(shù)量增長問題。

1 原理與方法

表1是國家4部門給出的1983-2007年間主要年份外出務(wù)工的農(nóng)民工數(shù)量數(shù)據(jù)[3]。

表1 改革開放以來主要年份外出務(wù)工的農(nóng)民工數(shù)量萬人

1.1 最小一乘法

數(shù)據(jù)(xi,yi)i=1,2,…,m是隱函數(shù)y(x)在有定義的區(qū)間內(nèi)給出的m個(gè)離散點(diǎn)組,為找到隱函數(shù)y(x),設(shè)擬合函數(shù)f(x)=f(x,a),其中參數(shù)a=(a1,a2,…,an),n≤m,而a1,a2,…,an為n個(gè)不全為0的實(shí)數(shù)。為使f(x)盡可能接近y(x),設(shè)誤差函數(shù)r(x)=y(tǒng)(x)-f(x),而誤差值(xi,ri)是誤差函數(shù)r(x)上的具體數(shù)值:

ri=y(tǒng)i-?(xi,,a)i=1,2,…,m。

曲線擬合的最小一乘法,是依據(jù)誤差ri=y(tǒng)if(xi,a)的絕對值之和為極小的準(zhǔn)則來選擇參數(shù)a,即依據(jù)Q=Q(a)=min而構(gòu)成的一種曲線擬合法。

1.2 平均絕對誤差Mae、平均絕對百分誤差Mape、曲線擬合誤差

平均絕對誤差Mae是最小一乘法一個(gè)重要的絕對量值指標(biāo):

平均絕對百分誤差Mape是最小一乘法一個(gè)重要的相對量值指標(biāo):

在曲線擬合中,平均絕對百分誤差常被稱為曲線擬合誤差,在后文中將應(yīng)用該術(shù)語。

1.3 最小一乘解

如果最小一乘的解存在,即存在a=a?使則至少存在n個(gè)零誤差點(diǎn)x1,x2,…,xn使yj-f(xj,a?)=0,j=1,2,…,n。

稱參數(shù)a?為最小一乘最佳擬合參數(shù),上標(biāo)用?表示,稱f(x,a?)為最小一乘最佳擬合方程,它們構(gòu)成了最小一乘法的一般解。

1.4 零誤差以及最小一乘法、最小二乘法、廣義最小一乘法在數(shù)據(jù)處理方式上的差異

所謂零誤差就是沒有誤差,或誤差為0。在實(shí)際計(jì)算過程中由于計(jì)算機(jī)的浮點(diǎn)運(yùn)算功能是有限的,所以常將很小可以忽略不計(jì)的絕對值誤差作為零誤差處理。從1.3節(jié)可以看出,最小一乘法是通過n個(gè)零誤差點(diǎn)處的零誤差來獲得最小一乘解的,這種求解方式是最小一乘法獨(dú)有的。但不是任意n個(gè)數(shù)據(jù)都可以成為零誤差數(shù)據(jù),而是需要通過選優(yōu)的方式,在m個(gè)都有可能成為零誤差的數(shù)據(jù)中,擇優(yōu)選出能使誤差絕對值之和極小的n個(gè)數(shù)據(jù)作為零誤差數(shù)據(jù)。這個(gè)由全部m個(gè)數(shù)據(jù)都參與,選出n個(gè)數(shù)據(jù)作為全部數(shù)據(jù)的代表的數(shù)據(jù)處理過程可用一個(gè)通俗的語言代表式的數(shù)據(jù)處理方式來描述,而選中的n個(gè)數(shù)據(jù)就成了代表數(shù)據(jù)。

最小二乘法的數(shù)據(jù)處理過程要求全部數(shù)據(jù)都參與,得到的結(jié)果是集體貢獻(xiàn)的組合性結(jié)果,是一種捆綁式的數(shù)據(jù)處理方式。如果在數(shù)據(jù)缺失情況下應(yīng)用該法,得到的結(jié)果會(huì)產(chǎn)生一定的片面性。

廣義最小一乘法具有相當(dāng)大的靈活性,它吸收了最小一乘法的零誤差原理,卻不苛刻要求誤差絕對值之和必須極小,以部分犧牲極小化結(jié)果的代價(jià)換取對應(yīng)用條件的寬松。例如,最小一乘法規(guī)定的n個(gè)特征數(shù)據(jù)具有唯一性的特征,是不能任選的;但是廣義最小一乘法可以根據(jù)實(shí)際需要,人為確定2個(gè)數(shù)據(jù)為特征數(shù)據(jù),另外(n-2)個(gè)數(shù)據(jù)由最小一乘準(zhǔn)則來選取。這種用抬高或犧牲誤差絕對值之和極小的代價(jià)換取對關(guān)鍵數(shù)據(jù)的保護(hù)的最小一乘法就是廣義最小一乘法,是最小一乘法的一個(gè)推廣。

1.5 原始數(shù)據(jù)中的重點(diǎn)數(shù)據(jù)

在表1給出的1組原始數(shù)據(jù)中,可以確定以下3個(gè)數(shù)據(jù)為重點(diǎn)數(shù)據(jù):1983年外出農(nóng)民工數(shù)量200萬,這是一個(gè)被公認(rèn)的歷史性數(shù)據(jù),該數(shù)據(jù)之后的多個(gè)數(shù)據(jù)是缺失的;1996年外出農(nóng)民工數(shù)量7 223萬,該數(shù)據(jù)為第一次全國農(nóng)業(yè)普查數(shù)據(jù),具有很高的置信度和權(quán)威性,由于該數(shù)據(jù)之前的多個(gè)數(shù)據(jù)是缺失的,它定位的重要性就尤為突出;2006年外出農(nóng)民工數(shù)量13 181萬,該數(shù)據(jù)為第二次全國農(nóng)業(yè)普查數(shù)據(jù),也具有很高的置信度和權(quán)威性,該數(shù)據(jù)之前是多個(gè)矛盾數(shù)據(jù),如果需要糾正矛盾數(shù)據(jù),它的定位作用就十分重要。

這3個(gè)數(shù)據(jù)的一個(gè)共同特征是它們分別代表了相應(yīng)的年代(80,90,00年代),使得重要數(shù)據(jù)在時(shí)間分布上比較均勻且合理。除這3個(gè)數(shù)據(jù)外,其他的數(shù)據(jù)均作為一般數(shù)據(jù)處理。2008-2013年的數(shù)據(jù)有6個(gè)在表1中并沒有列出,這6個(gè)數(shù)據(jù)具有很高的置信度,但這6個(gè)數(shù)據(jù)集中在最近的6年,數(shù)據(jù)是連續(xù)的、不缺失的、無矛盾的,所以這6個(gè)數(shù)據(jù)屬于權(quán)重相等的一般數(shù)據(jù)。

1.6 Richards生長模型

Richards生長模型是一個(gè)具有漸近線功能的S形模型,模型中的4個(gè)參數(shù)用a1,a2,a3,a4簡化表達(dá):

當(dāng)時(shí)間x→∞,e-a3x→0,所以參數(shù)a1表示為極限量。

1.7 冪指數(shù)+指數(shù)混合型生長模型

冪指數(shù)+指數(shù)混合型生長模型是冪指數(shù)模型與指數(shù)模型簡單組合而構(gòu)成的一個(gè)混合型模型,用g(x)=g(x,b)表示,其中參數(shù)b=(b1,b2,b3,b4)。

g(x)=g(x,b)=b1xb2+b3eb3x。

g(x)的變化率即為1階導(dǎo)函數(shù)g′(x),g(x)的2階變化率即為2階導(dǎo)函數(shù)g″(x):

式中都是超越方程,令g′(x)=0通過牛頓迭代法得到0點(diǎn)是g(x)的極大值點(diǎn);令g″(x)=0通過牛頓迭代法得到的0點(diǎn)是g(x)的拐點(diǎn),因篇幅關(guān)系不展開對該生長模型的擴(kuò)展性討論。

2 數(shù)據(jù)處理

表2中第1列是序號(hào),共18個(gè),第2列是年份,第3列是1983-2013年我國外出農(nóng)民工數(shù)量實(shí)際數(shù)據(jù),為母系列,其中2008-2013年的6組數(shù)據(jù)是國家統(tǒng)計(jì)局通過人民網(wǎng)財(cái)經(jīng)頻道公布的國家數(shù)據(jù)[9-10],缺失年份的數(shù)據(jù)有13個(gè)(1984,1985,1986,1987,1988,1990,1991,1992,1994,1997,1998,1999,2007年)。因最小一乘法解的實(shí)現(xiàn)是一個(gè)十分繁復(fù)的計(jì)算,文中略去所有的計(jì)算過程,只給出計(jì)算的結(jié)果。

依據(jù)上述的討論,在最小一乘準(zhǔn)則下得到的Richards方程為:

對數(shù)據(jù)處理的結(jié)果見表2第4列,表中第5列為絕對誤差(萬),第6列為相對誤差(%)。位于i=1,5,12,18的誤差是零誤差點(diǎn),相應(yīng)的年份是1983,1996,2006,2013年。Richards方程獲得了平均絕對誤差Mae=386.8(萬)和曲線擬合誤差Mape=4.73%的條件極小化的結(jié)果。

在最小一乘準(zhǔn)則下得到指數(shù)+冪指數(shù)混合模型方程為:

對數(shù)據(jù)處理的結(jié)果見表2,其中第7列為擬合值,第8列為絕對誤差,第9列為相對誤差。位于i=1,5,12,15的誤差點(diǎn)是零誤差點(diǎn),相應(yīng)的年份是1983,1996,2006,2010年。冪指數(shù)+指數(shù)混合模型獲得了平均絕對誤差Mae=351.3萬和曲線擬合誤差Mape=4.36%的條件極小化的結(jié)果。

由表2可以說明以下幾點(diǎn):

1)4個(gè)零誤差點(diǎn)是31年間(1983-2013年)外出農(nóng)民工數(shù)量變化的4個(gè)重要數(shù)據(jù)點(diǎn),分別在80,90,00,10年代出現(xiàn),比較均衡。假設(shè)這4個(gè)重要數(shù)據(jù)是全部31個(gè)數(shù)據(jù)(含缺失的13個(gè)數(shù)據(jù))的代表數(shù)據(jù),那么最小一乘法依據(jù)這4個(gè)數(shù)據(jù)獲得的解,即獲得的曲線擬合方程就可以認(rèn)為是31年來我國外出農(nóng)民工數(shù)量變化的一個(gè)近似規(guī)律。

2)如果假設(shè)不成立,那么就必須從給定的數(shù)據(jù)中,另外選出4個(gè)代表數(shù)據(jù),并獲得相應(yīng)的解。文中不展開重新選擇數(shù)據(jù)的探討,因?yàn)檫@種對比將涉及大量的計(jì)算和討論,所以文中認(rèn)定給出的假設(shè)是成立的。

3)2個(gè)生長模型的數(shù)據(jù)處理有相同點(diǎn),都認(rèn)為2000年和2001年的數(shù)據(jù)誤差較大,它們的相對誤差都超過了20%,所以需要修正。

4)根據(jù)國家統(tǒng)計(jì)局給出的我國外出農(nóng)民工與農(nóng)民工總數(shù)的比例,多年來一直在1∶1.6左右,由Richards方程給出的外出農(nóng)民工的極限數(shù)量為28 282.892萬,按1.6倍率推算,我國農(nóng)民工總數(shù)的極限量為4.53億,這個(gè)結(jié)果超出了實(shí)際可能的范圍。根據(jù)《中國農(nóng)村統(tǒng)計(jì)年鑒》數(shù)據(jù),截至2010年,我國農(nóng)村勞動(dòng)力的資源為46 875萬人[5],Richards模型給出的理論結(jié)果接近該值,但不可能都轉(zhuǎn)化為農(nóng)民工,所以事實(shí)不可能實(shí)現(xiàn)。從意義上說Richards模型給出的數(shù)據(jù)處理結(jié)果只能作為參考,同樣對于Mitscherlich,Gompertz,Logistic等模型,給出的結(jié)果將產(chǎn)生大的偏差而不合實(shí)際情況,這里從略。

5)相比之下,冪指數(shù)+指數(shù)型混合模型比較符合實(shí)際的人口變化情況,且2個(gè)重要的曲線擬合指標(biāo)Mae和Mape都要較Richards模型小些,所以在后文的分析中將主要運(yùn)用該模型。

3 數(shù)據(jù)分析

3.1 預(yù)測的零誤差經(jīng)驗(yàn)法則

預(yù)測的零誤差經(jīng)驗(yàn)法則適用于數(shù)值逼近[11]。大量試驗(yàn)表明,在數(shù)值逼近中若將端點(diǎn)xm處的數(shù)據(jù)值(xm,ym)設(shè)定為零誤差,即ym-f(xm)=0。則對于未知的數(shù)據(jù)(xm+1,ym+1)的預(yù)測具有較為準(zhǔn)確的結(jié)果。

在數(shù)值逼近中,數(shù)據(jù)值的隨機(jī)誤差一般較小,函數(shù)方程越接近0點(diǎn)其誤差絕對值就越小,如果端點(diǎn)前數(shù)據(jù)的誤差rm-1=y(tǒng)m-1-f(xm-1)的絕對值誤差很小,而端點(diǎn)處的誤差為0,rm=y(tǒng)m-f(xm)=0,按照曲線延伸的慣性原理,則端點(diǎn)后數(shù)據(jù)(xm+1,ym+1)的誤差也不會(huì)大,這為預(yù)測數(shù)據(jù)(xm+1,ym+1)引入的預(yù)測誤差必定很小。如果再對預(yù)測進(jìn)行一種誤差補(bǔ)償,將誤差值rm-1簡單疊加在預(yù)測值f(xm+1)上,即有ym+1=f(xm+1)±rm-1,則預(yù)測結(jié)果將更接近實(shí)際真值ym+1。

這個(gè)經(jīng)驗(yàn)法則雖適用于數(shù)值逼近,但對于統(tǒng)計(jì)學(xué)數(shù)據(jù)而言,當(dāng)數(shù)據(jù)的隨機(jī)誤差不是很大,依然可以簡單套用,僅當(dāng)隨機(jī)誤差很大,曲線失去了延伸的一般規(guī)律時(shí),該法則就不宜使用。

3.2 預(yù)測性檢驗(yàn)

對于未來的預(yù)測,重要的是預(yù)測結(jié)果是否準(zhǔn)確,此時(shí)其他問題,例如規(guī)律性問題、曲線的形狀問題等都要讓位,即凡是干擾或影響預(yù)測所需要的條件的一般都要加以限制。預(yù)測的零誤差經(jīng)驗(yàn)法則設(shè)定端點(diǎn)數(shù)據(jù)為滿足式y(tǒng)m-f(xm)=0的零誤差數(shù)據(jù),其他數(shù)據(jù)均視為一般數(shù)據(jù)以免干擾,以下給出實(shí)際預(yù)測結(jié)果。

表2 1983-2013年我國外出農(nóng)民工數(shù)量的模型擬合

1)用冪指數(shù)+指數(shù)模型,預(yù)測2011年外出的農(nóng)民工數(shù)量。

由表2,取1983-2010年的15組數(shù)據(jù),設(shè)定2010年的數(shù)據(jù)為零誤差數(shù)據(jù),其余均為一般數(shù)據(jù),依據(jù)最小一乘準(zhǔn)則,獲得的擬合方程:

g(xi)=457.293 83(xi-1 982)1.064617-250.231 44e0.027832(xi-1982)。

零誤差在1983,1996,2004,2010年的4個(gè)數(shù)據(jù)位上出現(xiàn),擬合結(jié)果為平均絕對誤差Mae=381.2(萬),曲線擬合誤差5.07%,將x16=2011帶入上式,得預(yù)測結(jié)果g(2011年)=15 924.1(萬),與實(shí)際值15 863(萬)的絕對誤差為61.1(萬),預(yù)測的相對誤差為0.39%。

2)預(yù)測2012年外出的農(nóng)民工數(shù)量。

同理,取1983-2011年的16組數(shù)據(jù),設(shè)定2011年的數(shù)據(jù)為零誤差數(shù)據(jù),其余均為一般數(shù)據(jù),依據(jù)最小一乘準(zhǔn)則,獲得的擬合方程:

g(xi)=445.083(xi-1 982)1.080664-232.495 93e0.05272423(xi-1982)。

該方程在1983,1996,2004,2011年的4個(gè)點(diǎn)位獲得零誤差,擬合結(jié)果為平均絕對誤差Mae=357.9(萬),曲線擬合誤差4.74%,將x17=2012帶入上式,得預(yù)測結(jié)果g(2012年)=164 36.9(萬),與實(shí)際值16 336(萬)的絕對誤差為100.9(萬),預(yù)測的相對誤差為0.62%。

3)預(yù)測2013年外出的農(nóng)民工數(shù)量。

取1983-2012年的17組數(shù)據(jù),設(shè)定2012年的數(shù)據(jù)為零誤差數(shù)據(jù),其余同上,獲得的擬合方程:

g(xi)=430.322 37(xi-1 982)1.096374-215.518 93e0.0664312(xi-1982)。

該方程在1983,1996,2004,2012年的4個(gè)點(diǎn)位獲得零誤差,擬合結(jié)果為平均絕對誤差Mae=342.1(萬),曲線擬合誤差4.47%,將x18=2013帶入上式,得預(yù)測結(jié)果g(2013)=16 883.2(萬),與實(shí)際值16 610(萬)的絕對誤差為273.2(萬),預(yù)測的相對誤差為1.64%。

以上預(yù)測都具有一定的準(zhǔn)確性,同時(shí)也看到,雖然只設(shè)定了端點(diǎn)數(shù)據(jù)為零誤差數(shù)據(jù),其余都按一般數(shù)據(jù)論處,但按照最小一乘準(zhǔn)則的數(shù)據(jù)處理,1983年和1996年的數(shù)據(jù)都?xì)w入了零誤差數(shù)據(jù)范疇,這與上述討論中將1983,1996,2006年屬于重點(diǎn)數(shù)據(jù)的設(shè)定十分相近,這一結(jié)果也說明了最小一乘法對于數(shù)據(jù)的選取具有與事實(shí)十分接近的優(yōu)良功能。

3.3 預(yù)測2014年我國農(nóng)民工數(shù)量

在以上分析基礎(chǔ)上,對2014年外出農(nóng)民工可能的數(shù)量進(jìn)行預(yù)測。取1983-2013年的18組數(shù)據(jù),設(shè)定2013年的數(shù)據(jù)為零誤差數(shù)據(jù),其余同上,獲得的擬合方程:

g(xi)=403.336 53(xi-1 982)1.123753-186.985 37e0.083832(xi-1982)。

將x19=2014帶入上式,得預(yù)測結(jié)果g(2014年)=17 084.7(萬),按照1∶1.6的比率,農(nóng)民工總量為2.73億;該結(jié)果有待2015年驗(yàn)證。

3.4 Richards曲線分析

圖1中Richards模型是表2數(shù)據(jù)及數(shù)據(jù)處理結(jié)果的曲線形式轉(zhuǎn)化,圖中橫坐標(biāo)為年份,縱坐標(biāo)是人口數(shù)(萬人)。

圖1中曲線1是Richards曲線:

在定義區(qū)間[1983,2013年]內(nèi),Richards曲線是一條無極值(極小和極大)的單增曲線。

圖1中ARichards模型曲線2是Richards曲線的變化率曲線,即f(x)的1階導(dǎo)函數(shù)f′(x)曲線,因?yàn)橹皇嵌ㄐ哉f明問題,略去了該曲線的數(shù)值標(biāo)定,即沒有給出曲線2的縱坐標(biāo)數(shù)值。曲線2表明Richards曲線的變化率曲線是一條含有一個(gè)極大值的駝峰狀曲線,計(jì)算表明f′(x)曲線在x=1 994.8處獲得極大值,相當(dāng)于Richards曲線f(x)在1995年處出現(xiàn)一個(gè)變化的拐點(diǎn)。拐點(diǎn)的出現(xiàn)使Richards曲線由逐步加快的遞增變?yōu)橹鸩綔p慢的遞增。

圖1 我國外出農(nóng)民工數(shù)量的擬合曲線

3.5 冪指數(shù)+指數(shù)曲線分析

圖1冪指數(shù)+指數(shù)混合模型中的曲線1是冪指數(shù)+指數(shù)曲線:

g(x)=338.2388(x-1 982)1.187315-124.48e0.104837(x-1982)。

g(x)曲線與Richards曲線不同之處在于,在定義區(qū)間[1983,2013年]內(nèi),g(x)曲線雖然也是一條無極值(極小和極大)的單增曲線,在它的延伸部分,在區(qū)間外的x=2 021.2,相當(dāng)于2021年將出現(xiàn)一個(gè)極大值g(2 021.2)=18 777,預(yù)示外出農(nóng)民工在2021年將達(dá)到最大值18 777萬,之后將緩慢下降。圖1冪指數(shù)+指數(shù)混合模型中曲線2是g(x)曲線的變化率曲線g′(x),這是一條含有一個(gè)極大值的駝峰狀曲線,但峰值出現(xiàn)點(diǎn)位與Richards變化率曲線略有差異。計(jì)算表明g′(x)曲線在x=1 998.4處獲得極大值,相當(dāng)于g(x)曲線1998年處出現(xiàn)一個(gè)變化的拐點(diǎn)。拐點(diǎn)的出現(xiàn)使冪指數(shù)+指數(shù)曲線由逐步加快的遞增變?yōu)橹鸩綔p慢的遞增。

3.6 曲線分析的綜合

Richards曲線和冪指數(shù)+指數(shù)曲線得出的結(jié)論略有不同,Richards曲線顯示,當(dāng)時(shí)間→∞,外出農(nóng)民工數(shù)量為2.8億,這既難以驗(yàn)證也超出現(xiàn)實(shí)的可能。農(nóng)民工的出現(xiàn)具有歷史局限性,必將伴隨歷史的前進(jìn)而消失,所以該值不具有參考性,可以除去。綜合2個(gè)生長模型給出的結(jié)論可歸結(jié)為,1983-2013年的31年間,我國外出農(nóng)民工數(shù)量的變化是一個(gè)不存在極值(極大或極?。┑摹⑦B續(xù)遞增的發(fā)展,在發(fā)展過程中的1995-1998年出現(xiàn)了變化的拐點(diǎn),由逐步加快的遞增變?yōu)橹鸩綔p慢的遞增,這種增長率的變慢必將產(chǎn)生效應(yīng),外出農(nóng)民工將在2021年左右出現(xiàn)最大值1.877 7億,按1.6倍率推算,農(nóng)民工總數(shù)為3.00億,之后農(nóng)民工數(shù)量將逐漸減少。

31年來外出農(nóng)民工缺失的數(shù)據(jù)可用數(shù)學(xué)上的內(nèi)插法加以補(bǔ)齊,表3是按照冪指數(shù)+指數(shù)混合增長模型,在最小一乘準(zhǔn)則下計(jì)算的結(jié)果。數(shù)據(jù)獲得的曲線擬合誤差為0.5%,最大誤差為1.98%,所以在實(shí)際應(yīng)用中,若考慮到統(tǒng)計(jì)學(xué)的隨機(jī)誤差,帶有?號(hào)或??的數(shù)據(jù)其誤差允許在±0.5%范圍內(nèi)波動(dòng),其中個(gè)別數(shù)據(jù)波動(dòng)的最大范圍不得超過±1.98%。

表3 1983-2013年外出農(nóng)民工數(shù)量變動(dòng)情況

4 小結(jié)

最小一乘法解的實(shí)現(xiàn)過程,是一種代表式的選取方式,我國外出農(nóng)民工數(shù)量變化數(shù)據(jù)雖然缺失但仍存有重要數(shù)據(jù),將二者之間建立緊密的關(guān)聯(lián),使重要數(shù)據(jù)成為代表數(shù)據(jù),彌補(bǔ)了數(shù)據(jù)缺失的不足。通過數(shù)據(jù)處理、數(shù)據(jù)分析、實(shí)踐驗(yàn)證等多個(gè)環(huán)節(jié),得出如下結(jié)論。

1983-2013年我國外出農(nóng)民工的數(shù)據(jù)雖然只有18個(gè),但因存有高置信度的權(quán)威數(shù)據(jù),這使得缺失的數(shù)據(jù)、矛盾的數(shù)據(jù)可以通過最小一乘法得以補(bǔ)缺及糾正。

31年來農(nóng)民工數(shù)量的變化規(guī)律可以用Richards生長模型和冪指數(shù)+指數(shù)混合生長模型來描述。31年來我國外出農(nóng)民工的增長是一個(gè)不存在峰或谷的連續(xù)增長,在增長過程中,1995-1998年出現(xiàn)了變化的拐點(diǎn),使原先逐步加快的增長變?yōu)橹鸩綔p慢的增長。

2014年我國外出農(nóng)民工數(shù)量將達(dá)1.71億,按照1∶1.6比率推算,農(nóng)民工總數(shù)約為2.73億;我國外出農(nóng)民工數(shù)量將在2021年左右出現(xiàn)峰值1.88億,按1.6倍率推算,農(nóng)民工總數(shù)為3.00億,之后農(nóng)民工數(shù)量將逐漸趨于減少。

31年來外出農(nóng)民工缺失的數(shù)據(jù)可用數(shù)學(xué)上的內(nèi)插法加以補(bǔ)齊,在實(shí)際應(yīng)用中,數(shù)據(jù)誤差允許在一定范圍內(nèi)波動(dòng)。

[1] 朱信凱.農(nóng)民市民化的國際經(jīng)驗(yàn)及對我國農(nóng)民工問題的啟示[J].中國軟科學(xué),2005(1):28-34.

[2] 國務(wù)院研究室課題組.中國農(nóng)民工調(diào)研報(bào)告[M].北京:中國言實(shí)出版社,2006.

[3] 我國農(nóng)民工工作“十二五”發(fā)展規(guī)劃綱要研究課題組.中國農(nóng)民工問題總體趨勢:觀測“十二五”[J].改革,2010(8):5-29.

[4] 王萍萍,張毅,彭麗荃,等.新生代農(nóng)民工的數(shù)量,結(jié)構(gòu)和特點(diǎn)[EB/OL].(2011?03?10)[2012?04?14].http://www.my 12340.cn/article.aspx.

[5] 陳書偉.外出農(nóng)民工流動(dòng)態(tài)勢及潛在數(shù)量測算[J].廣東技術(shù)師范學(xué)院學(xué)報(bào),2013,34(2):99-102.

[6] 顧樂民.曲線擬合的最小一乘法[J].同濟(jì)大學(xué)學(xué)報(bào):自然科學(xué)版,2011,39(9):1377-1382.

[7] 顧樂民.曲線擬合的廣義最小一乘法[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2011,41(19):107-113.

[8] 程毛林.Richards模型參數(shù)估計(jì)及其模型應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2010,40(12):139-143.

[9] 統(tǒng)計(jì)局.2012年全國農(nóng)民工總量達(dá)26261萬人[EB/OL].(2013?05?27).http://finance.people.com.cn/n/2013/0527/c1004-21624982.html.

[10] 國家統(tǒng)計(jì)局.2013年國民經(jīng)濟(jì)發(fā)展穩(wěn)中向好[EB/OL].(2014?01?20).http://www.stats.gov.cn/tjsj/zxfb/201401/t20140120_502082.html.

[11] 顧樂民.預(yù)測型切比雪夫多項(xiàng)式[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(7):34-38.

(責(zé)任編輯:高 峻)

C 921

A

0528?9017(2015)01?0130?07

2014?08?28

顧樂民(1952-),男,江蘇射陽人,研究方向?yàn)樽罴驯平砑捌鋺?yīng)用。E?mail:gulemin@#edu.cn。

猜你喜歡
冪指數(shù)曲線擬合乘法
源于學(xué)生試題疑問的數(shù)學(xué)建模例談
算乘法
部分相干冪指數(shù)相位渦旋光束的傳輸特性研究*
我們一起來學(xué)習(xí)“乘法的初步認(rèn)識(shí)”
《整式的乘法與因式分解》鞏固練習(xí)
把加法變成乘法
曲線擬合的方法
基于曲線擬合的投棄式剖面儀電感量算法
電子測試(2017年12期)2017-12-18 06:35:46
基于逼近理想點(diǎn)冪指數(shù)評估的防空導(dǎo)彈型譜分析與研究
一類度互質(zhì)的無標(biāo)度網(wǎng)絡(luò)研究
考試周刊(2016年99期)2016-12-26 10:54:30
永春县| 黎城县| 杂多县| 安塞县| 铜陵市| 方正县| 白水县| 双流县| 宜兴市| 防城港市| 邓州市| 苗栗县| 灵宝市| 原阳县| 垫江县| 玉门市| 偏关县| 台南市| 眉山市| 英山县| 桦川县| 塔城市| 华宁县| 余干县| 光泽县| 河北省| 郑州市| 修水县| 巴里| 栖霞市| 金平| 淄博市| 绥阳县| 安吉县| 宁阳县| 临夏县| 五寨县| 怀来县| 左贡县| 玉龙| 玛多县|