左 凱
(成都師范學院 數(shù)學學院,四川 成都611130)
統(tǒng)計資料表明,大量社會經(jīng)濟現(xiàn)象的發(fā)展主要是漸進型的,其發(fā)展相對于時間具有一定的規(guī)律性[1-2].趨勢外推法是事物發(fā)展?jié)u進過程的一種統(tǒng)計方法,主要優(yōu)點是可以揭示事物未來的發(fā)展,并定量地估計其功能特性,常見的趨勢外推統(tǒng)計模型有多項式曲線預測模型、指數(shù)曲線模型、對數(shù)曲線預測模型和生長曲線預測模型.如果社會經(jīng)濟現(xiàn)象的發(fā)展趨勢每期基本上按照相同的增長速度變化,則可采用指數(shù)曲線模型進行擬合;如果社會經(jīng)濟現(xiàn)象的發(fā)展趨勢為初期增長迅速,隨后增長率逐漸減低,最終以一個常數(shù)為增長極限時,則可采用修正指數(shù)曲線模型進行擬合.
楊桂元[3]根據(jù)指數(shù)曲線預測模型的特點,對模型的假設、參數(shù)估計、擬合誤差以及無偏性等問題進行了討論,并與經(jīng)典的線性回歸模型進行了比對.高燕希等[4]根據(jù)現(xiàn)有指數(shù)曲線模型計算方法的應用特點,對其計算過程進行了優(yōu)化,并以湖南省岳陽市進港道路為例,分析路面沉降的變化規(guī)律.官陳平等[5]利用2004—2010年福州市細菌性疾病的發(fā)病率建立指數(shù)曲線方程,并進行外推5 a預測,取得了較為準確的計算結果.程健等[6]利用指數(shù)曲線法研究了在役儲罐發(fā)生不均勻沉降后的結構疲勞安全性問題.最近,左凱等[7]研究了具有時間一次項的指數(shù)曲線模型,采用分段求和的思想方法給出了模型各個參數(shù)的具體表達式,并通過一個例子詳細地給出了求解的具體步驟.2009年,吳新燕等[8]采用修正指數(shù)曲線模型對汶川地震各時刻的死亡人數(shù)進行擬合,并與指數(shù)曲線模型進行比較,同時又用集集地震和阪神地震的數(shù)據(jù)進行了驗證.計算結果表明,修正指數(shù)曲線模型能夠很好地對地震死亡人數(shù)進行估計,從而為各級抗震救災指揮部提供救災決策參考依據(jù).
歐陽明等[9]在對已有的數(shù)學模型預測方法進行分析,并將指數(shù)曲線模型按照一定的修正方法進行優(yōu)化的基礎上,提出了一個新的修正指數(shù)曲線模型.通過對不同類型的單樁靜載荷試驗數(shù)據(jù)進行擬合,驗證了提出的新模型能夠?qū)螛禤-S曲線進行很好地描述.譚生源[10]在修正指數(shù)曲線模型的基礎上提出了具有振蕩項的修正指數(shù)曲線模型.針對模型本身的特點,采用最小二乘法給出了系統(tǒng)參數(shù)滿足的最優(yōu)化問題,并結合Matlab軟件包求解出系統(tǒng)參數(shù)的具體取值.最后,將模型應用在一次能源消費分析中.最近,張萍等[11]結合指數(shù)曲線模型和修正指數(shù)曲線模型的特點,提出了具有時間冪次項的指數(shù)曲線模型,利用信賴域算法給出了模型參數(shù)的數(shù)值求解方法,并將其應用在西藏自治區(qū)水資源總量的分析中.
但是,值得注意的是,文獻[10-11]并沒有給出模型參數(shù)的具體表達式,而是通過數(shù)值計算方法給出模型參數(shù)的計算方法.本文在經(jīng)典指數(shù)曲線模型、修正的指數(shù)曲線模型和文獻[7,10-11]的啟發(fā)下,提出了具有二次多項式項的新型指數(shù)曲線模型,并采用分段求和的方法給出了模型各個參數(shù)的具體表達式.最后,以我國稻谷產(chǎn)量為例,將數(shù)值計算結果與指數(shù)曲線模型、修正的指數(shù)曲線模型進行對比.從結果上可以明顯看出,本文提出的模型具有更高的精度和準確度.
1.1 指數(shù)曲線模型由文獻[1-2]可知,經(jīng)典的指數(shù)曲線模型為
為了估計參數(shù)a、b的表達式,一般將方程(1)兩端取對數(shù),得
從而估計出參數(shù)lna和lnb,再取反對數(shù),即可得到參數(shù)a、b的估計值.
1.2 修正指數(shù)曲線模型由文獻[1-2]可知,在經(jīng)典指數(shù)曲線模型的基礎上增加一個常數(shù)c,即得到修正指數(shù)曲線模型的表達式
其中,a、b、c為未知參數(shù),a≠0,b∈(0,1)∪(1,∞),c∈(0,∞).
參數(shù)a、b、c估計的基本思想是三和法:把整個原始序列分成相等的3個數(shù)組,每個組有m項,根據(jù)趨勢值Y(t)的3個局部總和分別等于原數(shù)列觀察值3個局部總和來確定3個參數(shù).具體設觀察值的3個局部總和分別為得:
在經(jīng)典指數(shù)曲線模型、修正指數(shù)曲線模型上,本文提出了具有二次多項式項的指數(shù)曲線模型,其一般方程為
可以看出,當p=0、q=0、r=0時,新型指數(shù)曲線模型退化為經(jīng)典指數(shù)曲線模型;當p=0、q=0時,新型指數(shù)曲線模型退化為修正指數(shù)曲線模型.
接下來,利用分段求和法的思想推導系統(tǒng)中參數(shù)a、b、p、q、r的具體表達式.首先,把用于建模的數(shù)據(jù)分成相等的5組,每組有m項,根據(jù)趨勢值Y(t)的5個局部和分別等于原序列的5個局部和來確定模型的參數(shù).具體為設觀察值的5個局部和分別為S1、S2、S3、S4、S5,得到:
通過對方程(22)和(23)求解,并結合表達式(10)(15)(19)得到
至此,通過分段求和的方法得到了模型各個參數(shù)的具體表達式,一旦給定原始序列的具體取值,則可建立具體的模型并進行擬合和預測.
3.1 模型精度判斷準則在具體應用之前,給出衡量模型精確的幾個度量指標,分別是絕對百分誤差(APE)、平均絕對誤差(MAE)、平均絕對百分誤差(MAPE)和希爾統(tǒng)計量(TIC).
在(26)式中,當l=2,v=5m,MAE為擬合誤差,記為MAEfit;當l=5m+1,v=n,MAE為預測誤差,記為MAEfore;當l=2,v=n,MAE為總誤差,記為MAEtotal,表達式中^Y(t)為計算得到的值,5m為用于建模的個數(shù),n為原始序列的總個數(shù).
3.2 對中國稻谷產(chǎn)量的分析使用2002—2018年共17 a的我國稻谷產(chǎn)量(萬t)的統(tǒng)計數(shù)據(jù)進行研究.首先,以2002—2016年共15 a的數(shù)據(jù)進行模型的建立,2017—2018年的數(shù)據(jù)進行驗證,將相應的數(shù)據(jù)代入分別得到3種模型的具體表達式為:
1)指數(shù)曲線模型
經(jīng)典指數(shù)曲線模型、修正指數(shù)曲線模型、二次多項式項的指數(shù)曲線模型的數(shù)值計算結果見表1、表2.從計算結果看出,二次多項式項的指數(shù)曲線模型的值與真實的數(shù)據(jù)更接近.從平均絕對百分誤差看到:指數(shù)曲線模型的建模誤差、擬合誤差和總的誤差分別為26.887 3%、47.013 8%和29.403 1%;修正指數(shù)曲線模型的建模誤差、擬合誤差和總的誤差分別為1.154 0%、1.983 0%和1.257 6%;新型指數(shù)曲線模型的建模誤差、擬合誤差和總的誤差分別為1.115 3%、0.142 7%和0.993 7%.可以明顯看出,新提出的模型在稻谷產(chǎn)量中比經(jīng)典指數(shù)曲線模型和修正指數(shù)曲線模型有更高的精度.
表1 指數(shù)曲線模型、修正指數(shù)曲線模型和新型指數(shù)曲線模型對稻谷產(chǎn)量數(shù)據(jù)的計算結果Tab.1 Calculations of rice yields by an exponential curve model,a modifed exponential curve model and a new exponential curve model
表2 指數(shù)曲線模型、修正指數(shù)曲線模型和新型指數(shù)曲線模型對稻谷產(chǎn)量數(shù)據(jù)的計算誤差Tab.2 Calculational errors of rice yields by an exponential curve model,a modifed exponential curve model and a new exponential curve model
本文討論了帶有二次多項式項的新型指數(shù)曲線模型,并充分利用分段求和的思想給出了模型中每個參數(shù)的具體表達式.最后,以我國稻谷產(chǎn)量為例說明了本模型在某些數(shù)據(jù)下的擬合精度和預測精度比經(jīng)典指數(shù)曲線模型、修正指數(shù)曲線模型都要高.
相比較傳統(tǒng)的最小二乘法或者是對數(shù)變換等方法,本文的分段求和方法思想簡單,操作性好,且能夠得到滿意的結果.在今后的研究中,將考慮此方法在其他類似模型中的應用.
致謝成都師范學院校級重點項目(CS19ZA12)對本文給予了資助,謹致謝意.