張相斌,梁 嘯
(南京郵電大學(xué) 經(jīng)濟(jì)與管理學(xué)院,南京 210046)
多元線性回歸分析是一種重要的處理變量間相關(guān)關(guān)系的數(shù)理統(tǒng)計(jì)方法,不僅可以提供變量間相關(guān)關(guān)系的數(shù)學(xué)表達(dá)式,利用概率統(tǒng)計(jì)知識(shí)對(duì)此關(guān)系進(jìn)行分析,以判別其有效性;還可以利用關(guān)系式,由一個(gè)或多個(gè)變量值,預(yù)測(cè)和控制另一個(gè)因變量的取值,并進(jìn)行因素分析。我們?cè)诮⒍嘣€性回歸模型并進(jìn)行預(yù)測(cè)的時(shí)候,首先會(huì)對(duì)各個(gè)自變量進(jìn)行預(yù)測(cè),這種預(yù)測(cè)往往只反映出自變量單一的可能性,即自變量只取單一的預(yù)測(cè)值。然而在未來,自變量的取值是具有多種可能性的,不同的自變量的取值都會(huì)對(duì)預(yù)測(cè)值產(chǎn)生影響。在這種情況下,概率排序型的預(yù)測(cè)方法可以考慮到不同的自變量取值對(duì)預(yù)測(cè)值的影響,并通過期望值的最大最小值和方差的最大值描述預(yù)測(cè)的結(jié)果并衡量預(yù)測(cè)結(jié)果的波動(dòng)性,對(duì)未來的預(yù)測(cè)更加貼近實(shí)際。
目前基于多元線性回歸反映自變量的多種可能性以及將概率排序的預(yù)測(cè)方法應(yīng)用到多元線性回歸模型的研究還很少,本文針對(duì)運(yùn)用多元線性回歸進(jìn)行預(yù)測(cè)時(shí),由于自變量的不確定性導(dǎo)致的預(yù)測(cè)值的波動(dòng)性,提出了概率排序型的預(yù)測(cè)方法,并用期望值的最大最小值和方差的最大值作為預(yù)測(cè)的指標(biāo),描述預(yù)測(cè)的結(jié)果并衡量預(yù)測(cè)結(jié)果的波動(dòng)性,最后結(jié)合示例說明該方法的有效性。
在實(shí)際問題中,我們研究的變量往往會(huì)受到很多因素的影響。例如對(duì)于某件商品的需求量會(huì)受到消費(fèi)者的收入、自身價(jià)格、相關(guān)產(chǎn)品的價(jià)格等因素的影響。這就涉及到一個(gè)因變量與若干自變量的相關(guān)關(guān)系問題,對(duì)于這樣的問題,我們常常通過多元線性回歸分析的方法來解決。
如果影響影響因變量 y的因素有n個(gè),分別記為:x1,x2,…,xn,y 與 x1,x2,…,xn之間存在線性相關(guān)關(guān)系,那么多元線性回歸的數(shù)學(xué)模型的就可以表示為:
目前,利用多元線性回歸進(jìn)行預(yù)測(cè)時(shí),如果求得回歸系數(shù),那么只要知道當(dāng)期 (x1,x2,…,xn)具體的值,就可以通過多元線性回歸方程,預(yù)測(cè)出下一期y的值。但是這種方法的問題在于,預(yù)測(cè)是對(duì)未來的判斷,而未來是不確定的,每一個(gè)因素都可能會(huì)有若干個(gè)可能的取值,并且各個(gè)取值出現(xiàn)的概率也有可能不一樣。因此,我們?cè)诶枚嘣€性回歸模型對(duì)下一期進(jìn)行預(yù)測(cè)的時(shí)候,應(yīng)當(dāng)通過調(diào)查問卷、專家調(diào)查法等方式,得到未來變化的波動(dòng)性范圍,比較出不同組合出現(xiàn)的概率大小,這樣才把未來的變化導(dǎo)致的不確定性考慮了進(jìn)來。
表1 不同概率下各種組合及其對(duì)應(yīng)的結(jié)果
從表1中可以看出,在實(shí)際的預(yù)測(cè)分析中,決策者對(duì)未來狀態(tài)出現(xiàn)概率的了解是處于既有所了解但又不足以單值地計(jì)算出準(zhǔn)確數(shù)值來。換句話說,決策者只知道N個(gè)未來狀態(tài)的概率將呈現(xiàn)出這樣的順序:p1≥p2≥…≥pN,或 pi-pi+1≥0,而不知道 pi的具體數(shù)值。在這種情況下,概率排序型預(yù)測(cè)方法不失為一種實(shí)用并且有效的方法。
在概率排序型預(yù)測(cè)中,由于無法確定各個(gè)需求的準(zhǔn)確概率數(shù)字,所以也無法準(zhǔn)確地計(jì)算其期望值,但是我們可以通過求得期望值的最大值和最小值來確定期望值可能的取值范圍,因此,用f(x)的最大期望值和最小期望值來描述在需求不確定情況下預(yù)測(cè)的結(jié)果,不失為一個(gè)可行的辦法。又因?yàn)樵谄谕迪嗤那闆r下,需求的波動(dòng)性也可能有很大的差別。因此,我們?cè)诒A羝谕档那疤嵯?,用方差作為衡量預(yù)測(cè)的波動(dòng)性的指標(biāo),同時(shí)運(yùn)用到概率排序型預(yù)測(cè)方法的構(gòu)建中。
對(duì)于每個(gè)結(jié)果 fi(x)的期望值E(Ai)的最大值和最小值為:
根據(jù)克米耶托維茨所著《決策論和不完全信息》中對(duì)這種概率弱排序條件下的特殊的二次規(guī)劃問題研究后,可以得出以下結(jié)論:
表2 機(jī)電行業(yè)銷售額與汽車產(chǎn)量和建筑業(yè)產(chǎn)值
某地區(qū)相關(guān)部門對(duì)本地區(qū)機(jī)電行業(yè)銷售額y、汽車產(chǎn)量x1以及建筑業(yè)產(chǎn)值x2進(jìn)行統(tǒng)計(jì),如表2所示。
根據(jù)表中的統(tǒng)計(jì)數(shù)據(jù)和多元線性回歸的相關(guān)知識(shí),可以得到樣本回歸方程:
表3 不同組合下對(duì)應(yīng)的預(yù)測(cè)y值
由于是對(duì)未來的預(yù)測(cè),所以汽車產(chǎn)量和建筑業(yè)產(chǎn)值各個(gè)組合出現(xiàn)的概率是無法準(zhǔn)確的判定的。但根據(jù)各方面的綜合研究和市場(chǎng)形勢(shì)的判斷,決策者認(rèn)為各個(gè)組合出現(xiàn)的概率由大到小分別為 y4≥y1≥y5≥y2≥y3≥y6,那么我們就能得到按概率大小排序以后新的預(yù)測(cè)表4,表中π1≥π2≥π3≥π4≥π5≥π6。
表4 按概率排序后的預(yù)測(cè)表
表5 預(yù)測(cè)值的最大期望值、最小期望值和最大方差
本文討論了概率弱排序的預(yù)測(cè)問題,對(duì)于未來預(yù)測(cè)值的各個(gè)影響因子出現(xiàn)的概率既有所了解,又不足以準(zhǔn)確的計(jì)算出數(shù)值,即由于自變量的不確定性導(dǎo)致的預(yù)測(cè)值的波動(dòng)性,提出利用概率排序的預(yù)測(cè)方法,建立多元線性回歸模型進(jìn)行預(yù)測(cè),不僅具有堅(jiān)實(shí)的理論基礎(chǔ),而且更貼近實(shí)際。將期望值的最大最小值和方差的最大值作為預(yù)測(cè)的指標(biāo),可以很好的描述預(yù)測(cè)的結(jié)果并衡量預(yù)測(cè)結(jié)果的波動(dòng)性,方法簡(jiǎn)單、應(yīng)用方便。因此,應(yīng)用該模型企業(yè)可以及時(shí)的根據(jù)相關(guān)因素在市場(chǎng)中未來的取值概率對(duì)資源進(jìn)行合理的預(yù)測(cè),從而制定相應(yīng)的對(duì)策,實(shí)現(xiàn)企業(yè)的效益最優(yōu)化。最后示例驗(yàn)證了模型應(yīng)用的可行性和有效性。
[1]葉春明,齊靜.基于多元線性回歸模型的專利技術(shù)產(chǎn)業(yè)化評(píng)價(jià)研究[J].科技管理研究,2010,(21).
[2]王振友,陳莉娥.多元線性回歸統(tǒng)計(jì)預(yù)測(cè)模型的應(yīng)用[J].統(tǒng)計(jì)與決策,2008,(5).
[3]王義宏.基于多元線性回歸分析的縣域經(jīng)濟(jì)發(fā)展程度的評(píng)價(jià)——以江陰為例[J].生產(chǎn)力研究,2009,(18).
[4]陳剛,蔡遠(yuǎn)利,穆靜,楊衛(wèi)麗.海量信息異常檢測(cè)問題的異常概率排序算法[J].西安交通大學(xué)學(xué)報(bào),2011,(4).
[5]邱滌珊,賀川,朱曉敏.基于概率可信度的區(qū)間數(shù)排序方法[J].控制與決策,2012,(12).
[6]Kmietowicz Z W,Pearman A D.Decision Theory and Incomplete Knowledge[M].Hampshire,England:Gower Pub,1981.