国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于多重共線性的氣象觀測站優(yōu)化模型

2020-12-28 02:17:35梁素梅
價值工程 2020年32期
關鍵詞:回歸分析降水量

梁素梅

摘要:氣象觀測站優(yōu)化問題已成為實際生活中的熱點問題,文章根據(jù)已有的降水量數(shù)據(jù)對該市氣象觀測站之間的相互關系和擬合程度進行了分析;借助EXCEL,EVIEWS3.1,MATLAB等軟件進行數(shù)據(jù)的預處理,對氣象觀測站問題進行更加深入討論和相關的分析研究,使得站點的選擇問題得到了很好解決。

Abstract: The optimization of meteorological observation stations has become a hot issue in real life. Based on the existing precipitation data, this paper analyzes the relationship and fitting degree between the meteorological observation stations in the city; With the help of EXCEL, EVIEWS3.1, MATLAB and other software for data preprocessing, it conducts more in-depth discussion and related analysis and research on the problems of meteorological observation stations, so that the problem of site selection is well resolved.

關鍵詞:氣象觀測站;多重共線性;多元統(tǒng)計;回歸分析;降水量

Key words: meteorological observation station;multicollinearity;multivariate statistics;regression analysis;precipitation

中圖分類號:O212.1? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1006-4311(2020)32-0157-04

0? 引言

某市有10個縣,每個縣有一個氣象觀測站,每個氣象觀測站測得的年降水量即為該縣的年降水量。30年來各觀測站測得的年降水量[1]中的B題。為了節(jié)省開支,想要適當減少氣象觀測站,那么減少哪些觀測站既可以節(jié)省開支,又可以使得該市年降水量的信息量損失較小即信息量足夠大?我們究竟應按什么標準來減少觀測站呢?這個標準是主觀還是客觀的呢?如果是客觀的,那么減少觀測站時應考慮哪些影響因素呢?有沒有可能根據(jù)這些影響因素來構建一個氣象觀測站標準的量化模型或定性模型呢?如果可能具體操作又如何呢?如①有人認為第7個觀測站和第8個觀測站觀測到的數(shù)據(jù)之間有相關關系,第7個觀測站可以減少,第7個觀測站的年降水量信息可以從第8個觀測站觀測到的數(shù)據(jù)中獲取。②還有哪些觀測站可以減少,減少的觀測站的年降水量信息如何獲取。③如果以10個縣年降水量的平均值為該市年平均降水量。在減少觀測站以前,每個縣年降水量都是觀測數(shù)據(jù)。在減少觀測站以后,被減少的觀測站的年降水量只能從其它觀測站觀測到的數(shù)據(jù)中獲取。減少觀測站以前和減少觀測站以后是用兩種不同測量計算方法得到該市年平均降水量。兩種不同測量計算方法得到的該結果會有誤差,試預測誤差的絕對值小于10mm的概率是多少?誤差的絕對值大于20mm的概率是多少?

1? 模型假設

①該市的地理特性具有一定的均勻性,即地理因素對氣象的影響可忽略不計;

②不考慮該區(qū)以外的其它因素對本地區(qū)的氣象的影響;

③各縣建氣象觀測站的花費是相同的,不隨地理的不同而改變;

④信息量足夠大是指可預測性在95%以上;

⑤假設預測誤差的絕對值服從正態(tài)分布,當m值比較大時服從中心極限定理。

2? 符號說明

3? 減少氣象觀測站的模型

通過軟件EViews3.1分析降水量數(shù)據(jù)得到各觀測站之間的相關系數(shù)如表1所示。

從表1中我們可以看出x7和x8的相關系數(shù)為0.952268,具有高度相關性,其中x2和x3,x6和x7,x6和x8之間都存在較強的相關性。這反映出它們之間可能存在多重共線性[2-3]。

下面通過軟件EViews3.1用VIFi法來診斷多重共線性問題。通過軟件EViews3.1算出各變量xi的VIFi值如表2。

從表2中可以看出,VIF8=19.7776,這個數(shù)值是很大的,當變量間出現(xiàn)共線性時,可以設法將其消除,用其他變量來表示它,通常選擇VIFi值最大的變量進行剔除,所以我們首先可以將x8即第8個觀測站減去。它們之間的相關系數(shù)為0.952268,具有高度相關性,認為第8個觀測站的年降水量信息可以從第7個觀測站觀測到的數(shù)據(jù)中獲取。但是x2,x3,x6,x7的VIFi值同樣也比較大,尤其是x7的VIF7值僅次于VIF8,所以x2,x3,x6,x7中還有可能減少。

當?shù)趇個特征值λ≈0時,表示與其對應的主分量對總體的貢獻很小,若λi所對應的特征向量vi中第k個分量所占的權重最大,則說明在貢獻很小的主成份中起主要作用的是第k個觀測站,因此可把第k個觀測站剔除掉,剔除它所損失的信息量就是這個主成份的貢獻率。對剩下的p-1個觀測站的n年觀測數(shù)據(jù)再按上述方法進行計算,看是否需要再剔除另一個觀測站;依此進行有限次計算,直到?jīng)]有特征值近似為0時為止。

在上述過程中剔除了3個測站即x3,x6,x8。因為其剩下的7個觀測站就基本上保留了原來氣象測站的信息,這樣就達到了節(jié)省開支,優(yōu)化測站的目的。

由表2可見λ1=0.0321,λ2=0.0571,λ3=0.0933都是約等于0,第一次計算結果與它們相對應的特征向量v1,v2,v3中,只有v1中的第8個分量的絕對值最大,這時在不損失信息量的情況下刪除站x8。由于各測站之間存在相關關系,所以每次只可刪除一個測站,再將余下的9個測站30年來的數(shù)據(jù)按上述方法計算剔除測站x3。第三次將余下的8個測站到按上述方法計算剔除測站x6此計算結束。

綜上所述第7個觀測站可以減少,第7個觀測站的年降水量信息可以從第8個觀測站觀測到的數(shù)據(jù)中獲取。

4? 優(yōu)化氣象觀測站模型與回歸模型

4.1 模型的分析

要減少觀察站,肯定會對降水量信息量有一定的影響,但要求降水信息量損失較小。因此,此處不妨將預測的可靠性設置為95%。首先對表中數(shù)據(jù)進行分析,可以得出各數(shù)據(jù)之間的線性相關性[4],根據(jù)95%的可信度,查“檢驗相關系數(shù)ρ=0的臨界(rα)表”,可得:

用EVIEWS3.1[7]求的各個相關系數(shù)β0,β1,并建立相關的一元線性函數(shù)和二元線性函數(shù),再通過F檢驗線性系數(shù)的正確性。過后對模型的建立求解,最后檢驗模型。并通過誤差分析判斷出所測數(shù)據(jù)的置信區(qū)間。

4.2 模型的建立

4.2.1 將表中的數(shù)據(jù)進行折線圖的繪圖,如圖1。

根據(jù)圖1可知,各觀測站之間存在著一定的線性關系,再通過求各觀測站之間的線性相關系數(shù),判斷是否可以進行各個觀測站的線性擬合;又由表2可知:根據(jù)95%的可信度,查“檢驗相關系數(shù)ρ=0的臨界(rα)表”,可得r0.05(30-2)≈0.36,從表1可查得,rij>0.36的觀測站組合:

說明了這四個組合的線性相關性是顯著的。

4.2.2 建立一元線性回歸模型

對于觀測站2和3的線性回歸模型為

4.2.3 建立了多元線性回歸模型

因為在一元線性回歸中,只考慮兩者間的相關性,而沒有考慮用多個觀測站來預測一個站點的情況,因而我們須再進行多元線性回歸分析。

從表2的數(shù)據(jù)可知,一些rij較接近于0.36,如:r25=-0.271127,r35=-0.345852,這時可通過多元分析,來確定是否可再減少一些站點。

在二元線性回歸中,對于6,7和8的線性回歸模型:

③通過優(yōu)化模型可以解決第三個問題。

方案1)當建立7個站時候,由于我們選擇了x1,x2,x4,x5,x8,x9,x10則預測誤差絕對值的均值可用模型2得到誤差絕對均值=19.9,方差=227.6,又預測誤差的絕對值滿足正態(tài)分布當θ=10時候根據(jù)公式可得:p=2.5,即預測誤差的絕對值小于10mm的概率為0.25。

當誤差的絕對值大于20mm的概率同理可得p=0.5。

由于m值為30較大,故可以用中心極限定理來求:可知預測誤差的絕對值小于10mm的概率p=0.3667。誤差的絕對值大于20mm的概率p=0.5。

方案2)當建立8個站時候,由于我們選擇了x1,x2,x4,x5,x7,x8,x9,x10則預測誤差絕對值的均值可用模型2得到誤差絕對均值=10.8,方差=58.1,又預測誤差的絕對值滿足正態(tài)分布當θ=10時候根據(jù)公式可得p=0.4602,即預測誤差的絕對值小于10mm的概率為0.4602。當誤差的絕對值大于20mm的概率同理可得p=0.1736。

由于m值為30較大,故可以用中心極限定理來求:可知預測誤差的絕對值小于10mm的概率p=0.53。

誤差的絕對值大于20mm的概率p=0.1。

④對②中的兩種方案進行討論

對②中1)雖然建立觀測站的開支減少了,但是使得該市的年降水量損失比較大,而對于4中的2)雖然觀測站的開支相對1)多了點,但是使得該市的年降水量的信息損失減小了。從上述的討論,可以看出在開支和信息損失兩個角度,如果開支大,得到的信息準確,那么寧愿要選擇信息準確的方案。因此,對上述的討論,采取方案2)是最優(yōu)的,即在即在市內x1,x2,x4,x5,x7,x8,x9,x10建立氣象觀測站。

5? 結論

依據(jù)以上的兩種模型,可以對某市的氣象站進行一個比較好的規(guī)劃。氣象站的建立固然重要,但是有些不應該建立的站點,應該從費用和實用性雙方面來考慮。信息的準確性對于一個市的經(jīng)濟有重要的影響,同時建立的站點并不是越多就越好,對于有些沒有必要的站點,可以通過采用就近的方案近似的估計它當年的降水量。通過合理規(guī)劃既可以節(jié)省開支又比較準確地獲得了降水量的信息。

參考文獻:

[1]http://www.doc88.com/p-304514289238.html.

[2]周品,趙新芬.數(shù)理統(tǒng)計分析[M].北京:國防工業(yè)出版社,1989.

[3]于秀,任秀松.多元統(tǒng)計分析[M].北京:中國統(tǒng)計出版社,1999.

[4]袁衛(wèi),等.統(tǒng)計學[M].北京:高等教育出版社,2000.

[5]劉來福,曾文藝.數(shù)學模型與數(shù)學建模[M].北京:北京師范大學出版社,2002.

[6]求是科技,MATLAB7.0從入門到精通[M].北京:人民郵電出版社,2001.

[7]易丹輝.數(shù)據(jù)分析與EVIEWS應用[M].北京:中國人民出版社,2008.

[8]袁曾任.人工神經(jīng)元網(wǎng)絡及其應用[M].北京:清華大學出版社,1999.

猜你喜歡
回歸分析降水量
繪制和閱讀降水量柱狀圖
1958—2019年新興縣汛期降水量的氣候特征
廣東氣象(2022年5期)2022-10-26 04:01:26
降水量是怎么算出來的
啟蒙(3-7歲)(2019年8期)2019-09-10 03:09:08
黃臺橋站多年降水量變化特征分析
山東水利(2018年7期)2018-08-17 07:29:50
1988—2017年呼和浩特市降水演變特征分析
中國經(jīng)濟發(fā)展狀況與大學生就業(yè)情況的相關性研究
城鄉(xiāng)居民醫(yī)療費用的相關性與回歸分析
基于變形監(jiān)測的金安橋水電站壩體穩(wěn)定性分析
價值工程(2016年29期)2016-11-14 01:56:12
森林碳匯影響因素的計量模型研究
中國市場(2016年33期)2016-10-18 13:00:47
河北省城鎮(zhèn)居民人均可支配收入與消費統(tǒng)計分析
商(2016年27期)2016-10-17 05:53:09
霍山县| 凉城县| 山阴县| 亳州市| 西藏| 克东县| 马龙县| 南召县| 洱源县| 东海县| 遂川县| 定陶县| 筠连县| 罗甸县| 乌拉特前旗| 麻江县| 商南县| 大足县| 宁明县| 惠来县| 黄石市| 上蔡县| 卫辉市| 商河县| 侯马市| 乐亭县| 嘉黎县| 河南省| 邻水| 黔东| 阿鲁科尔沁旗| 昂仁县| 廊坊市| 共和县| 阳城县| 东阳市| 洪雅县| 水富县| 湟中县| 凤庆县| 合川市|