洪佳音 朱少娟
[摘要]隨著我國綜合國力的提升,很多發(fā)達國家曾經面臨的問題現在也出現在我們周圍,空氣污染成為現在人們關心的重點。PM2.5是指環(huán)境空氣中當量值小于等于2.5微米(um)的顆粒物,也稱細顆粒物。PM2.5直徑非常小,但是活性很強,它的表面容易攜帶有毒有害的物質,PM2.5懸浮在空氣中,能夠通過肺泡進入到人體的更深處,通過血液循環(huán)對身體造成一些不可預知的影響。因此,PM2.5對人們的健康和空氣質量的影響非常大。近年來PM2.5逐漸被大眾熟知,PM2.5的濃度也被視為評判空氣質量的一個重要指標,了解其在空氣中的變化趨勢,對制定合理的治理機制具有很大意義。
隨著我國經濟的快速發(fā)展,人們對好的生活環(huán)境的訴求愈加強烈,PM2.5進入大家視線并且很快成為現在中國普遍關心的空氣污染問題。本文我們針對PM2.5做了以下研究:
首先,基于多重馬氏鏈建立PM2.5等級預測模型。本文根據大氣污染物濃度限值將PM2.5日平均濃度數據分級,并建立多重馬氏鏈預測模型。然后利用一步狀態(tài)轉移概率矩陣,通過C-K方程對模型的有效性進行檢驗。最后根據多重馬氏鏈的遍歷性得到穩(wěn)態(tài)分布和重現期。本文以宿州市PM2.5數據為例,對PM2.5污染等級進行預測。結果表明:該多重馬氏鏈模型用于PM2.5等級預測是有效的。
[關鍵詞]:PM2.5;多重馬氏鏈;宿州市
1.基于重馬爾科夫鏈PM2.5的預測
空氣污染預測的模型有很多,比如:灰色預測模型]時間序列模型等。本文將采用一種隨機過程模型:馬爾科夫鏈模型來預測PM2.5污染。
1.1多重馬爾科夫鏈的基本理論
隨機過程研究的是隨時間變化的隨機現象,隨機現象是事情發(fā)生之前不可預測的現象。隨機過程應用領域廣有:氣象預報,通信工程經濟分析等。許多領域都會根據隨機過程的理論建立不同的數學模型[2。隨機過程嚴格的定義如下。
定義1.1.13]設(2,y,P)是一個概率空間,其中e為樣本空間,y為樣本空間g上的一個o域,P為定義在業(yè)上的一個概率函數,設TcR為實數集.設X(t,o)為定義在二元空間TxQ上的函數,若對任一參數1eT,X(t,o)都是(2,Y,P)上的隨機變量。則稱{X(t,)tET,oe2}是概率空間(2,,P)上的隨機過程,簡記為{X(1)tET}或x}
定義中的T稱為參數集或參數空間.給定1eT,X(t,o)為隨機變量,稱為{X(1)teT}在t時刻的狀態(tài),所有可能狀態(tài)的集合構成狀態(tài)空間(狀態(tài)集)E。參數集和狀態(tài)集既可以是離散的,也可以是連續(xù)的。
馬爾科夫過程是一種重要的隨機過程,它是俄國數學家馬爾科夫最早研究并命名的。我們把參數集為離散集,狀態(tài)集也為離散集的馬爾科夫過程稱為馬爾科夫鏈[4],定義如下:
有關,這種性質稱為馬爾科夫的無后效性,簡稱馬氏性。簡單來講,馬氏性就是己知現在的狀態(tài),將來要達到的狀態(tài)與過去的“經歷”無關[5]。
定義1.1.316]設{X,1=0,l,2,一為一個馬爾科夫鏈,其狀態(tài)集為E,稱P{X=jX,=}為馬爾科夫鏈在時刻t從狀態(tài)出發(fā)一步到達狀態(tài)j的條件概率為一步轉移概率,詹稱轉移概率,記為P,(1)。
轉移概率P,(1)i,jEE可以排列成一個轉移概率矩陣P=(p,(D),jEE轉移概率矩陣具有如下性質:
根據一步轉移概率,可以得到m步轉移概率[7]
將其改寫為n步轉移概率矩陣的形式如下:
式(1.1)式(1.2)簡稱C-K方程,它揭示了P和plo之間的關系。
則稱此鏈具有遍歷性,并且各狀態(tài)的穩(wěn)態(tài)概率
此時所得的穩(wěn)態(tài)概率分布也為平穩(wěn)分布,用4;表示從狀態(tài)j出發(fā)再回到狀態(tài)歹所用的平均時間,即狀態(tài)j的重現期。若一個馬爾科夫鏈是遍歷的,則可得到穩(wěn)態(tài)概率與重現期的關系:
1.2離散參數馬爾科夫鏈預測模型的建立
1.2.1狀態(tài)集的分類
馬爾科夫鏈預測模型的準確性與狀態(tài)集的科學劃分有著緊密聯系。下面介紹三種常用的狀態(tài)集劃分方法。
(1)根據人們在生活中的經驗,對事物的認識和了解,從而對現象進行等級劃分。
比如:空氣污染物等級的劃分,太湖流域梅雨類別的劃分。
根據樣本均值X和均方差s構造指標值的變化區(qū)間.比如將指標值劃分為五個區(qū)間:
若研究對象與時間順序相關,則可采用有序樣本分類法。即通過構建F統(tǒng)計量,來尋求最優(yōu)分割點,從而實現對有序樣本的分類。
1.2.2馬氏性的檢驗
利用馬爾科夫鏈模型正確預測的基礎是對該隨機過程進行馬爾科夫性檢驗"。
將得到的數據按照一定的分類法進行分類,得到一串指標值序列x如,%,其中x,EEkl,2,一,.N},下面使用X~統(tǒng)計量
來檢驗隨機過程{{}是否具有馬爾科夫性。其中,f,ijEE表示從狀態(tài)i經過一步到達狀態(tài)j的頻數,將轉移頻數排列成轉移頻數矩陣
將稱為“轉移概率”。事實上,它是一步轉移頻率。由頻率的穩(wěn)定性可知,當N充分大時,轉移頻率可以用來估計轉移概率。為簡單起見,這里用轉移概率的記號砌來表示轉移頻率,且稱它為“轉移概率”。
將稱為“邊際概率”,口,事實上,它是邊際頻率。由頻率的穩(wěn)定性可知,當N充分大時,邊際頻率可以用來估計邊際概率。
當n充分大時,此統(tǒng)計量服從自由度為(v-I}的X~分布。在給定的顯著性水平@下,若r2(V一IP則認為該隨機過程{X}具有馬氏性,可以建立馬爾科夫鏈預測模型。
1.3基于離散參數馬爾科夫鏈的宿州市PM2.5預測
我們從網站"2搜集宿州市2017年5月18至2019年5月26日的PM2.5日平均濃度數據,PM2.5日平均濃度數據是根據當天環(huán)??傉久啃r的數據計算求出的平均數據。PM2.5污染等級是根據《環(huán)境空氣質量指數(AQI)技術規(guī)定(試行)》13!中大氣污染物項目濃度限值進行劃分的,即依據PM2.5日平均濃度限值將PM2.5污染劃分為“優(yōu)”,“良”,“輕度污染”,“中度污染”“重度污染”和“嚴重污染”6個等級,分別用數1,2,3,4,5,6表示,詳見表1.1。
根據表1.1,將宿州市PM2.5日平均濃度數據對應為不同的PM2.5污染等級,得到表1.2。
通過分析,該市PM2.5日平均濃度為58.18.g/m',低于我國《環(huán)境空氣質量標準(G3095-2012)》中二級PM2.5日平均濃度限值754g/m',高于世界衛(wèi)生組織在2005年制定的PM2.5標準限值(25pg/m')。該市2017年5月18日至2019年5月26日共計746天中PM2.5各等級出現的天數及所占百分比見表1.3。
由表1.3可知,宿州市2017年5月1日至2019年5月26日期間,PM2.5日平均濃度處于2等級較多,即PM2.5污染等級處于“良”的天數占整體的51.3%.其次是1等級,在檢測的746天中,有105天處于3等級,占整體的14.1%,3等級對應”輕度污染”,對于健康人群會出現刺激癥狀.在統(tǒng)計的746天中,6等級即PM2.5污染為“嚴重污染”出現1天,這1天對人的危害是非常大的。
每一天的等級是一個隨機變量,746天的等級構成一個隨機過程{X,t=1.746,表1.2是該過程的一次實現,其狀態(tài)集E=1.23.4.6},使用x?統(tǒng)計量(式(1.4))來檢驗過程{x}是否具有馬氏性。根據表1.2可得一步轉移頻數矩陣(1.5)。
其中,$;表示從等級i一步轉移到等級J的天數。
從而,宿州市PM2.5污染等級的一步狀態(tài)轉移概率矩陣
其中,p,表示等級i一步轉移到等級]的概率。
利用一步狀態(tài)轉移概率矩陣中的數據,根據式(1.4)計算得出x?對于給定顯著性水平Q=0.05,查表可知,表明該隨機過程具有馬氏性,可以建立馬爾科夫鏈模型進行PM2.5污染等級預測。
由C-K方程(式(1.2))得到兩步轉移概率矩陣p(2)和三步轉移概率矩陣pl)
其中,p}表示等級i兩步轉移到等級j的概率;PP表示等級i三步轉移到等級J的概率。
運用馬爾科夫鏈預測模型P、p(2)、p),我們對宿州市2019年6月1日、2日、3日的PM2.5污染等級進行預測。
根據網站數據顯示,2019年5月31日宿州市PM2.5等級為|,在一步狀態(tài)轉移概率矩陣P中狀態(tài)1-步到達狀態(tài)1的概率P1最大,其值為0.615,表明6月18PM2.5等級為1,在6月18PM2.5等級為1的可能性最大,即預測等級為1。2019年6月1日該市PM2.5日平均濃度為294g/m',據表1.1可知該天PM2.5等級為1,預測等級與當天PM2.5實際等級是吻合的。
在兩步狀態(tài)轉移矩陣P(2)中,2019年5月31日的PM2.5等級為I經過兩步到達等級2的概率p悅最大且為0.4981,即6月2日預測等級為2。2019年6月2日該市PM2.5日平均濃度為39g/m',PM2.5等級為2,預測等級與當天PM2.5實際等級一致市PM2.5日平均濃度為39.ug/m',PM2.5等級為2,預測等級與當天PM2.5實際等級一致。
在三步狀態(tài)轉移概率矩陣P(3)中,2019年5月31日的.PM2.5等級1經過三步到達等級2的概率pl2'最大,其值為0.5425,即6月3日預測等級為2。據表1.1可知2019年6月3日PM2.5實際等級為2,預測等級符合實際。因此,該馬爾科夫鏈預測模型是有效的,可以利用該模型對宿州市PM2.5未來等級進行預測。
根據三步狀態(tài)轉移概率矩陣P(3)的概率p?都大于0,即存在正整數3,對任意的ijeE,有們>0。根據定理1.1.2可知該馬爾科夫鏈具有遍歷性。根據式(1.3)可計算得出唯一解:
將式(1.7)與表1.3中PM2.5各等級所占百分比進行比較分析,可知宿州市若按現有狀況發(fā)展下去,在未來1,2,3等級出現的百分比將有所增加,增幅分別為0.3%,0.93%,0.34%,即空氣質量等級為優(yōu)、良和輕度污染的概率都有小幅上升,意味著宿州市空氣質量在朝好的方向發(fā)展;4等級出現的百分比略微下降,降幅為0.13%,即空氣質量等級為中度污染的概率有所下降,這從側面印證未來宿州市的空氣質量有所好轉。5,6等級出現的概率幾乎保持穩(wěn)不變,表明未來宿州市出現重度污染和嚴重污染的概率與過去一段時間持平。根據各狀態(tài)的重現期,可以預測在未來長期過程中該城市出現2等級的可能性最大,平均每隔2.271天出現一次。出現3等級的概率次之,平均每隔3.685天出現一次。此外,平均每隔70.42天出現一次出現6等級。
本章根據大氣污染物PM2.5日平均濃度限值,將宿州市2017年5月1日至2019年5月26日的PM2.5日平均濃度數據進行分類,采用離散參數馬爾科夫鏈建立PM2.5預測模型,并對該預測模型的馬氏性進行PM2.5檢驗。最后根據馬爾科夫鏈的遍歷性求出穩(wěn)態(tài)分布,并基于此對未來宿州市PM2.5等級狀態(tài)進行預測。預測結果表明:宿州市未來PM2.5污染狀態(tài)略微有所好轉,但是PM2.5重度污染和嚴重污染的概率幾乎沒有降低。因此建議環(huán)境保護部門應該加大環(huán)境治理力度,采取更加有效的措施,減少PM2.5嚴重污染的天數,讓優(yōu)質環(huán)境的天數更多,為人們創(chuàng)造一個健康的生活環(huán)境。
參考文獻:
[1]李裕奇隨機過程[M].國防工業(yè)出版社2003.
[2]周永道,王會琦,昌王勇.時間序列分析及應用[M].高等教育出版社,2015.
[3]車險峰.基于馬爾科夫鏈的股市大盤指數預測(U1.商情,2013(21):1-4.
[4]丁倩蕓馬氏鏈在生物網絡中的運用[D]長沙:中南大學,2011.
[5]劉秀芹,李娜,趙金玲.應用隨機過程[M].科學出版杜,2015.
[6]黃賢玲.馬爾柯夫法在商情預測中的應用(洛陽師范學院學報2001,202);31-32
[7]孫榮恒隨機過程及其應用[M].清華大學出版社,2005.
[8]方兆本繆柏其,隨機過程[M].科學出版社,2011.
[9]張宗國馬爾可夫鏈預測方法及其應用研究[D].南京:河海大學,2005:20-23.
[10]夏樂天.馬爾可夫鏈預測方法及其在水文序列中的應用研究[D].南京:河海大學2005:31-32.
[11]夏樂天,朱元性沈水梅.加權馬爾可夫鏈在降水狀況預測中的應用水利水電科技進展,2006.
[12]天氣后報。(2015-2-28)/[2015-4-20].http://WWW.tianqihoubao.com/.
[13]HJ633-2012,環(huán)境空氣質量指數(AQI)技術規(guī)定(試行)[S].北京:中國環(huán)境科學出版社,2012.