張春紅
(湖南科技職業(yè)學院 湖南長沙 410004)
為及時掌握空氣質量,我們可實時對“兩塵四氣”(PM2.5、PM10、CO、NO2、SO2、O3)濃度進行監(jiān)測,對污染源采取相應措施。雖然國家監(jiān)測控制站點(國控點)對“兩塵四氣”有監(jiān)測數(shù)據(jù),且較為準確,國控點布控較多。但是,由于我國地域廣闊,其覆蓋不全面,監(jiān)測有限,有些地區(qū)數(shù)據(jù)發(fā)布時間滯后較長且花費較大,無法給出每個企業(yè)尤其是化工、醫(yī)藥、礦業(yè)、冶金、燃氣管道等企業(yè)和邊遠地區(qū)實時空氣質量的監(jiān)測和預報。因此,我們可采用微型空氣質量檢測儀檢測數(shù)據(jù)作為監(jiān)控空氣質量的另一種形式,實現(xiàn)相關企業(yè)的監(jiān)測和邊遠地區(qū)空氣質量的檢測。微型空氣質量監(jiān)測儀具有花費少、監(jiān)測方便等優(yōu)點,可對空氣質量進行實時網格化監(jiān)控,并同時監(jiān)測溫度、濕度、風速、氣壓、降水等氣象參數(shù)。由于所使用的電化學氣體傳感器在長時間使用后會產生一定的零點漂移和量程漂移,非常規(guī)氣態(tài)污染物(氣)濃度變化對傳感器存在交叉干擾,以及天氣因素對傳感器的影響,這就造成同一時間微型空氣質量檢測儀所采集的數(shù)據(jù)與真實值存在一定的差異。因此,我們需要對這些自建點數(shù)據(jù)進行誤差及影響因素的數(shù)據(jù)處理分析,才能進行下一步的差異分析和校準研究,實現(xiàn)既方便快捷又省時省力的精準監(jiān)測、實時檢測所有地區(qū)和特殊企業(yè)的空氣質量狀況。[1]
本文數(shù)據(jù)以中國工業(yè)與應用數(shù)學學會提供的國控點和自建站數(shù)據(jù)為基礎。
國控點數(shù)據(jù)以每小時為單位給出,而自建點的數(shù)據(jù)以時間間隔在五分鐘之內給出,數(shù)據(jù)量較為龐大,因此選取合適的時間點來進行模型的建立是本論文的基礎。一方面,通過觀察和比較分析,我們發(fā)現(xiàn)國控點的每日數(shù)據(jù)存在部分缺失,比如說2018年11月14日的數(shù)據(jù)就不是完整的24小時數(shù)據(jù)。這一類的數(shù)據(jù),我們記為不完整數(shù)據(jù),在我們取樣過程中不考慮這一類的數(shù)據(jù)。另一方面,空氣質量的評判可以看出一段時間序列,但正如我們知道,空氣質量受天氣的影響。附件所給的時間跨度半年多,因此,我們在選取數(shù)據(jù)時根據(jù)時間段選取2019年1月8日、2019年4月7日、2019年5月7日這三天的數(shù)據(jù)作為樣本進行可視化數(shù)據(jù)分析。選取這三天的原因是因為這這三天的數(shù)據(jù)完整,且處于不同的月份,涵蓋了不同季節(jié)氣溫對空氣質量的影響因素,具有較全面的典型性。我們在整篇文章里都以國建的數(shù)據(jù)視為標準數(shù)據(jù)來衡量自建數(shù)據(jù)的差異,對國建數(shù)據(jù)選取完畢之后對題目所要求的三個問題進行系統(tǒng)分析。
我們對自建點數(shù)據(jù)與國控點數(shù)據(jù)進行探索性數(shù)據(jù)分析。首先,我們根據(jù)前期所選取的國建三天的數(shù)據(jù),找到相應的自建數(shù)據(jù)。自建數(shù)據(jù)所給的時間間隔為五分鐘之內,為了與國控數(shù)據(jù)的范圍統(tǒng)一,通過計算平均值的方法來計算出自建點每小時的值。其次,我們先通過折線圖來直觀反映選取的三天的每組數(shù)據(jù)的國控和自建的關系,如下圖。然后,根據(jù)每天的折線圖可以看出,自建監(jiān)測點所測的數(shù)據(jù)在一定程度上還是可以反映出國控監(jiān)測點的數(shù)據(jù)值。[2]
具體來看,1月8日PM10,PM2.5的浮動取值兩者基本一致,4月17日,PM2.5,NO2,O3,CO這些監(jiān)測值的走勢基本一致,5月7日PM10,O3的監(jiān)測值的走勢基本一致。這些都可以在一定程度上反映自建監(jiān)測點所測數(shù)據(jù)的準確性。但根據(jù)折線圖,我們可以看到一些差異比較大的數(shù)據(jù)值,如SO2兩者的數(shù)據(jù)就差別較大。這可能跟風度、溫度、非常規(guī)氣態(tài)污染物(氣)濃度變化等其它因素有關系。[3]
根據(jù)上面的分析,我們引入空氣污染指數(shù)的計算公式來直觀地刻畫兩種模式下的空氣質量監(jiān)控之間的差異。針對上面的差異,我們再用回歸模型對兩組數(shù)據(jù)的量進行回歸分析,得出了兩者之間的具體差異。
我們對導致自建點數(shù)據(jù)與國控點數(shù)據(jù)造成差異的因素進行分析,根據(jù)問題回歸分析所得出結果,仍將國控監(jiān)測地的數(shù)據(jù)值作為標準,將風速、壓強、降水量、溫度、濕度等因素考慮進去。因所給的變量比較多,我們采用主成分分析法,選取影響比較大的幾個因素進行分析。
由于客觀事物內部規(guī)律的復雜性和認識程度的有限性,在遇到無法用機理分析建立數(shù)學模型時,我們通常采取搜集大量數(shù)據(jù)的辦法,基于對數(shù)據(jù)的統(tǒng)計分析去建立模型,其中用途最為廣泛的一類隨機模型就是統(tǒng)計回歸模型。[4]
回歸模型確定的變量之間是相關關系,在大量的觀察下會表現(xiàn)出一定的規(guī)律性,可以借助函數(shù)關系式來表達,稱為回歸函數(shù)或回歸方程。
我們先對第一問五個指標,以自建點數(shù)據(jù)“兩塵四氣”(PM2.5、PM10、CO、NO2、SO2、O3)濃度為X1、X2、X3、X4、X5,以國控點數(shù)據(jù)“兩塵四氣(PM2.5、PM10、CO、NO2、SO2、O3)濃度為Y1、Y2、Y3、Y4、Y5,探究Y關于X相對的函數(shù)關系;然后回歸分析,看看數(shù)據(jù)差異。
首先,我們使用SPSS軟件進行數(shù)據(jù)分析,給出PM10和NO2的分析樣圖,對2019年1月8日的數(shù)據(jù)進行單個量之間的相關性分析,證實自建點和國控點之間數(shù)據(jù)的相互關系。其次,我們根據(jù)折線圖來將檢測的數(shù)據(jù)值進行可視化分析,分析結果,X(i)與 Y(i)之間都有相關的性質,但是在某幾個因素中,相關度不高。最后,我們將自建點中的其他五個因素進行相關性分析,得到了如下結果。
我們通過以上分析發(fā)現(xiàn):
風速與PM2.5濃度和PM10的濃度有一定關系,無風時PM2.5和PM10的濃度容易聚集,風速在一定范圍內會降低PM2.5濃度和PM10的濃度。近地面氣溫較高時,大氣對流作用加劇,可以降低PM2.5濃度和PM10的濃度;反之,大氣出現(xiàn)逆溫層時,PM2.5和PM10的濃度不易擴散。近地面氣溫較高時,NO2濃度容易聚集;反之,氣溫較低時NO2濃度容易擴散。近地面氣溫較高時,O3濃度容易聚集;反之,氣溫較低時,O3濃度容易擴散。降水有利于降低PM2.5濃度和PM10的濃度,利于水汽凝結,形成云霧和降水。