国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于遺傳BP網(wǎng)絡(luò)的城市空氣質(zhì)量等級預(yù)測

2015-02-18 01:29:58李世峰邱占芝
大連交通大學(xué)學(xué)報 2015年4期
關(guān)鍵詞:編碼方案正確率空氣質(zhì)量

李世峰,邱占芝

(大連交通大學(xué) 機械工程學(xué)院,遼寧 大連 116028)*

0 引言

2013年,“霧霾”成為年度關(guān)鍵詞,采用新空氣質(zhì)量標(biāo)準(zhǔn)的74個城市中,只有???、舟山和拉薩3個城市達(dá)到了空氣質(zhì)量二級標(biāo)準(zhǔn).2014年1月4日,國家減災(zāi)辦、民政部首次將危害健康的霧霾天氣納入2013年自然災(zāi)情進行通報.空氣質(zhì)量的好壞及其對環(huán)境和民眾健康的影響開始成為公眾熱議的話題.因此,對空氣質(zhì)量進行預(yù)測預(yù)報研究,對于防災(zāi)減災(zāi)以及公眾健康都是十分重要的.

預(yù)測預(yù)報方法通常采用小波網(wǎng)絡(luò)[1]、貝葉斯網(wǎng)絡(luò)[2]等,利用遺傳BP網(wǎng)絡(luò)的預(yù)測預(yù)報方法一直是人們關(guān)注的研究課題.D.E.Rumelhat和J.L.McClelland在1986年提出了一種利用誤差反向傳播訓(xùn)練的神經(jīng)網(wǎng)絡(luò),簡稱BP(Back Propagation)網(wǎng)絡(luò)[3].該算法具有較好的非線性映射能力,使得復(fù)雜問題能在很多中間過程未知情況下得到較合理的解答[4].但典型的BP網(wǎng)絡(luò)仍然存在過早收斂問題[5-6],而且如何確定隱含層節(jié)點數(shù)目前尚無理論上的指導(dǎo)[7],需要反復(fù)實驗確定.遺傳算法(Genetic Algorithm)具有并行計算、魯棒性強等特點,特別適用于全局尋優(yōu)問題.遺傳BP網(wǎng)絡(luò)融合了BP網(wǎng)絡(luò)與遺傳算法各自的優(yōu)點,非常適合于建立預(yù)測模型,在股市預(yù)測[8]、電力負(fù)荷預(yù)測[9]、產(chǎn)品銷售[10]、環(huán)境保護[11]等方面有著廣泛的應(yīng)用.本文嘗試使用遺傳BP網(wǎng)絡(luò),對城市空氣質(zhì)量等級進行預(yù)測.

1 神經(jīng)網(wǎng)絡(luò)的特點

神經(jīng)網(wǎng)絡(luò)僅僅依靠輸入數(shù)據(jù)和輸出數(shù)據(jù)就能完成網(wǎng)絡(luò)的訓(xùn)練,學(xué)得蘊藏在輸入數(shù)據(jù)與輸出數(shù)據(jù)之間的模式,而不需要關(guān)心學(xué)習(xí)過程本身,極大的簡化了對數(shù)據(jù)的處理過程,擴展了應(yīng)用范圍.但是神經(jīng)網(wǎng)絡(luò)預(yù)測有其局限性,并非所有的問題都可以用神經(jīng)網(wǎng)絡(luò)來進行預(yù)測.其中一類是完全隨機的問題,如彩票,這類問題不能用神經(jīng)網(wǎng)絡(luò)來進行預(yù)測;另一類不可預(yù)測問題是無法獲得輸入信息,例如地震預(yù)測.

由于與空氣質(zhì)量等級相關(guān)的因素眾多,我們并不知道該問題是否屬于上述不可預(yù)測問題.在本案例中,我們嘗試使用氣象信息對空氣質(zhì)量等級進行預(yù)測,首先對數(shù)據(jù)進行了分析.網(wǎng)絡(luò)預(yù)測輸出為空氣質(zhì)量等級,共6類(優(yōu)、良、輕、中、重、嚴(yán)重),若輸入輸出之間為隨機的,預(yù)測正確率17%(即1/6).在進行簡易編碼后使用典型BP網(wǎng)絡(luò)對空氣質(zhì)量等級進行了預(yù)測,預(yù)測正確率在40%左右,40%的預(yù)測正確率在可預(yù)測問題里相對較低,BP網(wǎng)絡(luò)應(yīng)用于很多問題預(yù)測正確率可達(dá)70%以上,但該預(yù)測正確率仍遠(yuǎn)高于隨機預(yù)測,足以證明的問題的可預(yù)測性.

2 數(shù)據(jù)預(yù)處理

2.1 文字屬性編碼

以大連市2013年10月28日開始的空氣質(zhì)量等級記錄為例,選取大連市2013年11月 ~2014年4月(共181個樣本)的天氣記錄及空氣質(zhì)量等級作為訓(xùn)練數(shù)據(jù),預(yù)測未來數(shù)天的空氣質(zhì)量等級.輸入信息如圖1.

圖1 氣象信息截圖

圖中包含了大量的文字信息,依次為天氣1、天氣2、最高氣溫、最低氣溫、風(fēng)向1、風(fēng)力1、風(fēng)向2、風(fēng)力2.

眾所周知,BP網(wǎng)絡(luò)擅長處理數(shù)字問題,所以需要對文字信息進行編碼.風(fēng)向信息可依據(jù)角度進行編碼,例如北風(fēng)為0(度)、南風(fēng)為180(度)天氣屬性按濕度大小編碼,我們可以認(rèn)為天氣為“小雨”比“晴”濕度大,所以“晴”排在前面,“小雨”排在后面,但某天“陰”也不見得一定比某天“多云”濕度大,對于這種憑直觀感覺難以區(qū)分的情況,任選一個排在前面即可;空氣質(zhì)量等級由好到差依次與 0、0.2、0.4、0.6、0.8、1 相對應(yīng).

2.2 輸入屬性篩選

本文使用典型的遺傳算法對輸入屬性進行篩選.

表1 輸入屬性篩選結(jié)果對應(yīng)表

具體計算流程為:首先使用二進制編碼方案對輸入屬性進行編碼,若該屬性參與運算則該屬性的標(biāo)志為1,若該屬性不參與運算則該屬性的標(biāo)志為0.然后,使用預(yù)測值與實際值之差的絕對值的倒數(shù)作為適應(yīng)度,對標(biāo)志位串進行尋優(yōu).最后,得結(jié)果為11110111000,對應(yīng)表如表1.

根據(jù)屬性篩選結(jié)果及高度相關(guān)變量二選其一原則,最終選取天氣1、天氣2、最高氣溫、最低氣溫、風(fēng)力1和風(fēng)力2共6個變量作為輸入.

2.3 數(shù)據(jù)關(guān)聯(lián)方案

針對空氣質(zhì)量等級的預(yù)測使用了2類共10種輸入輸出數(shù)據(jù)關(guān)聯(lián)方案,如圖2.

圖2 兩類預(yù)測方案

類1為不需要天氣預(yù)報的預(yù)測方案,方案1為當(dāng)天的氣象情況關(guān)聯(lián)未來1天的空氣質(zhì)量等級,方案2為當(dāng)天的氣象情況關(guān)聯(lián)未來1、2天的空氣質(zhì)量等級,……,方案6為當(dāng)天的氣象情況關(guān)聯(lián)未來1~6天的空氣質(zhì)量等級.這類關(guān)聯(lián)方案的理論依據(jù)就是樣本輸入對樣本輸出變化的影響,例如今天下雨會使明天的空氣變好,但并不是所有的神經(jīng)網(wǎng)絡(luò)預(yù)測都可以使用該方案,因為使用該方案的前提是我們必須知道輸入樣本對輸出的變化是有影響的.

類2為需要天氣預(yù)報的預(yù)測方案,未來7天的氣象情況可從國家氣象局的預(yù)報獲得,即認(rèn)為未來7天的氣象情況是已知的.方案7為未來1天的氣象情況關(guān)聯(lián)未來1天的空氣質(zhì)量等級,方案8為未來1天的氣象情況關(guān)聯(lián)未來2天的空氣質(zhì)量等級,方案9為未來1天的氣象情況關(guān)聯(lián)未來3天的空氣質(zhì)量等級,方案10為未來1天的氣象情況關(guān)聯(lián)未來4天的空氣質(zhì)量等級.

3 仿真預(yù)測

3.1 遺傳算法優(yōu)化方案

在本案例中,遺傳算法對BP網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)、權(quán)值閥值的優(yōu)化是分開進行的.

BP網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)包含網(wǎng)絡(luò)層數(shù)和隱節(jié)點數(shù)兩部分內(nèi)容,網(wǎng)絡(luò)層數(shù)通常為單隱含層結(jié)構(gòu),雙隱含層結(jié)構(gòu)較少,同時隱節(jié)點數(shù)通常為1~2個整數(shù),例如,經(jīng)典的鳶尾花數(shù)據(jù)集的最優(yōu)隱節(jié)點數(shù)為8,即BP網(wǎng)絡(luò)的網(wǎng)絡(luò)層數(shù)、隱節(jié)點數(shù)是可以精確求得的.而BP網(wǎng)絡(luò)的權(quán)值閥值一般為-3~3之間的浮點數(shù),往往精確到小數(shù)點后數(shù)位,無論多少次運行遺傳算法算法,每次的尋優(yōu)結(jié)果還是會存在一定差異,即遺傳算法搜尋到的最優(yōu)權(quán)值閥值是存在誤差的.假如把網(wǎng)絡(luò)結(jié)構(gòu)和權(quán)值閥值放在一起編碼、優(yōu)化,不僅增加了編碼長度、尋優(yōu)難度,使算法過早收斂的可能性變大,而且由于權(quán)值閥值的尋優(yōu)結(jié)果存在誤差,就會使原本可以精確求得的網(wǎng)絡(luò)結(jié)構(gòu)最優(yōu)參數(shù)混入誤差,所以兩者不宜放在一起進行優(yōu)化.

3.2 遺傳算法優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)

BP 網(wǎng)絡(luò)的層數(shù).Hecht-Nielson 已經(jīng)證明[12]:具有偏差和至少一個S型隱層加上一個線性輸出層的網(wǎng)絡(luò),能夠逼近任何有理函數(shù).實驗證明[16],多隱含層BP網(wǎng)絡(luò)雖然可以略微提高預(yù)測精度,但學(xué)習(xí)訓(xùn)練時間會大大增加.綜合考慮,本文選用了單隱含層結(jié)構(gòu).本文直接使用遺傳算法對網(wǎng)絡(luò)所需隱含層節(jié)點數(shù)進行了尋優(yōu),具體步驟如下.

采用二進制編碼方案,使用測試數(shù)據(jù)集的預(yù)測值與實際值之差的絕對值的倒數(shù)作為適應(yīng)度;使用遺傳算法對隱節(jié)點數(shù)進行尋優(yōu),尋優(yōu)范圍為1~16(24)的整數(shù),假如求得隱節(jié)點數(shù)超過14,則調(diào)整上限;設(shè)置初始種群為20,迭代次數(shù)為10次,運行算法.

在尋優(yōu)過程中,初始種群數(shù)為20,隱節(jié)點數(shù)為1~16的整數(shù),理論上,1次迭代就能完全覆蓋尋優(yōu)范圍,而實際操作中,本算法的適應(yīng)度計算結(jié)果是由BP網(wǎng)絡(luò)預(yù)測值計算得來,而典型BP網(wǎng)絡(luò)過早收斂的現(xiàn)象非常常見,所以算法仍需多次迭代才能達(dá)到理想效果.

對于訓(xùn)練集、測試集的劃分以及重復(fù)驗證問題,10次10折交叉驗證是標(biāo)準(zhǔn)評估技術(shù)[22],即把全部數(shù)據(jù)集據(jù)隨機的分為10個部分,每部分?jǐn)?shù)據(jù)的數(shù)量基本一致,其中1個部分做測試集,剩余的9部分做訓(xùn)練集,交替進行,直至每部分?jǐn)?shù)據(jù)都做過測試集為止.然后重復(fù)進行10次取均值再取整即可.

3.3 遺傳算法優(yōu)化權(quán)值閥值

編碼方案.遺傳算法的編碼方案有多種,其中以二進制編碼方案和實數(shù)編碼方案最為常見.權(quán)值閥值通常要精確到小數(shù)點后數(shù)位,實數(shù)編碼方

其中:a'ij為變異后的個體;aij為變異前的個體;r為0~1之間的隨機數(shù);amax為個體上界;amin為個體下界;g為當(dāng)前進化代數(shù);Gmax為最大進化代數(shù).

3.4 實驗結(jié)果及分析

選取大連市2013年11月~2014年4月(共181個樣本)的天氣記錄及空氣質(zhì)量等級作為訓(xùn)練數(shù)據(jù),預(yù)測未來數(shù)天的空氣質(zhì)量等級.

為了驗證算法的泛化能力,多次替換預(yù)測輸入數(shù)據(jù),運行算法,直至預(yù)測出2014年5~9月全部的空氣質(zhì)量等級,然后重復(fù)10次實驗,統(tǒng)計預(yù)測正確率.預(yù)測正確率統(tǒng)計表,如表2所示.案特別適合于精度要求較高的遺傳算法,所以選擇了實數(shù)編碼方案對初值進行了編碼.

適應(yīng)度函數(shù).使用預(yù)測正確天數(shù)的個數(shù)作為適應(yīng)度,即預(yù)測正確的個數(shù)越多該組權(quán)值閥值被選中的概率越高.

選擇、交叉、變異.選擇方案為最常用的輪盤賭選擇方法;交叉方案選用算數(shù)交叉方案,這是由于算數(shù)交叉方案特別適用于實數(shù)編碼;變異方案采用改進后的非一致變異方案,公式如下:

表2 預(yù)測正確率統(tǒng)計表

其中,采用數(shù)據(jù)關(guān)聯(lián)方案8預(yù)測正確率最高,達(dá)67.1%.單次運行算法的預(yù)測誤差圖,如圖3,規(guī)整后的分類效果圖,如圖4.

在表2中,方案1~6為不需要天氣預(yù)報的預(yù)測方案,可以看出,預(yù)測正確率隨著預(yù)測天數(shù)的增加而下降;方案7~10為需要天氣預(yù)報的預(yù)測方案,可以看出,方案8的預(yù)測正確率高于其他方案,即當(dāng)天的氣象情況對第二天的空氣質(zhì)量影響較大.

圖4 分類效果圖

4 結(jié)論

影響空氣質(zhì)量等級的因素眾多,例如,車輛、船舶的尾氣、工業(yè)生產(chǎn)排放、居民生活取暖、垃圾焚燒、城市人口密度、發(fā)達(dá)程度、地形地貌、節(jié)日出行和氣象條件等,都是影響空氣質(zhì)量的重要因素.本文僅以大連市2013年11月~2014年4月氣象信息作為學(xué)習(xí)數(shù)據(jù),采用多種方案,使用遺傳BP網(wǎng)絡(luò)對短期空氣質(zhì)量等級進行了預(yù)測,取得了較好的預(yù)測效果,對于污染防治、公眾健康、出行日期選擇都有一定借鑒作用.

[1]汪小寒,張燕平,趙姝,等.基于動態(tài)粒度小波神經(jīng)網(wǎng)絡(luò)的空氣質(zhì)量預(yù)測[J].計算機工程與應(yīng)用,2013,49(6):221-224.

[2]辛若波.基于遺傳優(yōu)化和貝葉斯正規(guī)化神經(jīng)網(wǎng)絡(luò)的空氣質(zhì)量預(yù)測研究[D].濟南:山東大學(xué),2013:26-32.

[3]李國勇.智能預(yù)測控制及其MATLAB實現(xiàn)[M].北京:電子工業(yè)出版社,2010:16.

[4]馬麗慧,韓文喜,李陽.BP網(wǎng)絡(luò)在高填方地基沉降預(yù)測中的應(yīng)用[J].土工基礎(chǔ),2013,27(1):14-16.

[5]沈清.神經(jīng)網(wǎng)絡(luò)應(yīng)用技術(shù)[M].長沙:國防科技大學(xué)出版社,1993:45-85.

[6]徐水春,張森文.遺傳K均值方法在品種資源分類中的應(yīng)用[J].華南農(nóng)業(yè)大學(xué)學(xué)報,2009,30(2):97-100.

[7]PIZZILEO B,LI KANG,MEMBER S.Improved Structure Optimization for Fuzzy-Neural Networks[J].Fuzzy Systems,IEEE Transactions on,2012,20(6):1076-1089.

[8]鄧凱,趙振勇.基于遺傳BP網(wǎng)絡(luò)的股市預(yù)測模型研究與仿真[J].計算機仿真,2009,26(5):316-319.

[9]常輝.基于遺傳BP網(wǎng)絡(luò)的智能型電力負(fù)荷預(yù)測技術(shù)[J].電腦知識與技術(shù),2009,5(8):1962-1964.

[10]蘇晨,李成義.基于遺傳算法和BP神經(jīng)網(wǎng)絡(luò)的服裝銷售預(yù)測[J].經(jīng)營與管理,2012(2):110-111.

[11]韓亮華.遺傳BP網(wǎng)絡(luò)對臨江河回水區(qū)葉綠素a的短期預(yù)測模擬[D].重慶:重慶大學(xué),2011.

[12]HECHT NIELSON R.Neurocomputing[M].Boston:Addison Wesley,1990.

猜你喜歡
編碼方案正確率空氣質(zhì)量
基于功能類別和技術(shù)參數(shù)的刀具編碼方案設(shè)計
門診分診服務(wù)態(tài)度與正確率對護患關(guān)系的影響
基于唯一標(biāo)識的ATP車載設(shè)備編碼方案研究
基于改進粒子群算法的毫米波大規(guī)模MIMO混合預(yù)編碼方案
“空氣質(zhì)量發(fā)布”APP上線
生意
品管圈活動在提高介入手術(shù)安全核查正確率中的應(yīng)用
天津護理(2016年3期)2016-12-01 05:40:01
車內(nèi)空氣質(zhì)量標(biāo)準(zhǔn)進展
汽車與安全(2016年5期)2016-12-01 05:22:14
重視車內(nèi)空氣質(zhì)量工作 制造更環(huán)保、更清潔、更健康的汽車
汽車與安全(2016年5期)2016-12-01 05:22:13
開展“大氣污染執(zhí)法年”行動 加快推動空氣質(zhì)量改善
白银市| 夹江县| 亚东县| 甘肃省| 陆丰市| 宣城市| 闻喜县| 定南县| 南郑县| 兴和县| 宣恩县| 内丘县| 北安市| 定南县| 奉节县| 台湾省| 陇西县| 嘉义市| 石景山区| 福州市| 乌拉特后旗| 上杭县| 随州市| 沭阳县| 东丽区| 岗巴县| 吉安县| 嘉祥县| 沾化县| 安庆市| 搜索| 慈利县| 松溪县| 左贡县| 建宁县| 丘北县| 耿马| 南京市| 浦北县| 琼海市| 邵阳县|