国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于關聯(lián)規(guī)則算法的水體污染預警研究

2014-10-20 06:04:54董文倩張麒彭佳紅
電腦知識與技術 2014年25期
關鍵詞:Apriori算法數(shù)據(jù)挖掘預警

董文倩 張麒 彭佳紅

摘要:關聯(lián)規(guī)則是一種重要的數(shù)據(jù)挖掘技術,結合水體污染的特點,應用關聯(lián)挖掘中的Apriori算法,分析水體污染排放量和水體中重金屬含量之間的關系,同時分析工業(yè)、生活分別與水體重金屬含量之間的關系,對水體重金屬污染物有一定的預警作用。

關鍵詞:數(shù)據(jù)挖掘;Apriori算法;水體污染;重金屬;預警

中圖分類號: TP301 文獻標識碼:A 文章編號:1009-3044(2014)25-5985-03

1 概述

隨著社會經(jīng)濟的迅猛發(fā)展和工業(yè)化程度的不斷提高,污染物的排放已使環(huán)境日趨惡化,直接或間接給生物的生存帶來威脅,并危及人類健康。重金屬污染與其他有機化合物的污染不同,具有富集性,很難在環(huán)境中降解。近年來,工礦業(yè)廢水、生活污水等未經(jīng)適當處理即向外排放,污染土壤和廢棄物堆置場受流水作用,以及富含重金屬的大氣沉降物輸入, 城市生活污水、工業(yè)廢水和礦山開采、金屬冶煉等所產(chǎn)生的污染物通過不同方式進入水中, 使水體中的重金屬含量急劇升高,如隨廢水排出的重金屬汞(Hg)、銅(Cu)、鉻(Cr),導致水體受到重金屬污染[1]。我國各大江河湖庫普遍受到不同程度的重金屬污染,其底質(zhì)的污染率高達80.11%[2],而且已經(jīng)開始影響到水體的質(zhì)量,嚴重影響著人類及其它生物的健康與生存。

數(shù)據(jù)挖掘是從大量的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又潛在的有用信息和知識的過程。數(shù)據(jù)挖掘得到的信息和知識的表現(xiàn)形式為規(guī)則、概念和模式等,它可以幫助決策者分析歷史數(shù)據(jù)以及當前數(shù)據(jù)的特征和規(guī)律,以便進一步預測未來。[3]關聯(lián)挖掘作為數(shù)據(jù)挖掘的一個重要研究分支,其主要研究目的就是從大型數(shù)據(jù)集中發(fā)現(xiàn)隱藏的、有趣的、屬性間的規(guī)律,即關聯(lián)規(guī)則。[4]本文采用數(shù)據(jù)挖掘的關聯(lián)規(guī)則技術從現(xiàn)有的生活、工業(yè)兩方面的廢水排放量、化學需氧量排放量、氨氮排放量以及水體中汞、鎘、鉛的含量數(shù)據(jù)進行處理,并用關聯(lián)規(guī)則中的Apriori算法獲取相應的關聯(lián)規(guī)則,形成水體污染預警知識,便于水體重金屬污染的預防和治理。

2 材料與方法

2.1 數(shù)據(jù)來源

本文數(shù)據(jù)來源于2011年環(huán)境統(tǒng)計年報[5]。選取六個對于水體重金屬污染有一定作用的影響因子:工業(yè)廢水排放量、生活廢水排放量、工業(yè)化學需氧量排放量、生活化學需氧量排放量、工業(yè)氨氮排放量、生活氨氮排放量,并選取了汞、鎘、鉛三種最具重金屬代表性的元素作為分析因子,具體數(shù)據(jù)如表1所示。

2.2 關聯(lián)規(guī)則及Apriori算法描述

1994年由R.Agrawal等人提出來的Apriori算法是關聯(lián)規(guī)則挖掘的一個經(jīng)典算法[6],關聯(lián)規(guī)則挖掘發(fā)現(xiàn)大量數(shù)據(jù)中項集之間有趣的關聯(lián)或相關聯(lián)系。關聯(lián)規(guī)則側重于確定數(shù)據(jù)中不同領域之間的聯(lián)系,找出滿足給定支持度和置信度閾值的多個域之間的依賴關系[7]。關聯(lián)規(guī)則能夠從大量數(shù)據(jù)的項集之間發(fā)現(xiàn)有趣的、頻繁出現(xiàn)的模式、關聯(lián)和相關性。為了在數(shù)據(jù)挖掘任務中得到有用的和可靠的規(guī)則,需要通過支持度和置信度兩個閾值來保證。關聯(lián)規(guī)則 X=>Y 在 D 中的支持度是 D 中事務包含 XUY 的百分比,即概率 P(XUY),它是對關聯(lián)規(guī)則重要度的衡量,表示關聯(lián)規(guī)則的頻度。關聯(lián)規(guī)則X=>Y 在 D 中的置信度是包含 X 的事務中同時包含 Y的百分比,即條件概率 P(X=>Y),它是對關聯(lián)規(guī)則準確度的衡量,表示關聯(lián)規(guī)則的強度[8]。Apriori算法的核心思想是把發(fā)現(xiàn)關聯(lián)規(guī)則的工作分為兩步:第一步通過迭代檢索出事務數(shù)據(jù)庫中的所有頻繁項集,即頻繁項集的支持度不低于用戶設定的閾值;第二步從頻繁項集中構造出滿足用戶最低信任度的規(guī)則[9]。對于滿足最小支持度和最小置信度要求的關聯(lián)規(guī)則稱為強規(guī)則[10]。

2.3 數(shù)據(jù)處理

利用Weka軟件,采用關聯(lián)規(guī)則中的Apriori算法,對表1的數(shù)據(jù)進行處理,得到的關聯(lián)規(guī)則如所示:

Apriori

Minimum support: 0.25 (2 instances)

Minimum metric: 0.9

Number of cycles performed: 15

Generated sets of large itemsets:

Size of set of large itemsets L(1): 24

Size of set of large itemsets L(2): 28

Size of set of large itemsets L(3): 24

Size of set of large itemsets L(4): 16

Size of set of large itemsets L(5): 6

Size of set of large itemsets L(6): 1

Best rules found:

1. Ammonia emissions from industrial='(-inf-29.82]' 3 ==> Mercury='(-inf-1.505]' 3 conf:(1)

2. COD emissions of industrial='(-inf-452.07]' 2 ==> Lead='(482.96-525.73]' 2 conf:(1)

3. Lead='(482.96-525.73]' 2 ==> COD emissions of industrial='(-inf-452.07]' 2 conf:(1)

4.Industrial wastewater emissions='(233.43-237.82]' 2 ==> Ammonia emissions from industrial='(-inf-29.82]' 2 conf:(1)

5. Industrial wastewater emissions='(233.43-237.82]' 2 ==> Mercury='(-inf-1.505]' 2 conf:(1)

6. Cadmium='(-inf-38.14]' 2 ==> Industrial wastewater emissions='(233.43-237.82]' 2 conf:(1)

7. Industrial wastewater emissions='(233.43-237.82]' 2 ==> Cadmium='(-inf-38.14]' 2 conf:(1)

8. Lead='(-inf-183.57]' 2 ==> Industrial wastewater emissions='(233.43-237.82]' 2 conf:(1)

9. Industrial wastewater emissions='(233.43-237.82]' 2 ==> Lead='(-inf-183.57]' 2 conf:(1)

10. Wastewater discharge life='(-inf-245.25]' 2 ==> Ammonia emissions from industrial='(39.9-42.42]' 2 conf:(1)

11. Cadmium='(102.46-inf)' 2 ==> Wastewater discharge life='(-inf-245.25]' 2 conf:(1)

12. Wastewater discharge life='(-inf-245.25]' 2 ==> Cadmium='(102.46-inf)' 2 conf:(1)

13. Lead='(482.96-525.73]' 2 ==> Wastewater discharge life='(-inf-245.25]' 2 conf:(1)

14. Wastewater discharge life='(-inf-245.25]' 2 ==> Lead='(482.96-525.73]' 2 conf:(1)

15. COD emissions of industrial='(-inf-452.07]' 2 ==> Mercury='(-inf-1.505]' 2 conf:(1)

相應的規(guī)則解釋如下:

規(guī)則1:工業(yè)氨氮排放量<29.82萬噸時,則汞排放量<1.505噸,置信度為100%;

規(guī)則2.3:工業(yè)化學需氧量排放量<452.07萬噸時,則鉛排放量<183.57噸,置信度為100%;

規(guī)則4:工業(yè)廢水排放量為233.43-237.82億噸時,則工業(yè)氨氮排放量<29.82萬噸,置信度為100%;

規(guī)則5:工業(yè)廢水排放量為233.43-237.82億噸時,則汞排放量<1.505噸 ,置信度為100%;

規(guī)則6.7:工業(yè)廢水排放量為233.43-237.82億噸時,則鎘排放量<38.14噸, 置信度為100%;

規(guī)則8.9:工業(yè)廢水排放量為233.43-237.82億噸時,則鉛排放量<183.57噸, 置信度為100%;

規(guī)則10: 生活廢水排放量<245.25億噸,則工業(yè)氨氮排放量為39.9-42.42萬噸 置信度為100%;

規(guī)則11.12:生活廢水排放量>245.25億噸時, 則鎘排放量>102.46噸 置信度為100%;

規(guī)則13.14:生活廢水排放量<245.25億噸時,則鉛排放量為482.96-525.73噸 置信度為100%;

規(guī)則15:工業(yè)化學需氧量排放量<452.07萬噸時,則汞排放量<1.505噸 置信度為100%;

3 結果分析

由關聯(lián)規(guī)則Apriori算法得出的15條規(guī)則結果分析,可以得到如下結論:

1) 重金屬與氨氮排放量關系。當工業(yè)氨氮排放量<29.82萬噸時,則汞排放量<1.505噸,說明工業(yè)氨氮排放量較低時,重金屬元素汞的排放量低;

2) 重金屬與廢水排放量關系。當工業(yè)廢水排放量為233.43-237.82億噸時,則汞排放量<1.505噸,鎘排放量<38.14噸,鉛排放量<183.57噸,說明工業(yè)廢水排放量較低時,重金屬汞、鎘、鉛的排放量較少;當生活廢水排放量>245.25億噸時, 則鎘排放量>102.46噸,說明生活廢水排放量比較高時,重金屬鎘的含量比較高。生活廢水排放量<245.25億噸時,則鉛排放量為482.96-525.73噸,說明當生活廢水排放量比較高時,重金屬鉛的含量比較高。

3) 重金屬與化學需氧量排放量關系。工業(yè)化學需氧量排放量<452.07萬噸時,則汞排放量<1.505噸,說明當工業(yè)化學需氧量排放量比較少時,重金屬汞的含量比較低。工業(yè)化學需氧量排放量<452.07萬噸時,則鉛排放量<183.57噸,說明化學需氧量排放量較少時,鉛的排放量較少。

4 結論

水體中金屬污染具有富集性、不可降解性等特點,已經(jīng)對我國各大江河湖庫造成了嚴重污染,影響人類和其他生物的健康和生存,因此,提高對水體中重金屬污染的成因認識,了解水體污染物排放對幾大重金屬的影響,加強對水體重金屬污染排放的控制,顯得尤為重要。采用數(shù)據(jù)挖掘關聯(lián)規(guī)則Apriori算法,對近十年來的全國污染物和重金屬排放量數(shù)據(jù)利用weka進行離散化處理后,獲取相關的關聯(lián)規(guī)則知識,分析了工業(yè)、生活兩方面的廢水排放量、氨氮排放量、化學需氧量與水體重金屬汞、鎘、鉛含量之間的關系 ,從而對水體重金屬污染進行預警,對水體重金屬污染的預防和治理的決策上起到了一定的指導作用,幫助控制環(huán)境污染。

參考文獻:

[1] 邱小香,朱海燕.水體重金屬的污染及其處理方法[J].湖南農(nóng)業(yè)科學,2010(14):34-35.

[2] 周啟艷,李國蔥,唐植成.我國水體重金屬污染現(xiàn)狀與治理方法研究[J].輕工科技,2013(4):98-99.

[3] 李梅,張陽,蔡曉妍.關聯(lián)規(guī)則挖掘在學生成績分析中的應用[J].中國電力教育,2014(20):94-95.

[4] 司曉梅.數(shù)據(jù)挖掘中關聯(lián)規(guī)則的研究及應用[D].武漢:武漢理工大學,2007.

[5] 羅毅.中國環(huán)境統(tǒng)計年報2011[N].中國環(huán)境科學出版社,2012-12-1(1)

[6] 秦亮曦,史忠植.關聯(lián)規(guī)則研究綜述[J].廣西大學學報:自然科學版,2005,30(4):310-317.

[7] 吳昊.基于關聯(lián)規(guī)則的道路交通事故數(shù)據(jù)挖掘的研究[D].長春:吉林大學,2005.

[8] 何兵.關聯(lián)規(guī)則數(shù)據(jù)挖掘算法的相關研究[D].成都:西南交通大學,2001.

[9] 羅鳳娥.基于Web的農(nóng)業(yè)數(shù)據(jù)挖掘平臺技術研究[D].長沙:湖南農(nóng)業(yè)大學,2010.

猜你喜歡
Apriori算法數(shù)據(jù)挖掘預警
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
法國發(fā)布高溫預警 嚴陣以待備戰(zhàn)“史上最熱周”
園林有害生物預警與可持續(xù)控制
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
基于Hadoop平臺的并行DHP數(shù)據(jù)分析方法
基于Apriori算法的高校學生成績數(shù)據(jù)關聯(lián)規(guī)則挖掘分析
基于云平臺MapReduce的Apriori算法研究
關聯(lián)規(guī)則挖掘Apriori算法的一種改進
中國市場(2016年36期)2016-10-19 04:10:44
機載預警雷達對IFF 的干擾分析
一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
民县| 洪湖市| 石棉县| 荣昌县| 岳西县| 凌海市| 武胜县| 长治县| 六安市| 渑池县| 衡南县| 开远市| 宜兰县| 平山县| 循化| 鹰潭市| 涟源市| 获嘉县| 惠东县| 郯城县| 宿迁市| 宁安市| 墨江| 汉川市| 凤城市| 蓬溪县| 横峰县| 隆林| 谢通门县| 隆回县| 正定县| 镇江市| 达孜县| 沈阳市| 祁东县| 克拉玛依市| 高台县| 肃宁县| 长治县| 昌吉市| 柳江县|