国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘在地質(zhì)環(huán)境評測中的應用

2014-01-28 07:39:48佳,李
城市地質(zhì) 2014年4期
關(guān)鍵詞:評測方差數(shù)據(jù)挖掘

李 佳,李 瀟

(1.北方工業(yè)大學,北京 100186;2.北京市地質(zhì)調(diào)查研究院,北京 102206)

1 應用現(xiàn)狀

數(shù)據(jù)挖掘技術(shù)在金融業(yè)、零售業(yè)、餐飲業(yè)及電信等行業(yè)中的到了廣泛應用,并為人們帶來了良好的經(jīng)濟效益,但在地質(zhì)行業(yè)中的應用相對比較少,主要被用在石油挖掘、探礦工程、地震預警預報等重大領(lǐng)域。但數(shù)據(jù)挖掘技術(shù)分析、處理大量數(shù)據(jù)信息能力的特點很適合應用在有大量數(shù)據(jù)的地質(zhì)環(huán)境評測工作上。如果能夠通過數(shù)據(jù)挖掘技術(shù)分析出地質(zhì)環(huán)境各數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,并歸納出其權(quán)重指標,將會推進環(huán)境評測工作的精準性。

2 數(shù)據(jù)挖掘的方法

(1)數(shù)據(jù)挖掘過程

地質(zhì)環(huán)境數(shù)據(jù)挖掘過程一般由數(shù)據(jù)準備、數(shù)據(jù)挖掘、知識表達3個階段組成,如圖1所示。地質(zhì)環(huán)境數(shù)據(jù)挖掘算法對數(shù)據(jù)有一定的要求,如數(shù)據(jù)冗余性小,出錯率小等。由于地質(zhì)行業(yè)的特殊性, 現(xiàn)實各區(qū)域所采集到的地質(zhì)環(huán)境數(shù)據(jù)通常具有數(shù)據(jù)來源廣泛、異構(gòu)性、模糊性、冗余性、不完整性、噪聲、隨機性、數(shù)據(jù)量大而復雜的特點。因此,數(shù)據(jù)挖掘必須經(jīng)過數(shù)據(jù)準備以提高數(shù)據(jù)質(zhì)量;數(shù)據(jù)挖掘階段包括選擇合適的數(shù)據(jù)挖掘算法模型, 并對挖掘模型進行分析、驗證、調(diào)整, 挖掘有價值的知識;知識表達階段是對結(jié)果進行分析, 提取出最有價值的信息。

(2)數(shù)據(jù)準備

使用的數(shù)據(jù)為北京市房山區(qū)地質(zhì)環(huán)境評估報告中的實際數(shù)據(jù),共包括土壤樣2643件、河流沉積物樣17件、垃圾土壤樣36件、水樣33件、玉米樣74件、柿子7件、梨5件,總計2888件。

(3)核心算法

標準方差是在樣本統(tǒng)計中,特別是大量樣本的統(tǒng)計計算,最常用到的幾種算法之一,公式為:

然而,在計算機編程中,還需要計算運行方差(running variance),因為樣本的個數(shù)總是的在不斷變化的,即不斷遞增;如果每次增加,都要重新計算平均值,再按此公式計算出方差,雖可以實現(xiàn),但計算量會隨著數(shù)據(jù)的增加變的很大。

因此,遞推的公式就顯得格外重要;通過n-1個樣本時的方差值,和新增的樣本,就能得到此時這N個樣本的方差;這樣計算量不會變同時保持在一個很小的值,可大大提高程序的計算效率。遞推公式如下:

圖1 地質(zhì)環(huán)境評測數(shù)據(jù)挖掘過程

Mn為平均值,初始時:M1 = x1, S1 = 0,而樣本方差 s =Sn/(n-1)

土地養(yǎng)分評價指標包括大量營養(yǎng)元素、微量營養(yǎng)元素、有益元素等3個部分,均采用加法模型來計算指數(shù)得分P:

P肥綜=Σfi×Ci(i=1,2,3,4……n)

式中:P為指數(shù)得分;

fi為第i個評估指標的隸屬函數(shù)值;

Ci為第i個評估指標的權(quán)重。

由此得到養(yǎng)分指標(大量元素指標得分

將土地養(yǎng)分和肥力劃分為3等(表1)。

表1 土地養(yǎng)分或肥力分等與綜合參數(shù)對應表

數(shù)據(jù)導入后,經(jīng)過系統(tǒng)的分析統(tǒng)計,結(jié)果如圖2所示:

圖2 數(shù)據(jù)挖掘系統(tǒng)計算結(jié)果

通過與人工計算結(jié)果(圖3)對比,可以算出數(shù)據(jù)挖掘計算結(jié)果與人工處理結(jié)果一致。

圖3 人工計算統(tǒng)計表

3 結(jié)論

在數(shù)據(jù)挖掘過程中首先需要把已有的數(shù)據(jù)進行規(guī)范化處理,建成數(shù)據(jù)挖掘源數(shù)據(jù)庫。處理方法包括統(tǒng)求和、求平均、正態(tài)分布、統(tǒng)一坐標體系、監(jiān)測資料的規(guī)范化、評測單元的統(tǒng)一。然后進行數(shù)據(jù)挖掘建模,進行模型評估,選擇合適數(shù)據(jù)挖掘模型,部署模型,根據(jù)實施結(jié)果評測地質(zhì)環(huán)境健康度。實驗證明,利用數(shù)據(jù)挖掘技術(shù)生成評測單元, 并利用預處理屬性數(shù)據(jù)庫對各區(qū)域進行地質(zhì)環(huán)境評測, 其結(jié)果與環(huán)境現(xiàn)狀基本相符, 具有較高的可信度。

[1]黃 淇等.北京市平原區(qū)土地質(zhì)量地球化學評估報告[R].北京:北京市地質(zhì)調(diào)查研究院,2011.

[2]于春香.數(shù)據(jù)挖掘技術(shù)簡介[J].福建信息技術(shù)教育,2005年01期.

[3]梁 循.數(shù)據(jù)挖掘:建模、算法、應用和系統(tǒng)[J].計算機技術(shù)與發(fā)展,2006年01期

[4]韓家煒.數(shù)據(jù)挖掘:概念與技術(shù)[M].北京:機械工業(yè)出版社,2012.

[5]張良均.數(shù)據(jù)挖掘:實用案例分析[M].北京:機械工業(yè)出版社,2013.

[6]坎塔爾季奇(美).數(shù)據(jù)挖掘:概念、模型、方法和算法[M].北京:清華大學出版社,2013.

猜你喜歡
評測方差數(shù)據(jù)挖掘
方差怎么算
概率與統(tǒng)計(2)——離散型隨機變量的期望與方差
次時代主機微軟XSX全方位評測(下)
次時代主機微軟XSX全方位評測(上)
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
計算方差用哪個公式
攻坡新利器,TOKEN VENTOUS評測
方差生活秀
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
Canyon Ultimate CF SLX 8.0 DI2評測
中國自行車(2017年1期)2017-04-16 02:54:06
婺源县| 南平市| 西藏| 郓城县| 岳普湖县| 永和县| 鄂尔多斯市| 潍坊市| 彰武县| 邵阳市| 延长县| 肇东市| 内江市| 梁河县| 青龙| 永济市| 怀来县| 保定市| 沧源| 阿合奇县| 娄烦县| 科技| 松原市| 德钦县| 郴州市| 博客| 祁门县| 班玛县| 章丘市| 边坝县| 庄河市| 鱼台县| 固原市| 丰台区| 福州市| 衡南县| 玛纳斯县| 卢湾区| 镇江市| 巨野县| 岳阳县|