国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于聚類挖掘的安全閥試驗(yàn)位移數(shù)據(jù)處理

2011-03-08 07:09劉婧瑤
關(guān)鍵詞:安全閥數(shù)據(jù)挖掘液壓

劉婧瑤

(煤炭科學(xué)研究總院檢測研究分院,北京 100013)

基于聚類挖掘的安全閥試驗(yàn)位移數(shù)據(jù)處理

劉婧瑤

(煤炭科學(xué)研究總院檢測研究分院,北京 100013)

在安全閥試驗(yàn)中,位移是計(jì)算流量的重要數(shù)據(jù),由于液壓系統(tǒng)振動及位移傳感器數(shù)據(jù)采集誤差等原因,需對原始位移數(shù)據(jù)進(jìn)行處理。依據(jù)位移數(shù)據(jù)的時序性和分布特征,建立新的相似函數(shù)作為數(shù)據(jù)聚類的判定準(zhǔn)則,改進(jìn)聚類挖掘方法;并提出新的聚類中心不同的聚類方法,按照時間順序?qū)?shù)據(jù)聚類與初始聚類中心的選取交替進(jìn)行,完成數(shù)據(jù)樣本的全部聚類。最后對各簇數(shù)據(jù)樣本中的異常點(diǎn)進(jìn)行檢測和處理,并采用平均值法計(jì)算每簇數(shù)據(jù)新的聚類中心,作為實(shí)際的位移數(shù)據(jù)。

安全閥;數(shù)據(jù)挖掘;聚類分析;數(shù)據(jù)處理

安全閥是液壓系統(tǒng)中重要的安全保護(hù)元件,需在一定壓力下通過試驗(yàn)測定安全閥流量,標(biāo)定其性能,一般通過采集液壓缸活塞位移,采用位移-時間法確定安全閥的流量,因此,位移數(shù)據(jù)精確與否將直接影響流量的測定。

在國內(nèi)液壓系統(tǒng)數(shù)據(jù)采集研究中,魯永秋等人設(shè)計(jì)了液壓系統(tǒng)壓力和流量的數(shù)據(jù)采集系統(tǒng),采用DSP芯片控制數(shù)據(jù)采集模塊的軟硬件實(shí)現(xiàn)[1]。胡學(xué)軍等人基于MATLAB的數(shù)據(jù)采集工具箱開發(fā)了液壓元件試驗(yàn)臺CAT系統(tǒng)軟件和硬件[2]。國內(nèi)對液壓系統(tǒng)壓力和流量的研究多集中在數(shù)據(jù)采集系統(tǒng)的軟硬件實(shí)現(xiàn),針對試驗(yàn)數(shù)據(jù)誤差分析處理的深入研究甚少。

針對液壓系統(tǒng)試驗(yàn)數(shù)據(jù)分析和處理存在的問題,通過多次安全閥流量試驗(yàn),提出采用數(shù)據(jù)挖掘?qū)?shí)時獲取的位移試驗(yàn)數(shù)據(jù)進(jìn)行分析處理。由于傳感器采集頻率較高時出現(xiàn)數(shù)據(jù)點(diǎn)重復(fù)或迂回擾動現(xiàn)象及液壓系統(tǒng)振動等因素的影響,采集得到的位移數(shù)據(jù)點(diǎn)主要特征是:時序性和呈分段帶狀分布。根據(jù)位移數(shù)據(jù)的特征,建立新的相似函數(shù)作為聚類判定的準(zhǔn)則,改進(jìn)聚類挖掘方法,提出依據(jù)聚類簇的部分?jǐn)?shù)據(jù)依次確定聚類中心,并按照時間順序完成每簇數(shù)據(jù)的聚類。利用改進(jìn)的聚類分析法對位移數(shù)據(jù)點(diǎn)進(jìn)行有效地聚類分析,再通過異常點(diǎn)檢測處理原始試驗(yàn)數(shù)據(jù)的誤差點(diǎn)。最后利用平均值法得到每簇數(shù)據(jù)新的聚類中心,作為實(shí)際的位移數(shù)據(jù)。

1 系統(tǒng)工作原理及數(shù)據(jù)定義

1.1 液壓系統(tǒng)工作原理

在安全閥試驗(yàn)過程中,為了計(jì)算單位時間內(nèi)工作缸液體體積的變化量以確定安全閥實(shí)時流量值,需通過位移傳感器采集工作缸活塞位移數(shù)據(jù),系統(tǒng)工作原理如圖1所示。

1.2 獲取位移數(shù)據(jù)

通過位移傳感器實(shí)時采集得到原始試驗(yàn)數(shù)據(jù),需對數(shù)據(jù)屬性進(jìn)行定義。每個數(shù)據(jù)點(diǎn)具有3種屬性:X屬性值表示時間,Y屬性值表示位移,標(biāo)識屬性值表示該簇數(shù)據(jù)所屬簇的編號。原始數(shù)據(jù)樣本記錄如表1所示。

圖1 安全閥流量測試原理

表1 原始數(shù)據(jù)樣本記錄

2 改進(jìn)聚類分析與優(yōu)化

聚類分析是一種數(shù)據(jù)挖掘方法,從大量、雜亂連續(xù)的數(shù)據(jù)中發(fā)現(xiàn)新的、有實(shí)際意義的數(shù)據(jù)點(diǎn)。數(shù)據(jù)挖掘的方法有:分類挖掘、關(guān)聯(lián)挖掘、聚類挖掘和異類挖掘[3-5]等。聚類挖掘是將大量數(shù)據(jù)劃分為性質(zhì)相同的子類,以便于分析數(shù)據(jù)的分布情況。聚類的結(jié)果是得到一組數(shù)據(jù)對象的集合,稱其為簇。

定義1:設(shè)Ω表示一個有n個樣本的集合,Si表示其中的樣本,δ為預(yù)設(shè)閾值,若對于任意的Si,Sj∈C,都有

則C稱為一類。

劃分算法是聚類挖掘的一種重要方法,劃分算法首先給定要構(gòu)建的劃分?jǐn)?shù)目,并創(chuàng)建初始劃分,然后采用一種迭代的重定位技術(shù)改進(jìn)劃分,使同一簇類中的對象盡可能接近,反之,盡可能遠(yuǎn)離。

2.1 劃分算法改進(jìn)

聚類分析對于任意形狀的數(shù)據(jù)分布難以實(shí)現(xiàn)有效聚類。初始聚類中心選取是否適當(dāng),將直接影響到聚類效果。

基于距離法和相似系數(shù)法2種聚類方法的特征,提出改進(jìn)聚類算法對任意形狀數(shù)據(jù)簇進(jìn)行聚類分析。改進(jìn)聚類算法主要是具有一定規(guī)則有序分布的數(shù)據(jù)對象,按照順序?qū)υ紨?shù)據(jù)點(diǎn)分組,選取第1組內(nèi)第1點(diǎn)作為該組的初始聚類中心,然后選定閾值以相似函數(shù)作為優(yōu)化目標(biāo)函數(shù)進(jìn)行迭代運(yùn)算,確定第1簇聚類的數(shù)據(jù)樣本點(diǎn)。第1組內(nèi)未被選入第1簇的其余點(diǎn)作為第2簇的數(shù)據(jù)點(diǎn),并通過平均值計(jì)算其數(shù)據(jù)中心作為第2簇聚類的初始聚類中心。按照這種算法依次交替確定每一簇的聚類中心和數(shù)據(jù)樣本點(diǎn)。

假設(shè)數(shù)據(jù)庫D中包含所有位移數(shù)據(jù)樣本,該集合記做Ω,集合中有n個有序元素Si(Xi,Yi) (i=1,2,…n)。對全樣本集按照時序進(jìn)行分類后,生成簇的個數(shù)為m(1≤m≤n),每個簇用Ω的子集Gj(j=1,2,…m)表示。選取相似函數(shù):

改進(jìn)聚類算法框架如下:

(1)按照順序?qū)⒃紭颖緮?shù)據(jù)分為m簇,表示為Gj,每簇樣本數(shù)據(jù)個數(shù)相同為p,并設(shè)定數(shù)據(jù)樣本分類閾值δ。

(2)選第1個數(shù)據(jù)樣本點(diǎn)S1作為第1簇G1的種子點(diǎn),計(jì)算種子點(diǎn)與簇G1中每個點(diǎn)的相似函數(shù)值即

將初次聚類分析后的簇記做G'j,若K(S1,Su)<δ,則Su∈,否則Su∈Z1;將簇Gj中屬于簇的點(diǎn)集合記做Zj(j=1,2,…,m-1),Zj中的數(shù)據(jù)樣本點(diǎn)個數(shù)記做vj。

(3)計(jì)算集合Zj中所有樣本點(diǎn)的平均值,即ZMj=;并選定Zj中最接近ZMj的數(shù)據(jù)點(diǎn)作為簇Gj+1的種子點(diǎn)ZGj+1,對簇Gj+1進(jìn)行分類,并聚類得到G'j+1。

(4)按照以上方法先分類后聚類依次得到位移數(shù)據(jù)的所有聚類簇,…。

2.2 異常點(diǎn)檢測

異常點(diǎn)一般來源于測量誤差、人為誤差等,且明顯偏離其他數(shù)據(jù)。為避免影響數(shù)據(jù)分析的結(jié)果[6-7],在進(jìn)行分析時將其視為噪聲加以修正或剔除?;诰嚯x法對異常點(diǎn)進(jìn)行檢測和處理可以高效、準(zhǔn)確地發(fā)現(xiàn)異常點(diǎn)。

由于在進(jìn)行簇Gj(j=1,2,…,n-1 )內(nèi)數(shù)據(jù)樣本聚類分析時,若某樣本數(shù)據(jù)不屬于第j簇,不再進(jìn)行相似函數(shù)值計(jì)算判定直接記入第j+1簇,這樣,G'j+1(j=1,2,…,n-1 )內(nèi)將難以避免的含有屬性差別較大的異常點(diǎn),需進(jìn)一步檢測異常點(diǎn)并加以處理。

基于距離的異常點(diǎn)檢測算法框架如下:

(1)設(shè)定閾值ξ。

(2)計(jì)算簇中數(shù)據(jù)樣本Y屬性值的平均值YMj=,計(jì)算中任意樣本Si(Xi,Yi)的Y屬性值與YMj的絕對距離,若|Yi-YMj|>ξ,則將樣本Si作為異常點(diǎn)濾除。

(3)按照步驟⑵中的方法依次濾除簇(j=2,3,…m)中的粗大誤差點(diǎn),并相應(yīng)得到不包含異常點(diǎn)的數(shù)據(jù)聚類簇(j=1,2,…m)。

2.3 確定新的聚類中心

為了消除數(shù)據(jù)誤差的影響,將得到的每簇數(shù)據(jù)樣本新聚類中心作為進(jìn)行流量計(jì)算時實(shí)際位移點(diǎn)。計(jì)算方法如下:

(1)計(jì)算數(shù)據(jù)簇中數(shù)據(jù)樣本的平均值,作為數(shù)據(jù)集的聚類中心。

(2)依次計(jì)算(j=1,2,…m)數(shù)據(jù)集的聚類中心,記做(j=1,2,…m)。

(3)最后確定每簇樣本集新的聚類中心。

截取部分?jǐn)?shù)據(jù)樣本簇并顯示其新聚類中心,如表2所示。

表2 新聚類中心記錄

3 位移數(shù)據(jù)處理

3.1 位移數(shù)據(jù)聚類分析

在對位移數(shù)據(jù)進(jìn)行處理的過程中,首先按照時間順序?qū)υ紨?shù)據(jù)進(jìn)行分組,然后應(yīng)用改進(jìn)聚類分析法對位移數(shù)據(jù)進(jìn)行聚類分析,并基于距離法檢測和處理異常點(diǎn),得到的聚類簇數(shù)據(jù)記錄如表3。

3.2 確定新的聚類中心

為了消除誤差影響,通過聚類挖掘和計(jì)算得到每簇數(shù)據(jù)樣本新的聚類中心作為流量計(jì)算時的實(shí)際位移點(diǎn)。截取部分?jǐn)?shù)據(jù)樣本并顯示其聚類中心如表4和圖2所示。

表3 聚類簇數(shù)據(jù)記錄

表4 聚類中心記錄

圖2 位移數(shù)據(jù)聚類中心

如圖2中所示,菱形表示對原始試驗(yàn)數(shù)據(jù)進(jìn)行聚類分析后得到各簇數(shù)據(jù)的聚類中心。

4 結(jié)論

提出新的聚類判定準(zhǔn)則:相似函數(shù)法,改進(jìn)聚類分析方法,可有效、快速地實(shí)現(xiàn)數(shù)據(jù)樣本的歸屬判定和聚類。采用改進(jìn)的聚類分析法,先將原始數(shù)據(jù)按照時序劃分為n個數(shù)據(jù)組Gi(i=1,2,3,…,n),當(dāng)?shù)贕'j(j=2,3,…,m)簇數(shù)據(jù)樣本聚類時,將Gj簇數(shù)據(jù)中不屬于簇的數(shù)據(jù)樣本劃分為第G'j+1簇數(shù)據(jù)樣本,依據(jù)這部分?jǐn)?shù)據(jù)樣本計(jì)算確定第G'j+1簇的聚類中心;改進(jìn)的聚類分析法依據(jù)位移數(shù)據(jù)的有序性及其分布特征,將聚類中心初始化與數(shù)據(jù)樣本特征相關(guān)聯(lián),避免由于聚類中心的選取不當(dāng)引起聚類誤差;同時,改進(jìn)的聚類算法按照時間順序?qū)?shù)據(jù)樣本進(jìn)行分組,大大降低了迭代運(yùn)算次數(shù),提高了計(jì)算效率。

利用改進(jìn)聚類技術(shù)有效地對原始數(shù)據(jù)樣本進(jìn)行聚類分析后,對每簇數(shù)據(jù)進(jìn)行異常點(diǎn)檢測和處理,減小了誤差;并采用平均值法計(jì)算每簇數(shù)據(jù)的新聚類中心作為實(shí)際位移數(shù)據(jù)點(diǎn),以便更為準(zhǔn)確地計(jì)算安全閥流量。

[1]魯永秋,高欽和,蔣 威.液壓系統(tǒng)的壓力、流量數(shù)據(jù)采集系統(tǒng)設(shè)計(jì)[J].機(jī)床與液壓,2008,36(11):124-130.

[2]胡學(xué)軍,滕 達(dá),談宏華.基于MATLAB的液壓試驗(yàn)臺的數(shù)據(jù)采集與處理[J].自動化技術(shù)與應(yīng)用,2010,29(3).

[3]王 晗,孔令富.一種新的增量式關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘方法研究[J].儀器儀表學(xué)報,2009,30(2):438-443.

[4]張 賀,蔡江輝,張繼福,等.信息熵度量的離群數(shù)據(jù)挖掘算法[J].智能系統(tǒng)學(xué)報,2010,5(2):150-155.

[5]孫慶先,陳秋平,方 濤,等.基于模糊聚類的多尺度空間數(shù)據(jù)挖掘模型及其礦山應(yīng)用[J].上海交通大學(xué)學(xué)報,2008,42(2):194-197.

[6]周 荃,趙鳳英,王崇俊,等.數(shù)據(jù)挖掘方法在入侵檢測中的應(yīng)用研究[J].模式識別與人工智能,2008,21(4).

[7]陳大峰,汪加才,韓冰青.基于離群數(shù)據(jù)挖掘的計(jì)算機(jī)審計(jì)[J].南京審計(jì)學(xué)院學(xué)報,2009,(6)2:62-66.

Displacement Data Processing of Safety-valve Test Based on Cluster Analysis

LIU Jing-yao

(Test Research Branch,China Coal Research Institute,Beijing 100013,China)

Displacement is an important data for inflow calculation in safety valve testOriginal displacementdatamustbe processed because of hydraulic system vibration and collection error of displacement sensors Based on time-sequence and distribution characteristic of displacement data,this paper setup a new similar function as judgment principle of data cluster to improve cluster excavationmethod New clustermethod was put forward That is,alternating data cluster and original cluster center selection and finishing all clusters of data samples firstly,then testing and processing outliers in data samples,applying even-valuemethod to calculating new cluster center of every cluster as actual displacement data.

safety valve;data excavation;cluster analysis;data processing

TH137.5

A

1006-6225(2011)05-0008-03

2011-06-15

“十一五”科技支撐項(xiàng)目:大采高綜放開采技術(shù)標(biāo)準(zhǔn)體系研究 (2008BAB36B11)

劉婧瑤 (1979-),女,河北邯鄲人,博士,工程師,主要從事煤炭機(jī)械檢測設(shè)備研究。

[責(zé)任編輯:李宏艷]

猜你喜歡
安全閥數(shù)據(jù)挖掘液壓
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
上支承輥平衡缸液壓控制系統(tǒng)的設(shè)計(jì)改進(jìn)
企業(yè)基于風(fēng)險的安全閥分級管理體系構(gòu)建
再談液壓吊裝
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
安全閥以及安全閥選用設(shè)計(jì)
露天液壓鉆車
安全閥距彎管布置距離的探討
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
一種新型危險品液罐車安全閥