国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

引入重疊度指標的FPPC油氣管道管段劃分方法

2018-09-17 06:38:04駱正山王文輝王小完張新生
天然氣工業(yè) 2018年8期
關(guān)鍵詞:管段類別投影

駱正山 王文輝 王小完 張新生

西安建筑科技大學管理學院

0 引言

由于油氣管道所經(jīng)地區(qū)地域遼闊,環(huán)境復(fù)雜,會引起管道的自身屬性發(fā)生改變,進而造成管道沿線風險不斷發(fā)生變化。因此,要準確評估油氣管道各點風險值的大小[1-4],需掌握管道沿線風險所具有的特征和規(guī)律,再構(gòu)建合適的模型對管道進行合理劃分。

油氣管道完整性評價的研究成果頗多。孫寶財?shù)萚5]利用改進的BP算法對長輸油氣腐蝕管道失效壓力進行預(yù)測,Senouci等[6]分別采用回歸算法和人工神經(jīng)網(wǎng)絡(luò),基于歷史數(shù)據(jù)預(yù)測油氣管道的多種失效類型,但以上模型對樣本容量要求較高,預(yù)測結(jié)果精度較差。李大全等[7]采用模糊聚類對油氣管道進行劃分,張杰等[8]建立基于主成分—聚類分析法的油氣管道風險評價模型,然而模糊聚類法并不能針對具有特殊數(shù)據(jù)特征的管道樣本集進行精確劃分,推廣性不強。舒暢等[9]引入投影尋蹤聚類(Projection Pursuit Clustering,PPC)算法評估油氣管道的失效可能性,但該算法易受到指標維數(shù)的影響,當樣本指標維數(shù)過高,該算法在執(zhí)行時會出現(xiàn)不穩(wěn)定甚至失效的問題。綜上,現(xiàn)有方法均存在不同程度的局限性且對油氣管道的管段劃分缺乏系統(tǒng)理論依據(jù),其劃分結(jié)果不理想、與實際吻合度不高。

模糊投影尋蹤聚類(Fuzzy Projection Pursuit Cluster,F(xiàn)PPC)算法是一種應(yīng)用于水質(zhì)評價、環(huán)境監(jiān)測、洪災(zāi)評估等領(lǐng)域能夠處理非線性、非正態(tài)高維數(shù)據(jù)的新算法[10-12]。管道沿線地理環(huán)境的復(fù)雜性導(dǎo)致管道失效往往具有突發(fā)性,即管道風險在空間上稀疏分布而在時間上密集分布,因此FPPC算法理論上適用于管段劃分。但傳統(tǒng)FPPC算法的投影指標函數(shù)只考慮到數(shù)據(jù)集的類間稀疏度和類內(nèi)緊密度,實際應(yīng)用中,管道樣本的數(shù)據(jù)類大小分布并不均勻,僅用所有樣本點到聚類中心的距離之和來刻畫管段樣本集中類的緊密度,難以識別數(shù)據(jù)集中的小類或低密度類,得出的最佳聚類數(shù)往往出現(xiàn)錯誤。

綜上所述,筆者構(gòu)建了一種改進的FPPC算法管段劃分模型,建立管道劃分評價指標體系,引入考慮樣本重疊度的FPPC算法對管段進行動態(tài)聚類,通過聚類有效性評價指標評判聚類效果,得出最佳的管道聚類數(shù),并根據(jù)類別離散值所確定的管道風險等級進行管段劃分,識別管道數(shù)據(jù)集中的小類。最后為了評價所提算法的性能,同時與PPC算法和傳統(tǒng)的FPPC算法進行了對比分析。

1 改進的FPPC算法及原理

1.1 模糊聚類迭代算法

將樣本集對于全體類別加權(quán)廣義歐式權(quán)距離的平方和最小作為目標,目標函數(shù)F表示如下[13]:

式中n表示樣本集的數(shù)目;ωi表示第i維指標所占權(quán)重;m表示指標維數(shù);c表示類別數(shù);sih表示指標i在類別h中的聚類中心;rij表示樣本j的第i個指標的歸一化值;μhj表示樣本j歸屬于類別h的相對隸屬度。

模糊聚類迭代(Fuzzy Clustering Iterative,F(xiàn)CI)算法的隸屬度μhj和模糊聚類中心sih表示如下:

式中sik表示指標i在類別k中的聚類中心,該算法的求解步驟可參見本文參考文獻[13]。

1.2 投影尋蹤聚類算法

投影尋蹤的基本思想就是將高維數(shù)據(jù)投影到低維空間,通過分析低維空間的投影特性來研究高維數(shù)據(jù)特征,是處理多因素復(fù)雜問題的統(tǒng)計方法[14]。投影指標函數(shù)一般定義為Q(a)=Sz*Dz,其中a表示單位長度矢量,Sz和Dz分別表示樣本投影值的標準差和局部密度,其計算公式及該算法的求解過程可參照本文參考文獻[12]。

1.3 引入重疊度指標的FPPC算法

本文參考文獻[15]中提出的投影指標函數(shù)考慮到類間的離散程度和類內(nèi)的緊密程度,但現(xiàn)有研究表明,沒有一個投影指標函數(shù)能夠處理任何類型數(shù)據(jù)集且性能總能達到最優(yōu)。因此,F(xiàn)PPC投影指標函數(shù)的設(shè)計要視樣本集的分布規(guī)律和屬性特征而定??紤]到油氣管道數(shù)據(jù)集中不同類樣本之間可能存在重疊的情況,筆者引入重疊度指標,將樣本點在兩個類之間的重疊度定義為超出給定閾值范圍外該樣本點屬于這兩個類的隸屬度差異,兩個類間的所有樣本重疊度之和定義為這兩個類的重疊度,這樣在保證了最小類間距離盡可能大和所有類都盡可能分離的同時,能夠發(fā)現(xiàn)管道樣本集中的小類或低密度類[16]。因此提出的投影指標函數(shù)能夠有效處理包含大小和密度差異較大數(shù)據(jù)類的管段劃分樣本集。

1.3.1 重疊度概念

重疊度度量因子(O)[17]定義公式如下:

樣本xi在第h1類和第h2類之間的重疊度定義為:

式中μh1i、μh2i分別表示樣本xi屬于第h1類、h2類的隸屬度;μ00表示重疊度閾值。

重疊度度量因子O構(gòu)建的本質(zhì)是:若樣本集中的某個樣本點對某兩個類的相對隸屬度都大于預(yù)定義的重疊度閾值μ00,則表明該樣本點距該兩類的距離都較遠,那么可認定該樣本對象是該兩類的重疊樣本。該樣本點到兩個類的隸屬度差的絕對值越小,則該樣本所在位置越趨向于這兩類的分界線處,即該樣本點對這兩個類貢獻的重疊度就越大[18]。

1.3.2 DOS投影指標函數(shù)的構(gòu)建

綜合考慮投影點團間分布的稀疏度、重疊度和團內(nèi)緊密度的DOS投影指標函數(shù)(QF)定義如下:

其中

式中αj表示樣本的第j維投影方向值;ri表示樣本i的相對隸屬度;sh表示類別h的聚類中心;Dz表示類內(nèi)樣本的緊密度;z(i)表示第i個樣本投影值;E(z)表示樣本投影值的均值;Sz表示類間距離,即投影點團間分布的稀疏度,該投影指標函數(shù)避免了密度窗寬參數(shù)的選取。

一個好的DOS投影指標函數(shù)應(yīng)該使得類內(nèi)緊密度和類間稀疏度都盡可能大,同時還需要滿足不同類間的重疊度盡可能小。因此,Dz和O越小,Sz越大,則DOS投影指標函數(shù)越小,即相應(yīng)的模糊聚類劃分結(jié)果越優(yōu)。以最小化DOS投影指標函數(shù)值為目標來計算最優(yōu)投影方向向量。

1.3.3 改進的FPPC算法基本原理

改進的FPPC算法基本原理如下[19]:

1)首先運用投影尋蹤原理將高維樣本投影至低維空間,降低FCI的迭代運算量,避免多維指標出現(xiàn)聚類中心的交叉現(xiàn)象。

2)再利用FCI對樣本投影點進行模糊聚類,并將得到的最小歐式距離平方和來表征類內(nèi)密度Dz,設(shè)定閾值,引入樣本重疊度指標O來表征類間的重疊度,構(gòu)建DOS投影指標函數(shù)。

3)以DOS投影指標函數(shù)最小化為目標,對其尋優(yōu),找出最優(yōu)的投影方向,進行投影尋蹤聚類。

通過以上措施,實現(xiàn)了類內(nèi)密度Dz最小化的模糊聚類以及DOS投影指標函數(shù)最小化的投影尋蹤雙重迭代聚類,并通過DOS投影指標函數(shù)的構(gòu)建來統(tǒng)一兩個模型的聚類目標。

2 改進的FPPC算法管段劃分模型

采用改進FPPC算法構(gòu)建油氣管道管段劃分模型的基本架構(gòu)如圖1所示。

2.1 管段劃分模型詳細流程

2.1.1 樣本集標準化

假設(shè)油氣管道風險指標的樣本集為{xij|i=1, 2,…,n,j=1, 2, …,m},其中xij表示樣本i的第j個指標值,n、m分別表示待評價管段數(shù)和油氣管道評價指標維數(shù)。按照下式采用越小越優(yōu)的指標來標準化樣本集。

式中rij表示歸一化后的指標特征值;max(xj)和min(xj)分別表示第j個指標的最大值和最小值。

2.1.2 線性投影

筆者采用隨機函數(shù)初始化投影方向向量,用下式將油氣管道樣本集的多維空間投影到一維空間,計算出樣本投影值,隨機生成投影聚類中心向量。

圖1 油氣管道管段劃分模型架構(gòu)圖

2.1.3 改進的FPPC算法迭代聚類

利用投影尋蹤技術(shù)將高維樣本集投影到一維樣本集后,權(quán)重向量降至一維,因此,ω的值為1,且sjh、sjk和rij分別變?yōu)閟h、sk和ri,隸屬度μhi和聚類中心sh變?yōu)椋?/p>

式中sk表示類別k的聚類中心,根據(jù)式(13)、(14)對投影點進行模糊聚類迭代運算,以式(8)中DOS投影指標函數(shù)最小化為目標尋找最優(yōu)投影方向向量。采用基于實數(shù)編碼的加速遺傳算法(RAGA)來求解該優(yōu)化問題[20]。

2.1.4 類別特征值的計算

參照本文參考文獻[21]提出對洪災(zāi)大小進行排序的類別特征值法,可以求出管段各樣本的類別特征值C(i)。

式中h=(1, 2, …,c)表示類別值; 表示最優(yōu)隸屬度。

對類別特征值進行四舍五入可得管段樣本所屬類別離散值,類別離散值對應(yīng)油氣管段的相對風險等級,從而直觀得出聚類結(jié)果。類別離散值越大,則其所對應(yīng)的管段相對風險等級越高,同時可根據(jù)類別特征值的大小對管段樣本的相對風險大小進行排序。

2.2 指標驗證

為了對模糊聚類效果進行評判,采用以下3種常用的聚類有效性指標函數(shù)[13]:

3 實例分析

3.1 油氣管道管段劃分指標體系的構(gòu)建

國際管道研究協(xié)會(Pipeline Research Council International,PRCI)將管道失效事件分為22類,每一類都代表對管道完整性的一種威脅[22]。根據(jù)對油氣管道造成風險的對象不同,可將管道失效風險進一步歸類為自然因素、社會因素和管道自身因素3種。為此,筆者遵循客觀性、科學性和合理性的原則,結(jié)合我國的實際情況,參考美國《管道風險管理指南》[23]和本文參考文獻[24],構(gòu)建油氣管道風險指標的兩級層次結(jié)構(gòu)(圖2)。

圖2 油氣管道管段劃分風險指標體系圖

3.2 數(shù)據(jù)準備

以我國西部某長輸氣管道為例,所評估的16段管道均為同一管道運營系統(tǒng),輸送介質(zhì)為天然氣,管道設(shè)計輸送能力為4.0×105m3/d,但各管段所處地理位置不同,管道沿線區(qū)域的自然、經(jīng)濟和社會環(huán)境差異較大。根據(jù)圖2構(gòu)建的油氣管道管段劃分風險指標體系,以及采集的現(xiàn)場數(shù)據(jù),確定各指標的對應(yīng)值,管道指標數(shù)據(jù)隨著距離的變化而改變,其部分數(shù)據(jù)如表1所示。

3.3 數(shù)據(jù)標定

由表1可知,管道風險指標值既有定性數(shù)據(jù),也有定量數(shù)據(jù),考慮到處理數(shù)據(jù)的方便性,可依據(jù)管道風險評價技術(shù)中風險等級劃分原則和參照表2的對應(yīng)關(guān)系,量化底層指標,再結(jié)合實際情況,將表1中每個管道的屬性特征值都轉(zhuǎn)化為該指標對管道造成失效風險的定值(表3)。

3.4 驗證模型及結(jié)果分析

筆者分別采用傳統(tǒng)的FPPC算法和改進的FPPC算法對管道進行聚類劃分,并將兩種方法進行對比,利用本文2.2節(jié)中的聚類有效性指標來分析最佳的管段聚類數(shù),并驗證算法的聚類有效性。FPPC算法的部分參數(shù)設(shè)定如下:樣本數(shù)為16,指標維數(shù)為11,適應(yīng)度精度設(shè)為10-4,閾值設(shè)定為0.2。由管段劃分的實際意義,將聚類數(shù)分別設(shè)置為2、3、4、5和6,通過編寫目標函數(shù)和聚類有效性函數(shù),結(jié)合加速遺傳算法搜索工具求解。不同的聚類數(shù)對應(yīng)的聚類有效性指標值如表4所示。

分析表4結(jié)果可知,傳統(tǒng)的FPPC算法在聚類數(shù)設(shè)定為3時,各項指標值最?。垂芏蝿澐诌_到最優(yōu)),而改進的FPPC算法在聚類數(shù)為4時,各項指標值達到最小,且均小于傳統(tǒng)FPPC算法的各項指標值。因此,改進的FPPC算法對管段劃分更加準確。

表1 管道實際屬性值表

表2 指標對管道造成的風險等級表

當管段聚類數(shù)為4時,根據(jù)式(15),可求出管段相對風險等級。將管段相對風險等級定義為高風險(第4類)、較高風險(第3類)、一般風險(第2類)和低風險(第1類)。經(jīng)改進的FPPC聚類,得到最佳投影方向為{0.254 1, 0.176 1, 0.325 2, 0.283 6,0.373 1, 0.351 8, 0.219 2, 0.547 6, 0.236 8, 0.127 9,0.186 7},DOS投影指標函數(shù)最小值為0.075 3,各指標投影方向值的大小表明了該指標對管道風險的影響程度。投影值最優(yōu)聚類中心為{1.786 0, 1.475 9,1.134 8, 0.723 4},樣本投影值為{0.837 6, 1.114 7,1.524 3, 0.761 2, 0.774 1, 1.837 3, 1.662 5, 0.694 1,0.937 6, 0.858 3, 1.387 5, 1.616 4, 1.083 6, 0.792 3,0.714 3, 1.509 1},最優(yōu)隸屬度矩陣值如表5所示。

表3 指標的風險評分值表

表4 管段聚類數(shù)和聚類有效性指標值比較表

為了能直觀看出改進FPPC算法能否識別出管道樣本中的小類,將傳統(tǒng)的FPPC算法最優(yōu)聚類數(shù)為3時的管段劃分結(jié)果與改進的FPPC算法的計算結(jié)果進行對比。依據(jù)表5的FPPC類別連續(xù)值(限于篇幅,省略傳統(tǒng)FPPC算法的最優(yōu)隸屬度矩陣),作出管段相對風險直方圖(圖3)。

由表5和圖3可知,傳統(tǒng)的FPPC算法將管道聚為3類,顯然是把管段6和管段7歸為第3類,但由圖3可知,管段6和管段7的類別連續(xù)值明顯偏離第3類,這會造成第3類聚類中心的極大偏移,從而導(dǎo)致聚類有效性指標值偏大,聚類結(jié)果具有較大誤差。而改進的FPPC算法將管段6和管段7歸為高風險類管段(第4類),有效識別出管段樣本中的小類。因此改進的FPPC算法的管段劃分結(jié)果更加合理準確。

對應(yīng)用于管段劃分的聚類算法來說,雖然聚類的準確性是評價管段聚類效果的重要指標,但僅將聚類結(jié)果的準確性作為管段劃分效果的評價指標未免太過單一,其聚類的迭代次數(shù)及收斂速度也是評價管段劃分聚類效果的重要依據(jù)。為了比較引入重疊度指標對FPPC算法收斂性和迭代次數(shù)的影響,將改進的FPPC算法與PPC算法和傳統(tǒng)的FPPC算法進行30次的聚類迭代比較(圖4),PPC算法的密度窗寬選為常用的0.1Sz。

由圖4可知,3種算法的投影指標函數(shù)最小值雖然非常接近,但改進的FPPC算法的收斂速度明顯快于PPC算法和傳統(tǒng)的FPPC算法,且迭代次數(shù)更少,更快的接近于投影指標函數(shù)最小值。由此可知,改進的FPPC算法在收斂性和穩(wěn)定性方面要優(yōu)于PPC算法和傳統(tǒng)的FPPC算法。

表5 最優(yōu)隸屬度矩陣值表

圖3 管段相對風險直方圖

4 結(jié)論

1)構(gòu)造一種全新的DOS投影指標函數(shù),針對管道失效風險的時空分布不均勻性,引入重疊度因子,該指標函數(shù)同時考慮到了投影點團內(nèi)緊密度、團間稀疏度和重疊度的情況,可識別出管道樣本集中的小類或低密度類,保證了聚類結(jié)果的準確性和科學性。

2)改進的FPPC模型客觀地根據(jù)管道樣本集內(nèi)在特性進行管道風險評價,在有無管道相應(yīng)風險等級標準時均可對樣本集進行精確聚類并得到樣本類別連續(xù)值,聚類效果提高明顯,管段劃分結(jié)果更加客觀。

3)將改進的FPPC算法與PPC算法和傳統(tǒng)的FPPC算法進行對比,可知改進的FPPC算法具有更快的收斂速度和更少的迭代次數(shù)。因此,改進后的FPPC算法收斂性更好,穩(wěn)定性更強。

圖4 3種算法的收斂性比較圖

同時很多聚類算法受到多種參數(shù)的影響,如何更加合理地確定這些參數(shù),比如閾值的選取,也是下一步研究工作的重點。

猜你喜歡
管段類別投影
高溫氣冷堆核電站蒸汽發(fā)生器可拆管段拆裝系統(tǒng)研究
管段沿線流量簡化前后水頭和流行時間差異性分析
解變分不等式的一種二次投影算法
基于最大相關(guān)熵的簇稀疏仿射投影算法
找投影
找投影
學生天地(2019年15期)2019-05-05 06:28:28
電站配管設(shè)計中的旋轉(zhuǎn)角度分析及計算
服務(wù)類別
新校長(2016年8期)2016-01-10 06:43:59
某亞臨界鍋爐水冷壁泄漏失效分析
機械工程師(2015年8期)2015-04-10 09:52:14
論類別股東會
商事法論集(2014年1期)2014-06-27 01:20:42
都安| 达尔| 贡嘎县| 思茅市| 永兴县| 自治县| 什邡市| 长宁区| 项城市| 武安市| 英吉沙县| 黔江区| 呼和浩特市| 中方县| 连山| 安泽县| 阿鲁科尔沁旗| 汨罗市| 乐昌市| 莒南县| 东平县| 长岛县| 丰县| 伊宁县| 西充县| 武宣县| 长汀县| 丹东市| 定结县| 锡林浩特市| 奈曼旗| 宣汉县| 绍兴市| 景泰县| 滕州市| 福海县| 天气| 五峰| 越西县| 镇雄县| 沅江市|