国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于模糊聚類的核電工程數(shù)據(jù)分析與處理方法研究

2022-09-02 06:24李英
電子設(shè)計工程 2022年16期
關(guān)鍵詞:超平面核電聚類

李英

(上海核工程研究設(shè)計院有限公司,上海 200233)

為了優(yōu)化核電工程物項數(shù)據(jù)采集管理問題,可以基于目前較成熟的模糊聚類技術(shù)處理數(shù)據(jù)[1-9]。提取數(shù)據(jù)的主要方法有傅里葉變換、經(jīng)驗?zāi)B(tài)分解、小波變換和局部特征分解;數(shù)據(jù)分類方法主要有智能診斷專家系統(tǒng)、神經(jīng)網(wǎng)絡(luò)、樹狀分析、支持向量機(SVM)等[10]。在數(shù)據(jù)特征提取方面,短時傅里葉變換對數(shù)據(jù)的變化并不敏感[11],這主要是由于小波變換的窗口有限,可能會遺漏部分數(shù)據(jù)。因此該文采用希爾伯特-黃變換,利用經(jīng)驗?zāi)B(tài)分解方法將數(shù)據(jù)信息分解成眾多有意義的固有模態(tài)函數(shù)分量[12-13],從而解決了專家知識庫更新較慢,難以跟隨最新信息調(diào)整的問題[14-16]。該文提出了一種基于模糊聚類的核電工程數(shù)據(jù)分析與處理方法,該方法可以突出不同采購物資的樣本特征,在內(nèi)核空間進行聚類,實現(xiàn)高效的工程采購管理。

1 理論基礎(chǔ)

1.1 模糊聚類方法

每種隸屬度類型的樣本范圍在0~1 之間,其中接近1 的值表示樣本出現(xiàn)的可能性極低,接近0 的值表示樣本出現(xiàn)的可能性較大。與普通的數(shù)據(jù)分類方法相比,通過模糊聚類后,訓練樣本的數(shù)量有所減少,從而有效提高了訓練率與分類算法的精度。

原始空間樣本集下,x=(x1,x2,…,xl),xi∈Rn(i=1,2,…,l)的非線性映射是β:x→β(x)。若在高維特征空間中使用歐氏距離,模糊聚類算法的公式為:

其中,uij是成員,C是模糊組別的數(shù)量,vi是第i組的中心,?(vi)是核空間的中心,m∈(1,∞)是模糊權(quán)重指數(shù),K(xj,vi)是核公式,是樣本到中心點的距離。

根據(jù)KFCM 優(yōu)化方法,成員的計算公式為:

為了最小化目標函數(shù),則需要計算K(xj,vi),其為空間中心的函數(shù),且有K(xj,vi)={?(xj),?(vi)}。

1.2 模糊聚類的步驟

模糊聚類算法基于統(tǒng)計學習理論,使用有限的樣本信息來平衡模型復雜性和學習能力,并尋找出分離超平面最優(yōu)分類的過程。在保持分類精度的同時,兩側(cè)的最大超平面空白空間就可以實現(xiàn)最優(yōu)分類,然后再通過線性分類來劃分類別邊界。由于一般的線性可分最優(yōu)超平面樣本可以分為兩種類型,因此,若從最近樣本到超平面的距離被最大化,那么最優(yōu)超平面的構(gòu)成問題就被轉(zhuǎn)化成了基于約束條件的優(yōu)化問題。

在這一約束條件中,b是閾值,(xi,yi)是樣本,ω是最優(yōu)超平面法向量。將拉格朗日乘數(shù)應(yīng)用于上述問題,設(shè)αi是拉格朗日乘數(shù),則目標函數(shù)可以寫作:

模糊聚類方法的目的是通過最大化兩個對立類之間的邊際來解決分類問題。在訓練之前,聚類算法將其數(shù)據(jù)在最大程度上簡化為訓練樣本,使用隸屬度來確定類型。為了小于給定閾值,聚類算法的中心值選擇隸屬度,然后將該學習放入訓練集中。

基于KFCM 隸屬度步長的算法步驟如下:

1)選擇0~1 之間的一個隨機數(shù)初始化隸屬矩陣u,并且使矩陣滿足約束條件。那么通過計算C 聚類中心就可以計算出新的u矩陣;

2)在這些初始聚類中心vi上使用迭代KFCM 算法后,設(shè)置模糊指數(shù)m、迭代次數(shù)閾值t以及迭代停止條件;

3)計算樣本對聚類中心的隸屬度uij;

4)重新定義集群中心的種類?(vi),計算新的K(xj,vi)和K(vi,vi),并更新成員uij為;

6)聚類算法結(jié)束后,u輸出按隸屬度排序且樣本小于80%Aoutput的數(shù)據(jù);

7)對輸出樣本進行訓練,依次用數(shù)據(jù)集的初始分類來檢驗其有效性。

2 核電工程數(shù)據(jù)處理算法

2.1 數(shù)據(jù)聚類

在進行采購數(shù)據(jù)管理系統(tǒng)設(shè)計之前,需要根據(jù)不同的應(yīng)用功能對數(shù)據(jù)類別進行區(qū)分。

1)信息共享功能。采購數(shù)據(jù)共享是系統(tǒng)最主要的應(yīng)用之一,設(shè)計符合采購信息、合同核對、倉庫儲存信息交換的模塊功能業(yè)務(wù)需求,可以與現(xiàn)存財務(wù)管控信息、項目管理模塊、廠家信息以及內(nèi)容管控相結(jié)合。從而確定這些功能模塊和采購流程的邏輯銜接,實現(xiàn)物資信息的共享。

2)物項信息管控。核電工程建設(shè)的物項信息數(shù)據(jù)庫較大、種類繁多,甚至有上百萬類,包括器材、設(shè)備、電力部件、工器具和備品等。物項主數(shù)據(jù)的準確性尤為重要,決定了物資信息的可使用度。為了方便掌握物資的信息情況,對每個物項設(shè)定唯一編碼并通過編碼區(qū)分類別,對應(yīng)采購合同的性質(zhì)以及時間節(jié)點。

3)合同管控。在國外通常使用SRM 系統(tǒng)來管控采購合同,但國內(nèi)類似的應(yīng)用案例較少,尤其是對于體量龐大的工程,這種準確管理的實現(xiàn)要求較為繁瑣,不符合現(xiàn)場實際。若強行推行SRM 系統(tǒng)可能會導致無效數(shù)據(jù)的混雜,這需要核電工程項目在管控方式、技術(shù)方案上有所創(chuàng)新。

4)倉儲管控。倉儲資料包括核電工程建設(shè)的新建和擴建驗收、入庫、出庫、移交等中間階段的信息,在物資最終登記為固定資產(chǎn)前,倉庫中的流通信息量十分龐大。目前的倉儲管控系統(tǒng)通常負責物資從“到貨”開始到被領(lǐng)用出庫的全部信息,管控系統(tǒng)的建立則有助于實現(xiàn)設(shè)備和材料等物資信息的充分利用。對于多個種類的物資,倉儲管理需要實現(xiàn)物資的精確關(guān)聯(lián)。

5)財務(wù)管控。財務(wù)是資產(chǎn)采購的關(guān)鍵環(huán)節(jié),但現(xiàn)有財務(wù)管控方法存在對前端業(yè)務(wù)部門的信息了解相對缺失、數(shù)據(jù)信息浪費的問題。例如合同進度款的匯總計算和支付等信息細化程度不合理,對判斷物資最終歸屬造成困擾,且財務(wù)管控依賴于大量人工勞作,對竣工決算和資產(chǎn)轉(zhuǎn)移等信息處理效率低下,計算效率和精確度均有待提升。

2.2 改進核C聚類均值算法

在基于模糊聚類的工程數(shù)據(jù)處理建模方法中,核C 聚類均值算法(KFCM)適合用于第一步優(yōu)化中。首先計算出聚類中心xc,KFCM 算法先用φ(x)映射輸入數(shù)據(jù)x到高維特征空間,然后進行模糊C 均值聚類,其目標函數(shù)為:

其中,uik(i=1,2,…,c且k=1,2,…,n)是第k個樣本對第i種類型的隸屬度,滿足uik∈[0,1]和歸一化條件=1,?k=1,2,…,n。

對于高斯核函數(shù)K(xk,vi),有:

將上式代入目標函數(shù)表達式,并歸一化約束條件的隸屬度,再通過以下迭代公式來最小化目標函數(shù):

由上述方法可以得出基于核模糊C 均值的模糊聚類核電工程數(shù)據(jù)分析與處理算法流程,如圖1所示。

圖1 模糊聚類算法流程

3 聚類算法效果驗證

該文以核電工程采購管理數(shù)據(jù)為研究對象,基于模糊聚類算法驗證了上述方法的有效性。基于經(jīng)驗?zāi)B(tài)對數(shù)據(jù)類型進行分類,將前10 個模態(tài)分量作為樣本矩陣。將特征矩陣奇異值分解得到奇異值特征向量,并劃分為初始訓練集和測試集,再根據(jù)基于KFCM 隸屬度的模糊聚類算法和認證算法對128 個樣本值進行分類和驗證。

模糊聚類數(shù)據(jù)處理流程如圖2 所示。利用模糊聚類的思想,通過MATLAB 軟件為實驗平臺編寫測試程序。通過對數(shù)據(jù)的多次迭代,計算出各類的聚類中心,得到的待測樣本與各模型曲線聚類中心幅值的對照如圖3所示。圖3(a)表示待測樣本,圖3(b)為標準狀態(tài),從圖中可以看出待測樣本與標準狀態(tài)差異較大,且數(shù)據(jù)走向也有較大差異。MATLAB 軟件中記錄的測試時間的顯示結(jié)果與曲線分析結(jié)果一致,模糊聚類的類型是一致的,驗證了所提算法的準確性。

圖2 模糊聚類數(shù)據(jù)處理流程

圖3 聚類算法處理樣本數(shù)據(jù)

該文使用奇異值分解對實驗樣本數(shù)據(jù)進行分解。首先將訓練樣本數(shù)據(jù)的列向量構(gòu)成一個矩陣,然后對其進行奇異值分解,得到訓練樣本的一個特征矩陣,再通過該文算法計算價值函數(shù),生成新的隸屬度和聚類中心。最后,在整個成員矩陣中隨機選擇成員,并將小于樣本輸出數(shù)80%的數(shù)據(jù)作為新的訓練集進行聚類算法訓練。該文實驗的測試樣本數(shù)量為128 個,分類結(jié)果如表1 所示。

表1 分類結(jié)果

實驗結(jié)果表明,KFCM 具有更優(yōu)的特性且分類精度和速度均有所提高,且當訓練樣本線性不可分時,其保持了良好的可行性。

4 結(jié)束語

該文提出了核電工程數(shù)據(jù)改進的核C 值模糊聚類算法,考慮了實際工程量的規(guī)模和現(xiàn)場應(yīng)用的可行性,實現(xiàn)將采購物資信息清單與系統(tǒng)數(shù)據(jù)準確、可靠地對應(yīng)。最后通過初始訓練集和測試集128 個樣本的校驗,證明了所提基于模糊聚類算法的核電工程數(shù)據(jù)分析與處理的有效性和可行性,為后續(xù)關(guān)聯(lián)整合核電工程信息數(shù)據(jù)推廣應(yīng)用奠定了基礎(chǔ)。該文所提出的采購全過程數(shù)據(jù)信息化方案可為核電工程的新建、擴建數(shù)據(jù)處理提供數(shù)據(jù)支持。

猜你喜歡
超平面核電聚類
基于非線性核的SVM模型可視化策略
全純曲線正規(guī)族分擔超平面
有限維Banach空間中完備集的構(gòu)造
第四代核電 高溫氣冷堆
百年初心精神 點亮核電未來
2020年核電活動安排
核電鏈接
基于高斯混合聚類的陣列干涉SAR三維成像
基于Spark平臺的K-means聚類算法改進及并行化實現(xiàn)
基于加權(quán)模糊聚類的不平衡數(shù)據(jù)分類方法
遂昌县| 黄冈市| 阿拉善右旗| 梨树县| 绥滨县| 无锡市| 鸡东县| 建水县| 南通市| 平凉市| 津市市| 文安县| 湄潭县| 宁安市| 神农架林区| 吉隆县| 黄大仙区| 通河县| 封开县| 汨罗市| 平湖市| 灵璧县| 平原县| 泗阳县| 镶黄旗| 吕梁市| 威信县| 蒙阴县| 澳门| 嘉鱼县| 万宁市| 嵊州市| 乌鲁木齐县| 平顺县| 垦利县| 无极县| 宜都市| 河池市| 巩义市| 绥滨县| 文安县|