楊清宇 孫鳳偉 張曌 張迪 莊健
摘要:針對(duì)往復(fù)式壓縮機(jī)故障數(shù)據(jù)空間分布復(fù)雜、常規(guī)算法不能有效聚類的問題,提出了一種改進(jìn)的譜聚類算法,該算法使用新的相似度矩陣計(jì)算方式,根據(jù)故障數(shù)據(jù)流形分布的特點(diǎn)引入測地線距離取代歐氏距離作為數(shù)據(jù)間的關(guān)系度量;通過計(jì)算各數(shù)據(jù)點(diǎn)的鄰域密度因子有效地識(shí)別和剔除了噪聲點(diǎn);利用基于密度的局部歐氏距離調(diào)整方法對(duì)流形間隙過小的區(qū)域進(jìn)行了處理,在幾個(gè)人工數(shù)據(jù)集和往復(fù)式壓縮機(jī)故障數(shù)據(jù)集上的測試結(jié)果表明,改進(jìn)譜聚類算法對(duì)于具有流形分布、多尺度、有噪聲、流形間隙過小甚至交叉等特點(diǎn)的數(shù)據(jù)具有很好的聚類能力,聚類準(zhǔn)確率比常規(guī)的k-均值和MSCA譜聚類算法分別提高了50.86%和8.6%。