国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于密度最大值的K—means初始聚類中心點算法改進

2018-01-11 14:01:52劉闖陳桂芬
數(shù)字技術與應用 2017年11期
關鍵詞:可靠性聚類穩(wěn)定性

劉闖+陳桂芬

摘要:聚類分析是機器學習中重要的方法,傳統(tǒng)的K-means算法對于聚類的初始中心點的選擇具有隨機性,這就造成不同的選擇產(chǎn)生不同的聚類結果。針對這一問題,提出一種基于密度最大值的優(yōu)化初始聚類中心選取算法。試驗結果顯示,改進后的算法與傳統(tǒng)算法相比具有較高的穩(wěn)定性和可靠性。

關鍵詞:聚類;穩(wěn)定性;局部密度;可靠性

中圖分類號:TP393 文獻標識碼:A 文章編號:1007-9416(2017)11-0118-02

1 引言

聚類算法是數(shù)據(jù)挖掘中一種重要的算法,K-means聚類算法思路簡單,聚類快速。但是,其缺點也是十分明顯,易受噪聲影響,容易陷入局部最優(yōu)解。為解決傳統(tǒng)K-means聚類算法問題,很多學者從不同角度提出改進算法。文獻[1]根據(jù)密度和平均距離完成聚類中心的優(yōu)化,文獻[2]選擇相互距離最遠的K個處于高密度區(qū)域的點作為中心。文獻[3]選擇平均密度優(yōu)化初始聚類中心。綜合各個改進思想,提出基于密度最大值初始聚類中心的K-means算法。

4 仿真實驗分析

為驗證改進算法的有效性,采用國際上的專門用來測試機器學習算法的UCI數(shù)據(jù)集中Iris、Wine、Soybean這三組數(shù)據(jù)進行測試。Iris數(shù)據(jù)有950條數(shù)據(jù),每個數(shù)據(jù)對象有4個屬性,分三類;Wine數(shù)據(jù)750條數(shù)據(jù),每個數(shù)據(jù)13屬性,分三類;Soybean數(shù)據(jù)500條,每個數(shù)據(jù)對象35個屬性,分7類。測試實驗結果如表1,表2所示。

由表1,表2實驗對比結果可知改進后算法在迭代次數(shù),平方誤差,測試時間,準確率等方面對比傳統(tǒng)K-means算法,由表可知,改進后算法準確率明顯高于其他兩種算法。

5 結語

對于提出基于密度最大值初始化聚類中心的K-means算法,通過實驗對比表明,算法迭代次數(shù)和聚類所需時間減小,準確率提高。

參考文獻

[1]王浩,黃越.基于距離測度學習的AP聚類圖像標注[J].計算機工程與應用,2016:43-46.

[2]孫士保,秦克云.改進的k-平均聚類算法研究[J].計算機工程,2014:57-62.

[3]邢長征.基于平均密度優(yōu)化初始聚類中心的K-means算法[J].計算機應用工程,2014:56-59.

[4]Han Jiawei.Data mining:concepts and techniques[M].San Francisco:Morgan Kaufmann Publishers,2014:32-35.

Abstract:Clustering analysis is an important method in machine learning. The traditional K-means clustering algorithm has randomness to the initial central point of clustering, which leads to different choices to produce different clustering results. In response to this problem, an optimal initial clustering center selection algorithm based on maximum density is proposed. Compared with the standard data UCI, the experiment shows that the improved algorithm has higher stability and reliability than the traditional algorithm.

Key Words:Clustering;stability;local density;reliabilityendprint

猜你喜歡
可靠性聚類穩(wěn)定性
可靠性管理體系創(chuàng)建與實踐
非線性中立型變延遲微分方程的長時間穩(wěn)定性
基于DBSACN聚類算法的XML文檔聚類
電子測試(2017年15期)2017-12-18 07:19:27
電子制作(2017年2期)2017-05-17 03:55:06
半動力系統(tǒng)中閉集的穩(wěn)定性和極限集映射的連續(xù)性
基于改進的遺傳算法的模糊聚類算法
基于可靠性跟蹤的薄弱環(huán)節(jié)辨識方法在省級電網(wǎng)可靠性改善中的應用研究
電測與儀表(2015年6期)2015-04-09 12:01:18
一種層次初始的聚類個數(shù)自適應的聚類方法研究
可靠性比一次采購成本更重要
風能(2015年9期)2015-02-27 10:15:24
自適應確定K-means算法的聚類數(shù):以遙感圖像聚類為例
会昌县| 封开县| 洪洞县| 聊城市| 盐津县| 承德县| 二手房| 简阳市| 普陀区| 公安县| 西安市| 津南区| 鸡东县| 东莞市| 昂仁县| 榆社县| 福泉市| 顺义区| 富川| 平定县| 眉山市| 宜章县| 得荣县| 汝州市| 义乌市| 福鼎市| 四子王旗| 丰城市| 金山区| 井陉县| 北流市| 南京市| 岗巴县| 巴林左旗| 仪陇县| 白沙| 鹤峰县| 祁连县| 壶关县| 宁强县| 惠水县|