国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于k-means算法聚類問題的研究

2020-10-20 21:32張勤
數(shù)碼設(shè)計 2020年8期
關(guān)鍵詞:聚類算法可行性

張勤

摘要:K-means算法是一種分類的聚類算法,通過這種算法,對藥品銷售數(shù)據(jù)進(jìn)行處理,把銷量較好的一組顯示給用戶,實(shí)現(xiàn)藥品銷售排行功能,以方便用戶的采購,也便于銷售商掌握銷售規(guī)律,采取相應(yīng)的措施。這樣也就完成K-means聚類算法的實(shí)現(xiàn)過程。

關(guān)鍵詞:聚類算法;可行性;聚類算法的實(shí)現(xiàn)過程

中圖分類號:TP301.6 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-9129(2020)08-0182-01

1 問題的提出

當(dāng)今是一個信息爆炸的時代,在生產(chǎn)和生活的各個方面,每天都有形形色色的海量數(shù)據(jù)不斷出現(xiàn),這些數(shù)據(jù)背后都隱藏著有價值的信息。這些信息 需要被挖掘才能體現(xiàn)價值,聚類是這個過程中最常用到的一個技術(shù),所以聚類被越來越多地運(yùn)用,得到了越來越多的重視。例如,在藥品銷售方面,既存在銷路一般的滯銷藥,也有著銷售速度極快的暢銷藥。而倘若能夠準(zhǔn)確把握其中的數(shù)據(jù)信息,采取聚類分析的方法來對相關(guān)藥品實(shí)施統(tǒng)一化的銷售處理,就能夠讓藥品的處理率得到有力提升,而且還可以通過對藥品銷售規(guī)律的把控,科學(xué)化地處理多類別藥品。

2 K-means聚類算法

客觀地說,聚類分析屬于一種以挖掘數(shù)據(jù)為核心的功能,其能夠充當(dāng)為一種獲取數(shù)據(jù)分布情況的工具,為使用者正確認(rèn)知類別對象特點(diǎn),進(jìn)而進(jìn)行集中化的類別分析提供數(shù)據(jù)支持。同時,其作為當(dāng)前較為時興的一種算法,能夠?qū)ψ⑷胧袌鰻I銷、生物學(xué)、空間數(shù)據(jù)技術(shù)、機(jī)器學(xué)習(xí)、統(tǒng)計學(xué)以及數(shù)據(jù)挖掘等多個領(lǐng)域提供便利。由于各領(lǐng)域都存有數(shù)據(jù)儲存量龐大的數(shù)據(jù)庫。故此,聚類分析意境逐步發(fā)展成數(shù)據(jù)挖掘領(lǐng)域中一個極其重要的研究課題。對于k-means 算法而言,其接受輸入量為k;然后以k為聚類劃分n各數(shù)據(jù)對象,進(jìn)而獲得相應(yīng)的聚類滿足:不同聚類中各個對象的相似度不高,而同一聚類中各個對象則有著極高的相似度。而其中的相似度,則是以聚類對象的“中心對象”,也就是均值來計算而得。

3 K-means聚類算法的可行性

聚類算法在各個方面都有所應(yīng)用,在生物學(xué)上對于基因的聚類,分別同一物種;在上市分析上幫助銷售人員選擇客戶群;在房地產(chǎn)選址方面也能選擇較好的房源;在居民階梯電量制定方法雙眼皮也有應(yīng)用。現(xiàn)如今藥品的數(shù)量、種類繁多,單獨(dú)去了解一個或一類藥品費(fèi)時費(fèi)力,而聚類K-means正是分類的算法,在此以銷量作為分組的依據(jù),把銷量較好的顯示給用戶。銷量較差的提示給管理員,采取相應(yīng)的措施。所以該系統(tǒng)使用K-means算法也是可行的。

4 K-means聚類算法的基本步驟

(1)從數(shù)據(jù)中選擇k個對象作為初始聚類中心;

(2)計算每個聚類對象到聚類中心的距離來劃分;

(3)再次計算每個聚類中心

(4)計算標(biāo)準(zhǔn)測度函數(shù),到達(dá)到最大迭代次數(shù),則停止,否則,繼續(xù)操作。

5 K-means聚類算法的實(shí)現(xiàn)過程

首先對所選數(shù)據(jù)進(jìn)行預(yù)處理和標(biāo)準(zhǔn)化,做預(yù)處理是因為數(shù)據(jù)的“不純凈”,提高數(shù)據(jù)的挖掘質(zhì)量,節(jié)約數(shù)據(jù)挖掘的時間;數(shù)據(jù)標(biāo)準(zhǔn)化是為了壓縮數(shù)據(jù),提高數(shù)據(jù)的準(zhǔn)確性和有效性。標(biāo)準(zhǔn)化的方法為:已知有n個藥品,設(shè)第i個藥品,第j個屬性的值為Xij,

下面是選擇的部分?jǐn)?shù)據(jù):

經(jīng)過K-means聚類后可得到兩大藥品分類,第一類編號為:3、4、5、6、7;第二類編號為:8、9、11、12、13。

結(jié)語:用數(shù)據(jù)聚類K-means算法,通過聚類分析把銷售數(shù)據(jù)分為幾組,把銷量好的顯示給用戶,便于采購。銷量不好的反饋給管理者,以便采取措施,調(diào)整銷售策略。下一步將軟件的開發(fā)和完善。

參考文獻(xiàn):

[1] 阿霍. 計算機(jī)算法設(shè)計與分析(英文版)[M].北京:機(jī)械工業(yè)出版社,2006.

[2] 任恒妮. 大數(shù)據(jù) K-means 聚類算法的研究與應(yīng)用[J].信息技術(shù)2019(11)

[3] 王曉東.計算機(jī)算法設(shè)計與分析[M].北京:電子工業(yè)出版社,2018.

[4] 王曉云,陳業(yè)綱.計算機(jī)算法設(shè)計、分析與實(shí)現(xiàn)[M].北京:科學(xué)出版社,2012.

猜你喜歡
聚類算法可行性
IPTV 8K超高清建設(shè)可行性分析與建議
螺旋CT對食管癌手術(shù)的可行性評價
淺談出行及服務(wù)MaaS方案在XX市實(shí)施的必要性和可行性
五家渠市交通信號控制系統(tǒng)可行性改造研究
數(shù)據(jù)挖掘算法性能優(yōu)化的研究與應(yīng)用
K—Means聚類算法在MapReduce框架下的實(shí)現(xiàn)
基于K?均值與AGNES聚類算法的校園網(wǎng)行為分析系統(tǒng)研究
基于改進(jìn)的K_means算法在圖像分割中的應(yīng)用
大規(guī)模風(fēng)電場集中接入對電力系統(tǒng)小干擾穩(wěn)定的影響分析
可行性指南絲綢襯衫款
淅川县| 普格县| 手机| 汉阴县| 忻城县| 明光市| 延安市| 鹤壁市| 康定县| 云林县| 临猗县| 清水河县| 耒阳市| 达孜县| 大厂| 昂仁县| 彝良县| 阿坝县| 万盛区| 平江县| 嘉鱼县| 凭祥市| 射阳县| 子洲县| 常德市| 鄂托克旗| 志丹县| 登封市| 时尚| 宁远县| 阿坝| 许昌县| 米林县| 通州市| 大邑县| 曲松县| 南和县| 深水埗区| 麻阳| 东源县| 新昌县|