国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

結(jié)合蟻群算法的改進(jìn)粗糙K均值聚類算法

2019-04-25 07:09:44王慧琴張小紅
數(shù)據(jù)采集與處理 2019年2期
關(guān)鍵詞:均值螞蟻準(zhǔn)確率

劉 洋 王慧琴,2 張小紅

(1.西安建筑科技大學(xué)信息與控制工程學(xué)院,西安,710055;2.西安建筑科技大學(xué)管理學(xué)院,西安,710055;3.西安科技大學(xué)通信與信息工程學(xué)院,西安,710054)

引 言

聚類是指按照一定的相似性度量準(zhǔn)則將物理或抽象對(duì)象的集合劃分成多組具有同類性質(zhì)的子類(簇),同一子類(簇)中的對(duì)象相似度較高,而不同子類(簇)中的對(duì)象差別較大[1]。聚類在生態(tài)學(xué)領(lǐng)域,醫(yī)學(xué)醫(yī)療領(lǐng)域,經(jīng)濟(jì)學(xué)領(lǐng)域,以及電子商務(wù)領(lǐng)域等很多領(lǐng)域都有著非常廣泛的應(yīng)用[2]。不同的領(lǐng)域中,有適用于該領(lǐng)域的聚類算法?;镜木垲愃惴煞譃閷哟尉垲悺澐志垲?、密度聚類、模型聚類和網(wǎng)格聚類[3]。K均值聚類算法是一種經(jīng)典的劃分聚類算法,它將對(duì)象按照歐氏距離來進(jìn)行劃分。在實(shí)際中樣本對(duì)象之間沒有固定的邊界,往往會(huì)出現(xiàn)某個(gè)對(duì)象不是確定地屬于某一類。

粗糙集理論[4]是Pawlak提出的一種可以有效處理不確定性問題的方法。Lingras提出了粗糙K均值聚類算法,它能較好地處理無法精確分類的樣本數(shù)據(jù)[5]。粗糙K均值聚類算法根據(jù)樣本對(duì)象到類(簇)心歐氏距離的不同,將其劃分到上近似區(qū)域和下近似區(qū)域。上近似區(qū)域中的樣本對(duì)象可能屬于某類(簇),下近似區(qū)域中的樣本對(duì)象確定屬于某類(簇),因此粗糙K均值聚類算法能較好地處理無法精確分類的樣本數(shù)據(jù)。粗糙K均值聚類算法存在以下不足:初始質(zhì)心的選取是隨機(jī)的,導(dǎo)致聚類結(jié)果可能不是全局最優(yōu)而是局部最優(yōu);閾值的選擇不合理導(dǎo)致聚類結(jié)果的波動(dòng)性較大;經(jīng)驗(yàn)權(quán)重的設(shè)置容易忽略了數(shù)據(jù)分布的差異性。

國(guó)內(nèi)外文獻(xiàn)針對(duì)粗糙K均值聚類算法的不足之處進(jìn)行了研究與改進(jìn),文獻(xiàn)[6]根據(jù)樣本密度迭代地選取粗糙K均值算法的初始聚類中心,同時(shí)提出根據(jù)樣本密度給每個(gè)樣本賦以不同的權(quán)重計(jì)算類質(zhì)心,但是沒有考慮到,固定經(jīng)驗(yàn)權(quán)重?zé)o法很好地適應(yīng)聚類前期和后期的特點(diǎn)。文獻(xiàn)[7]考慮了每個(gè)對(duì)象的密度和賦予不同的權(quán)重,但缺少對(duì)上近似和下近似整的體權(quán)重的考慮。文獻(xiàn)[8]認(rèn)為在聚類過程中同一類中的各個(gè)樣本對(duì)類心的影響是不相同的,因此針對(duì)每一個(gè)樣本都計(jì)算其所屬類別的權(quán)重,但卻沒考慮閾值隨聚類過程的變化對(duì)聚類結(jié)果的影響。文獻(xiàn)[9]采用遺傳算法與粗糙K均值結(jié)合雖得到全局最優(yōu)解,卻忽略了固定經(jīng)驗(yàn)權(quán)重?zé)o法很好地適應(yīng)聚類前期和后期的特點(diǎn)。文獻(xiàn)[10]采用自適應(yīng)獲得參數(shù)的方法,避免了人為設(shè)置固定經(jīng)驗(yàn)權(quán)重對(duì)算法影響的缺點(diǎn),提高了算法的準(zhǔn)確性,卻沒考慮到粗糙K均值聚類算法對(duì)初始點(diǎn)敏感的缺陷。文獻(xiàn)[11]中通過構(gòu)造Logistic增長(zhǎng)曲線來計(jì)算下近似區(qū)域的權(quán)重,但當(dāng)算法的迭代次數(shù)過大時(shí)下近似區(qū)域的權(quán)重幾乎不再改變,對(duì)于不同的數(shù)據(jù)集忽略了其數(shù)據(jù)分布的差異性。

本文在前人對(duì)粗糙K均值聚類算法研究的理論基礎(chǔ)上進(jìn)行改進(jìn),結(jié)合蟻群算法中螞蟻決策行為時(shí)的隨機(jī)概率選擇策略,以及蟻群算法的正負(fù)反饋機(jī)制,對(duì)粗糙K均值聚類算法的初始質(zhì)心的選擇進(jìn)行優(yōu)化,以改進(jìn)基本粗糙K均值聚類算法初始質(zhì)心隨機(jī)選擇導(dǎo)致聚類結(jié)果可能是局部最優(yōu)而不是全局最優(yōu)的缺點(diǎn),同時(shí)采用動(dòng)態(tài)調(diào)整閾值和相關(guān)權(quán)重的方法,避免人為設(shè)置對(duì)算法的影響。

1 粗糙K均值聚類算法

粗糙集的思想為確定屬于某個(gè)類的樣本點(diǎn)在該類的下近似區(qū)域中,可能屬于某個(gè)類的樣本點(diǎn)在該類的上近似區(qū)域中[7]。在K均值聚類算法的基礎(chǔ)上引入粗糙集的思想,即為粗糙K均值聚類算法。

用xi表示樣本點(diǎn),Ck表示k個(gè)類,每個(gè)類對(duì)應(yīng)的的上近似表示為-Ck和下近似表示為-Ck,類Ck的邊界區(qū)域表示為,其中||=||-||,mk表示類心。mk計(jì)算公式為式中:|·|表示樣本點(diǎn)個(gè)數(shù);ωl表示下近似區(qū)域權(quán)重,ωb表示邊界區(qū)域的權(quán)重,且ωl+ωb=1;?表示空集。

首先將每個(gè)xi(i=1,2,…,N)分到任意一個(gè)Ck(k=1,2,…,K)的中,之后依照公式(1)計(jì)算mk。接下來計(jì)算每個(gè)xi與各個(gè)mk的距離dki,并找出與xi距離最近的mk',即xi與mk'之間的距離為min(dk'i)。若存在其他mk(k≠k')與xi之間的dki與min(dk'i)之差小于閾值,則把該xi劃分到這些類的,否則把xi加入到mk'所對(duì)應(yīng)的類Ck'的。再次更新類心,不斷循環(huán)上述過程,直到每個(gè)類的mk不變[10]。

2 結(jié)合蟻群算法的改進(jìn)粗糙K均值聚類算法

蟻群算法是對(duì)真實(shí)螞蟻覓食行為的一種抽象,算法中人為定義的螞蟻代替了真實(shí)的螞蟻。螞蟻從一個(gè)樣本點(diǎn)移動(dòng)到聚類中心時(shí),根據(jù)當(dāng)前路徑信息素量的大小依概率進(jìn)行選擇,螞蟻在所經(jīng)過的路徑上留下信息素,以此影響本次迭代或者下次迭代螞蟻選擇該路徑的概率。而信息素隨著時(shí)間的推移不斷揮發(fā),這使螞蟻不局限于過去的尋優(yōu)結(jié)果,能跳出局部最優(yōu)解,發(fā)現(xiàn)新的解。

結(jié)合蟻群算法中螞蟻決策行為時(shí)的隨機(jī)概率選擇策略以及蟻群算法的正負(fù)反饋機(jī)制,以此增加聚類結(jié)果的多樣性,且不斷搜索更優(yōu)結(jié)果,在避免算法陷入局部最優(yōu)解的同時(shí)達(dá)到改進(jìn)粗糙K均值聚類算法對(duì)初始點(diǎn)敏感的缺陷。同時(shí)粗糙K均值聚類算法中下近似與邊界區(qū)域權(quán)重的通過上、下近似元素?cái)?shù)來衡量,閾值采取自動(dòng)獲得,都避免了人為設(shè)計(jì)對(duì)聚類結(jié)果的影響,以此達(dá)到改進(jìn)粗糙K均值聚類算法的目的。

2.1 隨機(jī)概率選擇策略增加解的多樣性

在蟻群算法中,螞蟻搜索所有樣本所屬的聚類中心時(shí),根據(jù)當(dāng)前信息素量的大小依概率進(jìn)行隨機(jī)選擇,某樣本與某一聚類中心之間的信息素量越大,該樣本點(diǎn)被選擇歸入該類的概率越大。隨機(jī)概率選擇策略使算法擁有收斂的特性,同時(shí)有利于搜索更優(yōu)的結(jié)果,避免算法陷入局部最優(yōu)。

樣本到聚類中心mk的距離dij為歐式距離,啟發(fā)式函數(shù)定義為距離的倒數(shù),即

式中:k=1,2,…,K,其中K表示聚類數(shù)目;j=1,2,…,N,其中N表示數(shù)據(jù)集中樣本總個(gè)數(shù)。螞蟻在選擇路徑時(shí),不僅利用啟發(fā)式函數(shù),而且用到了樣本點(diǎn)與聚類中心之間的信息素。樣本與聚類中心之間的信息素分布為τkj,信息素分布在樣本和聚類中心之間。

在算法的搜索過程中,樣本點(diǎn)被分配到各個(gè)聚類中心的概率計(jì)算公式為

式中:α為信息素的相對(duì)重要程度,β為啟發(fā)式因子的相對(duì)重要程度,M為螞蟻總數(shù)(m∈[0,M]),q∈[0,1]為給定參數(shù),隨機(jī)產(chǎn)生的rand∈[0,1],t為迭代次數(shù)。allowm(i)為禁忌表之外的樣本集合,s為禁忌表中第s個(gè)元素,即螞蟻m所走過的第s個(gè)樣本。在算法的搜索過程中,為了加快收斂速度和增加搜索的多樣性,螞蟻隨機(jī)選擇一個(gè)xi∈allowm(i)作為起始點(diǎn),之后按照式(3)計(jì)算該樣本選擇各個(gè)聚類中心的概率pkj,最后根據(jù)輪盤賭的方法確定xi所屬的類,并將xi歸到相應(yīng)的類中。之后,螞蟻再隨機(jī)選取一個(gè)不包含在禁忌表之內(nèi)的樣本,重復(fù)上述過程,直到將所有樣本遍歷,即形成一個(gè)解。

2.2 目標(biāo)函數(shù)設(shè)計(jì)

在算法中所有螞蟻完成構(gòu)造解以后,通過目標(biāo)函數(shù)進(jìn)行評(píng)估,每次只保留目標(biāo)函數(shù)值最優(yōu)的螞蟻所得到的聚類結(jié)果,因此粗糙K均值聚類可視為優(yōu)化問題,優(yōu)化的過程即為目標(biāo)函數(shù)最小值的獲得,即為最優(yōu)的聚類結(jié)果。

式中:J表示類內(nèi)距離,用來評(píng)價(jià)聚類的內(nèi)聚程度;‖·‖2表示歐氏距離;ωlk,ωbk分別為第k簇下近似和邊界區(qū)域的權(quán)重值。在聚類過程中動(dòng)態(tài)地調(diào)整下近似與邊界區(qū)域的權(quán)重,可以避免經(jīng)驗(yàn)權(quán)重的設(shè)置導(dǎo)致忽略了數(shù)據(jù)分布的差異性。下近似與邊界區(qū)域的元素個(gè)數(shù)可以衡量相對(duì)重要度比例

考慮到聚類結(jié)果的好壞是由類內(nèi)距離和類間距離共同作用,即盡量減小類內(nèi)距離,增加類間距離。故本文采用能有效地均衡類間距離與類內(nèi)距離的目標(biāo)函數(shù),當(dāng)目標(biāo)函數(shù)達(dá)到最小值時(shí),得到最優(yōu)的聚類結(jié)果。目標(biāo)函數(shù)的計(jì)算公式為

式中:D表示類間距離,用來評(píng)價(jià)類間分離程度,隨著K增加內(nèi)聚程度下降,而類間分離程度增加。為使類間距離和類內(nèi)距離達(dá)到平衡,ω為類間分離程度權(quán)重[11]。

2.3 正負(fù)反饋機(jī)制

蟻群算法中各條路徑上信息素在不斷更新,最優(yōu)路徑上不斷增加的信息素吸引更多的螞蟻沿此路徑前進(jìn),同時(shí)新增的螞蟻在該路徑上釋放更多的信息素,不斷加強(qiáng)該路徑的吸引力,形成正反饋機(jī)制。差的路徑上信息素被加強(qiáng)的程度較弱或者得不到加強(qiáng),隨著信息素不斷揮發(fā)慢慢失去吸引力,形成負(fù)反饋機(jī)制[12]。

正反饋機(jī)制將更多的螞蟻吸引到當(dāng)前最優(yōu)的路徑上,促進(jìn)了聚類算法的收斂。但當(dāng)螞蟻搜索得到的是局部最優(yōu)解時(shí),為防止更多的螞蟻被吸引到該路徑導(dǎo)致最終結(jié)果為局部最優(yōu)解,負(fù)反饋機(jī)制則可以消除正反饋機(jī)制的作用。通過正負(fù)反饋機(jī)制對(duì)螞蟻釋放的信息素的作用,使螞蟻在尋優(yōu)過程當(dāng)中,不局限于局部最優(yōu)解,能不斷發(fā)現(xiàn)新的解。

蟻群算法中的人工螞蟻尋優(yōu)利用的是蟻群的整體信息,即完成一次尋優(yōu)后才進(jìn)行殘留信息素的全局更新。在蟻群算法中各路徑上的信息素更新公式為

式中:JFmin為目標(biāo)函數(shù)取得最小值時(shí)的類內(nèi)距離;Δτkj為信息素的增量;Q為螞蟻釋放的信息素總量;ρ(0<ρ<1)為信息素?fù)]發(fā)系數(shù)。

2.4 自動(dòng)獲取閾值

閾值T的作用是區(qū)分樣本屬于聚類上近似區(qū)域或下近似區(qū)域,閾值選擇的適當(dāng)才能確保上、下有充足的樣本。閾值的取值使用文獻(xiàn)[13]提出的方法,該方法可以自動(dòng)獲得閾值,避免人為設(shè)置對(duì)算法的影響。

(1)分別計(jì)算所有樣本元素與K個(gè)聚類中心的距離d(k,j)。

(2)找出d(k,j)中每列的最小值dmin(j)。

(3)計(jì)算各個(gè)樣本元素和其他類心的距離與dmin(j)的差值dt(k,j)。

(4)找出差值矩陣中每列的最小值ds(j)且ds(j)≠0,求這些最小值的平均值dmeans(j)。

(5)閾值的取值為T=min(dmeans(j))。其中k=1,2,…,K;j=1,2,…,N。

2.5 生成新聚類中心

式中:k=1,2,…,K;j=1,2,…,N;ωlk與ωbk分別表示第k類的下近似權(quán)重和邊界區(qū)域權(quán)重。

2.6 算法描述

螞蟻隨機(jī)選取一個(gè)樣本點(diǎn)作為起點(diǎn),參考啟發(fā)式函數(shù)與路徑上信息素的量,按照隨機(jī)概率選擇策略計(jì)算該樣本選擇各個(gè)聚類中心的概率,然后根據(jù)概率確定應(yīng)該所屬的類。然后螞蟻再隨機(jī)選取另外一個(gè)樣本,重復(fù)上述過程,直到螞蟻遍歷所有樣本,即形成了一個(gè)解。所有的螞蟻構(gòu)造完成解之后,使用目標(biāo)函數(shù)評(píng)價(jià)出最優(yōu)值并且保留,然后計(jì)算下近似區(qū)域權(quán)重和邊界區(qū)域權(quán)重,最后重新計(jì)算各個(gè)簇的質(zhì)心。信息素的更新為全局更新,在算法迭代的過程中,只聚類結(jié)果最優(yōu)的螞蟻的路徑進(jìn)行信息素增加,其余的螞蟻的路徑進(jìn)行信息素衰減。

算法具體步驟如下:

(1)設(shè)定各參數(shù)的值,初始信息素濃度τkj(0)=1,求閾值。

(2)初始聚類中心隨機(jī)選取K個(gè)。

(3)計(jì)算 dkj及 ηkj。

(4)M只螞蟻按照式(3)搜索方法獨(dú)立地構(gòu)造各自的解。

(5)根據(jù)式(5,6)計(jì)算下近似權(quán)重和邊界區(qū)域權(quán)重,根據(jù)式(11)重新計(jì)算各個(gè)簇的質(zhì)心。

(6)如果M只螞蟻都構(gòu)造完成各自的解,轉(zhuǎn)步驟(7),否則轉(zhuǎn)步驟(4)。

(7)根據(jù)式(4,7,8)計(jì)算并比較M只螞蟻求得的目標(biāo)函數(shù),保存其最優(yōu)解和最優(yōu)聚類結(jié)果。

(8)根據(jù)式(9,10)進(jìn)行全局信息素更新。

(9)若滿足結(jié)束條件(達(dá)到最大迭代次數(shù)),則輸出最優(yōu)解,否則進(jìn)行迭代,轉(zhuǎn)步驟(3)。

3 實(shí) 驗(yàn)

3.1 評(píng)價(jià)指標(biāo)

實(shí)驗(yàn)將聚類結(jié)果與實(shí)際通用UCI數(shù)據(jù)進(jìn)行比較,以此評(píng)價(jià)聚類算法的性能的優(yōu)良。常用的評(píng)價(jià)方法有準(zhǔn)確率指標(biāo)Rand[8]和Kappa系數(shù)[14]。

Rand計(jì)算公式為式中nk表示正確劃入第k簇的下近似中的樣本的個(gè)數(shù)。聚類結(jié)果中的任意一個(gè)簇的下近似中,若其中含有k類別的樣本數(shù)目最多,則認(rèn)為該集合為第k類數(shù)據(jù)的分布。

Kappa系數(shù)公式如下

式中:nk+表示第k類真實(shí)的樣本總數(shù),n+k表示第k類被分類的樣本總數(shù)。

3.2 UCI數(shù)據(jù)集實(shí)驗(yàn)

采用UCI機(jī)器學(xué)習(xí)數(shù)據(jù)庫中的3個(gè)經(jīng)典數(shù)據(jù)集:Iris,Balance-scale和 Wine數(shù)據(jù)集驗(yàn)證算法的性能,數(shù)據(jù)集具體信息如表1所示。實(shí)驗(yàn)環(huán)境為:Windows 7系統(tǒng),i3處理器,2 GB內(nèi)存,C語言編程。

實(shí) 驗(yàn)參 數(shù) α=1,β=1,ρ=0.9,q=0.9,M=20,T=0.1最大迭代次數(shù) Nc=100,Q=100。

為了驗(yàn)證本文算法的性能,分別采用粗糙K均值聚類算法、基于粒計(jì)算的粗糙集聚類算法[10]和本文提出的算法在所選UCI標(biāo)準(zhǔn)數(shù)據(jù)集上進(jìn)行20次實(shí)驗(yàn),然后取其平均值進(jìn)行比較分析。在粗糙K均值聚類算法中ωl和ωb取值的不同會(huì)導(dǎo)致類心的變化,影響到聚類結(jié)果的準(zhǔn)確率。當(dāng)ωl和ωb取不同值時(shí)粗糙K均值聚類結(jié)果準(zhǔn)確率如圖1所示。下近似和邊界區(qū)域的權(quán)重中的一個(gè)太大或者太小,都會(huì)造成類心的偏移,導(dǎo)致聚類結(jié)果準(zhǔn)確率不高。因此在本次試驗(yàn)中粗糙K均值聚類算法中的下近似和邊界區(qū)域權(quán)重的取值分別為ωl=0.8,ωb=0.2。

3種算法在各數(shù)據(jù)集上聚類結(jié)果的準(zhǔn)確率和Kappa系數(shù)如圖2—4所示。3種算法在各個(gè)數(shù)據(jù)集上運(yùn)行時(shí)間和迭代次數(shù)如圖5,6所示。3種算法在各個(gè)數(shù)據(jù)集上運(yùn)行后下近似中各類的類內(nèi)距離如圖7—9所示。

表1 數(shù)據(jù)集信息Tab.1 Data sets information

圖1 ωl和ωb取不同值對(duì)應(yīng)的聚類結(jié)果準(zhǔn)確率Fig.1 Accuracy rate of differentωlandωb

圖2 Iris數(shù)據(jù)集準(zhǔn)確率和Kappa系數(shù)Fig.2 Accuracy rate and Kappa of Iris data sets

圖3 Balance-scale數(shù)據(jù)集準(zhǔn)確率和Kappa系數(shù)Fig.3 Accuracy rate and Kappa of Balance-scale data sets

圖4 Wine數(shù)據(jù)集準(zhǔn)確率和Kappa系數(shù)Fig.4 Accuracy rate and Kappa of Wine data sets

圖5 3種算法運(yùn)行時(shí)間Fig.5 Running time of three algorithms

圖7 Iris數(shù)據(jù)集收斂曲線Fig.7 Convergence curves of Iris data sets

圖6 3種算法運(yùn)行次數(shù)Fig.6 Running number of three algorithms

圖8 Balance-scale數(shù)據(jù)集收斂曲線Fig.8 Convergence curves of Balance-scale data sets

通過圖2—4各項(xiàng)實(shí)驗(yàn)結(jié)果數(shù)據(jù)可知,本文算法在聚類準(zhǔn)確率、Kappa系數(shù)方面有所改進(jìn)。在Iris數(shù)據(jù)集上本文算法比粗糙K均值聚類算法與基于粒計(jì)算的粗糙集聚類算法的準(zhǔn)確率分別提高了13.5%和3.17%,準(zhǔn)確率效果顯著,Kappa系數(shù)也得到了提高。在Balancescale數(shù)據(jù)集和Wine數(shù)據(jù)集上,樣本維數(shù)增加,本文算法的準(zhǔn)確率與Kappa系數(shù)依然高于粗糙K均值聚類算法和基于粒計(jì)算的粗糙集聚類算法。通過圖5和圖6可知,本文算法與粗糙K均值聚類算法相比,運(yùn)行時(shí)間和迭代次數(shù)都有所下降;本文算法與文獻(xiàn)[10]中算法比較,雖然運(yùn)行時(shí)間和迭代次數(shù)都略有增加,但是實(shí)驗(yàn)結(jié)果的準(zhǔn)確率和Kappa系數(shù)都得到提升,因此為了提升實(shí)驗(yàn)結(jié)果增加迭代次數(shù)和運(yùn)行時(shí)間也是值得的。下近似中各類的類間距離越大,即確定劃分到該類的元素越多,算法的準(zhǔn)確率越高。由圖7—9可知,本文提出算法收斂的速度快于粗糙K均值聚類算法,與文獻(xiàn)[10]算法相比收斂速度差別不大,但是準(zhǔn)確率更高。由此可見,本文算法使用蟻群算法中隨機(jī)概率選擇策略增加解的多樣性,使用信息素正負(fù)反饋機(jī)制促進(jìn)算法收斂的同時(shí)跳出局部最優(yōu)解,克服粗糙K均值聚類算法對(duì)初始點(diǎn)敏感的缺陷。同時(shí)根據(jù)數(shù)據(jù)集中數(shù)據(jù)的特點(diǎn)使用動(dòng)態(tài)調(diào)整下近似權(quán)重,邊界區(qū)域權(quán)重和閾值的方法,避免了人為設(shè)置參數(shù)對(duì)算法的影響,使得本文算法優(yōu)于比較的其他算法。

圖9 Wine數(shù)據(jù)集收斂曲線Fig.9 Convergence curves of Wine data sets

4 結(jié)束語

本文提出了一種結(jié)合蟻群算法的改進(jìn)粗糙K均值聚類算法,該算法結(jié)合蟻群算法中的隨機(jī)概率選擇策略和正負(fù)反饋機(jī)制,優(yōu)化粗糙K均值聚類算法對(duì)初始點(diǎn)敏感,導(dǎo)致聚類結(jié)果時(shí)常是局部最優(yōu)而不是全局最優(yōu)的缺陷,以及采用了動(dòng)態(tài)調(diào)整下近似與邊界區(qū)域的權(quán)重和算法閾值的方法,克服了人為設(shè)置參數(shù)對(duì)算法的影響。實(shí)驗(yàn)證明這種方法,聚類結(jié)果的準(zhǔn)確率和Kappa系數(shù)有很大提高。但該算法還存在著一些不足,如當(dāng)有新的數(shù)據(jù)加入時(shí)需要在整個(gè)數(shù)據(jù)集上重新聚類。此項(xiàng)不足將是筆者下一步的研究工作重點(diǎn)。

猜你喜歡
均值螞蟻準(zhǔn)確率
乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
高速公路車牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
我們會(huì)“隱身”讓螞蟻來保護(hù)自己
螞蟻
均值不等式失效時(shí)的解決方法
均值與方差在生活中的應(yīng)用
關(guān)于均值有界變差函數(shù)的重要不等式
對(duì)偶均值積分的Marcus-Lopes不等式
南平市| 瑞丽市| 科技| 昌邑市| 涡阳县| 曲水县| 栾川县| 体育| 南昌县| 专栏| 娱乐| 锡林郭勒盟| 红安县| 岐山县| 麦盖提县| 高邑县| 平凉市| 北京市| 军事| 石屏县| 扶绥县| 定南县| 伊春市| 大兴区| 泸定县| 西畴县| 禹城市| 金秀| 合肥市| 渝北区| 景东| 南陵县| 祁连县| 扬州市| 浦北县| 黄陵县| 昌平区| 大宁县| 仁布县| 井研县| 潢川县|