国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于改進(jìn)模糊聚類的煙草品質(zhì)集成評(píng)價(jià)模型

2016-08-10 08:04尹梅周國雄
關(guān)鍵詞:模擬退火煙草聚類

尹梅,周國雄

(1.湖南工程職業(yè)技術(shù)學(xué)院信息工程系,湖南 長沙 410151;2.中南林業(yè)科技大學(xué)計(jì)算機(jī)與信息工程學(xué)院,湖南長沙 410004)

?

基于改進(jìn)模糊聚類的煙草品質(zhì)集成評(píng)價(jià)模型

尹梅1,周國雄2

(1.湖南工程職業(yè)技術(shù)學(xué)院信息工程系,湖南 長沙 410151;2.中南林業(yè)科技大學(xué)計(jì)算機(jī)與信息工程學(xué)院,湖南長沙 410004)

針對(duì)煙草化學(xué)成分與煙草品質(zhì)之間難以建立確定的數(shù)學(xué)模型的問題,提出了一種基于改進(jìn)模糊聚類的煙草品質(zhì)評(píng)價(jià)方法。該方法以煙葉樣品的化學(xué)成分的差異性為依據(jù),以模型分類結(jié)果與專家評(píng)吸結(jié)果的一致性為目標(biāo),利用模擬退火算法對(duì)現(xiàn)有的模糊聚類算法進(jìn)行優(yōu)化改進(jìn),建立基分類器;在此基礎(chǔ)上,利用 AdaBoost將基分類器對(duì)于不同樣本集的多個(gè)分類結(jié)果進(jìn)行集成,形成最終的煙草品質(zhì)評(píng)價(jià)模型。以130組煙葉作為煙草樣本,測(cè)定了各煙葉樣品中總糖、還原糖、總氮、煙堿、氧化鉀、氯離子、蛋白質(zhì)7種化學(xué)成分含量,并采用改進(jìn)的模糊聚類方法與神經(jīng)網(wǎng)絡(luò)算法、模糊聚類算法進(jìn)行對(duì)比試驗(yàn),該方法的誤檢率為6.7%,具有提升小樣本數(shù)據(jù)的辨識(shí)能力,優(yōu)于所比較的其他2種方法。

模糊聚類;模擬退火;專家評(píng)吸;煙草品質(zhì)評(píng)價(jià)

投稿網(wǎng)址:http://xb.ijournal.cn

煙草中的化學(xué)成分十分復(fù)雜,它們對(duì)人的感官刺激與人的主觀感受之間的關(guān)系極其微妙,呈弱隨機(jī)性,使得煙草品質(zhì)的評(píng)價(jià)差異性較大。現(xiàn)有的煙草品質(zhì)評(píng)價(jià),大都采用傳統(tǒng)的數(shù)理統(tǒng)計(jì)方法,曹建敏等[1]利用簡(jiǎn)單相關(guān)分析、偏相關(guān)分析以及線性回歸方法,分析了多種化學(xué)物質(zhì)對(duì)煙草品質(zhì)的影響;李強(qiáng)等[2]對(duì)煙草主要化學(xué)成分進(jìn)行主成分分析,建立了烤煙品質(zhì)的估算方法;于建軍等[3]通過相關(guān)和回歸方法,從7種化學(xué)成分及其3種比值中提取了4個(gè)對(duì)煙草品質(zhì)影響較大的主因子,這些方法能夠明確不同化學(xué)成分對(duì)煙草品質(zhì)的影響程度,但難以建立煙草化學(xué)成分與其品質(zhì)之間確定的數(shù)學(xué)模型,因而無法直接給出評(píng)估結(jié)果。徐小華等[4]則將支持向量機(jī)用于煙草化學(xué)成分協(xié)調(diào)性的分類,陳清等[5]利用人工神經(jīng)網(wǎng)絡(luò)對(duì)煙草品質(zhì)進(jìn)行分類,這些智能計(jì)算在一定程度上彌補(bǔ)了傳統(tǒng)數(shù)理統(tǒng)計(jì)的不足,但是對(duì)于弱隨機(jī)性的品質(zhì)分類準(zhǔn)確性仍然不高。

筆者提出了一種基于改進(jìn)模糊聚類的煙草品質(zhì)的評(píng)價(jià)方法:以煙葉樣品的化學(xué)成分的差異性為依據(jù),以評(píng)價(jià)結(jié)果與專家評(píng)吸結(jié)果一致性為綜合目標(biāo),利用模擬退火算法對(duì)現(xiàn)有的模糊聚類算法進(jìn)行優(yōu)化改進(jìn),建立基分類器;在此基礎(chǔ)上,利用AdaBoost將基分類器對(duì)于不同樣本集的多個(gè)分類結(jié)果進(jìn)行集成,形成最終的煙草品質(zhì)評(píng)價(jià)模型。

1 煙草品質(zhì)評(píng)價(jià)原理和方案

選用煙葉中總糖、還原糖、總氮、煙堿、蛋白質(zhì)、氧化鉀、氯離子的含量作為煙草品質(zhì)主要評(píng)價(jià)依據(jù),采用多種煙草樣本以及專家評(píng)價(jià)結(jié)果建立測(cè)量集[6],通過分類算法對(duì)樣本煙草化學(xué)成分進(jìn)行分析,來評(píng)價(jià)煙草內(nèi)在品質(zhì)的差異性。

基于傳統(tǒng)數(shù)理統(tǒng)計(jì)方法只能分析影響卷煙品質(zhì)的相關(guān)因素,無法建立煙草化學(xué)成分與品質(zhì)之間明確數(shù)學(xué)模型[7]和評(píng)吸專家的感受存在一定的隨機(jī)性,導(dǎo)致單一的分類模型,往往存在弱學(xué)習(xí)特性[8],分類結(jié)果容易受到影響,導(dǎo)致偏差,提出一種基于改進(jìn)模糊聚類的煙草品質(zhì)集成評(píng)價(jià)方法,算法原理如圖1所示,主要分為基于模擬退火優(yōu)化的模糊聚類煙草品質(zhì)評(píng)價(jià)模型和基于 AdaBoost的集成分類優(yōu)化2部分,前者采用模擬退火算法對(duì)傳統(tǒng)的模糊聚類算法進(jìn)行優(yōu)化,對(duì)多組測(cè)試樣本中的化學(xué)成分進(jìn)行分類,得到若干個(gè)單一的煙草品質(zhì)弱評(píng)價(jià)模型;在此基礎(chǔ)上,利用 AdaBoost對(duì)多組分類模型的權(quán)重進(jìn)行迭代計(jì)算,最終組合為煙草品質(zhì)集成評(píng)價(jià)模型。

圖1 基于改進(jìn)模糊聚類的煙草品質(zhì)集成評(píng)價(jià)方法Fig.1 Tobacco quality integrated evaluation method based on improved fuzzy clustering

2 基于改進(jìn)模糊聚類的煙草品質(zhì)評(píng)價(jià)模型

煙草中主要化學(xué)成分的含量及比例是評(píng)價(jià)煙草品質(zhì)的重要依據(jù),但是由于燃燒過程中各種化學(xué)成分間存在相互作用,使煙草品質(zhì)的評(píng)價(jià)模型的建立更為困難。

聚類分析是典型的無指導(dǎo)學(xué)習(xí)算法,具有很強(qiáng)的數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)能力,聚類分析能夠按照某個(gè)特定標(biāo)準(zhǔn)對(duì)數(shù)據(jù)集進(jìn)行合理劃分[9],確定每個(gè)對(duì)象所屬的類別,從而將煙草化學(xué)成分這類復(fù)雜對(duì)象集合,分化成由相似的對(duì)象組成的多個(gè)類。

2.1模糊聚類分析

式中:uil為隸屬度,表示第l個(gè)煙葉樣品隸屬于第i個(gè)品質(zhì)等級(jí)的程度,并要滿足2個(gè)約束條件,即。引入距離),(iixxd'表示任意煙葉樣品間的差異度,),(iixxd'采用明考斯基公式[10]來表示。由于不同化學(xué)成分對(duì)煙葉品質(zhì)的影響有一定的差異,因此在明考斯基距離的基礎(chǔ)上,加入權(quán)重因子,以體現(xiàn)不同化學(xué)成分對(duì)煙葉品質(zhì)的影響程度,得到

式中:xi、xi'分別表示2個(gè)煙葉樣品品質(zhì)等級(jí);d(xi,xi')為 2個(gè)樣品品質(zhì)等級(jí)的加權(quán)明考斯基距離; xij表示第i個(gè)煙葉樣品的第j個(gè)化學(xué)成分含量的取值;ωk(k∈[1,p])表示第k個(gè)化學(xué)成分的品質(zhì)等級(jí)影響權(quán)重。

由于不同化學(xué)成分的度量單位不一致,會(huì)影響煙葉品質(zhì)聚類分析的結(jié)果,為避免這一影響,需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理[11–12]。采用 z–score標(biāo)準(zhǔn)化方法對(duì)于各化學(xué)成分含量f的度量值進(jìn)行處理,即

式中:zif為標(biāo)準(zhǔn)化處理后的煙草樣本某一等級(jí)成分取值;r1f,r2f,…,rnf分別表示N個(gè)煙葉樣本的某一化學(xué)成分的原始含量f數(shù)據(jù),mf是rif的平均值。

經(jīng)過 z–score標(biāo)準(zhǔn)化處理后,以每個(gè)煙葉樣品品質(zhì)等級(jí)到各個(gè)品質(zhì)等級(jí)中心距離之和的最小值為目標(biāo),結(jié)合式(2),得到如下目標(biāo)函數(shù)。

由此,利用模糊聚類的基本思想,煙草品質(zhì)的評(píng)價(jià)問題被轉(zhuǎn)換為式(4)所示的目標(biāo)優(yōu)化問題,即通過選取合適的分類中心cjk,使式(4)所示指標(biāo)達(dá)到最優(yōu)。

2.2基于模擬退火的分類改進(jìn)

傳統(tǒng)的模糊聚類采用K均值法,即采用最小二乘法對(duì)(4)式所示目標(biāo)函數(shù)進(jìn)行求解,尋找權(quán)重因子以及聚類中心向量。該方法一方面受到計(jì)算法的限制,難以在全局范圍類搜索最優(yōu)的分類結(jié)果;另一方面由于僅考慮了煙葉樣品的化學(xué)成分的差異性,而無法使分類中心符合評(píng)吸專家的評(píng)定結(jié)果。

模擬退火是一種基于種群并行優(yōu)化的算法,具有易實(shí)現(xiàn)、計(jì)算效率高等優(yōu)點(diǎn)[13–14],同時(shí)在陷入局部最優(yōu)問題上有所改善,因此采用模擬退火算法對(duì)于分類中心cjk進(jìn)行選取。

2.2.1實(shí)現(xiàn)步驟

第1步,對(duì)煙草樣本的化學(xué)成分含量進(jìn)行標(biāo)準(zhǔn)化處理。

第2步,建立初始族群,在充分高的初始溫度T0條件下,在PM×個(gè)煙草品質(zhì)分類中心cjk系數(shù)以及P個(gè)權(quán)重組成的解空間中,產(chǎn)生N個(gè)隨機(jī)的物質(zhì)粒子族群γ,每個(gè)族群同時(shí)隨機(jī)生成初始解狀態(tài)S1,S1,…,SN,以及迭代次數(shù) L。

第3步,評(píng)價(jià)煙草品質(zhì),根據(jù)準(zhǔn)則函數(shù)計(jì)算種群中各個(gè)物質(zhì)粒子的綜合代價(jià)J(γn)。

第4步,模型擾動(dòng),對(duì)族群中的物質(zhì)粒子按照狀態(tài)產(chǎn)生函數(shù)進(jìn)行擾動(dòng),調(diào)整N個(gè)粒子的狀態(tài)值,生成新的粒子γn。

第5步,退火過程,根據(jù)退火表對(duì)準(zhǔn)則函數(shù)進(jìn)行降火。

第6步,判定算法終止條件,判斷評(píng)價(jià)指標(biāo)J,如J小于0,認(rèn)定煙草品質(zhì)分類中心已達(dá)到最優(yōu),否則按照Metropolis準(zhǔn)則對(duì)結(jié)果進(jìn)行判斷,若滿足Metropolis準(zhǔn)則,則終止迭代,反之跳入第2步,繼續(xù)迭代。

第7步,利用迭代得到的最優(yōu)系數(shù)構(gòu)造煙草品質(zhì)分類中心,建立煙草品質(zhì)分類評(píng)價(jià)模型,完成煙草品質(zhì)分類。

2.2.2 準(zhǔn)則函數(shù)選取

在退火算法中,準(zhǔn)則函數(shù)的取值越小,表示權(quán)重和分類中心cjk的取值越優(yōu)。根據(jù)煙草品質(zhì)評(píng)價(jià)問題的特點(diǎn),準(zhǔn)則函數(shù)的選取既需要考慮煙葉樣品的化學(xué)成分的差異性,又需要考慮分類結(jié)果與評(píng)吸專家評(píng)定結(jié)果的一致性,因此采用式(5)的性能指標(biāo)。

式中:J為綜合準(zhǔn)則函數(shù),其由分類距離代價(jià)J1與分類準(zhǔn)確性代價(jià)J2加權(quán)組合而成;α和β分別為2種指標(biāo)的權(quán)重系數(shù);2J利用樣本的分類誤差來度量,其中nl表示第l個(gè)等級(jí)中,專家認(rèn)定的樣本個(gè)數(shù),ln'表示模型分類中與專家評(píng)定結(jié)果一致的樣本個(gè)數(shù)。

2.2.3溫度更新速度

模擬退火算法中,溫度更新函數(shù)用于外循環(huán)中溫度值的修改[15],是“金屬物質(zhì)”降溫方式的數(shù)學(xué)表示,它直接決定了煙草品質(zhì)評(píng)價(jià)算法的收斂速度。

2.2.4狀態(tài)產(chǎn)生函數(shù)

模擬退火算法的搜索能力決定于狀態(tài)產(chǎn)生函數(shù)的選取,應(yīng)盡可能同時(shí)保證搜索的全局性和隨機(jī)性。為了達(dá)到這一目的,引入混沌因子對(duì)物質(zhì)粒子的狀態(tài)進(jìn)行擾動(dòng)[16]。

式中:px是某一時(shí)刻準(zhǔn)備進(jìn)行迭代生成新狀態(tài)的原始物質(zhì)粒子狀態(tài);xp'是即將產(chǎn)生的新物質(zhì)粒子狀態(tài);Logistic為混沌擾動(dòng)因子。

3 基于AdaBoost的煙草品質(zhì)集成分類

專家評(píng)吸對(duì)煙草品質(zhì)評(píng)價(jià)的結(jié)果受到很多因素的影響,單一煙草樣本集的品質(zhì)評(píng)價(jià)模型,難以克服評(píng)價(jià)樣本的弱隨機(jī)性,容易出現(xiàn)誤判。AdaBoost集成分類方法,能夠?qū)⒍鄠€(gè)精度相對(duì)較低的弱分類算法進(jìn)行綜合考慮,構(gòu)造出精度較高的強(qiáng)分類算法,提升分類精度,因此將改進(jìn)模糊聚類算法與AdaBoost相結(jié)合,用于煙草品質(zhì)評(píng)價(jià)。

基于AdaBoost的模型集成分類算法[17],是利用改進(jìn)模糊聚類算法作為基分類器,通過單個(gè)基分類器的分類結(jié)果誤差為依據(jù),加權(quán)建立最終的煙草品質(zhì)評(píng)價(jià)模型[17]。首先根據(jù)改進(jìn)模糊聚類算法的分類誤差計(jì)算樣本權(quán)重;其次利用加權(quán)后的煙草樣本進(jìn)行模糊聚類分析,得到對(duì)應(yīng)的煙草品質(zhì)評(píng)價(jià)模型,同時(shí)更新該分類模型的模型權(quán)重;根據(jù)模型精度以及迭代次數(shù)檢查收斂條件。如滿足迭代結(jié)束條件,則根據(jù)模型權(quán)重和各次煙草品質(zhì)分類模型生成最終的集成煙草品質(zhì)評(píng)價(jià)模型,否則開始新一輪的迭代。

AdaBoost方法的實(shí)現(xiàn):

第1步,設(shè)m個(gè)初始學(xué)習(xí)的化學(xué)成分樣本集為{M},各個(gè)樣本集的初始權(quán)重Mddd,,,21…相同,均設(shè)置為1/M。

第2步,利用模擬退火算法優(yōu)化模糊聚類算法,分別對(duì)m個(gè)煙草訓(xùn)練樣本集進(jìn)行訓(xùn)練,獲得第t次的煙草品質(zhì)評(píng)價(jià)模型ht。

第3步,記錄本次煙草品質(zhì)評(píng)價(jià)模型ht,計(jì)算并保存第t次煙草品質(zhì)評(píng)價(jià)模型ht的權(quán)重tω,根據(jù)第2步得到的煙草品質(zhì)評(píng)價(jià)模型的分類誤差,判定收斂標(biāo)準(zhǔn),若滿足收斂條件,進(jìn)入第5步;否則進(jìn)入第4步。

第4步,根據(jù)煙草品質(zhì)評(píng)價(jià)模型對(duì)m個(gè)訓(xùn)練集分類誤差絕對(duì)值的和,計(jì)算樣本權(quán)重,計(jì)算新的樣本集,返回第2步,開始新一輪迭代。

3.1模型權(quán)重的計(jì)算

煙草品質(zhì)評(píng)價(jià)模型的權(quán)重tω的計(jì)算,直接影響最終評(píng)價(jià)模型的準(zhǔn)確性[19]。為了增加誤差較小的煙草品質(zhì)評(píng)價(jià)模型在最終模型中的權(quán)重,采用分類誤差相對(duì)值進(jìn)行權(quán)重的更新。

式中:yt(k)表示各個(gè)煙草訓(xùn)練集原始分類結(jié)果;Et表示第t次迭代計(jì)算的煙草品質(zhì)評(píng)價(jià)模型ht的錯(cuò)誤率,相對(duì)所有煙草品質(zhì)評(píng)價(jià)模型對(duì)各個(gè)煙草訓(xùn)練集的加權(quán)方差總和的比例,即相對(duì)誤差;βt為調(diào)節(jié)因子;ωt為第t次迭代得到的煙草品質(zhì)評(píng)價(jià)模型對(duì)最終預(yù)測(cè)模型的影響權(quán)重值。

3.2樣本權(quán)重的計(jì)算

在評(píng)吸過程中,品質(zhì)評(píng)價(jià)結(jié)果必然會(huì)受到評(píng)吸專家個(gè)人主觀因素的影響,存在異常評(píng)價(jià)的樣本,為了有效降低錯(cuò)誤樣本對(duì)煙草品質(zhì)評(píng)價(jià)模型的影響,提升正確樣本的貢獻(xiàn),需要對(duì)樣本權(quán)重值進(jìn)行調(diào)節(jié)。采用分類誤差絕對(duì)值作為衡量樣本權(quán)重的依據(jù),通過權(quán)重計(jì)算和歸一化2個(gè)步驟,計(jì)算樣本的權(quán)重。

式中: Et表示第t次迭代計(jì)算的煙草品質(zhì)評(píng)價(jià)模型ht的錯(cuò)誤率,相對(duì)所有煙草品質(zhì)評(píng)價(jià)模型對(duì)各個(gè)煙草訓(xùn)練集的加權(quán)方差總和的比例,即相對(duì)誤差;dt'+1(k)表示新的樣本權(quán)重值。

由于樣本權(quán)重值總和必須為 1,需要進(jìn)行歸一化處理。

4 仿真與試驗(yàn)

為了驗(yàn)證方法的有效性,采用真實(shí)的煙草樣本數(shù)據(jù)對(duì)基于模擬退火的改進(jìn)模糊聚類算法和基于AdaBoost集成分類算法進(jìn)行仿真試驗(yàn)。

煙草樣本為來自于山東、山西、云南、四川、陜西、廣西、貴州和江西8省的130組煙葉,測(cè)定了各煙葉樣品中總糖、還原糖、總氮、煙堿、氧化鉀、氯離子、蛋白質(zhì)7種化學(xué)成分含量,與多位評(píng)吸專家給出的品質(zhì)評(píng)定結(jié)果組成試驗(yàn)樣本集。隨機(jī)抽取其中的 3 0組樣本作為驗(yàn)證樣本,其余的 1 00組作為學(xué)習(xí)樣本。

4.1改進(jìn)模糊聚類算法的仿真

采用MATLAB仿真軟件,對(duì)基于模糊聚類的煙葉品質(zhì)評(píng)價(jià)方法進(jìn)行仿真;同時(shí)采用模擬退火方法對(duì)模糊聚類的分類中心進(jìn)行優(yōu)化。模擬退火的冷卻參數(shù)α=0.9,初始溫度T0=1 000,群體規(guī)模N=20,其中分類中心 cjk和權(quán)重采用實(shí)數(shù)編碼,分別占 16位。最大迭代次數(shù)為8。

為了說明改進(jìn)效果,將改進(jìn)模糊聚類算法和單純的模糊聚類算法,對(duì)相同煙葉樣本進(jìn)行分類分析,得到的不同樣本數(shù)量條件下,驗(yàn)證樣本品質(zhì)分類精度如圖2所示。不難看出,基于模擬退火優(yōu)化的模糊聚類方法的分類精度具有明顯優(yōu)勢(shì),隨著樣本數(shù)量的不斷增加,模擬退火–模糊聚類對(duì)煙葉樣本的分類精度不斷提高,當(dāng)樣本數(shù)大于 6 5后,模糊聚類–模擬退火算法的平均分類誤差在 15%以內(nèi),優(yōu)于傳統(tǒng)的模糊聚類算法的分類結(jié)果。

圖2 分類誤差對(duì)比曲線Fig.2 Classification error contrast curve

4.2基于AdaBoost的集成分類仿真

以改進(jìn)模糊聚類算法為基分類器,利用MATLAB,按照AdaBoost方法進(jìn)行集成分類。經(jīng)過多次試驗(yàn)發(fā)現(xiàn),AdaBoost算法的迭代次數(shù)以及單次訓(xùn)練的樣本數(shù)量是決定分類精度的關(guān)鍵因素。

若單次分類參與的樣本數(shù)較少,為了涵蓋所有樣本,必然要求 AdaBoost迭代次數(shù)增加,迭代次數(shù)增加能夠提升算法的精度,但由于單次樣本數(shù)量較少,其分類的精度可能仍然不高;反之,若單次分類選用的樣本數(shù)較多,算法的運(yùn)算量呈指數(shù)級(jí)增加,各次訓(xùn)練的差異將不明顯。集成分類仿真結(jié)果表明,AdaBoost算法的迭代次數(shù)為11次,單次訓(xùn)練的樣本數(shù)為12時(shí),分類精度較高。

表1是專家對(duì)于30組驗(yàn)證樣本所作出的煙草品質(zhì)評(píng)定結(jié)果。表2是采用算法所得到的品質(zhì)評(píng)價(jià)結(jié)果。對(duì)比表1和表2,可以看到,利用所建立算法得到的結(jié)果與專家評(píng)定結(jié)果差異較小,準(zhǔn)確性較高。

表1 30組驗(yàn)證樣本的專家評(píng)吸結(jié)果Table 1 The results of expert evaluation for 30 groups of validation samples

表2 30組驗(yàn)證樣本的改進(jìn)模糊聚類算法的評(píng)級(jí)結(jié)果Table 2 The experimental results of the 30 sets of validation samples by the improved fuzzy clustering algorithm

為了進(jìn)一步說明所采用算法的優(yōu)勢(shì)和有效性,采用SVM、神經(jīng)網(wǎng)絡(luò)、模糊聚類對(duì)100組煙葉樣本集進(jìn)行學(xué)習(xí),建立評(píng)價(jià)模型,利用評(píng)價(jià)模型對(duì)驗(yàn)證樣本進(jìn)行分析,30組驗(yàn)證樣本的評(píng)級(jí)結(jié)果列于表3。

表3 煙草品質(zhì)評(píng)價(jià)對(duì)比Table 3 Comparison results for tobacco quality evaluation

改進(jìn)的模糊聚類算法的評(píng)級(jí)結(jié)果與專家評(píng)吸結(jié)果基本一致,誤檢率為6.7%,因此在檢測(cè)的準(zhǔn)確性方面優(yōu)于其他2種算法。這主要是由于將模擬退火算法與模糊聚類算法相結(jié)合,提升了小樣本數(shù)據(jù)的辨識(shí)能力,同時(shí)利用 AdaBoost方法,降低了評(píng)吸專家對(duì)煙草品質(zhì)評(píng)定過程的主觀性對(duì)分析結(jié)果的影響,因此在樣本相同時(shí),檢測(cè)的誤檢率遠(yuǎn)小于其他2種缺陷辨識(shí)算法。

[1] 曹建敏,劉帥帥,邱軍.烤煙重要致香物質(zhì)與評(píng)吸質(zhì)量的相關(guān)性研究[J].中國煙草科學(xué),2012,12(6):65–68.

[2] 李強(qiáng),周冀衡,楊榮生.基于主成分回歸的曲靖 C3F等級(jí)烤煙評(píng)吸質(zhì)量估算模型[J].中國煙草學(xué)報(bào),2011,24(1):42–45.

[3] 于建軍,閆鼎,葉賢文.重慶地區(qū)烤煙主要化學(xué)成分與評(píng)吸質(zhì)量分析[J].浙江農(nóng)業(yè)學(xué)報(bào),2010,32(10):22–25.

[4] 徐小華,胡曉飛,全曉松,等.支持向量機(jī)對(duì)煙草化學(xué)成分協(xié)調(diào)性的分類應(yīng)用[J].江蘇農(nóng)業(yè)科學(xué),2014,42(7):431–432.

[5] 陳清,劉巍,鐘科軍.基于煙草中致香成分的人工神經(jīng)網(wǎng)絡(luò)分類模型[J].湖南大學(xué)學(xué)報(bào)(自然科學(xué)版),2009,23(2):56–64.

[6] 殷勇.煙草成分對(duì)其香級(jí)影響程度的粗糙集判別方法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2010,16(5):36–42.

[7] 李恒,羅華元,王玉,等.烤煙致香成分與評(píng)吸質(zhì)量的相關(guān)性分析[J].昆明學(xué)院學(xué)報(bào),2008,30(4):37–40.

[8] 湯朝起,劉穎,束茹欣.應(yīng)用在線近紅外光譜分析復(fù)烤前后原煙及片煙的質(zhì)量特性[J].光譜學(xué)與光譜分析,2014,24(12):45–48.

[9] Zhao Feng,Jiao Licheng,Liu Hanqiang.Kernel generalized fuzzy C–means clustering with spatial information for image segmentation[J].Digital Signal Processing,2013,16(1):63–67.

[10] Zeng Shan,Tong Xiaojun,Sang Nong.Study on multicenter fuzzy C–means algorithm based on transitive closure and spectral clustering[J].Applied Soft Computing Journal,2014,18(5):25–31.

[11] Benaichouche A N H,Siarry Oulhadj P.Improved spatial fuzzy C–means clustering for image segmentation using PSO initialization,Mahalanobis distance and postsegmentation correction[J].Digital Signal Processing,2013,18(5):33–36.

[12] Zhao Xinchao.Simulated annealing algorithm with adaptive neighborhood[J].Applied Soft Computing Journal,2010,26(2):56–62.

[13] Leung Stephen C H,Zhang Defu,Zhou Changle,et al. A hybrid simulated annealing metaheuristic algorithm for the two-dimensional knapsack packing problem[J].Computers and Operations Research,2010, 26(1):42–45.

[14] 葛洪偉,王銀年.求解VRPSDP問題的改進(jìn)模擬退火遺傳算法[J].計(jì)算機(jī)工程與應(yīng)用,2010,32(30):48–52.

[15] 袁泉.Adaboost組合分類模型在信用評(píng)估領(lǐng)域應(yīng)用研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2011.

[16] 付忠良,趙向輝,苗青,等.AdaBoost算法的推廣——一組集成學(xué)習(xí)算法[J].四川大學(xué)學(xué)報(bào)(工程科學(xué)版),2010,16(6):36–39.

[17] 陳春萍.基于SVM與AdaBoost組合的分類算法研究[D].西安:西安電子科技大學(xué),2012.

責(zé)任編輯:羅慧敏

英文編輯:羅 維

An improved fuzzy clustering-based ensemble evaluation model for tobacco quality

Yin Mei1, Zhou Guoxiong2
(1.Department of Information Engeering, Hunan Vocational College of Engineering, Changsha 410151, China; 2.School of Computer and Information Engineering, Central South University of Forestry & Technology, Changsha 410004, China)

To solve the difficulty in establishing the mathematical model of the cigarette chemical composition and tobacco quality, an improved fuzzy clustering-based ensemble evaluation model for tobacco quality is proposed. The method first determined the differences in chemical components among tobacco samples, and to obtain consistency results between model classification and expert evaluation results, simulated annealing algorithm was used to optimize the existing fuzzy clustering algorithm, and base classifier was established. On this basis, multiple classification results for different sample sets by the classifiers were integrated using the AdaBoost, and the final tobacco quality evaluation models was formed. The contents of 7 kinds of chemical composition including total sugar, reducing sugar, total nitrogen, nicotine, potassium ion, chlorine ion and protein in 130 group of tobacco leaf were determined, contrast experiment is done by the improved fuzzy clustering method, neural network algorithm and fuzzy clustering algorithm, the results showed that the error detection rate of the improved fuzzy clustering method is 6.7%, indicating the improved method has the ability to recognize small sample data, and is superior to the other compared methods.

fuzzy clustering; simulated annealing; expert evaluation; tobacco quality evaluation

尹梅(1983—),女,廣西桂林人,碩士,講師,主要從事電子信息工程技術(shù)及自動(dòng)控制研究,21298544@qq.com

TP273+.21

A

1007-1032(2016)04-0359-06

2015–06–15 修回日期:2016–05–08

國家自然科學(xué)基金項(xiàng)目(60975049)

猜你喜歡
模擬退火煙草聚類
結(jié)合模擬退火和多分配策略的密度峰值聚類算法
基于改進(jìn)模擬退火的布爾函數(shù)生成算法
CORESTA 2019年SSPT聯(lián)席會(huì)議關(guān)注新煙草、吸煙行為研究和雪茄煙
基于K-means聚類的車-地?zé)o線通信場(chǎng)強(qiáng)研究
改進(jìn)模擬退火算法在TSP中的應(yīng)用
基于高斯混合聚類的陣列干涉SAR三維成像
煙草依賴的診斷標(biāo)準(zhǔn)
基于模擬退火剩余矩形算法的矩形件排樣
基于Spark平臺(tái)的K-means聚類算法改進(jìn)及并行化實(shí)現(xiàn)
基于改進(jìn)的遺傳算法的模糊聚類算法