国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于輕型卷積神經(jīng)網(wǎng)絡(luò)的舌苔顏色分類方法

2019-09-20 05:41:38
測(cè)控技術(shù) 2019年3期
關(guān)鍵詞:舌象舌苔準(zhǔn)確率

(北京工業(yè)大學(xué) 信號(hào)與信息處理研究室,北京 100124)

中醫(yī)舌診是中醫(yī)學(xué)中望診的重要組成部分,指通過(guò)觀察舌象的變化,了解人體生理功能和病理變化。舌苔顏色作為舌象最基本的特征之一,其顏色變化可反映臟腑的寒、熱、虛、實(shí)、病邪的性質(zhì)和病位的深淺[1]。從人眼視覺(jué)的角度,舌苔顏色一般有白苔、黃苔和灰黑苔三類,然而,在中醫(yī)臨床舌診中,這種苔色分類方法對(duì)于中醫(yī)辨證論治的指導(dǎo)意義并不明顯,中醫(yī)大夫常常將舌苔的厚度與舌苔的顏色相結(jié)合,通過(guò)觀測(cè)舌苔顏色和厚度的變化,得出身體真實(shí)的病理情況。因此,根據(jù)中醫(yī)專家對(duì)舌苔顏色的劃分,舌苔顏色主要分為薄白苔、白厚苔、薄黃苔、黃厚苔和灰黑苔5類。在實(shí)際舌診中,舌象特征的診斷通常取決于醫(yī)生的主觀判斷,不同的光源和亮度等外界因素會(huì)對(duì)醫(yī)生產(chǎn)生干擾,不可避免地影響了舌診的可靠性和可重復(fù)性。因此,利用計(jì)算機(jī)對(duì)舌苔顏色進(jìn)行精準(zhǔn)化分析,對(duì)促進(jìn)中醫(yī)舌診客觀化研究具有重要的實(shí)際意義[2]。

在利用計(jì)算機(jī)對(duì)舌象特征進(jìn)行分析時(shí),常常結(jié)合中醫(yī)醫(yī)師的先驗(yàn)知識(shí),提取舌圖像的語(yǔ)義特征,從舌圖像中得到與機(jī)體的生理功能和病理變化相關(guān)的舌象特征[2-3]。舌苔顏色作為舌象最基本的特征之一,其分類的準(zhǔn)確程度決定了后續(xù)舌象自動(dòng)分析的有效性,因此對(duì)舌苔顏色進(jìn)行分類研究,對(duì)促進(jìn)中醫(yī)舌診客觀化研究具有重要的實(shí)際意義。

1 相關(guān)工作

以計(jì)算機(jī)圖像分析技術(shù)為主要手段進(jìn)行舌象特征自動(dòng)分析,是20世紀(jì)80年代發(fā)展起來(lái)的一種舌診客觀化研究方法,此后,香港理工大學(xué)[4]、臺(tái)灣蓬甲大學(xué)[5]和北京工業(yè)大學(xué)[6]等各大機(jī)構(gòu)紛紛開(kāi)展相關(guān)工作,在舌象顏色校正、舌象分割和舌象特征分析等方面取得了一定的研究成果。筆者所在的北京工業(yè)大學(xué)信號(hào)與信息處理研究室早在20世紀(jì)90年代末期,就在國(guó)內(nèi)率先開(kāi)展了中醫(yī)舌象數(shù)字化、客觀化和定量化的研究工作,在中醫(yī)舌面象信息的數(shù)字化采集與自動(dòng)分析方面取得了豐厚的研究積累[2-3,6-11]。

目前,關(guān)于中醫(yī)舌苔顏色的研究工作有很多,總的來(lái)說(shuō),這些工作的基本思路是將中醫(yī)舌苔顏色的自動(dòng)分析看作是分類問(wèn)題,在分類時(shí),通過(guò)提取舌苔的顏色特征和紋理特征等手工特征,然后通過(guò)“特征+分類器”或“特征+相似性度量”的分類模式進(jìn)行舌苔顏色分析。其中較為常用的舌苔顏色分析方法有:基于支撐向量機(jī)(Support Vector Machine,SVM)的分析方法[8-9]、基于人工神經(jīng)網(wǎng)絡(luò)的分析方法[10]和基于稀疏表示分類器的分析方法[11]等。文獻(xiàn)[8]提出了一種基于聚類樹(shù)算法的舌苔顏色分類方法,對(duì)舌苔顏色和厚度進(jìn)行了定量化描述。文獻(xiàn)[9]將Universum SVM應(yīng)用于舌象樣本的分類中,在舌苔顏色分類中取得了84.44%的分類準(zhǔn)確率。文獻(xiàn)[10]采用學(xué)習(xí)矢量量化神經(jīng)網(wǎng)絡(luò)分類器進(jìn)行舌苔顏色自動(dòng)分析,能夠獲得85%的識(shí)別效果。文獻(xiàn)[11]采用稀疏表示分類器的中醫(yī)舌苔顏色自動(dòng)分析方法,通過(guò)重建最小殘差的方式實(shí)現(xiàn)舌苔顏色分類,識(shí)別準(zhǔn)確率達(dá)到90.51%。在這些分析方法中,SVM與ANNs是兩個(gè)常用的分類器,SVM比較適合解決小樣本、非線性等模式識(shí)別問(wèn)題[12],但其最終性能依賴于核函數(shù)的選擇,需要投入大量的理論分析工作。而人工神經(jīng)網(wǎng)絡(luò)特有的非線性適應(yīng)性信息處理能力,能夠較好地適用于苔色分析方面,具有較強(qiáng)的泛化能力,但其訓(xùn)練易陷入局部最小值。稀疏表示分類器雖然對(duì)數(shù)據(jù)的缺損并不敏感,但字典的質(zhì)量對(duì)稀疏編碼的性能具有非常重要的影響。

雖然基于傳統(tǒng)手工特征的舌苔顏色分析方法已經(jīng)取得了一定的研究成果,但是總的來(lái)說(shuō),以手工特征建立的分析模型對(duì)光照比較敏感,分析性能的好壞常常依賴于手工特征的選擇。若光照條件發(fā)生變化,以手工特征建立的分析模型將失去作用,使得這些研究成果的識(shí)別性能尚不能達(dá)到中醫(yī)舌診實(shí)際應(yīng)用的要求,所以需要引入新的信息處理技術(shù)來(lái)解決這些問(wèn)題。

近幾年來(lái),深度學(xué)習(xí)在圖像分類等計(jì)算機(jī)領(lǐng)域取得了巨大成功[13-14]。其中,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)憑借其強(qiáng)大的特征學(xué)習(xí)與表達(dá)能力被廣泛應(yīng)用于圖像分類。雖然目前CNN網(wǎng)絡(luò)模型多種多樣,但其網(wǎng)絡(luò)結(jié)構(gòu)主要由卷積層、池化層和全連接層3種類型的層級(jí)成,如圖1所示。CNN通過(guò)交替進(jìn)行卷積、池化等操作,逐層提取特征,底層學(xué)習(xí)到局部特征,高層學(xué)習(xí)到全局特征,隨著網(wǎng)絡(luò)層數(shù)的增加,學(xué)習(xí)到的特征越來(lái)越抽象,特征經(jīng)全連接層與分類器相連,輸出分類類別。

圖1 CNN分類網(wǎng)絡(luò)模型結(jié)構(gòu)

卷積神經(jīng)網(wǎng)絡(luò)的出現(xiàn),為更智能化的舌象特征分析提供了可能。利用卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練出來(lái)的分類模型,具有更高的泛化能力,能更好地適應(yīng)復(fù)雜多樣的數(shù)據(jù)情況。目前已有研究將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于舌象特征分析中,文獻(xiàn)[15]利用PCANet提取深度特征,在正常舌和異常舌的二分類問(wèn)題上取得91.14%的效果,但尚未對(duì)舌象特征進(jìn)行后續(xù)分析。最近,筆者所在研究室也將深度學(xué)習(xí)的理論知識(shí)引用到舌象特征分析中,采用一層卷積加3層全連接的神經(jīng)網(wǎng)絡(luò)架構(gòu),對(duì)舌苔顏色進(jìn)行分類研究,相比于傳統(tǒng)方法,分類性能平均提升4.48%,但采用的網(wǎng)絡(luò)結(jié)構(gòu)相對(duì)簡(jiǎn)單,分類性能尚有待提高[16]。

舌圖像雖是在自然條件下拍攝得到,但其與普通自然圖像相比卻具有顯著不同。首先,舌圖像的獲取條件較為苛刻,通常要求在具有良好外界條件下拍攝,這樣才能避免引入過(guò)多的外界干擾;其次,樣本的標(biāo)注需要依賴權(quán)威醫(yī)生的標(biāo)注,經(jīng)驗(yàn)不足的醫(yī)生或非專業(yè)人士標(biāo)注的數(shù)據(jù)往往會(huì)導(dǎo)致雜亂的注釋,引起歧義,同時(shí)舌圖像的獲取代價(jià)較為昂貴,造成實(shí)際可以用來(lái)實(shí)驗(yàn)的樣本數(shù)量較少;最后,采集的樣本來(lái)源以健康或亞健康人群居多,而常見(jiàn)病比例不均衡,造成采集到的樣本類別之間存在樣本數(shù)量不均衡的狀況,以此數(shù)據(jù)建立的分類模型在對(duì)舌象特征進(jìn)行識(shí)別時(shí)容易產(chǎn)生小樣本偏向大樣本類別的情況。盡管將深度學(xué)習(xí)的理論應(yīng)用于苔色分析中已取得初步發(fā)展,但是樣本數(shù)量有限以及類別不平衡的客觀因素仍是制約客觀化研究的重要因素。因此,本文針對(duì)舌苔樣本數(shù)量有限且類別不平衡的特點(diǎn),對(duì)舌象樣本中不平衡的舌苔顏色類別進(jìn)行數(shù)據(jù)擴(kuò)充處理,然后通過(guò)設(shè)計(jì)輕型卷積神經(jīng)網(wǎng)絡(luò),將特征提取和分類結(jié)合到一個(gè)框架中,通過(guò)數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)圖像與其屬性的映射關(guān)系,實(shí)現(xiàn)舌苔顏色的精確分類。

2 基于輕型CNN網(wǎng)絡(luò)的舌苔顏色分類方法

本文提出的基于輕型CNN網(wǎng)絡(luò)的舌苔顏色分類方法的基本思想是:首先,對(duì)已標(biāo)注的舌苔訓(xùn)練樣本通過(guò)幾何變換等數(shù)據(jù)擴(kuò)充方式平衡數(shù)據(jù)集;然后,設(shè)計(jì)輕型卷積神經(jīng)網(wǎng)絡(luò),將特征提取和分類納入到一個(gè)框架結(jié)構(gòu)中,利用平衡后的數(shù)據(jù)集進(jìn)行網(wǎng)絡(luò)模型訓(xùn)練,通過(guò)設(shè)置網(wǎng)絡(luò)參數(shù)和迭代次數(shù),選擇具有最優(yōu)分類性能的模型作為最終的舌苔顏色分類模型;最后,利用訓(xùn)練好的舌苔顏色分類模型對(duì)預(yù)測(cè)舌圖像進(jìn)行識(shí)別,通過(guò)提取圖像中的舌苔圖像塊進(jìn)行識(shí)別,得出苔色分類結(jié)果。該方法的整體框圖如圖2所示。

圖2 基于輕型CNN模型的舌苔顏色分類整體框圖

2.1 舌苔顏色樣本的不平衡處理

如前所述,由于實(shí)際采集到的舌苔顏色多以薄白苔為主,其他顏色相對(duì)來(lái)說(shuō)數(shù)量較少,特別是灰黑苔樣本很少見(jiàn),所以舌苔顏色數(shù)據(jù)集各類別數(shù)量之間存在不平衡狀況。因此在訓(xùn)練舌苔顏色分類模型之前需要進(jìn)行平衡數(shù)據(jù)集操作,通過(guò)數(shù)據(jù)擴(kuò)充手段,如鏡像、翻轉(zhuǎn)、平移和尺寸變換等,對(duì)舌苔數(shù)據(jù)集進(jìn)行平衡處理。

根據(jù)中醫(yī)理論,中醫(yī)專家往往將舌苔顏色分為5類:薄白苔、白厚苔、薄黃苔、黃厚苔和灰黑苔。為了使訓(xùn)練樣本盡可能標(biāo)準(zhǔn)且典型,實(shí)驗(yàn)中所使用的訓(xùn)練樣本為若干由中醫(yī)專家逐塊確定類別的一系列圖像子塊,圖像子塊的大小必須兼顧統(tǒng)計(jì)特性和精確度。由于舌苔是舌質(zhì)上附著的苔狀物,透過(guò)舌苔能隱隱見(jiàn)到舌質(zhì)的為薄苔,不能見(jiàn)到舌質(zhì)的為厚苔[1],因此圖像子塊的選擇必須有效區(qū)分薄苔和厚苔,以確保實(shí)驗(yàn)結(jié)果的精確度。舌苔實(shí)驗(yàn)樣本塊的示例如表1所示。

表1 舌苔顏色訓(xùn)練樣本塊示例

實(shí)驗(yàn)樣本集共1158例,實(shí)驗(yàn)樣本按照4∶1的比例隨機(jī)劃分為訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù),其中訓(xùn)練數(shù)據(jù)用于網(wǎng)絡(luò)模型訓(xùn)練,測(cè)試數(shù)據(jù)用于計(jì)算最終的模型分類精確度。在分類模型訓(xùn)練之前需要平衡樣本以保證訓(xùn)練不會(huì)偏向較大樣本類別。因此,對(duì)訓(xùn)練數(shù)據(jù)采用鏡像、旋轉(zhuǎn)方式進(jìn)行了數(shù)據(jù)平衡,測(cè)試數(shù)據(jù)保持不變,平衡前與平衡后的樣本分布如表2所示。

表2 平衡前與平衡后的各類樣本分布 單位:例

平衡策略可如下表示。

① 保持最大類的樣本數(shù)目不變,在本實(shí)驗(yàn)中薄白苔樣本有404例,為數(shù)量最大類別,因此其數(shù)量保持不變。

② 根據(jù)少數(shù)類與最大類的數(shù)量之間的差異,對(duì)少數(shù)類進(jìn)行樣本擴(kuò)充,擴(kuò)充方式首先選擇鏡像操作,如果擴(kuò)充后樣本類別差別很大,則再選擇旋轉(zhuǎn)操作,直到樣本類別數(shù)目不大。例如表2中灰黑苔具有75例,首先進(jìn)行鏡像操作擴(kuò)充數(shù)據(jù)一倍變?yōu)?50例,由于鏡像操作后樣本數(shù)量和最大類數(shù)量相差很多,所以再進(jìn)行旋轉(zhuǎn)操作,分別旋轉(zhuǎn)90°、180°和270°,共擴(kuò)充3倍。其中,旋轉(zhuǎn)的角度可以根據(jù)實(shí)際樣本的數(shù)量進(jìn)行選擇,即在對(duì)原始樣本進(jìn)行旋轉(zhuǎn)操作時(shí),根據(jù)需要擴(kuò)充的樣本數(shù)目,選擇擴(kuò)充1倍或多倍,旋轉(zhuǎn)角度選擇90°或其他度數(shù)的組合。

③ 將擴(kuò)充的樣本與原有樣本一起作為數(shù)據(jù)集,并保證每類樣本的最終數(shù)量相同或相差不大。

2.2 舌苔顏色分類模型

在大規(guī)模數(shù)據(jù)支持的基礎(chǔ)上,CNN 可以實(shí)現(xiàn)較高的識(shí)別準(zhǔn)確率。但是在一些應(yīng)用中,數(shù)據(jù)很難收集,標(biāo)定過(guò)程費(fèi)時(shí)費(fèi)力,訓(xùn)練樣本數(shù)據(jù)的不足將導(dǎo)致過(guò)擬合的發(fā)生,產(chǎn)生較低的識(shí)別準(zhǔn)確率。在本文中,選擇AlexNet[17]作為基礎(chǔ)網(wǎng)絡(luò),這是因?yàn)锳lexNet相比于其他網(wǎng)絡(luò)模型,如VggNet[18]、GoogleNet[19]和ResNet[20]等,具有較淺的網(wǎng)絡(luò)結(jié)構(gòu),在小樣本下不容易出現(xiàn)過(guò)擬合的問(wèn)題。對(duì)于舌苔顏色分類問(wèn)題來(lái)說(shuō),因?yàn)闃颖緮?shù)量的限制,選取的深度學(xué)習(xí)網(wǎng)絡(luò)模型層次不宜過(guò)深。因此,對(duì)AlexNet網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行修改,通過(guò)減少網(wǎng)絡(luò)參數(shù)來(lái)設(shè)計(jì)輕型網(wǎng)絡(luò)結(jié)構(gòu)的舌苔顏色分類模型,以此來(lái)克服過(guò)擬合現(xiàn)象,提高識(shí)別準(zhǔn)確率和模型的魯棒性。

對(duì)網(wǎng)絡(luò)結(jié)構(gòu)的修改如圖3所示,首先為了減少網(wǎng)絡(luò)參數(shù)以避免過(guò)擬合,摒棄了11×11或7×7大小的卷積核,網(wǎng)絡(luò)結(jié)構(gòu)中的卷積核大小皆為5×5或3×3,并減少了全連接層的輸出數(shù)目,將第一個(gè)全連接層原始輸出數(shù)目從4096減少到1024,將第二個(gè)全連接層的原始輸出數(shù)目從1024減少到512;然后為了提高網(wǎng)絡(luò)的泛化能力,保留了原網(wǎng)絡(luò)中的LRN層與Dropout層;同時(shí)為了減少特征圖尺寸和參數(shù)數(shù)目,在每次卷積操作結(jié)束后均進(jìn)行池化操作,池化操作可以從一個(gè)區(qū)域中通過(guò)某種方式得出一個(gè)值作為特征,從而降低卷積層輸出的特征圖的維度,同時(shí)非常有效地縮小參數(shù)矩陣的尺寸,從而減少最后全連層中的參數(shù)數(shù)量。

圖3 舌苔顏色分類模型架構(gòu)

網(wǎng)絡(luò)采用以下幾種網(wǎng)絡(luò)優(yōu)化策略和訓(xùn)練技巧,以提高網(wǎng)絡(luò)模型分類性能。

2.2.1 修正線性單元

修正線性單元(Rectified Linear Unit,ReLU)函數(shù)是目前在網(wǎng)絡(luò)結(jié)構(gòu)中應(yīng)用較為廣泛的一種激活函數(shù),常用于卷積操作之后和池化操作之前,可以使網(wǎng)絡(luò)具有非線性,增加網(wǎng)絡(luò)對(duì)于復(fù)雜函數(shù)的擬合能力,對(duì)于輸入x,其輸出F(x)的數(shù)學(xué)形式為

F(x)=max(0,x)

(1)

傳統(tǒng)的激活函數(shù)sigmoid或者tanh函數(shù)都是飽和非線性函數(shù),即函數(shù)值達(dá)到一定程度之后,變化會(huì)非常小,幾乎為零,容易出現(xiàn)梯度消失問(wèn)題。ReLU激活函數(shù)能夠保留結(jié)果中的正數(shù),不僅可以解決梯度消失問(wèn)題,還可以加快收斂。

2.2.2 局部響應(yīng)歸一化層

(2)

式中,(x,y)為卷積操作的位置;N為該層中的核總數(shù);i為第i個(gè)卷積核;k,n,α和β都是超參數(shù),在網(wǎng)絡(luò)中需要根據(jù)實(shí)際情況進(jìn)行賦值。

2.2.3 Dropout策略

Dropout是一種重要的防止模型過(guò)擬合方法,指在模型訓(xùn)練時(shí)隨機(jī)讓網(wǎng)絡(luò)某些隱含層節(jié)點(diǎn)的權(quán)重不工作,不工作的那些節(jié)點(diǎn)可以暫時(shí)認(rèn)為不是網(wǎng)絡(luò)結(jié)構(gòu)的一部分,但是它的權(quán)重被保留下來(lái),在下次樣本輸入時(shí)它可能又得以工作。Dropout過(guò)程就是一個(gè)非常有效的結(jié)合多模型決策的方法,通過(guò)訓(xùn)練大量的不同的網(wǎng)絡(luò),來(lái)平均預(yù)測(cè)概率。不同的模型在不同的訓(xùn)練集上訓(xùn)練,其中每個(gè)批次的訓(xùn)練數(shù)據(jù)都是隨機(jī)選擇,最后每個(gè)模型用相同的權(quán)重來(lái)“融合”,以此來(lái)使網(wǎng)絡(luò)學(xué)習(xí)到更加魯棒的特征,提高模型的泛化能力。

2.3 舌苔顏色分類

在分類器選擇方面,選擇Softmax分類器作為模型的最終分類器,通過(guò)計(jì)算當(dāng)前樣本屬于每一類別的概率,選擇具有最高概率的那一類作為當(dāng)前樣本的類別。Softmax回歸模型是Logistic回歸模型在多分類問(wèn)題上的擴(kuò)展。相比訓(xùn)練多個(gè)Logistic回歸來(lái)做多分類問(wèn)題,Softmax回歸更適合類別間是互斥的情況。設(shè)m個(gè)訓(xùn)練集樣本為{(x(1),y(1)),…,(x(m),y(m))},向量x(i)的維度為n+1,類標(biāo)y可以取c個(gè)不同的值,則回歸模型的代價(jià)函數(shù)J(θ)為

(3)

3 實(shí)驗(yàn)結(jié)果與分析

所使用的舌象樣本是在首都醫(yī)科大學(xué)宣武醫(yī)院中醫(yī)科采集得到,共采集了249張,并按照苔色分布情況由中醫(yī)專家選取標(biāo)準(zhǔn)塊,共獲得1158例實(shí)驗(yàn)樣本。在經(jīng)過(guò)樣本平衡處理后,共得到2257例實(shí)驗(yàn)樣本。本實(shí)驗(yàn)提出的網(wǎng)絡(luò)架構(gòu)使用Tensorflow架構(gòu)進(jìn)行實(shí)現(xiàn)。系統(tǒng)配置為Intel?CoreTMi7-6700 CPU 3.40 GHz,16 GB內(nèi)存,TITAN X Pascal顯卡。具體實(shí)驗(yàn)中,首先對(duì)所提出的網(wǎng)絡(luò)模型的識(shí)別性能進(jìn)行測(cè)試;然后對(duì)樣本平衡前與平衡后的網(wǎng)絡(luò)模型準(zhǔn)確率進(jìn)行對(duì)比分析;最后通過(guò)不同模型分類準(zhǔn)確性之間進(jìn)行對(duì)比,驗(yàn)證網(wǎng)絡(luò)模型的有效性。

3.1 模型分類結(jié)果

基于上述的舌苔樣本庫(kù),進(jìn)行舌苔顏色分類模型訓(xùn)練。分類模型訓(xùn)練采用Adam梯度下降算法,其相比于SGD隨機(jī)下降算法具有更好的收斂速度。網(wǎng)絡(luò)輸入統(tǒng)一歸一化為100像素×100像素大小,訓(xùn)練參數(shù)設(shè)置如表3所示。

表3 網(wǎng)絡(luò)訓(xùn)練參數(shù)設(shè)置

在實(shí)際模型訓(xùn)練中將訓(xùn)練數(shù)據(jù)集全部訓(xùn)練一遍稱為一個(gè)epoch,在實(shí)際模型訓(xùn)練中,訓(xùn)練樣本共進(jìn)行了1000個(gè)epoch的訓(xùn)練,每100個(gè)epoch保存一個(gè)模型,并用訓(xùn)練模型在測(cè)試集上進(jìn)行了分類性能測(cè)試,如果分類器對(duì)測(cè)試樣本的分類結(jié)果與舌象樣本標(biāo)注相同,則認(rèn)為分類正確,否則則認(rèn)為分類結(jié)果錯(cuò)誤。不同epoch下的分類準(zhǔn)確性如圖4所示。

圖4 不同epoch下的分類準(zhǔn)確率

從圖4中可以看出,不同epoch下的分類準(zhǔn)確率存在一定的差異,在實(shí)際模型選擇時(shí),應(yīng)設(shè)定適當(dāng)?shù)牡螖?shù)來(lái)獲得最優(yōu)的識(shí)別準(zhǔn)確率。因此,選擇在epoch為900時(shí)訓(xùn)練出的模型作為苔色分類的最終模型,此模型在測(cè)試數(shù)據(jù)集下能取得約94.85%的分類準(zhǔn)確率,所得到苔色分類結(jié)果的混淆矩陣如表4所示。

表4中,矩陣中對(duì)角線上的數(shù)值為每類分類正確的樣本數(shù)量,其他為誤分類的樣本數(shù)量。如混淆矩陣的第一行中被正確分類的薄白苔有98例,有2例被誤分為白厚苔,有1例被誤分為薄黃苔。

表4 舌苔顏色分類的混淆矩陣

除此之外,在同一模型上對(duì)數(shù)據(jù)不進(jìn)行平衡處理和進(jìn)行平衡處理兩種情況下訓(xùn)練的模型準(zhǔn)確率進(jìn)行了比較,實(shí)驗(yàn)結(jié)果如圖5所示。

圖5 樣本平衡前與平衡后的分類準(zhǔn)確率對(duì)比

從圖5中可以看出,未進(jìn)行數(shù)據(jù)平衡處理的數(shù)據(jù)集訓(xùn)練的分類模型各類別的分類準(zhǔn)確率之間相差較大,且在多數(shù)類上的分類準(zhǔn)確率明顯高于少數(shù)類;但在經(jīng)數(shù)據(jù)平衡處理的數(shù)據(jù)集訓(xùn)練的分類模型上的各類別的分類準(zhǔn)確率之間相差較小。如在未進(jìn)行樣本平衡之前,薄白苔樣本因?yàn)閿?shù)量最多,其分類準(zhǔn)確率達(dá)到99.01%,但在薄黃苔、白厚苔類別上的分類準(zhǔn)確率則比較低,分別為78.38%、84.62%,而樣本經(jīng)過(guò)平衡處理后,雖然薄白苔的準(zhǔn)確率下降到96.04%,但在薄黃苔、黃厚苔類別上的分類準(zhǔn)確率則分別提高到94.59%、92.31%。因此樣本平衡后與樣本平衡前的分類結(jié)果相比,雖然由于樣本擴(kuò)充改變了數(shù)據(jù)的分布,使得樣本各類的訓(xùn)練更加均衡,在多數(shù)類上的分類準(zhǔn)確率有所下降,但在少數(shù)類上的分類準(zhǔn)確率得到提升,且整體平均準(zhǔn)確率由93.13%提高到94.85%。

3.2 不同卷積神經(jīng)網(wǎng)絡(luò)分類結(jié)果

為了驗(yàn)證所采用的網(wǎng)絡(luò)的有效性,將所設(shè)計(jì)的網(wǎng)絡(luò)架構(gòu)與目前主流的網(wǎng)絡(luò)架構(gòu)LeNet、AlexNet、VggNet16、ResNet18以及文獻(xiàn)[16]的分類模型采用相同訓(xùn)練方式在相同的數(shù)據(jù)集下的模型分類準(zhǔn)確率進(jìn)行了對(duì)比。對(duì)比結(jié)果如圖6所示。

圖6 不同分類模型的分類準(zhǔn)確率對(duì)比

從圖6中可以看出,上述幾種網(wǎng)絡(luò)模型在相同數(shù)據(jù)集下分別取得94.42%、93.13%、93.99%、93.56%和92.71%的分類準(zhǔn)確率。因此,所設(shè)計(jì)的網(wǎng)絡(luò)架構(gòu)能夠取得更好的94.85%分類性能,相比其中最高的網(wǎng)絡(luò)模型準(zhǔn)確率可以提升0.43%。

4 結(jié)束語(yǔ)

本文結(jié)合中醫(yī)醫(yī)師的診療經(jīng)驗(yàn),提出一種基于輕型卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)的舌苔顏色分類方法。首先,對(duì)樣本中不平衡的舌苔顏色類別進(jìn)行數(shù)據(jù)擴(kuò)充;然后,根據(jù)舌象樣本的特點(diǎn),設(shè)計(jì)了一種輕型卷積神經(jīng)網(wǎng)絡(luò),將特征提取和分類納入到一個(gè)框架中統(tǒng)一進(jìn)行處理;最后,通過(guò)數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)圖像與其屬性的映射關(guān)系,得到苔色分類模型,從而實(shí)現(xiàn)舌苔顏色的分類。實(shí)驗(yàn)證明,所提出的方法在舌苔顏色分類方面能取得更好的分類性能。未來(lái),將通過(guò)完善數(shù)據(jù)集和優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)的方式,進(jìn)一步提高舌苔顏色分類的準(zhǔn)確率。希望通過(guò)進(jìn)行這一研究,能夠促進(jìn)中醫(yī)舌診智能化分析的發(fā)展,同時(shí)對(duì)輔助中醫(yī)臨床診療及臨床研究具有現(xiàn)實(shí)意義。

猜你喜歡
舌象舌苔準(zhǔn)確率
574例新型冠狀病毒肺炎康復(fù)者舌象特征分析
基于Citespace的國(guó)內(nèi)腫瘤舌象研究可視化分析(2001-2020年)
基于Citespace糖尿病舌象研究的文獻(xiàn)計(jì)量與可視化分析
乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
舌象儀臨床應(yīng)用研究的方法學(xué)及報(bào)告質(zhì)量評(píng)價(jià)
寶寶需要清潔舌苔嗎
高速公路車(chē)牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
刷牙別忘清理舌苔
连城县| 新河县| 兖州市| 石棉县| 安阳县| 汶上县| 滦南县| 黄大仙区| 达日县| 龙州县| 铁岭县| 南漳县| 百色市| 栾城县| 通河县| 麻城市| 桐乡市| 湛江市| 江川县| 兴隆县| 宽城| 泾川县| 甘泉县| 理塘县| 电白县| 大连市| 凌源市| 华蓥市| 淮北市| 故城县| 上林县| 柳林县| 甘孜| 平远县| 晋城| 安阳县| 沙田区| 金门县| 随州市| 怀集县| 长沙市|