国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于介電特性的蘋果內部品質預測方法研究

2019-05-27 08:47晗,蔡騁,劉
農(nóng)機化研究 2019年10期
關鍵詞:口感標簽水果

耿 晗,蔡 騁,劉 斌

(西北農(nóng)林科技大學 信息工程學院,陜西 楊凌 712100)

0 引言

我國是世界上最大的水果產(chǎn)出國,種植面積和產(chǎn)量長期穩(wěn)居世界第一,水果產(chǎn)業(yè)在國民經(jīng)濟發(fā)展中一直占有舉足輕重的地位。但是,在國際市場上我國水果出口量僅占總產(chǎn)量的2%左右,遠低于世界同期各國水果出口10%的平均水平[1],主要原因在于我國水果產(chǎn)業(yè)的粗放型經(jīng)營模式,未能按照國際標準嚴格執(zhí)行對水果品質的分級處理[2]。另一方面,隨著人們生活水平和質量的大幅提升,對水平品質的追求也越來越高,開始逐步關注水果的口感指標。因此,如何快速無損檢測水果的糖度、硬度及含水率等內部品質對確定水果的營養(yǎng)價值和分級銷售有重要意義。

水果無損檢測是基于在水果表面無任何損傷的情況下,對水果內部的成分和結構進行分析的技術。國內外相關研究人員利用水果的電學特性、聲學特性、光學特性、太赫茲及機器視覺等技術對水果品質進行無損檢測[3-6]。Reyer 等[7]基于計算機視覺檢測了杏和桃的撞傷問題,該方法對傷果的檢測準確率為65%左右,但該方法屬于水果外部品質測定的范疇。近年來,水果內部品質檢測及分類的研究逐漸成為研究熱點。Sivakumar[8]對芒果的水分含量用高光譜成像技術進行檢測與研究,結果表明采用人工神經(jīng)網(wǎng)絡預測芒果的水分相關系數(shù)為0.81。Kandala 等[9]使用近紅外光譜法有效檢測到了花生中的水分含量,結果表明預測花生的水分含量相關系數(shù)為0.97。王等[10]利用聲波震動測量方法對庫爾勒香梨的硬度進行了無損檢測,識別率達到了86.7%。蔡騁等[11]基于介電特征的無損檢測技術按照蘋果失重率分別為0%、5%、10%、15%,以及果心病變果將蘋果品質分為5個品質等級,其檢測準確率達到了98.3%。

但上述水果內部品質檢測方法多基于水果的單個參數(shù)進行檢測,難以準確地對水果進行有效分級。蔡騁等[11]雖然考慮了蘋果的108個介電特征對水果內部品質進行分級,但未考慮水果糖度、硬度及含水率等重要的理化指標,未能實現(xiàn)對蘋果口感的檢測與分級。在蘋果外觀與理化品質對比中發(fā)現(xiàn)(見圖1):蘋果的外觀與理化指標不一定成正比,外觀較好但蘋果的口感、理化品質不一定優(yōu),因此需要采用無損檢測方法檢測影響蘋果口感的理化指標并實行有效口感分級。

圖1 蘋果外觀

針對當前研究中尚未實現(xiàn)對蘋果內部口感品質的有效分級,本文主要對蘋果進行研究,借鑒圖像標注方法[12],提出一種基于隨機森林的蘋果內部口感品質多語義分類方法。該方法使用蘋果的介電參數(shù)作為指導生成隨機森林,用TF-IDF算法選取輸出類別,依據(jù)介電參數(shù)估計預測蘋果的理化指標。實驗結果表明:該方法分級后均方根誤差為0.51,可有效實現(xiàn)對蘋果內部品質的多語義分類,可為水果等農(nóng)產(chǎn)品的無損檢測及分級提供參考。

1 實驗材料與相關處理

實驗中用富士蘋果,蘋果成熟后(10月中下旬)采自西北農(nóng)林科技大學白水蘋果試驗基地,采收后當天運回實驗室,平衡24h后,選擇成熟度一致、色澤相近、大小均勻、無病蟲害及無機械損傷的果實500個。裸果于中室溫(20±2)℃條件下貯藏;逐果編號并測定其在158、251、398、15 800、25 100、39 800、1 580 000、2 510 000、3 980 000Hz等9個頻率點下的介電特征值。介電參數(shù)的測量采用如圖2所示的3532-50所示系統(tǒng),介電特征的測量方法與安等提出的方法[13]一致。在測量蘋果的介電特征值時,沿著蘋果最大橫截面測量兩次,然后將兩次測量數(shù)據(jù)取平均值作為該果實的介電特征數(shù)值。

1.計算機 2.LCR測試儀 3.測試探頭 4.平行電極板圖2 介電參數(shù)測試系統(tǒng)

實驗中共選取12個介電參數(shù)(見表1),每種介電參數(shù)在9個頻率點(i=158~3 980 000Hz)范圍內共測得12種介電特征,一共得到108種介電特征均值,并進行編號。各介電特征均值如表2所示。

對采摘的500個蘋果,測量完介電特征數(shù)值后,立即開始測量理化特征值,實驗過程中測量得到了8種常用品質評估理化特征數(shù)值,如表3所示。

表1 12種介電特征

i代表頻率點,頻率范圍為 158 ~3 980 000Hz,共測12種介電特征。

表2 各種介電特征均值

續(xù)表2

表3 8種理化特征

將每個蘋果的介電特征數(shù)值與理化特征數(shù)值對應,為了訓練蘋果內部品質多語義分類模型,對比分級正確率,需知道500個樣本的理化特征各屬于哪種級別。由于果品行業(yè)對水果內部品質分級沒有統(tǒng)一的標準,本實驗將測得的蘋果理化特征值從小到大分為5個等級,并將介電特征參數(shù)作為輸入,訓練隨機森林。

2 分類模型設計

2.1 隨機森林模型設計

隨機森林是一種集合學習方法,可用作分類、回歸、半監(jiān)督學習等領域[14],是一系列決策樹的集合。

對于分類問題,隨機森林能夠快速且準確地處理多種分類任務。通過隨機選擇特征子集和樣本子集訓練得到?jīng)Q策樹,隨機森林中為了選定測試樣本輸出類別,將所有決策樹對其預測類別分布采用投票策略選定,如圖3所示。

圖3 隨機森林運行示意圖(圖中方塊表示標簽信息量的傳遞)

1)劃分點選取。Ta表示在在樣本集上屬性為a的分裂值,即

(1)

其中,a表示樣本集上的連續(xù)屬性。a在樣本集上有n個不同的取值,將這些值從大到小排序,記為a1,a2,...,an?;趧澐贮ct∈T可將子集分為大于t和小于t的樣本,對連續(xù)屬性a考察n-1個劃分點候選集合。

2)訓練目標函數(shù)選取。隨機森林訓練的關鍵是如何選擇最優(yōu)劃分屬性。一般而言,隨著劃分過程不斷進行,希望每棵樹的分支節(jié)點所包含的樣本盡可能屬于同一類,即結點的“純度”越來越高。將信息論和信息增益應用于樹中分裂結點的目標函數(shù),能得到3種函數(shù),分別是信息增益、信息增益率、基尼系數(shù)。本實驗中,將信息增益率作為目標函數(shù),原因是使用信息增益率來選擇屬性能夠完成對連續(xù)屬性的離散化處理,能夠對不完整數(shù)據(jù)進行處理。I定義為信息增益率,即

(2)

其中,S為分裂結點的屬性數(shù)據(jù)集,將S分為左子集SL和右子集SR;H表示信息熵;|S|、|Si|分別表示樣本總數(shù)。H(S)定義為香農(nóng)信息熵,即

(3)

其中,c為類別標簽;C為所有的類別標簽集,p(c)為集合S中的樣本屬于c類的概率。信息增益率目標函數(shù)選擇信息增益值最大的屬性作為分裂屬性。

隨機森林訓練過程中起到關鍵作用的參數(shù)有:

1)樹的最大深度。樹的深度越小,計算量越小,速度越快;深度越大,計算量越大,速度越慢。過大或過小會影響分類的準確性[14]。

2)森林中樹的總數(shù)。樹的總數(shù)越大,分類性能越好,樹總數(shù)的選擇取決于計算機的硬件資源。

2.2 標簽預測

在隨機森林訓練后,使用投票策略選定測試樣本的輸出類別,然而在蘋果內部口感品質多語義分類研究中,分級標簽為8個,僅采用隨機森林模型無法統(tǒng)計輸出類別。因此,本研究中將測試樣本用理化指標標注標簽,通過隨機森林中的每棵隨機樹,從根節(jié)點到葉子節(jié)點按照分割函數(shù)不斷進行深度優(yōu)先搜索完成。

TF-IDF(詞頻-逆文檔頻率)算法[15]是一種統(tǒng)計方法,用以評估一個字詞對于一個文件集或一個語料庫中的其中一份文件的重要程度。其中,TF指的是某一個給定的標簽在該樣本集出現(xiàn)的次數(shù),IDF是一個標簽普遍重要性的度量。該算法具有快速選取輸出類別、算法復雜度低的優(yōu)勢,在本研究中采用TF-IDF算法過濾掉普通標簽,保留重要的有分類意義的標簽。使用該算法進行理化特征標簽預測的主要思想是:如果某一理化特征標簽在某個測試集中出現(xiàn)的頻率越高,在其他測試集中很少出現(xiàn),則該標簽就能較好地對測試集進行分類。用于預測測試集對應的8個標簽qj表示為

(4)

3 結果與分析

實驗中,按照9:1隨機的將蘋果分為訓練集和測試集,采用十輪交叉驗證的方法取均值。

隨機森林模型的訓練過程中,使用信息增益率作為目標函數(shù)。實驗中使用了平行的8個標簽(見圖4),且標簽是連續(xù)的,在分類預測中預測出的標簽級別分布較為一致,采用的評價指標為均方根誤差(RootMeanSquareError,RMSE),即

(5)

圖4 標簽對應分布圖

實驗結果表明:將隨機森林應用于蘋果內部口感品質多語義分類中可行。由圖4可看出:8個理化指標的實際等級和預測等級分布較為一致,最多3個標簽的實際等級和預測等級有差值,差值相差一級。

實驗結果表明:將隨機森林應用于蘋果內部口感品質多語義分類中可行。由圖4可看出:8個理化指標的實際等級和預測等級分布較為一致,最多3個標簽的實際等級和預測等級有差值,差值相差一級。

基于森林規(guī)模的RMSE和時間的關系如表3和圖5所示。由表3和圖5可以看出:隨機森林規(guī)模對實驗結果有較大影響;森林規(guī)模影響分類的準確性及訓練時間,隨著森林規(guī)模的增加,RMSE值逐漸降低,準確性逐漸提高;訓練時間越長,森林規(guī)模越大,RMSE值變化越明顯。

表3 基于森林規(guī)模的RMSE和時間的關系

圖5 基于森林規(guī)模的RMSE和時間的關系

基于樹深度的RMSE和時間的關系如表4和圖6所示。由表4和圖6可看出:樹的深度也會影響分類的準確率及訓練時間,樹的深度過小時,容易造成低度擬合,會降低分類準確性;過大時,容易造成過擬合,會降低分類準確性。隨著樹的深度的增加,RMSE值逐漸降低; 但降到一定值后,又逐漸增加,而訓練時間逐漸增長。實驗中選取森林的規(guī)模1 000,樹的深度為25時,RMSE為0.51,分類準確率較好。

表4 基于樹深度的RMSE和時間的關系

圖6 基于樹深度的RMSE和時間的關系

為對蘋果內部口感品質進行有效的多語義分類,驗證隨機森林的可行性,本研究測試了支持向量機分類模型(SVM)[16]。實驗結果表明:SVM分類RMSE值為0.69,在隨機森林模型中使用信息增益率作為目標函數(shù),每棵樹的最大深度為25,森林規(guī)模為1 000,RMSE值為0.51。因此,使用本文提出的隨機森林作為蘋果內部口感品質分類器效果更好。

4 結論

在本實驗中,使用隨機森林為基礎進行蘋果內部多品質語義分類,使用介電特征參數(shù)指導隨機森林的生成,標簽信息為理化特征,采用TF-IDF算法選取輸出類別。實驗測試表明:基于隨機森林的蘋果內部口感品質進行多標簽分類的RMSE值為0.51,對比SVM,準確率更高;隨機森林模型對蘋果內部口感品質多標簽分類,相比以往蘋果整體等級分類,能夠較準確地在無損情況下確定蘋果內部口感品質。

猜你喜歡
口感標簽水果
青菜口感嫩的辦法
豆腐去鹵水味切不易碎的辦法
無懼標簽 Alfa Romeo Giulia 200HP
不害怕撕掉標簽的人,都活出了真正的漂亮
四月里該吃什么水果
讓衣柜擺脫“雜亂無章”的標簽
科學家的標簽
水果篇之Cherry
水果暢想曲
胚芽香脆餅干