国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于多傳感器人工嗅覺系統(tǒng)及機(jī)器學(xué)習(xí)模型的蘋果種類識(shí)別方法

2023-07-12 09:01:28李書賢周琪樊亞楠葉詩琪趙志彪張思祥
天津農(nóng)業(yè)科學(xué) 2023年7期
關(guān)鍵詞:氣體蘋果分類

李書賢 周琪 樊亞楠 葉詩琪 趙志彪 張思祥

摘??? 要:基于多傳感器人工嗅覺系統(tǒng)的蘋果種類識(shí)別方法是將自行研發(fā)的便攜式硬件和上位機(jī)算法相結(jié)合,目的是將市面上常見的外形相似的‘花牛和‘阿克蘇蘋果進(jìn)行無損種類識(shí)別,降低檢測(cè)成本。實(shí)施方法是根據(jù)實(shí)際情況選擇傳感器并設(shè)計(jì)電路對(duì)待測(cè)樣本氣味信息進(jìn)行響應(yīng),下位機(jī)將采集到的信號(hào)傳輸至上位機(jī)的機(jī)器學(xué)習(xí)算法中進(jìn)行模型訓(xùn)練。通過線性判別分析算法(Linear Discriminant Analysis,LDA)、邏輯回歸算法(Logistic Regression,LR)、鄰近算法(K-NearestNeighbor,KNN)、前饋神經(jīng)網(wǎng)絡(luò)算法(Back Propagation,BP)分類模型對(duì)氣味信息數(shù)據(jù)進(jìn)行計(jì)算并作出分類。最終得到LDA、LR、KNN、BP算法識(shí)別的準(zhǔn)確率分別為86.83%、85.33%、91.26%、85.00%,通過stacking框架將以上4種算法模型進(jìn)行融合,融合后算法識(shí)別的準(zhǔn)確率最高為97.14%。與傳統(tǒng)單預(yù)測(cè)模型相比,基于多模型融合的蘋果識(shí)別方法精確度更高。研究結(jié)果表明,基于多傳感器人工嗅覺系統(tǒng)可以直接通過氣味對(duì)其種類進(jìn)行識(shí)別,為蘋果的無損分類做出有效的判斷,可為受主觀因素影響的的感官評(píng)價(jià)提供客觀的理論依據(jù)。

關(guān)鍵詞:多傳感器;種類識(shí)別;機(jī)器學(xué)習(xí);stacking融合算法

中圖分類號(hào):TP391??????????? 文獻(xiàn)標(biāo)識(shí)碼:A???????????? DOI 編碼:10.3969/j.issn.1006-6500.2023.07.012

A Multi-sensor Artificial Olfactory System and Machine Learning Model Based on Apple Species Recognition Method

LI Shuxian1,2, ZHOU Qi1,2, FAN Yanan1,2, YE Shiqi1,2, ZHAO Zhibiao1,2, ZHANG Sixiang3

(1. School of Automation and Electrical Engineering, Tianjin University of Technology and Education, Tianjin 300222, China; 2. Tianjin Key Laboratory of Information Sensing and Intelligent Control, Tianjin University of Technology and Education, Tianjin 300222, China; 3. School of Mechanical Engineering, Hebei University of Technology, Tianjin 300401, China)

Abstract:The method of apple variety recognition based on a multi-sensors artificial olfaction system combines a self-developed portable hardware device with a PC-based algorithm. The aim is to achieve non-destructive identification of visually similar apple varieties, such as 'Huaniu' and 'Akane', in the market, thereby reducing detection costs.The implementation method involved selecting sensors based on the actual conditions and designing circuits to respond to the odor information of the tested samples. The lower-level device transmitted the collected signals to the machine learning algorithm implemented on the upper-level PC for model training. The collected odor information data was processed and classified using classification models, including Linear Discriminant Analysis (LDA), Logistic Regression (LR), K-Nearest Neighbor (KNN), and Back Propagation (BP). The classification accuracy of LDA, LR, KNN and BP algorithms was determined to be 86.83%, 85.33%, 91.26% and 85.00%, respectively. The four algorithm models were then fused using the stacking framework, resulting in the highest accuracy of 97.14%. Compared to traditional single prediction models, the apple recognition method based on multi-model fusion achieved higher accuracy. The research results indicated that the multi-sensors artificial olfaction system can directly identify the variety of apples based on their odor, providing an effective means for non-destructive classification. This method could offer objective criteria for sensory evaluation that may be influenced by subjective factors.

Key words: multi-sensors; variety recognition; machine learning; stacking fusion algorithm

蘋果散發(fā)的氣味是蘋果種類的一個(gè)重要標(biāo)識(shí)[1],不同種類的蘋果散發(fā)的氣味也有差異[2]。傳統(tǒng)蘋果種類識(shí)別主要靠化學(xué)檢測(cè),過程復(fù)雜,對(duì)被測(cè)樣本傷害高,無法實(shí)現(xiàn)無損檢測(cè)[3~4]。

為解決傳統(tǒng)水果檢測(cè)過程復(fù)雜的問題,乜蘭春等[5]通過對(duì)‘紅富士‘新紅星和‘喬納金等多個(gè)品種的蘋果的揮發(fā)性氣體進(jìn)行研究,結(jié)果發(fā)現(xiàn),紅富士蘋果未成熟時(shí)含量最高的揮發(fā)性氣體是乙醛,占總揮發(fā)性氣體含量的18.73%,成熟時(shí)含量最高的揮發(fā)性氣體為丁酸乙酯,占總揮發(fā)性氣體含量的19.51%;‘新紅星蘋果成熟時(shí)含量最高的揮發(fā)性氣體為乙醛和2-甲基環(huán)戊醇,占總揮發(fā)性氣體的20%以上;‘喬納金蘋果成熟時(shí)含量最高的揮發(fā)性氣體是1-丙醇,占總揮發(fā)性氣體的9.30%;乜春蘭[5]研究表明,不同品種的蘋果揮發(fā)性氣體差異較大。楊艷菊等[6]將傳感器陣列和人工神經(jīng)網(wǎng)絡(luò)模式識(shí)別算法結(jié)合起來建立電子鼻系統(tǒng),對(duì)水果的變化過程進(jìn)行監(jiān)控,嘗試對(duì)3種狀態(tài)(好、碰傷、壞)的蘋果氣體進(jìn)行定性識(shí)別,其中對(duì)‘紅富士蘋果進(jìn)行識(shí)別時(shí)的準(zhǔn)確率達(dá)到83.33%以上。郭清乾等[7]研究發(fā)現(xiàn),蘋果的成熟度與其產(chǎn)生的乙烯含量密切相關(guān),乙烯含量小于1 mg·L-1時(shí),蘋果處于未成熟的狀態(tài);乙烯含量在1~6 mg·L-1時(shí),蘋果處于成熟的狀態(tài);乙烯含量高于6 mg·L-1時(shí),蘋果過成熟,處于次新鮮的狀態(tài)。通過試驗(yàn)證明,不同新鮮度的蘋果散發(fā)的乙烯濃度具有鮮明的區(qū)分性,乙烯含量可以作為蘋果鮮度檢測(cè)的一個(gè)重要指標(biāo)。張艷麗等[8]采用氣相色譜檢測(cè)技術(shù),對(duì)4種‘紅富士蘋果的香氣物質(zhì)成分和含量進(jìn)行分析,檢測(cè)到36種香氣物質(zhì),其主要成分為脂類,其次為醇類。含有2-甲基丁酸己脂和己醛等特有香氣物質(zhì)的果實(shí)風(fēng)味較好。Baietto等[9]探討了目前電子鼻的使用情況,指出其在辨別復(fù)雜的水果混合揮發(fā)物方面非常有效,可以作為新的高效工具對(duì)水果的香氣進(jìn)行分析,以取代傳統(tǒng)的昂貴的水果香氣評(píng)估方法。研究提供了氣體傳感器陣列在水果識(shí)別、栽培品種鑒別、成熟度評(píng)估和水果分級(jí)等方面的有效數(shù)據(jù)。Valente等[10]通過將傳感器陣列與無人機(jī)技術(shù)相結(jié)合,根據(jù)果園中乙烯濃度判斷蘋果是否成熟,實(shí)現(xiàn)對(duì)蘋果林中的蘋果成熟度進(jìn)行監(jiān)測(cè)。

以上研究表明,蘋果的新鮮度、風(fēng)味、成熟度與其散發(fā)的氣味之間存在聯(lián)系,但目前尚未見報(bào)道將蘋果散發(fā)的氣味與蘋果種類進(jìn)行關(guān)聯(lián)研究。本文利用金屬氧化物半導(dǎo)體(MOS)傳感器陣列采集被測(cè)樣本散發(fā)的氣體,并將擬合結(jié)果通過識(shí)別算法與蘋果種類進(jìn)行關(guān)聯(lián)研究,為蘋果的準(zhǔn)確分類提供判別的依據(jù)。

1 材料與方法

1.1 蘋果種類識(shí)別系統(tǒng)硬件開發(fā)

由傳感器陣列和上位機(jī)組成的人工嗅覺系統(tǒng)與人體嗅覺系統(tǒng)類似,如圖1所示。MOS傳感器陣列通過模仿生物嗅覺神經(jīng)元,在檢測(cè)氣體的同時(shí)檢測(cè)編碼的尖峰信號(hào)[11],在傳感器內(nèi)部實(shí)現(xiàn)模擬人類神經(jīng)形態(tài)的功能,上位機(jī)中的機(jī)器學(xué)習(xí)算法模擬人類大腦對(duì)被測(cè)樣本進(jìn)行識(shí)別。硬件系統(tǒng)搭建如圖2所示,電路系統(tǒng)為:直流穩(wěn)壓電壓源給傳感器陣列提供5 V的工作電壓,單片機(jī)信號(hào)采集模塊由上位機(jī)PC端供電以方便采集信號(hào)的傳輸。傳感器陣列進(jìn)行集體響應(yīng),優(yōu)點(diǎn)是簡化了傳感器陣列的氣路設(shè)計(jì),降低了信號(hào)采集的難度,簡化氣路的同時(shí)縮短了氣體與傳感器中氧化物反應(yīng)的時(shí)間,提高了系統(tǒng)的效率[12]。

為避免傳感器的交叉敏感性給系統(tǒng)帶來的誤差,選擇8個(gè)不同型號(hào)的TGS金屬氧化物半導(dǎo)體氣體傳感器組成傳感器陣列[13],如圖3所示。本系統(tǒng)采用日本TGS系列傳感器,其電阻RS與待測(cè)樣本之間的濃度關(guān)系如公式1所示。

式中,A和α是只與目標(biāo)氣體相關(guān)的常數(shù),通常用于描述被測(cè)氣體濃度C發(fā)生變化時(shí),MOS傳感器對(duì)濃度變化的分辨程度,通常由費(fèi)加羅的傳感器手冊(cè)給出,與傳感器的特性有關(guān),且α≤0.6。

選擇傳感器濃度響應(yīng)區(qū)間與蘋果散發(fā)的香氣濃度相對(duì)應(yīng)的傳感器以保證被測(cè)氣體濃度數(shù)據(jù)能夠被正常采集[14]。反復(fù)測(cè)試后,選擇的傳感器型號(hào)及其性能指標(biāo)如表1所示。其中S3、S7、S8傳感器對(duì)氨氣、乙醇和硫化氫有良好的響應(yīng)特性,適用于水果的特征氣體檢測(cè)。由于TGS系列傳感器的廣譜性,選擇S1、S2、S4、S5、S6對(duì)蘋果中的其他氣體進(jìn)行響應(yīng),減小傳感器的交叉敏感性。測(cè)量范圍的單位PPM全稱parts per million,即一百萬體積的空氣中所含污染物的體積數(shù)。

1.2 試驗(yàn)過程

本試驗(yàn)用到的蘋果樣品為2類:分別是產(chǎn)自甘肅天水市的‘花牛與新疆維吾爾族自治區(qū)的‘阿克蘇。每種蘋果樣本為20個(gè),每個(gè)樣本取4個(gè)不同時(shí)期分別進(jìn)行試驗(yàn)測(cè)量,共進(jìn)行160次數(shù)據(jù)測(cè)量。選取大小一致外表完好的蘋果進(jìn)行編號(hào),將編好號(hào)的蘋果放入750 mL的密閉容器內(nèi),常溫平衡20 min,傳感器陣列預(yù)熱15 min,氣泵流量進(jìn)氣和出氣均設(shè)置為100 mL·min-1,樣本測(cè)定時(shí)間為180 s。隨著樣本蘋果散發(fā)的各種氣體濃度的變化,得到不同種類散發(fā)氣體原始濃度數(shù)據(jù),如圖4所示。

圖4-A、圖4-B為部分‘花牛的氣體濃度響應(yīng)曲線,圖4-C、圖4-D為部分‘阿克蘇的響應(yīng)曲線,由于TGS2602的靈敏度最大,故2種被測(cè)樣品的最大響應(yīng)曲線均來自硫化氫傳感器。由圖4可知,被測(cè)氣體穩(wěn)定時(shí),‘花牛樣品中的烷類氣體與乙醇?xì)怏w的差別較大,氫氣含量轉(zhuǎn)化為電壓值高于2 V;‘阿克蘇樣品中烷類氣體與乙醇?xì)怏w相差則較小,氫氣含量轉(zhuǎn)化為電壓值低于2 V。

1.3 單一模式識(shí)別算法模型研究

本文采用線性判別分析(Linear Discriminant Analysis,LDA)、邏輯回歸(Logistic Regression,LR)、鄰近算法(K-NearestNeighbor,KNN)、前饋神經(jīng)網(wǎng)絡(luò)(Back Propagation,BP)4種單一算法對(duì)測(cè)得的樣本數(shù)據(jù)進(jìn)行訓(xùn)練和測(cè)試。

LDA是一種有監(jiān)督的學(xué)習(xí)算法[15]。LDA的思路為:找到一個(gè)最優(yōu)的向量,將高維空間中的樣本點(diǎn)(特征向量)都投影到這個(gè)最優(yōu)向量的方向上,投影結(jié)果即為判斷類別的依據(jù)。為了尋找一組數(shù)據(jù)集的最優(yōu)投影方向,首先要考慮種類內(nèi)的緊湊性和不同類別間的分離性,即‘花牛與‘阿克蘇樣本類內(nèi)距離和類間距離,如圖5所示。

類內(nèi)距離和類間距離的計(jì)算公式分別為:

式中,a1和a2分別表示‘花牛和‘阿克蘇響應(yīng)數(shù)據(jù)特征向量集合;m1和m2表示2個(gè)類別的樣本均值向量。

LDA求解的目標(biāo)是最小化同類樣本類內(nèi)距離,最大化不同類樣本類間距離。將高維特征記作x,投影后向量記作ω,2個(gè)類別的樣本高維度特征均值向量分別記作μ1和μ2,投影后的兩均值點(diǎn)則分別為ωTμ1和ωTμ2,投影后的一維特征為ωTx,將投影后的一維特征點(diǎn)帶入上述由類內(nèi)距離和類間距離組成的目標(biāo)函數(shù)得到公式4,最大化類間距離從而對(duì)不同種類蘋果的數(shù)據(jù)進(jìn)行分類。

LR[16]是在線性回歸的計(jì)算結(jié)果上加上一個(gè)Sigmoid函數(shù),將線性回歸的數(shù)值結(jié)果轉(zhuǎn)化為0到1之間的概率。對(duì)2種蘋果進(jìn)行分類,建立如下線性方程:

式中,w為自變量系數(shù)矩陣;x為特征值,w0為偏置項(xiàng)。

將線性方程與Sigmoid函數(shù)相結(jié)合得出用于概率計(jì)算的歸一化指數(shù)函數(shù)。

式中,ezk為類別K的得分經(jīng)過指數(shù)函數(shù)轉(zhuǎn)化后的值;∑l k =1 ezl表示所有類別得分經(jīng)過指數(shù)函數(shù)轉(zhuǎn)化后的值的總和。

每個(gè)類別的得分通過指數(shù)函數(shù)轉(zhuǎn)化為正數(shù),并對(duì)2個(gè)類別得分進(jìn)行求和,類別K的得分除以總和獲得類別K的歸一化概率值。這樣可以將‘花牛和‘阿克蘇的分類問題轉(zhuǎn)化為概率計(jì)算問題,方便進(jìn)行概率預(yù)測(cè)和決策。

KNN算法是一個(gè)簡單而經(jīng)典的機(jī)器學(xué)習(xí)分類方法[17]。通過度量待分類樣本和已知類別樣本之間的距離(通常使用歐氏距離)或相似度,對(duì)樣本進(jìn)行分類。因?yàn)镵最近鄰算法在分類時(shí)只根據(jù)周圍最近鄰的一個(gè)或幾個(gè)樣本來對(duì)待測(cè)樣本進(jìn)行分類,根據(jù)計(jì)算出來的歐氏距離大小對(duì)樣本進(jìn)行遞增排序,距離越小相似度越高。統(tǒng)計(jì)K個(gè)最近的鄰居樣本點(diǎn)分別屬于每個(gè)類別的個(gè)數(shù),采用投票法和少數(shù)服從多數(shù)的原則,將K個(gè)鄰居樣本點(diǎn)里出現(xiàn)頻率最高的類別,作為該樣本點(diǎn)的預(yù)測(cè)類別。適合蘋果二分類中類域交叉重疊較多的樣本。

BP神經(jīng)網(wǎng)絡(luò)是一種按照誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò)[18],能學(xué)習(xí)和存貯大量的輸入—輸出模式映射關(guān)系,其核心是使用梯度下降法,通過反向傳播不斷調(diào)整神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,從而最小化網(wǎng)絡(luò)的誤差平方和。BP神經(jīng)網(wǎng)絡(luò)由輸入層、隱藏層和輸出層構(gòu)成,在此結(jié)構(gòu)中信號(hào)向前傳播,誤差向后傳播。利用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練時(shí),樣本數(shù)據(jù)分為訓(xùn)練集和測(cè)試集,訓(xùn)練集用于發(fā)現(xiàn)和預(yù)測(cè)樣本數(shù)據(jù)和分類之間的關(guān)系,測(cè)試集用于評(píng)估關(guān)系強(qiáng)度。圖6是1層隱藏層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。數(shù)學(xué)表達(dá)式為:

式中,f為非線性單元,即模型中的sgn(·)函數(shù);(ω11,b11)和(ω12,b12)分別為輸入層連接到2個(gè)隱藏層節(jié)點(diǎn)的權(quán)重參數(shù)向量;(ω1,b2)為隱藏層到輸出層的參數(shù);h=(h1,h2)為隱藏層輸出。

1.4 基于Stacking的融合算法模型研究

集成學(xué)習(xí)是建立在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上的多算法融合的機(jī)器學(xué)習(xí)方法[19],可以克服單一模型識(shí)別準(zhǔn)確率呈邊際效用遞減趨勢(shì)的缺點(diǎn)。多模型融合時(shí)既要考慮每個(gè)基學(xué)習(xí)器的識(shí)別能力,也要考慮各學(xué)習(xí)器組合的效果。算法模型差異度較大時(shí)能夠最大程度體現(xiàn)不同算法的優(yōu)勢(shì)。本文采用Person相關(guān)系數(shù)對(duì)各個(gè)模型的誤差差異度進(jìn)行計(jì)算[20],以此分析不同的基學(xué)習(xí)器之間的關(guān)聯(lián)程度,二維向量的Person相關(guān)系數(shù)計(jì)算方法如下:

基于此研究,本文在對(duì)樣本二分類的基礎(chǔ)上提出了一種基于Stacking框架的算法融合方法,研究單一機(jī)器學(xué)習(xí)和集成學(xué)習(xí)在蘋果氣味樣本二分類上的適用性。原理如圖7所示。

基于Stacking框架的蘋果二分類方法流程如圖8所示。按照5折交叉驗(yàn)證思想將初始訓(xùn)練集分成5個(gè)訓(xùn)練子集記作S1、S2...S5,其中S1、S2、S3、S4用來訓(xùn)練第1層分類模型,S5用來測(cè)試第1層分類模型;每個(gè)訓(xùn)練子集均做1次測(cè)試集;初始化1個(gè)測(cè)試集預(yù)測(cè)結(jié)果矩陣,將第1層預(yù)測(cè)的結(jié)果放在該矩陣中作為第2層模型的輸入,最后輸出結(jié)果矩陣,即測(cè)試集上的分類結(jié)果。

2 結(jié)果與分析

2.1 單一分類算法的超參選擇與關(guān)聯(lián)度分析

為優(yōu)化算法模型,首先對(duì)各個(gè)基學(xué)習(xí)器冗余信息進(jìn)行篩選[21]。本文的特征信息為傳感器采集的電壓峰值數(shù)據(jù),對(duì)于不同的算法傳感器陣列輸入的特征貢獻(xiàn)度也不同。各個(gè)基學(xué)習(xí)器的特征貢獻(xiàn)度如圖9所示。系數(shù)既可以為正,也可以為負(fù)。正數(shù)表示預(yù)測(cè)類別1的特征,負(fù)數(shù)表示預(yù)測(cè)類別0的特征。由圖9可知,傳感器0、5和7對(duì)LDA算法的貢獻(xiàn)度較大,在訓(xùn)練模型時(shí)5號(hào)傳感器TGS2602應(yīng)占比最重,0號(hào)TGS2603和7號(hào)TGS2602次之。LR、BP神經(jīng)網(wǎng)絡(luò)和KNN算法的貢獻(xiàn)度同理。

LDA算法通過拉格朗日乘子法對(duì)輸入的數(shù)據(jù)集進(jìn)行特征值提取,使用hθ(x)=θ0+θ1 x1+θ2 x2+…+θ8 x8的8輸入模型對(duì)其進(jìn)行θ值計(jì)算。多次訓(xùn)練后得到θ1~θ8的值分別為2.076 949 46e-03、2.125 127 04e-04、-9.578 842 53e-05、-6.149 024 72e-04、-2.866 366 30e-04、-3.594 670 69e-03、-2.464 231 56e-04、2.270 187 30e-03,截距θ0的值約為-2.71?!ㄅ:汀⒖颂K的氣味與傳感器電壓值的3D關(guān)系如圖10所示,藍(lán)色o代表‘花牛,紅色x代表‘阿克蘇。

LR模型采用準(zhǔn)確率(Accuracy),召回率(Recall)和精確率(Precision)3項(xiàng)指標(biāo)來評(píng)價(jià)分類結(jié)果。本次分類用到的數(shù)據(jù)共171組,從中隨機(jī)選擇120組作訓(xùn)練集,51組數(shù)據(jù)作測(cè)試集。其中正確率、召回率和準(zhǔn)確率的值見表2。

K-近鄰算法中的K值表示選擇K個(gè)最近的鄰居進(jìn)行參考。K值較小時(shí)間模型的復(fù)雜度高,包容度也高,模型訓(xùn)練誤差小,泛化能力弱;K值較大時(shí)模型復(fù)雜程度低,模型訓(xùn)練誤差大,泛化能力強(qiáng)。本文中K值和模型精確度如圖11所示。由圖11可以看出,K值取1時(shí),模型的精確度最高。本文僅對(duì)2種蘋果進(jìn)行分類,故K值取1時(shí),模型擬合能力較強(qiáng),此時(shí)決策只根據(jù)最近鄰的訓(xùn)練樣本給出結(jié)果,當(dāng)訓(xùn)練種類過多,訓(xùn)練中包含噪聲樣本時(shí),K值取3會(huì)獲得更佳的擬合效果。

BP神經(jīng)網(wǎng)絡(luò)采用正確率、召回率和F1共3項(xiàng)指標(biāo)來評(píng)價(jià)分類結(jié)果的好壞,其中F1=2×正確率×召回率/確率+召回率 用于綜合反映整體的指標(biāo)。對(duì)試驗(yàn)數(shù)據(jù)進(jìn)行處理,第1列為標(biāo)簽列,將‘花牛種類標(biāo)記為“0”,‘阿克蘇種類標(biāo)記為“1”,訓(xùn)練集和測(cè)試集的比例為7∶3,迭代次數(shù)設(shè)置為2 000次,訓(xùn)練后的結(jié)果如表3所示。

使用5折交叉驗(yàn)證的網(wǎng)格搜索法觀測(cè)不同超參數(shù)在各模型上的預(yù)測(cè)效果,從而確定各模型的最優(yōu)超參數(shù)組合。各單算法模型的超參數(shù)及模型準(zhǔn)確率如表4所示,單個(gè)模型算法結(jié)果如圖12所示。

2.2 基于Stacking框架的融合算法分析

Stacking多模型融合算法[24]需要在不同的數(shù)據(jù)空間角度和數(shù)據(jù)結(jié)構(gòu)角度來觀測(cè)數(shù)據(jù),故第1層模型要選擇差異度較大的模型作為基學(xué)習(xí)器。為選取最佳的基模型組合,首先對(duì)各個(gè)基學(xué)習(xí)器進(jìn)行單獨(dú)預(yù)測(cè),綜合比較單模型誤差,采用二維向量的Person系數(shù)計(jì)算相關(guān)性指標(biāo),各單模型算法的誤差相關(guān)性如圖13所示,顏色越深表示相關(guān)度越高。

由圖13可知,由于各算法學(xué)習(xí)能力較強(qiáng),各個(gè)模型之間的誤差相關(guān)性普遍較高,可以選擇以上4種模型進(jìn)行融合集成學(xué)習(xí)。為避免過擬合的情況,第2層選擇結(jié)構(gòu)簡單且泛化能力強(qiáng)的LR模型作為元學(xué)習(xí)器。最終得到結(jié)果矩陣和測(cè)試集之間分類的準(zhǔn)確率為97.14%。為進(jìn)一步驗(yàn)證Stacking集成模型中基學(xué)習(xí)器對(duì)識(shí)別能力的影響,表5總結(jié)了不同基學(xué)習(xí)器組合的識(shí)別結(jié)果。結(jié)果表明,使用不同的基學(xué)習(xí)器對(duì)識(shí)別結(jié)果影響較大,使用相關(guān)性小的基學(xué)習(xí)器會(huì)使Stacking模型識(shí)別能力更加優(yōu)異。

3 討論與結(jié)論

以上研究表明,蘋果種類與氣味可以通過人工嗅覺系統(tǒng)建立聯(lián)系?;贚DA、LR、KNN和BP神經(jīng)網(wǎng)絡(luò)4種單一分類算法對(duì)‘花牛和‘阿克蘇進(jìn)行分類其準(zhǔn)確率分別為86.83%、85.33%、91.26%、85.00%;基于Stacking框架的二分類融合算法考慮到各基學(xué)習(xí)器之間的關(guān)聯(lián)度,不同的基學(xué)習(xí)器融合后的效果各不相同,當(dāng)基學(xué)習(xí)器為LDA、LR、KNN、BP,第2層模型為LR時(shí)融合模型的準(zhǔn)確率最高,此時(shí)基于Stacking框架的融合模型的分類準(zhǔn)確率為97.14%。其他3個(gè)單一模型融合后的分類效果則不如KNN單一模型,故在算法融合時(shí)需要考慮各個(gè)模型之間的協(xié)同作用,才能有效地解決單一模型泛化能力弱的問題。以上研究表明,基于多傳感器人工嗅覺系統(tǒng)及機(jī)器學(xué)習(xí)模型的蘋果種類識(shí)別系統(tǒng)可對(duì)蘋果分類作出有效判斷,可為受主觀因素影響的感官評(píng)價(jià)提供客觀參考,提高蘋果種類判斷的準(zhǔn)確性。本研究提出的人工嗅覺系統(tǒng)有效地避免了檢測(cè)過程中對(duì)水果樣本的破壞,大幅度降低了檢測(cè)成本和品種識(shí)別的難度。雖然本研究目前局限于二分類的判別,但當(dāng)需要分類的蘋果種類增加時(shí),依然可以選擇多傳感器和機(jī)器學(xué)習(xí)組合的模式進(jìn)行分類。

參考文獻(xiàn):

[1] MOSTAFA S, WANG Y, ZENG W, et al. Floral scents and fruit aromas: functions, compositions, biosynthesis, and regulation[J]. Frontiers in Plant Science, 2022, 13: 860157.

[2] 鮮義坤, 楊楠, 孔凌, 等. 圈養(yǎng)大熊貓所食蘋果和胡蘿卜的氣味特點(diǎn)與香氣成分研究[J]. 飼料博覽, 2020(6): 1-9, 19.

[3] 何馥嫻, 蒙慶華, 唐柳, 等. 高光譜成像技術(shù)在水果品質(zhì)檢測(cè)中的研究進(jìn)展[J]. 果樹學(xué)報(bào), 2021, 38(9): 1590-1599.

[4] 凡建. 基于近紅外光譜傳感器的便攜式食品檢測(cè)器的設(shè)計(jì)與實(shí)現(xiàn)[D]. 南京: 南京郵電大學(xué), 2019.

[5] 乜蘭春, 孫建設(shè), 陳華君, 等. 蘋果不同品種果實(shí)香氣物質(zhì)研究[J]. 中國農(nóng)業(yè)科學(xué), 2006, 39(3): 641-646.

[6] 楊艷菊, 黃成鈞. 人工神經(jīng)網(wǎng)絡(luò)的蘋果氣體識(shí)別算法研究[J]. 銅陵學(xué)院學(xué)報(bào), 2010, 9(2): 76-78.

[7] 郭清乾, 馬劉正, 孫海峰, 等. 電化學(xué)傳感器水果成熟度檢測(cè)技術(shù)的研究[J]. 河南農(nóng)業(yè)大學(xué)學(xué)報(bào), 2017, 51(6): 839-844.

[8] 張艷麗. 靜寧縣4種紅富士蘋果香氣物質(zhì)成分及含量檢測(cè)與分析[J]. 安徽農(nóng)業(yè)科學(xué), 2019, 47(12): 207-209, 214.

[9] BAIETTO M, WILSON A D. Electronic-nose applications for fruit identification, ripeness and quality grading[J]. Sensors, 2015, 15(1): 899-931.

[10] VALENTE J, ALMEIDA R, KOOISTRA L. A compre-hensive study of the potential application of flying ethylene-sensitive sensors for ripeness detection in apple orchards[J]. Sensors, 2019, 19(2): 372.

[11] HAN J K, KANG M G, JEONG J, et al. Artificial olfactory neuron for an in-sensor neuromorphic nose[J]. Advanced Science, 2022, 9(18): e2106017.

[12] 王辰, 粟勇, 吳濤, 等. 一種傳感器陣列的封閉氣路設(shè)計(jì)方法及封閉氣路: CN202111579090.0[P]. 2022-04-01.

[13] 宋婷婷. 基于MOS氣體傳感器陣列的混合氣體檢測(cè)方法研究[D]. 哈爾濱: 哈爾濱理工大學(xué), 2022.

[14] 謝曉錚, 夏炎. 電子鼻的核心——?dú)怏w傳感器的研究與應(yīng)用[J]. 大學(xué)化學(xué), 2021, 36(9): 2012045.

[15] 付榮榮, 李朋, 劉沖, 等. 基于線性判別分析的決策融合腦電意識(shí)動(dòng)態(tài)分類[J]. 計(jì)量學(xué)報(bào), 2022, 43(5): 688-695.

[16] 王正存, 肖中俊, 嚴(yán)志國. 邏輯回歸分類識(shí)別優(yōu)化研究[J]. 齊魯工業(yè)大學(xué)學(xué)報(bào), 2019, 33(5): 47-51.

[17] XING W C, BEI Y L. Medical health big data classification based on KNN classification algorithm[J]. IEEE Access, 2020, 8: 28808-28819.

[18] 吳貴軍, 范鵬生, 陳浩辰, 等. 基于深度學(xué)習(xí)的數(shù)據(jù)分類預(yù)測(cè)及應(yīng)用[J]. 無線互聯(lián)科技, 2022, 19(8): 126-127.

[19] 史佳琪, 張建華. 基于多模型融合Stacking集成學(xué)習(xí)方式的負(fù)荷預(yù)測(cè)方法[J]. 中國電機(jī)工程學(xué)報(bào), 2019, 39(14): 4032-4041.

[20] 張露康, 王海蓉, 古可言, 等. 基于Pearson相關(guān)性分析的交通樞紐站客運(yùn)量預(yù)測(cè)模型分析研究[J]. 黑龍江交通科技, 2023, 46(3): 137-139.

[21] 劉培江. 基于Relief-F學(xué)習(xí)算法的煙葉近紅外光譜特征貢獻(xiàn)度分析[J]. 科學(xué)技術(shù)創(chuàng)新, 2022(25): 49-53.

猜你喜歡
氣體蘋果分類
二維定常Chaplygin氣體繞直楔流動(dòng)
分類算一算
非等熵Chaplygin氣體測(cè)度值解存在性
分類討論求坐標(biāo)
吃氣體,長大個(gè)
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
收獲蘋果
有毒的蘋果
拿蘋果
石阡县| 黄浦区| 峡江县| 新干县| 运城市| 漾濞| 临海市| 瑞金市| 新乐市| 梁山县| 灵台县| 南丰县| 祁阳县| 东阳市| 海门市| 昌乐县| 浦北县| 陵水| 迁安市| 渭源县| 都兰县| 荃湾区| 静宁县| 江川县| 大余县| 垦利县| 调兵山市| 诏安县| 贺兰县| 巢湖市| 临泽县| 来宾市| 辽阳市| 扶绥县| 勃利县| 肇庆市| 汽车| 宿松县| 金坛市| 进贤县| 三明市|