崔琳琳 沈冰冰 葛志強
在實際工業(yè)生產(chǎn)過程中,需要對一些關(guān)鍵的質(zhì)量變量進行實時測量,如產(chǎn)品濃度、過程氣體含量、催化劑活性和熔體指數(shù)等,這對實現(xiàn)有效的過程控制和提高產(chǎn)品質(zhì)量具有重要意義[1-5].然而,由于極端的測量環(huán)境、昂貴的儀器成本、大的分析測量延遲等因素,關(guān)鍵質(zhì)量變量的物理測量難以實現(xiàn)[6-8].因此,軟測量技術(shù)應(yīng)運而生.軟測量是一種虛擬傳感器技術(shù),通過構(gòu)建數(shù)學(xué)模型,以一組容易測量的相關(guān)過程變量為輸入,以過程關(guān)鍵質(zhì)量變量為輸出,來快速準(zhǔn)確地估計這些難以直接測量的質(zhì)量變量[9-11].一般來說,軟測量方法可大致分為兩種,模型驅(qū)動的軟測量和數(shù)據(jù)驅(qū)動的軟測量[12-13].與前者相比,數(shù)據(jù)驅(qū)動的軟測量方法不需要精準(zhǔn)的機理模型和大量的過程專家知識,更加具有靈活性和實用性.此外,隨著分布式控制系統(tǒng)(Distributed control systems,DCSs)在現(xiàn)代工業(yè)過程中的廣泛使用,收集到的數(shù)據(jù)也日益增多,為數(shù)據(jù)驅(qū)動建模方法提供了豐富的數(shù)據(jù)保證[14].因此,數(shù)據(jù)驅(qū)動的軟測量方法受到了越來越多的關(guān)注.經(jīng)典的基于數(shù)據(jù)驅(qū)動的軟測量建模方法有主成分回歸分析(Principal component regression,PCR)[15]、偏最小二乘法(Partial least squares,PLS)[16]、支持向量機(Support vector machine,SVM)[17]和人工神經(jīng)網(wǎng)絡(luò)(Artificial neuralnetwork techniques,ANN)[18]等.
近年來,深度學(xué)習(xí)作為一種新興技術(shù),在圖像處理、計算機視覺、自然語言處理等應(yīng)用領(lǐng)域都取得了很大的進展.與傳統(tǒng)的淺層方法相比,深度學(xué)習(xí)方法具有更深的網(wǎng)絡(luò)結(jié)構(gòu),它能夠通過多層非線性映射,從數(shù)據(jù)中提取更深層的抽象特征,具有強大的數(shù)據(jù)建模能力.因此,面對越來越復(fù)雜的大規(guī)?,F(xiàn)代工業(yè)過程,深度學(xué)習(xí)具有不可替代的優(yōu)勢,已經(jīng)被應(yīng)用到了軟測量領(lǐng)域當(dāng)中[19].例如,Yao和Ge 提出了一種基于分層極限學(xué)習(xí)機的半監(jiān)督深度學(xué)習(xí)軟測量模型[20].Yuan 等開發(fā)出一種質(zhì)量相關(guān)自動編碼器,用于提取深層次的輸出相關(guān)特征[21].Zhang和Ge 基于門控循環(huán)單元和編碼解碼網(wǎng)絡(luò),設(shè)計了一種深度可遷移動態(tài)特征提取器,并應(yīng)用于軟測量[22].Zheng 等將集成策略、深度信念網(wǎng)絡(luò)和核學(xué)習(xí)集成到軟測量框架中,建立了集成深度核回歸模型,并擴展到半監(jiān)督形式[23].然而,由于過程的隨機擾動等原因,幾乎所有的過程數(shù)據(jù)都會受到隨機噪聲的污染,從本質(zhì)上來說,過程變量都屬于隨機變量[14,24-25].最近,Kingma和Welling 提出了變分自編碼器[26],一種深度生成模型,它結(jié)合了深度學(xué)習(xí)和貝葉斯變分推斷.作為一種以深層神經(jīng)網(wǎng)絡(luò)為結(jié)構(gòu)的概率框架模型,VAE 既具有深度學(xué)習(xí)的非線性特征提取能力,又能像概率模型那樣對過程不確定性和數(shù)據(jù)噪聲進行建模.基于這些優(yōu)點,VAE已經(jīng)被引入到工業(yè)過程中,并逐漸被用于過程監(jiān)測和軟測量建模等應(yīng)用場景[27-31].
盡管目前VAE 在軟測量應(yīng)用中取得了一些進展,但是傳統(tǒng)的VAE 通常假設(shè)其潛在變量分布服從高斯分布,因此模型學(xué)習(xí)到的特征表示只能是單峰形式,難以充分發(fā)揮潛在空間編碼的能力和靈活性.這在很大程度上限制了VAE 對復(fù)雜特性過程數(shù)據(jù)的描述,如工業(yè)領(lǐng)域廣泛存在的多模態(tài)數(shù)據(jù),VAE 的建模性能很難得到有效的保障.在實際工業(yè)過程中,由于原料比例、產(chǎn)品需求、制造策略等因素的變化,經(jīng)常會發(fā)生操作條件的轉(zhuǎn)變,即工況發(fā)生變化,從而使過程數(shù)據(jù)呈現(xiàn)典型的多模態(tài)特性[32-34].近年來,學(xué)者們提出了一些VAE 變體模型,通過使用復(fù)雜的先驗等手段來促進編碼的靈活性,但他們的目標(biāo)大多是進行無監(jiān)督聚類[35-37].到目前為止,還沒有VAE 在多模態(tài)工業(yè)過程軟測量應(yīng)用中的相關(guān)研究報導(dǎo).基于以上討論,本文結(jié)合高斯混合模型的思想,基于VAE 框架提出一種混合變分自編碼器回歸(MVAER)模型,用于解決多模態(tài)過程的質(zhì)量預(yù)測問題.該方法采用高斯混合模型來描述VAE 的潛在空間變量分布,分別對應(yīng)工業(yè)過程中的多個模態(tài).通過非線性映射將復(fù)雜多模態(tài)數(shù)據(jù)映射到潛在空間,學(xué)習(xí)各模態(tài)下的潛在變量,獲取原始數(shù)據(jù)的有效特征表示.同時,建立潛在特征表示與關(guān)鍵質(zhì)量變量之間的回歸模型,實現(xiàn)軟測量應(yīng)用.通過一個數(shù)值算例和一個實際工業(yè)案例,驗證了所提方法的有效性和可行性.
本文的其余部分組織如下.在第1 節(jié)中,簡要回顧了VAE 模型.在第2 節(jié)中,介紹了所提出的MVAER 模型的主要思想和詳細的推導(dǎo)過程,并介紹了基于MVAER 的軟測量建模與應(yīng)用方法.在第3 節(jié)中,通過兩個案例對MVAER 進行了性能評估.最后,在第4 節(jié)中得出本論文的結(jié)論.
VAE 是一種無監(jiān)督的深度生成模型,結(jié)合了深度學(xué)習(xí)和貝葉斯概率推斷的觀點.它假設(shè)數(shù)據(jù)x是由某個具有不可觀測的連續(xù)隨機隱變量z的隨機過程產(chǎn)生的.觀測數(shù)據(jù)的邊際似然可以寫為:
其中,pθ(x|z) 是生成模型,可以被描述為多元高斯分布,p(z) 是先驗,通常被簡單地設(shè)置為標(biāo)準(zhǔn)高斯分布 N (0,1) .
根據(jù)貝葉斯定理,可以得到隱變量z的后驗分布為.然而,由于生成模型的參數(shù)θ和隱變量都是未知的,這里隱變量的積分和后驗概率都是難以處理的.因此,VAE 根據(jù)變分推斷的思想,引入一個額外的變分分布qφ(z|x) 作為推斷模型,來近似難解的真實后驗.與生成模型相似,推斷模型qφ(z|x) 也可以描述為多元高斯分布.
VAE 的優(yōu)化目標(biāo)是最大化邊際似然函數(shù)的證據(jù)下界.
其中,等號右邊的第一項是給定pθ(x|z) 時,lnpθ(x|z)的期望,用來保證重建數(shù)據(jù)與真實數(shù)據(jù)之間的匹配程度;第二項是一個Kullback-Leibler (KL)散度項,可以被看作是一種正則化,指導(dǎo)近似后驗分布盡可能地接近先驗分布.
VAE 的模型結(jié)構(gòu)如圖1 所示.可以看到,在VAE 中,推斷模型qφ(z|x) 被參數(shù)化為一個參數(shù)為φ的神經(jīng)網(wǎng)絡(luò),稱為概率編碼器.它將輸入數(shù)據(jù)映射到低維潛在空間,得到其隱變量表示z,這可以看作是對輸入數(shù)據(jù)的特征提取;pθ(x|z) 被參數(shù)化為另一個參數(shù)為θ的神經(jīng)網(wǎng)絡(luò),稱為概率解碼器,它從潛在空間中重建原始數(shù)據(jù).通過最小化負變分證據(jù)下界,同時優(yōu)化模型的參數(shù)φ和θ.更多詳細內(nèi)容可以參考文獻[26,38-39].
圖1 VAE 模型結(jié)構(gòu)圖Fig.1 Model structure of VAE
在實際應(yīng)用中,傳統(tǒng)的基于VAE 的軟測量方法難以對工業(yè)中廣泛存在的多模態(tài)數(shù)據(jù)進行有效的特征提取.為了解決這一問題,本節(jié)將提出一種混合變分自編碼器回歸模型,并將其應(yīng)用于軟測量模型的構(gòu)建.總體而言,該方法結(jié)合了VAE 框架和高斯混合模型,并將特征提取和回歸建模融為一體,使其對復(fù)雜多模態(tài)過程的關(guān)鍵質(zhì)量指標(biāo)數(shù)據(jù)具有更好的預(yù)測性能.
混合變分自編碼器回歸模型本質(zhì)上是建立在VAE 框架上,同樣可以通過生成模型和推斷模型來描述.
模型假設(shè)輸入數(shù)據(jù)x由隨機連續(xù)潛在變量z生成,z在潛在空間中服從高斯混合分布.為了建立關(guān)鍵質(zhì)量變量,即輸出變量y的回歸模型,假設(shè)y也由潛在變量z生成,那么生成過程可以描述為:
根據(jù)上述生成過程,生成模型可以用聯(lián)合概率分布表示并被分解為:
數(shù)據(jù)樣本點的邊緣概率p(x,y) 的 l og 似然函數(shù)可以推導(dǎo)為:
其中,ELBO(θ,φ;x,y) 是邊緣概率似然函數(shù)的證據(jù)下界;qφ(z,c|x) 是推斷模型,作為一個額外引入的變分后驗,用來逼近難以計算的真實復(fù)雜后驗p(z,c|x),可以被分解為:
圖2 混合變分自編碼器回歸模型結(jié)構(gòu)圖Fig.2 Model structure of the MVAER model
結(jié)合式(4)~ (6),模型的ELBO 可以重寫為:
與VAE 相似,為了計算參數(shù)φ和θ,需要最大化上述的證據(jù)下界ELBO(θ,φ;x,y),這相當(dāng)于最大化邊緣概率似然函數(shù).
其中,μx通過模型解碼器得到,μy通過模型回歸器得到;表示數(shù)據(jù)在每個模式下的潛在特征所服從的高斯分布,其均值和方差通過模型編碼器得到;qφ(c|x) 表示數(shù)據(jù)屬于每個模式的可能性,通過帶有Softmax 層的編碼器計算得到.基于最小化損失函數(shù)的優(yōu)化目標(biāo),可以通過隨機梯度下降等優(yōu)化算法,對模型參數(shù)φ和θ進行更新優(yōu)化.
損失函數(shù)中的前兩項是輸入數(shù)據(jù)的重構(gòu)誤差和輸出數(shù)據(jù)的預(yù)測誤差項,能夠鼓勵模型很好地重構(gòu)輸入數(shù)據(jù)和預(yù)測輸出數(shù)據(jù);后兩項是有關(guān)連續(xù)潛變量z和離散潛變量c的KL 散度項,有助于將原始數(shù)據(jù)中的變化傳播到潛在空間中的隱變量中去,并使后驗和先驗之間更好地匹配.模型期望潛在空間中的離散隱變量c能夠表示與原始混合分布中相對應(yīng)的數(shù)據(jù)集群;潛在空間中的連續(xù)隱變量z能夠表示每個集群內(nèi)的數(shù)據(jù)變化.
在上一小節(jié)中,詳細推導(dǎo)了MVAER 模型.當(dāng)該模型用于工業(yè)過程在線軟測量時,就是對當(dāng)前樣本,表示為xnew,提供相應(yīng)的質(zhì)量變量預(yù)測.
假設(shè)模型中p(y|z)=N(μy,k,I),其中z~q(z|xnew,ck),k=1,2,···,K,那么當(dāng)前數(shù)據(jù)樣本的質(zhì)量變量預(yù)測值計算為:
其中,q(ck|x) 表示當(dāng)前數(shù)據(jù)樣本屬于第k個混合成分的可能性,可以通過模型中的編碼器得到,計算公式如式(11)所示,公式中表示該編碼器除最后Softmax 層之外的部分所代表的函數(shù),則代表該部分的網(wǎng)絡(luò)參數(shù);μy,k表示當(dāng)前樣本質(zhì)量變量y服從的高斯分布的均值,將其視為y的預(yù)測值,可以使用樣本的潛在特征zk為輸入,通過模型中的回歸器得到,計算公式如式(12) 所示,公式中f(·;θy) 表示回歸器所代表的函數(shù),θy則代表回歸器的參數(shù).取所有混合成分下的預(yù)測值的加權(quán)和作為質(zhì)量變量的最終預(yù)測值.
接下來,我們詳細介紹基于MVAER 模型的實際工業(yè)過程軟測量應(yīng)用過程.該過程主要包括兩部分,離線建模和在線預(yù)測.
在離線建模階段,首先要根據(jù)理論分析和操作經(jīng)驗選擇模型的輸入變量,并采集數(shù)據(jù)(包括輸入變量和質(zhì)量變量).對收集到的數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,然后訓(xùn)練MVAER 模型.當(dāng)模型訓(xùn)練完成后,保存模型參數(shù)用于在線質(zhì)量預(yù)測.在線預(yù)測時,對于新采集的待預(yù)測樣本,需要對其進行與離線建模時相同的數(shù)據(jù)預(yù)處理,然后將其送入訓(xùn)練好的模型中,得到質(zhì)量變量的預(yù)測結(jié)果.所提出的基于MVAER 模型的軟測量建模算法總結(jié)如算法1 所示,并將整個過程直觀地體現(xiàn)在如圖3 所示的流程圖中.
圖3 基于MVAER 的軟測量建模流程圖Fig.3 Flowchart for soft sensor modeling based on the MVAER model
為了直觀地評價模型的性能,本文使用均方根誤差(Root mean squared error,RMSE)和R2系數(shù)兩個指標(biāo)來量化模型的預(yù)測效果.RMSE和R2定義如下:
其中,N是樣本個數(shù),yi是第i個樣本的實際輸出值,是第i個樣本的預(yù)測輸出值,是所有樣本實際輸出值的平均值.RMSE 代表預(yù)測誤差,R2表示實際值和預(yù)測值之間的平方相關(guān)關(guān)系.通常,RMSE越小,R2越接近于1,模型的預(yù)測性能越好.
本節(jié)設(shè)置了一個具有三種運行模式的數(shù)值算例,各個高斯組分和關(guān)系的具體情況如表1 所示.每個模式下輸入和輸出之間的關(guān)系都是非線性的.為了構(gòu)建模型,生成500 個樣本作為訓(xùn)練集用于模型訓(xùn)練,生成500 個樣本作為測試集用于模型性能測試.圖4 中分別顯示了X和Y的數(shù)據(jù)分布,可以直觀地看出該算例具有多模態(tài)行為.
表1 數(shù)值算例的配置Table 1 Configuration of the numerical example
圖4 數(shù)值算例的數(shù)據(jù)模式Fig.4 Data pattern of the numerical example
為了驗證MVAER 算法的有效性,將其與偏最小二乘(Partial least squares,PLS)、高斯混合回歸(Gaussian mixture regression,GMR)、自編碼器(Auto-encoder,AE)、變分自編碼器(Variational auto-encoder,VAE)方法進行比較.其中,PLS是一種傳統(tǒng)回歸模型,GMR 是一種典型的多模式建模方法,AE 是常用的深度學(xué)習(xí)建模方法,VAE則是所提出的MVAER 模型的基礎(chǔ)框架.
在MVAER 算法中,將編碼器和譯碼器設(shè)置為具有單層隱藏層,隱藏層的神經(jīng)單元個數(shù)為6;潛在變量的維度設(shè)為2;為了方便,回歸網(wǎng)絡(luò)設(shè)為一個全連接層,即在提取的特征和輸出之間建立一個線性關(guān)系;組分個數(shù)設(shè)為3,這是已知的.GMR 的組分個數(shù)設(shè)為3.每個模型在測試集上的數(shù)值評價指標(biāo)在表2 中列出.
表2 PLS、GMR、AE、VAE和MVAER模型的性能評價指標(biāo)Table 2 Performance evaluation indices of PLS,GMR,AE,VAE and MVAER models
從中可以發(fā)現(xiàn),MVAER 模型的性能明顯優(yōu)于其他模型.PLS、GMR、AE、VAE和MVAER 的詳細預(yù)測值如圖5 所示,散點圖如圖6 所示.
圖5 PLS、GMR、AE、VAE和MVAER模型的預(yù)測結(jié)果圖Fig.5 Predicted results of PLS,GMR,AE,VAE and MVAER models
圖6 預(yù)測結(jié)果散點圖Fig.6 The predicted scatter points of different models
從預(yù)測曲線中可以直觀地看出,PLS 在每個模態(tài)下都不能很好對輸出值進行預(yù)測.相比之下,AE和VAE 模型對于該過程的回歸預(yù)測效果有所改善,對第二模態(tài)樣本有較好的預(yù)測效果.然而,AE和VAE 模型對第一模態(tài)和第三模態(tài)樣本具有較差的預(yù)測能力,從圖中可以看出在這兩個模態(tài)下它們的預(yù)測結(jié)果趨于直線,這表明模型沒有學(xué)習(xí)到相關(guān)的數(shù)據(jù)特性和耦合關(guān)系.GMR和MVAER 對所有模式下的數(shù)據(jù)樣本都有良好的擬合能力,但與GMR相比,MVAER 的預(yù)測曲線更加貼合真實曲線,具有更高的預(yù)測精度.從散點圖中,也能得到相似的結(jié)論.散點圖結(jié)果表明,PLS 等模型的預(yù)測結(jié)果分布較為分散,存在較大的預(yù)測偏差,而MVAER 模型的預(yù)測結(jié)果更加集中和靠近主對角線,這意味著它的預(yù)測效果最好.以上比較和分析表明,PLS 作為線性模型,不能有效提取數(shù)據(jù)中的非線性和多模態(tài)特性,因此不能很好地處理具有復(fù)雜特性的過程,而 AE和VAE 模型雖然可以處理非線性關(guān)系,但無法同時對多個模態(tài)下的耦合關(guān)系進行建模.GMR和MVAER 模型則可以較好地適應(yīng)多模態(tài)過程,并且當(dāng)輸入輸出之間非線性相關(guān)時,MVAER 的性能優(yōu)于GMR.
該工業(yè)案例取自于合成氨過程中的制氫裝置,氫氣是合成氨氣的重要原料之一.根據(jù)工藝設(shè)計,氫氣生產(chǎn)過程中的關(guān)鍵反應(yīng)在一段轉(zhuǎn)化爐中進行,主要是通過脫碳反應(yīng)將脫硫天然氣轉(zhuǎn)化為氫氣.過程的工藝流程圖如圖7[28]所示.根據(jù)反應(yīng)機理,溫度對氫氣的含量和純度有很大的影響,而爐內(nèi)溫度主要取決于稠密燃燒器的燃燒條件.燃燒條件則是通過調(diào)節(jié)爐內(nèi)氧氣含量來控制的.因此,控制一段爐頂部氧氣濃度在規(guī)定的范圍內(nèi)是十分重要的.在實際生產(chǎn)過程中,氧氣含量通常由昂貴的質(zhì)譜儀測量得到.為了降低生產(chǎn)成本,有必要構(gòu)建一種軟傳感器在線估計氧氣含量.
圖7 一段爐工藝流程圖Fig.7 Flowchart of the primary reformer
選擇13 個過程變量作為軟測量模型的輸入變量,包括溫度、流量和壓力,它們易于測量且和氧氣含量變化有關(guān).這13 個過程變量的詳細說明列于表3.收集5 000 個樣本用于構(gòu)建軟測量模型,其中2 500 個樣本作為訓(xùn)練集,其余樣本作為測試集.為了展示MVAER 的有效性,構(gòu)建PLS、GMR和VAE模型進行性能比較.通過試錯方法,將MVAER 的組分個數(shù)K設(shè)置為4,編碼器的隱藏層神經(jīng)單元個數(shù)設(shè)置為32,隱變量的維度設(shè)為10,解碼器的結(jié)構(gòu)與編碼器對稱,回歸器與上述數(shù)值算例中的一樣,是一層全連接層.GMR 的組分個數(shù)設(shè)置為9.VAE 模型的結(jié)構(gòu)參數(shù)與MVAER 中對應(yīng)的參數(shù)保持一致.
表3 一段爐過程變量描述Table 3 The description of the process instruments in the primary reformer
各種方法的性能評價指標(biāo),RMSE和R2,列于表4.通過比較這些結(jié)果可以發(fā)現(xiàn),多模態(tài)建模方法優(yōu)于非多模態(tài)方法,非線性方法優(yōu)于線性方法.其中,MVAER 模型的預(yù)測性能最好.
表4 PLS、GMR、VAE和MVAER模型的性能評價指標(biāo)Table 4 Performance evaluation indices of PLS,GMR,VAE and MVAER models
PLS、GMR、VAE和MVAER 對氧氣濃度的預(yù)測結(jié)果如圖8 所示.直觀上,從圖中可以看出,PLS 模型的預(yù)測結(jié)果比較平穩(wěn),不能很好地追蹤氧氣濃度的變化.其余三種方法的預(yù)測效果都優(yōu)于PLS 模型.其中,VAE 雖然大體上能捕捉氧氣濃度的變化趨勢,但其預(yù)測波動較大,預(yù)測曲線上有較多的毛刺;相比之下,GMR 模型能較好地對氧氣濃度進行預(yù)測,但是其預(yù)測曲線存在較多的尖峰現(xiàn)象.與VAE和GMR 相比,MVAER 模型的預(yù)測效果則有了明顯改善.MVAER 模型的預(yù)測曲線毛刺、尖峰現(xiàn)象更少,與真實值曲線吻合度較高,這意味著我們的模型有更強的擬合能力和更高的預(yù)測精度.幾種模型的預(yù)測誤差和預(yù)測散點圖分別如圖9和圖10 所示,從中也能得到相似的結(jié)論.具體來說,圖9 中顯示MVAER 模型的預(yù)測誤差小于其他幾種方法,大多處于-2和+2 之間.圖10 中顯示,MVAER 模型的預(yù)測結(jié)果分布更加集中,并且最為接近主對角線,這些結(jié)果都反映出MVAER 模型具有較好的預(yù)測性能.
圖8 PLS、GMR、VAE和MVAER 模型的預(yù)測結(jié)果圖Fig.8 Predicted results of PLS,GMR,VAE and MVAER models
圖9 預(yù)測誤差圖Fig.9 The prediction errors of different models
圖10 預(yù)測結(jié)果散點圖Fig.10 The predicted scatter points of different models
總體而言,以上兩個實例的比較和分析表明,面對復(fù)雜多模態(tài)過程,本文所提出的MVAER 模型在捕獲數(shù)據(jù)多模態(tài)特性和非線性等方面表現(xiàn)出較強的能力,能夠有效地對關(guān)鍵質(zhì)量變量進行預(yù)測.
本文提出了一種新的混合變分自編碼器回歸模型,并將其用于復(fù)雜多模態(tài)工業(yè)過程的產(chǎn)品質(zhì)量軟測量.通過結(jié)合高斯混合模型的思想,該方法打破了傳統(tǒng)VAE 中潛在空間單峰分布的限制,能夠有效地提取復(fù)雜多模態(tài)數(shù)據(jù)的潛在特征,并利用潛在特征對產(chǎn)品質(zhì)量變量進行回歸建模.此外,該方法由于其混合概率框架,在不同模態(tài)下將會自動進行質(zhì)量預(yù)測.在兩個案例中,包括一個數(shù)值例子和一個合成氨生產(chǎn)過程一段爐實際工業(yè)過程,與其他幾種方法相比,基于混合變分自編碼器回歸模型的軟傳感器預(yù)測性能最好,驗證了所提方法的有效性和可行性.最后,考慮到過程數(shù)據(jù)中有標(biāo)簽數(shù)據(jù)稀少的實際情況,后續(xù)研究工作可以結(jié)合半監(jiān)督學(xué)習(xí),將所提方法擴展為半監(jiān)督軟測量方法.