于 洪,楊雪梅
(重慶郵電大學(xué) 計(jì)算智能重慶市重點(diǎn)實(shí)驗(yàn)室,重慶 400065)
三支決策(three-way decisions, 3WD)是加拿大Regina大學(xué)姚一豫教授在2009年提出的一種“三分而治”和 “化繁為簡”的處理復(fù)雜問題的理論[1]。其主要思想是將整體分為3個(gè)獨(dú)立的部分,對(duì)不同部分采用不同的處理方法,為復(fù)雜問題求解提供一種有效的策略與方法。三支決策經(jīng)歷了孵化期(1980—2006年)、羽化期(2007—2016年)、成長期(2017年至今)3個(gè)階段[2]。三支決策理論的提出源于20世紀(jì)90年代Yao提出的決策粗糙集理論[3]。
當(dāng)前,我國正處于工業(yè)化和信息化的深度融合時(shí)期,發(fā)展基于工業(yè)大數(shù)據(jù)的人工智能新技術(shù)是實(shí)現(xiàn)從制造大國向制造強(qiáng)國邁進(jìn)的戰(zhàn)略舉措。隨著云平臺(tái)及工業(yè)物聯(lián)網(wǎng)的快速發(fā)展,工業(yè)環(huán)境中的數(shù)據(jù)種類和數(shù)據(jù)規(guī)模迅速增長。此時(shí),有必要將新的理論工具及方法引入到工業(yè)大數(shù)據(jù)分析當(dāng)中,以滿足日益?zhèn)€性化、多樣化、復(fù)雜化的工業(yè)生產(chǎn)決策需求[4]。IBM推出的認(rèn)知計(jì)算代表了智能決策的前沿方向[5]。建立在認(rèn)知計(jì)算基礎(chǔ)上的決策方法可幫助期望從大數(shù)據(jù)中獲益的企業(yè)解決兩大障礙:①數(shù)據(jù)來源不統(tǒng)一、格式混雜造成的數(shù)據(jù)整合難題;②數(shù)據(jù)分析難以被直觀理解和運(yùn)用的問題。通過結(jié)合認(rèn)知計(jì)算有望進(jìn)一步釋放工業(yè)大數(shù)據(jù)的商業(yè)價(jià)值。三支決策正是這樣一種符合人類認(rèn)知的智能信息處理模式,有望為復(fù)雜問題求解提供一種有效的策略。因此,借鑒人類對(duì)復(fù)雜問題求解的認(rèn)知思路,研究基于三支決策理論的工業(yè)大數(shù)據(jù)分析方法及應(yīng)用是非常必要的。
本文對(duì)工業(yè)大數(shù)據(jù)新的特點(diǎn)以及工業(yè)大數(shù)據(jù)智能決策面臨的挑戰(zhàn)進(jìn)行了歸納和總結(jié);然后,舉例闡述了三支決策在工業(yè)大數(shù)據(jù)中的應(yīng)用;最后,對(duì)其今后的研究方向進(jìn)行了探討。
工業(yè)大數(shù)據(jù)即工業(yè)數(shù)據(jù)的總和, 其來源主要包括企業(yè)信息化數(shù)據(jù)、 工業(yè)物聯(lián)網(wǎng)數(shù)據(jù)、 “跨界”數(shù)據(jù)。 如今, 工業(yè)大數(shù)據(jù)被譽(yù)為智能制造的關(guān)鍵要素, 并推動(dòng)生產(chǎn)型制造向服務(wù)型制造轉(zhuǎn)型。 隨著大數(shù)據(jù)技術(shù)的發(fā)展, 工業(yè)大數(shù)據(jù)將在智能化設(shè)計(jì)、 智能化生產(chǎn)、 網(wǎng)絡(luò)化協(xié)同制造、 智能化服務(wù)、 個(gè)性化定制等場景發(fā)揮巨大作用。 那么, 如何高效地從復(fù)雜的工業(yè)數(shù)據(jù)集中發(fā)現(xiàn)新的模式與知識(shí), 是工業(yè)大數(shù)據(jù)智能分析領(lǐng)域亟待解決的科學(xué)問題[6]。
工業(yè)大數(shù)據(jù)除具有一般大數(shù)據(jù)的特征(數(shù)據(jù)容量大、 多樣、 快速和價(jià)值密度低)外, 還具有多時(shí)空性、 強(qiáng)關(guān)聯(lián)性、 準(zhǔn)確性、 閉環(huán)性、 弱監(jiān)督性等特征[7-9]。
多樣性:指數(shù)據(jù)來源廣、數(shù)據(jù)類型復(fù)雜。如工業(yè)數(shù)據(jù),常來源于工業(yè)產(chǎn)品、互聯(lián)網(wǎng)、機(jī)器設(shè)備、管理系統(tǒng)等,并且包含結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化等多種結(jié)構(gòu)數(shù)據(jù)。并且,有的數(shù)據(jù)是高維動(dòng)態(tài)的,有的數(shù)據(jù)采樣周期是不同的,還存在如豎爐焙燒過程磁選管回收率數(shù)據(jù)往往難以在線測量,只能通過人工化驗(yàn)獲得。
快速性:指獲得和處理數(shù)據(jù)的速度。工業(yè)數(shù)據(jù)處理速度需求多樣,生產(chǎn)現(xiàn)場要求分析時(shí)限達(dá)到毫秒級(jí),管理與決策應(yīng)用需要支持交互式或批量數(shù)據(jù)分析。
強(qiáng)關(guān)聯(lián)性:不僅反映了屬性間的關(guān)聯(lián),而且反映了物理對(duì)象之間和過程語義之間的復(fù)雜動(dòng)態(tài)關(guān)聯(lián)關(guān)系。包括產(chǎn)品生命周期設(shè)計(jì)、制造、服務(wù)等不同環(huán)節(jié)數(shù)據(jù)之間的關(guān)聯(lián),產(chǎn)品部件之間的關(guān)聯(lián)關(guān)系,生產(chǎn)過程的數(shù)據(jù)關(guān)聯(lián)以及在產(chǎn)品生命周期的統(tǒng)一階段涉及的不同學(xué)科不同專業(yè)的數(shù)據(jù)關(guān)聯(lián)。
多時(shí)空性:隨著工業(yè)過程中數(shù)據(jù)采樣率的增大、歷史數(shù)據(jù)采樣時(shí)間段的增大、采樣變量規(guī)模的增大,采集存儲(chǔ)到更大容量的多時(shí)空大數(shù)據(jù)。指標(biāo)數(shù)據(jù)與過程數(shù)據(jù)不僅空間上具有相關(guān)性,由于成批次運(yùn)行、動(dòng)態(tài)運(yùn)行操作使得過程變量具有互相關(guān)和強(qiáng)自相關(guān)關(guān)系,時(shí)間尺度上數(shù)據(jù)也呈稀疏分布,且具有時(shí)間序列相關(guān)關(guān)系。
準(zhǔn)確性:主要指數(shù)據(jù)的可靠性、真實(shí)性以及完整性,更加關(guān)注數(shù)據(jù)質(zhì)量、處理、分析技術(shù)以及方法的可靠性。對(duì)數(shù)據(jù)分析的置信度要求較高,僅依靠統(tǒng)計(jì)相關(guān)性分析不足以支撐預(yù)測預(yù)警、故障診斷等工業(yè)應(yīng)用,需要將數(shù)據(jù)模型與物理模型相結(jié)合。
閉環(huán)性:包括產(chǎn)品全生命周期橫向過程中數(shù)據(jù)鏈條的封閉和關(guān)聯(lián),以及智能制造縱向數(shù)據(jù)采集和處理過程中,需要支撐狀態(tài)感知、分析、反饋、控制等閉環(huán)場景下的動(dòng)態(tài)持續(xù)調(diào)整和優(yōu)化決策。
弱監(jiān)督性:工業(yè)大數(shù)據(jù)的快速增長也決定了其弱監(jiān)督性甚至是非監(jiān)督性。特別是一些生產(chǎn)設(shè)備物聯(lián)數(shù)據(jù),由于產(chǎn)生速度快、標(biāo)記代價(jià)大,該類數(shù)據(jù)往往呈現(xiàn)極弱監(jiān)督性。然而物聯(lián)數(shù)據(jù)對(duì)生產(chǎn)流程的整體優(yōu)化起到了難以替代的關(guān)鍵作用。
由于以上特征,工業(yè)大數(shù)據(jù)對(duì)傳統(tǒng)的數(shù)據(jù)管理技術(shù)、大數(shù)據(jù)分析技術(shù)以及決策分析方法均提出了很大的挑戰(zhàn)。工業(yè)生產(chǎn)的動(dòng)態(tài)特征決定了數(shù)據(jù)信息的獲取也是一個(gè)動(dòng)態(tài)的過程。工業(yè)大數(shù)據(jù)多時(shí)空性與閉環(huán)性要求決策模型具有動(dòng)態(tài)持續(xù)優(yōu)化能力。此時(shí),借鑒人類復(fù)雜問題求解的三支決策思想,研究三支多粒度智能決策分析模型與方法,期望在動(dòng)態(tài)變化的生產(chǎn)環(huán)境下不斷地優(yōu)化加強(qiáng)對(duì)數(shù)據(jù)的理解。
針對(duì)當(dāng)前生產(chǎn)知識(shí)體系下難以決策的任務(wù),用戶既可以在已有知識(shí)體系下給出博弈后的一個(gè)二支決策結(jié)果,也可以利用三支決策的思想等待動(dòng)態(tài)信息以幫助進(jìn)一步?jīng)Q策。事實(shí)上,根據(jù)人類認(rèn)知習(xí)慣以及心理特點(diǎn),人類通常更傾向于將對(duì)象劃分到帶偏序關(guān)系的3部分,而不是直接將決策對(duì)象嚴(yán)格地排序。然后,基于這3部分再進(jìn)行相應(yīng)的決策動(dòng)作。典型的供應(yīng)商選擇決策、評(píng)價(jià)決策問題等均可采用這種三支決策策略。
又如,廣泛存在于設(shè)備層、控制層、車間層的各類動(dòng)態(tài)運(yùn)行操作數(shù)據(jù)采集周期是不一致的。有的數(shù)據(jù)采集容易、采集周期短、低價(jià)值密度,通常是高頻數(shù)據(jù);有的數(shù)據(jù)采集不容易、采集周期長、付出代價(jià)大,大多是低頻數(shù)據(jù)。此時(shí),針對(duì)這類動(dòng)態(tài)帶時(shí)序的、決策知識(shí)需要?jiǎng)討B(tài)更新的決策問題,用戶可以結(jié)合三支漸進(jìn)決策的思想來解決。
針對(duì)工業(yè)大數(shù)據(jù)的極弱監(jiān)督性,可以采用三支決策聚類模型逐步地、有效地利用少量標(biāo)簽信息或該領(lǐng)域?qū)<抑R(shí),構(gòu)建合適的多粒度聚類分析算法予以解決。由此可見,這些基于三支決策的新思路有望為工業(yè)大數(shù)據(jù)決策分析帶來新的理論模型和計(jì)算方法。
本文借鑒人類對(duì)復(fù)雜問題求解的認(rèn)知思路,提出了融合三支決策理論到工業(yè)大數(shù)據(jù)分析中。在此,給出三支決策在鋁電解過熱度預(yù)測、大型分層組織機(jī)構(gòu)中成員評(píng)價(jià)問題以及加熱爐鋼溫軟預(yù)測問題中的應(yīng)用示例。
我國已成為全球最大的鋁電解生產(chǎn)國。截至2015年底,我國電解鋁、氧化鋁產(chǎn)量分別占全球電解鋁和氧化鋁產(chǎn)量的54.5%和48.8%[10]。然而,我國鋁電解行業(yè)仍面臨著諸多挑戰(zhàn),如資源緊缺、能源消耗巨大、環(huán)境制約、嚴(yán)重依賴人工決策等等。如何在保證產(chǎn)品性能、質(zhì)量、成本的前提下,實(shí)現(xiàn)鋁電解生產(chǎn)的高效化、綠色化、智能化轉(zhuǎn)型是鋁電解行業(yè)亟待解決的問題。而研究面向工業(yè)大數(shù)據(jù)的智能決策新方法有望成為促進(jìn)鋁電解行業(yè)智能化、可持續(xù)化發(fā)展的有力途徑。
在鋁電解生產(chǎn)中電解槽過熱度是關(guān)乎生產(chǎn)效率、生產(chǎn)質(zhì)量的關(guān)鍵性指標(biāo)。而鋁電解槽過熱度的測量一直是一個(gè)世界性難題。過熱度是指鋁電解中電解質(zhì)溫度與電解質(zhì)初晶溫度之間的差值。將過熱度保持在5℃到12℃之間有利于形成規(guī)整的槽堂內(nèi)形,進(jìn)而能夠穩(wěn)定生產(chǎn),減少水平電流,提高電流效率,延長電解槽壽命。但由于工業(yè)鋁電解現(xiàn)場是一個(gè)強(qiáng)磁場、高溫、高濕、含高濃度腐蝕氣體、粉塵的環(huán)境,因此,目前業(yè)界還難以在線獲得過熱度。在實(shí)際生產(chǎn)中,鋁廠往往通過人工經(jīng)驗(yàn)視察法來離線判斷過熱度,通過已有的經(jīng)驗(yàn)公式和電解質(zhì)成分化學(xué)分析來計(jì)算過熱度。但進(jìn)行電解質(zhì)成分化學(xué)分析花費(fèi)時(shí)間較長,導(dǎo)致結(jié)果不能得到及時(shí)反饋和控制生產(chǎn)。由于過熱度與電解質(zhì)成分之間的關(guān)系十分復(fù)雜,并且各個(gè)電解鋁廠的電解質(zhì)成分不同,因此,很難用一個(gè)統(tǒng)一的過熱度數(shù)學(xué)模型來對(duì)過熱度進(jìn)行計(jì)算。這些都對(duì)過熱度的軟測量帶來了一定的困難[11-12]。
目前,曹丹陽等人提出了一種基于Restreken公式的初晶溫度預(yù)測方法,通過對(duì)電解質(zhì)成分的分析計(jì)算初晶溫度,進(jìn)而通過初晶溫度計(jì)算得出槽過熱度[13]。考慮到各個(gè)鋁廠電解質(zhì)組成復(fù)雜,而且電解質(zhì)成分分析是一種后期化學(xué)成分分析,難以在線實(shí)現(xiàn)。為了盡可能地使用在線測量信息,通過與電解鋁行業(yè)專家研討認(rèn)為,通過分子比對(duì)初晶溫度進(jìn)行估算進(jìn)而估計(jì)過熱度的方法可能會(huì)是一種有效的途徑。因此,采用了鋁電解歷史生產(chǎn)數(shù)據(jù)中的分子比來計(jì)算初晶溫度,進(jìn)而實(shí)現(xiàn)過熱度計(jì)算,并基于三支決策思想把過熱度劃分為高、中、低3個(gè)部分[14]。
使用工業(yè)鋁電解中電解槽的歷史生產(chǎn)數(shù)據(jù),通過機(jī)器學(xué)習(xí)方法提取各個(gè)參數(shù)與過熱度之間的規(guī)則[14]。由于分類規(guī)則具有較強(qiáng)的可理解性,因此得到廣泛地研究與應(yīng)用。如:Yan等使用粗糙集理論,在沒有先驗(yàn)知識(shí)的情況下,通過時(shí)間、空間與河水富營養(yǎng)化的關(guān)系,提取了季節(jié)、地區(qū)等屬性與河水富營養(yǎng)化的規(guī)則[15];朱鵬飛和胡清華[16]通過觀察支持向量機(jī)中樣本的分布區(qū)域定義了一致區(qū)域,并提出了覆蓋約簡算法進(jìn)行規(guī)則提取。但在實(shí)際應(yīng)用中存在著大量的動(dòng)態(tài)數(shù)據(jù),隨著時(shí)間的遞進(jìn),數(shù)據(jù)集中的數(shù)據(jù)量會(huì)不斷增加,以上靜態(tài)規(guī)則獲取方法無法有效應(yīng)對(duì)動(dòng)態(tài)增量式數(shù)據(jù)。目前,面向動(dòng)態(tài)數(shù)據(jù)集的規(guī)則獲取及規(guī)則更新方法已經(jīng)有較多的研究成果。Huang等將粗糙集理論與決策樹相結(jié)合,提出了一種動(dòng)態(tài)規(guī)則獲取方法[17]。Kim和Park基于模糊神經(jīng)網(wǎng)絡(luò)提出了一種動(dòng)態(tài)規(guī)則獲取方法[18]。楊吉森等提出了一種基于規(guī)則樹的增量式過熱度軟測量模型[19]。該模型通過應(yīng)用粗糙集理論中值約簡方法來提取規(guī)則,利用規(guī)則樹對(duì)規(guī)則進(jìn)行存儲(chǔ)并實(shí)現(xiàn)對(duì)過熱度的軟測量,進(jìn)而設(shè)計(jì)了規(guī)則樹的增量式學(xué)習(xí)方法。該模型具有在線學(xué)習(xí)功能,通過在生產(chǎn)過程中的動(dòng)態(tài)學(xué)習(xí),有望進(jìn)一步提高過熱度軟測量準(zhǔn)確率。
圖1為面向工業(yè)鋁電解生產(chǎn)的過熱度預(yù)測模型框架,主要包括數(shù)據(jù)預(yù)處理、規(guī)則提取、規(guī)則存儲(chǔ)與增量式更新4個(gè)部分。
圖1 工業(yè)鋁電解中的過熱度軟測量框架Fig.1 Soft sensing prediction framework of superheatdegree in industrial aluminum electrolysis
表1為使用魏橋鋁電公司部分車間從2015年11月至2016年5月的鋁電解生產(chǎn)數(shù)據(jù)集,將規(guī)則樹的增量式學(xué)習(xí)方法與啟發(fā)式值約簡算法、隨機(jī)子空間方法、隨機(jī)森林方法、M5方法進(jìn)行對(duì)比得到的實(shí)驗(yàn)驗(yàn)證結(jié)果。
表1 各種方法在鋁電解生產(chǎn)數(shù)據(jù)集上的準(zhǔn)確率Tab.1 Accuracy of various methods in aluminum electrolysis production data set
由表1可知,本文所提方法在針對(duì)鋁電解生產(chǎn)時(shí)實(shí)際效果會(huì)更好。雖然,該方法在最初表現(xiàn)不是最佳的,但隨著數(shù)據(jù)的增加,該方法全面超越了對(duì)比的分類方法。并且隨著數(shù)據(jù)的增加,該方法的準(zhǔn)確率也逐步提升。
由實(shí)驗(yàn)結(jié)果可知,本文所提模型對(duì)于鋁電解工業(yè)中的過熱度預(yù)測問題具有一定的有效性和可行性。
分層組織是生產(chǎn)生活中常見的一種企業(yè)組織架構(gòu),表現(xiàn)為較高粒度層上的某個(gè)對(duì)象由較低粒度層上的某些對(duì)象構(gòu)成。如國家單位、企業(yè)集團(tuán)和其他非盈利組織等大部分組織結(jié)構(gòu)都具有分層組織架構(gòu)。當(dāng)前集團(tuán)企業(yè)面臨著一個(gè)挑戰(zhàn)性問題,即如何對(duì)具有分層組織架構(gòu)的企業(yè)中的多級(jí)分層評(píng)價(jià)對(duì)象進(jìn)行聯(lián)合評(píng)價(jià)。以鋁電解集團(tuán)企業(yè)分層組織機(jī)構(gòu)成員評(píng)價(jià)活動(dòng)為例進(jìn)行說明。對(duì)于一個(gè)鋁電解集團(tuán)企業(yè),其成員架構(gòu)猶如一個(gè)分層的樹形結(jié)構(gòu)(見圖2)。
圖2 一個(gè)分層組織機(jī)構(gòu)例子Fig.2 An example of hierarchical organization
從層級(jí)組織的角度來看,一個(gè)鋁電解集團(tuán)企業(yè)可分4個(gè)層級(jí):集團(tuán)層、分廠層、車間層以及電解槽層。其中,一個(gè)集團(tuán)由多個(gè)工廠構(gòu)成,一個(gè)工廠由多個(gè)車間構(gòu)成,一個(gè)車間又由多個(gè)電解槽構(gòu)成。從粒計(jì)算的角度來看,該鋁電解集團(tuán)企業(yè)中成員對(duì)象之間具有分層包含的關(guān)系,實(shí)際上是一種分層多粒度結(jié)構(gòu)。諸如鋁電解集團(tuán)企業(yè)的管理層迫切需要對(duì)具有分層組織架構(gòu)特征的成員對(duì)象進(jìn)行聯(lián)合評(píng)價(jià)。在分層組織架構(gòu)的成員對(duì)象聯(lián)合評(píng)價(jià)中,評(píng)價(jià)信息具有逐層傳遞的特征,即不同層其評(píng)價(jià)指標(biāo)不同,且要求較高層成員的評(píng)價(jià)需要承接較低層成員的評(píng)價(jià)結(jié)果,評(píng)價(jià)信息傳遞過程如圖3所示。
在分層組織結(jié)構(gòu)成員的評(píng)價(jià)中,傳統(tǒng)評(píng)價(jià)方法存在一些問題。一方面,傳統(tǒng)的評(píng)價(jià)方法大部分僅適用于單一層次結(jié)構(gòu)的成員評(píng)價(jià),針對(duì)具有分層組織架構(gòu)特征的成員評(píng)價(jià)是無效的。另一方面,傳統(tǒng)評(píng)價(jià)方法往往是針對(duì)小規(guī)模評(píng)價(jià)對(duì)象,且通常是給出評(píng)價(jià)對(duì)象間的排序,然而,嚴(yán)格的排序可能并非是管理者所需的。因此,針對(duì)具有大規(guī)模評(píng)價(jià)對(duì)象且具有分層組織架構(gòu)的成員進(jìn)行評(píng)價(jià)時(shí),分級(jí)評(píng)價(jià)比排序評(píng)價(jià)更為實(shí)用。
圖3 評(píng)價(jià)信息流圖Fig.3 Evaluation information flow diagram
針對(duì)分層組織架構(gòu)成員評(píng)價(jià)問題,提出了一種基于多準(zhǔn)則的三分類多粒度評(píng)價(jià)模型[20]。考慮到管理者往往并不關(guān)心成員對(duì)象之間的嚴(yán)格排序,更關(guān)心哪些對(duì)象狀態(tài)較好,哪些對(duì)象狀態(tài)較差,因此,基于三支決策思想,將評(píng)價(jià)對(duì)象劃分為3個(gè)等級(jí),即一等、二等、和三等。對(duì)于分層組織架構(gòu)成員的評(píng)價(jià),需要解決較低層評(píng)價(jià)信息向較高層的傳遞問題。針對(duì)該問題,將前一層的輸出結(jié)果轉(zhuǎn)換為其后一層的輸入條件[21]。
圖4 分層組織圖解Fig.4 Hierarchical organization diagram
圖5 單粒度評(píng)價(jià)算法流程Fig.5 Flow chart of single granularityevaluation algorithm
在圖2的例子中, 分廠層、車間層以及電解槽層對(duì)應(yīng)的評(píng)價(jià)指標(biāo)如表2所示。在這個(gè)4層結(jié)構(gòu)中,只需要評(píng)價(jià)前3個(gè)粒層上的對(duì)象。將對(duì)象的評(píng)價(jià)指標(biāo)分為3類:收益屬性, 該類屬性值越大越好, 如槽壽命; 消耗屬性, 該類屬性值越低越好, 如陽極消耗速率; 非單調(diào)屬性, 該類屬性既有收益也有消耗, 并有一個(gè)最優(yōu)值, 屬性值越靠近最優(yōu)值越好。
圖6 多粒度層次評(píng)價(jià)模型框架Fig.6 Multi-granularity hierarchical evaluation model framework
該模型將基于TOPSIS的三支決策評(píng)價(jià)模型[21]進(jìn)行改進(jìn)和拓展,把單粒度拓展到多粒度,將定性評(píng)價(jià)方法和定量評(píng)價(jià)方法TWD-TOPSIS進(jìn)行改進(jìn),結(jié)合基于多準(zhǔn)則排序的相關(guān)策略最終得到每個(gè)粒度上的評(píng)價(jià)結(jié)果[20]。
鋼鐵工業(yè)對(duì)國民經(jīng)濟(jì)發(fā)展和社會(huì)穩(wěn)定至關(guān)重要。為了鋼鐵工業(yè)的可持續(xù)發(fā)展,目前行業(yè)的節(jié)能減排、綠色制造已經(jīng)提到了首要位置。無疑,對(duì)鋼鐵生產(chǎn)的各個(gè)環(huán)節(jié),都要致力于研究節(jié)能減排的措施和方法。其中,在熱軋生產(chǎn)線上,鋼坯加熱爐是一個(gè)非常重要的設(shè)備,其能耗占比很大,如何提高其加熱效率,降低能耗,提高成材率,是實(shí)現(xiàn)綠色鋼鐵制造的關(guān)鍵所在[22]。
表2 圖2例子系統(tǒng)中的評(píng)價(jià)指標(biāo)Tab.2 Evaluation index in the system of the example in Fig.2
加熱爐作為鋼鐵工業(yè)過程中的重要設(shè)備,經(jīng)過加熱爐加熱進(jìn)入熱軋機(jī)的鋼坯加熱情況對(duì)最終的鋼材質(zhì)量有直接影響。實(shí)際中也通常以出爐鋼溫作為加熱過程效能的判斷標(biāo)準(zhǔn)。因此,為了保證鋼坯質(zhì)量并實(shí)現(xiàn)節(jié)能環(huán)保,必須對(duì)其出口鋼溫進(jìn)行準(zhǔn)確控制[23]。
由于檢測技術(shù)的限制, 很難直接在爐內(nèi)對(duì)鋼坯溫度進(jìn)行測量。 目前, 較為常用的方法是建立加熱爐的鋼溫預(yù)報(bào)模型對(duì)出爐鋼坯溫度進(jìn)行預(yù)測。
很多學(xué)者做了大量的研究,梁軍通過有限元分析和有限差分分析方法對(duì)整個(gè)鋼坯進(jìn)行了離散化,同時(shí)考慮了現(xiàn)場測定的方程邊界條件,以此建立了爐內(nèi)鋼坯的加熱模型[24];也有學(xué)者考慮了過程中鋼坯表面氧化鐵皮的產(chǎn)生和與時(shí)間相關(guān)的邊界條件,利用有限差分法和控制體積法提出了一種用于鋼坯三維瞬態(tài)溫度預(yù)測的數(shù)值熱傳導(dǎo)模型[25];Jang等人為了在步進(jìn)梁式加熱爐中以最小的能耗獲得鋼坯的最佳加熱方式,建立鋼坯溫度歷史預(yù)報(bào)的二維數(shù)學(xué)傳熱模型[26];Tang等人通過利用有限差分法建立了步進(jìn)梁式加熱爐中板坯加熱的二維數(shù)值傳熱模型[27];Jang為不同滑塊高度的鋼坯建立了三維傳熱模型[28];Osintsev在有限體積法應(yīng)用于加熱爐數(shù)學(xué)模型的基礎(chǔ)上提出了用有限體積法結(jié)合組合差分格式對(duì)連續(xù)爐的加熱區(qū)進(jìn)行計(jì)算的方法[29]。
從另一角度出發(fā),有學(xué)者提出了借助總括熱吸收率的方法。安等人運(yùn)用了總括熱吸收率的方法簡化了爐膛內(nèi)輻射換熱,針對(duì)步進(jìn)式鋼坯加熱爐建立了鋼坯加熱過程數(shù)學(xué)模型,同時(shí)也給出了爐膛熱平衡數(shù)學(xué)模型、爐膛換熱過程數(shù)學(xué)模型以及鋼坯氧化過程數(shù)學(xué)模型[30]。但是,總括熱吸收率會(huì)隨著生產(chǎn)條件的變化而變化,因此,如何求解準(zhǔn)確的總括熱吸收率是很重要的。陳等人給出了一種修正總括熱吸收率試算的算法[31]。
這些方法大部分是基于機(jī)理所建立的。這種建模因?yàn)闊o法考慮加熱過程中作用機(jī)理不清楚的因素,也無法考慮加熱過程中動(dòng)態(tài)變化造成的影響,因此,自適應(yīng)性較差。該類建模過程中需要事先做諸多假設(shè),并且在實(shí)際生產(chǎn)過程中加熱爐還會(huì)受到很多隨機(jī)因素的影響。因此,該類模型在精度方面也存在難以滿足用戶要求的問題。
鑒于機(jī)理建模方法的局限性,同時(shí),加熱爐現(xiàn)場可以方便地獲得大量相關(guān)數(shù)據(jù),一些學(xué)者采用了基于數(shù)據(jù)驅(qū)動(dòng)的智能建模方法建立了加熱爐鋼坯溫度預(yù)測模型。
姜等人基于RBF神經(jīng)網(wǎng)絡(luò)建立了鋼坯溫度預(yù)報(bào)模型[32],通過收集影響鋼坯溫度的相關(guān)數(shù)據(jù)樣本,來對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到鋼坯溫度預(yù)測模型,實(shí)現(xiàn)了鋼坯溫度的較為準(zhǔn)確的預(yù)報(bào);王等人提出了基于模糊聚類的鋼坯溫度神經(jīng)網(wǎng)絡(luò)軟測量模型[33],用聚類算法對(duì)訓(xùn)練樣本進(jìn)行聚類,用分布式RBF網(wǎng)絡(luò)對(duì)每類樣本進(jìn)行訓(xùn)練。Yang等人介紹了一種基于相關(guān)向量機(jī)的步進(jìn)式加熱爐軟件傳感預(yù)測模型[34],此模型是利用支持向量機(jī)進(jìn)行的回歸方法建模。楊等人為了實(shí)現(xiàn)鋼坯出爐溫度精準(zhǔn)檢測與控制的目的,采用了基于數(shù)據(jù)驅(qū)動(dòng)的研究方法建立加熱爐鋼坯出爐溫度預(yù)報(bào)模型[35]。楊等人針對(duì)加熱爐工業(yè)過程具有復(fù)雜、非線性、時(shí)滯性的特點(diǎn)和鋼坯出爐溫度預(yù)報(bào)問題,提出了一種基于數(shù)據(jù)特征的改進(jìn)主元回歸加熱爐鋼溫預(yù)報(bào)模型的建立方法[23],該方法在預(yù)測鋼坯出爐溫度方面具有更好的性能。
雖然上述基于數(shù)據(jù)驅(qū)動(dòng)的方法存在優(yōu)勢,但忽略了加熱爐運(yùn)行中固在的波動(dòng)現(xiàn)象。這種波動(dòng)現(xiàn)象使得產(chǎn)生的數(shù)據(jù)也存在很大的波動(dòng)性,會(huì)導(dǎo)致產(chǎn)生的數(shù)據(jù)中存在著一定的不確定性,這種波動(dòng)現(xiàn)象會(huì)降低預(yù)測模型的準(zhǔn)確性。隨著新技術(shù)的出現(xiàn),三支聚類[15]是解決不確定性問題的一種有效方法。因此,將三支聚類分析的方法引入其中,首次嘗試采用三支聚類分析來解決加熱爐運(yùn)行中固在的波動(dòng)現(xiàn)象,其目的是為了盡可能消除波動(dòng)現(xiàn)象帶來的影響??紤]到人工神經(jīng)網(wǎng)絡(luò)具有很好的逼近性能,同時(shí)能夠很好地體現(xiàn)出系統(tǒng)的非線性特性,和因?yàn)檫^程機(jī)理不清楚給建模帶來的困難,所以,提出的模型是基于ANN建立的。基于以上分析,提出了基于三支聚類的方法來解決這一方面的問題,該項(xiàng)工作有望通過消除實(shí)際生產(chǎn)中存在的波動(dòng)現(xiàn)象產(chǎn)生的影響來提高預(yù)測模型的精度[36]。
圖7為基于三支聚類和人工神經(jīng)網(wǎng)絡(luò)的加熱爐鋼溫軟預(yù)測模型(TW-ANNs)的整體框架,是為了解決上述問題而提出的,由3個(gè)階段組成。
第一階段: 利用三支聚類算法對(duì)預(yù)處理的數(shù)據(jù)集進(jìn)行聚類。 使用三支聚類算法[16]將數(shù)據(jù)劃分為多個(gè)類簇, 使相似的數(shù)據(jù)可以劃分為相同的類。
第二階段:通過對(duì)不同聚類數(shù)據(jù)的訓(xùn)練,建立相應(yīng)的預(yù)測模型。例如,在仿真系統(tǒng)中有3個(gè)子預(yù)測模型,不確定樣本是通過三支聚類得到的,即它們來自類簇的邊緣區(qū)域。對(duì)于任意一個(gè)類簇i,假設(shè)Ci是類簇的核心域,Oi是同時(shí)屬于多個(gè)類簇的樣本。設(shè)Zi是預(yù)測模型的評(píng)價(jià)函數(shù),這個(gè)評(píng)價(jià)函數(shù)是平均絕對(duì)誤差(mean absolute error)和均方根誤差(root mean squared error)。然后,在Oi∪Ci上再一次訓(xùn)練子預(yù)測模型。如果在Oi∪Ci上的Zi比Ci上的Zi好,那么,選擇更新之后的子預(yù)測模型。也就是說,通過分析將重疊樣本添加到相應(yīng)的訓(xùn)練數(shù)據(jù)中,是否能提高模型的預(yù)測精度來選擇最優(yōu)模型。這些子預(yù)測模型的生成是根據(jù)不同類簇的數(shù)據(jù)生成的,所以,每一個(gè)子預(yù)測模型將會(huì)是不一樣的。對(duì)相似性高的數(shù)據(jù)進(jìn)行訓(xùn)練,預(yù)測模型會(huì)提高預(yù)測結(jié)果的精準(zhǔn)度。
圖7 TW-ANNs模型的整體框架Fig.7 The overall framework of the TW-ANNs model
第三階段:為了保證預(yù)測結(jié)果的可信度,對(duì)新來的數(shù)據(jù)通過“劃分判定協(xié)同預(yù)測”的方式來給出預(yù)測結(jié)果。這是因?yàn)楸疚乃岢龅哪P褪墙⒃谔幚聿淮_定性樣本的基礎(chǔ)上,所以在預(yù)測后續(xù)數(shù)據(jù)時(shí),不能以“劃分預(yù)測”的方式對(duì)新的樣本進(jìn)行預(yù)測。因此,提出了“劃分判定協(xié)同預(yù)測”的方式對(duì)新的樣本進(jìn)行預(yù)測。步驟如下:首先,根據(jù)聚類的劃分標(biāo)準(zhǔn)將新樣本劃分到相似的類簇中。然后,判定該新樣本是否屬于該類簇的重疊部分區(qū)域。如果不屬于重疊部分,可以直接通過該類簇上的固定模型進(jìn)行預(yù)測得到結(jié)果;如果新樣本屬于重疊部分區(qū)域,則需要通過包含重疊部分區(qū)域的類簇上訓(xùn)練的模型相互協(xié)同來得到結(jié)果。最后,給出預(yù)測的結(jié)果。
使用某鋼鐵工業(yè)中的加熱爐自2019年9月11日至10月11日期間采集的現(xiàn)場生產(chǎn)數(shù)據(jù)作為數(shù)據(jù)集,在平均絕對(duì)誤差(mean absolute error)、均方根誤差(root mean squared error)的評(píng)價(jià)指標(biāo)上,將本文所提TW-ANNs方法與ANN、HCM-SVRs、MFCM-SVRs、TW-SVRs、HCM-ANNs幾種方法進(jìn)行對(duì)比實(shí)驗(yàn),結(jié)果如表3所示。
表3 不同方法的預(yù)測指標(biāo)Tab.3 Prediction indicators of different methods
由表3可知, 與ANN相比, HCM-ANNs和TW-ANNs在各類聚類上的評(píng)價(jià)指標(biāo)普遍有所提高, 但是在HCM-ANNs方法和HCM-SVRs方法中的 Class 2的指標(biāo)顯示是很低的。 然而, 加入了基于三支聚類的TW-SVRs和TW-ANNs方法之后能夠比較好地解決這一現(xiàn)象。 為了直觀地觀察, Class 2中的出爐溫度如圖8所示, 可以看出, 這里數(shù)據(jù)的波動(dòng)性非常大, 由此導(dǎo)致了指標(biāo)的降低。 相比之下, 可以很明顯地看出本文提出的方法比較好地解決了這一現(xiàn)象, 具有更高的精度。 同時(shí), 本文提出的TW-ANNs方法同樣比TW-SVRs方法在指標(biāo)上具有優(yōu)勢。 觀察這些數(shù)據(jù)可以看到, 所提出的預(yù)測模型可以很好地預(yù)測鋼坯溫度的趨勢。
圖8 Class 2中的出爐溫度值Fig.8 The furnace temperature in Class 2
此外,圖9,10直觀地描述了評(píng)價(jià)指標(biāo),可以看出,通過TW-ANNs處理之后的指標(biāo)均比其他比較方法的指標(biāo)好,證明了在預(yù)測問題中引入不確定處理策略的優(yōu)越性。同時(shí),也證明了基于三支聚類和人工神經(jīng)網(wǎng)絡(luò)的出口溫度預(yù)測方法是相當(dāng)可靠的。對(duì)于加熱爐的穩(wěn)定運(yùn)行和提高鋼坯加熱質(zhì)量具有重要意義。
圖9 不同方法的MAE指標(biāo)Fig.9 MAE indicator of different methods
圖10 不同方法的RMSE指標(biāo)Fig.10 RMSE indicator of different methods
綜上所述,從工業(yè)大數(shù)據(jù)智能決策的要求來看,現(xiàn)有決策方法和技術(shù)存在靜態(tài)優(yōu)化多、動(dòng)態(tài)學(xué)習(xí)少,局部、孤立、基于精確模型的優(yōu)化較容易,多環(huán)節(jié)、異構(gòu)、不確定性決策較困難的問題,在前述研究成果的基礎(chǔ)上還有很多可以進(jìn)一步拓展研究的內(nèi)容。
要實(shí)現(xiàn)復(fù)雜工業(yè)過程中的決策智能化,還缺乏將自上而下的知識(shí)和自下而上的數(shù)據(jù)兩類資源在工業(yè)生產(chǎn)過程中的人、機(jī)、物系統(tǒng)中實(shí)現(xiàn)有效融合的方法;針對(duì)工業(yè)大數(shù)據(jù)全流程動(dòng)態(tài)性,還缺乏有效的能持續(xù)優(yōu)化決策的模型;針對(duì)工業(yè)大數(shù)據(jù)對(duì)處理高效性的要求,還缺乏高效的計(jì)算方法。三支決策和粒計(jì)算是一種符合人類認(rèn)知的智能信息處理模式,是解決復(fù)雜問題的一種有效的策略和方法。針對(duì)以上問題,未來可進(jìn)一步研究“數(shù)據(jù)-知識(shí)”融合驅(qū)動(dòng)、能夠處理不確定性復(fù)雜工業(yè)大數(shù)據(jù)的三支多粒度智能決策模型與方法。
模仿人類的認(rèn)知機(jī)制,構(gòu)造智能計(jì)算模型是人工智能研究的重要方法。本文歸納總結(jié)了工業(yè)大數(shù)據(jù)新的特點(diǎn),分析了工業(yè)大數(shù)據(jù)智能決策面臨的挑戰(zhàn)。從工業(yè)大數(shù)據(jù)實(shí)際應(yīng)用案例分析中可以看到,對(duì)于三支工業(yè)大數(shù)據(jù)分析方面已經(jīng)初見成效,但對(duì)于人機(jī)認(rèn)知機(jī)制結(jié)合、數(shù)據(jù)知識(shí)融合方面仍有待進(jìn)一步研究。人類認(rèn)知除了具有多粒度認(rèn)知機(jī)制外,還具有復(fù)雜信息轉(zhuǎn)化、經(jīng)驗(yàn)學(xué)習(xí)、概念化、直覺、聯(lián)想記憶等特點(diǎn),如何使智能系統(tǒng)具備和人類相似的認(rèn)知行為能力,將是未來人工智能發(fā)展的方向。