崔嵐 鄭懷宇
摘 要:準(zhǔn)確的連續(xù)退火爐溫度控制是高質(zhì)量冷軋生產(chǎn)的基本要求,然而變量的不確定性和不完整性以及測(cè)量誤差的存在使這項(xiàng)任務(wù)具有挑戰(zhàn)性。人工神經(jīng)網(wǎng)絡(luò)在這一領(lǐng)域雖然得到了廣泛的應(yīng)用,但是它們可能無(wú)法提供所需的準(zhǔn)確性。隨著深度置信網(wǎng)絡(luò)、堆疊自編碼機(jī)等算法的出現(xiàn),使得越來(lái)越多的學(xué)者傾向于對(duì)無(wú)監(jiān)督—微調(diào)模型的研究。人們寄期望于無(wú)監(jiān)督模型可以挖掘出數(shù)據(jù)中潛在的關(guān)系和知識(shí),然后通過(guò)微調(diào)引導(dǎo),從而得到一個(gè)更好、更具魯棒性的模型?;谠撍枷?,將粗糙集理論引入退火爐的神經(jīng)網(wǎng)絡(luò)“遺忘門(mén)”部分,通過(guò)粗糙集理論決定變量的淘汰和保留。
關(guān)鍵詞:粗糙集;神經(jīng)網(wǎng)絡(luò);RST
RESEARCH ON NEURAL NETWORK MODEL FOR CONTINUOUS ANNEALING FURNACE TEMPERATURE BASED ON RST
Cui Lan? ? Zheng Huaiyu
(Benxi Iron and Steel(Group)Co.Ltd.? ? Benxi? ? 117000,China)
Abstract:Accurate continuous annealing furnace temperature control is a fundamental requirement for high-quality cold rolling production, but the uncertainty and incompleteness of variables, as well as the presence of measurement errors, make this task challenging. Although artificial neural networks have been widely used in this field, they may not provide the required accuracy. With the emergence of algorithms such as deep confidence networks and stacked self coding machines, more and more scholars are inclined to study unsupervised fine-tuning models. People expect unsupervised models to uncover potential relationships and knowledge in the data, and then fine-tune guidance to obtain a better and more robust model. Based on this idea, this article introduces rough set theory into the "forgetting gate" part of the neural network of the annealing furnace, and determines the elimination and retention of variables through rough set theory.
Key words:rough set theory;neural network;RST
1? ? 粗糙集理論概述
粗糙集理論(Rough Set Theory,RST)是Pawlak提出的,用于處理機(jī)器學(xué)習(xí)和模式識(shí)別領(lǐng)域那些不確定、不精確的或者是模糊知識(shí)的一種數(shù)學(xué)工具[1-2]。粗糙集理論首先定義一個(gè)信息系統(tǒng) ,其中 表示有限非空對(duì)象集合,也叫論域; 是有限非空屬性集合,也稱之為條件屬性集; 是值域集合。每個(gè)屬性 都與一個(gè)論域集合 和 相聯(lián)系。知識(shí)約簡(jiǎn)是粗糙集理論中的重要思想,其準(zhǔn)則是盡量不改變系統(tǒng)的性能,盡可能多的刪除冗余的或者重復(fù)的知識(shí),這種特性對(duì)神經(jīng)網(wǎng)絡(luò)“遺忘門(mén)”的搭建起到重要的用。
2? ? 基于粗糙集理論的神經(jīng)元
粗糙集神經(jīng)網(wǎng)絡(luò)由傳統(tǒng)神經(jīng)元和相互連接的粗糙神經(jīng)元組成,粗糙神經(jīng)元 可以看作是一對(duì)神經(jīng)元,一個(gè)是上界 ,另一個(gè)是下界 。粗糙神經(jīng)元的輸出是一對(duì)上界和下界,而傳統(tǒng)神經(jīng)元的輸出是單個(gè)值。該神經(jīng)網(wǎng)絡(luò)模型使用多層、前饋和反向傳播設(shè)計(jì)來(lái)描述,由一個(gè)輸入層、一個(gè)輸出層和一個(gè)隱含層組成。以粗糙集神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),單個(gè)粗糙神經(jīng)元和神經(jīng)網(wǎng)絡(luò)“遺忘門(mén)”的設(shè)計(jì)結(jié)構(gòu)圖如圖1所示:
該網(wǎng)絡(luò)的輸入為粗糙集理論獲得輸入數(shù)據(jù)的上、下邊界。通過(guò)后期試驗(yàn),從時(shí)間復(fù)雜度和算法的預(yù)測(cè)性能來(lái)分析,我們發(fā)現(xiàn)隱含層的個(gè)數(shù)選擇2是最合理的。
3? ? 基于粗糙集理論的神經(jīng)網(wǎng)絡(luò)
本文使用神經(jīng)網(wǎng)絡(luò)粗糙模式進(jìn)行預(yù)測(cè),粗糙模式中的每個(gè)值都是一對(duì)上界和下界,粗糙神經(jīng)元提供了使用粗糙模式的能力。根據(jù)應(yīng)用程序的性質(zhì),網(wǎng)絡(luò)中的兩個(gè)粗糙神經(jīng)元可以通過(guò)四個(gè)上界和下界連接相互連接。粗糙神經(jīng)元也可以通過(guò)兩個(gè)連接權(quán)重來(lái)連接到傳統(tǒng)神經(jīng)元,所以粗糙神經(jīng)網(wǎng)絡(luò)是由粗糙神經(jīng)元和傳統(tǒng)神經(jīng)元相互連接組成的。在粗糙集理論中,我們引入了另一個(gè)集合相等的概念,即近似(粗糙)相等。粗糙集另一個(gè)重要的性質(zhì)-屬性約簡(jiǎn),給模型的選擇帶來(lái)了極大的便利。因?yàn)樵谥R(shí)庫(kù)中知識(shí)(屬性)并不是同等重要的,甚至某些知識(shí)是冗余的,所謂知識(shí)約簡(jiǎn)就是在保持知識(shí)庫(kù)分類能力不變的條件下,刪除其中不相關(guān)或不重要的知識(shí)。利用粗糙集理論這些關(guān)鍵性質(zhì),我們將其引入到現(xiàn)有的退火爐神經(jīng)網(wǎng)絡(luò)模型中。本文設(shè)計(jì)的退火爐神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
4? ? 試驗(yàn)及分析
為了證明所提出模型的有效性,我們進(jìn)行了試驗(yàn)仿真,試驗(yàn)中所使用的數(shù)據(jù)為退火爐的燃?xì)饬髁?、空氣流量、燃燒溫度?/p>
從圖3a可以看出,由于引入粗糙集理論,退火爐神經(jīng)網(wǎng)絡(luò)的跟隨能力很高。在訓(xùn)練階段,RST神經(jīng)網(wǎng)絡(luò)的性能并沒(méi)有出現(xiàn)過(guò)擬合現(xiàn)象,且針對(duì)干擾具有一定的魯棒性。從圖3b可以看出,訓(xùn)練數(shù)據(jù)的最大正負(fù)誤差較小,主要原因是粗糙集很好地在不同時(shí)刻識(shí)別出每個(gè)變量的貢獻(xiàn)度。
5? ? 總? ? 結(jié)
簡(jiǎn)單來(lái)講,在該模型中粗糙集理論相當(dāng)于一個(gè)分類器,用于對(duì)特征進(jìn)行簡(jiǎn)單的分類,然后神經(jīng)網(wǎng)絡(luò)再進(jìn)行深度提取數(shù)據(jù)特征。利用粗糙集神經(jīng)元的知識(shí)篩選特性對(duì)數(shù)據(jù)進(jìn)行選擇,可以增強(qiáng)遺忘門(mén)的數(shù)據(jù)選擇能力,雖然訓(xùn)練時(shí)間增加,但是模型的其他性能均得到了明顯的提高。根據(jù)退火爐實(shí)際運(yùn)行數(shù)據(jù)分析,如果我們控制模型在線調(diào)整的間隔,可以實(shí)現(xiàn)其更優(yōu)秀的性能。
參考文獻(xiàn)
[1]? ? Pawla,Z.Vagueness and Uncertainty: A Rough Set Perspective[J].Computational Intelligence,? 1995,11(2):227-232.
[2]? ? Pawla Z,Grzymala-Busse J,Slowinski R, et al. Rough Sets[J].Communications of the ACM, 1995,38(11):88-95.