黃成華
(蘭州職業(yè)技術(shù)學(xué)院,甘肅 蘭州 730070)
數(shù)據(jù)技術(shù)是一項(xiàng)新興的科學(xué)技術(shù),在數(shù)據(jù)處理方面能夠發(fā)揮出十分強(qiáng)大的功能,它通過對(duì)數(shù)學(xué)、人工智能、數(shù)據(jù)可視化等多種學(xué)科進(jìn)行一定程度的應(yīng)用,并在此基礎(chǔ)之上挖掘數(shù)據(jù)中隱藏的知識(shí)與信息。一般情況下,數(shù)據(jù)挖掘技術(shù)主要存在著七大主要步驟,分別為數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)選擇、數(shù)據(jù)變型、數(shù)據(jù)挖掘、模式評(píng)估以及知識(shí)表現(xiàn)。
建筑系統(tǒng)性能的診斷與優(yōu)化一直是一個(gè)研究熱點(diǎn)問題,目前使用較多的分析方法主要有專業(yè)知識(shí)分析、物理定律分析以及統(tǒng)計(jì)分析,這些方法在對(duì)預(yù)測(cè)問題進(jìn)行處理的過程中,都是利用監(jiān)督學(xué)習(xí)技巧來(lái)實(shí)現(xiàn)對(duì)于建筑系統(tǒng)能耗與表現(xiàn)的預(yù)測(cè),研究者運(yùn)用這些分析方法來(lái)對(duì)建筑的冷負(fù)荷、耗電量以及系統(tǒng)工作效率等參數(shù)進(jìn)行分析,在這其中,較常使用的監(jiān)督學(xué)習(xí)技巧主要有人工神經(jīng)網(wǎng)絡(luò)、向量支持器、決策樹以及隨機(jī)森林等。而在故障診斷方面,這些常規(guī)的分析方法主要是對(duì)建筑系統(tǒng)的能耗或者變量之間的關(guān)系進(jìn)行一定程度的分析,并由此來(lái)對(duì)故障進(jìn)行判別。
相比于上文中所提到的常規(guī)分析方法,數(shù)據(jù)挖掘技術(shù)在建筑領(lǐng)域的研究起步較晚,目前還存在著一定的局限性。一方面,目前狀況下專業(yè)知識(shí)仍然對(duì)整個(gè)知識(shí)發(fā)現(xiàn)的過程起到了主導(dǎo)作用,因此數(shù)據(jù)挖掘技術(shù)的優(yōu)勢(shì)不能夠得到完全的體現(xiàn),例如在對(duì)預(yù)測(cè)問題進(jìn)行處理時(shí),大多數(shù)基于數(shù)據(jù)挖掘技術(shù)的研究仍然是通過專業(yè)知識(shí)來(lái)對(duì)輸入量進(jìn)行相應(yīng)的選取,與常規(guī)方法其實(shí)并沒有本質(zhì)的區(qū)別。另一方面,目前已存在的對(duì)于數(shù)據(jù)挖掘技術(shù)在建筑領(lǐng)域中的應(yīng)用研究,在變量數(shù)的選取上相對(duì)較少,這樣一來(lái)就會(huì)導(dǎo)致挖掘所得到的知識(shí)在全面性上有所欠缺,對(duì)數(shù)據(jù)挖掘技術(shù)的應(yīng)用價(jià)值造成了一定的限制。
保證能耗預(yù)測(cè)模型的可靠性與穩(wěn)定性,對(duì)建筑系統(tǒng)故障的診斷與優(yōu)化能夠起到很大的有利作用。與前文中所說(shuō)的傳統(tǒng)分析方法不同的是,利用數(shù)據(jù)挖掘技術(shù)所建立起來(lái)的模型并不會(huì)預(yù)先選定輸入變量,而是將時(shí)序分析、遞歸特征消去與整體學(xué)習(xí)等方法有機(jī)結(jié)合起來(lái),并由此來(lái)對(duì)第二天建筑的能耗與能耗峰值進(jìn)行一定程度上的預(yù)測(cè)。具體操作如下:首先,運(yùn)用時(shí)序分析來(lái)對(duì)輸入量的最大時(shí)間延遲值進(jìn)行確定,一般情況之下,建筑的能耗呈現(xiàn)出周期性的變化,基于此并運(yùn)用偏相關(guān)系數(shù),得出輸入量的最大時(shí)間延遲值為15d。然后在這一基礎(chǔ)之上,選取算法對(duì)其進(jìn)行建模,在算法的選擇上主要選取了整合移動(dòng)平均自回歸模型、多變量回歸模型、向量支持器、人工神經(jīng)網(wǎng)絡(luò)以及隨機(jī)森林等算法,之所以選擇相對(duì)較多的算法進(jìn)行建模,一方面是因?yàn)檫@些算法在建筑能耗預(yù)測(cè)上有著較為廣泛的使用,另一方面是為了提高算法多樣性,并以此提高整體學(xué)習(xí)中的表現(xiàn)。建模完成之后,通過對(duì)遞歸特征消去方法進(jìn)行有效的使用,為每一種算法選取了最優(yōu)的輸入量集合。不同于傳統(tǒng)的分析方法,運(yùn)用遞歸特征消去方法對(duì)輸入量沒有特別硬性的要求,而是根據(jù)可用的數(shù)據(jù)集來(lái)對(duì)模型進(jìn)行建立。在這一算法之下,會(huì)對(duì)最優(yōu)輸入集合進(jìn)行自動(dòng)而有效的選擇,這樣一來(lái),即使某一個(gè)變量無(wú)法獲得,也不會(huì)造成模型效用降低的情況出現(xiàn)。然后在此基礎(chǔ)之上,運(yùn)用整體學(xué)習(xí)概念來(lái)對(duì)模型進(jìn)行整合,由于每一種算法有著差異性的建模機(jī)制,因此對(duì)于系統(tǒng)中的變化捕捉也會(huì)更為全面。除此之外,基于不同算法的模型殘差值也不是相關(guān)的,因此在整體學(xué)習(xí)概念分析的過程中存在著相互抵消的可能。
目前狀況下,量化關(guān)聯(lián)性分析時(shí)挖掘建筑運(yùn)行數(shù)據(jù)中隱藏知識(shí)的主要工具,然后在實(shí)際的操作過程中顯示運(yùn)用這一工具所得到的相關(guān)數(shù)據(jù)難以進(jìn)行有效的后處理,基于此提出了一種基于提升度方差來(lái)鑒別可能有用的關(guān)聯(lián)法則的方法。
首先通過對(duì)ANOVA方法與聚類分析方法進(jìn)行使用,并由此來(lái)對(duì)建筑數(shù)據(jù)進(jìn)行一定程度上的分類,將建筑自動(dòng)化系統(tǒng)的數(shù)據(jù)分為8個(gè)類別,然后在分類基礎(chǔ)之上運(yùn)用量化關(guān)聯(lián)性分析方法來(lái)對(duì)每個(gè)數(shù)據(jù)子集中的量化關(guān)系法則進(jìn)行一定程度的挖掘。在后處理階段之中,通過對(duì)提升值方差進(jìn)行計(jì)算,并以計(jì)算數(shù)據(jù)基礎(chǔ)選擇了相關(guān)的關(guān)系法則,這些關(guān)聯(lián)法則對(duì)于診斷冷機(jī)以及新風(fēng)機(jī)能耗具有十分重要的作用與價(jià)值。值得一提的是,在這之前還需要運(yùn)用專業(yè)知識(shí)來(lái)定性地檢驗(yàn)準(zhǔn)則的合理性。在后處理中主要選擇了決策樹算法,決策樹的輸出量為PAU的能耗,輸入量為建筑數(shù)據(jù)的其它變量。
本文主要針對(duì)基于數(shù)據(jù)挖掘技術(shù)的建筑系統(tǒng)性能診斷和優(yōu)化進(jìn)行研究與分析。首先對(duì)數(shù)據(jù)挖掘技術(shù)在建筑領(lǐng)域中的應(yīng)用進(jìn)行了一定程度上的闡述,指出當(dāng)前狀況下在建筑領(lǐng)域中的應(yīng)用受到相關(guān)因素的影響還未能發(fā)揮出全部?jī)r(jià)值,這主要是因?yàn)閷I(yè)知識(shí)的主導(dǎo)作用依然存在以及之前對(duì)于數(shù)據(jù)挖掘技術(shù)的研究在變量數(shù)據(jù)獲取上相對(duì)較少,基于此從能耗預(yù)測(cè)模型與監(jiān)測(cè)評(píng)估運(yùn)行策略兩個(gè)角度分析了基于數(shù)據(jù)挖掘技術(shù)的建筑系統(tǒng)性能診斷和優(yōu)化。總而言之,雖然數(shù)據(jù)挖掘技術(shù)在數(shù)據(jù)處理方面有著十分強(qiáng)大的應(yīng)用潛力,但受到一些因素的影響,當(dāng)前數(shù)據(jù)挖掘技術(shù)在建筑領(lǐng)域的應(yīng)用還具有一定的局限性。本文將數(shù)據(jù)挖掘技術(shù)與專業(yè)知識(shí)及大量數(shù)據(jù)有機(jī)結(jié)合起來(lái),通過算法建模分析,全面的了解建筑實(shí)際運(yùn)行規(guī)律,并在此基礎(chǔ)之上對(duì)建筑系統(tǒng)運(yùn)行的性能進(jìn)行有效的優(yōu)化。