劉珂妍 武新乾 劉鵬
[摘? 要]:為了探究建筑因素與區(qū)域環(huán)境溫度之間的統(tǒng)計關(guān)系,文章先對原始數(shù)據(jù)做預(yù)處理,包括剔除奇異值和標(biāo)準(zhǔn)化轉(zhuǎn)換,并運用聚類分析方法對標(biāo)準(zhǔn)化變換之后的數(shù)據(jù)實現(xiàn)控制變量。再運用回歸分析的方法,探究綠化率、密度和高度與區(qū)域環(huán)境溫度之間的統(tǒng)計關(guān)系,利用SAS軟件建立了溫度與密度和高度、溫度與綠化率和高度的二元回歸模型,并對建立的模型進(jìn)行擬合優(yōu)度檢驗、參數(shù)顯著性檢驗和殘差檢驗,檢驗結(jié)果表明,所建立的模型是合理有效的。
[關(guān)鍵詞]:綠色建筑;建筑設(shè)計;聚類分析; 線性回歸分析; 非線性回歸分析
TU111.19A
建筑行業(yè)作為我國社會經(jīng)濟建設(shè)中的三大主要行業(yè)之一,對社會資源的消耗大。近幾年,隨著我國綠色建筑的迅速發(fā)展[1],生態(tài)理念在建筑行業(yè)[2]中愈發(fā)重要,若能探究出建筑因素與區(qū)域環(huán)境溫度之間關(guān)系,就能夠在建筑設(shè)計方面提供科學(xué)有效的依據(jù),并對于推動建筑經(jīng)濟可持續(xù)發(fā)展[3]、高效實現(xiàn)健康建筑[4]、提高生態(tài)環(huán)保的質(zhì)量具有重要的意義。
為了探究建筑因素與區(qū)域環(huán)境溫度之間的定量關(guān)系,本文在聚類分析和控制變量的基礎(chǔ)之上分析了綠化率、密度和高度這3個建筑因素與區(qū)域環(huán)境溫度之間的關(guān)系,建立二元回歸模型,并對建立的模型進(jìn)行檢驗,確保所建模型的有效性。
1 數(shù)據(jù)預(yù)處理
本文使用河南科技大學(xué)建筑學(xué)院實測數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)包含440組綠化率、密度和高度3個建筑因素及其對應(yīng)的環(huán)境溫度。首先對各因素數(shù)據(jù)進(jìn)行奇異值處理、極差正規(guī)化變換,使得變換后的數(shù)據(jù)與量綱無關(guān)。之后,對于標(biāo)準(zhǔn)化處理之后的數(shù)據(jù),采用K-means聚類分析的方法對樣本數(shù)據(jù)進(jìn)行控制分類,并使用手肘法[5]確定最優(yōu)K值。
1.1 標(biāo)準(zhǔn)化處理
極差正規(guī)化變換公式為
xij=xij-minxijmaxxij-minxiji=1,2,3;j=1,2...439;
式中:xij為第i個因素的第j個樣本的原始數(shù)據(jù),xij為變換后的數(shù)據(jù),且0≤xij≤1,極差為1,無量綱。
1.2 K-means聚類分析
為建立二元回歸模型,需控制第三自變量的影響。采用K-means法對第三自變量聚類,之后再使用其中某一類的數(shù)據(jù)進(jìn)行建模。在此,利用Python編程實現(xiàn)手肘法,得到K值的最優(yōu)可能取值。
根據(jù)手肘圖(圖1、圖2),綠化率的最優(yōu)K值可能為3、4、5;密度的最優(yōu)K值可能為3、4、5;高度的最優(yōu)K值可能為4、5、6。本文選用3個因素的K值都為5,即都聚為5類,并利用R軟件實現(xiàn)聚類。
2 回歸分析
令y為溫度,x1為綠化率,x2為密度,x3為高度。由于在預(yù)處理中將3個因素都聚為5類,利用SAS軟件對聚類后的各類族數(shù)據(jù)中對應(yīng)的因變量(溫度)進(jìn)行正態(tài)性檢驗,選擇滿足正態(tài)性檢驗的類族進(jìn)一步進(jìn)行回歸分析。
2.1 因變量正態(tài)性檢驗
綠化率聚類的第3類、密度聚類的第4類和高度聚類的第5類所對應(yīng)的因變量(溫度)滿足正態(tài)性檢驗,結(jié)果如表1所示。
根據(jù)表1可知,因變量y1,y2,y3對應(yīng)的P值均大于0.05,因此可認(rèn)為因變量均服從正態(tài)分布,于是,選擇這3個類對應(yīng)的數(shù)據(jù)進(jìn)行回歸分析。
2.2 因變量與自變量的相關(guān)性分析
利用SAS軟件,分別對溫度與綠化率、密度、高度進(jìn)行相關(guān)性分析,檢驗結(jié)果如表2所示。
建筑論壇與建筑設(shè)計劉珂妍, 武新乾, 劉鵬: 建筑因素與區(qū)域溫度的二元回歸建模
從表2可以看出,在控制綠化率的情況下,溫度與密度的相關(guān)系數(shù)絕對值在0.0~0.2之間,且P值等于0.5519>0.05,即認(rèn)為變量之間是極弱相關(guān)或無線性相關(guān)關(guān)系;溫度與高度的相關(guān)系數(shù)為0.827 10,且P值小于0.000 1,即認(rèn)為溫度與高度之間是存在強的正相關(guān)關(guān)系。在控制密度的情況下,溫度與綠化率的相關(guān)系數(shù)絕對值在0.0~0.2之間,且P值等于0.9689>0.05,即認(rèn)為變量之間是極弱相關(guān)或無線性相關(guān)關(guān)系;溫度與高度的相關(guān)系數(shù)為0.769 15,且P值小于0.000 1,即認(rèn)為溫度與高度之間是存在強的正相關(guān)關(guān)系。在控制高度的情況下,溫度與綠化率、密度的相關(guān)系數(shù)絕對值在0.0~0.2之間,且P值均大于顯著性水平0.05,即認(rèn)為變量之間是極弱相關(guān)或無線性相關(guān)關(guān)系。
2.3 散點圖
利用SPSS軟件,分別畫出溫度與綠化率和高度、溫度與密度和高度、溫度與密度和綠化率的散點圖(如圖4~圖12所示)。
從圖4~圖9中可以看出,溫度與密度、綠化率、高度之間存在非線性關(guān)系,且溫度與高度之間的非線性關(guān)系十分類似對數(shù)函數(shù)。
由圖10~圖12并結(jié)合相關(guān)分析的結(jié)果可以得到,單獨考慮溫度與綠化率和密度之間的關(guān)系較弱,因此,不再建立溫度與綠化率和密度之間的模型。
3 模型建立
根據(jù)上述分析,設(shè)建立溫度與密度和高度的二元回歸模型為
y1=α11+α12x2+α13log(x3)+ε1(1)
溫度與綠化率和高度的二元回歸模型為
y2=α21+α22x1/21+α23log(x3)+α24x1x3+ε2(2)
3.1 溫度與密度和高度線性回歸模型
利用SAS進(jìn)行模型擬合[6],結(jié)果如表3和表4所示。
根據(jù)方差分析表3可得,P值小于0.0001<0.05,說明溫度與密度和高度模型通過顯著性檢驗;根據(jù)R2為0.906 5、調(diào)整R2為0.904 9,可知擬合精度高。
根據(jù)參數(shù)估計表4可得,α11和α13的P值小于0.0001<0.05,滿足顯著性要求;而α12的P值為0.063 4,不滿足顯著性要求,但仍考慮擬合模型為:
y1=25.72966+0.76843x2+1.00090log(x3)+ε1(3)
利用式(3)計算殘差,見圖13。由于殘差圖13有明顯的趨勢,可能是因為殘差中的非隨機模式表明模型的確定部分(預(yù)測變量)沒有捕獲一些“泄露”到殘差中的一些可解釋的信息。
3.2 溫度與密度和高度非線性回歸模型
改進(jìn)模型(3),由于前6個數(shù)據(jù)對應(yīng)的殘差在-1.5以外,故先剔除前6個數(shù)據(jù),再嘗試加入密度和高度的交互作用項,擬合模型為[7-10]
y1=β11+β12x2+β13log(x3)+β14x2x3+ε3(4)
利用SAS進(jìn)行模型擬合,結(jié)果如表5和表6所示。
根據(jù)方差分析表5可得,P值小于0.0001<0.05,說明溫度與密度和高度模型通過顯著性檢驗;根據(jù)R2為 0.958 2、調(diào)整R2為0.957 1,可知擬合精度比模型(3)更高。
根據(jù)參數(shù)估計表6可得,模型(4)中β11、β12、β13、β14的P值小于0.05,滿足顯著性要求。根據(jù)Vif<10,Condition Index<10,可知變量之間不存在多重共線性[11]。因此,擬合模型為
y1=25.48385+1.24099x2+
3.24655log(x3)-0.06998x2x3+ε3(5)
模型(5)表明,在建筑綠化率相當(dāng)時,溫度與密度和高度之間正相關(guān),與密度和高度的交互作用負(fù)相關(guān)。
對所建的模型(5)進(jìn)行殘差檢驗,結(jié)果見表7。根據(jù)表7,模型的殘差檢驗P值大于0.05,即通過殘差檢驗,因此模型(5)的擬合是有效的。
3.3 溫度與綠化率和高度非線性回歸模型
利用SAS進(jìn)行模型擬合,結(jié)果如表8和表9所示。
根據(jù)方差分析表8可得,P值小于0.0001<0.05,說明溫度與綠化率和高度模型通過顯著性檢驗;根據(jù)R2為0.899 7、調(diào)整R2為0.894 8,可知擬合精度高。
根據(jù)參數(shù)估計表9可得,模型(2)中α21、α22、α23、α24的P值小于0.05,滿足顯著性要求,根據(jù)Vif<10,Condition Index<10可知自變量之間不存在多重共線性。因此,擬合模型為
y2=24.08427+3.22525x1/21+
3.57499log(x3)-0.25349x1x3+ε2(6)
模型(6)表明,在建筑密度相當(dāng)時,溫度與綠化率和高度之間正相關(guān),與綠化率和高度的交互作用負(fù)相關(guān)。
4 結(jié)論
本文通過采用聚類分析和線性回歸分析、非線性回歸分析相結(jié)合的方法,對溫度與綠化率、密度、高度之間的統(tǒng)計關(guān)系進(jìn)行了分析,最終建立了2個較為合理的模型(5)和(6)。這2個模型表明,在設(shè)計建筑時,可以通過同時考慮建筑密度和高度這2個因素的規(guī)劃,或者同時考慮綠化率和高度這2個因素的規(guī)劃,達(dá)到控制建筑物的區(qū)域環(huán)境溫度的目的。
參考文獻(xiàn)
[1] 全世海.我國綠色建筑發(fā)展現(xiàn)狀及展望[J].重慶建筑,2020,19(12):14-16.
[2] 朱旭.綠色建筑的可持續(xù)生態(tài)設(shè)計——析《可持續(xù)設(shè)計》[J].環(huán)境保護,2020,48(24):71-72.
[3] 嚴(yán)瑞青.綠色經(jīng)濟理念下建筑經(jīng)濟可持續(xù)發(fā)展研究[J].商訊,2020,37(36):152-153.
[4] 王焯瑤,錢振瀾,王竹,等.健康建筑評價標(biāo)準(zhǔn)比較分析與認(rèn)知框架[J].西部人居環(huán)境學(xué)刊,2020, 35(6):32-39.
[5] 王建仁,馬鑫,段剛龍.改進(jìn)的K-means聚類k值選擇算法[J].計算機工程與應(yīng)用,2019,55(8):27-33.
[6] 王赫.基于多元線性回歸的經(jīng)濟發(fā)展影響因素分析[J].商訊,2020,37(36):146-147.
[7] 王林.消防員受傷人數(shù)非線性回歸模型建立及分析[J].科技與創(chuàng)新,2020,6(23):23-24.
[8] 王蕊,董祥旻,何衛(wèi)蘋.一種多元非線性回歸模型的建立方法及其應(yīng)用[J].中國考試,2010,7(11): 17-22.
[9] 趙瑩,李純良,馬義茹,等.基于多元非線性回歸對合金收得率的預(yù)測[J].數(shù)學(xué)的實踐與認(rèn)識,2020,50(17):297-304.
[10] 趙曉晴. 基于債券成交額的中國債券市場實證研究[D].濟南: 山東大學(xué),2019.
[11] 高惠璇.處理多元線性回歸中自變量共線性的幾種方法——SAS/STAT軟件(6.12)中REG等過程增強功能的使用[J].數(shù)理統(tǒng)計與管理,2000,18(5):49-55.