摘 要: 本文建立以二氧化硫濃度為因變量,以藍(lán)色顏色值、綠色顏色值、紅色顏色值、色調(diào)、飽和度為自變量的多元線性回歸模型,通過MATLAB軟件編程求解得二氧化硫的濃度與顏色讀數(shù)之間的多元線性回歸方程,將數(shù)據(jù)回代到回歸方程中求出理論的二氧化硫濃度,并與實(shí)際濃度進(jìn)行對(duì)比,運(yùn)用絕對(duì)誤差進(jìn)行誤差分析。通過減少不同二氧化硫濃度的數(shù)據(jù)量,再利用所求模型求解,并將不同數(shù)據(jù)量下模型的標(biāo)準(zhǔn)誤差進(jìn)行比較,同時(shí)在不同顏色維度(四維,三維,二維,一維)下分析對(duì)應(yīng)模型的決定系數(shù),通過決定系數(shù)大小的比較來比較顏色維度對(duì)模型的影響。
關(guān)鍵詞: 物質(zhì)濃度;顏色讀數(shù);多元回歸線性模型;決定系數(shù)
一、引言
比色法是通過比較或測(cè)量有色溶液物質(zhì)顏色來確定待測(cè)組含量的方法,如果是由人來觀測(cè),這一方法在精度上受到很大影響。但隨著照相技術(shù)和顏色分辨率的提高,建立顏色讀數(shù)和物質(zhì)濃度的數(shù)量關(guān)系這一想法就被提出,即只要輸入照片中的顏色讀數(shù)就能夠確定待測(cè)物質(zhì)的濃度。本文根據(jù)提供的不同二氧化硫濃度與顏色讀數(shù)的數(shù)據(jù),對(duì)顏色讀數(shù)與物質(zhì)濃度之間的關(guān)系進(jìn)行了分析與探討,建立了顏色讀數(shù)與物質(zhì)濃度之間的數(shù)學(xué)模型,對(duì)模型進(jìn)行評(píng)價(jià)和誤差分析,并探討了數(shù)據(jù)量與顏色維度對(duì)模型的影響。
二、 模型建立
對(duì)提供的數(shù)據(jù),建立以二氧化硫的濃度為被因變量y,以藍(lán)色顏色值x1、綠色顏色值x2、紅色顏色值x3、色調(diào)x4、飽和度x5顏色讀數(shù)為自變量的多元線性回歸模型
其中,a0,a1,a2,a3,a4,a5為待定系數(shù),ε為由其他因素引起的隨機(jī)誤差。
三、模型的求解
通過運(yùn)行MATLAB腳本,得到因變量二氧化硫的濃度y與5個(gè)自變量的多元線性回歸方程為
通過運(yùn)行結(jié)果還可以得到?jīng)Q定系數(shù)R2=0.8996、F=34.0366以及該模型的殘差分析圖1 。可以得到:F=34.0366,設(shè)定顯著性水平α=0.05,查詢F檢驗(yàn)臨界值表,得到臨界F0.05(3,31)=4.51值(變量數(shù)目為5,樣本容量為25),因?yàn)镕>F0.05(3,31)=4.51,表明模型的線性關(guān)系在的置信水平下顯著成立。
從圖1中可以看出,殘差的置信區(qū)間基本包含零點(diǎn),除第15個(gè)數(shù)據(jù)外,其余數(shù)據(jù)的殘差離零點(diǎn)均較近,這說明“二氧化硫”回歸模型能較好的擬合原始數(shù)據(jù),而第15個(gè)數(shù)據(jù)可視為異常點(diǎn)。
四、模型的誤差分析
將數(shù)據(jù)代入模型進(jìn)行誤差分析。通過EXCEL軟件依次將藍(lán)色顏色值x1、綠色顏色值x2、紅色顏色值x3、色調(diào)x4、飽和度x5等實(shí)際顏色讀數(shù)代入計(jì)算分析得到不同物質(zhì)濃度的模擬值,再與數(shù)據(jù)中的實(shí)際值進(jìn)行相減操作,△y=y-yi,得到絕對(duì)誤差,計(jì)算結(jié)果如圖所示
通過表1,圖2研究分析得到,計(jì)算誤差值的絕對(duì)值 |△y|,以估計(jì)絕對(duì)誤差作為上限△ymax,得到最大的絕對(duì)誤差△ymax=38.5513,此△ymax稱為實(shí)際物質(zhì)濃度y的“絕對(duì)誤差限”。表明實(shí)際物質(zhì)濃度值和理論物質(zhì)濃度值的絕對(duì)值△y=|y-yi|越小,△y表示模擬數(shù)據(jù)值yi的精度越高。
五、數(shù)據(jù)量與顏色維度對(duì)模型的影響
1、數(shù)據(jù)量對(duì)模型的影響
根據(jù)建立的模型,利用EXCEL軟件和運(yùn)用公式 (E為誤差=測(cè)定值—真實(shí)值),計(jì)算二氧化硫的實(shí)際濃度和理論濃度之間的標(biāo)準(zhǔn)誤差w=16.1672,隨機(jī)將數(shù)據(jù)中的二氧化硫不同濃度下的組數(shù)都改為3組,算出標(biāo)準(zhǔn)誤差為w1=16.3727。同理將組數(shù)改為2、1組時(shí),依次得到的標(biāo)準(zhǔn)誤差依次為w2=16.38450793,w3=20.9514。通過上述分析可得:w>w1>w2>w3,即當(dāng)二氧化硫不同濃度下的數(shù)據(jù)量減少時(shí),誤差也變得越來越大。所以當(dāng)數(shù)據(jù)量越多時(shí),模型的誤差越小。
2、顏色維度對(duì)模型的影響
通過對(duì)的數(shù)據(jù)的分析,探討顏色維度對(duì)模型的影響,發(fā)現(xiàn)缺少某些維度對(duì)物質(zhì)濃度影響不大,將數(shù)據(jù)中的R列數(shù)據(jù)表示為1,G列數(shù)據(jù)表示為2,B列數(shù)據(jù)表示為3,H列數(shù)據(jù)表示為4,S列數(shù)據(jù)表示為5,設(shè)R(i)為顏色維度。
運(yùn)用MATLAB軟件編程求得不同顏色維度下對(duì)應(yīng)的決定系數(shù),再對(duì)同個(gè)維度的決定系數(shù)的平均值進(jìn)行求解,如下表:
由表2可知: R2(5)>R2(4)>R2(3)>R2(2)>R2(1)。所以當(dāng)維度越多時(shí),模型對(duì)數(shù)據(jù)的擬合度越好;而維度越少時(shí),模型對(duì)數(shù)據(jù)的擬合度越差。
六、結(jié)論
當(dāng)數(shù)據(jù)量減少時(shí),模型誤差也變得越來越大;當(dāng)數(shù)據(jù)量越多時(shí),模型的誤差相對(duì)越小。通過決定系數(shù)大小的比較來比較顏色維度對(duì)模型的影響,發(fā)現(xiàn)維度越多時(shí),模型對(duì)數(shù)據(jù)的擬合度越好;而維度越少時(shí),模型對(duì)數(shù)據(jù)的擬合度越差。
參考文獻(xiàn)
[1] 李艷嬌,多元線性回歸的MATLAB實(shí)現(xiàn),常熟理工學(xué)院學(xué)報(bào),28卷2期:49頁,2014年.
[2] 瞿國(guó)棟,誤差理論與數(shù)據(jù)處理,北京,科學(xué)出版社,2016年.
作者簡(jiǎn)介:陳薇(1989.11.25),女,漢族,籍貫是湖北省咸寧市;2016年6月畢業(yè)于武漢理工大學(xué),理學(xué)碩士,主要研究方向?yàn)閼?yīng)用數(shù)學(xué);現(xiàn)供職于廣東嶺南職業(yè)技術(shù)學(xué)院,助教。