肖鄭利
天津機電職業(yè)技術學院,天津 300350
?
運用Matlab和SPSS軟件求解回歸分析的比較研究
肖鄭利
天津機電職業(yè)技術學院,天津300350
在研究變量之間的相關關系時要用到回歸分析。本文以一個給定的線性回歸模型,分別介紹Matlab軟件和SPSS軟件求解過程,兩者的計算結(jié)果是一樣的。分析過程可知:Matlab的優(yōu)勢是函數(shù)豐富、編程靈活;SPSS的優(yōu)點在于界面友好、操作簡單。均為回歸分析提供了全面的解決方案
線性回歸;Matlab;SPSS;統(tǒng)計量
回歸分析是研究變量之間相關關系的數(shù)學方法,是將實際問題中體現(xiàn)的相關關系轉(zhuǎn)化為確定性關系來解決的過程。常見的實際問題有:生活中近似關系的表達,通過觀測數(shù)據(jù)對固定數(shù)值的預測和控制,根據(jù)測量數(shù)據(jù)對生產(chǎn)工藝進行優(yōu)化等等?;貧w分析按照自變量的數(shù)量可以分為一元回歸和多元回歸;按照方程形式可以分為線性回歸和非線性回歸。隨著計算機技術的應用發(fā)展,有多種軟件可以求解回歸方程并進行分析,常用的有數(shù)學軟件Mathematica、科學計算軟件Matlab、數(shù)據(jù)統(tǒng)計分析軟件SPSS和表格應用軟件excel等等。
本文以簡單的一元線性回歸為例,分別利用Matlab軟件和SPSS軟件求解分析,并進行比較研究。
首先給出一個實際案例。
考察溫度x對產(chǎn)量y的影響,測得下列10組數(shù)據(jù)
溫度(℃)20253035404550556065產(chǎn)量(kg)13.215.116.417.117.918.719.621.222.524.3
分析y關于x的線性回歸方程,檢驗回歸效果是否顯著。
(一)Matlab軟件介紹
Matlab軟件有總包和若干個工具箱,可以進行數(shù)值分析、統(tǒng)計、優(yōu)化,可以完成信號處理、圖像處理等領域的計算和圖形顯示。它用函數(shù)形式將各類數(shù)學分支的算法分類,使用時可設計參數(shù)再選擇調(diào)用相應的函數(shù),快速而準確的解決問題。
(二)Matlab軟件中回歸分析命令介紹
線性回歸的命令是regress,用以確定回歸系數(shù)的點估計值:b=regress(Y,X);求回歸系數(shù)的點估計和區(qū)間估計,并進行檢驗,直接用命令:[b,bint,r,rint,stats]=regress(Y,X,alpha),其中alpha是顯著性水平 ,缺省時默認為0.05,bint是區(qū)間估計,r是殘差,rint計算殘差的置信區(qū)間,stats記錄檢驗回歸模型的統(tǒng)計量,有四個數(shù)值分別是相關系數(shù)R 、F檢驗值、與F對應的概率P以及方差的估計值;還可以畫殘差計算其置信區(qū)間,命令為:rcoplot(r,rint)。這里面R 越接近1,則回歸方程越顯著;F值越大,也說明回歸方程越顯著;P小于 時,回歸模型成立。
(三)Matlab軟件求解上述案例
1.輸入數(shù)據(jù):
x=20:5:65;
X=[ones(10,1) x'] ;
Y=[13.2 15.1 16.4 17.1 17.9 18.7 19.6 21.2 22.5 24.3]';
2.回歸分析及檢驗:
[b,bint,r,rint,stats]=regress(Y,X);
b,bint,stats
計算結(jié)果為:
b=
9.1212
0.2230
bint=
8.021110.2214
0.19850.2476
stats=
0.9821439.83110.00000.2333
即回歸模型為 成立。
3.殘差分析并作圖:
rcoplot(r,rint)
得到圖1。
z=b(1)+b(2)*x
plot(x,Y,'k+',x,z,'r')
得到圖2。
(一)SPSS軟件簡介
SPSS軟件是社會科學統(tǒng)計軟件,具有先進成熟、操作簡便的統(tǒng)計方法。它強大的統(tǒng)計分析過程,可以實現(xiàn)基本統(tǒng)計分析方法、多元統(tǒng)計方法和專業(yè)統(tǒng)計分析等功能。
(二)線性回歸的SPSS操作
線性回歸分析在SPSS Statistics數(shù)據(jù)編輯器窗口的具體操作有以下幾個步驟:首先是打開“線性回歸”對話框;然后在對話框中選擇變量;再進行相應的設置,逐一選取需要用到的統(tǒng)計量和圖形方式等內(nèi)容;最后單擊“確定”,在SPSS Statistics查看器窗口得到線性回歸分析結(jié)果。
(三)SPSS軟件求解上述案例
第一步:從“文件”菜單中選擇“打開”、“數(shù)據(jù)”點擊,將事先保存在wps文件中的數(shù)據(jù)調(diào)用出來;
第二步:選擇“分析”菜單中的“回歸”、“線性”命令,打開“線性回歸”對話框,將“溫度”選入“自變量”,“產(chǎn)量”選入“因變量”;
第三步:單擊“統(tǒng)計量”按鈕,在“線性回歸:統(tǒng)計量”對話框中選中“估計”、“置信區(qū)間”,然后單擊“繼續(xù)”;
第四步:單擊“繪制”按鈕,在“線性回歸:圖”對話框中選中“直方圖”、“正態(tài)概率圖”,然后單擊“繼續(xù)”;
第五步:回到“線性回歸”對話框,單擊“確定”按鈕,完成操作。
于是在查看器窗口得到一系列輸出結(jié)果,選取其中案例需要的數(shù)據(jù)列出如表1-表2,同時得到圖3和圖4:
模型匯總b
表1
表2
從上述兩種軟件求解結(jié)果來看,我們發(fā)現(xiàn)不管是使用Matlab還是SPSS,計算的回歸系數(shù)、系數(shù)的區(qū)間估計、統(tǒng)計量中的相關系數(shù)、F值、與F對應的概率、方差的估計值等等都是一樣的。而求解過程兩者差別很大:Matlab是在視窗環(huán)境中編寫程序,進行數(shù)據(jù)分析、建模仿真,函數(shù)資源豐富,靈活性較強;SPSS是菜單操作,圖形交互式的友好界面操作簡單,強大的數(shù)據(jù)分析處理功能針對性較強。總之兩種軟件各有其優(yōu)勢,均為回歸分析提供了全面的解決方案。
[1]趙靜,但琦.數(shù)學建模與數(shù)學實驗[M].高等教育出版社,2008.
[2]Cleve Moler.MATLAB數(shù)值計算[M].機械工業(yè)出版社,2006.
[3]陳勝可.SPSS統(tǒng)計分析從入門到精通[M].清華大學出版社,2013.
[4]張文彤,鐘云飛.IBM SPSS數(shù)據(jù)分析與挖掘?qū)崙?zhàn)案例精粹[M].清華大學出版社,2013.
O212.1
A
1006-0049-(2016)18-0058-02