高 煥,諶 悅
(西安職業(yè)技術(shù)學(xué)院生物工程學(xué)院,陜西西安 710077)
SPSS(Statistical Product and Service Solutions)結(jié)合了統(tǒng)計(jì)學(xué)分析運(yùn)算、數(shù)據(jù)挖掘、預(yù)測(cè)分析和決策支持任務(wù)等功能[1],可以為用戶提供數(shù)據(jù)錄入、數(shù)據(jù)管理、統(tǒng)計(jì)分析運(yùn)算、圖表分析、資料編輯、輸出管理、數(shù)據(jù)挖掘、預(yù)測(cè)分析等服務(wù)[2]。統(tǒng)計(jì)功能包括描述性統(tǒng)計(jì)、均值比較、一般線性模型、相關(guān)分析、回歸分析、方差分析、主成分分析和因子分析、卡方檢驗(yàn)、t 檢驗(yàn)和非參數(shù)檢驗(yàn)、聚類分析、對(duì)數(shù)線性模型等[3-4],涵蓋了《教育統(tǒng)計(jì)學(xué)》中的所有項(xiàng)目。利用SPSS 軟件運(yùn)用定性與定量相結(jié)合的方法[5-7],提升大學(xué)生創(chuàng)業(yè)環(huán)境評(píng)價(jià)精準(zhǔn)度,有助于更好梳理創(chuàng)業(yè)環(huán)境指標(biāo)體系中的薄弱點(diǎn),有針對(duì)性地改善創(chuàng)業(yè)環(huán)境,激發(fā)學(xué)生創(chuàng)業(yè)意愿。
在大學(xué)生創(chuàng)業(yè)環(huán)境指標(biāo)體系構(gòu)建中,通過(guò)運(yùn)用SPSS 軟件,可以收集影響大學(xué)生創(chuàng)業(yè)環(huán)境整體情況的因子,整理、檢驗(yàn)因子數(shù)據(jù),分析因子對(duì)大學(xué)生創(chuàng)業(yè)環(huán)境影響的顯著性等,確保該指標(biāo)體系滿足用戶需求。用SPSS 統(tǒng)計(jì)分析軟件,構(gòu)建大學(xué)生創(chuàng)業(yè)環(huán)境指標(biāo)體系,提升大學(xué)生創(chuàng)業(yè)環(huán)境分析的精準(zhǔn)性,提高工作效率,滿足指標(biāo)體系構(gòu)建需求。
1)大學(xué)生創(chuàng)業(yè)環(huán)境指標(biāo)體系構(gòu)建思路
該研究通過(guò)文獻(xiàn)研究法,對(duì)以往研究者關(guān)于創(chuàng)業(yè)環(huán)境的構(gòu)成要素進(jìn)行匯總梳理,對(duì)國(guó)內(nèi)外創(chuàng)業(yè)環(huán)境構(gòu)成要素進(jìn)行對(duì)比,認(rèn)為GEM 模型對(duì)創(chuàng)業(yè)環(huán)境的概括最全面,能夠較完整地反映影響大學(xué)生創(chuàng)業(yè)的各類環(huán)境要素[8-11]?;诖耍撗芯吭趨⒖糋EM 模型基礎(chǔ)上,通過(guò)調(diào)研走訪,聽(tīng)取專家相關(guān)意見(jiàn),考慮指標(biāo)體系設(shè)計(jì)的科學(xué)性、可實(shí)施性、全面性等原則,構(gòu)建了大學(xué)生創(chuàng)業(yè)環(huán)境指標(biāo)體系。
2)大學(xué)生創(chuàng)業(yè)環(huán)境指標(biāo)體系設(shè)計(jì)
根據(jù)構(gòu)建思路,該研究主要將指標(biāo)體系劃分為4個(gè)層次,分別為目標(biāo)層、系統(tǒng)層、準(zhǔn)則層和指標(biāo)層。
①目標(biāo)層是對(duì)大學(xué)生創(chuàng)業(yè)環(huán)境總體情況的反映。
②系統(tǒng)層是在綜合參考GEM 模型基礎(chǔ)上構(gòu)建而成的,具體包括資金環(huán)境、政策環(huán)境、市場(chǎng)環(huán)境、教育環(huán)境、文化環(huán)境5 個(gè)系統(tǒng)。
③準(zhǔn)則層是在系統(tǒng)層基礎(chǔ)上的進(jìn)一步細(xì)化,具體分為13 個(gè)層面,其中資金環(huán)境系統(tǒng)層細(xì)化為4 個(gè)層面,政策環(huán)境系統(tǒng)層細(xì)化為2 個(gè)層面,市場(chǎng)環(huán)境細(xì)化為2 個(gè)層面,教育環(huán)境細(xì)化為3 個(gè)層面,文化環(huán)境細(xì)化為2 個(gè)層面。
④指標(biāo)層用來(lái)具體描述準(zhǔn)則層,反映準(zhǔn)則層情況,文中共遴選了具有代表性的25項(xiàng)具體指標(biāo)。
1)理論模型
該研究在GEM 基礎(chǔ)上構(gòu)建了大學(xué)生創(chuàng)業(yè)環(huán)境指標(biāo)體系,認(rèn)為大學(xué)生創(chuàng)業(yè)總體環(huán)境由資金環(huán)境、政策環(huán)境、市場(chǎng)環(huán)境、教育環(huán)境、文化環(huán)境5 個(gè)環(huán)境指標(biāo)要素構(gòu)成,如表1 所示,并假設(shè)該指標(biāo)體系能夠較準(zhǔn)確反映大學(xué)生創(chuàng)業(yè)環(huán)境總體情況,提出了以下研究假設(shè)。
表1 大學(xué)生創(chuàng)業(yè)環(huán)境指標(biāo)體系
①資金環(huán)境越充足,大學(xué)生創(chuàng)業(yè)總體環(huán)境越好。資金環(huán)境用來(lái)反映大學(xué)生在創(chuàng)業(yè)過(guò)程中能夠獲得金融支持的程度,包括政府撥款、家庭親屬贈(zèng)予、創(chuàng)業(yè)資本、權(quán)益資本等創(chuàng)業(yè)資金來(lái)源。
②政策環(huán)境越寬松,大學(xué)生創(chuàng)業(yè)總體環(huán)境越好。政策環(huán)境主要用來(lái)反映政府對(duì)大學(xué)生創(chuàng)業(yè)的扶持力度,其內(nèi)容包括政府政策與政府項(xiàng)目,諸如政府政策中涉及到的與創(chuàng)業(yè)有關(guān)的稅收優(yōu)惠減免政策、財(cái)政扶持政策、行政規(guī)費(fèi)減免等有利于創(chuàng)業(yè)的政策以及政府政策的具體化操作,比如大學(xué)生能否直接參與政府科技項(xiàng)目等。
③市場(chǎng)環(huán)境越好,大學(xué)生創(chuàng)業(yè)總體環(huán)境越好。市場(chǎng)環(huán)境主要用來(lái)反映大學(xué)生在創(chuàng)業(yè)過(guò)程中可以獲得的“軟件資源”和“硬件資源”,包括市場(chǎng)環(huán)境、獲取商業(yè)服務(wù)的可得性,獲得公共基礎(chǔ)設(shè)施、自然資源、交通設(shè)施、通訊設(shè)施的可得性等。
④教育環(huán)境越完善,大學(xué)生創(chuàng)業(yè)總體環(huán)境越好。教育環(huán)境主要用來(lái)反映大學(xué)生接受創(chuàng)業(yè)教育的情況,體現(xiàn)在大學(xué)生通過(guò)教育獲得的創(chuàng)業(yè)技能、創(chuàng)業(yè)思維等方面。
⑤文化環(huán)境越鼓勵(lì)創(chuàng)業(yè),大學(xué)生創(chuàng)業(yè)總體環(huán)境越好。文化環(huán)境主要用來(lái)反映社會(huì)文化以及社會(huì)規(guī)范對(duì)大學(xué)生創(chuàng)業(yè)的態(tài)度,包括是否支持創(chuàng)業(yè),以及對(duì)大學(xué)生創(chuàng)業(yè)成敗的評(píng)價(jià)等。
2)研究設(shè)計(jì)與變量說(shuō)明
該研究所用的調(diào)查問(wèn)卷是在之前構(gòu)建的大學(xué)生創(chuàng)業(yè)總體環(huán)境指標(biāo)體系的框架基礎(chǔ)上設(shè)計(jì)而成的。主要由三部分構(gòu)成,分別是個(gè)人基本信息、大學(xué)生創(chuàng)業(yè)總體環(huán)境評(píng)價(jià)、大學(xué)生創(chuàng)業(yè)環(huán)境指標(biāo)。在大學(xué)生創(chuàng)業(yè)總體環(huán)境評(píng)價(jià)和大學(xué)生創(chuàng)業(yè)環(huán)境指標(biāo)下各設(shè)置了5 個(gè)肯定性題項(xiàng),采用Likert 五星級(jí)量表記錄調(diào)查對(duì)象從“很差”到“很好”的評(píng)價(jià)態(tài)度,分別賦值1~5進(jìn)行計(jì)分。
在研究過(guò)程中,共涉及6 個(gè)主要研究變量,其中大學(xué)生創(chuàng)業(yè)總體環(huán)境(Y)為因變量,資金環(huán)境(F1)、政策環(huán)境(F2)、市場(chǎng)環(huán)境(F3)、教育環(huán)境(F4)、文化環(huán)境(F5)為自變量。
對(duì)于大學(xué)生創(chuàng)業(yè)環(huán)境指標(biāo)體系的設(shè)計(jì),基于SPSS 軟件進(jìn)行驗(yàn)證、優(yōu)化指標(biāo)體系,其SPSS 軟件應(yīng)用平臺(tái)如圖1 所示。
圖1 SPSS應(yīng)用平臺(tái)
1)建立SPSS 數(shù)據(jù)文件:通過(guò)SPSS 讀取調(diào)研數(shù)據(jù)時(shí),要注意利用SPSS 命令(TYPE 子命令、SHEEET 子命令、CELLRANGE 子命令、READNAMES 子命令)將數(shù)據(jù)表中的題目、變量名等信息排除在數(shù)據(jù)之外。讀取調(diào)研數(shù)據(jù)的命令語(yǔ)句如下:
GTE DATA
/TYPE=XLS
/FILE=調(diào)研數(shù)據(jù)儲(chǔ)存的根目錄
/SHEEET=NAME′大學(xué)生創(chuàng)業(yè)環(huán)境總體情況′
/CELLRANGE=RANGE′A2:AE′
/READNAMES=on.
2)處理大學(xué)生創(chuàng)業(yè)環(huán)境指標(biāo)數(shù)據(jù):通過(guò)SPSS 對(duì)調(diào)研數(shù)據(jù)進(jìn)行信度和效度分析,使用因子分析法對(duì)調(diào)研數(shù)據(jù)進(jìn)行主成分分析,利用因子分析的結(jié)果計(jì)算出主成分。
3)擬合大學(xué)生創(chuàng)業(yè)環(huán)境評(píng)價(jià)指標(biāo)體系:通過(guò)SPSS,采用回歸分析法,檢驗(yàn)大學(xué)生創(chuàng)業(yè)總體情況(Y)和資金環(huán)境(F1)、政策環(huán)境(F2)、市場(chǎng)環(huán)境(F3)、教育環(huán)境(F4)、文化環(huán)境(F5)之間的關(guān)系。
4)統(tǒng)計(jì)結(jié)果分析:通過(guò)模型擬合優(yōu)度、回歸方程整體顯著性檢驗(yàn)、系數(shù)顯著性檢驗(yàn)來(lái)得出自變量對(duì)因變量的影響程度。
import pandas as pd
import seaborn as sns
from sklearn.linear_model import Linear Regression
import matplotlib.pyplot as plt
From sklearn.cross_validation import train_test_split
#通過(guò)read_csv 來(lái)讀取目的數(shù)據(jù)集
Dimensions_data=pd.read_csv("C:/Users/Administrator/Desktop/Dimensions.csv")
#清洗不需要的數(shù)據(jù)
new_Dimensions_data=Dimensions_data.ix[:,1:]
#得到所需要的數(shù)據(jù)集且查看其前幾列以及數(shù)據(jù)形狀
print(′head:′,new_Dimensions_data.head(),′ Shape:′,new_Dimensions_data.shape)
#數(shù)據(jù)描述
print(new_Dimensions_data.describe())
#缺失值檢驗(yàn)
print(new_Dimensions_data[new_Dimensions_data.isnull()==True].count())
new_Dimensions_data.boxplot()
plt.savefig("boxplot.jpg")
plt.show()
##相關(guān)系數(shù)矩陣r(相關(guān)系數(shù))=x 和y 的協(xié)方差/(x 的標(biāo)準(zhǔn)差*y 的標(biāo)準(zhǔn)差)==cov(x,y)/σx*σy
#相關(guān)系數(shù):0~0.3 表示弱相關(guān),0.3~0.6 表示中等程度相關(guān),0.6~1 表示強(qiáng)相關(guān)
print(new_Dimensions_data.corr())
#建立散點(diǎn)圖來(lái)查看數(shù)據(jù)集里的數(shù)據(jù)分布
#seaborn 的pairplot 函數(shù)繪制X 的每一維度和對(duì)應(yīng)Y 的散點(diǎn)圖。通過(guò)設(shè)置size 和aspect 參數(shù)來(lái)調(diào)節(jié)顯示的大小和比例。
# 通過(guò)加入一個(gè)參數(shù)kind='reg',seaborn 可添加一條最佳擬合直線和95%的置信帶。
sns.pairplot(new_Dimensions_data,x_vars=[′F1′,′F2′,′F3,″F4′,′F5′,′F6′,′F7′,′F8′,′F9′],y_vars=′environment′,size=7,aspect=0.8,kind=′reg′)
plt.savefig("pairplot.jpg")
plt.show()
#利用sklearn 對(duì)數(shù)據(jù)集進(jìn)行劃分,以此來(lái)創(chuàng)建訓(xùn)練集和測(cè)試集
#train_size 表示訓(xùn)練集所占總數(shù)據(jù)集的比例
X_train,X_test,Y_train,Y_test=train_test_split(new_Dimensions_data.ix[:,:3],new_Dimensions_data.environment,train_size=.80)
print("原始數(shù)據(jù)特征:",new_Dimensions_data.ix[:,:9].shape,
",訓(xùn)練數(shù)據(jù)特征:",X_train.shape,
",測(cè)試數(shù)據(jù)特征:",X_test.shape)
print("原始數(shù)據(jù)標(biāo)簽:",new_Dimensions_data.environment.shape,
",訓(xùn)練數(shù)據(jù)標(biāo)簽:",Y_train.shape,
",測(cè)試數(shù)據(jù)標(biāo)簽:",Y_test.shape)
model=Linear Regression()
model.fit(X_train,Y_train)
a=model.intercept_#截距
b=model.coef_#回歸系數(shù)
print("最佳擬合線:截距",a,",回歸系數(shù):",b,")
#y=b0+b1X1+b2X2+b3X3+b4X4+b5X5
#R 方檢測(cè)
#決定系數(shù)r平方
#對(duì)于評(píng)估模型的精確度
#y 誤差平方和=Σ(y 實(shí)際值-y 預(yù)測(cè)值)^2
#y 的總波動(dòng)=Σ(y 實(shí)際值-y 平均值)^2
#有多少百分比的y 波動(dòng)沒(méi)有被回歸擬合線所描述=SSE/總波動(dòng)
#有多少百分比的y 波動(dòng)被回歸線描述=1-SSE/總波動(dòng)=決定系數(shù)R 平方
#對(duì)于決定系數(shù)R 平方來(lái)說(shuō)1)回歸線擬合程度:有多少百分比的y 波動(dòng)刻印有回歸線來(lái)描述(x 的波動(dòng)變化)
#2)值大?。篟 平方越高,回歸模型越精確(取值范圍0~1),1 無(wú)誤差,0 無(wú)法完成擬合
score=model.score(X_test,Y_test)
print(score)
#對(duì)線性回歸進(jìn)行預(yù)測(cè)
Y_pred=model.predict(X_test)
print(Y_pred)
plt.plot(range(len(Y_pred)),Y_pred,'b',label="predict")
#顯示圖像[12]
#plt.savefig("predict.jpg")
plt.show()
plt.figure()
plt.plot(range(len(Y_pred)),Y_pred,′b′,label="predict")
plt.plot(range(len(Y_pred)),Y_test,′r′,label="test")
plt.legend(loc="upper right")#顯示圖中的標(biāo)簽
plt.x label("the number of environment")
plt.y label('value of environment')
plt.savefig("ROC.jpg")
plt.show()
為了檢驗(yàn)該研究構(gòu)建的大學(xué)生創(chuàng)業(yè)環(huán)境指標(biāo)體系是否與實(shí)際調(diào)研數(shù)據(jù)一致,利用經(jīng)過(guò)主成分分析處理后的調(diào)研數(shù)據(jù)對(duì)構(gòu)建的大學(xué)生創(chuàng)業(yè)環(huán)境指標(biāo)體系進(jìn)行線性回歸[13-17]。
KMO 檢驗(yàn)和Bartlett 球度檢驗(yàn)是因子分析前的檢驗(yàn),主要用來(lái)衡量問(wèn)卷結(jié)構(gòu)效度,判斷調(diào)查數(shù)據(jù)是否適合因子分析。該研究的檢驗(yàn)結(jié)果KMO 均大于0.8,Bartlett 球度檢驗(yàn)P值=0.000<0.05,如表2 所示。表明所選調(diào)研數(shù)據(jù)成球形分布,數(shù)據(jù)之間具有相關(guān)性,十分適合做因子分析。通過(guò)對(duì)大學(xué)生創(chuàng)業(yè)環(huán)境調(diào)查問(wèn)卷的總體以及各指標(biāo)進(jìn)行可信度檢驗(yàn),Cronbach’s Alpha 系數(shù)均大于0.7,如表3 所示,表明該調(diào)查具有較好的內(nèi)在一致性,可靠性較強(qiáng)。
表2 KMO 和Bartlett 的檢驗(yàn)
表3 可靠性統(tǒng)計(jì)量
將經(jīng)過(guò)主成分計(jì)算得分的5 個(gè)維度作為自變量,創(chuàng)業(yè)總體環(huán)境作為因變量,基于SPSS 軟件進(jìn)行多元線性回歸分析[18-19],如表4 所示。
表4 線性回歸分析結(jié)果
1)以創(chuàng)業(yè)環(huán)境指標(biāo)的5 個(gè)維度為自變量,以創(chuàng)業(yè)總體環(huán)境為因變量進(jìn)行回歸分析的結(jié)果顯示,回歸模型整體的解釋度較高,5 個(gè)維度可以解釋創(chuàng)業(yè)環(huán)境總體情況的90%的變差,設(shè)計(jì)的大學(xué)生創(chuàng)業(yè)環(huán)境評(píng)價(jià)指標(biāo)體系模型與實(shí)際調(diào)研數(shù)據(jù)之間擬合度較好。因此,可以判定資金環(huán)境、政策環(huán)境、市場(chǎng)環(huán)境、教育環(huán)境以及文化環(huán)境能較好地反映大學(xué)生創(chuàng)業(yè)整體環(huán)境。但是仍有一部分因素未在研究中得到揭示,在今后的研究中需要更加全面考慮影響因素。
2)設(shè)計(jì)的大學(xué)生創(chuàng)業(yè)環(huán)境指標(biāo)體系模型中,資金環(huán)境、政策環(huán)境、市場(chǎng)環(huán)境、教育環(huán)境以及文化環(huán)境的系數(shù)均為正值,符合研究預(yù)期,表明改善創(chuàng)業(yè)環(huán)境指標(biāo)5個(gè)維度均有助于大學(xué)生創(chuàng)業(yè)環(huán)境總體情況的提升。但是,各維度對(duì)大學(xué)生創(chuàng)業(yè)環(huán)境總體情況的影響程度不同,其中資金環(huán)境、政策環(huán)境、市場(chǎng)環(huán)境、教育環(huán)境均對(duì)大學(xué)生創(chuàng)業(yè)環(huán)境總體情況的影響顯著,文化環(huán)境的影響未通過(guò)顯著性檢驗(yàn),對(duì)大學(xué)生創(chuàng)業(yè)環(huán)境總體情況的影響不顯著。
3)大學(xué)生創(chuàng)業(yè)環(huán)境總體情況是一個(gè)相對(duì)復(fù)雜的系統(tǒng),影響創(chuàng)業(yè)環(huán)境總體情況的因素也有很多,隨著時(shí)代發(fā)展,創(chuàng)業(yè)環(huán)境評(píng)價(jià)指標(biāo)體系也會(huì)不斷進(jìn)行完善和改進(jìn),是一個(gè)開(kāi)放發(fā)展的系統(tǒng)。
該研究基于GEM 模型構(gòu)建了大學(xué)生創(chuàng)業(yè)環(huán)境指標(biāo)體系,通過(guò)SPSS 軟件驗(yàn)證了該體系能夠較為科學(xué)地反映大學(xué)生創(chuàng)業(yè)環(huán)境整體情況,有利于快速獲得大學(xué)生創(chuàng)業(yè)環(huán)境整體情況,有針對(duì)性地改善創(chuàng)業(yè)環(huán)境,從而提高了大學(xué)生創(chuàng)業(yè)的意愿和成功率。