謝 威,趙嵩正
(西北工業(yè)大學(xué)管理學(xué)院,西安710129)
近年來(lái),國(guó)際統(tǒng)計(jì)界對(duì)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量的內(nèi)涵進(jìn)行了一些探索,在某些方面也達(dá)成了一致:首先,注重從用戶(hù)的角度來(lái)衡量統(tǒng)計(jì)數(shù)據(jù)質(zhì)量,強(qiáng)調(diào)用戶(hù)對(duì)統(tǒng)計(jì)信息的滿(mǎn)意程度;其次,鑒于統(tǒng)計(jì)數(shù)據(jù)質(zhì)量是一個(gè)具有豐富內(nèi)涵的概念,需要建立一個(gè)開(kāi)放、透明的統(tǒng)計(jì)數(shù)據(jù)質(zhì)量評(píng)估管理體系,應(yīng)從多角度、多方面來(lái)衡量[1]。因此,統(tǒng)計(jì)數(shù)據(jù)質(zhì)量可以定義為:統(tǒng)計(jì)數(shù)據(jù)的一組固有特性滿(mǎn)足使用者需要的程度[2]。統(tǒng)計(jì)數(shù)據(jù)質(zhì)量具體需要涵蓋哪些特性,則取決于使用者對(duì)數(shù)據(jù)的要求。統(tǒng)計(jì)數(shù)據(jù)質(zhì)量是一個(gè)相對(duì)概念,從狹義上講,準(zhǔn)確性是統(tǒng)計(jì)數(shù)據(jù)質(zhì)量的同義詞,是指客觀反映現(xiàn)實(shí)情況的程度,統(tǒng)計(jì)誤差越小越準(zhǔn)確,數(shù)據(jù)質(zhì)量越高。從廣義上講,準(zhǔn)確性?xún)H是數(shù)據(jù)質(zhì)量的一個(gè)重要方面,它還包括可獲得性、及時(shí)性、相關(guān)性、時(shí)間和空間上的一致性以及不同數(shù)據(jù)之間的一致性等。要求我們從統(tǒng)計(jì)數(shù)據(jù)提供者、生產(chǎn)者和用戶(hù)等多個(gè)角度來(lái)衡量數(shù)據(jù)質(zhì)量。
本文采用結(jié)構(gòu)方程模型來(lái)分析能源統(tǒng)計(jì)數(shù)據(jù)質(zhì)量的影響因素。結(jié)構(gòu)方程模型(簡(jiǎn)稱(chēng)為SEM)是基于變量的協(xié)方差矩陣來(lái)分析變量之間關(guān)系的一種統(tǒng)計(jì)方法,所以也稱(chēng)為協(xié)方差結(jié)構(gòu)分析[3]。該模型能夠很好地解決了多元回歸分析法存在的弱點(diǎn),并整合了路徑分析、驗(yàn)證性因素分析與一般統(tǒng)計(jì)檢驗(yàn)方法,可分析變量之間的相互因果關(guān)系,包括了因子分析與路徑分析的優(yōu)點(diǎn)。因此,廣泛應(yīng)用于社會(huì)科學(xué)的各個(gè)領(lǐng)域。
結(jié)構(gòu)方程模型通常包括三個(gè)矩陣方程式[4]:
相應(yīng)的模型假設(shè)如下:
(1)測(cè)量方程誤差項(xiàng)d、e的均值為零;
(2)結(jié)構(gòu)方程殘差項(xiàng)ζ的均值為零;
(3)誤差項(xiàng)d與ξ、e與η之間不相關(guān),d與e不相關(guān);
(4)殘差項(xiàng)ζ與d、e、ξ之間不相關(guān)。
其中,方程(1)和方程(2)被稱(chēng)之為測(cè)量模型,方程(3)則被稱(chēng)之為結(jié)構(gòu)模型,有關(guān)符號(hào)說(shuō)明見(jiàn)表1。
表1 結(jié)構(gòu)方程模型符號(hào)說(shuō)明
能源統(tǒng)計(jì)數(shù)據(jù)質(zhì)量是一個(gè)多因素集合,是一個(gè)內(nèi)生潛變量,需要通過(guò)數(shù)據(jù)的準(zhǔn)確性、可得性、完整性、空間時(shí)間一致性、時(shí)效性以及對(duì)用戶(hù)需求的滿(mǎn)足程度來(lái)反映。統(tǒng)計(jì)方案設(shè)計(jì)因素、環(huán)境因素以及統(tǒng)計(jì)人員因素是三個(gè)外生潛變量,同樣需要通過(guò)一系列外生觀測(cè)變量來(lái)反映。通過(guò)文獻(xiàn)分析及多輪次的頭腦風(fēng)暴,本文選取了4大類(lèi)共計(jì)18項(xiàng)影響因素作為本文的研究變量。能源統(tǒng)計(jì)數(shù)據(jù)質(zhì)量的影響因素如圖1所示。
圖1 能源統(tǒng)計(jì)數(shù)據(jù)質(zhì)量影響因素
通過(guò)文獻(xiàn)分析,結(jié)合本文建立的模型,做出如下假設(shè):
(1)基于潛變量之間關(guān)系的假設(shè)
假設(shè)1:假設(shè)統(tǒng)計(jì)方案設(shè)計(jì)因素、環(huán)境因素以及統(tǒng)計(jì)人員因素對(duì)能源統(tǒng)計(jì)數(shù)據(jù)質(zhì)量具有影響;
假設(shè)2:假設(shè)統(tǒng)計(jì)方案設(shè)計(jì)因素、統(tǒng)計(jì)人員因素受環(huán)境因素的影響;
假設(shè)3:假設(shè)統(tǒng)計(jì)人員因素受統(tǒng)計(jì)方案設(shè)計(jì)因素的影響。
(2)基于潛變量與觀測(cè)變量之間關(guān)系的假設(shè)
假設(shè)4:能源統(tǒng)計(jì)數(shù)據(jù)質(zhì)量可以用數(shù)據(jù)的準(zhǔn)確性、數(shù)據(jù)的可得性、數(shù)據(jù)的完整性、數(shù)據(jù)的空間時(shí)間一致性、數(shù)據(jù)的時(shí)效性以及對(duì)用戶(hù)需求的滿(mǎn)足程度來(lái)反映;
假設(shè)5:統(tǒng)計(jì)方案設(shè)計(jì)因素可以用統(tǒng)計(jì)方法的健全性、調(diào)查方式的多樣性、統(tǒng)計(jì)方案的可操作性以及統(tǒng)計(jì)流程的規(guī)范性來(lái)反映;
假設(shè)6:環(huán)境因素可以用資源配置水平、信息化水平、審核制度以及被調(diào)查者的合作化程度來(lái)反映;
假設(shè)7:統(tǒng)計(jì)人員因素可以用人員數(shù)量、人員穩(wěn)定性、人員基本素質(zhì)以及人員業(yè)務(wù)素質(zhì)來(lái)反映。
(3)基于內(nèi)生觀測(cè)變量之間關(guān)系的假設(shè)
假設(shè)8:假設(shè)數(shù)據(jù)的空間時(shí)間一致性受數(shù)據(jù)的準(zhǔn)確性、可得性、完整性和時(shí)效性影響;
假設(shè)9:假設(shè)對(duì)用戶(hù)需求的滿(mǎn)足程度受數(shù)據(jù)的準(zhǔn)確性、可得性、完整性、空間時(shí)間一致性以及時(shí)效性的影響。
根據(jù)研究需要,共發(fā)放了200份調(diào)查問(wèn)卷,回收167份,有效問(wèn)卷145份,問(wèn)卷有效回收率72.5%。問(wèn)卷的測(cè)量題目均采用李克特7點(diǎn)量表法測(cè)量,“7”代表非常符合,“1”代表非常不符合。
運(yùn)用SPSS16.0進(jìn)行探索性因子分析。各變量間的相關(guān)系數(shù)大部分都在0.4~0.8之間,說(shuō)明進(jìn)行因子分析的必要性。限于篇幅,本文在此不再列出變量間的相關(guān)系數(shù)矩陣。效度檢驗(yàn)結(jié)果見(jiàn)表2。從表2可以看出,本文KMO統(tǒng)計(jì)量檢驗(yàn)取值0.864,根據(jù)統(tǒng)計(jì)學(xué)家Kaiser給出的標(biāo)準(zhǔn),KMO取值大于0.7,適合進(jìn)行因子分析;同時(shí),在本文給定顯著性水平0.05的條件下,K方統(tǒng)計(jì)量較大,且P值小于0.05,通過(guò)了Bartlett球形檢驗(yàn)。
根據(jù)表3所示的方差貢獻(xiàn)率表可以看出,通過(guò)因子分析,模型自動(dòng)提取出3個(gè)主成分,12個(gè)外生觀測(cè)變量能夠解釋總方差的64.262%,涵蓋了原始數(shù)據(jù)的大部分信息。從中可以看出,旋轉(zhuǎn)前的3個(gè)主成分分別能夠解釋原有12個(gè)外生觀測(cè)變量總方差的45.501%、10.102%和8.659%,累積方差貢獻(xiàn)率達(dá)到64.264%,能夠從總體上反映原有變量的大部分信息。另外,因子旋轉(zhuǎn)后累積方差并沒(méi)有改變,但重新分配了各個(gè)因子解釋原有變量的方差,改變了各個(gè)因子的方差貢獻(xiàn),使得因子更易于解釋。
表2 KMO統(tǒng)計(jì)量和Bartlett球形檢驗(yàn)
表3 方差貢獻(xiàn)率表
信度表示對(duì)于同樣的對(duì)象,運(yùn)用同樣的觀測(cè)方法得出同樣觀測(cè)數(shù)據(jù)結(jié)果的可能性[5]。通常用量表的內(nèi)部一致性來(lái)進(jìn)行信度測(cè)試。Cronbach α系數(shù)是檢驗(yàn)量表的內(nèi)部一致性指標(biāo),介于0到1之間,α值越大表示信度越高。根據(jù)學(xué)者研究,Cronbach α系數(shù)信度一般介于0.7~0.9之間,都可算是高信度值[11]。運(yùn)用SPSS16.0進(jìn)行信度分析,可以得出,本文設(shè)計(jì)的問(wèn)卷量表的Cronbach α系數(shù)達(dá)到0.929,說(shuō)明信度較高。
依據(jù)研究對(duì)象的特點(diǎn),選取結(jié)構(gòu)方程模型作為研究工具。模型構(gòu)建如下:首先,以能源統(tǒng)計(jì)數(shù)據(jù)質(zhì)量作為內(nèi)生潛變量,通過(guò)6個(gè)觀測(cè)變量來(lái)體現(xiàn);其次,以統(tǒng)計(jì)方案設(shè)計(jì)因素、環(huán)境因素以及統(tǒng)計(jì)人員因素3項(xiàng)因素作為外生潛變量,分別通過(guò)4個(gè)觀測(cè)變量來(lái)體現(xiàn);最后,以調(diào)查問(wèn)卷題目的協(xié)方差矩陣作為基礎(chǔ)數(shù)據(jù)。利用結(jié)構(gòu)方程軟件AMOS7.0,得到相應(yīng)的驗(yàn)證性因子模型,如圖2所示。
圖2 能源統(tǒng)計(jì)數(shù)據(jù)質(zhì)量影響因素結(jié)構(gòu)方程模型
將數(shù)據(jù)導(dǎo)入AMOS7.0,建立結(jié)構(gòu)方程路徑圖,進(jìn)行模型估計(jì)與檢驗(yàn),分析顯示:
(1)各潛變量之間的路徑系數(shù)相應(yīng)的P值均小于0.05,說(shuō)明假設(shè)1、2、3中描述的潛變量之間的關(guān)系在90%的置信度上顯著,即可以說(shuō)明各潛變量之間具有一定的相關(guān)關(guān)系。
(2)各潛變量與觀測(cè)變量間的載荷系數(shù)相應(yīng)的P值除ξ3→x12為0.07以外,均小于0.05,說(shuō)明假設(shè)4、5、6、7中所描述的潛變量與觀測(cè)變量之間的關(guān)系在90%的置信度上顯著,即可以說(shuō)明利用絕大多數(shù)觀測(cè)變量來(lái)反映潛變量是合理的。
(3)各內(nèi)生觀測(cè)變量之間的載荷系數(shù)相應(yīng)的P值除y2→y4以外,均大于0.05,說(shuō)明假設(shè)8、9中描述的內(nèi)生觀測(cè)變量之間的關(guān)系在90%的置信度上不顯著,即可以說(shuō)明絕大多數(shù)內(nèi)生觀測(cè)變量之間的相關(guān)關(guān)系是不顯著的。
依據(jù)相應(yīng)檢驗(yàn)標(biāo)準(zhǔn)[6~7],通過(guò)6個(gè)步驟對(duì)模型進(jìn)行修正:第一,修正因子負(fù)荷Λx、Λy;第二,修正因子之間的協(xié)方差矩陣φ;第三,修正測(cè)量誤差的協(xié)方差Td、Te;第四,修正路徑系數(shù)B;第五,修正路徑系數(shù)Γ;第六,修正殘差項(xiàng)的協(xié)方差矩陣Ψ。在上述每個(gè)步驟中,都要依據(jù)模型給出的修正建議進(jìn)行修正,并重新檢驗(yàn)參數(shù)。針對(duì)每個(gè)步驟不斷重復(fù)這些過(guò)程,直到模型參數(shù)滿(mǎn)足標(biāo)準(zhǔn)需要。修正后的模型各擬合指標(biāo)如表4所示。
表4 修正后的擬合指標(biāo)
從表4中可以看出,c2/df<3,說(shuō)明模型與現(xiàn)實(shí)情況擬合好;除CFI以外,其余GFI、NFI、IFI均大于0.9,說(shuō)明模型擬合好;RMSEA<0.05,表明模型與數(shù)據(jù)擬合程度較好??傮w上看,能源統(tǒng)計(jì)數(shù)據(jù)影響因素結(jié)構(gòu)方程模型擬合程度較好,具有一定的有效性。
首先,統(tǒng)計(jì)方案設(shè)計(jì)因素、環(huán)境因素以及統(tǒng)計(jì)人員因子對(duì)能源統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量具有顯著的影響;其次,環(huán)境因素對(duì)于統(tǒng)計(jì)方案設(shè)計(jì)因素以及統(tǒng)計(jì)人員因素具有顯著的影響;再次,統(tǒng)計(jì)方案設(shè)計(jì)因素對(duì)于統(tǒng)計(jì)人員因素具有顯著的影響。因此,應(yīng)在對(duì)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量環(huán)境進(jìn)行一定控制的前提下,著重加強(qiáng)統(tǒng)計(jì)方案的設(shè)計(jì)工作,并提高統(tǒng)計(jì)人員的數(shù)量、質(zhì)量與穩(wěn)定性。
首先,在統(tǒng)計(jì)方案的設(shè)計(jì)因素方面,按照估計(jì)的路徑系數(shù)由強(qiáng)到弱依次進(jìn)行控制的是:統(tǒng)計(jì)方法的健全性、統(tǒng)計(jì)方案的可操作性、統(tǒng)計(jì)流程的規(guī)范性、調(diào)查方式的多樣性;其次,在環(huán)境因素方面,按照估計(jì)的路徑系數(shù)由強(qiáng)到弱依次進(jìn)行控制的是:被調(diào)查者的合作化程度、資源配置水平、信息化水平、審核制度;再次,在統(tǒng)計(jì)人員因素方面,按照估計(jì)的路徑系數(shù)由強(qiáng)到弱依次進(jìn)行控制的是:人員基本素質(zhì)、人員數(shù)量、人員的穩(wěn)定性、人員的業(yè)務(wù)素質(zhì)。
雖然大部分變量之間的關(guān)系并未通過(guò)顯著性檢驗(yàn),但是通過(guò)分析我們可以看出,對(duì)用戶(hù)需求的滿(mǎn)足程度受到數(shù)據(jù)的時(shí)效性、可得性、完整性、空間時(shí)間一致性以及準(zhǔn)確性的影響;而數(shù)據(jù)的空間時(shí)間一致性受到時(shí)效性、完整性以及準(zhǔn)確性的影響。因此,對(duì)于數(shù)據(jù)的質(zhì)量,應(yīng)重點(diǎn)控制其準(zhǔn)確性、時(shí)效性以及完整性,在此基礎(chǔ)上追求數(shù)據(jù)的可得性、空間時(shí)間一致性,最終滿(mǎn)足用戶(hù)對(duì)數(shù)據(jù)的需求。
[1]茍巧玲.普查數(shù)據(jù)質(zhì)量控制存在的主要問(wèn)題及建議[J].統(tǒng)計(jì)與咨詢(xún),2010,(2).
[2]許永洪.統(tǒng)計(jì)數(shù)據(jù)質(zhì)量的基本概念與數(shù)據(jù)質(zhì)量評(píng)估的基本模型[J].商業(yè)經(jīng)濟(jì)與管理,2010,(12).
[3]李懷組.管理研究方法論(第2版)[M].西安:西安交通大學(xué)出版社,2004.
[4]林嵩,姜彥福.結(jié)構(gòu)方程模型理論及其在管理研究中的應(yīng)用[J].科學(xué)學(xué)與科學(xué)技術(shù)管理,2006,(2).
[5]Karen Weber Cullen,Kathy Watson,Issa Zaker I.Relative Reliability and Validity of the Block Kids Questionnaire among Youth Aged 10 to 17 Years[J].Journal of the American Dietetic Association,2008,108(5).
[6]易丹輝.結(jié)構(gòu)方程模型方法與應(yīng)用[M].北京:中國(guó)人民大學(xué)出版社,2008.
[7]Paul Barrett.Structural Equation Modeling:Adjudging Model Fit[J].Personality and Individual Differences,2007,42(5).