国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

公共管理研究中潛變量指標(biāo)誤用問題及其改進(jìn)策略

2022-01-28 09:04:42郭晟豪蕭鳴政
關(guān)鍵詞:構(gòu)念題項效度

□郭晟豪,蕭鳴政

一、引言

有效測量問題被視作公共管理的大問題,準(zhǔn)確得當(dāng)?shù)臏y量既是實踐改進(jìn)方向的基礎(chǔ),也是公共管理研究可信可用的前提。對于實踐而言,有效測量問題是導(dǎo)向問題。量化的準(zhǔn)確性能夠決定研究能否是“好的定量研究”,也是當(dāng)前我國公共管理量化研究中亟待重視的問題[1]。但是,量化的實際操作并不簡單,尤其是潛變量,最為復(fù)雜。具體而言,有的研究變量可以直接測量,如國內(nèi)生產(chǎn)總值(GDP)、人口數(shù)量等被稱為顯變量或觀察變量,在測量時并無技術(shù)難度;還有部分研究變量難以直接測量,如當(dāng)前頗受重視的干部領(lǐng)導(dǎo)能力、治理效能、公共價值、合作生產(chǎn)等,這些無法直接觀測的變量被稱為潛變量,相關(guān)研究在對其測量時存在相當(dāng)?shù)奶魬?zhàn)。但是,社會中的現(xiàn)實問題往往繞不開潛變量。因此,早在現(xiàn)代統(tǒng)計學(xué)出現(xiàn)之前,人們已經(jīng)開始使用系統(tǒng)觀察的方式測量一些不易直接衡量的社會變量。在實證主義運動的推動下,日益完善的數(shù)理統(tǒng)計方法為量化研究提供了有力的工具支持,難以直接測量的潛變量可以通過多個題項共同測定,以避免單一題項測量潛變量存在測量不完整、精確性不足以及存在隨機誤差等內(nèi)生缺陷。在潛變量測量時,一般可以應(yīng)用兩種不同的指標(biāo)進(jìn)行,即反映型指標(biāo)(reflective indicator)與形成型指標(biāo)(formative indicator)。但是,在具體的潛變量測量時,反映型指標(biāo)和形成型指標(biāo)并不完全相同,且非常容易混用。

變量測量偏誤最直接的后果就是估計的嚴(yán)重偏誤,對于研究結(jié)論有致命影響。這一現(xiàn)象已經(jīng)得到心理學(xué)、社會學(xué)和工商管理學(xué)等具有定量研究傳統(tǒng)的學(xué)科的廣泛反思和討論[2]。值得注意的是,在公共管理等定量研究興起較晚的社會科學(xué)領(lǐng)域,仍有不少定量研究在測量指標(biāo)選用問題上“重蹈覆轍”。這一方面源于學(xué)科間的知識優(yōu)勢差異,另一方面則是因為公共管理研究對象更為復(fù)雜特殊。公共管理研究涉及政府、社會以及非營利機構(gòu)等中宏觀治理主體,還有領(lǐng)導(dǎo)干部、群眾等微觀行為個體,且許多構(gòu)念往往具有多學(xué)科源流,相應(yīng)潛變量的測量指標(biāo)選用難度進(jìn)一步提升。近年來公共管理研究熱點問題,諸如干部能力素質(zhì)、政府治理效能等都是難以直接觀測的潛變量。這些潛變量只有正確使用相應(yīng)類型的反映型指標(biāo)或者形成型指標(biāo),完成準(zhǔn)確測量,才能在量化研究中實現(xiàn)對理論構(gòu)念的正確分析,避免測量誤差、遺漏變量乃至因果關(guān)系的錯誤推斷等嚴(yán)重后果。

必須指出的是,公共管理領(lǐng)域?qū)τ诜从承椭笜?biāo)和形成型指標(biāo)的討論尚未引起足夠重視。在實際的公共管理研究中,上述兩種測量方式存在的混淆和誤用已經(jīng)導(dǎo)致部分公共管理錯誤的研究結(jié)論,更無法有效解決現(xiàn)實問題。選取一個與研究設(shè)計不相符的測量方式,將意味著在變量的測量和變量關(guān)系研究中出現(xiàn)第一類和第二類錯誤(1)第一類錯誤:原假設(shè)是正確的,卻拒絕原假設(shè)。第二類錯誤:原假設(shè)是錯誤的,卻沒有拒絕原假設(shè)。的概率大大增加,研究結(jié)論的可靠性存疑。已有研究發(fā)現(xiàn),在地方治理績效的測量中,將形成型指標(biāo)誤用為反映型指標(biāo),導(dǎo)致地方治理績效指標(biāo)無法通過所謂的統(tǒng)計檢驗,治理績效的所謂統(tǒng)計結(jié)構(gòu)難以解釋,部分績效內(nèi)容被遺漏,極大地削弱了研究結(jié)果對于現(xiàn)實問題的回應(yīng)力和解釋力[3]。但是,類似的問題不僅在地方治理績效中存在,在整個公共管理領(lǐng)域的量化研究中,只要涉及難以直接測量的潛變量,就繞不開反映型指標(biāo)和形成型指標(biāo)。而這些諸如效能、能力、價值的變量正是當(dāng)前公共管理研究的熱點、重點、難點,因此有必要對變量指標(biāo)進(jìn)行系統(tǒng)的回顧和辨析。

在廣泛借鑒其他學(xué)科關(guān)于潛變量測量方法論的研究成果、系統(tǒng)考察當(dāng)前公共管理領(lǐng)域定量研究的基礎(chǔ)上,本文認(rèn)為公共管理研究領(lǐng)域的變量與指標(biāo)問題需要注意以下三個要點。第一,指標(biāo)不僅僅是揭示變量的方式,合適的指標(biāo)更體現(xiàn)著對于變量的合意理解。如果研究者在構(gòu)造指標(biāo)和指標(biāo)統(tǒng)計檢驗時,本該使用形成型指標(biāo)卻使用反映型指標(biāo),或在本該使用反映型指標(biāo)時卻使用形成型指標(biāo),盡管仍能得出統(tǒng)計上的結(jié)果,但是,可能存在匹配上的誤差,也將無法形成契合理論構(gòu)想和恰當(dāng)解釋實踐的研究結(jié)論。第二,公共管理學(xué)領(lǐng)域本身使用的研究方法有多學(xué)科交叉的特征,在統(tǒng)計分析方面,心理學(xué)變量測量常用的內(nèi)部一致性、區(qū)別效度、聚合效度等統(tǒng)計標(biāo)準(zhǔn)均有其適用范圍,如果在公共管理學(xué)領(lǐng)域未經(jīng)判斷就沿用這些統(tǒng)計標(biāo)準(zhǔn),有可能造成量化統(tǒng)計的嚴(yán)重錯誤。第三,盡管在變量關(guān)系模型中,潛變量結(jié)構(gòu)方程的使用正日益成為公共管理學(xué)領(lǐng)域量化研究的一大熱點,但含有形成型潛變量的結(jié)構(gòu)方程在統(tǒng)計時并不適用傳統(tǒng)的基于協(xié)方差的結(jié)構(gòu)方程(CB-SEM),如不遵循判別和使用原則,同樣會產(chǎn)生謬誤[4]。

在當(dāng)前社會科學(xué)實證主義運動持續(xù)推進(jìn)卻也飽受質(zhì)疑的時代,對公共管理研究中潛變量測量原則的方法論進(jìn)行辨析,不僅可以明晰量化研究在公共管理領(lǐng)域的使用前景并從長遠(yuǎn)角度影響著公共管理學(xué)科的未來發(fā)展,而且可以為社會科學(xué)領(lǐng)域的潛變量測量系統(tǒng)理論的構(gòu)建貢獻(xiàn)來自公共管理學(xué)科的智慧。因此,本文旨在從三方面對上述問題做出回應(yīng):一是辨析潛變量測量中的反映型指標(biāo)與形成型指標(biāo)的區(qū)別以及誤用的后果;二是明確指標(biāo)選用的條件與情形,從而避免指標(biāo)混用;三是闡明針對不同類型的潛變量指標(biāo)所適宜的統(tǒng)計策略。

二、公共管理領(lǐng)域反映型和形成型指標(biāo)選擇的異同分析

在公共管理領(lǐng)域的變量測量問題中,顯變量通常可以直接測量,因此測量較為簡單;難點主要在于潛變量的測量,具體體現(xiàn)在對反映型指標(biāo)和形成型指標(biāo)做出正確的選擇。本文認(rèn)為,有必要對兩種類型的指標(biāo)進(jìn)行辨析(表1)。

表1 反映型指標(biāo)與形成型指標(biāo)

(一)反映型指標(biāo)與形成型指標(biāo)

反映型指標(biāo)是變量理論構(gòu)念的一組外在表現(xiàn),各指標(biāo)的含義相近,有相同主題,多個指標(biāo)共同“反映”出要測量的構(gòu)念。該類指標(biāo)起源于經(jīng)典測評理論和心理測量學(xué),指標(biāo)可以被視為潛變量的函數(shù),潛變量的變化反映在可觀測指標(biāo)的變化上,因果關(guān)系由理論構(gòu)念指向測量指標(biāo)。如果用δ來表示構(gòu)念(潛變量),X1,X2,X3為該構(gòu)念的一組反映型指標(biāo),λi為構(gòu)念δ對指標(biāo)Xi的影響,εi為第i個指標(biāo)的測量誤差,則Xi=λiδ+εi,i=1, 2, 3,…,n。反映型指標(biāo)是構(gòu)念本身的外在表現(xiàn),是由構(gòu)念決定的,因此反映型指標(biāo)也被稱作效果指標(biāo)(effect indicators)。在大多數(shù)情況下,因為承襲心理學(xué)的研究習(xí)慣,當(dāng)前管理學(xué)相關(guān)的研究量表和關(guān)于量表開發(fā)的方法研究幾乎以反映型指標(biāo)為主。

形成型指標(biāo)是指定義理論構(gòu)念的一組指標(biāo),該組指標(biāo)共同“形成”理論構(gòu)念的內(nèi)涵,這些指標(biāo)不相似或相近,也不必有一個共同主題。在許多情況下,指標(biāo)可以影響它所測量的潛變量,而不是被潛變量影響。在這種情況下,這些指標(biāo)被稱為形成型指標(biāo),因果關(guān)系由測量指標(biāo)指向理論構(gòu)念。如果同樣用δ來表示構(gòu)念(潛變量),X1,X2,X3為該構(gòu)念的形成型指標(biāo),γi為指標(biāo)Xi對構(gòu)念δ的影響,i=1, 2, 3,…,n,ξ是誤差項,則δ=γ1X1+γ2X2+γ3X3+…+γnXn+ξ。形成型指標(biāo)不是構(gòu)念本身的外在表現(xiàn),而是由指標(biāo)組成構(gòu)念的內(nèi)涵、決定潛變量的構(gòu)念,因此形成型指標(biāo)也被稱作原因指標(biāo)(cause, causal indicators)。形成型指標(biāo)對于實踐中的潛變量測量,尤其是具體內(nèi)容復(fù)雜的潛變量有著獨有的適用性,因此在近些年得到越來越多的關(guān)注。

(二)潛變量的指標(biāo)類型辨析

反映型指標(biāo)和形成型指標(biāo)的特點可以通過二者的比較得到更為明顯的體現(xiàn)。具體地,反映型指標(biāo)和形成型指標(biāo)的差異體現(xiàn)在以下幾方面。第一,在構(gòu)念組成方面,反映型指標(biāo)是構(gòu)念的外在表現(xiàn),因果方向由構(gòu)念指向指標(biāo),構(gòu)念的變化會引起指標(biāo)的變化;形成型指標(biāo)組成構(gòu)念的內(nèi)涵,因果方向由指標(biāo)指向構(gòu)念,指標(biāo)的變化會引起構(gòu)念的變化。第二,在指標(biāo)內(nèi)容方面,反映型指標(biāo)必須相似或相近,必須要有一個共同的主題,減少某一個指標(biāo)并不影響構(gòu)念的內(nèi)涵;形成型指標(biāo)無須相似或相近,不需要有一個共同的主題,減少某一個指標(biāo)將改變構(gòu)念的內(nèi)涵。第三,在指標(biāo)關(guān)系方面,反映型指標(biāo)可彼此共變,且指標(biāo)有相同的理論基礎(chǔ);形成型指標(biāo)不必彼此共變,可以相互獨立,且指標(biāo)可以有不同的理論基礎(chǔ)。第四,在信度方面,反映型指標(biāo)關(guān)注內(nèi)部一致性、項目信度;形成型指標(biāo)不存在內(nèi)部一致性。第五,在效度方面,反映型指標(biāo)關(guān)注聚合效度、區(qū)分效度;形成型指標(biāo)關(guān)注構(gòu)念效度、項目效度、區(qū)分效度。最后,反映型指標(biāo)常用統(tǒng)計方法包括回歸分析、基于協(xié)方差的結(jié)構(gòu)方程(CB-SEM),測量誤差存在于指標(biāo)層;形成型指標(biāo)常用統(tǒng)計方法為偏最小二乘法的結(jié)構(gòu)方程(PLS-SEM),測量誤差存在于構(gòu)念層。

(三)公共管理領(lǐng)域潛變量測量指標(biāo)適用類型

本文選擇公共管理學(xué)研究中具有代表性的部分潛變量,并根據(jù)反映型指標(biāo)和形成型指標(biāo)在概念上的區(qū)別進(jìn)行類型舉例(表2)。首先是一些反映型指標(biāo)在公共管理學(xué)領(lǐng)域的使用情況。被測量的潛變量往往在微觀層面、以行為公共管理學(xué)為主,如公民義務(wù)式公共服務(wù)動機、人事管理的繁文縟節(jié)以及政策感知的薪酬和晉升政策。可以發(fā)現(xiàn),反映型指標(biāo)的題項有明顯的相似性,每一個題項可以由另外相近的題項代替,題項是潛變量的外在表現(xiàn)。例如,公民義務(wù)式公共服務(wù)動機中的“我認(rèn)為公共服務(wù)是我的公民義務(wù)”“有意義的公共服務(wù)對我來說是非常重要的”具有一定相似性,“我認(rèn)為公共服務(wù)是我的公民義務(wù)”得分高的被試者在“有意義的公共服務(wù)對我來說是非常重要的”得分也會高。因此,某個題項的剔除不會對公民義務(wù)式公共服務(wù)動機的內(nèi)涵本身產(chǎn)生影響,這也是研究者可以通過信效度檢驗剔除反映型指標(biāo)原量表中題項的原因。

表2 反映型與形成型的公共管理評價指標(biāo)舉例

然而在更多時候,公共管理學(xué)研究中的高維變量是由多方面共同組成的,測量題項之間不具有相互的替代性,尤其是中、宏觀層面的變量。同樣地,本文對一些形成型指標(biāo)在公共管理學(xué)領(lǐng)域的使用情況進(jìn)行梳理,被測量的潛變量包括兒童支援執(zhí)行計劃的績效、腐敗、政府績效、公務(wù)員績效等??梢园l(fā)現(xiàn),形成型指標(biāo)的題項之間彼此獨立,每個題項均具有自身的特征和獨有性,題項間重復(fù)度低,各個題項共同組成潛變量的具體內(nèi)涵,如果缺失某一個題項,測量的對象也會發(fā)生變化。例如,公務(wù)員績效中“出勤及守時”“領(lǐng)導(dǎo)才能”并沒有高相似度,“出勤及守時”得分高的被評價者不意味著“領(lǐng)導(dǎo)才能”得分也會高;如果測量指標(biāo)中不包含“領(lǐng)導(dǎo)才能”,那么公務(wù)員績效這一構(gòu)念將缺少一部分內(nèi)容,構(gòu)念內(nèi)涵將發(fā)生重大變化。這也是形成型指標(biāo)不適宜以內(nèi)部一致性作為評價標(biāo)準(zhǔn),也不可以隨意剔除原量表中題項的原因。

三、公共管理研究中反映型與形成型指標(biāo)的誤用

(一)指標(biāo)類型誤用產(chǎn)生的錯誤

在選擇測量指標(biāo)時,如果不能對反映型與形成型指標(biāo)進(jìn)行區(qū)分,研究者可能會犯第一類錯誤或第二類錯誤,如表3所示。如果在應(yīng)該選用形成型指標(biāo)的構(gòu)念上選取反映型指標(biāo),就會產(chǎn)生第一類錯誤。此時因果關(guān)系錯誤地從構(gòu)念指向指標(biāo),指標(biāo)不再被用于定義構(gòu)念,而是成為構(gòu)念的一系列外在表現(xiàn)(2)盡管出現(xiàn)第一類錯誤,統(tǒng)計結(jié)果依然會顯示具有較適合的單維性、高度可靠的子量表以及較好的整體模型擬合度。但是從理論構(gòu)念本身具有的特質(zhì)來說,這種測量方法并不可?。簭膬?nèi)容上來說,犯第一類錯誤會產(chǎn)生內(nèi)容不同的指標(biāo)體系;從指標(biāo)刪減過程來說,犯第一類錯誤會導(dǎo)致在指標(biāo)構(gòu)建過程中為降低多重共線性而刪去高度相關(guān)的項目,在量表開發(fā)過程中為增加內(nèi)部一致性而保留高度相關(guān)的項目;從效標(biāo)效度來說,不同的指標(biāo)構(gòu)建和量表開發(fā)過程也會導(dǎo)致不同的效標(biāo)效度。。如果在應(yīng)該選用反映型指標(biāo)的構(gòu)念上選取形成型指標(biāo),就會發(fā)生第二類錯誤。此時因果關(guān)系錯誤地從指標(biāo)指向構(gòu)念,指標(biāo)不再是構(gòu)念的一系列外在表現(xiàn),而是定義了構(gòu)念。由于反映型指標(biāo)在管理學(xué)占據(jù)主導(dǎo)地位,一些學(xué)者甚至在測量潛變量時會下意識地使用反映型指標(biāo)及其統(tǒng)計方法。

表3 指標(biāo)類型選擇正誤與結(jié)果

Jarvis、Mackenzie和Podsakoff的元分析顯示,大多數(shù)測量中出現(xiàn)的錯誤都是由于在本應(yīng)該使用形成型指標(biāo)時卻使用反映型指標(biāo)[16]。Diamantopoulos、Riefler和Roth對先前的研究進(jìn)行總結(jié),發(fā)現(xiàn)第一類錯誤發(fā)生的次數(shù)遠(yuǎn)遠(yuǎn)多于第二類錯誤,且犯第一類錯誤的后果十分嚴(yán)重[17]。研究者往往難以解釋實質(zhì)性的結(jié)構(gòu)模型關(guān)系,結(jié)構(gòu)參數(shù)要么被高估,要么被低估;在某些情況下,甚至能使結(jié)構(gòu)參數(shù)由不顯著變?yōu)轱@著(3)當(dāng)本應(yīng)使用形成型指標(biāo)卻誤用反映型指標(biāo)時,會減少構(gòu)念的方差,因為以反映型指標(biāo)測量的構(gòu)念的方差等于各個測量的公方差,而以形成型指標(biāo)測量的構(gòu)念的方差等于各個測量的方差之和。因此如果犯第一類錯誤,就會減少外生變量的方差并保持內(nèi)生變量的方差,從而增加對它們之間關(guān)系的參數(shù)估計,相反,如果降低內(nèi)生變量的方差,而外生變量的方差保持不變,那么相關(guān)的參數(shù)估計就會降低。由于指標(biāo)類型的錯誤使用,結(jié)構(gòu)路徑系數(shù)要么被高估,要么被低估,對結(jié)構(gòu)模型關(guān)系的實質(zhì)性解釋產(chǎn)生不良影響。。

(二)公共管理領(lǐng)域變量指標(biāo)誤用的表現(xiàn)

在目前的公共管理領(lǐng)域,同樣由于沿用心理學(xué)測量習(xí)慣,研究者們更多地選擇使用反映型指標(biāo)的統(tǒng)計標(biāo)準(zhǔn),形成型指標(biāo)并沒有得到廣泛重視和使用,因此,將反映型誤用為形成型的情況比較罕見。而且,反映型指標(biāo)在公共管理領(lǐng)域常見于微觀;微觀的行為公共管理是公共管理學(xué)與心理學(xué)的交叉學(xué)科,許多潛變量(如公務(wù)員的離職傾向)本來就化用的是心理學(xué)的反映型指標(biāo)量表,因此反映型指標(biāo)的思維更容易在公共管理研究中先入為主。相應(yīng)地,當(dāng)前公共管理研究的突出問題是將形成型指標(biāo)誤用為反映型,尤其是使用反映型指標(biāo)的統(tǒng)計標(biāo)準(zhǔn)和流程進(jìn)行變量測量和變量關(guān)系的檢驗,其直接后果是形成型指標(biāo)的潛變量被反映型指標(biāo)的統(tǒng)計標(biāo)準(zhǔn)束縛,從而因統(tǒng)計錯誤導(dǎo)致結(jié)果謬誤。

其一是在測量工具的信效度檢驗時采用不適當(dāng)?shù)臋z驗指標(biāo)。這是當(dāng)前公共管理學(xué)研究測量指標(biāo)首當(dāng)其沖的問題。由于公共管理學(xué)的測量統(tǒng)計方法往往借鑒心理學(xué)測量,部分統(tǒng)計分析的教材直接以心理學(xué)量表為范例介紹信度與效度等檢驗方法和判斷標(biāo)準(zhǔn),但是如前所述,大多數(shù)的心理學(xué)測量量表屬于反映型指標(biāo),因此指標(biāo)的評價流程往往會受到“先入為主”的影響,采用的默認(rèn)統(tǒng)計技術(shù)其實是反映型指標(biāo)的標(biāo)準(zhǔn)。如果指標(biāo)其實是形成型指標(biāo),那么用反映型的標(biāo)準(zhǔn)去檢驗指標(biāo)是否合格就會出現(xiàn)第一類錯誤,將原本好的指標(biāo)以為是不好的。例如,部分研究者在開發(fā)測量量表或者量表驗證時,通常直接采用探索性因子分析、內(nèi)部一致性檢驗(如判定Cronbach’sα)等反映型指標(biāo)的標(biāo)準(zhǔn),但是對于大多數(shù)的公共管理變量,如政府績效評價,因為績效往往由多方面共同組成,一系列指標(biāo)共同構(gòu)成政府績效的內(nèi)涵,指標(biāo)的數(shù)量、含義變化都會影響政府績效內(nèi)涵[18],因此應(yīng)該屬于形成型指標(biāo)。誤用為反映型指標(biāo)的最為突出的表現(xiàn)是采用探索性因子分析對題項“降維”,造成所謂的“共同因子”難以合理命名,以及因績效指標(biāo)內(nèi)部一致性較差,所以剔除所謂“不合理”題項,導(dǎo)致評價內(nèi)容缺失[3]。

其二是在變量關(guān)系檢驗時采用不恰當(dāng)?shù)慕y(tǒng)計技術(shù)。目前,對于公共管理領(lǐng)域的變量關(guān)系檢驗,潛變量實際上往往被處理為觀察變量(所謂結(jié)構(gòu)方程模型其實只是路徑分析),即計算潛變量的全部題項平均數(shù)作為潛變量的取值,但是可以計算平均數(shù)的前提是題項的內(nèi)部一致性系數(shù)信度高。顯然這是反映型指標(biāo)的計算方式,形成型指標(biāo)并不適用,因此不可以直接以Cronbach’sα大于0.600或0.700為由,計算形成型指標(biāo)的平均數(shù)并作為潛變量的觀測值。此外,隨著潛變量結(jié)構(gòu)方程的日益流行及其在公共管理研究中的應(yīng)用,另一個問題也將涌現(xiàn),即在使用潛變量結(jié)構(gòu)方程時,研究者同樣容易囿于潛變量結(jié)構(gòu)方程通常被默認(rèn)為基于協(xié)方差的結(jié)構(gòu)方程(CB-SEM)而直接使用,但是對于形成型指標(biāo)而言,CB-SEM并不適用。錯誤的結(jié)構(gòu)方程使用會造成模型估計的嚴(yán)重不準(zhǔn)確,變量間關(guān)系的結(jié)論也不可靠。

(三)公共管理研究中指標(biāo)誤用及后果舉例

關(guān)于公共管理領(lǐng)域指標(biāo)誤用的情況,國內(nèi)的研究以縣域政府治理績效和鄉(xiāng)鎮(zhèn)工作治理績效為例加以說明[3]??h域政府治理績效的測量指標(biāo)的研究,原本根據(jù)理論和實踐提出行政服務(wù)態(tài)度、行政審批效率、民主決策水平、政策執(zhí)行能力、公務(wù)員廉潔情況、政務(wù)公開程度、執(zhí)法公正性、市場監(jiān)督能力以及對區(qū)政府總體治理水平的評價等較為完整的諸多方面,共同組成縣域政府治理績效。這本屬于形成型指標(biāo),但是由于在統(tǒng)計檢驗時使用反映型指標(biāo)的標(biāo)準(zhǔn),進(jìn)行內(nèi)部一致性的檢驗并剔除題項,最終得到話語權(quán)與問責(zé)制、政府有效性、管制質(zhì)量、法治和腐敗控制等內(nèi)容,這與研究的構(gòu)想存在較大差距并難以解釋,實際上造成縣域政府治理績效測量的損失,其根源就是指標(biāo)類型選擇不當(dāng),使得應(yīng)該測量的題項未能被納入。此外,在鄉(xiāng)鎮(zhèn)工作治理績效的測量中,鄉(xiāng)鎮(zhèn)日常工作包括基本生活、日常服務(wù)、政策制度等不同方面,每個方面也由具體的內(nèi)容組成,同樣屬于形成型指標(biāo)。研究發(fā)現(xiàn),當(dāng)使用形成型指標(biāo)的統(tǒng)計檢驗標(biāo)準(zhǔn)時,原先維度區(qū)分不明顯或難以解釋的窘境將得到解決,也更符合研究者測量鄉(xiāng)鎮(zhèn)工作治理績效的構(gòu)想,且不會無端造成信息的損失[3]。

國外的研究以出口方面的績效測量為例。出口協(xié)調(diào)績效的測量指標(biāo)包括出口的溝通、責(zé)任共擔(dān)和合作等內(nèi)容,這應(yīng)該屬于形成型指標(biāo),但是研究者如果誤用為反映型指標(biāo),那么使用同樣的數(shù)據(jù)進(jìn)行分析,將發(fā)現(xiàn)出口的合作對工作者的工作績效沒有影響,這并不符合實際的情況,并且難以解釋[6]。類似地,在出口績效的測評上,Zou、Taylor和Osland的量表包括財務(wù)、戰(zhàn)略性和滿意度三個方面[19],每個方面三個題項,并被一直作為反映型指標(biāo)使用。但是,戰(zhàn)略性中的題項“盈利額度”和 “長期高增長”兩項在內(nèi)部一致性檢驗時會彼此干擾,導(dǎo)致內(nèi)部一致性較差。而現(xiàn)實情況是,“盈利額度”和“長期高增長”兩者在統(tǒng)計上并不具有絕對一致性,也就是說這里并不符合反映型指標(biāo)的標(biāo)準(zhǔn),本就不存在所謂的內(nèi)部一致性。但是,類似這種誤用使諸多研究者在滿足本就不應(yīng)檢驗的題項在內(nèi)部一致性的問題上遇阻。而當(dāng)將出口績效的測量指標(biāo)轉(zhuǎn)化為形成型指標(biāo)時,發(fā)現(xiàn)問題即可迎刃而解[5],研究結(jié)論更能體現(xiàn)理論和實踐的情況。

四、改進(jìn)當(dāng)前誤用問題的建議

實證研究中的測量模型經(jīng)常被誤用,往往體現(xiàn)著研究人員和評論員對兩類指標(biāo)不夠了解[16]。針對目前公共管理學(xué)潛變量測量指標(biāo)中存在的反映型指標(biāo)與形成型指標(biāo)誤用的現(xiàn)象,本文首先進(jìn)行指標(biāo)的類型辨析,在對比反映型指標(biāo)與形成型指標(biāo)各自特點的基礎(chǔ)上,進(jìn)一步介紹指標(biāo)的選擇策略以及相應(yīng)的統(tǒng)計方法。面對指標(biāo)誤用問題,本文將公共管理量化研究中的潛變量測量初步劃分為“指標(biāo)類型選擇”“指標(biāo)統(tǒng)計檢驗”“模型使用”以及“模型判別”四個階段,提出潛變量測量的操作流程指南(圖1),以有助于研究者尤其是公共管理學(xué)科領(lǐng)域的研究者參考借鑒。

圖1 公共管理學(xué)潛變量指標(biāo)選擇與研究流程圖

(一)明確研究問題的性質(zhì)與特點

明確研究問題的性質(zhì)和特點是研究的起點。針對某一構(gòu)念,在反映型指標(biāo)和形成型指標(biāo)之間進(jìn)行選擇并不容易,必須依靠理論分析。研究者應(yīng)該考慮,對特定問題的回應(yīng)在理論上應(yīng)當(dāng)是如何的,測量模型應(yīng)該從理論考慮出發(fā)去設(shè)計。比如,對于政府績效的測量,不同的研究之中可以不同,取決于具體要研究什么樣的政府績效(如縣域政府績效、職能部門績效、干部工作績效等),是關(guān)注多方面的組成還是某一方面的具體表現(xiàn),應(yīng)當(dāng)有所差異。也就是說,應(yīng)該通過研究問題和理論分析來決定指標(biāo)的類型,而不是直接默認(rèn)指標(biāo)類型或者根據(jù)統(tǒng)計結(jié)果更改原先的指標(biāo)類型設(shè)計。形成型指標(biāo)和反映型指標(biāo)之間并沒有絕對的優(yōu)劣之分,部分變量可以有不同的解釋和測量角度,為避免第一類錯誤和第二類錯誤,研究者應(yīng)立足特定問題進(jìn)行研究設(shè)計,秉持回應(yīng)、改進(jìn)現(xiàn)實的初衷,并充分考慮具體構(gòu)念和指標(biāo)之間的邏輯因果關(guān)系,以此選擇最恰當(dāng)?shù)闹笜?biāo)類型。

在理論構(gòu)念的定義階段,要仔細(xì)考慮后續(xù)統(tǒng)計時潛變量及其指標(biāo)之間可能的因果優(yōu)先級。盡管Bollen和Lennox已經(jīng)呼吁研究者不應(yīng)該自動地將自己局限于單維的經(jīng)典測評模型中[20],但是目前在研究中反映型指標(biāo)仍占主導(dǎo)地位。這樣的反映型指標(biāo)主導(dǎo)通常是不假思索的下意識行為,意味著存在未經(jīng)審慎判定即做出錯誤選擇的可能。這樣的錯誤會導(dǎo)致無法準(zhǔn)確評估構(gòu)念之間的理論關(guān)系,即真實的因果究竟是怎樣的。因此,研究者在為感興趣的理論構(gòu)念開發(fā)多題項的量表之前,就要依據(jù)特定問題和研究目的,明確問題的性質(zhì)和特點,充分考慮反映型指標(biāo)和形成型指標(biāo)的潛在適用性,究竟哪一種更為適合。

(二)指標(biāo)類型的選擇與設(shè)計

指標(biāo)類型的選擇同樣應(yīng)當(dāng)由理論而非研究者的統(tǒng)計目標(biāo)驅(qū)動。Gerbing和Anderson指出,反映型指標(biāo)適用的CB-SEM適合于測評和發(fā)展理論,形成型指標(biāo)使用的PLS-SEM適合于對未來的預(yù)測[21]。Fornell和Bookstein指出,如果研究可觀測的差異,反映型指標(biāo)更合適;如果研究抽象的解釋或無法觀測的差異,形成型指標(biāo)會有更強的解釋力[22]。雖然這仿佛說明,可以依據(jù)研究目的的不同而選擇指標(biāo)類型,但是這些說法其實并不準(zhǔn)確,因為測量手段應(yīng)該服務(wù)于變量構(gòu)念。

構(gòu)念與其指標(biāo)之間的認(rèn)知關(guān)系并非可以被“操縱”并由此適應(yīng)研究者的目標(biāo)。這種“操縱”與理論主導(dǎo)(theory-driven)的原則不一致。在檢查構(gòu)念間的實質(zhì)關(guān)系之前,構(gòu)念與指標(biāo)之間關(guān)系的性質(zhì)和方向是已經(jīng)確定的[6]。也就是說,反映型指標(biāo)和形成型指標(biāo)之間的選擇必須在根本上是理論驅(qū)動,而不是測評驅(qū)動。

指標(biāo)設(shè)計需要考慮指標(biāo)內(nèi)容的充分性和統(tǒng)計的有效性之間的平衡。具體地說,在構(gòu)建指標(biāo)時,必須將理論驅(qū)動的測量操作化與期望獲得的統(tǒng)計有效性相協(xié)調(diào)。例如,為提高信度(在反映型指標(biāo)中)或減少多重共線性(在形成型指標(biāo)中)而盲目剔除項目,很可能會對所有指標(biāo)的效度產(chǎn)生不良后果。雖然對如何平衡內(nèi)容充分性和統(tǒng)計有效性并沒有硬性規(guī)則,但如果只關(guān)注統(tǒng)計上的有效性,則不太可能產(chǎn)生說服力強且具有可重復(fù)性的測量工具。也就是說,盡管可以判斷采用反映型指標(biāo)或者形成型指標(biāo)哪一種的統(tǒng)計有效性更好,但是這并不應(yīng)該成為指標(biāo)類型選擇的理由。如果在理論基礎(chǔ)上已經(jīng)選擇反映型指標(biāo)(這意味著形成型指標(biāo)已經(jīng)被仔細(xì)考慮過,但最終未被采納),不管在量表開發(fā)過程中獲得何種結(jié)果,轉(zhuǎn)換為形成型指標(biāo)并不可取,反之亦然。

Jarvis、Mackenzie和Podsakoff建議思考以下原則:通過指標(biāo)與構(gòu)念之間因果關(guān)系的指向、指標(biāo)之間的互換性、指標(biāo)是否應(yīng)彼此一致、指標(biāo)是否具有相同的前因和后因等四組問題,在反映型指標(biāo)和形成型指標(biāo)之間進(jìn)行選擇,研究者可以參考比照(表4)[16]。

表4 反映型指標(biāo)和形成型指標(biāo)的選擇原則

(三)指標(biāo)統(tǒng)計檢驗

對于指標(biāo)的評價必須首先判斷其類型,然后再采用相應(yīng)的統(tǒng)計評價方法。在選擇符合潛變量的理論指標(biāo)類型后,即應(yīng)選擇與之相應(yīng)的信度、效度檢驗標(biāo)準(zhǔn),從而避免前文所述在統(tǒng)計上存在的第一種錯誤。此時可以參考本文中的信度、效度部分,反映型指標(biāo)關(guān)注內(nèi)部一致性、項目信度、聚合效度、區(qū)分效度,形成型指標(biāo)則關(guān)注共線性、構(gòu)念效度、項目效度、區(qū)分效度。

反映型指標(biāo)的評價相對成熟,可以從單維性、內(nèi)部一致性、項目信度、聚合效度、區(qū)別效度等標(biāo)準(zhǔn)進(jìn)行判斷。其中,單維性方面,探索性因子分析后應(yīng)為同一因子且載荷在0.600以上;內(nèi)部一致性方面,Cronbach’sα應(yīng)該在0.600以上,CR值應(yīng)達(dá)到0.600以上;項目信度方面,指標(biāo)載荷應(yīng)大于0.700并達(dá)到顯著水平;聚合效度方面,AVE值應(yīng)大于0.500;區(qū)別效度方面,交叉載荷應(yīng)不高于內(nèi)部載荷,且AVE的平方根大于所有相關(guān)系數(shù)。

形成型指標(biāo)的評價相對有限,主要判斷標(biāo)準(zhǔn)有項目效度、共線性和區(qū)別效度。其中,項目效度方面,指標(biāo)權(quán)重應(yīng)在0.200以上或至少大于0.100,并且應(yīng)達(dá)到顯著水平;共線性方面,指標(biāo)應(yīng)不存在嚴(yán)重的共線性[7],即VIF低于5或公差大于2、狀況指數(shù)(condition index)低于30;區(qū)別效度方面,指標(biāo)間的相關(guān)系數(shù)應(yīng)低于0.700[23]。

(四)潛變量模型使用與判別

如果研究者在檢驗潛變量的指標(biāo)信、效度后,通過計算平均數(shù)或加權(quán)平均數(shù)將潛變量整理為一個數(shù)值,那么在使用模型統(tǒng)計分析時,變量的處理與顯變量的模型無異。需要補充說明的是,真正意義的潛變量模型,即測量模型與結(jié)構(gòu)模型均存在于完整的模型統(tǒng)計中。

如果采用的是反映型指標(biāo),那么采用潛變量結(jié)構(gòu)方程最常使用的CB-SEM完成即可。這也是眾多潛變量結(jié)構(gòu)方程操作教程中介紹的方法,模型結(jié)果的判定可以參考CFI、TLI(大于0.800)、RMSEA(小于0.080)等判別指標(biāo)。這一部分的內(nèi)容已經(jīng)較為成熟。

如果采用的是形成型指標(biāo),為確保模型被正確識別,那么統(tǒng)計分析則需要使用PLS-SEM完成[4]。常用準(zhǔn)則包括:對于每個外部權(quán)重,使用1作為初始值;使用路徑加權(quán)方式[24];最大迭代次數(shù)不超過300;使用交叉冗余;遺漏距離(omission distance)設(shè)置為5-10,且有效觀測數(shù)除以遺漏距離不得為整數(shù)[25];Bootstrap樣本設(shè)置為5000,必須大于有效觀測值的個數(shù);模型結(jié)果的判定可以參考R-square、Q-square、F-square和GOF等判別指標(biāo)[26],只是與已經(jīng)頗為成熟的CB-SEM相比,目前PLS-SEM模型的判別指標(biāo)依然存在爭議[25]。

五、應(yīng)用案例與進(jìn)一步探索

(一)公共管理領(lǐng)域潛變量測量應(yīng)用案例

本文以“烏干達(dá)民主和治理質(zhì)量數(shù)據(jù)(2015)”中選舉公正的測量為例(4)烏干達(dá)民主和治理質(zhì)量數(shù)據(jù)(The Quality of Democracy and Governance in Uganda)調(diào)查于2015年5月7日至2015年5月26日間,在烏干達(dá)全國范圍內(nèi)進(jìn)行,對該國18歲及以上公民進(jìn)行隨機抽樣調(diào)查,共計調(diào)查2400人,應(yīng)答率達(dá)84.7%,搜集得到烏干達(dá)公民對政治腐敗、區(qū)域關(guān)系等社會公共議題的態(tài)度。本文所選取關(guān)于選舉公正的測量選自該數(shù)據(jù)的題項Q48A-Q48F。資料來源:Golooba-Mutebi F, Kibirige F. Afrobarometer Round 6: The Quality of Democracy and Governance in Uganda, 2015[DB/OL],(2018-05-21) [2021-08-01]https://doi.org/10.3886/ICPSR36900.v1.,說明前述指導(dǎo)框架中指標(biāo)判定以及統(tǒng)計檢驗的應(yīng)用思路。烏干達(dá)民主和治理質(zhì)量數(shù)據(jù)是一系列關(guān)于公眾態(tài)度的調(diào)查,用于搜集非洲人對民主、治理、經(jīng)濟(jì)、公民社會及相關(guān)問題的看法,在公共管理領(lǐng)域的研究中得到研究者的重視和使用。本文用于示例的選舉公正的測量共有6個題項,分為選舉環(huán)境和選舉行為兩個方面,每個方面各三題,具體見表5。首先,選舉環(huán)境的公正水平高,選舉行為的公正水平并不一定也高,雖然建立的環(huán)境可能足夠公正,但在實際投票行為中也可能被干擾,反之亦然。所以應(yīng)該是選舉環(huán)境和選舉行為兩個方面(還可能存在其他方面)組成選舉公正,因此指標(biāo)應(yīng)為形成關(guān)系。具體到選舉環(huán)境的測量,包括選票統(tǒng)計公正、反對派候選人被阻止競選(R)、媒體對所有候選人公正報道三個具體題項,同樣地,三者不一定同時處于高水平或低水平,選舉環(huán)境在這3個題項中可能各有不同,同時也可能存在其他的內(nèi)容,因此,應(yīng)該為形成型指標(biāo)。同理,選舉行為也屬于形成型指標(biāo)。所以,應(yīng)該采用形成型指標(biāo)的統(tǒng)計檢驗。本文使用SmartPLS進(jìn)行偏PLS-SEM的驗證性因子分析。如表5所示,選舉環(huán)境和選舉行為的3個題項外部權(quán)重均大于0.200,達(dá)到標(biāo)準(zhǔn),并且顯著。此外,兩個變量的相關(guān)系數(shù)為0.606,低于0.700,說明區(qū)分效度較高。因此,數(shù)據(jù)適合進(jìn)行量化統(tǒng)計分析。

表5 指標(biāo)判定以及統(tǒng)計檢驗的差異舉例:選舉公正的測量

但是,如果沒有進(jìn)行潛變量指標(biāo)類型的判斷,而是依照研究的慣性直接采用計算變量的內(nèi)部一致性,即采用反映型指標(biāo)的統(tǒng)計檢驗標(biāo)準(zhǔn),如表5所示,選舉環(huán)境的Cronbach’sα為0.347,并未達(dá)到0.600以上的標(biāo)準(zhǔn);CR為0.357,也未達(dá)到0.600以上的標(biāo)準(zhǔn);AVE為0.168,同樣未超過0.500。這就意味著從指標(biāo)統(tǒng)計檢驗的標(biāo)準(zhǔn)來看,選舉環(huán)境的3個題項無法通過統(tǒng)計檢驗,不可以以平均數(shù)的方式計算為顯變量。同樣的情況,對于選舉行為而言依然存在,即選舉行為3個題項的內(nèi)在一致性信度很低,無法進(jìn)行平均數(shù)的合并計算。

不僅如此,使用潛變量結(jié)構(gòu)方程進(jìn)行驗證性因子分析方式的情況依然堪憂。例如一般而言最為常用的CB-SEM,使用Mplus進(jìn)行分析,即選舉公正有選舉環(huán)境和選舉行為兩個維度,每個維度使用3個題項測量,即二階CFA??梢园l(fā)現(xiàn),選舉環(huán)境3個題項的標(biāo)準(zhǔn)化因子載荷都低于0.600的標(biāo)準(zhǔn),選舉行為3個題項也只有1項在0.600以上。這同樣意味著,選舉公正的測量在潛變量的統(tǒng)計中無法使用。這就給研究者帶來研究的困境,即無法有效測量選舉公正。但是,問題的癥結(jié)并不在于測量的題項,而是因為構(gòu)念本身是形成型,采用反映型指標(biāo)的統(tǒng)計檢驗標(biāo)準(zhǔn)本身就是誤判。

(二)公共管理領(lǐng)域變量指標(biāo)的進(jìn)一步探索

好的定量研究的基礎(chǔ)必定是價值思考。值得再次強調(diào)的是,指標(biāo)類型判斷必須理論先行,必須考慮特定公共管理問題,不可依賴統(tǒng)計結(jié)果。當(dāng)變量同時兼?zhèn)浞从承团c形成型指標(biāo)的特征情況時,無論采用何種統(tǒng)計或者檢驗方式,結(jié)果都可能通過統(tǒng)計標(biāo)準(zhǔn)。一方面,反映型指標(biāo)可能存在是形成型的可能。例如,本文中舉例的人事管理的繁文縟節(jié)量表屬于反映型指標(biāo);但是繁文縟節(jié)本身包括人事管理的繁文縟節(jié)、溝通的繁文縟節(jié)、采購的繁文縟節(jié)、信息系統(tǒng)的繁文縟節(jié)、預(yù)算的繁文縟節(jié)等5個維度。對于繁文縟節(jié)這個構(gòu)念,既可以理解為如果一個組織的繁文縟節(jié)程度高,那么將表現(xiàn)為人事管理、溝通、采購、信息系統(tǒng)、預(yù)算的繁文縟節(jié)程度都高,因此屬于反映型的結(jié)構(gòu);也可以理解為繁文縟節(jié)包括人事管理、溝通、采購、信息系統(tǒng)、預(yù)算等5個方面,5個方面的內(nèi)容共同組成繁文縟節(jié)。因為,人事管理的繁文縟節(jié)程度高并不意味著信息系統(tǒng)的繁文縟節(jié)程度也高,5個子維度之間沒有高度的相關(guān)性,因此屬于形成型指標(biāo)。針對繁文縟節(jié)究竟是形成型概念還是反映型構(gòu)念,這一問題有著持續(xù)的討論。Coursey和Pandey認(rèn)為將繁文縟節(jié)視為反映型構(gòu)念的觀點,源于政治問責(zé)制和其他外部影響;而將繁文縟節(jié)視為形成型構(gòu)念的觀點,則源于各種管理子系統(tǒng)(如預(yù)算、人員)的不靈活性。另一方面,形成型指標(biāo)也存在屬于反映型的可能。在這種情況下,如果從統(tǒng)計的角度出發(fā),部分研究的指標(biāo)采用反映型指標(biāo)的標(biāo)準(zhǔn)或者形成型指標(biāo)的標(biāo)準(zhǔn)都可以達(dá)到較高的信效度,這同樣容易引起研究者的困惑。因此,反映型指標(biāo)和形成型指標(biāo)的實際運用中非常有必要在類型辨析的特點之外明確指標(biāo)類型選擇的思路。

最后,需要指出的是,反映型或形成型指標(biāo)并不是研究者唯一的選擇。在某些情況下,理論構(gòu)念的概念化可能需要一個高階模型,研究者可以調(diào)用更加復(fù)雜的測量模型,比如在所有階段都使用同一類型指標(biāo)(反映型-反映型、形成型-形成型),或者交替地使用反映型或形成型指標(biāo)(反映型-形成型、形成型-反映型)。研究者應(yīng)該意識到這些復(fù)雜結(jié)構(gòu)操作的存在,并且在決定測量策略時仔細(xì)考慮它們潛在的適用性。比如前文提到的公共服務(wù)動機,在理論分析的基礎(chǔ)上,第一階段分為由四組題項,各自測量一種公共服務(wù)動機(政策取向、公民義務(wù)、同情心、自我犧牲),每一種均是一個反映型指標(biāo),而第二階段四種公共服務(wù)動機共同組成完整的公共服務(wù)動機構(gòu)念,為形成型指標(biāo)。這樣公共服務(wù)動機的測量就是一個反映型-形成型模型。比如Wright就提出,公共服務(wù)動機可能是在一階時是反映型指標(biāo);在二階時,是形成型指標(biāo)[27]。Kim實證驗證了這種可能性。在比較“反映型-反映型”和“反映型-形成型”的公共服務(wù)動機后,發(fā)現(xiàn)在理論分析和統(tǒng)計上“反映型-形成型”指標(biāo)更適合測量公共服務(wù)動機[28]。再如前文提到的關(guān)于繁文縟節(jié)的爭論,Coursey和Pandey在比較繁文縟節(jié)是反映型還是形成型時,實質(zhì)上也是“反映型-反映型”和“反映型-形成型”的比較,只不過他們發(fā)現(xiàn)“反映型-反映型”更適合作為測量指標(biāo)。這也恰恰說明,指標(biāo)類型應(yīng)該因變量而異,并無絕對的優(yōu)劣。本文再次強調(diào)公共管理研究應(yīng)該結(jié)合理論分析和實踐,強調(diào)公共管理研究應(yīng)與現(xiàn)實社會場景相結(jié)合;量化統(tǒng)計只是技術(shù)手段,研究者務(wù)必防止僵化教條地使用。

猜你喜歡
構(gòu)念題項效度
自我構(gòu)念在認(rèn)知和情緒加工中的作用及其生理機制
心理研究(2020年6期)2020-11-30 04:40:48
慈善募捐規(guī)制中的國家與社會:兼論《慈善法》的效度和限度
英語深讀教學(xué)讀思言模型構(gòu)念與實踐研究
教師教學(xué)風(fēng)格測量工具TSI修訂的實證研究
中國大學(xué)英語考試能力構(gòu)念三十年之嬗變
高職學(xué)生價值觀調(diào)查的研究變量的項目分析
山西青年(2017年6期)2017-03-15 01:27:59
被看重感指數(shù)在中國大學(xué)生中的構(gòu)念效度
12題項一般健康問卷(GHQ-12)結(jié)構(gòu)的多樣本分析
外語形成性評估的效度驗證框架
調(diào)查問卷的信效度檢驗及結(jié)構(gòu)調(diào)整的定量分析
万年县| 宜丰县| 嘉禾县| 富源县| 富裕县| 绥化市| 景洪市| 兰溪市| 德格县| 唐海县| 仙桃市| 安塞县| 瑞金市| 九寨沟县| 晋中市| 铁力市| 莲花县| 丹阳市| 彭泽县| 寿宁县| 五常市| 荣成市| 武宣县| 东海县| 延安市| 通化县| 斗六市| 孟津县| 临潭县| 舞钢市| 汉中市| 新巴尔虎左旗| 阜新| 分宜县| 乐昌市| 东城区| 广饶县| 红安县| 长乐市| 门头沟区| 淮南市|