国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于項目反應(yīng)理論的社情民意調(diào)查問卷設(shè)計

2012-07-25 08:14全,劉
統(tǒng)計與決策 2012年10期
關(guān)鍵詞:量值校園生活受訪者

劉 全,劉 汀

0 引言

社情民意調(diào)查是使用社會科學(xué)的調(diào)查和分析方法,對一個地方政府所管轄的居民的調(diào)查,通過調(diào)查了解公民的需求、行為特征、政策偏好及其對政府服務(wù)的評價,并確定公民對政府服務(wù)評價高低的決定因素,以利于政府改進(jìn)服務(wù)的過程。目前,我國社情民意調(diào)查主要包括民主政治類、經(jīng)濟(jì)(心理)類、社會民生類等方面。社情民意類調(diào)查已成為當(dāng)前統(tǒng)計調(diào)查的重點。

社情民意調(diào)查的基本目的是了解公民對政府行為及其產(chǎn)生的后果的評價,以及決定公民評價的影響因素。在政府的行為和績效的評價上,公眾本著“合理的無知”原則[1],一般只能給出他們看得見、摸得著的政府施政行為及其結(jié)果的感知。所以,滿意度調(diào)查是社情民意調(diào)查的主要形式。而如何設(shè)計出科學(xué)的問卷(量表),對公眾就政府行為及其產(chǎn)生的后果進(jìn)行準(zhǔn)確的心理特質(zhì)(如感受、意愿、態(tài)度等)測量,是社情民意調(diào)查中的關(guān)鍵問題。

項目反應(yīng)理論[2](Item Response Theory,IRT)用于心理學(xué)上對所謂潛在心理特質(zhì)的測量,這與社情民意調(diào)查研究目標(biāo)一致。IRT起源于20世紀(jì)50年代,主要由勞勒(Lwaley,1936)、拉扎斯菲爾德(Lazarsfield,1950)、伯恩鮑姆(A.Birnbaum,1957)、拉希(G.Rasch,1960)等人創(chuàng)立,70年代起,IRT理論已在大多數(shù)國家中成為心理測量學(xué)家的主要研究課題。近年來,國內(nèi)學(xué)者漆樹青、余嘉元、何曉群、柯惠新等在這方面進(jìn)行了大量研究[2-6],但其研究側(cè)重于IRT基礎(chǔ)理論及其在心理測評、標(biāo)準(zhǔn)化考試、試題庫建設(shè)、自適應(yīng)測驗的應(yīng)用等方面。

1 基于IRT的社情民意問卷設(shè)計原理及過程

1.1 IRT建模

不失一般性,設(shè)公眾對政府行為及其產(chǎn)生的后果評價為θ,其取值范圍在-1.0~+1.0區(qū)間。顯然,每個受訪者在任何一個給定時刻都有一個,并且只有一個態(tài)度量值θ,但這個θ是潛在的,是無法直接觀察到的。調(diào)查時,當(dāng)把我們把第i個調(diào)查項目呈現(xiàn)給受訪者時,將會誘發(fā)出受訪者的一個態(tài)度反應(yīng)γi,由于誤差的存在,一般可以假定γi=ρiθ+εi。此時,受訪者能否對某項目給出滿意評價,關(guān)鍵取決于其潛在態(tài)度反應(yīng)γi是否大于某個閥值若則該受訪者將給出滿意評價(記作ui=1,否則記作ui=0)。于是,受訪者對該調(diào)查項目給出滿意評價的概率就是 γi大于的概率,即

在 γi=ρiθ+εi中,對于具體一個受訪者,θ 是固定值,因此,使?jié)撛趹B(tài)度反應(yīng)γi具有概率性質(zhì)的原因是誤差εi的存在。這里,εi是由大量隨機(jī)因素共同產(chǎn)生(如受訪者對該調(diào)查項目理解、分析等環(huán)節(jié)產(chǎn)生的誤差),一般可認(rèn)為服從正態(tài)分布,且均值是0。于是,γi的分布也應(yīng)是正態(tài)的,且均值為 μi=ρiθ ,標(biāo)準(zhǔn)差為從而,受訪者對調(diào)查項目i給出滿意評價的概率為

又由于ICC形同正態(tài)分布的累計函數(shù)曲線,故自然考慮用下函數(shù)來擬合它,即

這便得出洛德(F.M.Lord,1952)雙參數(shù)正態(tài)肩形ICC模型[2]。其中ai和bi分別與該項目的區(qū)分度、難度特征有關(guān),故分別稱為區(qū)分度、難度參數(shù)。再根據(jù)伯恩鮑姆(A.Birnbaum,1957)的研究結(jié)果 ,正態(tài)肩形函數(shù)與邏輯斯蒂(Logistic)函數(shù)有如下關(guān)系成立

其中,函數(shù)

稱為邏輯斯蒂函數(shù),其中x為任意符號。這樣,復(fù)雜的正態(tài)肩形ICC曲線便可用簡單的邏輯斯蒂ICC曲線來近似表示。x取不同代數(shù)式,就形成各種不同邏輯斯蒂模型。社情民意調(diào)查中常用的二參數(shù)邏輯斯蒂模型為

其中,Pi(θ)表示態(tài)度量值為θ的受訪者回答第i問項為滿意的概率;D是常數(shù)1.7;參數(shù)a是該調(diào)查問項的區(qū)分度,在ICC中反映為曲線的陡峭程度。α參數(shù)越大,ICC越陡,α越小,ICC越平。參數(shù)b表示其難度,反映在ICC上是斜率最大處在態(tài)度量表上對應(yīng)的點。項目越難,所需態(tài)度量值會越高,ICC也偏右,這時具有一般態(tài)度量值的受訪者在該項目作出肯定或滿意回答的概率會較低。

由IRT模型可見,對于任一受訪者,一調(diào)查問項(即調(diào)查題目)能否得到肯定或滿意回答的概率,取決于兩個方面:一是自身態(tài)度,即主觀因素;另一是用難度(即問項能得到肯定或滿意回答的程度)與區(qū)分度(即問項能將具有不同態(tài)度或滿意程度的受訪者區(qū)分開來的程度)等屬性所反映的調(diào)查問項客觀屬性。換言之,該問項是否得到肯定或滿意回答,是由受訪者自身態(tài)度、調(diào)查問項的難度與區(qū)分度共同決定的。以上IRT建模基本思想,充分體現(xiàn)了IRT在社情民意調(diào)查問卷設(shè)計應(yīng)用中的重要性。

1.2 社情民意調(diào)查精度估計

根據(jù)抽樣理論,抽樣分布的標(biāo)準(zhǔn)誤(SE)減少則會使統(tǒng)計推斷置信區(qū)間縮短,從而提高估計精度。由此,IRT用標(biāo)準(zhǔn)誤的平方(即方差)的倒數(shù),即 I(θ)=1/SE(θ)2作為調(diào)查精度,這里I(θ)稱信息函數(shù)。可以證明,對于邏輯斯蒂模型,按照極大似然法估計受訪者的態(tài)度量值θ時,其估值是隨樣本容量的增大而漸近正態(tài)分布的,進(jìn)一步推導(dǎo),可得出其計算公式為[2]

其中,Pi(θ)是第i調(diào)查項目的項目反應(yīng)函數(shù)。并且,(4)中的每一項還恰好是第i調(diào)查項目的信息函數(shù)。若選二參數(shù)邏輯斯蒂模型,則信息函數(shù)是[2]:

可見,信息函數(shù)能給出基于不同態(tài)度量值θ受訪者的不同調(diào)查精度。信息函數(shù)圖象呈鐘形,在態(tài)度量值θ接近調(diào)查項目難度bi時達(dá)到最大。為此,可選擇對不同態(tài)度量值的對估計精度最有增益的調(diào)查問項,使調(diào)查達(dá)到預(yù)先規(guī)定的滿意精度。

1.3 基于IRT的問卷設(shè)計過程

(1)問項編寫和預(yù)調(diào)查。問項編寫與傳統(tǒng)方法一致,根據(jù)確定的調(diào)查目標(biāo),在其構(gòu)建的評價指標(biāo)體系的基礎(chǔ)上編寫調(diào)查項目(問項),編寫的問項要足夠多(至少30個以上[3]),并盡量保證問項與調(diào)查目標(biāo)的內(nèi)在一致性,以便后續(xù)選擇和優(yōu)化。使用以上問項進(jìn)行預(yù)調(diào)查,為保證采用IRT進(jìn)行問卷設(shè)計的精度,一般要求接受預(yù)調(diào)查的被試在500以上[3]。

(2)單維性假定檢驗及ICC選擇。所謂單維性,即只有一種潛在心理特質(zhì)對反應(yīng)數(shù)據(jù)起作用?;贗RT理論,對模型進(jìn)行單維性假定檢驗是必須的。單維性假設(shè)檢驗常采用主成分分析法,若第一和第二主成分的特征根之比在5.0以上則可認(rèn)定該假定成立。社情民意類調(diào)查中,因態(tài)度量值低的受訪者沒理由要給出態(tài)度量值高的評價,故常用二參數(shù)邏輯斯蒂模型。

(3)參數(shù)估計及問項初選。根據(jù)預(yù)調(diào)查數(shù)據(jù),可采用各種IRT軟件對各問項的二參數(shù)邏輯斯蒂ICC模型的參數(shù)進(jìn)行估計。而問項初選是根據(jù)估計出來的各問項ICC參數(shù),將有極端參數(shù)值的問項去掉。一般來說,對于a≤0.3(或a≥4),b>2.95(或b<-2.95),c>0.4中任意一個條件不滿足的問項均需要修改或被刪除[8]。

(4)確定目標(biāo)信息曲線(Target Information Curve,TIC)。根據(jù)用戶對調(diào)查精度要求,計算調(diào)查的標(biāo)準(zhǔn)誤SE(θ),得出調(diào)查所需最低信息量的要求,即目標(biāo)信息曲線TIC。

如若構(gòu)造真實態(tài)度量值θ1的置信度為98%的置信區(qū)間,根據(jù)正態(tài)分布理論,則θ1應(yīng)在以態(tài)度中立點θ0為中心的兩個標(biāo)準(zhǔn)差以上,即應(yīng)該有 ||θ0-θ1≥2SE(θ),再據(jù)公式(4),從而得出入選問項應(yīng)具有的最低信息量I(θ),這便產(chǎn)生出滿足相應(yīng)精度要求的目標(biāo)信息曲線TIC。這樣,對調(diào)查精度的要求轉(zhuǎn)變成了調(diào)查問項應(yīng)具有的最低信息量及TIC確定。顯然,精度要求越高,對應(yīng)的信息函數(shù)值就越大。

(5)問項選擇并形成最終調(diào)查問卷。問項選擇旨在產(chǎn)生一組調(diào)查問項,綜合其信息曲線以產(chǎn)生一條TIC,符合或大于目標(biāo)TIC。問項選擇時,一般在所要求的態(tài)度量值θ區(qū)間內(nèi),根據(jù)確定的入選問項應(yīng)具有最低信息量標(biāo)準(zhǔn),按照問項具有的信息量從大到小依此選取。

2 基于IRT的大學(xué)生校園生活滿意度調(diào)查問卷設(shè)計

滿意度調(diào)查是社情民意調(diào)查的主要形式。本文以我國大學(xué)生校園生活滿意度調(diào)查問卷設(shè)計過程為例,進(jìn)一步闡述基于IRT的社情民意調(diào)查問卷設(shè)計的基本思想及方法。

2.1 大學(xué)生校園生活滿意度調(diào)查指標(biāo)構(gòu)建

滿意度的測量模型有多種,最具代表性是費耐爾(Fornell,1989)提出的包括顧客預(yù)期、感知質(zhì)量、感知價值、顧客抱怨和顧客忠誠等五方面組成的邏輯模型[7][8]。如在對大學(xué)生校園生活滿意度調(diào)查中,借鑒費耐爾顧客滿意度模型的核心概念和架構(gòu),并結(jié)合我國高校具體情況,再利用結(jié)構(gòu)方程模型等理論,可構(gòu)建出如圖2所示的大學(xué)生校園生活滿意度評價模型(圖2)。

圖2 大學(xué)生校園生活滿意度評價模型

圖2中變量均為潛變量(隱變量),是不可直接測量出來的。為此,圍繞圖2中7個潛變量構(gòu)造出相應(yīng)的顯變量,構(gòu)架相應(yīng)的調(diào)查指標(biāo)體系(表1)。

表1 大學(xué)生校園生活滿意度調(diào)查指標(biāo)體系

2.2 大學(xué)生校園生活滿意度問卷設(shè)計

(1)問項編寫。根據(jù)以上構(gòu)建的“大學(xué)生校園生活滿意度調(diào)查指標(biāo)體系”,采用五級李克特量表,編寫出相應(yīng)的初始問卷(含64個問項)。對540名大學(xué)生進(jìn)行預(yù)調(diào)查,并經(jīng)同向化和二級評分處理,取得建立IRT模型的基礎(chǔ)數(shù)據(jù)。

(2)單維性假定檢驗和模型參數(shù)估計。應(yīng)用SPSS11.5對基礎(chǔ)數(shù)據(jù)進(jìn)行主成分分析,結(jié)果表明第一因子的特征根為17.239,第二特征根為3.061,兩者之比達(dá)到了5.632。故可以認(rèn)為單維性假設(shè)檢驗成立。

選用二參數(shù)邏輯斯蒂ICC模型,其模型參數(shù)估計采用BILOG_MG[9]軟件進(jìn)行,得出各問項的ICC曲線,去掉項目區(qū)分度和難度不滿足要求的項目,尚余24個調(diào)查項(見表2)

由BILOG_MG生成的總體信息函數(shù)曲線如圖3。由此可知,本調(diào)查方案對滿意度量值在-1.0~+1.0之間(通過等值化處理,相當(dāng)于24個問項中回答滿意的有4項至21項之間)的大學(xué)生調(diào)查很有效,當(dāng)大學(xué)生滿意度瑯值為0.0(相當(dāng)于24項問項中填寫滿意的為12項)時調(diào)查最精確(信息量最大),此后隨著態(tài)度量表的減低或增強(qiáng),調(diào)查逐漸失去其鑒別作用。

(3)確定目標(biāo)信息曲線TIC。如若要求置信區(qū)間|θ0-θ1|=0.8的置信度為98%,則根據(jù)關(guān)系式 |θ0-θ1|≥2SE(θ)可知,SE(θ)=0.4 ,再由上式(4)可得結(jié)果表明,調(diào)查方案所含問項的信息函數(shù)累計值須大于或等于6.25這一最低信息量要求。

圖3 大學(xué)生校園生活滿意度調(diào)查的信息曲線

(4)問項選擇并產(chǎn)生調(diào)查方案。根據(jù)計算出來的各問項分別在-0.8和+0.8處的信息量,并依此從大到小排列(見表3)。

表3 各問項測量精度(信息量)排序

再按信息量大到小依次提取問項,直至滿足最低累計信息量6.25的要求,在此基礎(chǔ)上生成最終的調(diào)查方案(含19個問項)。其TIC與方案的調(diào)查信息曲線如圖4所示??梢?,本方案的測量誤差完全滿足精度要求。

2.3 基于IRT的滿意度合格線劃分

對于滿意度調(diào)查來說,如何科學(xué)、準(zhǔn)確地劃分滿意度的合格線是一個難點?;谛畔⒑瘮?shù),IRT為其提供了相對精確和完備的合格線劃分方法。因為,如果一項調(diào)查能較好地測量出其滿意度的實際狀況,則被試在該項調(diào)查中回答滿意的百分比應(yīng)是其在該測評全部問項上期望的平均數(shù),近似計算公式為[2]:

圖4 最終生成的大學(xué)生校園生活滿意度調(diào)查方案信息曲線

其中,n為調(diào)查問項數(shù),Pi(θ)是被試能力θ下對第i問項回答滿意的概率。如果我們根據(jù)實際和權(quán)威專家評估小組研究,確定出滿意度合格線應(yīng)該至少達(dá)到的滿意百分比π1,再根據(jù)選用的IRT模型可得出Pi(θ)的計算公式,那么公式(5)就只含一個參數(shù)θ,采用牛頓迭代法即可求解出滿足方程(5)的θπ值,這就是對應(yīng)的滿意度合格線標(biāo)準(zhǔn)。顯然,也可采用等值化處理,將θπ轉(zhuǎn)換為回答滿意的問項數(shù)。

3 結(jié)論

本文系統(tǒng)探討了基于IRT的社情民意問卷設(shè)計的基本原理,研究了社情民意類問卷設(shè)計的過程規(guī)范、問項選擇、方案配置、誤差控制、滿意度標(biāo)準(zhǔn)確定等關(guān)鍵技術(shù)和方法,并結(jié)合大學(xué)生校園生活滿意度調(diào)查詳細(xì)討論了其具體實現(xiàn)過程。

研究表明[6],IRT方法允許方案設(shè)計者根據(jù)規(guī)定的目標(biāo)信息曲線TIC,編制出符合要求調(diào)查項目,方案調(diào)查精度能在受訪者滿意度θ連續(xù)統(tǒng)上的若干點和區(qū)間得到嚴(yán)格控制;同時,滿意度的合格線標(biāo)準(zhǔn)劃分更加科學(xué)合理?,F(xiàn)代問卷設(shè)計理論研究還表明,在問卷設(shè)計中,項目反映理論IRT在處理微觀問題(即受訪者與問項之間的實質(zhì)性關(guān)系)時優(yōu)勢明顯,經(jīng)典測量理論CTT在處理中觀問題(如處理常見的標(biāo)準(zhǔn)化測試等)時顯得方便易懂,概化理論GT則在處理宏觀問題(如對結(jié)果作推論)時更顯出色。以上三種調(diào)查理論各有長處,可為問卷設(shè)計研究和實踐提供強(qiáng)大理論支撐。

[1] 張光.社情民意調(diào)查:理論、實踐和過程簡論[J].天津行政學(xué)院學(xué)報,2008,(3).

[2] 余嘉元.項目反應(yīng)理論及其應(yīng)用[M].南京:江蘇教育出版社,1992.

[3] 漆書青.現(xiàn)代教育與心理測量學(xué)原理[M].北京:高等教育出版社,1998.

[4] 許健,馬世曄,何曉群.標(biāo)準(zhǔn)化試題的評價與IRT模型的應(yīng)用[J].考試研究,2004,(8).

[5] 柯惠新,祝建華.傳播統(tǒng)計學(xué)[M].北京:北京廣播學(xué)院出版社,2003.

[6] 魏華忠.教育統(tǒng)計與測量[M].沈陽:遼寧師范大學(xué)出版社,2006.

[7] 涂榮庭.顧客滿意度測量探討:量表設(shè)計、信度和效度[J].管理學(xué)報,2008,(1).

[8] 劉武等.中國高等教育顧客滿意度指數(shù)模型的構(gòu)建[J].高教發(fā)展與評估.2008,(7).

[9] Robert J.Mislevy,Bilog,R.Darrell Bock(芝加哥大學(xué)),1990.

[10] 孔燕等.基于項目反應(yīng)理論的中國公民科學(xué)素養(yǎng)測評方法研究[J].科學(xué)管理研究,2009,(4).

[11] 楊業(yè)兵等.應(yīng)用項目反應(yīng)理論對《中國士兵人格問卷》的項目分析[J].心理學(xué)報,2008,(5).

猜你喜歡
量值校園生活受訪者
今天,你休閑了嗎?
多元向量值區(qū)域和加權(quán)風(fēng)險值
關(guān)于安全,需要注意的幾件小事
低碳生活從我做起
精彩的校園生活
五成受訪者認(rèn)為自己未養(yǎng)成好的閱讀習(xí)慣
基于QAR數(shù)據(jù)的碳當(dāng)量值適航符合性驗證方法
校園生活的幸福密碼
愛上勞動,開啟幸福校園生活
歡樂的校園生活