陳欣欣 于洪彥
摘要 在心理學(xué)研究中,等級評定量表是研究數(shù)據(jù)的常用測量工具。然而,研究者們使用的等級評定量表的版式并不一致,尤其表現(xiàn)在使用的反應(yīng)項的數(shù)目不同。關(guān)于最佳反應(yīng)項數(shù)目的研究只局限于從被試的最終反應(yīng)結(jié)果來進行分析,而沒有從被試對量表的反應(yīng)過程來進行分析。根據(jù)前人相關(guān)文獻,設(shè)計6種反應(yīng)項的量表,并通過眼動實驗來測量被試的信息處理過程。通過對反應(yīng)時、凈默認反應(yīng)方式、極端反應(yīng)方式和選項比例變化的綜合比較,我們得出最佳的量表反應(yīng)項數(shù)目是5。
關(guān)鍵詞 等級評定量表,反應(yīng)項,反應(yīng)時,注視持續(xù)時間。
分類號 B841
1.前言
在心理學(xué)研究中,經(jīng)常要使用等級評定量表(rating scale)來測量人們的態(tài)度和觀點。最常用的一種測量態(tài)度和觀點的等級評定量表是李克特等級評定量表(Likert scale)。李克特等級評定量表是給被試呈現(xiàn)一個句子或者問題,讓他們在選項中做出選擇,這些選項就是量表的反應(yīng)項(response alterna-tives)。盡管李克特等級評定量表在心理學(xué)的研究中應(yīng)用廣泛,但是研究中使用的量表版式并不一致,特別是對等級評定量表應(yīng)該采用多少個數(shù)目的反應(yīng)項并沒有得到一致的結(jié)論。然而,等級評定量表的版式可能會影響問卷數(shù)據(jù)的質(zhì)量,量表的反應(yīng)項的標注和反應(yīng)項的數(shù)目也會影響被試反應(yīng)偏差的水平(Greenleaf,1992),顯然量表的版式與反應(yīng)項的數(shù)目對于依賴問卷調(diào)查來收集研究數(shù)據(jù)的心理學(xué)研究而言,影響巨大。
關(guān)于等級評定量表的反應(yīng)項數(shù)的研究已經(jīng)具有幾十年的歷史,但量表的最佳反應(yīng)項數(shù)目的問題仍然沒有得到解決。以往的研究者們建議量表應(yīng)采用的反應(yīng)項從少到2個或3個(Johnson,Smith,&Tucker,1982;Matell & Jacoby,1971)到多達18個(Champney & Marshall,1939)或20個(Garner,1960)的都有。關(guān)于等級評定量表的最佳反應(yīng)項數(shù)目的問題,還包含了一個重要的問題:即應(yīng)選用奇數(shù)還是偶數(shù)的反應(yīng)項。前人對于這個問題的研究也沒有得到一致的結(jié)論,如Ko(1994)和Oaster(1989)認為量表應(yīng)該最佳采用6個或者7個反應(yīng)項,而Preston和Colman(2000)建議7到10個反應(yīng)項為最佳的量表反應(yīng)項。
一般來說,擁有最佳的反應(yīng)項的量表能夠從受試者那里獲得最多的信息并且減少反應(yīng)誤差(CoxIII,1980)。根據(jù)信息理論,量表的反應(yīng)項的數(shù)目越多,它能夠傳遞的信息就越多(Garner & Hake,1951)。然而,每個人的認知能力都是有限的,無法對太多數(shù)量的反應(yīng)項做出反應(yīng)。比如,Conklin(1923)就建議采用9個反應(yīng)項的量表而不是13個反應(yīng)項的量表,因為對于13個反應(yīng)項的量表來說,被試會忽略某些選項。認知學(xué)派理論指出,人們能夠進行認知處理的量表的反應(yīng)項數(shù)目存在著上限。Miller(1956)指出人們處理信息的能力限制在7±2個組塊。而動機理論也指出,量表中的反應(yīng)項如果太多,則人們可能沒有足夠的動機去對這些反應(yīng)項進行有效的區(qū)分(Alwin,1997)。從這兩個方面來說,量表的反應(yīng)項的數(shù)目并不是越多越好。
因此,在選擇量表的最佳反應(yīng)項的數(shù)目方面,應(yīng)該在最大化量表可能傳遞的信息和最小化被試的認知努力之間做出權(quán)衡(Weijters,Cabooter,& Schill-ewaert,2010)。人們可能假設(shè)量表實際傳遞的信息和量表的反應(yīng)項數(shù)目之間的關(guān)系如圖1所示(CoxIII,1980)。它們之間呈倒U型曲線的關(guān)系,最初反應(yīng)項數(shù)目的增加使得量表傳遞的信息量增大,然而到了一定水平之后,反應(yīng)項數(shù)目的增加反而使得量表傳遞的信息量減少。有意思的是,前人的研究似乎表明7±2是一個合理的量表的最佳的反應(yīng)項數(shù)目的范圍(Cox III,1980)。這和MiNer的觀點不謀而合。這為探究等級評定量表的最佳反應(yīng)項數(shù)目提供了可能。
對于等級評定量表的最佳反應(yīng)項的研究,近年來主要采用的方式有信度和效度測量(Preston &Colman,2000)、樣本的統(tǒng)計功效(Adelson & Mc-Coach,2010)、選項比例變化(Garland,1991)等。這些方式都是從被試對量表的反應(yīng)結(jié)果來進行分析,而沒有從被試對量表的反應(yīng)過程來進行分析。通過對反應(yīng)過程進行記錄和分析,將可以清晰地看到人們在對量表進行作答時,哪些反應(yīng)項引起了人們的注意,哪些反應(yīng)項被人們所忽略,哪些反應(yīng)項使得人們猶豫不決。而僅僅對反應(yīng)結(jié)果進行分析則掩蓋了人們的整個加工過程,會導(dǎo)致無法觀測到這些重要現(xiàn)象。因此,通過分析人們在面對量表時的信息處理過程,來揭示出量表的各個反應(yīng)項的作用,從而更好地揭示出量表的最佳反應(yīng)項數(shù)目是非常必要的。
因此,本研究將采用眼動實驗來探究人們在對等級評定量表進行反應(yīng)時的信息處理過程。眼動實驗是采用眼動儀來實時記錄實驗數(shù)據(jù)的實驗,使用眼動儀可以實時地記錄人們在對量表進行反應(yīng)時的眼動數(shù)據(jù)(注視持續(xù)時間、注視次數(shù)、注視位置等)。這種實時的數(shù)據(jù)記錄能夠分析人們對量表進行作答時的整個信息處理過程。因此,可以很好地用來分析哪種反應(yīng)項數(shù)目的量表更能傳遞出更多的信息。
綜上所述,量表的最佳反應(yīng)項數(shù)目應(yīng)該在最大化量表可能傳遞的信息和最小化受試者的認知努力之間做出權(quán)衡。前人的研究似乎表明,量表的最佳反應(yīng)項數(shù)目應(yīng)該在7±2這個范圍內(nèi)。因此,本研究的目的是使用上述原則,利用眼動實驗來探究量表的最佳反應(yīng)項數(shù)目的問題,以及包含在其中的另外一個問題:量表應(yīng)采用奇數(shù)還是偶數(shù)數(shù)量的反應(yīng)項。
2.方法
2.1 測量方法
從信息處理過程的角度出發(fā),量表的最佳反應(yīng)項數(shù)目應(yīng)該在最大化量表可能傳遞的信息和最小化受試者的認知努力之間做出權(quán)衡。據(jù)此,制定了作為具有最佳反應(yīng)項數(shù)目的量表標準:(1)被試作答時的認知努力最?。唬?)量表給被試傳遞的信息量最大。通過對這兩個標準的綜合比較來確定量表的最佳反應(yīng)項數(shù)目。將采用眼動實驗,通過記錄的眼動數(shù)據(jù)(注視持續(xù)時間和注視次數(shù))和反應(yīng)時來評判這兩個標準。
具體來說,被試作答量表時的反應(yīng)時越短,則他們做出的認知努力越小。而量表傳遞的信息量方面,我們通過比較被試作答量表時的反應(yīng)偏差來揭示。擁有最佳數(shù)目的反應(yīng)項的量表能夠傳遞最大的信息量,從而最大程度降低人們作答量表時的反應(yīng)偏差。最常見的對量表的反應(yīng)偏差包括凈默認反應(yīng)方式(net acquiescence response style,NARS)和極端反應(yīng)方式(extreme response style,ERS)。凈默認反應(yīng)方式指的是被試更傾向于選擇同意的選項,而不管測項的內(nèi)容是什么(Baumgartner & Steenkamp,2001;Greenleaf,1992;Rossi,Gilula,& Allenby,2001)。極端反應(yīng)方式指的是被試傾向于在等級評定量表中大幅度地選擇極端值的反應(yīng)項(Baumgartner &Steenkamp,2001;Greenleaf,1992)。我們通過比較被試對量表左右兩邊的反應(yīng)項(即各種程度的同意項和各種程度的不同意項)的注視持續(xù)時間和注視次數(shù)比例來確定凈默認反應(yīng)方式的程度。而通過比較各種量表之間的極端值上的被試的注視時間和注視次數(shù)比例來確定哪種量表的極端反應(yīng)方式程度高。
另外一個問題是,等級評定量表應(yīng)該采用奇數(shù)還是偶數(shù)的反應(yīng)項。相對應(yīng)的奇數(shù)項和偶數(shù)項的量表的區(qū)別在于奇數(shù)項的量表多了一個中立項(mid-dle point)的存在。本研究采用選項比例變化(Gar-land,1991)的模式來探討這個問題。通過比較相對應(yīng)的偶數(shù)和奇數(shù)反應(yīng)項的量表(即4點量表vs.5點量表,6點量表vs.7點量表,8點量表vs.9點量表)來確定是否有中立項存在的必要。如果被試對相對應(yīng)的奇數(shù)和偶數(shù)項的量表(如4點量表vs.5點量表)的反應(yīng)項的反應(yīng)不存在顯著差異,則中立項沒有存在的必要。反之,中立項就有存在的必要。而根據(jù)信息理論,量表的反應(yīng)項的數(shù)目越多能夠提供的信息就越多,那么奇數(shù)項的量表(如5點量表)比相對應(yīng)的偶數(shù)項的量表(4點量表)要好。同樣我們也將利用實時記錄的眼動數(shù)據(jù)——注視持續(xù)時間和注視次數(shù)——來探討這個問題。
2.2 實驗設(shè)計和數(shù)據(jù)收集
本研究采用單因素實驗設(shè)計,自變量為量表的反應(yīng)項數(shù)目,分別為4個、5個、6個、7個、8個和9個反應(yīng)項(即7±2的范圍),分別命名為4點、5點、6點、7點、8點和9點量表。我們以廣告的形式在中山大學(xué)招募實驗的被試,每名被試給予報酬10元。184名來自中山大學(xué)的學(xué)生被隨機分配到6種量表中的一種。最后有4名被試的數(shù)據(jù)被排除出分析。其中一名被試反應(yīng)時間過長,在所有被試平均反應(yīng)時的3個標準差之外;其他3名被試在進入正式實驗后,因為眼顫和眨眼太嚴重,導(dǎo)致儀器記錄到的有效數(shù)據(jù)很少,故他們的數(shù)據(jù)排除出分析。最后180名被試(男性84人)的數(shù)據(jù)進入最后分析。每種條件下被試人數(shù)均為30人。所有被試的母語均為漢語,都不知道實驗?zāi)康?。所有被試的裸眼視力或者矯正視力正常,平均年齡為22.17歲(SD=2.95)。
本研究為眼動實驗,采用SR Research公司的Eyelink 1000型眼動儀,其采樣頻率為500Hz,即每2ms記錄一次眼動位置。顯示器屏幕刷新率為60Hz,屏幕分辨率為1024像素×768像素,顯示器屏幕中央距被試的眼睛約為65cm。
將實驗材料分成兩部分,分別是量表的測項和評定項。量表的測項,本研究選取景奉杰和岳海龍(2005)修訂的《中國消費者沖動性購買傾向量表》,該量表由26個測項組成。這些測項以宋體形式呈現(xiàn),每個漢字的大小為25像素× 25像素,每個漢字對應(yīng)約成0.7°的視角。
評定項分為6個條件,分別為4點、5點、6點、7點、8點和9點量表的反應(yīng)項。圖2顯示的是4點量表反應(yīng)項和5點量表反應(yīng)項。如圖所示,每種量表的反應(yīng)項都是完全標注(fully labeled)的,即對所有反應(yīng)項都進行標注而不僅僅只對極端值進行標注(endpoint labeled)。在各個條件下,每個反應(yīng)項所占的空間都一樣大,即每個反應(yīng)項加上上面的標注大小都為67像素×134像素。采用完全標注的方式是為了減少被試的認知努力。同時,Weijters等人(2010)也提出對于態(tài)度和觀點測量來說,最好采取完全標注的方式。另外,本研究在被試間平衡了反應(yīng)項的位置,以免其對實驗結(jié)果造成誤差。即一半的被試看到的反應(yīng)項的排列從左到右是從“完全不同意”到“完全同意”,而另一半的被試看到的則是從“完全同意”到“完全不同意”。
實驗程序為每個被試單獨施測。首先出示指導(dǎo)語,告知被試將閱讀一些句子,這些句子描述的是人們對于購物的一些態(tài)度和看法。要求被試認真閱讀句子,盡可能理解句子的意思。當閱讀完一個句子后,按空格鍵進行翻頁,進入到下一屏的評定項。要求被試根據(jù)自己的實際情況來進行評定,對前面呈現(xiàn)的句子中提到的態(tài)度和看法,是否同意?程度如何?被試用鼠標點擊相應(yīng)的反應(yīng)項的數(shù)字來做出選擇。被試做出選擇后就進入到下一個測項的測評,如此循環(huán)26次。這26個測項是隨機呈現(xiàn)的。
為確保實驗數(shù)據(jù)的準確性,在實驗過程中被試的下巴放在一個下巴托上,以確保頭部的相對靜止。在實驗開始之前,先進行校準,成功校準后進入正式實驗。整個實驗大約持續(xù)10分鐘。本研究選擇的眼動指標是注視持續(xù)時間和注視次數(shù)。另外,本研究還記錄了被試進行選擇的反應(yīng)時和所選擇的反應(yīng)項。
在分析中,將注視持續(xù)時間大于1500ms或小于50ms的數(shù)據(jù)作為極端數(shù)據(jù)從分析中剔除。因為,一般認為小于50 ms的注視被試不能獲取有效信息,而1500 ms以上的注視則大多是由儀器或被試的誤差造成的。總共剔除無效數(shù)據(jù)占總數(shù)據(jù)的3.8%。
本實驗采取兩種劃分興趣區(qū)的方式來對眼動數(shù)據(jù)進行分析。第一種劃分興趣區(qū)的方式是按各個反應(yīng)項加上其上面的標注的區(qū)域來進行劃分。即將4點量表的4個反應(yīng)項劃分為4個興趣區(qū),依次類推,9點量表劃分為9個興趣區(qū)。通過這樣劃分興趣區(qū),可以比較被試在各個反應(yīng)項上的注視持續(xù)時間和注視次數(shù),以便進行凈默認反應(yīng)方式分析和選項比例變化分析。第二種劃分興趣區(qū)的方式是將每種版本量表的整個反應(yīng)項和標注平均進行劃分,都劃分為10個興趣區(qū),以便對各種量表的極端反應(yīng)方式進行比較。
3.結(jié)果
3.1 反應(yīng)時結(jié)果
通過反應(yīng)時來揭示被試的認知努力程度。表1顯示的是各種版本的量表的反應(yīng)時。單因素方差分析結(jié)果顯示,各個量表之間的反應(yīng)時差異顯著,F(xiàn)(5,174)=8.75,p<0.001。事后檢驗顯示,5點量表的反應(yīng)時最短,9點量表的反應(yīng)時最長。9點量表的反應(yīng)時顯著長于其他量表的反應(yīng)時。5點量表的反應(yīng)時除與7點量表的反應(yīng)時差異不顯著外,與其他量表的反應(yīng)時的差異都顯著。其他量表之間的反應(yīng)時差異不顯著。結(jié)果顯示被試對5點量表和7點量表的認知努力程度最低,而對9點量表的認知努力程度最高。
3.2 反應(yīng)偏差結(jié)果
通過眼動數(shù)據(jù)來比較哪種版本的量表能夠給被試傳遞最大的信息量。擁有最佳數(shù)目的反應(yīng)項的量表能夠傳遞最大的信息量,從而最大程度降低人們作答量表時的反應(yīng)偏差。因此通過比較被試的反應(yīng)偏差來揭示量表給被試傳遞的信息量。由于注視次數(shù)的結(jié)果模式和注視持續(xù)時間的結(jié)果模式相同,因此,在接下來的結(jié)果部分,只呈現(xiàn)注視持續(xù)時間的分析結(jié)果。
3.2.1 凈默認反應(yīng)方式結(jié)果
先以第一種劃分興趣區(qū)的方法來分析被試的凈默認反應(yīng)方式。通過對各種版本量表的不同意項和同意項的注視持續(xù)時間進行配對t檢驗來檢測被試是否對這兩個部分的注視持續(xù)時間存在差異。如果存在差異的話,說明存在凈默認反應(yīng)方式。
表2顯示的是被試對各種版本量表的凈默認反應(yīng)方式。結(jié)果顯示只有6點量表的不同意項和同意項的注視持續(xù)時間存在顯著差異。被試對6點量表的同意項的注視持續(xù)時間多于對不同意項的注視持續(xù)時間。表明只有6點量表存在被試的凈默認反應(yīng)方式。
3.2.2 極端反應(yīng)方式結(jié)果
通過第二種劃分興趣區(qū)的方法來比較被試在各種版本的量表上的極端反應(yīng)方式程度的高低。將這10個興趣區(qū)分別命名為I10,I20,I30,I40,I50,I60,I70,I80,I90和I100。比較各種版本量表在I10,I20,I90和I100上被試的注視持續(xù)時間,來揭示各種版本量表的極端反應(yīng)方式程度的高低。
結(jié)果表明(見表3),對于I10來說,被試在各種版本量表上注視持續(xù)時間百分比差異顯著,F(xiàn)(5,174)=5.40,p<0.001。事后比較顯示,被試在7點、8點和9點量表上的注視持續(xù)時間百分比顯著高于在4點、5點和6點量表上的注視持續(xù)時間百分比。對于I20來說,被試在各種版本量表上注視持續(xù)時間百分比差異顯著,F(xiàn)(5,174)=8.62,p<0.001。事后比較顯示,被試在8點和9點量表上的注視持續(xù)時間百分比顯著高于在4點、5點、6點和7點量表上的注視持續(xù)時間百分比。對于I90來說,被試在各種版本量表上注視持續(xù)時間百分比差異顯著,F(xiàn)(5,174)=5.44,p<0.001。事后比較顯示,被試在8點和9點量表上的注視持續(xù)時間百分比顯著多于在4點、5點和6點量表上的注視持續(xù)時間百分比。對于1100來說,被試在各種版本量表上注視持續(xù)時間百分比差異不顯著,F(xiàn)(5,174)=1.84,p>0.1。綜合起來,被試在8點和9點量表上的極端反應(yīng)方式程度更高。
3.3 選項比例變化結(jié)果
為了更好地確定量表的最佳反應(yīng)項數(shù)目,將探討包含在這個問題中的另外一個問題:量表是應(yīng)該采用奇數(shù)還是偶數(shù)的反應(yīng)項。通過比較相對應(yīng)的偶數(shù)和奇數(shù)反應(yīng)項的量表(如4點量表vs.5點量表)的選項比例變化來探討這個問題。表4顯示的是4點量表vs.5點量表,6點量表vs.7點量表,8點量表vs.9點量表的注視持續(xù)時間的百分比。
從表4可以得出,4點和5點量表相比時,被試在反應(yīng)項“不同意”和“同意”上的注視持續(xù)時間的百分比上存在顯著差異。中立項(即“不確定”)的存在明顯地改變了被試對與中立項相鄰的兩個反應(yīng)項的注視時間的百分比。根據(jù)前面的推論,5點量表要優(yōu)于4點量表。6點和7點量表相比時,被試在反應(yīng)項“部分不同意”、“部分同意”和“同意”上的注視持續(xù)時間的百分比上存在顯著差異。中立項(即“不確定”)的存在明顯地改變了被試對與中立項相鄰的幾個反應(yīng)項的注視時間的百分比。根據(jù)前面的推論,7點量表要優(yōu)于6點量表。而被試在8點和9點量表的反應(yīng)項“部分不同意”和“部分同意”上的注視持續(xù)時間的百分比上存在顯著差異。中立項的存在對其鄰近的兩個反應(yīng)項的注視持續(xù)時間的百分比變化不顯著,反而對其稍遠一些的反應(yīng)項的注視持續(xù)時間的百分比變化產(chǎn)生了顯著影響。
綜合表4結(jié)果可以發(fā)現(xiàn),隨著反應(yīng)項數(shù)目的增加,中立項的存在對其臨近的兩個反應(yīng)項的影響越來越小。這似乎表明,隨著反應(yīng)項數(shù)目的增加,中立項的存在對被試的注意分布的影響在降低。只有在反應(yīng)項數(shù)目較少的時候,中立項的存在對被試的影響才明顯。
4.討論
心理學(xué)研究者使用諸如李克特量表等級評定量表的問卷來理解、解釋和預(yù)測被試的行為。然而,研究者們在研究中經(jīng)常使用不同數(shù)目的反應(yīng)項的等級評定量表。本文旨在使用眼動儀,通過分析被試的信息處理過程來探究等級評定量表的最佳反應(yīng)項數(shù)目。在本實驗中,操縱量表的反應(yīng)項數(shù)目從4點到9點共有6種條件。從實驗結(jié)果可以得到以下一些結(jié)論:(1)從被試的認知努力程度來看,即從反應(yīng)時來看,5點量表和7點量表的反應(yīng)時最短,而9點量表反應(yīng)時最長。即被試對5點量表和7點量表做出選擇時需要的認知努力最少,而對9點量表做出選擇時需要的認知努力最多。(2)從凈默認反應(yīng)方式來看,只有6點量表導(dǎo)致被試的注視時間偏向于一端,產(chǎn)生凈默認反應(yīng)方式。從這個指標上來看,6點量表最差。(3)從對極端反應(yīng)方式來看,4點、5點、6點量表要優(yōu)于7點、8點、9點量表。(4)從相對應(yīng)的奇偶量表的反應(yīng)項的選項比例變化的結(jié)果來看,當反應(yīng)項數(shù)目較少的時候,應(yīng)該設(shè)置中間項。即5點和7點量表分別要比4點和6點量表要好。綜合以上這些的指標來看,5個反應(yīng)項是最佳的等級評定量表的反應(yīng)項數(shù)目。這個結(jié)果符合認知學(xué)派理論和動機理論。本研究的結(jié)果也驗證了關(guān)于量表傳遞的信息和反應(yīng)項數(shù)目之間的倒U型關(guān)系。
本結(jié)果與前人的一些研究結(jié)果一致。雖然前人對于等級評定量表的最佳反應(yīng)項數(shù)目還沒有定論,但前人的研究似乎表明7±2是一個合理的量表的最佳的反應(yīng)項數(shù)目的范圍(Cox III,1980)。Wei-jters等人也建議獨立的研究應(yīng)該采用5點或者7點量表。而在當前實踐中,大多數(shù)等級評定量表采用的也是5點或者7點量表(Bearden & Netemeyer,1999;Peter,1979;Shaw & Wright,1967)。
在等級評定量表最佳反應(yīng)項數(shù)目的這個問題上,還包含著是采用奇數(shù)還是偶數(shù)的反應(yīng)項的問題。一般來說,研究者們喜歡受試做出明確的選擇而不是選擇中立的模糊的選項(Garland,1991)。然而,在態(tài)度和觀點的測量中,中立項也可能反映了被試的真實想法。如果不設(shè)立中立項,研究者反而可能不能收集到某些被試的真實想法。研究表明中立項的存在有利于降低被試的反應(yīng)偏差(Weijters,etal.,2010;Garland,1991)。本結(jié)果表明,在反應(yīng)項數(shù)目較少的情況下,量表的中立反應(yīng)項的設(shè)置有必要。而在反應(yīng)項數(shù)目較多時,中立項的存在對被試的反應(yīng)影響則不大。這表明量表的中立項的設(shè)置受到總的反應(yīng)項數(shù)目的影響,只有在反應(yīng)項數(shù)目較少的時候,中立項的有無才會影響到信息的收集。
值得注意的是,在本實驗設(shè)計中,確保的是每個反應(yīng)項所占的空間大小一樣。因此隨著量表反應(yīng)項數(shù)目的增加,其總的反應(yīng)項所占的空間分布長度就隨著增加。也就是說,9點量表的反應(yīng)項所占的空間分布最廣,4點量表所占的空間分布最窄。這種設(shè)計與現(xiàn)實中的紙筆測試是一致的。這可能導(dǎo)致一種疑問,就是被試對9點量表的反應(yīng)時最長,是因為其反應(yīng)項所占用的空間分布廣,被試需要花費更多的時間來進行眼跳。然而,正如前面的反應(yīng)時結(jié)果顯示,被試對4點、6點、7點和8點量表的反應(yīng)時是沒有顯著差異的。應(yīng)當注意到,這幾種量表之間的反應(yīng)項的空間分布是有變化的,尤其是4點和8點量表之間,但它們之間的反應(yīng)時卻沒有顯著差異。也就是說,空間分布的寬窄并不是主要影響被試反應(yīng)時的因素。本研究認為反應(yīng)時反映出來的是被試對量表的反應(yīng)項進行區(qū)分的認知努力程度。
盡管在本研究中得出最佳的量表反應(yīng)項數(shù)目是5。然而,這并不意味著在以后的研究中就應(yīng)該全部采用5點量表。在研究中應(yīng)該采用哪種版本的量表是一個非常復(fù)雜的問題。在實際的研究中,往往要根據(jù)研究的特定目的、時間,受試人群的特點等情況來選擇相應(yīng)版式的量表。比如,如果研究者不關(guān)注受試者的中立態(tài)度,而需要受試者做出明確的態(tài)度選擇的時候,研究者就應(yīng)該使用偶數(shù)項的量表。如果研究的對象是認知能力較低的人群,則研究者可能要相應(yīng)地選擇反應(yīng)項較少的量表(如3點量表)。
本研究第一次采用眼動研究的方法對量表的最佳反應(yīng)項數(shù)目的問題做出探討。從被試的信息處理過程出發(fā)對這個問題的解答提出新的證據(jù)。然而,研究也存在一些局限。首先,選取的被試樣本僅僅是在校大學(xué)生,這可能會導(dǎo)致結(jié)果的推廣存在一定的限制。不同的人群可能適用的量表的最佳的反應(yīng)項數(shù)目會不同,這也是未來的研究需要進行探討的問題。其次,只是探討了量表版本中的一個方面。在研究中,研究者們使用了不同版本的量表,包括反應(yīng)項數(shù)目、標注方式(如完全標注vs.極端值標注)等。量表版本中的其他方面(如標注方式)也會對研究數(shù)據(jù)的收集產(chǎn)生影響。這些也是未來可能的研究方向。再次,通過測量被試的反應(yīng)偏差來間接測量量表傳遞的信息量,或許在未來的眼動研究中可以找到一種方法來直接對各個版本的量表傳遞的信息量進行比較。
5.結(jié)論
通過眼動實驗探究被試在對6種不同數(shù)目的反應(yīng)項的量表做出反應(yīng)時的信息處理過程來探討量表的最佳反應(yīng)項數(shù)目的問題。通過權(quán)衡被試在對量表做出反應(yīng)時的認知努力程度和獲取的信息量兩方面的結(jié)果,得出最佳的量表反應(yīng)項數(shù)目是5。