滕修攀
(河南警察學院, 河南 鄭州 450046)
目前社會正處于轉(zhuǎn)型期,違法犯罪活動激增,社會矛盾凸顯,公安機關(guān)作為打擊違法犯罪、維護社會穩(wěn)定的中堅力量,必將面臨嚴峻考驗。黨和人民對公安機關(guān)寄予了厚望, 這種期望通過公安機關(guān)的管理措施和手段以及強大的社會輿論壓在了人民警察的肩上, 無形地影響著他們的身心健康狀況[1]。近年來,民警心理健康問題日益突出。民警心理健康問題不僅會危及自身,還會對公安工作產(chǎn)生一系列不良影響。各地公安機關(guān)高度重視,積極應對,不斷推進心理健康相關(guān)工作。在心理健康工作中,心理測評工具發(fā)揮著越來越重要的作用。有不少心理測評工具已經(jīng)在警院新生錄取、公安招警考試及民警心理服務等工作中得到廣泛應用,有效地增強了這些工作的科學性、有效性和專業(yè)性。
當前,成熟的心理健康測評工具主要來自于西方,比如一般健康問卷、癥狀自評量表、明尼蘇達多項人格測驗、焦慮自評量表等。然而,這些量表是否適用于中國本土人群,以及在各種亞群體中是否具備有效性的問題,未得到充分驗證。近年來,國內(nèi)也有很多學者、研究機構(gòu)開發(fā)了各種各樣的心理健康測評工具,但往往質(zhì)量參差不齊。以往研究已經(jīng)表明,運用評測工具對某些亞群體的目標心理特質(zhì)實施評估時可能會出現(xiàn)測驗偏差[2]。即使評測工具中僅有一個題項出現(xiàn)偏差,也可能導致整個測驗失去有效性和公平性。本研究將嘗試檢驗心理健康評估工具在不同警察亞群體中是否存在項目功能偏差(differential item functioning,簡稱DIF)。項目功能偏差反映了控制群組特質(zhì)水平后,各項目在不同群組中顯示出的不一樣的統(tǒng)計特征,已成為檢驗心理測驗有效性和公平性的重要依據(jù)。
按照恩格爾的理論模式,個體的心理健康狀況會受到生物、心理和社會三方面因素的共同影響。就在職民警而言,生物因素涉及身體健康水平,心理因素涉及人格特征、能力結(jié)構(gòu)與崗位的匹配,社會因素涉及工作環(huán)境、生活質(zhì)量、組織支持和心理服務等因素。這些因素可能直接影響民警的心理健康水平,導致其認知與行為反應發(fā)生改變,從而使得心理測驗出現(xiàn)項目功能偏差。本研究主要通過大樣本警察數(shù)據(jù),考察體質(zhì)指數(shù)(Body Mass Index,簡稱BMI)對心理健康測驗的影響,驗證一般健康問卷工具在各種BMI類別亞群體中的項目功能偏差。一般健康問卷是非常成熟的心理健康評測工具,便于群體施測,具有較高的信效度,表現(xiàn)出較好的跨文化公平性,被世界各地的學者和研究機構(gòu)廣泛使用[3]。具體而言,本研究需要考察的是,一般健康問卷在正常體重的警察亞群體測得的心理特質(zhì),與其在偏瘦、超重、肥胖人群中測得的心理特質(zhì)是否具有可比性。
這里運用“河南省公安民警思想政治調(diào)查”中的BMI數(shù)據(jù)和一般健康問卷數(shù)據(jù),檢驗量表在不同BMI類別群體中是否存在項目功能偏差。項目功能偏差的檢驗方法較多,這里采用Choi, Gibbons, & Crane提出的有效綜合了有序logistic法和IRT法的檢驗方法[4]。就研究問題和數(shù)據(jù)性質(zhì)而言,該方法具有兩大優(yōu)勢:一是能夠同時檢測項目功能偏差為“一致性”(uniform) “非一致性”(non-uniform)和“全面性”(overall)的情況;二是可以有效地運用于樣本量較大的、二元計分數(shù)據(jù)的檢驗。項目功能偏差如果累積,可能導致整個測驗都出現(xiàn)偏差,因而還需要進行測驗功能偏差分析(Differential Test Functioning ,簡稱DTF)[5]。檢驗測驗功能偏差的方法有多種,這里采用了Camilli & Penfield[6]所提出并被Penfield & Algina[7]所驗證和推薦的適合二元計分數(shù)據(jù)的方法。
研究資料來源于“河南省公安民警思想政治調(diào)查”。調(diào)查由河南省公安廳2016年組織開展,范圍涉及河南省各級公安機關(guān)各類在職民警,采用了分層隨機抽樣,筆者為調(diào)查工作主要執(zhí)行者。民警通過河南省公安網(wǎng)絡平臺填寫問卷,指導語強調(diào)了“匿名填寫” “絕不涉及個人考察” “僅供研究之用”等內(nèi)容,以增強數(shù)據(jù)資料的真實性。數(shù)據(jù)的采集和使用均符合相關(guān)法律法規(guī),嚴格遵守了學術(shù)倫理以及《赫爾辛基宣言》的要求。
調(diào)查得到原始數(shù)據(jù)40790份,基于研究問題依據(jù)如下原則對數(shù)據(jù)進行了篩選:(1)保留一般健康問卷、身高和體重、基本人口學與崗位資料所涉及的題項填寫完全的個案;(2)刪除BMI值大于50的個案,因為達成這種肥胖程度的警察幾乎不可能繼續(xù)在公安機關(guān)工作,可被視為極端數(shù)據(jù)。最終獲得研究相關(guān)的有效數(shù)據(jù)33270例,占原始數(shù)據(jù)81.6%。其中,被試平均年齡38.57±8.01歲;男性占80.4%,女性19.6%;未婚7.2%,已婚91.0%,離婚、喪偶與再婚1.8%;高中中專以下3.7%,大專33.4%,本科61.4%,碩士研究生以上1.5%;治安警32.6%,交警10.5%,刑警12.9%,特巡警4.0%,其他一線崗位10.7%,非一線崗位29.3%。
體質(zhì)指數(shù)通過調(diào)查對象報告的身高、體重進行計算,計算公式為:BMI=體重/身高的平方(單位:kg/m)。不同人種的體質(zhì)結(jié)構(gòu)有所不同,因而BMI指數(shù)的劃分標準也有所偏差。按照中國肥胖問題工作組在2002年建議的評判標準[8],將體質(zhì)指數(shù)分為4類:偏輕(BMI<18.5),正常(18.5≤BMI<24),超重(24≤BMI<28),肥胖(BMI ≥28)。
一般健康問卷包含12個題目,各題目均有4個選項,調(diào)查對象根據(jù)自己過去四周的相關(guān)情況作答。最常用的選項計分方法是依次按照0-0-1-1計分,因而總分為0-12分;涉及臨床診斷時,GHQ-12得分<4分時,計為陰性;當GHQ12得分≧4分時,計為陽性[9]。整體數(shù)據(jù)的Cronbach's α系數(shù)為 0.86。
本研究主要采用了三個統(tǒng)計軟件進行數(shù)據(jù)分析。運用SPSS 21.0進行數(shù)據(jù)整理與評估結(jié)果分析,運用基于R語言平臺開發(fā)的Lordif加載包實施項目功能偏差分析[10],采用DIFAS 5.0進行測驗功能偏差檢驗[11]。
表1顯示,體重“正?!苯M人數(shù)高于其他三組(χ2=1254.928, p <0.001,Ф=0.01)。從一般健康問卷的原始分來看,體重“正?!苯M平均得分最低,其次是“超重”組和“偏瘦”組,“肥胖”組平均得分最高(F=153.367, p <0.001,η2=0.014)。鑒于普通成人中“正?!斌w重的人數(shù)占主導優(yōu)勢,所調(diào)查的警察樣本也體現(xiàn)了這一特點,因而將體重“正?!苯M設為參照組,將“超重”組、“偏瘦”組和“肥胖”組設為目標組,逐一配對檢驗。
運用基于所采用方法而開發(fā)的Lordif R語言加載包[12],選擇基于似然比χ2的McFaddenss pseudo R2估計法實施項目功能偏差效應值的估計,具體方法詳見Choi, Gibbons, & Crane的論述。
表1 不同BMI類別警察群體GHQ-12評估結(jié)果對比
注:***p<.001.
表2 項目功能偏差
注:“N”為“無項目功能偏差”
從檢驗結(jié)果來看,一般健康問卷的任何題項在“正?!苯M和“偏瘦”組之間,以及在“正?!苯M和“超重”組之間均不存在項目功能偏差,僅在“正?!苯M和“肥胖”組之間有10個題項存在偏差。對于效應值的解釋可依照如下標準:0.035≦R2Δ-U<0.070表明有中等水平的項目功能偏差,R2Δ-U≧0 .070表明有較高水平的項目功能偏差,R2Δ-U<0 .035表明項目功能偏差較小可忽略不計。由此來看,在“正?!苯M和“肥胖”組之間,題項6和題項10存在中等水平的“綜合性”項目功能偏差,題項1、題項2、題項3、題項4、題項8、題項9、題項11、題項12在兩組間存在較小可忽略的項目功能偏差。圖1表明,題項6在“正?!苯M和“肥胖”組中的項目特征曲線并不重合,題項10亦是如此,這與檢驗結(jié)果相互印證。
圖1 項目特征曲線(reference group=“正常”組 focal group=“肥胖”組)
題項層次的功能偏差如果累積,可能導致整個測驗的功能偏差出現(xiàn)偏差。這里采用DIFAS 5.0軟件相關(guān)功能模塊進行測驗功能偏差檢驗。同樣將“正常”組作為參照組,將其他三組分別作為目標組,逐一配對檢驗。具體方法詳見Camilli & Penfield的論述。
表3 測驗功能偏差
對于效應值的解釋遵循如下標準:τ2< 0.07表明測驗功能偏差較小可忽略不計,0.07 ≤τ2≤0.14 表明測驗功能偏差為中等水平,τ2>0.14表明存在測驗功能偏差較大。從表3來看,一般健康問卷在“正?!苯M和“偏瘦”組之間的測試功能偏差較小,在“正常”組和“超重”組之間的測試功能偏差較小,但在“正常”組和“肥胖”之間存在較大的測試功能偏差。
研究采用了河南省公安機關(guān)在職警察分層隨機抽樣數(shù)據(jù),對一般健康問卷在“正?!斌w重警察人群與其他BMI類型的警察人群之間作了項目功能偏差分析。從結(jié)果看,該量表的任何題項在“正?!苯M和“偏瘦”組,以及“正?!苯M和“超重”組之間均不存在項目功能偏差,整個量表在這兩種情況下的測試功能偏差可忽略。就統(tǒng)計意義上來說,一般健康問卷的構(gòu)建和測量在“正?!苯M和“偏瘦”組,以及“正常”組和“超重”組是等價的,可以直接進行比較。在“正?!苯M和“肥胖”組之間,該量表有2個題項存在中等水平的“綜合性”項目功能偏差,8個題項在兩組之間存在較小可忽略的項目功能偏差,10個題項的項目功能偏差產(chǎn)生的累積作用使得量表在兩組之間存在較大的測驗功能偏差,這使得該量表在“正?!苯M和“肥胖”組之間得到的評估分數(shù)比較時需持謹慎態(tài)度。
如果心理評測工具存在項目功能偏差的問題,則無論是增強樣本代表性,還是控制更多的額外變量,均難以準確反映體質(zhì)指數(shù)與心理健康的關(guān)系。在過去體質(zhì)指數(shù)與心理健康關(guān)系的相關(guān)研究中,除使用一般健康問卷作為心理健康的評估工具外,還有簡明健康問卷、凱斯勒心理困擾量表、第2版貝克抑郁量表等[13],運用這些心理健康量表在不同BMI警察亞群體中進行測驗時,是否也存在群體間的項目功能偏差,乃至出現(xiàn)測試功能偏差問題,也需要引起研究者的重視。
項目功能偏差往往由多種因素所致[14]??梢試L試歸因于施測對象的特殊性。比如,以往研究發(fā)現(xiàn),肥胖者相對于體重正常者容易患心血管疾病, Ⅱ型糖尿病, 高血壓、肌骨骼疾病,致死率更高[15-17];他們更容易遭到歧視,相比社會經(jīng)濟地位較低的肥胖者,從事專業(yè)工作的職場肥胖者反倒遭受更多的歧視[18]。肥胖警察的這些生理特征與面臨的社會環(huán)境的特殊性可能會影響他們的心理特質(zhì),從而在完成“覺得自己不能解決問題嗎” “失去自信了嗎”等題項時,其反應與正常體重的警察的反應存在偏差。當然,除了被試本身的因素,可能還會有其他復雜的因素,尚需后繼研究進行驗證。
關(guān)于項目功能偏差的處理尚未有統(tǒng)一辦法。有學者會放棄使得存在項目功能偏差的心理評測工具,也有有學者對存在項目功能偏差的題項采取直接刪除[19]。但對于一般健康問卷這樣比較成熟的量表來說,直接刪除一些題項可能影響信效度,采用基于項目反應理論的測驗等值方法進行處理或許更適用。此外,該量表的評分辦法早在1983年以普通人群為常模團體確立的[20],或許可以根據(jù)施測對象不同,重新設計評分標尺,重新確定“陽性”閾限。
心理健康評測工具已經(jīng)在公安工作中得廣泛使用。在這種情況下,評測工具的公平性和有效性應該被充分重視。本研究利用河南省33270例警察數(shù)據(jù),對一般健康問卷在體重正常群組與體重偏瘦、超重、肥胖群組之間兩兩實施項目功能偏差檢驗分析發(fā)現(xiàn),該量表在體重正常組和體重肥胖組之間存在項目功能偏差,8個題項存在低水平項目功能偏差,2個題項存在中等水平項目功能偏差;量表在這兩組之間存在較大的測驗功能偏差。研究表明,即便成熟的心理健康量表也并非適用于所有警察亞群體。本研究對于警院新生錄取、公安招警考試及民警心理服務中的心理測評工作均具有啟示作用。
一是優(yōu)化警院新生錄取中的心理測評。警察的來源既有公安院校,也有非公安院校。2015年以來,公安院校畢業(yè)生成了多數(shù)省份招警的主要對象。公安院校在學生招錄培養(yǎng)中越來越重視心理健康問題。河南警察學院等部分院校在公安專業(yè)提前批的招錄工作中便設置有心理健康測評環(huán)節(jié),將測評結(jié)果作為學生綜合素質(zhì)考察的重要參考。測評環(huán)節(jié)往往由心理健康教育中心的咨詢老師或心理學專業(yè)教師執(zhí)行,施測者具有較高的心理學專業(yè)素養(yǎng)。但由于人力與資源所限,公安院校往往缺乏獨立開發(fā)心理測評工具的能力,因而往往沿用成熟心理量表,或者外包給商業(yè)公司,這使得測驗質(zhì)量具有不穩(wěn)定性。今后應針對公安院校招警考試,統(tǒng)一組織,相互協(xié)作,針對警院招生考試開發(fā)出高質(zhì)量的心理測評工具。這些心理工具必須具備較高的信效度,能夠有效避免或處理項目功能偏差問題。
二是完善公安招警考試中的心理測評。在招警考試當中,無論面向社會還是面向公安院校,心理測評都越來越受到重視。以往實踐表明,部分易感性強、心理彈性差,甚至個別有精神疾病、人格障礙的不適合從事公安工作的人員進入了公安隊伍。招警過程中的心理健康測試有利于筑牢公安機關(guān)選人用人的心理防火墻。浙江、廣東等省份的招警考試都已出現(xiàn)心理素質(zhì)測評。招警考試是極其重要而嚴肅的工作,若要將心理測驗納入考試環(huán)節(jié),其測驗的編制、施測和解釋,都要實現(xiàn)標準化。在組織專家進行心理測評工具的開發(fā)時,應當充分重視這些測評工具可能出現(xiàn)的項目功能偏差問題,確保測驗的公平性和有效性。
三是改進民警心理服務中的心理測評。公安機關(guān)已經(jīng)認識到在職民警心理健康問題的危害性,已采取各種應對措施加以防治,以便提升民警的綜合心理素質(zhì)。心理測評工具能夠廣泛運用于民警的心理健康檢查、心理咨詢服務和心理危機干預。目前河南省公安廳、部分地市公安局建立了一些相對專業(yè)的心理服務機構(gòu),許多區(qū)市以下公安部門也設置有專門的心理咨詢室??梢酝ㄟ^心理測驗建立心理健康檔案,實施分類管理,對出現(xiàn)心理“陽性”的警察給予重點幫助。民警心理咨詢服務和心理危機干預當中,也需要運用心理測驗明確受助者的主要問題。在心理評測工具的使用中,普遍存在施測者專業(yè)素養(yǎng)不足,工具選取運用不當?shù)那闆r。應加強對民警心理服務人員的培訓,尤其加強對于心理測驗使用的指導,確保對特定的受助者進行心理評估時,能夠選擇合適量表,避免項目功能偏差。