◎ 孫卓爾 尚志蕾 劉偉志 歐陽慧(海軍軍醫(yī)大學(xué)心理系基礎(chǔ)心理學(xué)教研室,上海 200433)
對于接受在校教育的青少年而言,大多數(shù)活動時間都是在學(xué)校環(huán)境中度過的。因此,做好學(xué)校心理健康教育工作、維護(hù)在校學(xué)生的心理健康至關(guān)重要。而開展心理測評,實(shí)現(xiàn)對學(xué)生群體心理狀況的有效監(jiān)控則是學(xué)校心理健康教育工作中的關(guān)鍵一環(huán),對于發(fā)現(xiàn)群體心理問題傾向,進(jìn)而開展有針對性的心理健康教育工作,篩查心理問題風(fēng)險個體,建立規(guī)范的學(xué)生心理健康檔案,以及在心理咨詢和輔導(dǎo)工作中更好地掌握來訪學(xué)生的心理現(xiàn)狀等具有重要意義[1-2]。
目前,國家相關(guān)部門已經(jīng)出臺了部分政策和指導(dǎo)性意見,要求建立和完善學(xué)校心理健康監(jiān)測評估體系,以及時干預(yù)青少年心理健康問題。2020 年9月,國家衛(wèi)生健康委員會發(fā)布《探索抑郁癥防治特色服務(wù)工作方案》,明確“各個高中及高等院校將抑郁癥篩查納入學(xué)生健康體檢內(nèi)容,建立學(xué)生心理健康檔案,評估學(xué)生心理健康狀況,對測評結(jié)果異常的學(xué)生給予重點(diǎn)關(guān)注”[3]。2021 年7 月,教育部在《關(guān)于加強(qiáng)學(xué)生心理健康管理工作的通知》中也提出了“定期開展學(xué)生心理健康測評工作,健全篩查預(yù)警機(jī)制,及早實(shí)施精準(zhǔn)干預(yù)”等相關(guān)要求[4]。
利用各類專業(yè)化心理測量工具和技術(shù)協(xié)助開展學(xué)生心理健康測評目前已經(jīng)相當(dāng)普及。各高校新生入學(xué)后的心理測評已經(jīng)基本實(shí)現(xiàn)全覆蓋,部分社會經(jīng)濟(jì)較為發(fā)達(dá)的地區(qū)和城市的中小學(xué)也普遍開展了針對學(xué)生乃至教師和家長的心理測量[5]。隨著全國范圍內(nèi)初等至高等各教育階段學(xué)校心理健康教育工作的專業(yè)化程度不斷提升,心理測量也日趨規(guī)范和完善。在一線心理測量的實(shí)操中已經(jīng)開始注重測驗(yàn)的標(biāo)準(zhǔn)化,并且認(rèn)識到了測量誤差控制和測量結(jié)果信效度等對于開展學(xué)校心理測量工作的意義。
但是,目前學(xué)校心理健康測評工作的開展過程中依然存在專業(yè)性、科學(xué)性不夠的現(xiàn)象,特別是在測評工具的選擇方面,問題較為突出。例如,對中學(xué)生心理健康測評相關(guān)文獻(xiàn)進(jìn)行研究發(fā)現(xiàn),學(xué)校心理測評中存在測量工具選擇不夠合理、合適的問題[6-7]。本文分析了學(xué)校心理測評中出現(xiàn)問題的常見原因,并提出了改進(jìn)建議。
所有的測量工具都具有其適合的量程(range)。例如,在長度測量中,我們不會用直尺去測量操場的長度,也不會拿卷尺測量頭發(fā)絲直徑,因?yàn)檫@些測量對象顯然不適合直尺或卷尺的量程。但是在心理測量中,人們往往會忽視這一點(diǎn)。受測學(xué)生的某個心理特質(zhì)是心理測量的對象,而心理特質(zhì)也像長度等物理特征一樣有著極大的跨度范圍。以心理健康維度為例,有的個體心理彈性和情緒調(diào)節(jié)能力極強(qiáng),不論經(jīng)歷什么樣的挫折和困難都可以很快恢復(fù)積極的心態(tài),其心理健康水平位于特質(zhì)軸上特別偏向“好”的一端的位置上;同樣,也有的個體罹患重度精神障礙,其心理健康水平位于特質(zhì)軸上特別偏向“差”的一端的位置上,與前者在軸上的距離相去甚遠(yuǎn)。就像長度測量工具往往只能覆蓋有限的量程范圍一樣,大多數(shù)心理測量工具也僅能夠覆蓋其測量的心理特質(zhì)的一部分區(qū)間。因此,在開展心理測評時所選測量工具的量程必須與目標(biāo)對象群體的整體心理水平相適配。
心理測量工具的量程不合適可能會造成很多不利后果。
一是心理測量的結(jié)果會出現(xiàn)天花板效應(yīng)(ceiling effect)或地板效應(yīng)(floor effect),導(dǎo)致整體結(jié)果集中在高分段或低分段,壓縮了測量結(jié)果的變異程度,進(jìn)而影響測量結(jié)果的區(qū)分度和準(zhǔn)確性。例如,90 項(xiàng)癥狀自評問卷(Symptom Check List 90,SCL-90)是目前在學(xué)校心理健康測評中廣泛使用的心理量表,該量表是從軀體化、抑郁、精神病性等多維度評估精神障礙癥狀程度的臨床心理量表,其量程在心理健康特質(zhì)軸上應(yīng)該在“疑似有精神障礙”到“中度或重度精神障礙”之間[8]。如果想基于該量表進(jìn)行精神障礙的篩查,則目標(biāo)群體就是可能患有精神障礙的個體,使用該量表是合適的;但如果想評估學(xué)生群體整體心理健康水平或一般心理問題傾向,該量表并不適用,因?yàn)閷τ趯W(xué)生群體而言,心理問題大部分集中表現(xiàn)在學(xué)習(xí)、交往、情緒狀態(tài)和社會適應(yīng)性等方面,并且多數(shù)屬于發(fā)展性問題,僅少數(shù)屬于障礙性問題[9]。學(xué)生群體中的絕大多數(shù)心理健康水平會比SCL-90 適用的量程上限更好,如果用該量表施測,則結(jié)果會主要集中于低分段,難以進(jìn)行實(shí)質(zhì)性分析。
二是心理測量的實(shí)施是向受測學(xué)生提供標(biāo)準(zhǔn)化刺激(題目描述)并采集受測學(xué)生相應(yīng)的行為反應(yīng)(作答記錄)的過程,受測學(xué)生的心理活動本身也會受到測量過程的影響,而測驗(yàn)量程與測驗(yàn)題目表述往往密切相關(guān),測驗(yàn)量程不適配則該測驗(yàn)表述通常也不適宜展示給受測學(xué)生。如果將這樣的測驗(yàn)給低年級學(xué)生群體用,則可能會對受測學(xué)生造成一定的心理傷害,甚至可能引發(fā)惡性的群體心理事件。
例如,2021 年11 月,上海市某區(qū)在本區(qū)小學(xué)組織開展的心理健康測評中,就選用了貝克自殺意念量表(Beck Scale for Suicide Ideation,BSS)作為測評工具之一。該量表適用對象為可能存在抑郁等精神障礙且可能存有自殺意念的群體,因此其中含有大量類似“最近一周為了自殺,你的準(zhǔn)備行動完成得怎么樣”的表述。使用該量表施測對于心智發(fā)展尚不成熟的小學(xué)生群體可能會起到負(fù)面的誘導(dǎo)作用,也引發(fā)了很多家長的擔(dān)憂。最終,該事件在媒體報道和互聯(lián)網(wǎng)討論中不斷發(fā)酵,發(fā)展成為公眾輿論事件,造成了較為惡劣的影響。
絕大多數(shù)心理測驗(yàn)分?jǐn)?shù)的意義都是靠測驗(yàn)參照賦予的。按照測驗(yàn)參照的不同,心理測驗(yàn)可以分為標(biāo)準(zhǔn)參照測驗(yàn)(Criterion-Referenced Test)和常模參照測驗(yàn)(Norm-Referenced Test)[10]。其中,部分臨床心理測驗(yàn)和成就測驗(yàn)等屬于標(biāo)準(zhǔn)參照測驗(yàn),其余常用心理測驗(yàn)大都為常模參照測驗(yàn)。常模(norm)是根據(jù)標(biāo)準(zhǔn)化樣本的測驗(yàn)結(jié)果,經(jīng)過一定的統(tǒng)計處理建立起來的測驗(yàn)結(jié)果評價參照系。常模參照測驗(yàn)的實(shí)質(zhì)就是將受測對象放到其所在的群體中來確定其在某心理特質(zhì)上的相對位置。但群體的心理特征并非長久穩(wěn)定的,也會隨社會經(jīng)濟(jì)文化的發(fā)展發(fā)生變化,因此常模也應(yīng)隨群體的變化而不斷更新。根據(jù)心理測量學(xué)的要求,心理測驗(yàn)的常模一般每5 至10 年就應(yīng)重新制定[10]。但目前學(xué)校心理測量工作中常用常模參照測驗(yàn)的本土化常模大部分是于20 世紀(jì)80 至90 年代制定的,以常用的人格測驗(yàn)工具艾森克人格問卷(Eysenck Personality Questionnaire,EPQ)為例,其簡式中國版常模由錢銘怡等于20 世紀(jì)90 年代末修訂[11]。類似這些心理測驗(yàn)的常模已經(jīng)過于老舊,無法跟上我國日新月異的社會發(fā)展,不適宜在心理測量工作中繼續(xù)使用。
對于基于問卷的心理測量而言,受測學(xué)生認(rèn)真如實(shí)作答是測量有效性的根本前提。如果受測學(xué)生因?yàn)槟承┰蛱峁┝瞬粶?zhǔn)確的答案,心理測量的結(jié)果也就變成了空中樓閣。在學(xué)校心理測評的實(shí)施中,確實(shí)存在一些因工具選擇不當(dāng)而影響受測學(xué)生作答真實(shí)性的問題。
一是使用的測驗(yàn)過于冗長。不少教師在開展學(xué)校心理測評工作時,使用的測驗(yàn)工具包含的題目數(shù)量本就很多,有時為了增強(qiáng)測量的全面性和信度水平,還會將多個心理測驗(yàn)合并施測,總施測題目數(shù)量一般在100 項(xiàng)以上,學(xué)生要花20~40分鐘才能完成,低年級學(xué)生由于理解能力等方面的限制,可能花費(fèi)的時間更長。學(xué)生在作答時,注意力難以做到長時間集中,往往會出現(xiàn)不認(rèn)真讀題、隨機(jī)作答或選擇固定選項(xiàng)應(yīng)付了事的情況,這就使得心理測量結(jié)果變得毫無意義。即便使用了如明尼蘇達(dá)多相人格測驗(yàn)(Minnesota Multiphasic Personality Inventory,MMPI)等包含效度分量表的測驗(yàn),也僅能在一定程度上區(qū)分作答是否有效,并不能起到校正無效結(jié)果的作用。因此,控制題目數(shù)量以保證受測學(xué)生的注意維持使其能夠認(rèn)真作答的實(shí)際效果,遠(yuǎn)優(yōu)于提供大量題目但受測學(xué)生隨意應(yīng)付作答的情況。
二是過于依賴自評測驗(yàn)。目前,學(xué)校心理測評中使用的絕大多數(shù)都為自評測驗(yàn),即受測學(xué)生就是評估的對象,根據(jù)測驗(yàn)題目和自身實(shí)際情況自行作答。在接受心理健康方面的篩查時,受測學(xué)生可能存在的掩飾會有意或無意地直接影響作答過程,造成測量結(jié)果的偏差。
在立足既有心理測驗(yàn)開展學(xué)校心理測評工作時,應(yīng)進(jìn)一步加強(qiáng)測驗(yàn)選擇的科學(xué)化和規(guī)范化。一般來說,按照以下五步流程就能夠選出合理、適用的工具。
1.根據(jù)心理測評的目的確定需要測量的心理特質(zhì),如心理健康、智力、人格等,并找出盡可能多的針對目標(biāo)特質(zhì)進(jìn)行測量的心理測驗(yàn)作為備選。
2.考慮備選心理測驗(yàn)的量程和題目描述是否適合學(xué)生群體。
3.查看備選心理測驗(yàn)的參照是否更新及時,如果確實(shí)沒有新近修訂的參照工具,在排除其他因素的情況下可優(yōu)先選擇標(biāo)準(zhǔn)參照測驗(yàn)。因?yàn)闃?biāo)準(zhǔn)參照測驗(yàn)中標(biāo)準(zhǔn)的建立通?;谳^為確定的專家共識,相對于常模參照有更好的穩(wěn)定性。
4.根據(jù)測驗(yàn)使用手冊評估備選測驗(yàn)結(jié)果信效度是否在可以接受的范圍。
5.考慮備選測驗(yàn)的題目數(shù)量,盡可能選擇簡短的測驗(yàn)。
目前,我國針對在校學(xué)生群體的心理測評工具較為缺乏,有針對性地開發(fā)新的心理測驗(yàn),是解決學(xué)校心理測評工具選擇問題的更為理想的方案。即便是中國中學(xué)生心理健康量表這樣專門針對我國中學(xué)生群體編制的心理健康測驗(yàn),其測量內(nèi)容也是以強(qiáng)迫、抑郁等精神障礙因子為主,并未涵蓋前文所述的更為關(guān)鍵和普遍的發(fā)展性問題[12]。因此,新的學(xué)校心理測評工具的開發(fā)勢在必行。
新的學(xué)校心理測評工具的開發(fā)應(yīng)該遵循以下三個原則:
一是繼承現(xiàn)有工具的優(yōu)點(diǎn)。經(jīng)典心理測驗(yàn)經(jīng)過長期使用和多次修訂,通常具有測驗(yàn)結(jié)構(gòu)清晰、施測信效度好、配套手冊完善等特點(diǎn)。在編制新的測驗(yàn)時,應(yīng)借鑒經(jīng)典心理測驗(yàn)對于特質(zhì)結(jié)構(gòu)的分析和典型表現(xiàn)的表述,在此基礎(chǔ)上進(jìn)行適應(yīng)我國學(xué)生群體的改編和拓展,可以更好地提供開發(fā)思路,保證開發(fā)質(zhì)量,降低開發(fā)成本。
二是采用新測量理論和測評技術(shù)。新的學(xué)校心理測評工具應(yīng)是基于項(xiàng)目反應(yīng)理論(Item Response Theory,IRT)的計算化自適應(yīng)測驗(yàn)(Computerized Adaptive Testing,CAT)平臺,可以通過手機(jī)、智能平板、電腦等個人智能終端設(shè)備訪問。其特點(diǎn)是受測學(xué)生在完成每一道或每一組題目后,測評程序會重新評估受測學(xué)生的特質(zhì)水平,然后根據(jù)其特質(zhì)水平呈現(xiàn)最適合的后續(xù)題目。這一技術(shù)可以通過提供更加合適的題目減少測驗(yàn)所需的題目數(shù)量,能夠較好地克服測驗(yàn)冗長的問題,達(dá)到精簡測驗(yàn)長度的目的[13]。而且此類平臺可以不斷更新測驗(yàn)?zāi)P秃蛥⒄眨缭谑褂脮r借鑒美國教育測試服務(wù)機(jī)構(gòu)(Educational Testing Service,ETS)編制的學(xué)業(yè)測驗(yàn)的方法,在每一次施測的過程中對已有的和新的測驗(yàn)題目模型和常模進(jìn)行驗(yàn)證和完善。同時,該方法還便于利用技術(shù)手段提高學(xué)校心理測評工作的保密性。
三是頂層統(tǒng)籌指導(dǎo)實(shí)施。不論是項(xiàng)目反應(yīng)理論測驗(yàn)?zāi)P偷慕?,還是計算機(jī)化自適應(yīng)測驗(yàn)平臺的建設(shè),都具有前期投入和初始成本較高,但邊際成本很低的特點(diǎn)。因此,建議工具的開發(fā)建設(shè)應(yīng)由省級以上教育主管部門牽頭組織,以提供較強(qiáng)的技術(shù)和資金支持,在平臺建成后以公共服務(wù)的形式向各級學(xué)校開放使用。
在短期內(nèi)無法獲得特別適合的心理測評工具的情況下,也可以借鑒360 度評估技術(shù),采用他評與自評相結(jié)合的方式開展學(xué)校心理測評。360 度評估是組織行為學(xué)中常用的評估技術(shù),指由員工自己、上司、下屬、同級同事,乃至顧客等從全方位、多角度對員工進(jìn)行評估的方法[14]。
心理測評其實(shí)只是以低成本快速了解測評對象心理狀況的妥協(xié)性手段,因此只要能夠達(dá)到了解目標(biāo)群體心理的目的,并非一定要實(shí)施心理測評。當(dāng)缺乏合適的工具直接實(shí)施自評測驗(yàn)時,通過問詢測評對象的熟人其在一些關(guān)鍵表現(xiàn)和線索上的情況,同樣可以取得較好的效果。例如,關(guān)于自殺意念和自殺行為的監(jiān)測,可通過對學(xué)生開展心理健康教育,使學(xué)生了解自殺前常見表現(xiàn),之后通過學(xué)生間互助提供自殺預(yù)警,反而優(yōu)于使用貝克自殺意念量表等工具進(jìn)行篩查的效果[15]。因此,在學(xué)校心理測評工作中,應(yīng)重視學(xué)生中心理骨干、心理委員或?qū)W生心理社團(tuán)隊(duì)伍的培訓(xùn),從學(xué)生群體內(nèi)部入手,增進(jìn)對學(xué)生心理健康狀況的了解和掌握,實(shí)現(xiàn)心理問題相關(guān)風(fēng)險的提前預(yù)警。
心理測評作為學(xué)校心理健康教育工作中的重要一環(huán),其科學(xué)化和規(guī)范化應(yīng)得到進(jìn)一步加強(qiáng)。而測評工具的選擇作為心理測評中的關(guān)鍵環(huán)節(jié)之一,理應(yīng)得到高度重視。針對當(dāng)前學(xué)校心理測評工具選擇中存在的一些實(shí)際問題,學(xué)校心理健康教育工作的管理指導(dǎo)者和一線教師都應(yīng)立足自身崗位資源,提升和完善個人和體系的專業(yè)化程度,以提高心理測評服務(wù)學(xué)校心理健康教育工作的實(shí)效。