吳志淵,黃戌霞,陳新元,楊漫鑫
(1.福州墨爾本理工職業(yè)學(xué)院 學(xué)生工作部,福建 福州 350108;2.寧德職業(yè)技術(shù)學(xué)院 信息技術(shù)與工程系,福建 寧德 355000;3.福州墨爾本理工職業(yè)學(xué)院 信息工程系,福建 福州 350108)
近年來,經(jīng)歷抑郁或焦慮等心理健康問題的大學(xué)生比例不斷上升[1]。世界范圍內(nèi),大約有31%的大學(xué)生在過去的一年中篩查出某種精神紊亂或疾病[2]。人們也逐漸認(rèn)識(shí)到為存在這些常見精神健康問題的大學(xué)生提供治療具有一定的難度。
首先,許多學(xué)生的心理健康素養(yǎng)較低,沒有認(rèn)識(shí)到治療的必要性,而且認(rèn)為這些抑郁和焦慮癥狀是大學(xué)時(shí)期的典型壓力,沒有尋求專業(yè)醫(yī)療幫助的必要;雖然有些學(xué)生認(rèn)識(shí)到自己需要心理健康服務(wù),但是在尋求幫助時(shí)卻常常遇到障礙,或?qū)Ω深A(yù)方案的療效存在疑慮[3]。其次,大多數(shù)高校都有心理咨詢室,但可能存在專業(yè)人員/相關(guān)資源不足的問題,難以滿足學(xué)生的需求;而且部分學(xué)生對(duì)現(xiàn)實(shí)生活中的心理健康干預(yù)存在排斥心理,擔(dān)心隱私泄露[4]??上驳氖?,目前已有較多的在線心理健康干預(yù)方案(通過Web頁(yè)面和APP等方式)提供心理咨詢和治療服務(wù),不受時(shí)間/空間的限制,同時(shí)能跨越上述傳統(tǒng)心理健康服務(wù)的障礙[5]。
許多研究關(guān)注成年人的在線心理健康干預(yù)[6];關(guān)于高校學(xué)生心理干預(yù)方案的研究也在快速增加。2014年Davies等[7]對(duì)在線方式提供的大學(xué)生心理健康干預(yù)措施進(jìn)行了系統(tǒng)性回顧,發(fā)現(xiàn)在線治療可以有效緩解學(xué)生的抑郁、焦慮和壓力。2018年Harrer等[8]經(jīng)評(píng)估認(rèn)為,互聯(lián)網(wǎng)心理健康干預(yù)對(duì)一系列精神紊亂狀況可能具有輕到中度影響。
盡管上述研究一定程度上可以評(píng)估在線心理健康干預(yù)措施的治療成效,但存在局限性:只專注隨機(jī)對(duì)照試驗(yàn)(RCT)的研究。將其他類型的相關(guān)研究(如非隨機(jī)試驗(yàn)、單臂試驗(yàn)和全局試驗(yàn)等),即現(xiàn)實(shí)場(chǎng)景中的不同實(shí)施方案及成效分析納入評(píng)估范疇,有助于充分評(píng)估相關(guān)方案并改善未來的干預(yù)實(shí)施,充分發(fā)掘其臨床公共衛(wèi)生潛力。
進(jìn)一步來說,在線醫(yī)療工具的實(shí)施和將其集成到常規(guī)護(hù)理環(huán)境中是近年的研究熱點(diǎn)。有研究呼吁從實(shí)用主義的角度出發(fā),在現(xiàn)實(shí)場(chǎng)景中測(cè)試在線醫(yī)療方案,可盡快和最大程度地提高知識(shí)從科研實(shí)驗(yàn)到現(xiàn)實(shí)應(yīng)用的遷移[9],而在線心理干預(yù)無疑是在線醫(yī)療的重要組成部分。
此外,有研究發(fā)現(xiàn)在線心理健康工具普遍存在參與度和完成率較低的問題[10]。有研究將重心放在評(píng)估在線工具的用戶體驗(yàn)方面(包括易用性和可接受性),希望能發(fā)現(xiàn)用戶對(duì)相關(guān)治療方案的不滿意/不理解之處,分析并進(jìn)行改進(jìn),使用戶更愿意,也更能順利接受在線心理健康服務(wù)[11]。
本研究的目的是設(shè)計(jì)綜合性的評(píng)估框架,以包括但不限于RCT類型的大學(xué)生在線心理健康干預(yù)方案研究為評(píng)估對(duì)象,設(shè)計(jì)收錄標(biāo)準(zhǔn)和檢索策略,確定主流數(shù)據(jù)庫(kù)和數(shù)據(jù)源,設(shè)計(jì)數(shù)據(jù)抓取、處理和存儲(chǔ)方案,并對(duì)評(píng)估體系進(jìn)行初步設(shè)計(jì),包括治療效果、易用性、可接受性和推廣程度等內(nèi)容,以發(fā)現(xiàn)相關(guān)研究的強(qiáng)項(xiàng)和不足,用于其未來的改進(jìn)參照,最終加強(qiáng)抑郁癥、焦慮癥等心理問題的治療效果,進(jìn)一步提高大學(xué)生的心理健康水平。
團(tuán)隊(duì)成員包括多位心理學(xué)領(lǐng)域的具有3年以上提供心理咨詢服務(wù)經(jīng)驗(yàn)的專家,信息技術(shù)領(lǐng)域的從業(yè)人員,以及心理學(xué)專業(yè)的本科生等。
本文將框架分析對(duì)象的收錄標(biāo)準(zhǔn)定為:
⑴ 該研究的核心是旨在改善心理健康,解決心理問題的干預(yù)/治療措施。
⑵ 以在線方式提供干預(yù)(包括手機(jī),PC、平板等多種終端媒介,通過APP、小程序、在線網(wǎng)站等方式提供服務(wù)均可);可以是面對(duì)面治療方案的補(bǔ)充/輔助手段。
⑶ 治療和研究的對(duì)象為高等教育學(xué)生群體,包括全日制本科及以上學(xué)歷的學(xué)生,全日制高等職業(yè)教育的學(xué)生,成人非全日制學(xué)歷教育的學(xué)生,等等。
⑷ 研究的心理問題包括壓力、抑郁和焦慮等癥狀,應(yīng)有干預(yù)治療實(shí)施和成效分析的內(nèi)容。
本框架使用了基于關(guān)鍵字匹配的搜索策略,根據(jù)PMI共現(xiàn)頻率整理并手動(dòng)校對(duì)關(guān)鍵字字典,收錄“大學(xué)生”“抑郁”“焦慮”“心理健康”和“心理治療”等詞語,以及其同、近義詞和所有相應(yīng)的英文術(shù)語。
將關(guān)鍵字檢索應(yīng)用于以下數(shù)據(jù)庫(kù):知網(wǎng)、萬方、維普、MEDLINE(Ovid)、EMBASE(Elsevier)、PsycINFO(EbscoHost)、Cochrane(Wiley)和Web of Science(Thomson Reuters)。由于部分期刊(如JMIR Mental Health和Digital Health未在上述數(shù)據(jù)庫(kù)中收錄),因此另行訪問該類出版物的官方網(wǎng)站獲取文獻(xiàn);框架還擴(kuò)展到從檢索結(jié)果的參考文獻(xiàn)中發(fā)現(xiàn)新的未被上述數(shù)據(jù)庫(kù)收錄的期刊/文獻(xiàn)并進(jìn)行手動(dòng)核查。不對(duì)日期、語種、文獻(xiàn)類型(除簡(jiǎn)訊/快訊外)和研究方案類型進(jìn)行限制。
使用分布式爬蟲結(jié)合Redis進(jìn)行數(shù)據(jù)處理,持久化使用MongoDB(實(shí)驗(yàn)中發(fā)現(xiàn)該方案效率高于通過StrictRedis讀寫Redis數(shù)據(jù)庫(kù)實(shí)現(xiàn)持久化存儲(chǔ))。
本研究使用多認(rèn)證賬號(hào)(>100)、多授權(quán)APP_KEY組合(>20)、多代理(可用IP庫(kù)>400)的組合進(jìn)行輪詢;同時(shí)設(shè)定單線程的請(qǐng)求頻率,350 ms/400 ms,具體過程如下:
⑴ 首先構(gòu)建指向prelogin頁(yè)面的URL,從事先構(gòu)造且驗(yàn)證可行的Header庫(kù)中隨機(jī)選擇,通過urllib.request.Request進(jìn)行配置,使用urllib.request.ProxyHandler設(shè)置代理;
⑵ 根據(jù)頁(yè)面加密方式,對(duì)賬號(hào)進(jìn)行base64轉(zhuǎn)換,使用utf-8編碼,密碼構(gòu)造過程中,聯(lián)合從prelogin頁(yè)面取到的servertime時(shí)間戳、nonce和pubkey字段值后,進(jìn)行RSA加密和16進(jìn)制轉(zhuǎn)換;
⑶ 在使用servertime、rsakv等參數(shù)進(jìn)行登錄的同時(shí),根據(jù)is_openlock參數(shù)判斷驗(yàn)證碼是否存在,若發(fā)現(xiàn)則下載,使用weibo_verify_code等三方庫(kù)進(jìn)行識(shí)別(主流Python引擎如Tesseract的OCR識(shí)別率不高,故驗(yàn)證碼量較小時(shí)直接調(diào)用三方平臺(tái)是主流選擇,準(zhǔn)確率高且成本較低),登陸后根據(jù)響應(yīng)的location字段定位,使用ticket等字段構(gòu)造請(qǐng)求,獲取會(huì)話session信息,之后可從uniqueid中提取分配的用戶登錄編號(hào),其他信息類似,有效期內(nèi)使用MozillaCookieJar()進(jìn)行Cookies的切換;
⑷ 服務(wù)器響應(yīng)的URL中有部分進(jìn)行了字符編碼,使用urllib庫(kù)的unquote_plus函數(shù)進(jìn)行還原;具體信息根據(jù)<div class = “content clearfix” node-type =“l(fā)ike”>標(biāo)簽定位,先使用Selenium+PhantomJS框架的get_attribute等方法進(jìn)行重定向定位,再實(shí)現(xiàn)直接請(qǐng)求以提升抓取效率,過程中涉及到mini_original.js等請(qǐng)求參數(shù)的識(shí)別和使用;
⑸ 使用RedisSpider分布式框架將url爬取和數(shù)據(jù)提取分離,使用redisMixin為爬蟲分配key,同時(shí)引入concurrent包構(gòu)建進(jìn)程池和線程池,根據(jù)keyword選擇內(nèi)容,按時(shí)間升序生成隊(duì)列,并行提取、過濾和輸出各個(gè)字段的信息。在數(shù)據(jù)抓取過程中,時(shí)有發(fā)現(xiàn)因?yàn)閮?nèi)容過長(zhǎng),沒有完整抓取的情況,故針對(duì)“展開全文”的Ajax請(qǐng)求使用Beautiful Soup模塊進(jìn)行爬??;
⑹ 盡管數(shù)據(jù)收集機(jī)制較為完善,也提供了網(wǎng)站認(rèn)可的Header信息,使用了切換app_key、ip等機(jī)制,但實(shí)際獲取數(shù)據(jù)時(shí)還是會(huì)出現(xiàn)無法控制的異常,這類異常大約占總請(qǐng)求的2%~6%,使用re庫(kù)編寫的精確正則表達(dá)式往往無法識(shí)別,對(duì)數(shù)據(jù)過濾造成影響,因而大量使用了BeautifulSoup模塊提供的預(yù)處理方法,效率低些,但識(shí)別率高;這類異常往往隔一段時(shí)間后重發(fā)請(qǐng)求即可解決,但為了保證效率,使用了上述方案。此外考慮到網(wǎng)絡(luò)延時(shí)等因素導(dǎo)致數(shù)據(jù)抓取失敗的可能,設(shè)置了異常處理,對(duì)抓取到的數(shù)據(jù)進(jìn)行驗(yàn)證,若抓取失敗,如提取到500失敗碼,則執(zhí)行except語句循環(huán)抓取,同時(shí)使用Time庫(kù)的計(jì)時(shí)器判斷超時(shí);
⑺ 最終提取的數(shù)據(jù)結(jié)構(gòu)包括項(xiàng)目名,時(shí)間及跨度,地域,主要干預(yù)/治療目標(biāo),學(xué)生人數(shù),治療方案設(shè)計(jì),比較類型,預(yù)防/治療類型,技術(shù)類型,支持資源,參數(shù)設(shè)置,樣本組規(guī)模,易用性和可接受性,治療的完成度,干預(yù)治療結(jié)果,結(jié)果分析,等等。
⑻ 檢索得到的文獻(xiàn)經(jīng)框架自動(dòng)初篩(使用機(jī)器學(xué)習(xí)技術(shù)進(jìn)行迭代,直到驗(yàn)證集上的準(zhǔn)確率在最后10個(gè)epoch內(nèi)提升小于1%為止)和本科生根據(jù)標(biāo)題和摘要進(jìn)行初步校對(duì)外,每篇通過篩選的文獻(xiàn)都由不少于2位專家根據(jù)方案標(biāo)準(zhǔn)進(jìn)行獨(dú)立評(píng)估;存在分歧時(shí)則引入第3位專家作為仲裁[12]。
⑼ 數(shù)據(jù)的持久化存儲(chǔ)通過pyMongo模塊調(diào)用MongoDB數(shù)據(jù)庫(kù),通過創(chuàng)建Mongoclient()讀寫數(shù)據(jù);本文借鑒了Scrapy框架的get_media_requests和item_completed方法,將對(duì)url的請(qǐng)求發(fā)送到管道,實(shí)現(xiàn)異步下載和字典格式的存儲(chǔ)以提升效率。
⑽ 使用釘釘平臺(tái),以便研究成員間可進(jìn)行在線協(xié)作。
本文方案用到或參考的相關(guān)模塊版本如下:
Urllib_kerberos-0.2.0;Pymongo 3.7.0;BeautifulSoup 4.6.0;lxml 3.3.1;Scrapy 0.24.4;Selenium 3.11.0;PhantomJS 2.1.1;Numpy 1.14.3;Pandas 0.23.0;Chardet 3.0.4。
本研究旨在設(shè)計(jì)綜合性、自動(dòng)化的數(shù)據(jù)收集和評(píng)估框架,用于對(duì)大學(xué)生線上心理健康干預(yù)/治療相關(guān)研究進(jìn)行分析,根據(jù)Preferred Reporting Items for Systematic Reviews and Meta-Analyses guidelines[13]設(shè)計(jì)系統(tǒng)性的評(píng)估方案,評(píng)估體系包括治療效果、易用性、可接受性和推廣程度等內(nèi)容。具體如下:
⑴ 治療結(jié)果的度量指標(biāo)包括Beck Depression Inventory-II[14]和Patient Health Questionnaire[15](抑郁),Beck Anxiety Inventory[16]和Anxiety Sensitivity Inventory[17](焦慮),Perceived Stress Scale[18]和Scales of Psychological Well-being[19](心理壓力和幸福感/健康指數(shù))。
⑵ 易用性定義為與終端媒介和網(wǎng)站/程序交互時(shí)用戶體驗(yàn)質(zhì)量,包括剛開始治療時(shí)適應(yīng)方案的難易程度,網(wǎng)站/程序的操作效率和用戶友好性,可記憶性以及對(duì)相關(guān)方案的印象描述。易用性結(jié)果包括標(biāo)準(zhǔn)可用性度量System Usability Scale[20]和定性描述報(bào)告。
⑶ 可接受性是用戶關(guān)于治療/干預(yù)方案各方面的滿意度,主要通過用戶自行編寫的定性描述 報(bào)告進(jìn)行評(píng)估。
⑷ 推廣程度的主要指標(biāo)是在線干預(yù)/治療服務(wù)的下載和使用量、穩(wěn)定用戶數(shù)量和變化情況(以潛在用戶總數(shù)為基數(shù)),若有條件可補(bǔ)充該服務(wù)的高校知名度。但是,鑒于很少有研究提供該細(xì)節(jié),因此未來計(jì)劃在爬取的數(shù)據(jù)范圍和識(shí)別錨標(biāo)上進(jìn)行擴(kuò)展設(shè)計(jì)。
⑸ 偏倚風(fēng)險(xiǎn)評(píng)估:由于本框架的研究對(duì)象包括隨機(jī)試驗(yàn)和非隨機(jī)試驗(yàn),因此同時(shí)使用Cochrane Collaboration的評(píng)估隨機(jī)試驗(yàn)偏倚風(fēng)險(xiǎn)和評(píng)估非隨機(jī)研究風(fēng)險(xiǎn)的工具[21]。對(duì)于隨機(jī)試驗(yàn),使用“高”“低”和“不明”的等級(jí)評(píng)估選擇偏倚、實(shí)驗(yàn)偏倚、檢測(cè)偏倚、損耗偏倚和分析偏倚等。對(duì)于非隨機(jī)試驗(yàn),評(píng)估因混雜而造成的偏倚風(fēng)險(xiǎn),因選擇參與者而導(dǎo)致的偏倚,干預(yù)分類的偏倚,缺失數(shù)據(jù)而造成的偏倚,結(jié)果分析中的偏倚,等等。
近年來出現(xiàn)了許多在線大學(xué)生心理健康干預(yù)/治療方案,如何改善這些項(xiàng)目的用戶體驗(yàn)和實(shí)際治療效果,對(duì)于在高校中提供在線心理健康咨詢服務(wù)并持續(xù)改善至關(guān)重要。本文設(shè)計(jì)了大學(xué)生在線心理健康干預(yù)相關(guān)研究的評(píng)估框架,包括團(tuán)隊(duì)成員、方案收錄標(biāo)準(zhǔn)、檢索策略、數(shù)據(jù)源、數(shù)據(jù)抓取、處理和存儲(chǔ)方案,以及評(píng)估標(biāo)準(zhǔn)等,可對(duì)相關(guān)研究進(jìn)行匯總和分析。未來計(jì)劃開展該框架的驗(yàn)證實(shí)驗(yàn),通過對(duì)相關(guān)方案的匯總評(píng)估,為在線心理干預(yù)方案和相關(guān)研究提供持續(xù)改進(jìn)參照,同時(shí)迭代細(xì)化、優(yōu)化干預(yù)措施的有效評(píng)估指標(biāo),最終實(shí)現(xiàn)不斷提高大學(xué)生心理健康水平的目標(biāo)。