孫啟科 董問天 王克 馮超南 崔霖 李毓明 于淏巋 于濱 石川 紀(jì)俊
摘要:針對(duì)傳統(tǒng)MMPI量表中題目數(shù)量過多,許多應(yīng)用場(chǎng)景下受試者依從性差的問題,提出使用機(jī)器學(xué)習(xí)算法對(duì)MMPI量表中的臨床量表進(jìn)行簡(jiǎn)化的方法,對(duì)6種經(jīng)典機(jī)器學(xué)習(xí)算法的簡(jiǎn)化效果進(jìn)行了比較,并在受試者測(cè)評(píng)數(shù)據(jù)上對(duì)原始和簡(jiǎn)化后測(cè)評(píng)結(jié)果的敏感度與特異度進(jìn)行了對(duì)比分析。實(shí)驗(yàn)結(jié)果表明,使用最小絕對(duì)收縮和選擇算子(LASSO)的算法在保持相近準(zhǔn)確率的同時(shí)簡(jiǎn)化效果最好,平均減少了37.3%的男性和39.1%的女性受試者題目數(shù)量,并且簡(jiǎn)化后測(cè)評(píng)結(jié)果的敏感度與特異度仍能保持在原始測(cè)評(píng)結(jié)果的85%,縮短了測(cè)評(píng)時(shí)間,適用于更多的應(yīng)用場(chǎng)景。
關(guān)鍵詞:MMPI;機(jī)器學(xué)習(xí);量表簡(jiǎn)化
中圖分類號(hào):TP181
文獻(xiàn)標(biāo)志碼:A
收稿日期:2021-01-04
基金項(xiàng)目:
國(guó)家自然科學(xué)基金(批準(zhǔn)號(hào):61503208)資助;山東省自然科學(xué)基金(批準(zhǔn)號(hào):ZR2015PF002)資助。
通信作者:
石川,男,博士,副教授,主要研究方向?yàn)榫穹至寻Y、抑郁癥及雙相障礙。E-mail:shichuan@bjmu.edu.cn
紀(jì)俊,男,博士,講師,主要研究方向?yàn)檗D(zhuǎn)化醫(yī)學(xué)、醫(yī)療大數(shù)據(jù)分析。E-mail:jijun@healai.com
明尼蘇達(dá)多項(xiàng)人格測(cè)驗(yàn)(Minnesota Multiphasic Personality Inventory,MMPI)[1]是由明尼蘇達(dá)大學(xué)教授Hathaway等共同制定的人格檢測(cè)量表,在鑒別精神疾病方面有很好的信效度[2-3],并廣泛應(yīng)用在各個(gè)領(lǐng)域。近年來,社會(huì)競(jìng)爭(zhēng)壓力不斷增加,中國(guó)精神疾病的患病率明顯上升[4],精神疾病已成為危害中國(guó)人民身心健康的重要疾病之一[5] 。因此,一套高效簡(jiǎn)捷的人格檢測(cè)工具對(duì)國(guó)民精神疾病篩查非常必要。中國(guó)使用的MMPI量表是宋維真翻譯修訂的版本[6],共有566道題目,信息量龐大,患者應(yīng)用困難,往往要進(jìn)行分段實(shí)施。據(jù)統(tǒng)計(jì),青年男性需要42分鐘填寫[7],在體檢場(chǎng)景下測(cè)試者依從性較差,難以有耐心全部完成,所以要對(duì)原始的MMPI量表進(jìn)行簡(jiǎn)化,在保證結(jié)果一致性的前提下盡量減少題目,來提升量表的完成率。目前已有較多MMPI簡(jiǎn)化版本,例如MMPI-168[8],心理健康測(cè)查表(Psychological Health Inventory,PHI)[9]等,已經(jīng)被證明其在篩查方面的有效性[10],但這種類型的簡(jiǎn)化量表均是采用因子分析法生成固定的簡(jiǎn)化版本的量表,篩查過程中無法保證篩查的針對(duì)性和全面性。本研究針對(duì)前399道題目進(jìn)行簡(jiǎn)化,包括10個(gè)臨床量表。采用決策樹的特征選擇將10個(gè)題組的題目進(jìn)行重要性排序,再通過6種經(jīng)典機(jī)器學(xué)習(xí)算法對(duì)10個(gè)題組進(jìn)行建模分析,在保證結(jié)果一致性的前提下選出最優(yōu)簡(jiǎn)化量表的算法,確保量表簡(jiǎn)化的準(zhǔn)確性和全面性。
1 資料與方法
1.1 研究對(duì)象來源
數(shù)據(jù)集來自北京大學(xué)第六醫(yī)院疑似患有精神類疾病人群,從中抽取7 410名完成399道測(cè)評(píng)題目的患者。由于性別不同測(cè)評(píng)標(biāo)準(zhǔn)不同,所以將數(shù)據(jù)集分為3 144名男性與4 266名女性。由表1,測(cè)試者年齡因素對(duì)所有臨床測(cè)評(píng)題組都有統(tǒng)計(jì)學(xué)意義(p<0.05);性別因素對(duì)臨床測(cè)評(píng)題組Hs(疑?。?、D(抑郁)、Hy(癔病)、Mf(男女子氣)、Sc(精神分裂)、Ma(輕躁狂)、Si(社會(huì)內(nèi)向)具有統(tǒng)計(jì)學(xué)意義(p<0.05)。
1.2 機(jī)器學(xué)習(xí)算法
本研究采用最小絕對(duì)收縮和選擇算子(Least Absolute Shrinkage and Selection Operator,LASSO)[11]、梯度提升回歸樹(Gradient Boosting Regression Tree,GBRT)[12]、邏輯回歸(Logistic Regression,LR)[13]、隨機(jī)森林(Random Forest,RF)[14]、線性判別分析(Linear Discriminant Analysis,LDA)[15]、支持向量回歸(Support Vector Regression,SVR)[16]6種經(jīng)典機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練和驗(yàn)證。
1.3 量表簡(jiǎn)化過程
每個(gè)題組的題目簡(jiǎn)化流程如圖1所示。
(1)計(jì)算題目重要性:選擇平均絕對(duì)值誤差(Mean Absolute Error,MAE)[17]作為評(píng)價(jià)指標(biāo),根據(jù)決策樹的特征選擇將題組內(nèi)各題目進(jìn)行重要性排序,并按重要性從大到小調(diào)整組內(nèi)題目作答順序。
(2)機(jī)器學(xué)習(xí)預(yù)測(cè)建模:首先取測(cè)評(píng)者前2個(gè)題目的答案,選用6種經(jīng)典機(jī)器學(xué)習(xí)算法訓(xùn)練模型,自變量是測(cè)評(píng)者作答題目的答案,因變量是題組得分。預(yù)測(cè)出題組得分后,根據(jù)該題組常模原始分將預(yù)測(cè)得分篩選陰陽(yáng)性,得出與真實(shí)陰陽(yáng)性的混淆矩陣,計(jì)算出敏感度和特異度,如果敏感度和特異度都大于等于85%或者此時(shí)所有題目都用于建立模型,則結(jié)束,否則,跳至步驟(3)。
(3)迭代計(jì)算:根據(jù)重要性由大到小依次向模型中添加題目,重復(fù)步驟(2),直至敏感度和特異度均達(dá)到85%或該題組內(nèi)所有題目均做完為止,剩余題目即為題組內(nèi)刪除的題目。
1.4 評(píng)價(jià)指標(biāo)
根據(jù)中國(guó)常模標(biāo)準(zhǔn)[18],將真實(shí)得分與預(yù)測(cè)得分劃分陰陽(yáng)性,得到混淆矩陣,題組內(nèi)預(yù)測(cè)以敏感度和特異度作為衡量標(biāo)準(zhǔn)。本研究,按重要性由大到小依次向模型中添加題目,當(dāng)模型的敏感度與特異度均達(dá)到85%,題組剩余的題目為需要?jiǎng)h除的題目。
2 結(jié)果
通過6種經(jīng)典機(jī)器學(xué)習(xí)算法預(yù)測(cè)MMPI量表原有10個(gè)題組的敏感度與特異度,如表2、3所示,其中LASSO和LDA算法預(yù)測(cè)的最精準(zhǔn),均可達(dá)到90%以上。男性測(cè)試者通過機(jī)器學(xué)習(xí)算法預(yù)測(cè)10個(gè)題組的敏感度與特異度均達(dá)到閾值時(shí),采用GBRT、SVR、LASSO、LDA算法簡(jiǎn)化后的量表分別只需要做298、264、
250、260道題目。女性測(cè)試者通過6種經(jīng)典機(jī)器學(xué)習(xí)算法預(yù)測(cè)10個(gè)題組的敏感度與特異度均達(dá)到閾值時(shí),采用GBRT、SVR、LASSO、LDA算法簡(jiǎn)化后的量表分別只需要做292、253、243、250道題目。其中LASSO算法在保證較高的敏感度與特異度的條件下所需要做的題目數(shù)量最少。推斷出組內(nèi)簡(jiǎn)化時(shí)LASSO算法更可行。通過LASSO算法簡(jiǎn)化量表,男性測(cè)評(píng)者由原來的399道題目?jī)?yōu)化為250道題目,縮短了37.3%的測(cè)評(píng)時(shí)間,女性測(cè)評(píng)者由原來的399道題目?jī)?yōu)化為243道題目,縮短了39.1%的測(cè)評(píng)時(shí)間。
本研究采用克朗巴哈系數(shù)(Cronbach's α)[19]計(jì)算刪除題目前后的信度變化。如表4所示,4種算法對(duì)于男性測(cè)試者的Hy、Pd、Mf、Pa、Pt、Sc、Ma、Si題組刪除題目后的信度系數(shù)均在0.7以上;Hs、D題組刪除題目后的信度系數(shù)均在0.7以下。Hy、Pd、Mf、Pa、Pt、Sc、Ma、Si題組刪除題目前后的信度系數(shù)變化范圍在0~0.1之間;Hs、D題組變化超過0.1。如表5所示,4種算法對(duì)于女性測(cè)試者的Hy、Mf、Pa、Pt、Sc、Ma、Si題組刪除題目后的信度系數(shù)均在0.7以上;Hs、D題組刪除題目后的信度系數(shù)均在0.7以下;Pd題組通過GBRT算法刪除題目后信度系數(shù)大于0.7,其它3種算法信度系數(shù)均小于0.7。Hs、Hy、Mf、Pa、Pt、Sc、Ma、Si題組刪除題目前后的信度系數(shù)變化范圍在0至0.1之間,D題組變化超過0.1。
3 討論
近些年來,多位學(xué)者提出基于機(jī)器學(xué)習(xí)簡(jiǎn)化量表的方法,例如用于注意力缺陷多動(dòng)障礙行為區(qū)別的社交反應(yīng)量表(Social Responsiveness Scale,SRS)[20]和用于自閉癥診斷的自閉癥診斷觀察量表(Autism Diagnostic Observation Schedule,ADOS)[21],中文雙相情感障礙診斷清單(Bipolar Diagnosis Checklist in Chinese, BDCC)[22] 和基于梯度提升回歸樹的癥狀自評(píng)量表簡(jiǎn)化[23],均是利用機(jī)器學(xué)習(xí)算法分析大量臨床測(cè)評(píng)數(shù)據(jù)訓(xùn)練分類器實(shí)現(xiàn)量表簡(jiǎn)化,并通過對(duì)照簡(jiǎn)化前后結(jié)果的敏感性和特異性以驗(yàn)證其一致性。本研究經(jīng)過題組內(nèi)的篩選,刪除MMPI部分題組內(nèi)的題目,達(dá)到使用部分題目就能夠較為準(zhǔn)確的預(yù)測(cè)出各個(gè)題組陰陽(yáng)性的目的。但是由于男女子氣量表的陽(yáng)性數(shù)據(jù)量不足,機(jī)器學(xué)習(xí)模型無法通過足夠多的陽(yáng)性數(shù)據(jù)學(xué)習(xí)到其中蘊(yùn)含的關(guān)聯(lián)性,是的預(yù)測(cè)結(jié)果不夠準(zhǔn)確,因此還需要盡量收集更多的陽(yáng)性數(shù)據(jù),來提高簡(jiǎn)化量表的準(zhǔn)確性。
4 結(jié)論
本研究對(duì)比6種經(jīng)典機(jī)器學(xué)習(xí)算法的簡(jiǎn)化結(jié)果,發(fā)現(xiàn)LASSO相對(duì)于其他算法預(yù)測(cè)精度更高,適合于區(qū)分高維度和多重共線性的數(shù)據(jù),而MMPI量表中的每個(gè)量表都有33~78個(gè)題目,屬于高維數(shù)據(jù),因而適合采用LASSO算法。LASSO算法對(duì)異常值的魯棒性強(qiáng),可以靈活處理各種類型的數(shù)據(jù),包括連續(xù)值和離散值。在保證組內(nèi)題目預(yù)測(cè)的敏感度與特異度相近的情況下,LASSO算法采用的特征數(shù)量即題目數(shù)量最少、簡(jiǎn)化效果最好。簡(jiǎn)化后的量表與全量表相比,在保證各題組擁有較高信度和測(cè)評(píng)結(jié)果的敏感度與特異度均達(dá)到85%以上的前提下,男性平均減少37.3%的測(cè)評(píng)時(shí)間,女性平均減少39.1%的測(cè)評(píng)時(shí)間。在后續(xù)研究中,可以通過收集更多的MMPI測(cè)評(píng)數(shù)據(jù),嘗試其他算法來訓(xùn)練更精準(zhǔn)模型,從而推動(dòng)基于機(jī)器學(xué)習(xí)在精神科量表簡(jiǎn)化研究與應(yīng)用。
參考文獻(xiàn)
[1] HATHAWAY S R, MCKINLEY J C. A multiphasic personality schedule (minnesota): III. The measurement of symptomatic depression[J]. Journal of Psychology Interdiplinary & Applied, 1942, 14(1):73-84.
[2]紀(jì)術(shù)茂,陳佩璋,紀(jì)亞平,等. MMPI中文版的結(jié)構(gòu)效度研究[J]. 中國(guó)臨床心理學(xué)雜志, 1996(1):20-23.
[3]鄒義壯,趙傳繹. MMPI臨床診斷效度的研究[J]. 中國(guó)心理衛(wèi)生雜志, 1992(5):211-213+238.
[4]楊文雙,王志仁,張小璐,等.新冠肺炎疫情期間封閉管理醫(yī)護(hù)人員心理健康狀況[J].精神醫(yī)學(xué)雜志,2020,33(2):84-87.
[5]陳祉妍, 劉正奎, 祝卓宏,等. 我國(guó)心理咨詢與心理治療發(fā)展現(xiàn)狀、問題與對(duì)策[J]. 中國(guó)科學(xué)院院刊, 2016, 31(11):1198-1207.
[6]宋維真. 中國(guó)人使用明尼蘇達(dá)多相個(gè)性測(cè)驗(yàn)表的結(jié)果分析[J]. 心理學(xué)報(bào), 1985(4):346-355.
[7]貢京京,苗丹民,肖瑋,等.青年男性MMPI-215F量表應(yīng)答時(shí)間效應(yīng)分析[J].中國(guó)行為醫(yī)學(xué)科學(xué),2006(6):534-535.
[8]HOFFMANN T, DANA R H, BOLTON B. Measured acculturation and MMPI-168 performance of native American adults[J]. Journal of Cross Cultural Psychology, 1985,16(2):243-256.
[9]宋維真,莫文彬. 心理健康測(cè)查表(PHI)的編制過程[J]. 心理科學(xué), 1992(2):36-40.
[10] NEWMARK C S. Brief synopsis of the utility of MMPI short forms[J]. Journal of Clinical Psychology, 1981,37(1):136-137.
[11] TIBSHIRANI R. Regression shrinkage and selection via the Lasso[J]. Journal of the Royal Statistical Society. Series B (Methodological),1996,58(1):273-282.
[12] 郭銀景,宋先奇,楊蕾,等. 基于梯度提升回歸樹的井下定位算法[J]. 科學(xué)技術(shù)與工程, 2019,19(8):143-149.
[13] 于立勇,詹捷輝. 基于Logistic回歸分析的違約概率預(yù)測(cè)研究[J].財(cái)經(jīng)研究,2004(9):15-23.
[14] BREIMAN L. Bagging predictors[J]. Machine Learning, 1996,24(2):123-140.
[15] FISHER R A. The use of multiple measurements in taxonomic problems[J]. Annals of Eugenics, 1936,7(2): 179-188.
[16] ALEX J S, BERNHARD S. A tutorial on support vector regression[J]. Statistics & Computing, 2004,14(3):199-222.
[17] WANG W J, LU Y M. Analysis of the mean absolute error (MAE) and the root mean square error (RMSE) in assessing rounding model[J]. IOP Conference Series: Materials Science and Engineering,2018,324(1):1-5.
[18] 夏朝云. MMPI中國(guó)常模與精神分裂癥及躁狂癥的診斷[J]. 上海精神醫(yī)學(xué), 1992, 4(1):39-41.
[19] 游雅媛. 認(rèn)知診斷Cronbach's α系數(shù)屬性信度點(diǎn)估計(jì)和區(qū)間估計(jì)研究[D]. 南昌:江西師范大學(xué), 2019.
[20] DUDA M, MA R, HABER N, et al. Use of machine learning for behavioral distinction of autism and ADHD[J]. Translational Psychiatry, 2016,6(2):1-3.
[21] WALL D P, KOSMICKI J, DELUCA T F, et al. Use of machine learning to shorten observation-based screening and diagnosis of autism[J]. Translational Psychiatry, 2012,2(4):1-6.
[22] MA Y T, JI J, HUANG Y, et al. Implementing machine learning in bipolar diagnosis in China[J]. Translational Psychiatry, 2019,9(1): 1-7.
[23] 劉金銘,于淏巋,馮超南,等.基于梯度提升回歸樹的癥狀自評(píng)量表(SCL-90)簡(jiǎn)化[J].青島大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,33(2):32-37.
Research on the Validity of Simplifying MMPI Scale Based on Machine Learning
SUN Qi-ke1a, DONG Wen-tian2, WANG Ke3, FENG Chao-nan4, CUI Lin4,
LI Yu-ming4, YU Hao-kui4, YU Bin4, SHI Chuan2, JI Jun1a,1b,4
(1a.College of Computer Science&Technology, b.Medical College,Qingdao University,Qingdao 266071,China;
2.Peking University Sixth Hospital,Beijing 100083,China;3.Qingdao Municipal Hospital,Qingdao 266011,China;
4.Beijing Wanling Pangu Technology Co.,Ltd.,Beijing 100089, China)
Abstract: There are too many questions in the traditional MMPI scale and the subjects' compliance is poor in many application scenarios. A machine learning algorithm is proposed to simplify the clinical scale in the MMPI scale. The simplification effects of six classical machine learning algorithms are compared, and the sensitivity and specificity of the original and simplified evaluation results are compared and analyzed on the subject evaluation data. The experimental results show that the algorithm using the minimum absolute contraction and selection operator (LASSO) has the best simplification effect while keeping similar accuracy to reduce the number of subjects by 37.3% for men and 39.1% for women on average, keep the sensitivity and specificity of the simplified evaluation results at 85% of the original evaluation results, thus shortening the evaluation time and being suitable for more application scenarios.
Keywords:
MMPI; machine learning; shorten scale