馮鑫, 郁磊, 許斐, 李陽, 靳禎
(1.山西大學(xué) 復(fù)雜系統(tǒng)研究所,山西 太原 030006;2.山西大學(xué) 疾病防控的數(shù)學(xué)技術(shù)與大數(shù)據(jù)分析山西省重點實驗室,山西 太原 030006;3.山西醫(yī)科大學(xué) 第一臨床醫(yī)學(xué)院,山西 太原 030001;4.山西醫(yī)科大學(xué) 第一醫(yī)院,山西 太原 030001)
Cookie Theft測驗是臨床上常用的測評認知溝通能力的方法[1-4],通過向被試者展示如圖1所示的Cookie Theft圖(取自波士頓失語癥診斷測試),根據(jù)被試者對圖片內(nèi)容的描述進行評估分析.已有的研究大多將Cookie Theft測驗用于阿爾茨海默病(Alzheimer′s disease,AD)患者的語言分析或認知障礙評估[5-8],目前對腦小血管病患者的認知受損方面及語言功能的研究大多采用波士頓命名測驗或動物列名測驗[9-10],而將Cookie Theft測驗應(yīng)用于腦小血管病患者的認知溝通能力測評尚未見諸報道,由于腦小血管病與阿爾茨海默病之間有著密切的關(guān)系[11-12],故本文提出將Cookie Theft測驗用于研究腦小血管病患者的認知溝通能力測評.
在臨床測試中,Cookie Theft測驗通常需要評測人員用錄音設(shè)備對被試者的描述內(nèi)容進行錄音,根據(jù)錄音對被試者描述內(nèi)容的有效信息進行評分,評分結(jié)果很大程度上依賴評測醫(yī)生的經(jīng)驗,評測結(jié)果存在一定的主觀性,為了解決這一問題,本文將Cookie Theft測驗進行了數(shù)字化,以量表的方式呈現(xiàn)給評測醫(yī)生,使評測結(jié)果客觀;其次,對比分析了腦小血管病患者與健康人在Cookie Theft測驗上的表現(xiàn)差異;最后,綜合Cookie Theft測驗時的語音相關(guān)特征和信息量相關(guān)特征,利用人工智能方法建立腦小血管病智能診斷模型.
圖1 Cookie Theft圖
共招募了55名實驗對象參與Cookie Theft測驗,其中健康人30名,腦小血管病患者25名,腦小血管病患者的納入標(biāo)準(zhǔn)如下[13-15]:(1)年齡在50-85歲之間;(2)影像醫(yī)學(xué)上表現(xiàn)為以下任意一種:腔隙性腦梗死、腦白質(zhì)變性或腦微出血;(3)發(fā)病前無精神病史,無情緒障礙,無其他影響認知功能及語言功能的疾病史和外傷史.健康對照組的實驗對象從同時期門診檢查的健康老年人群中遴選產(chǎn)生.他們的基礎(chǔ)信息如表1所示.
表1 腦小血管病組和正常對照組的比較
表2 Cookie Theft圖數(shù)字化量表
如圖1所示,Cookie Theft圖描繪了一個熟悉的家庭場景,有著童年所學(xué)的基本關(guān)鍵詞匯,有著鮮明的人物和地點對比.根據(jù)圖片中的內(nèi)容,將Cookie Theft圖數(shù)字化為量表的形式,如表2所列.被試者描述出人物、地點和物品類別中的每個子項各得一分;在事件任務(wù)中,有動作及動作的對象,故事件得兩分;重復(fù)的表達不二次計分;對于以上量表的計分,不要求逐字逐句對應(yīng),意思一致即可.該量表一共包含22個測試子項,總分為28分.
采用錄音設(shè)備對被試者的描述內(nèi)容進行錄音得到原始語音樣本;對語音樣本進行人工轉(zhuǎn)錄獲取語音的文本.在本文中,提取的特征由如下兩部分組成:
(1)信息量相關(guān)特征:基于Cookie Theft圖數(shù)字化量表提取被試者在無提示語和有提示語兩種情況下各個測試子項的得分及總得分.
(2)語音相關(guān)特征:利用PRAAT軟件提取語音總時長、語音中的沉默時長、主試者及被試者語音的時長、語音中聲波振幅的最大值、最小值、平均值和均方差等.根據(jù)語音的轉(zhuǎn)錄文本得到主試及被試語音的總字數(shù).結(jié)合PRAAT軟件及語音轉(zhuǎn)錄文本提取的特征可計算出被試的語速、語音占總時長的比例、重復(fù)率和停頓率等特征.
圖2和圖3的雷達圖分別描述了腦小血管病組(CSVD)與健康對照組(HC)實驗對象在無提示語和有提示語條件下,在數(shù)字化Cookie Theft測驗量表上的表現(xiàn)對比情況.雷達圖中,每個測試子項的長度代表了在該測試子項上,CSVD組(灰線)和HC組(黑線)中得分的人數(shù)占該組別總?cè)藬?shù)的比例(概率值),譬如:在無提示語條件下的【三個人】測試子項上,從圖中可以看出,HC組中有超過80%的人描述出了該子項信息,而CSVD組中僅有不到30%的人描述出了該子項信息.通過深入對比圖2和圖3,可以得到以下結(jié)果:
圖2 無提示語條件下的數(shù)字化Cookie Theft測驗結(jié)果雷達分析圖
圖3 有提示語條件下的數(shù)字化Cookie Theft測驗結(jié)果雷達分析圖
(1)不論評測過程中主試者是否給出提示語,HC組在絕大多數(shù)測試子項上的得分率均高于CSVD組,表明HC組在Cookie Theft測驗時的表現(xiàn)明顯優(yōu)于CSVD組,即HC組能夠描述出的圖片信息量更多且更全.
(2)當(dāng)評測過程中主試者不提供任何提示語時,HC組在【凳子歪了】、【拿餅干】、【踩凳子】、【盤子】、【母親】、【女孩】、【男孩】和【三個人】等8個測試子項上的得分率顯著高于CSVD組,表明CSVD組在人物及人物關(guān)系、事件信息描述方面較差,在物品信息描述方面與HC組的表現(xiàn)相當(dāng).
(3)當(dāng)評測過程中主試者提供提示信息時,CSVD組和HC組在各個測試子項上的得分率均整體提高,但CSVD組在【踩凳子】、【櫥柜】、【房子】等測試子項上的得分率仍然較小(低于50%),表明CSVD組在這些測試項上容易忽略.
為了實現(xiàn)腦小血管病的智能診斷,基于隨機森林方法建立了機器學(xué)習(xí)模型,從55名實驗對象中隨機抽取38名(~70%)實驗對象作為訓(xùn)練集,剩余的17名(~30%)實驗對象作為測試集.為了對比不同輸入特征對模型性能的影響,分別建立了僅用語音相關(guān)特征、使用語音相關(guān)特征及無提示語條件下的信息量相關(guān)特征、使用語音相關(guān)特征及有提示語條件下的信息量相關(guān)特征作為輸入變量時的智能診斷模型,模型的性能如表3所列.從表中可以看出,與僅用語音相關(guān)特征相比,增加構(gòu)建的Cookie Theft數(shù)字化測驗量表提取的信息量相關(guān)特征作為模型輸入后,模型的識別準(zhǔn)確率顯著增加.值得注意的是,有提示語條件下的信息量相關(guān)特征建立的模型性能優(yōu)于無提示語條件下的信息量相關(guān)特征,與臨床評測過程中應(yīng)可能減少提示語的原則不一致,這是因為,當(dāng)主試者不給出任何提示信息時,CSVD組在許多測試子項上都無法得分,即測試過程無法提取充足的有效信息,從而會導(dǎo)致模型識別準(zhǔn)確率的降低.
表3 不同輸入特征對腦小血管病智能診斷模型性能的影響
為了更加便捷和客觀地評測腦小血管病患者的認知溝通能力,提出了一種基于Cookie Theft測驗的數(shù)字化評測方法.首先,將Cookie Theft測驗數(shù)字化為一個包含四個類別(人物、地點、物品和事件)、22個測試子項、總分為28分的量表;接著,分析對比了腦小血管病患者和健康人分別在無提示語和有提示語條件下的表現(xiàn)差異情況;最后,綜合傳統(tǒng)語音相關(guān)特征及基于Cookie Theft測驗的信息量相關(guān)特征,利用隨機森林方法建立了腦小血管病智能診斷模型,其識別準(zhǔn)確率可達82.4%.