国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

人工智能透過言語語言識(shí)別精神障礙

2023-07-17 04:22:38丁紅衛(wèi)
關(guān)鍵詞:精神障礙言語語音

丁紅衛(wèi)

摘 ? 要: 針對(duì)精神衛(wèi)生領(lǐng)域目前面臨缺乏早期診斷產(chǎn)品的困境,文章提出使用人工智能分析語言數(shù)據(jù)識(shí)別心理健康問題將是一項(xiàng)可行的方案。神經(jīng)科學(xué)的研究發(fā)現(xiàn),語言是精神的窗戶。以常見的抑郁癥和典型的精神分裂癥為例,表明機(jī)器學(xué)習(xí)可以通過分析語音文字及多模態(tài)的語言參數(shù)進(jìn)行智能診斷。一場(chǎng)突如其來的新冠疫情不僅使人們更加清晰地意識(shí)到精神健康的重要性,也讓人們深刻地認(rèn)識(shí)到可遠(yuǎn)程采集的語言數(shù)據(jù)作為精神障礙早期篩查資源具有獨(dú)特的優(yōu)勢(shì)。隨著移動(dòng)設(shè)備不斷普及,利用語言數(shù)據(jù)監(jiān)測(cè)心理健康的前景更加廣闊。然而語音語言數(shù)據(jù)要成為診斷精神障礙的生物標(biāo)記物,還面臨算法評(píng)估與臨床驗(yàn)證的挑戰(zhàn)。人工智能的發(fā)展需要遵循以人為本的理念。

關(guān)鍵詞: 精神障礙;孤獨(dú)癥(自閉癥);老年癡呆;語音語言數(shù)據(jù);計(jì)算精神醫(yī)學(xué);情感計(jì)算;心理健康

中圖分類號(hào): TP18 ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1004-8634(2023)04-0024-(11)

DOI:10.13852/J.CNKI.JSHNU.2023.04.003

一、引言

習(xí)近平總書記指出,“沒有全民健康,就沒有全面小康”,而精神健康一直是人類健康的重要組成部分。但是現(xiàn)代社會(huì)中的各類問題隨時(shí)都會(huì)給人帶來各種精神困擾,一旦處理不好,很可能導(dǎo)致心理和精神問題。精神障礙是大腦機(jī)能發(fā)生紊亂導(dǎo)致認(rèn)知、情感、行為等精神活動(dòng)障礙的總稱,既包括中青年期可能出現(xiàn)的焦慮與抑郁障礙,也包括兒童期發(fā)現(xiàn)的自閉傾向與老年期容易出現(xiàn)的智退現(xiàn)象。1 新的調(diào)查顯示,青少年抑郁癥發(fā)病率逐年上升;兒童被診斷為孤獨(dú)癥2 的人數(shù)在顯著增加;而伴隨人類平均壽命延長(zhǎng),老年癡呆癥患者人數(shù)也大幅上升。包括各類神經(jīng)類和精神類疾病在內(nèi)的腦相關(guān)疾病已經(jīng)超過了心血管疾病與癌癥,成為所有疾病中社會(huì)負(fù)擔(dān)最大的疾病。3 由于目前有關(guān)腦疾病治療還面臨致病機(jī)理不清楚、藥物研發(fā)緩慢、失敗率高等問題,研發(fā)各種腦疾病早期診斷智能產(chǎn)品并進(jìn)行早期干預(yù)將有助于阻止或減緩疾病的發(fā)生。2021年上海交通大學(xué)攜手《科學(xué)》雜志發(fā)布的125個(gè)新科學(xué)問題里面也將“我們是否能更有效地診斷和治療復(fù)雜的精神障礙”列為人類目前與未來將致力于解決的最具挑戰(zhàn)性的問題之一。1

近年來,隨著分子生物學(xué)與影像學(xué)等學(xué)科的快速發(fā)展,相關(guān)研究在精神衛(wèi)生領(lǐng)域也取得了諸多研究成果。但中國(guó)疾病控制中心精神衛(wèi)生中心主任陸林院士指出,“目前,精神障礙的診斷缺乏客觀、可定量的生物標(biāo)記物(biomarker)”,2 主要依據(jù)國(guó)際疾病分類標(biāo)準(zhǔn)、精神障礙診斷與統(tǒng)計(jì)手冊(cè),3由有經(jīng)驗(yàn)的醫(yī)生問診進(jìn)行判斷。這也表明長(zhǎng)期以來語言為診斷精神障礙提供了重要信息。臨床經(jīng)驗(yàn)豐富的精神科醫(yī)師通過語言這個(gè)窗口能夠評(píng)估患者的心理健康狀況。由于人的精神狀態(tài)往往是從語言行為中表現(xiàn)出來的,而且相對(duì)腦影像等數(shù)據(jù),語言數(shù)據(jù)具有采集便捷等優(yōu)點(diǎn),是計(jì)算精神醫(yī)學(xué)中比較容易大規(guī)模開展的研究對(duì)象。語言數(shù)據(jù)作為診斷精神障礙的新型數(shù)字生物標(biāo)記物也具備非常好的發(fā)展?jié)摿Α? 研發(fā)大規(guī)模的精神障礙早期診斷技術(shù)需要依賴人工智能。人工智能是“利用數(shù)字計(jì)算機(jī)或者數(shù)字計(jì)算機(jī)控制的機(jī)器模擬、延伸和擴(kuò)展人的智能,感知環(huán)境、獲取知識(shí)并使用知識(shí)獲得最佳結(jié)果的理論、方法、技術(shù)及應(yīng)用系統(tǒng)”。5 受益于計(jì)算機(jī)技術(shù)的快速發(fā)展,人工智能在諸多垂直領(lǐng)域已有非常成熟的應(yīng)用。雖然人工智能在精神衛(wèi)生領(lǐng)域的應(yīng)用還處于起步階段,但正影響著精神障礙的評(píng)估、預(yù)測(cè)、治療和康復(fù)方式。人工智能科學(xué)家使用數(shù)據(jù)挖掘技術(shù),結(jié)合語言學(xué)與精神科知識(shí),可以對(duì)語言數(shù)據(jù)(包括語音、語義、詞匯、句法等)、副語言數(shù)據(jù)(譬如情緒韻律、面部表情、肢體動(dòng)作),以及語言相關(guān)數(shù)據(jù)中所蘊(yùn)含的生物及社會(huì)認(rèn)知信息等進(jìn)行分析與建模,從而對(duì)精神障礙做到精準(zhǔn)預(yù)測(cè)與評(píng)估。

二、言語語言6 表達(dá)精神狀態(tài)

語言是洞察人類天性之窗,7 是人們表達(dá)思想和情感的媒介。人們通過言語交流傳情達(dá)意,交流思想。我們言語中的語音語調(diào)、詞匯搭配、語句長(zhǎng)度、語義邏輯都是理解對(duì)方思想的關(guān)鍵線索。語言也是人們大腦功能重要的外在表現(xiàn)形式。精神障礙患者大腦機(jī)能發(fā)生紊亂,便會(huì)在言語交流中表現(xiàn)出思維紊亂及語言異常。語言一直是人們洞察心理健康的窗口。8 當(dāng)精神科醫(yī)生問診時(shí),他們會(huì)傾聽這些言語語言信號(hào)來獲取患者的精神健康狀況,再憑借其淵博的專業(yè)學(xué)識(shí)與豐富的臨床經(jīng)驗(yàn)來形成對(duì)病情的判斷。

1.思維紊亂的語言表現(xiàn)及其評(píng)估

一般說來,精神障礙個(gè)體的思維出現(xiàn)了問題,便能通過很多語言特征表現(xiàn)出來。以典型的精神分裂癥為例,根據(jù)美國(guó)精神障礙診斷與統(tǒng)計(jì)手冊(cè)DSM-5(英文全稱Diagnostic and Statistical Manual of Mental Disorders, 5th Edition),診斷標(biāo)準(zhǔn)必須具有5個(gè)特征性癥狀的兩項(xiàng)以上,其中前3項(xiàng)陽性癥狀(即幻覺、妄想、思維或言語紊亂)中至少有一項(xiàng)符合。而這前3項(xiàng)可從患者語言中反映出來。后2項(xiàng)癥狀(即有明顯紊亂或緊張癥行為的陽性癥狀,以及如情感受限等陰性癥狀)則可能從言語行為的語音韻律中顯露出來。

早在1908年,瑞士精神醫(yī)學(xué)家布洛伊勒第一次提出了“精神分裂癥”這個(gè)概念,用來描述人格、思想、記憶、知覺之間的功能分離時(shí),就注意到這種思維障礙是如何從語言中表現(xiàn)出來的。1 臨床上已有專門評(píng)定思維、語言和交流問題癥狀嚴(yán)重程度的量表TLC(英文全稱Thought, Language and Communication)。2 TLC包括18項(xiàng)指標(biāo):(1)言語貧乏;(2)言語內(nèi)容貧乏;(3)言語擠壓;(4)離題言語;(5)“擦邊”言語;(6)語言脫軌;(7)言語不連貫;(8)思維邏輯障礙;(9)音聯(lián);(10)詞語新作;(11)字詞近似的用法;(12)病理性贅述;(13)談話主題缺失;(14)持續(xù)言語;(15)模仿言語;(16)言語中斷;(17)矯飾語言;(18)自我參照的言語。評(píng)分按照5級(jí)從0分(無癥狀)到4分(極重度)。定式訪談提綱包括不受干擾的談話和回答問題,開始時(shí)讓訪談對(duì)象在不受任何干擾的情況下介紹自己,時(shí)間不少于5分鐘;然后選擇有關(guān)個(gè)人、家庭和既往史提問。一般完成TLC評(píng)定約需45分鐘,中文譯本量表僅對(duì)訪談中個(gè)別問題依據(jù)中國(guó)文化背景進(jìn)行了修正。劉登堂和徐一峰的研究表明中文版本TLC有較好的內(nèi)在和外在信度,與陽性和陰性癥狀量表PANSS(英文全稱Positive and Negative Syndrome Scale)的總分、陽性量表分、思維障礙分、認(rèn)知因子和興奮因子等均呈顯著相關(guān),具有較好的效度。3

TLC的普適性歸功于科學(xué)的理論框架與有效的臨床驗(yàn)證。首先,TLC制定的理論依據(jù)是精神障礙人群存在認(rèn)知過程的異常,而內(nèi)在的精神問題起源會(huì)導(dǎo)致外在的語言混亂。通過觀察患者語言及言語行為有望輔助診斷內(nèi)在的心理精神問題。其次,精神障礙核心表現(xiàn)的思維紊亂并非單一癥狀表現(xiàn),而是由不同的語言問題/緯度組成。為了能涵蓋所有精神障礙引起的語言異常現(xiàn)象,TLC包含了12項(xiàng)交流障礙、4項(xiàng)語言障礙和2項(xiàng)思維障礙。這些分類在臨床驗(yàn)證中有很好的信度與效度。TLC中的諸多項(xiàng)目,如言語不連貫、詞語新作、模仿言語等癥狀也適用于其他精神障礙如老年癡呆與孤獨(dú)癥等。從語言學(xué)角度來看,TLC也涵蓋了語言學(xué)的主要分支,如音系的韻律單調(diào)乏味,形態(tài)的奇異語詞新作,句法的復(fù)雜句式減少,語義的找詞選詞困難,語用的脫軌離題話語等。而這些外顯語言方面的問題正是其內(nèi)在大腦認(rèn)知機(jī)能出現(xiàn)異常的表現(xiàn)。因此,TLC不僅可以用來評(píng)定精神分裂癥患者,而且也可以應(yīng)用于抑郁及雙向情感障礙等其他精神障礙的語言行為評(píng)定。

2.語言異常的腦機(jī)制研究

隨著生物科學(xué)與認(rèn)知神經(jīng)科學(xué)等現(xiàn)代科學(xué)技術(shù)的迅速發(fā)展,人們通過實(shí)驗(yàn)手段進(jìn)一步證實(shí)了“人類的言語語言反映了大腦的健康狀態(tài)”這一論斷的科學(xué)性。近年來,《自然》與《科學(xué)》等權(quán)威學(xué)術(shù)期刊上的研究論文從腦科學(xué)方面揭示了語言與大腦之間的密切聯(lián)系。越來越多的研究表明,人類用語言反映思維,人類的大腦已經(jīng)是語言化的大腦。4

腦成像技術(shù)不但說明語言各層面在大腦中都有相應(yīng)的加工區(qū)域與神經(jīng)回路,而且發(fā)現(xiàn)精神障礙人群的思維紊亂以及語言混亂往往與語言網(wǎng)絡(luò)中的結(jié)構(gòu)和功能異常密切相關(guān)。一項(xiàng)針對(duì)精神分裂癥的思維紊亂與腦成像關(guān)系的系統(tǒng)綜述研究整合了61項(xiàng)研究結(jié)果,顯示患者額下回、顳上回、下頂葉存在缺陷。這些腦區(qū)在靜息態(tài)功能磁共振成像研究中表現(xiàn)出過度活躍,而在功能磁共振成像的語義加工或自由言語產(chǎn)出研究中表現(xiàn)出過多或過少活動(dòng)的異?,F(xiàn)象。此外,擴(kuò)散張量成像研究則表明連接語言網(wǎng)絡(luò)的額葉與顳頂葉的纖維束白質(zhì)也出現(xiàn)病變。5 精神分裂癥不僅在大腦語言加工的神經(jīng)網(wǎng)絡(luò)出現(xiàn)病變,在大腦感知語言的區(qū)域也出現(xiàn)異常。一項(xiàng)神經(jīng)生理學(xué)綜述研究,綜合了近年來使用具有毫秒級(jí)高時(shí)間分辨率的腦電圖和腦磁圖儀器研究精神分裂癥語言加工的權(quán)威文獻(xiàn),結(jié)果顯示,精神分裂癥患者的聽覺、語言與記憶皮層皆受到嚴(yán)重?fù)p壞;特別是在言語感知與語言加工過程中出現(xiàn)相互關(guān)聯(lián)的神經(jīng)震蕩缺陷,從而發(fā)生語言感知與理解異常。1 語言加工腦影像的臨床研究進(jìn)一步發(fā)現(xiàn),語言加工異常不僅能輔助診斷精神障礙,而且能預(yù)測(cè)其發(fā)生的概率。精神障礙高危人群相對(duì)正常對(duì)照組在加工自然話語時(shí),相關(guān)大腦語言區(qū)域網(wǎng)絡(luò)(如雙側(cè)大腦內(nèi)側(cè)前額葉皮質(zhì)、左側(cè)額下回和顳中回以及前扣帶回)顯示出神經(jīng)活動(dòng)增強(qiáng)現(xiàn)象,而與語言加工相關(guān)的顳上回、尾狀核、左側(cè)額下回區(qū)域的神經(jīng)活動(dòng)增加程度則可預(yù)測(cè)數(shù)月后轉(zhuǎn)化為精神障礙的概率。2

3.語言情感的相互交融

盡管TLC有著較好的適用性,但TLC中的語法語用等評(píng)估并不能完全概括精神障礙人群語言表現(xiàn)出的所有問題,語言表現(xiàn)出的社會(huì)認(rèn)知(social cognition)3 問題也應(yīng)該歸于言語交流障礙,其中情感加工尤其重要,在臨床研究中表現(xiàn)出與語言交流障礙顯著相關(guān)。4

語言不僅能交流信息,更能傳遞情感。如果要充分利用語言相關(guān)信息來洞察人的精神狀態(tài),除了關(guān)注語言的音系、形態(tài)、句法、語義等語法問題,以及交際意圖等的語用問題,還應(yīng)關(guān)注交際互動(dòng)時(shí)語氣、眼神、手勢(shì)、身體姿態(tài)等其他副語言信息傳達(dá)的社會(huì)認(rèn)知信息。在言語交流中,文字中的語義情感與語音中的韻律情感相互交融,是否能正確理解與表達(dá)情感也與大腦的語言、認(rèn)知與情緒加工的神經(jīng)網(wǎng)絡(luò)相關(guān)聯(lián)。而精神障礙的核心問題如認(rèn)知、情感、行為等精神活動(dòng)障礙往往可以從情感語言的理解中表現(xiàn)出來。筆者的團(tuán)隊(duì)通過對(duì)主要精神障礙人群韻律情感感知領(lǐng)域的系統(tǒng)綜述分析發(fā)現(xiàn):精神分裂癥人群、5 抑郁與雙相情感障礙6 以及孤獨(dú)癥人群7 在韻律情感感知方面與正常人群存在顯著差異。如果結(jié)合面部表情等多模態(tài)信息,言語情感的感知能更好地區(qū)分精神分裂癥、8 孤獨(dú)癥等精神障礙。9 已有的神經(jīng)心理學(xué)研究表明,精神障礙人群由于認(rèn)知情感相關(guān)的大腦神經(jīng)受損,在情感語言理解中出現(xiàn)偏誤,在實(shí)際言語交流中也出現(xiàn)情感語言表述異常。精神科醫(yī)生正是通過問診來捕捉這些體現(xiàn)在言語交流中的異常從而做出診斷,而人工智能則是學(xué)習(xí)有經(jīng)驗(yàn)醫(yī)生的分析方法,從言語語言數(shù)據(jù)中提取相關(guān)信息,進(jìn)而做出判斷。此外,也有研究表明,僅使用心理量表不能完全捕捉到人類話語的豐富性,特別是未能考慮文化情感等對(duì)精神病理學(xué)的影響。而利用人工智能與機(jī)器學(xué)習(xí)卻能夠從語音中捕捉到細(xì)微的聲學(xué)參數(shù),從語音轉(zhuǎn)寫的文字中計(jì)算出語義連貫性,從而能夠更全面地利用語言行為中表現(xiàn)出來的社會(huì)認(rèn)知,更加精確地識(shí)別精神障礙。10 因此,正如有學(xué)者敏銳地指出的,語音語言數(shù)據(jù)不只是診斷精神障礙的生物標(biāo)記物,更是生物社會(huì)標(biāo)記物(biosocial marker)。1 言語語言中所反映的社會(huì)認(rèn)知障礙才是語言數(shù)據(jù)的寶貴之處,也是人工智能識(shí)別精神障礙未來的研究方向。

三、人工智能輔助識(shí)別精神障礙

由于目前精神障礙的診斷主要靠有經(jīng)驗(yàn)的精神科醫(yī)生通過逐個(gè)臨床問診進(jìn)行判斷,加之長(zhǎng)期以來人們對(duì)精神障礙問題重視不夠,還有更多有輕微癥狀的人群并未主動(dòng)來醫(yī)院就醫(yī),這就讓疾病的診斷變得緩慢且被動(dòng)。若能使用人工智能產(chǎn)品及早預(yù)測(cè)到精神疾患潛在的發(fā)病危險(xiǎn),及時(shí)采取有效措施進(jìn)行干預(yù),就能把疾病控制在萌芽狀態(tài)。盡管磁共振成像和功能性近紅外光譜等技術(shù)的應(yīng)用在很大程度上能夠輔助傳統(tǒng)的精神障礙問診診斷。但若要對(duì)那些還未能來醫(yī)院就診的潛在人群進(jìn)行預(yù)測(cè),尤其是大面積篩查,腦影像等生物數(shù)據(jù)的采集難以做到,而語言數(shù)據(jù)則可以滿足這個(gè)需求。語言數(shù)據(jù)能反映大腦健康狀況,而且可以廉價(jià)、遠(yuǎn)程、非侵入性地獲得,可作為精神障礙人群人工智能早期篩查的潛在資源。因此,針對(duì)精神障礙人群語音語言數(shù)據(jù)的人工智能研究也悄然興起。

由于現(xiàn)代語音技術(shù)可以精確地記錄人的言語,而語音語調(diào)能直接反映出人的情緒變化,語音分析便成為最早應(yīng)用于精神障礙診斷中的智能手段;隨著語音識(shí)別等技術(shù)不斷成熟,計(jì)算語言學(xué)家們通過將語音轉(zhuǎn)化為文字,進(jìn)一步分析詞匯、句法、篇章方面的特征,可以發(fā)現(xiàn)精神障礙患者情緒與思維等方面的問題;而借助先進(jìn)的圖像處理技術(shù),科學(xué)家們還可以通過面部表情和動(dòng)作手勢(shì)來分析說話人的情緒狀態(tài)。因?yàn)檎Z言的表達(dá)也是多模態(tài)的,綜合語音、文字與動(dòng)作表情的多模態(tài)語言數(shù)據(jù)能更加全面地反映人的精神狀態(tài)。將采集的多模態(tài)語言及副語言信息與有經(jīng)驗(yàn)的精神科專家的診斷結(jié)果相關(guān)聯(lián),可以學(xué)習(xí)到原本只有訓(xùn)練有素的精神醫(yī)學(xué)家才能從言語交流當(dāng)中捕捉到的心理健康問題。

用于機(jī)器學(xué)習(xí)的語言數(shù)據(jù)通常來源于精神科醫(yī)生的問診記錄以及各類為此研究專門收集的語音等多模態(tài)語料庫。2 人工智能專家通?;谡Z言學(xué)已有的研究結(jié)果,先提取語音或文字中重要的參數(shù),然后將精神障礙人群與正常對(duì)照人群的各類參數(shù)進(jìn)行比較,通過深度學(xué)習(xí)等算法分析語言數(shù)據(jù),學(xué)習(xí)精神科醫(yī)生的診斷結(jié)果。目前的學(xué)術(shù)研究經(jīng)常是將已有的數(shù)據(jù)庫分成訓(xùn)練集與測(cè)試集兩部分,用訓(xùn)練數(shù)據(jù)獲得的最佳算法,去推斷測(cè)試數(shù)據(jù)的結(jié)果,并與醫(yī)生的診斷結(jié)果相比較來評(píng)估算法的精確度。而相關(guān)的應(yīng)用程序則是通過大量的語言數(shù)據(jù)來學(xué)習(xí)已有的醫(yī)生診斷結(jié)果,去預(yù)測(cè)新的語言數(shù)據(jù)是否呈現(xiàn)精神障礙特有的語音及語言現(xiàn)象,從而給出機(jī)器的自動(dòng)診斷結(jié)果。如同人工智能對(duì)口語與作文的自動(dòng)評(píng)分無法完全代替人工評(píng)分,其對(duì)精神障礙的評(píng)分目前也只可以作為一個(gè)輔助的方式,還無法代替醫(yī)生的診斷。但是由于語言數(shù)據(jù)具備針對(duì)精神障礙進(jìn)行大規(guī)模早期篩查的獨(dú)特優(yōu)勢(shì),從而也促使語言學(xué)、人工智能與精神科的專家進(jìn)行跨學(xué)科合作,不斷改進(jìn)利用語言數(shù)據(jù)來識(shí)別精神障礙的精準(zhǔn)性。

1.語音韻律診斷

由于人的語音當(dāng)中包含了很多書面語言所不具備的表情達(dá)意的情緒信息以及與生理相關(guān)的生物學(xué)信息,語音信號(hào)的情感計(jì)算已用于診斷很多精神障礙。2020年,哈佛大學(xué)醫(yī)學(xué)院與麻省理工學(xué)院腦與認(rèn)知科學(xué)系的科學(xué)家對(duì)語音自動(dòng)診斷精神障礙方面的文獻(xiàn)做了一項(xiàng)綜述研究。3 他們從數(shù)據(jù)庫中找到1395篇近幾年發(fā)表的相關(guān)論文,并從中篩選出127篇進(jìn)行進(jìn)一步分析。結(jié)果表明,近一半的研究與抑郁癥診斷(48.6%)有關(guān),排在第二、第三位的分別是精神分裂癥(18.1%)與雙相障礙(16.5%)的診斷。近年來,患病率上升相對(duì)較快的抑郁癥是使用語音參數(shù)進(jìn)行診斷研究最多的精神障礙。

據(jù)2018年世界衛(wèi)生組織公布的數(shù)據(jù),全球有3億多人遭抑郁癥的困擾。而且很多患者是中青年群體,不但給病患個(gè)人及其家庭帶來了極大的痛苦,也給社會(huì)造成了巨大損失。根據(jù)精神障礙診斷與統(tǒng)計(jì)手冊(cè)的診斷標(biāo)準(zhǔn),兩周以內(nèi)幾乎每天的大多數(shù)時(shí)間出現(xiàn)持續(xù)的抑郁情緒或興趣快感缺失、體重驟降或驟升、疲憊乏力等幾大癥狀的五種以上,即可被診斷為抑郁。抑郁障礙表現(xiàn)出高患病率、高致殘率、高復(fù)發(fā)率和高自殺率的特點(diǎn),是當(dāng)今社會(huì)中突出的精神健康問題。因此,將人工智能的語音診斷產(chǎn)品用于抑郁癥的早期診斷成為當(dāng)務(wù)之急。

人們進(jìn)行語音產(chǎn)出時(shí),所需的運(yùn)動(dòng)神經(jīng)纖維間的配合要比人類其他活動(dòng)更多。語音產(chǎn)出過程涉及的呼吸系統(tǒng)、發(fā)音聲道、面部口唇等器官的肌肉多達(dá)一百多塊,是非常復(fù)雜的神經(jīng)學(xué)行為。由抑郁引起的大腦神經(jīng)變化也會(huì)在語音產(chǎn)出方面有所表現(xiàn),2015年發(fā)表于語音學(xué)權(quán)威期刊的一篇綜述對(duì)歷年來基于語音評(píng)估抑郁和自殺風(fēng)險(xiǎn)的文獻(xiàn)進(jìn)行了詳細(xì)梳理。1 分析結(jié)果顯示,抑郁癥患者由于在心理生理方面的障礙,與正常人群相比,在語音方面具有以下共同特征:(1)超音段韻律異常:由于心情低落、興趣缺失,表現(xiàn)出單調(diào)的韻律特征,如音強(qiáng)減弱,音域減小,語速減慢,語調(diào)與節(jié)奏的單調(diào)性增強(qiáng);(2)發(fā)聲態(tài)異常:由于聲帶過分緊張,而與之配合的喉部肌肉張力減小,造成聲帶振動(dòng)紊亂;(3)共振峰異常:由于面部肌肉緊張加上舌位運(yùn)動(dòng)幅度減小,使得聲道共振減弱,通常表現(xiàn)為前元音第一共振峰上升,第二共振峰下降;(4)語譜異常:由于抑郁癥患者的聲道與聲帶肌肉過分緊張,影響了聲道的共振濾波功能,經(jīng)常會(huì)產(chǎn)生嘶啞、緊張的嗓音。由于語音的頻譜通常與肌肉張力與控制力密切相關(guān),特別合適捕捉發(fā)音動(dòng)作的詳細(xì)信息。抑郁癥患者在很多頻譜參數(shù)方面都會(huì)出現(xiàn)異常,譬如梅爾倒譜系數(shù)特征結(jié)合高斯混合模型是檢測(cè)是否存在抑郁障礙以及區(qū)分抑郁程度的一種較流行的語音參數(shù)化方法。但這些異常頻譜現(xiàn)象與心理生理的關(guān)聯(lián)性還有待進(jìn)一步考察。目前使用聲學(xué)特征區(qū)分抑郁癥患者和非抑郁癥患者的語音自動(dòng)分析結(jié)果與專家評(píng)估一致性可達(dá)75%—80%;語音分析用于預(yù)測(cè)抑郁高危受試者2年后發(fā)病率的準(zhǔn)確率達(dá)74%。同樣,語音聲學(xué)分析還有可能檢測(cè)出精神障礙早期幻聽的跡象。總之,很多研究表明,語音參數(shù)的變化比其他很多生物特征都更適合作為抑郁癥和自殺傾向的早期篩查與預(yù)測(cè)的指標(biāo)。

語音數(shù)據(jù)除了可以自動(dòng)識(shí)別抑郁癥以外,還被廣泛應(yīng)用于其他精神障礙,如老年癡呆、精神分裂癥和孤獨(dú)癥等。特別是老年癡呆的自動(dòng)識(shí)別更是吸引了眾多的人工智能專家。2 國(guó)際語音領(lǐng)域頂級(jí)會(huì)議Interspeech自2020年開始,由卡內(nèi)基梅隆大學(xué)與愛丁堡大學(xué)的語音學(xué)家聯(lián)合發(fā)起國(guó)際阿爾茨海默癥識(shí)別競(jìng)賽。而2021年召開的第16屆全國(guó)人機(jī)語音通信學(xué)術(shù)會(huì)議,也啟動(dòng)了由高校與企業(yè)聯(lián)合組織的阿爾茲海默綜合癥識(shí)別競(jìng)賽。這些競(jìng)賽不僅關(guān)注老年癡呆癥的識(shí)別,更關(guān)注老年癡呆到來之前的輕度認(rèn)知障礙的識(shí)別,期望能夠盡早研發(fā)出有臨床應(yīng)用的智能產(chǎn)品。

2.語言文字診斷

這里的語言文字既包括口語轉(zhuǎn)寫的文字,也包括直接書寫的文字。語言文字中的詞語選擇也能精確地反映人的心理健康狀況。比較悲觀的人傾向于使用孤獨(dú)、傷心、郁悶等消極情緒的詞匯,比較樂觀的人則更多使用諸如開心、高興、幸福等積極情緒的詞語。在文本分析中,除了研究詞匯表述的情緒,量化語言語義豐富度也是預(yù)測(cè)精神障礙的一項(xiàng)重要指標(biāo)。而通過招募精神分裂癥譜系障礙和情緒障礙患者與健康被試的臨床對(duì)照研究,證實(shí)了Facebook上發(fā)帖的語言與圖片可以被認(rèn)作其心理狀態(tài)的客觀信號(hào)。3

計(jì)算語言學(xué)研究精神障礙人群的語義往往注重測(cè)量詞匯間語義連貫性,而來自由哈佛等大學(xué)的科學(xué)家2019年發(fā)表的一項(xiàng)研究,針對(duì)精神分裂癥語義空洞的特征,著重關(guān)注語言的語義密度。1他們使用矢量分解技術(shù)處理句子中的單詞,使得單詞語義之間差異的大小能通過“語義空間”中的距離遠(yuǎn)近得以呈現(xiàn)。研究使用來自Reddit社交平臺(tái)3萬多用戶的帖子構(gòu)建了一種檢測(cè)語義密度的算法基線,并將這些信息與臨床實(shí)驗(yàn)數(shù)據(jù)進(jìn)行比較。結(jié)果表明,只需要對(duì)語義密度和聲音相關(guān)詞匯這兩種語言變量進(jìn)行自動(dòng)分析,就可以預(yù)測(cè)一個(gè)有風(fēng)險(xiǎn)的受試者是否會(huì)發(fā)展成為精神障礙患者。臨床實(shí)驗(yàn)中研究者招募了40名受試者參加為期兩年有隨訪的實(shí)驗(yàn),并將受試者訪談的言語轉(zhuǎn)換為文本,輸入上述基線算法系統(tǒng)。受試者中30名的文本作為訓(xùn)練數(shù)據(jù)(其中有7名之后發(fā)展成為精神障礙),剩余10名的文本作為測(cè)試驗(yàn)證數(shù)據(jù)(其中有5名之后發(fā)展成為精神障礙)。若將語義密度和聲音相關(guān)詞匯作為預(yù)測(cè)指標(biāo),使用驗(yàn)證數(shù)據(jù)集的預(yù)測(cè)準(zhǔn)確率達(dá)90%以上。他們發(fā)現(xiàn)更頻繁地使用與聲音相關(guān)的單詞(由于患者出現(xiàn)幻聽癥狀)和低語義密度或模糊性語言(由于思維受損)的受試者將來出現(xiàn)精神障礙的可能性更大。雖然參加臨床實(shí)驗(yàn)的受試者人數(shù)還比較有限,但是該項(xiàng)目由于針對(duì)精神分裂癥幻聽的陽性癥狀與語言內(nèi)容貧乏的陰性癥狀展開研究,能較精準(zhǔn)地預(yù)測(cè)精神障礙的發(fā)生概率。而且神經(jīng)科學(xué)研究也進(jìn)一步將言語語言與大腦影像數(shù)據(jù)相結(jié)合,發(fā)現(xiàn)精神障礙人群的句法語義等言語語言方面關(guān)聯(lián)度較低與他們腦神經(jīng)連接障礙高度相關(guān)。2計(jì)算精神醫(yī)學(xué)中的語言研究不斷取得新的進(jìn)展,讓我們更加有信心將語言分析作為精神障礙早期檢測(cè)手段之一。

3.多模態(tài)綜合診斷

若將口語的語音與轉(zhuǎn)寫的文字相結(jié)合,相較于單獨(dú)使用其中一項(xiàng),預(yù)測(cè)評(píng)估的準(zhǔn)確率會(huì)有明顯提高。3 而多模態(tài)智能預(yù)測(cè)與評(píng)估進(jìn)一步將語音文字與輔助語言表達(dá)的面部表情、注視模式、動(dòng)作手勢(shì)等相結(jié)合,其預(yù)測(cè)評(píng)估的精準(zhǔn)度可與有經(jīng)驗(yàn)的精神科專家相媲美。4 使用多模態(tài)的方式識(shí)別評(píng)估抑郁癥也同時(shí)引起了學(xué)術(shù)界與工業(yè)界的重視,科學(xué)家聯(lián)手企業(yè)家共同研發(fā)利用多模態(tài)語言資源的人工智能產(chǎn)品,用于預(yù)測(cè)精神障礙風(fēng)險(xiǎn),并促進(jìn)產(chǎn)品轉(zhuǎn)換。從2011年起,由國(guó)際知名大學(xué)發(fā)起每年一次的視聽覺情感計(jì)算挑戰(zhàn)賽(Audio-Visual Emotion Challenge),這是情感計(jì)算領(lǐng)域公認(rèn)的頂級(jí)國(guó)際競(jìng)賽。該挑戰(zhàn)賽近幾年將“抑郁、情緒和情感”作為視聽情感的挑戰(zhàn)內(nèi)容之一,進(jìn)一步促進(jìn)了將語言作為評(píng)估預(yù)測(cè)精神障礙工具的國(guó)際研究。5

四、疫情防控凸顯語言優(yōu)勢(shì)

盡管人工智能技術(shù)在使用言語語言診斷或預(yù)測(cè)精神障礙方面的研究不斷深入,但實(shí)際應(yīng)用場(chǎng)景并不多見。而在此次疫情防控的阻擊戰(zhàn)中,語言數(shù)據(jù)驅(qū)動(dòng)的計(jì)算精神醫(yī)學(xué)研究的優(yōu)勢(shì)得到了凸顯。一方面疫情加劇了高危人群心理機(jī)能的混亂,使得精神障礙發(fā)病和復(fù)發(fā)的概率顯著提高。另一方面疫情防控期間人們大量使用社交媒體。這一切無疑都為利用語言數(shù)據(jù)促進(jìn)人工智能發(fā)展開辟了豐富的實(shí)戰(zhàn)場(chǎng)所。

1.疫情引起焦慮情緒

根據(jù)世衛(wèi)組織2022年3月發(fā)布的科學(xué)簡(jiǎn)報(bào),在新冠大流行的第一年,全球焦慮和抑郁患病率大幅增加了25%。1 簡(jiǎn)報(bào)分析疫情導(dǎo)致的社會(huì)隔離使人們?cè)诠ぷ髋c社交活動(dòng)方面受限,加上對(duì)感染和死亡的恐懼,導(dǎo)致焦慮與抑郁情緒激增。世衛(wèi)組織各成員國(guó)也積極采取行動(dòng),向相關(guān)人員提供精神衛(wèi)生和社會(huì)心理支持。2021年世衛(wèi)大會(huì)通過了更新后的《2013—2030年精神衛(wèi)生綜合行動(dòng)計(jì)劃》,進(jìn)一步強(qiáng)調(diào)在突發(fā)公共衛(wèi)生事件中加強(qiáng)精神衛(wèi)生服務(wù)的重要性。

各類學(xué)術(shù)研究也表明新冠疫情暴發(fā)伊始,各類恐慌情緒給很多人造成了不同程度的負(fù)面心理影響。2021年,國(guó)際期刊發(fā)表了國(guó)內(nèi)專家對(duì)新冠肺炎流行期間中國(guó)人的心理狀況及患病率的綜述與元分析。該研究通過對(duì)2019年12月新冠肺炎暴發(fā)至2020年12月期間文獻(xiàn)檢索,發(fā)現(xiàn)有多達(dá)8787篇文章報(bào)道相關(guān)內(nèi)容。研究者對(duì)其中滿足相關(guān)信息的66篇論文進(jìn)行了薈萃分析。分析結(jié)果顯示,在疫情暴發(fā)的早期,應(yīng)急和恐懼癥狀屬于高發(fā)現(xiàn)象;而在疫情流行期間,焦慮和抑郁癥狀持續(xù)高發(fā)。研究最后提醒大家需要警惕持續(xù)的心理健康問題及創(chuàng)傷后應(yīng)激障礙和其他精神障礙的風(fēng)險(xiǎn)。2 在2022年3月《科創(chuàng)中國(guó)·院士開講》中精神醫(yī)學(xué)專家陸林院士也指出,新冠疫情給人類的心理健康帶來了重大影響,而且這種影響將持續(xù)多年。而如何及早發(fā)現(xiàn)、及早干預(yù)是解決問題的關(guān)鍵所在。

2.防控呼喚遠(yuǎn)程服務(wù)

由于疫情防控形勢(shì)嚴(yán)峻,計(jì)算精神醫(yī)學(xué)可利用的影像學(xué)等資源因需要現(xiàn)場(chǎng)采集表現(xiàn)出一定的局限性,因而,可以遠(yuǎn)程采集的語言數(shù)據(jù)成為科學(xué)家關(guān)注的焦點(diǎn)。由于防控隔離需要,線下醫(yī)院門診大幅減少,網(wǎng)上的語言交流急速增長(zhǎng),各類使用語言語音大數(shù)據(jù)信息分析心理狀態(tài)的研究異軍突起。哈佛醫(yī)學(xué)院等多家機(jī)構(gòu)的研究人員通過使用機(jī)器學(xué)習(xí)分析了80多萬個(gè)社交媒介的帖子,并通過帖子特征將發(fā)帖群體進(jìn)行分類。結(jié)果發(fā)現(xiàn),在2020年1月初發(fā)布的有關(guān)新冠疫情的帖子出現(xiàn)峰值。隨著疫情的發(fā)展,有關(guān)經(jīng)濟(jì)壓力、孤獨(dú)之類的群體明顯增多。通過獨(dú)立的有監(jiān)督和無監(jiān)督機(jī)器學(xué)習(xí)分析,結(jié)果顯示,焦慮成為社交平臺(tái)一個(gè)普遍的主題。利用無監(jiān)督聚類,研究者們還發(fā)現(xiàn)了一些與孤獨(dú)和自殺有關(guān)的自然集群出現(xiàn)。而且與前一年同期相比,這些消極的集群中用戶數(shù)量增加了一倍。3 這項(xiàng)研究表明,自然語言處理技術(shù)可以通過社交媒介的文本分析實(shí)時(shí)有效地發(fā)現(xiàn)人們的精神健康問題,準(zhǔn)確地識(shí)別出風(fēng)險(xiǎn)人群,也能夠讓國(guó)家及時(shí)采取措施,為急需幫助的人群提供有效援助。

除了網(wǎng)頁的文字帖子,利用語音與多模態(tài)的診斷也可以通過遠(yuǎn)程采集音視頻信息,進(jìn)行人工智能分析與處理,這在疫情防控期間發(fā)揮出無與倫比的優(yōu)勢(shì)。2022年春季疫情防控期間,各大語音智能公司與高校紛紛研發(fā)抑郁癥的手機(jī)自測(cè)功能,將醫(yī)生的問診通過手機(jī)應(yīng)用程序搬至線上,并由使用語音合成與語音識(shí)別的機(jī)器人模擬醫(yī)生問診與使用者對(duì)話,進(jìn)行線上智能化心理健康測(cè)評(píng)。若有足夠量的使用者參與,焦慮抑郁早期篩查的人工智能產(chǎn)品將得到不斷完善。

五、移動(dòng)設(shè)備助力智能應(yīng)用

盡管人工智能利用語音及文本信息預(yù)測(cè)精神障礙的學(xué)術(shù)研究方興未艾,但語言數(shù)據(jù)是否能成為精神障礙臨床方面診斷的生物標(biāo)記物仍處在探索之中。為了采集更多的數(shù)據(jù)用于智能訓(xùn)練,語音及語言信息識(shí)別精神障礙的智能應(yīng)用程序通常會(huì)安裝在移動(dòng)電子設(shè)備如智能手機(jī)內(nèi)。1 中國(guó)手機(jī)的普及率極高,2023年中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心發(fā)布的第51次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,截至2022年12月,中國(guó)網(wǎng)民規(guī)模達(dá)10.67億,手機(jī)網(wǎng)民達(dá)10.65億,網(wǎng)民使用手機(jī)上網(wǎng)比例高達(dá)99.8%。2 可遠(yuǎn)程采集的語言數(shù)據(jù)與無處不在的智能手機(jī)和社交媒體相結(jié)合,使得語言從未像現(xiàn)在這樣容易被記錄、被數(shù)字化。使用移動(dòng)平臺(tái)或手機(jī)客戶端采集語言數(shù)據(jù),監(jiān)控心理健康狀態(tài),提供心理服務(wù)既有諸多潛在優(yōu)勢(shì),也面臨更多挑戰(zhàn)。

1.潛在的優(yōu)勢(shì)

正如陸林院士指出的,當(dāng)代精神醫(yī)學(xué)的概念已超越了傳統(tǒng)精神醫(yī)學(xué)所涵蓋的范疇,不只重視重性精神障礙,對(duì)輕性精神障礙也愈加關(guān)注。同時(shí)也更加注重一般人群的心理健康,從而減少和預(yù)防各種心理或行為問題的發(fā)生。3 相較于傳統(tǒng)精神醫(yī)學(xué)主要依賴于精神醫(yī)學(xué)家的技能、經(jīng)驗(yàn)和意見的診斷,以人工智能為依托的語言數(shù)據(jù)分析在精神障礙的預(yù)測(cè)與評(píng)估方面具有諸多潛在的優(yōu)勢(shì)。

首先,言語提供了認(rèn)知功能的豐富信息,因此,言語作為生物標(biāo)記,受到眾多精神醫(yī)學(xué)與神經(jīng)退行性疾病相關(guān)研究的青睞。即使是簡(jiǎn)短的語音樣本也可以為認(rèn)知情緒等大腦神經(jīng)活動(dòng)提供可靠的數(shù)據(jù)。而且語音還包括很廣泛的行為信息,特別是自發(fā)對(duì)話中產(chǎn)出的自然語言包含了各類生物及社會(huì)信息。其次,相對(duì)傳統(tǒng)的醫(yī)生問診,語音數(shù)據(jù)屬于數(shù)字生物標(biāo)記物,可以方便記錄與儲(chǔ)存,并能由不同的算法進(jìn)行多次運(yùn)算與驗(yàn)證,能從不同的角度來研究豐富的細(xì)節(jié)。最后,相對(duì)腦影像等先進(jìn)技術(shù),語言數(shù)據(jù)具有遠(yuǎn)程采集的優(yōu)勢(shì)。借助于移動(dòng)設(shè)備與社交平臺(tái)采集語音與語言數(shù)據(jù),使得輕性的精神問題如焦慮抑郁的篩查大面積普及。由于精神障礙人群及對(duì)照人群的語音語言采集特別困難,而通過移動(dòng)設(shè)備測(cè)試的同時(shí)也可以非常便捷地采集海量數(shù)據(jù)。因?yàn)槌掷m(xù)性的監(jiān)測(cè)比零星的臨床訪談評(píng)估能為疾病篩查提供更有用的信號(hào),4 這些大數(shù)據(jù)又為進(jìn)一步改善人工智能的算法提供了真實(shí)環(huán)境中的訓(xùn)練資源。鑒于目前很多有關(guān)精神障礙的學(xué)術(shù)研究及評(píng)估還存在一定局限性:譬如很多評(píng)估方法生態(tài)性較差,通常需要被試者脫離日常生活行為來完成特定的評(píng)估任務(wù);評(píng)估也存在一定偶發(fā)性,包括評(píng)估地點(diǎn)及評(píng)估人員等有限資源的匱乏,使得相關(guān)評(píng)估方法的可拓展性較差。對(duì)于輕性精神障礙患者,家人或熟人因平時(shí)與其有頻繁的言語交流行為,能比偶爾問診的醫(yī)生更早觀察到其心理問題。而移動(dòng)設(shè)備數(shù)據(jù)則能提供持續(xù)性的評(píng)估及監(jiān)測(cè)機(jī)制,人工智能若能通過對(duì)人們平時(shí)的言語行為進(jìn)行監(jiān)測(cè)與評(píng)估,就能為輕性心理問題的早期發(fā)現(xiàn)與干預(yù)提供解決方案。

2.面臨的挑戰(zhàn)

盡管與傳統(tǒng)的診斷方式相比,人工智能對(duì)平日語言交流的采集與分析存在生態(tài)性強(qiáng)、接近現(xiàn)實(shí)、易于推廣等優(yōu)勢(shì),但其臨床應(yīng)用依舊面臨不少挑戰(zhàn)。與其他新型數(shù)字生物標(biāo)記物一樣,言語語言作為精神障礙人群的生物標(biāo)記物目前還缺乏嚴(yán)格的評(píng)估與驗(yàn)證。一般說來,為了能有效和安全地使用這些新型的數(shù)字生物標(biāo)記物,必須滿足V3框架,5 即驗(yàn)證(verification)、分析確認(rèn)(analytical validation)和臨床確認(rèn)(clinical validation)三個(gè)部分。具體到語音數(shù)據(jù),驗(yàn)證包括評(píng)估錄音設(shè)備的聲學(xué)質(zhì)量與周圍環(huán)境對(duì)錄音質(zhì)量的影響;分析確認(rèn)包括對(duì)照參考標(biāo)準(zhǔn),檢查語音參數(shù)的有效性。臨床確認(rèn)包括對(duì)照病情發(fā)展與治療變化,驗(yàn)證相應(yīng)階段語音參數(shù)的有效性。1

第一步驗(yàn)證主要確保錄音設(shè)備與錄音環(huán)境符合要求。有很多研究表明,智能手機(jī)的錄音質(zhì)量可以與專業(yè)麥克風(fēng)相媲美;而另一些研究則發(fā)現(xiàn)智能手機(jī)的錄音在某些參數(shù)方面稍有遜色。另外,不同的錄音設(shè)備在音頻的采樣率、采樣精度及存儲(chǔ)格式方面也各不相同。關(guān)于錄音環(huán)境設(shè)在診所還是實(shí)際生活場(chǎng)景中也有很多研究,不少研究指出背景噪聲不超過50分貝的錄音才能進(jìn)行有效的聲學(xué)分析。以上影響錄音質(zhì)量的因素都需事先進(jìn)行驗(yàn)證,以確保錄音數(shù)據(jù)真實(shí)有效。此外,友好的用戶界面對(duì)于收集豐富的語音數(shù)據(jù)也非常重要,譬如使用錄音提示音,或使用文字與語音的指導(dǎo)語等,可以幫助收集到更加自然有效的數(shù)據(jù)。

第二步分析確認(rèn)必須保證分析的可靠性和有效性。語音語言數(shù)據(jù)處理前需要大量標(biāo)注,自動(dòng)標(biāo)注需要與人工標(biāo)注進(jìn)行比較,以確保一致性與準(zhǔn)確性。而言語可分析的參數(shù)數(shù)量眾多、種類繁多,也需要使用可靠的技術(shù)進(jìn)行準(zhǔn)確分析。常見的聲學(xué)參數(shù)包括基頻、振幅微擾、基頻微擾以及梅爾頻率倒譜系數(shù)等可以通過語音技術(shù)提取與分析;反映詞匯句法或語義語用等更高層次的語言特征則可以使用自然語言處理技術(shù)獲得。由于數(shù)據(jù)處理新算法需要與已有的標(biāo)準(zhǔn)算法進(jìn)行比較,但此前并沒有標(biāo)準(zhǔn)可以參考,也給分析效度驗(yàn)證帶來了一定的難度。而最難之處在于言語語言的各類參數(shù)受年齡性別、受教育程度、方言口音等社會(huì)因素的影響非常大,使得各類語音與語言學(xué)參數(shù)的標(biāo)準(zhǔn)難以確定,也給數(shù)學(xué)建模帶來了巨大困難。正是由于語言數(shù)據(jù)蘊(yùn)含了豐富的社會(huì)性因素,長(zhǎng)期以來一直是醫(yī)生問診診斷可以利用的有效資源。可是如何將語言的社會(huì)性在人工智能語言數(shù)據(jù)處理中得到體現(xiàn)也是聽音識(shí)障礙的挑戰(zhàn)之一。這也同樣說明為什么說語言智能是人工智能皇冠上的明珠,因?yàn)樘幚碚Z言數(shù)據(jù)是人工智能最大的挑戰(zhàn)。如果語言智能能實(shí)現(xiàn)突破,就能推動(dòng)整個(gè)人工智能體系發(fā)展,有更多的場(chǎng)景可以落地。此外,這些語言數(shù)據(jù)的質(zhì)量還取決于語言學(xué)家與心理學(xué)家設(shè)計(jì)的語言任務(wù),而任務(wù)的設(shè)計(jì)又取決于對(duì)精神障礙的了解。因此,需要計(jì)算機(jī)科學(xué)家、語言學(xué)家、心理學(xué)家、精神醫(yī)學(xué)家共同來完善分析確認(rèn)步驟。

第三步臨床確認(rèn)是評(píng)估語言生物標(biāo)記物是否能提供有意義的臨床癥狀變化信息。作為新型的數(shù)字生物標(biāo)記物,要求在診斷疾病的程度,監(jiān)測(cè)疾病的變化,預(yù)測(cè)疾病的發(fā)作,測(cè)量治療反應(yīng)等方面能與已有的臨床經(jīng)驗(yàn)標(biāo)準(zhǔn)進(jìn)行比較。如前所述,因?yàn)槿狈陀^標(biāo)準(zhǔn),目前做法便是將人工智能識(shí)別結(jié)果與有經(jīng)驗(yàn)的精神科醫(yī)生的診斷結(jié)果進(jìn)行比較加以驗(yàn)證。雖然現(xiàn)在越來越多的研究表明,使用語音數(shù)據(jù)識(shí)別抑郁癥、精神分裂癥、孤獨(dú)癥等精神障礙的準(zhǔn)確性可以與??漆t(yī)生相媲美,但我們還需要這些分類算法模型區(qū)分不同的精神障礙,并弄清楚哪些參數(shù)在分類中起了作用。目前很多機(jī)器算法是黑箱模型,只知結(jié)果不知過程。此外,雖然也有很多研究開始使用語音數(shù)據(jù)對(duì)測(cè)試者進(jìn)行跟蹤,預(yù)測(cè)疾病風(fēng)險(xiǎn),評(píng)估疾病進(jìn)展,檢測(cè)治療反應(yīng),但是目前大部分情緒預(yù)測(cè)方面的研究是在實(shí)驗(yàn)環(huán)境中完成的。通過智能手機(jī)或可穿戴設(shè)備獲得的語言交流大數(shù)據(jù)還有待證明其臨床的有效性。2 盡管新冠疫情的防控戰(zhàn)役為人工智能對(duì)語言的分析監(jiān)測(cè)提供了一個(gè)實(shí)戰(zhàn)機(jī)會(huì),但是數(shù)據(jù)所帶來的決策改善以及效率的提高還有待時(shí)間檢驗(yàn)。

除語音語言數(shù)據(jù)作為潛在的精神障礙生物標(biāo)記物需要滿足以上三個(gè)驗(yàn)證過程以外,還會(huì)遇到一些醫(yī)學(xué)倫理問題。很多研究者擔(dān)心把醫(yī)療信息上傳至應(yīng)用程序,對(duì)患者和臨床工作者都有潛在風(fēng)險(xiǎn)。相關(guān)信息一旦被泄露,將對(duì)患者造成更大的打擊。很多倫理學(xué)家擔(dān)心,數(shù)字化的日??梢韵襻t(yī)療信息一樣用來展示人們的精神狀態(tài),卻很難像醫(yī)學(xué)數(shù)據(jù)一樣進(jìn)行保護(hù)與管理。因此,很多專家呼吁,從事人工智能研究的科技人員需要在科研活動(dòng)中采取措施來履行前瞻性的道德責(zé)任。1

綜上所述,在人工智能時(shí)代,需要多學(xué)科專家共同參與提高全民的健康水平,不僅需要精神科醫(yī)生、計(jì)算機(jī)專家、語言學(xué)家等合作來分析人們語言交流信息,研發(fā)精神障礙早期篩查的智能產(chǎn)品,還需要我們有相應(yīng)的隱私法與倫理來確保科技以人為本的理念。只有把科學(xué)技術(shù)與人文精神相結(jié)合,才能確保人工智能透過言語行為識(shí)別精神障礙的可行性,有效提高全民的健康水平與幸福指數(shù)。

Artificial Intelligence Identifies Mental Disorders through

Speech and Language

DING Hongwei

Abstract: In response to the current dilemma of lacking early diagnostic products in the mental health field, the article proposes that using artificial intelligence to analyze linguistic data to identify psychological risks would be a feasible solution. Research in neuroscience has found that language is a window to the mind; taking the common example of depression and classic schizophrenia shows that machine learning can make intelligent diagnoses by analyzing speech-text and multimodal language parameters. A sudden outbreak of COVID-19 has not only increased awareness of the importance of mental health, but also of the unique advantages of remotely collectable language data as a resource for early screening of mental disorders. With the growing popularity of mobile devices, the use of language data to monitor mental health is even more promising. However, speech-language data face challenges of algorithmic evaluation and clinical validation to become a biomarker for diagnosing mental disorders. The development of artificial intelligence needs to follow a human-centered philosophy.

Key words: mental disorders; autism; alzheimers disease; speech-language data; computational psychiatry; affective computing; mental health

(責(zé)任編輯:蘇建軍)

猜你喜歡
精神障礙言語語音
自擬醒腦湯聯(lián)合體外反搏治療癲癇所致精神障礙的效果
言語思維在前,言語品質(zhì)在后
呂魁:難以用言語表述的特定感受
都市(2022年12期)2022-03-04 09:11:46
魔力語音
基于MATLAB的語音信號(hào)處理
電子制作(2019年14期)2019-08-20 05:43:38
奧氮平治療老年2型糖尿病伴發(fā)精神障礙臨床觀察
基于MQ3與MP3的價(jià)廉物美的酒駕語音提醒器
電子制作(2019年9期)2019-05-30 09:42:10
對(duì)方正在輸入……
小說界(2018年5期)2018-11-26 12:43:42
喹硫平與利培酮對(duì)癲癇所致精神障礙療效比較
聯(lián)合用藥治療偏執(zhí)性精神障礙的臨床經(jīng)驗(yàn)研究
武宣县| 华容县| 德庆县| 新野县| 仙居县| 天祝| 防城港市| 安泽县| 彭山县| 斗六市| 江源县| 安远县| 庆云县| 京山县| 来凤县| 定南县| 嵊州市| 夏津县| 上饶市| 丹东市| 通道| 正阳县| 嵊州市| 永和县| 星座| 昌都县| 秭归县| 黄骅市| 阳新县| 弥勒县| 安远县| 万盛区| 邢台市| 石台县| 开阳县| 定远县| 万山特区| 扎赉特旗| 阜平县| 鄯善县| 商洛市|