茅榮杰 汪作為 杜亞松
數(shù)據(jù)挖掘技術(shù)在兒童精神醫(yī)學(xué)中的運(yùn)用*
茅榮杰汪作為杜亞松
【摘要】當(dāng)前各種資訊及數(shù)據(jù)信息呈爆炸式增長(zhǎng),如何從中挖掘出有用的知識(shí)成為亟待解決的問(wèn)題,由此數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生,并已開(kāi)始用于兒童精神醫(yī)學(xué)。本文基于國(guó)內(nèi)外數(shù)據(jù)挖掘技術(shù)在兒童精神醫(yī)學(xué)中的發(fā)展?fàn)顩r,簡(jiǎn)要介紹了數(shù)據(jù)挖掘的概念、方法及各種挖掘方法的運(yùn)用現(xiàn)狀,總結(jié)了數(shù)據(jù)挖掘技術(shù)在兒童精神醫(yī)學(xué)中運(yùn)用的不足之處,并對(duì)今后的發(fā)展趨勢(shì)進(jìn)行展望。
【關(guān)鍵詞】數(shù)據(jù)挖掘兒童精神醫(yī)學(xué)信息人工智能
隨著計(jì)算機(jī)技術(shù)和互聯(lián)網(wǎng)的發(fā)展普及,人們能夠輕而易舉地采集到各種資訊,這些資訊及其伴隨的數(shù)據(jù)信息呈爆炸式增長(zhǎng)。兒童精神科醫(yī)師在工作中可以通過(guò)視頻、音頻、量表、病程記錄和日志等獲得多方面的數(shù)據(jù)信息,但是“我們被數(shù)據(jù)淹沒(méi),卻缺乏知識(shí)”[1]。如何透過(guò)紛繁復(fù)雜的數(shù)據(jù)信息尋找其背后的規(guī)律,挖掘出有用的知識(shí)[2],數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生,并已開(kāi)始用于兒童精神醫(yī)學(xué)(研究18周歲以下兒童青少年精神障礙的學(xué)科稱為兒童精神醫(yī)學(xué))。本文就數(shù)據(jù)挖掘技術(shù)在兒童精神醫(yī)學(xué)中的運(yùn)用展開(kāi)綜述。
1.1數(shù)據(jù)挖掘的概念數(shù)據(jù)挖掘(Data Mining,DM)又稱為數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)(Knowledge Discover in Database,KDD),是指運(yùn)用計(jì)算機(jī)等人工智能方法挖掘數(shù)據(jù)庫(kù)中大量數(shù)據(jù)背后潛藏著的有價(jià)值的信息的過(guò)程[1]。通過(guò)數(shù)據(jù)挖掘,數(shù)據(jù)擁有者可以把握事物的發(fā)展規(guī)律并以此來(lái)指導(dǎo)實(shí)踐工作。數(shù)據(jù)挖掘技術(shù)是在統(tǒng)計(jì)分析、模式識(shí)別、機(jī)器學(xué)習(xí)及數(shù)據(jù)庫(kù)技術(shù)等基礎(chǔ)上發(fā)展起來(lái)的一門新興學(xué)科,可以與包括兒童精神醫(yī)學(xué)在內(nèi)的其他學(xué)科相結(jié)合,為其他學(xué)科的發(fā)展提供新的研究方法。
1.2數(shù)據(jù)挖掘的方法數(shù)據(jù)挖掘用來(lái)對(duì)數(shù)據(jù)進(jìn)行描述和預(yù)測(cè)。常用的數(shù)據(jù)挖掘方法如下: (1)數(shù)據(jù)的匯總和表述:其目的是對(duì)數(shù)據(jù)進(jìn)行濃縮,給出它的緊湊描述。比如計(jì)算頻數(shù)、均值、百分比、方差等數(shù)據(jù),還可以運(yùn)用統(tǒng)計(jì)表、直方圖等可視化技術(shù)以便更直觀地了解事物[3]。(2)聚類(Clustering) :是將一個(gè)集中的數(shù)據(jù)劃歸至不同組別。聚類所依據(jù)的規(guī)則是:同一類別內(nèi)的各種數(shù)據(jù)相似性較高,不同類別之間的數(shù)據(jù)相似性較低[4]。最常用的兩種聚類方法是劃分法(包括K均值法等)和系統(tǒng)分類法(又叫層次分類法)。(3)相關(guān)分析:常用來(lái)作相關(guān)分析(Correlation Analysis)的方法有:①關(guān)聯(lián)規(guī)則(Association Rules ) :關(guān)聯(lián)規(guī)則反映了事物之間的關(guān)聯(lián)性,最經(jīng)典的算法是Apriori算法[5]。②貝葉斯網(wǎng)絡(luò)(Bayesian Network) :利用貝葉斯公式對(duì)條件概率等指標(biāo)進(jìn)行計(jì)算,分析事物之間的相關(guān)性。③回歸分析(Regression Analysis) :回歸分析可以用來(lái)描述因變量與一個(gè)或多個(gè)自變量之間的關(guān)系,如線性回歸、Logistic回歸等。(4)分類(Classification) :是一種數(shù)據(jù)分析的過(guò)程,根據(jù)記錄各種屬性的值確定該記錄屬于哪一類[6]。對(duì)于待分類的數(shù)據(jù)能被分到哪幾類必須是預(yù)先確定的,這是與聚類不同的地方。常用的分類方法有決策樹(shù)分類器、貝葉斯分類器、人工神經(jīng)網(wǎng)絡(luò)、近鄰分類器(KNN)、支持向量機(jī)等。(5)回歸分析: (Regression Analysis) :數(shù)學(xué)模型確定后,通過(guò)自變量的值來(lái)預(yù)測(cè)應(yīng)變量,如Logistic回歸、回歸樹(shù)、人工神經(jīng)網(wǎng)絡(luò)等[7]。(6)時(shí)間序列分析:現(xiàn)實(shí)世界中有大量的數(shù)據(jù)在時(shí)序上具有關(guān)聯(lián)性。時(shí)間序列分析(Time series Analysis)就是在數(shù)據(jù)庫(kù)中挖掘出在時(shí)間順序上出現(xiàn)頻率高的數(shù)據(jù)組合模式[8]。(7)異常值監(jiān)測(cè)或偏差分析:數(shù)據(jù)庫(kù)中存在一些明顯偏離常態(tài)的數(shù)據(jù),而這些數(shù)據(jù)背后常常隱藏著某種信息。偏差分析(Outlier Detection)的基本思想就是尋找觀察結(jié)果與參照量之間有意義的差別,再?gòu)倪@些差別中挖掘出有用的信息[9]。
上述挖掘方法中,數(shù)據(jù)的匯總和表述、聚類、相關(guān)分析,通常用來(lái)對(duì)數(shù)據(jù)進(jìn)行描述,屬于描述型的挖掘方法;而分類、回歸分析、時(shí)間序列分析、異常值監(jiān)測(cè)或偏差分析,用來(lái)對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè),屬于預(yù)測(cè)型的挖掘方法。實(shí)際上,描述和預(yù)測(cè)是相互聯(lián)系不可分割的兩個(gè)過(guò)程,描述是預(yù)測(cè)的基礎(chǔ),而預(yù)測(cè)的準(zhǔn)確性又反過(guò)來(lái)修正描述。就某些挖掘方法而言,既可用于描述也可用于預(yù)測(cè),例如回歸分析,可以用于描述因變量如何隨自變量變化而變化;當(dāng)回歸分析模型建立以后,它可以用于預(yù)測(cè),即通過(guò)輸入自變量的確定值,對(duì)未知事物(因變量)進(jìn)行預(yù)測(cè)。
數(shù)據(jù)挖掘技術(shù)已經(jīng)在金融、電信、制造、能源等多個(gè)領(lǐng)域得到了較為深入的應(yīng)用,但在醫(yī)學(xué)中的應(yīng)用剛剛起步,而在兒童精神醫(yī)學(xué)中更是處于試探摸索階段。面對(duì)海量的醫(yī)學(xué)數(shù)據(jù),數(shù)據(jù)挖掘技術(shù)已經(jīng)顯示出其重要的實(shí)用價(jià)值和經(jīng)濟(jì)價(jià)值[10]。目前數(shù)據(jù)挖掘技術(shù)在兒童精神醫(yī)學(xué)中的應(yīng)用主要在以下幾方面:
2.1數(shù)據(jù)的匯總和表述數(shù)據(jù)的匯總和表述是對(duì)數(shù)據(jù)的初步挖掘,為進(jìn)一步使用其他挖掘方法墊定基礎(chǔ),因此已得到較為廣泛的運(yùn)用。比如朱艷麗等[11]調(diào)查河南省某少年教養(yǎng)管理所在押的97名男性少年教養(yǎng)人員,了解其人格類型及其自尊、成就動(dòng)機(jī)、應(yīng)對(duì)方式等。國(guó)外Clarke AR等[12]分析了100個(gè)8~12歲患有注意缺陷多動(dòng)障礙(ADHD)的女孩的腦電圖數(shù)據(jù),了解其α波、β波、θ波、δ波等波形的分布、波幅、節(jié)律等; Thapar A等[13]跟蹤隨訪了7 387個(gè)青少年,定期做精神病樣體驗(yàn)的自陳問(wèn)卷調(diào)查,分析數(shù)據(jù)后發(fā)現(xiàn)1.7%的個(gè)體的精神病樣體驗(yàn)隨年齡增長(zhǎng)而減少,16.8%斷斷續(xù)續(xù)出現(xiàn),而0.9%則會(huì)持續(xù)出現(xiàn)。
2.2聚類分析在兒童精神醫(yī)學(xué)中,聚類分析通常用于如下三個(gè)方面: (1)對(duì)某一種疾病的亞型探索:國(guó)外學(xué)者運(yùn)用最多的是孤獨(dú)癥亞型探索,如Lane AE等[14]對(duì)54名孤獨(dú)癥兒童的感覺(jué)處理及適應(yīng)方式作聚類分析,將孤獨(dú)癥患兒分為味覺(jué)敏感型、嗅覺(jué)敏感型和運(yùn)動(dòng)相關(guān)感覺(jué)敏感型三類; Hrdlicka M等[15]對(duì)64名孤獨(dú)癥患兒的MRI數(shù)據(jù)進(jìn)行聚類分析,最后將其聚為四類。(2)用于兩類疾病異同比較: Goldstein G等[16]比較高功能孤獨(dú)癥與精神分裂癥的異同,先通過(guò)聚類分析法將精神分裂癥患者聚為四亞類,再將這四亞類與高功能孤獨(dú)癥數(shù)據(jù)聚類,發(fā)現(xiàn)精神分裂癥中的其中一個(gè)亞類可以與高功能孤獨(dú)癥聚為一類,兩者在認(rèn)知上有較多相似之處; Cuccaro ML等[17]通過(guò)聚類分析方法探索孤獨(dú)癥譜系障礙與癲癇癥的聯(lián)系,發(fā)現(xiàn)兩者在言語(yǔ)和運(yùn)動(dòng)能力發(fā)育上有較多相似之處。(3)對(duì)疾病相關(guān)因素及癥狀的歸類:馮永亮等[18]對(duì)上海市669名大學(xué)女生非意愿性行為特征進(jìn)行聚類分析,發(fā)現(xiàn)具有一定個(gè)人及行為特征的青少年容易遭受非意愿性行為的侵?jǐn)_,應(yīng)針對(duì)這些特征因素采取相應(yīng)措施。Rizzo R等[19]回顧了100名Tourette綜合征(抽動(dòng)穢語(yǔ)綜合征)患者長(zhǎng)期臨床過(guò)程,通過(guò)因子分析和聚類分析發(fā)現(xiàn),10年后有48%的患者除抽動(dòng)穢語(yǔ)癥狀外,表現(xiàn)出強(qiáng)迫癥的癥狀。
2.3相關(guān)分析在傳統(tǒng)的統(tǒng)計(jì)分析中,用作相關(guān)分析的主要是回歸相關(guān);而數(shù)據(jù)挖掘技術(shù)中的相關(guān)還包括關(guān)聯(lián)規(guī)則、貝葉斯網(wǎng)絡(luò)分析等。目前的運(yùn)用舉例如下: (1)關(guān)聯(lián)規(guī)則: García EG等[20]用關(guān)聯(lián)規(guī)則分析了9 300名14~18歲青少年關(guān)于物質(zhì)使用的數(shù)據(jù)庫(kù),得出與酒精、煙草、大麻、可卡因等使用最相關(guān)的因素,比如與酒精使用最相關(guān)的因素是父母的教育方式和同伴的使用(置信度為0.8 528)。Vianna RC等[21]通過(guò)關(guān)聯(lián)規(guī)則發(fā)現(xiàn)與嬰兒死亡最相關(guān)的因素是青少年懷孕生育。(2)回歸與相關(guān):杜亞松領(lǐng)導(dǎo)的科研小組做過(guò)不少研究,如江文慶等[22]對(duì)網(wǎng)絡(luò)成癮者數(shù)據(jù)庫(kù)進(jìn)行Logistic回歸分析,提示網(wǎng)絡(luò)成癮與應(yīng)對(duì)方式中使用“問(wèn)題解決”、“幻想”、“自責(zé)”以及在“對(duì)支持的利用”能力上獨(dú)立相關(guān);劉文文等[23]用Logistic回歸分析探討影響孤獨(dú)癥患兒嚴(yán)重程度的相關(guān)因素發(fā)現(xiàn)具有女性、父母文化程度低、新生兒窒息、剖宮產(chǎn)、易怒敏感古怪的性格特征、淡漠型混亂型的依戀類型、發(fā)現(xiàn)癥狀到就診的間隔時(shí)間長(zhǎng)等特征的孤獨(dú)癥患兒更有嚴(yán)重程度較重的傾向。國(guó)外也有不少類似的研究,如Yurdu爧en S等[24]通過(guò)分層回歸分析法發(fā)現(xiàn)學(xué)齡前兒童情緒和行為問(wèn)題與母親的焦慮情緒、拒絕的態(tài)度和養(yǎng)育方式密切相關(guān),而母親的焦慮情緒是最重要的影響因素。(3)貝葉斯網(wǎng)絡(luò)分析: Snoek HM等[25]運(yùn)用貝葉斯理論分析青少年身高體質(zhì)量指數(shù)(BMI)變化軌跡與情緒、在外就餐和過(guò)分克制飲食的關(guān)系,發(fā)現(xiàn)越過(guò)分克制飲食BMI指數(shù)越高。Le TN等[26]通過(guò)貝葉斯網(wǎng)絡(luò)分析青少年犯罪行為與學(xué)校人口學(xué)因素和種族歧視的關(guān)系,發(fā)現(xiàn)學(xué)校學(xué)生種族越是多樣化和歧視,青少年犯罪率越高,但老師的種族多樣化與之沒(méi)有關(guān)系;除非裔美國(guó)人之外,女性老師比率越高,青少年犯罪率越低。
2.4分類分類是數(shù)據(jù)挖掘中的常用方法,決策樹(shù)算法、貝葉斯分類器、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等多種分類算法均已在兒童精神醫(yī)學(xué)中得到運(yùn)用。目前的分類方法運(yùn)用于如下幾個(gè)方面: (1)用于疾病的診斷識(shí)別:國(guó)內(nèi)陳冰梅等[27]通過(guò)對(duì)全國(guó)1 125份病例資料的數(shù)據(jù)分析,將人工神經(jīng)網(wǎng)絡(luò)與專家系統(tǒng)相結(jié)合,編制了智能計(jì)算機(jī)診斷系統(tǒng),經(jīng)測(cè)試發(fā)現(xiàn)其診斷結(jié)果與資深專家診斷符合率為99%。國(guó)外Wall DP等[28]將人工智能分類技術(shù)用于孤獨(dú)癥患兒的篩查; Perego P等[29]將支持向量機(jī)技術(shù)用于孤獨(dú)癥的早期診斷。(2)用于風(fēng)險(xiǎn)預(yù)測(cè)和嚴(yán)重程度評(píng)估: Pazzani M J等[30]用貝葉斯概率模型用于新生兒患智能發(fā)育遲滯的風(fēng)險(xiǎn)評(píng)估。Ang RP等[31]將預(yù)測(cè)型數(shù)據(jù)挖掘技術(shù)與傳統(tǒng)Logistic回歸分析相比較,用于青少年攻擊行為的預(yù)測(cè),確證了決策樹(shù)、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等分類技術(shù)的效果。Stahl D等[32]利用支持向量機(jī)技術(shù)分析了嬰兒事件相關(guān)電位數(shù)據(jù)庫(kù)(這些嬰兒后來(lái)被診斷患有孤獨(dú)癥),建立了孤獨(dú)癥患病風(fēng)險(xiǎn)的預(yù)測(cè)模型。(3)決策支持:決策樹(shù)分類與成本效益分析相結(jié)合,能夠指導(dǎo)人們作出最優(yōu)策略,其運(yùn)用有著較早的歷史,早在1995年Fletcher J等[33]將決策樹(shù)技術(shù)用于產(chǎn)前唐氏綜合征的篩查方式比較,用成本效益分析比較血清測(cè)定法與羊膜穿刺法的優(yōu)略。決策支持技術(shù)不斷地得到運(yùn)用和發(fā)展,如Magyary D等[34]將決策樹(shù)技術(shù)用于注意缺陷多動(dòng)障礙患兒的評(píng)估和管理,發(fā)現(xiàn)結(jié)果與幾個(gè)國(guó)家專業(yè)機(jī)構(gòu)發(fā)布的多動(dòng)癥指南相一致。Ebesutani C等[35]用決策支持系統(tǒng)發(fā)現(xiàn)預(yù)先用自評(píng)問(wèn)卷調(diào)查可以減輕青少年心理治療的負(fù)擔(dān)。
2.5回歸分析數(shù)據(jù)挖掘技術(shù)中的回歸分析不僅包括Logistic回歸等經(jīng)典回歸分析法,還包括人工神經(jīng)網(wǎng)絡(luò)、回歸樹(shù)等不能用函數(shù)表達(dá)的復(fù)雜算法,具有廣闊的運(yùn)用前景。(1)經(jīng)典回歸分析: López-Villalobos JA等[36]以200例注意缺陷多動(dòng)障礙患兒相關(guān)數(shù)據(jù)為學(xué)習(xí)樣本,以年齡、匹配熟悉圖測(cè)驗(yàn)(MFFT-20)分、兒童嵌圖測(cè)試分(CEFT)、Stroop測(cè)試分?jǐn)?shù)為自變量,建立是否患有多動(dòng)癥的Logistic回歸模型,經(jīng)測(cè)試后該模型預(yù)測(cè)的靈敏度為85%、特異度為85%(相對(duì)于DSM–Ⅳ診斷標(biāo)準(zhǔn))。(2)人工神經(jīng)網(wǎng)絡(luò): Nuovo AG等[37]嘗試建立測(cè)定智商的神經(jīng)網(wǎng)絡(luò),其測(cè)試性能比韋氏智商量表更精確(置信區(qū)間5個(gè)單位)。(3)回歸樹(shù)算法:當(dāng)決策樹(shù)輸出的是連續(xù)變量時(shí)稱之為回歸樹(shù),而實(shí)際上單純運(yùn)用回歸樹(shù)的研究并不多見(jiàn),通常是將分類與回歸結(jié)合在一起,稱為分類回歸樹(shù)(Classification And Regression Tree,CART)。該算法已得到廣泛的運(yùn)用。Mckenzie DP等[38]用短期心境和感受問(wèn)卷(SMFQ)調(diào)查5 769名美國(guó)及加拿大青少年,用分類回歸樹(shù)法(CART)進(jìn)行數(shù)據(jù)分析,結(jié)果發(fā)現(xiàn)自我憎恨和不被愛(ài)是增加抑郁水平的兩個(gè)重要預(yù)測(cè)因素,由此考慮制定相應(yīng)措施。Brabant ME等[39]成功運(yùn)用CART法預(yù)測(cè)受性虐待的少女的自殺風(fēng)險(xiǎn)。
2.6時(shí)間序列分析時(shí)間序列分析是當(dāng)前人工智能和數(shù)據(jù)庫(kù)系統(tǒng)研究的熱點(diǎn)之一。但目前尚未發(fā)現(xiàn)有專門將時(shí)間系列分析用于兒童精神醫(yī)學(xué)的報(bào)道,但可以在相關(guān)的學(xué)科如腦電圖中見(jiàn)到一些零星研究。Ferri R等[40]曾有將時(shí)間系列模型用于分析新生兒腦電圖的報(bào)道。Kim SH等[41]報(bào)道,將時(shí)間系列分析與自回歸分析相結(jié)合后分析癲癇患者的腦電圖,預(yù)測(cè)的速度和準(zhǔn)確率明顯高于以前的方法。
2.7異常值監(jiān)測(cè)和時(shí)間系列分析類似,僅在兒童精神醫(yī)學(xué)相關(guān)的領(lǐng)域見(jiàn)到報(bào)道。Mefford HC等[41]將異常值監(jiān)測(cè)技術(shù)用于研究人類基因組變異(CVNs),發(fā)現(xiàn)1 105名不明原因智力殘疾的兒童(非孤獨(dú)癥)中有7名兒童染色體位點(diǎn)16p11.2缺失,而16p11.2缺失曾經(jīng)被認(rèn)為與孤獨(dú)癥有關(guān),且發(fā)現(xiàn)異常值監(jiān)測(cè)法相比其他方法更加經(jīng)濟(jì)實(shí)用。
從以上綜述中我們看到數(shù)據(jù)挖掘技術(shù)已經(jīng)在兒童精神醫(yī)學(xué)中有一定的應(yīng)用,但這種應(yīng)用剛剛起步,今后必然會(huì)不斷地發(fā)展和完善。首先,數(shù)據(jù)挖掘需要面對(duì)的是海量數(shù)據(jù),而上述數(shù)據(jù)挖掘技術(shù)在兒童精神心理疾病中的應(yīng)用研究樣本量非常小,更多的是嘗試性運(yùn)用,今后研究者必然會(huì)擴(kuò)大樣本量,在大規(guī)模數(shù)據(jù)庫(kù)中驗(yàn)證其應(yīng)用價(jià)值和實(shí)際可操作性。其次,數(shù)據(jù)挖掘技術(shù)在具體運(yùn)算之前還要經(jīng)歷漫長(zhǎng)的數(shù)據(jù)預(yù)處理階段,包括數(shù)據(jù)清洗、數(shù)據(jù)格式轉(zhuǎn)換、變量整合、數(shù)據(jù)表連接等,使其應(yīng)用遠(yuǎn)沒(méi)有傳統(tǒng)統(tǒng)計(jì)學(xué)廣泛。隨著簡(jiǎn)潔實(shí)用的數(shù)據(jù)挖掘軟件技術(shù)的發(fā)展,預(yù)計(jì)數(shù)據(jù)預(yù)處理會(huì)更加簡(jiǎn)便,數(shù)據(jù)挖掘技術(shù)也更易得到推廣[43]。再次,目前在兒童精神醫(yī)學(xué)中所用的數(shù)據(jù)挖掘技術(shù)比較單一,可能僅挖出數(shù)據(jù)背后眾多規(guī)律的一小部分,這難免造成重要知識(shí)的遺漏和數(shù)據(jù)資源的浪費(fèi),因此今后各種挖掘方法必然趨向于整合,從而提高挖掘效率。最后,信息貴在新、快,即所謂的“實(shí)時(shí)性”。對(duì)于兒童精神心理疾病,越早發(fā)現(xiàn)和治療,預(yù)后越好。這就需要數(shù)據(jù)挖掘技術(shù)與自動(dòng)化技術(shù)和視頻、音頻、圖像處理等技術(shù)結(jié)合起來(lái),實(shí)時(shí)監(jiān)測(cè),快速轉(zhuǎn)換、運(yùn)算和分析,并及時(shí)給出危險(xiǎn)警示和指導(dǎo)措施,充分發(fā)揮其實(shí)用價(jià)值[44]。
參考文獻(xiàn)
[1]Codreanu DE,Parpandel DE,Popa I.Extracting knowledge from data-data mining[J].Challenges of the Knowledge Society,2013,1: 2020-2025
[2]Winship K.Data mining in children and family services: the Contra Costa County experience[J].J Evid Soc Work,2012,9(1-2) : 19-26
[3]Alazemi AR.Data,text and web mining for business intelligence:A Survey[J].International Journal of Data Mining&Knowledge Management Process,2013,3(2) : 1-21
[4]Trebuňa P,Halˇcinová J.Mathematical tools of cluster analysis [J].Applied Mathematics,2013,4(5) : 814-816
[5]Anwar MA.Finding association rules through efficient knowledge management technique[J].International Journal of Advanced Computer Sciences and Applications,2013,3(12) : 131-134
[6]Dash SR,Dehuri S.Comparative study of different classification techniques for post operative patient dataset[J].International Journal of Innovative Research in Computer and Communication Engineering,2013,1(5) : 1101-1108
[7]龔著琳,陳瑛,章魯,等.生物醫(yī)學(xué)數(shù)據(jù)挖掘[M].上海:上??茖W(xué)技術(shù)出版社,2011: 25-44
[8]Momani NM.Time series analysis model for rainfall data in Jordan: case study for using time series analysis[J].American Journal of Environmental Sciences,2013,5(5) : 599-604
[9]Chandore P,Chatur P.Outlier detection techniques over streaming data in data mining: A research perspective[J].International Journal of Recent Technology and Engineering,2013,2(1) : 157-162
[10]Kaur H,Wasan SK.Empirical Study on Applications of Data Mining Techniques in Healthcare[J].J Comput Sci,2006,2(2) : 194-200
[11]朱艷麗,趙山明.少年教養(yǎng)人員人格類型及其與自尊、成就動(dòng)機(jī)、應(yīng)對(duì)方式的調(diào)查[J].中國(guó)組織工程研究與臨床康復(fù),2007,11(17) : 3306-3309
[12]Clarke AR,Barry RJ,Mccarthy R,et al.EEG activity in girls with attention-deficit/hyperactivity disorder[J].Clinical Neurophysiology,2003,114(2) : 319-328
[13]Thapar A,Heron J,Jones RB,et al.Trajectories of change in self-reported psychotic-like experiences in childhood and adolescence[J].Schizophrenia Research,2012,140(1-3) : 104-109
[14]Lane AE,Young RL,Baker AZ,et al.Sensory processing subtypes in autism: association with adaptive behavior [J].J Autism Dev Disord,2010,40(1) : 112-122
[15]Hrdlicka M,Dudova I,Beranova I,et al.Subtypes of autism by cluster analysis based on structural mri data[J].Eur Child Adolesc Psychiatry,2005,14(3) : 138-144
[16]Goldstein G,Minshew NJ,Allen DN,et al.High-functioning autism and schizophrenia: a comparison of an early and late onset neurodevelopmental disorder[J].Arch Clin Neuropsychol,2002,17(5) : 461-475
[17]Cuccaro ML,Tuchman RF,Hamilton KL,et al.Exploring the relationship between autism spectrum disorder and epilepsy using latent class cluster analysis[J].J Autism Dev Disord,2011,42(8) : 1630-1641
[18]馮永亮,牛紅峰,左霞云,等.上海市大學(xué)生非意愿性行為的聚類特征分析[J].中國(guó)衛(wèi)生統(tǒng)計(jì),2011,28(1) : 33 -36
[19]Rizzo R,Gulisano M,Calì PV,et al.Long term clinical course of Tourette syndrome[J].Brain Dev,2012,34(8) : 667-673
[20]García EG,Blasco BC,López RJ,et al.Study of the factors associated with substance use in adolescence using Association Rules[J].Adicciones,2010,22(4) : 293-299
[21]Vianna RC,Moro CM,Moysés SJ,et al.Data mining and characteristics of infant mortality[J].Cad Saude Publica,2010,26(3) : 535-542
[22]江文慶,杜亞松,辛秦,等.上海市網(wǎng)絡(luò)成癮中學(xué)生的應(yīng)對(duì)方式與社會(huì)支持[J].上海精神醫(yī)學(xué),2011,23(2) : 87-91
[23]劉文文,楊曹驊,張林娜,等.父母親對(duì)孤獨(dú)癥癥狀的認(rèn)識(shí)及嚴(yán)重程度影響因素的研究[J].中國(guó)兒童保健雜志,2013,21(6) : 575-577
[24]Yurdusen S,Erol N,Genz T.The effects of parental attitudes and mothers' psychological well-being on the emotional and behavioral problems of their preschool children[J].Matern Child Health J,2013,17(1) : 68-75
[25]Snoek HM,Engels R,van Strien T,et al.Emotional,external and restrained eating behaviour and BMI trajectories in adolescence[J].Appetite,2013,(67) : 81 -87
[26]Le TN,Stockdale G.The influence of school demographic factors and perceived student discrimination on delinquency trajectory in adolescence[J].J Adoles Health,2011,49 (4) : 407-413
[27]陳冰梅,樊曉平,周志明,等.基于人工神經(jīng)網(wǎng)絡(luò)與人工智能的計(jì)算機(jī)系統(tǒng)在兒童心理障礙診斷領(lǐng)域的應(yīng)用[J].中國(guó)組織工程研究與臨床康復(fù),2011,15(13) : 2467-2470
[28]Wall DP,Dally R,Luyster R,et al.Use of artificial intelligence to shorten the behavioral diagnosis of autism [J].PloS One,2012,7(8) : e43855
[29]Perego P,F(xiàn)orti S,Crippa A,et al.Reach and throw movement analysis with support vector machines in early diagnosis of autism[J].Conf Proc IEEE Eng Med Biol Soc,2009: 2555-2558
[30]Pazzani MJ,Mani S,Shankle WR.Acceptance of rules generated by machine learning among medical experts[J].Methods of Inf Med,2001,40(5) : 380-385
[31]Ang RP,Goh DH.Predicting juvenile offending: a comparison of data mining methods[J].Int J Offender Ther Com Criminol,2013,57(2) : 191-207
[32]Stahl D,Pickles A,Elsabbagh M,et al.Novel machine learning methods for ERP analysis: a validation from research on infants at risk for autism[J].Developmental Neuropsychology,2012,37(3) : 274-298
[33]Fletcher J,Hicks NR,Kay JD,et al.Using decision analysis to compare policies for antenatal screening for Down’s syndrome[J].BMJ,1995,311(7001) : 351-356
[34]Magyary D,Brandt P.A decision tree and clinical paths for the assessment and management of children with ADHD [J].Issues Ment Health Nurs,2002,23(6) : 553-566
[35]Ebesutani C,Bernstein A,Chorpita BF,et al.A transportable assessment protocol for prescribing youth psychosocial treatments in real-world settings: reducing assessment burden via self-report scales[J].Psychological Assessment,2012,24(1) : 141-155
[36]López-Villalobos JA,Serrano-Pintado I,Sánchez-Mateos JD,et al.Utility of a statistical model of cognitive styles in attention deficit hyperactivity disorder[J].Psicothema,2011,23(4) : 818-823
[37]Di Nuovo AG,Di Nuovo S,Buono S.Intelligent quotient estimation of mental retarded people fromdifferent psychometric instruments using artificial neural networks [J].Artif Intell Med,2012,54(2) : 135-145
[38]Mckenzie DP,Toumbourou JW,F(xiàn)orbes AB,et al.Predicting future depression in adolescents using the Short Mood and Feelings Questionnaire: a two-nation study[J].Journal Affect Disord,2011,134(1-3) : 151-159
[39]Brabant ME,Hébert M,Chagnon F.Identification of sexually abused female adolescents at risk for suicidal ideations: a classification and regression tree analysis[J].J Child Sex Abus,2013,22(2) : 153-172
[40]Ferri R,Chiaramonti RM,Musumeci SA,et al.Nonlinear EEG analysis during sleep in premature and full-term newborns[J].Clinical Neurophysiology,2003,114 (7) : 1176-1180.
[41]Kim SH,F(xiàn)aloutsos C,Yang HJ.Coercively adjusted auto regression model for forecasting in epilepsy EEG[J].Comput Math Methods Med,2013,545-613
[42]Mefford HC,Cooper G.A method for rapid,targeted CNV genotypingidentifies rarevariants associatedwith neurocognitive disease[J].Genome Res,2009,19(9) : 1579-1585
[43]Raju SH,Latha TS.An Unique Data mining Task for Sorting: Data Preprocessing for efficient External Sorting [J].International Journal of Advanced Research in Computer Engineering&Technology (IJARCET),2013,1(9) : 69-76
[44]Güiza F,Van Eyck J,Meyfroidt G.Predictive data mining on monitoring data from the intensive care unit[J].J Clin Monit Comput,2013,27(4) : 449-453
(收稿日期:2014-07-08)
通訊作者:杜亞松,E-mail: yasongdu@163.com
*基金項(xiàng)目:國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃項(xiàng)目(編號(hào): 2010CB529602) ;上海市科學(xué)技術(shù)委員會(huì)科研計(jì)劃項(xiàng)目(編號(hào): 11411952401)
doi:10.3969/j.issn.2095-9346.2015.01.026
【中圖分類號(hào)】R749.94
【文獻(xiàn)標(biāo)識(shí)碼】A
【文章編號(hào)】2095-9346(2015)-01-0077-04
作者單位:200030,上海交通大學(xué)醫(yī)學(xué)院附屬精神衛(wèi)生中心