陳澤慧 邢恩龍 魏玥 王瑞瑞 楊晉翔
慢性萎縮性胃炎(chronic atrophic gastritis,CAG)是以固有腺體減少并常伴腸上皮化生、異型增生為病理特點(diǎn)的常見消化系統(tǒng)疾病,屬于胃癌發(fā)展階段的癌前疾病。CAG臨床癥狀多無特異性,亦可無明顯癥狀,有癥狀者多表現(xiàn)為上腹部不適、飽脹、疼痛、食欲不振、反酸、噯氣等非特異性消化道癥狀[1],現(xiàn)代醫(yī)學(xué)的藥物治療多以針對(duì)性改善不同臨床癥狀為主,對(duì)于無癥狀而言的患者則在治療上存在一定局限性。通過對(duì)大量臨床與基礎(chǔ)研究的不斷挖掘,越來越多的證據(jù)表明中醫(yī)藥在慢性萎縮性胃炎治療方面具有良好療效,能夠減輕胃黏膜炎癥反應(yīng),增強(qiáng)抗損傷及修復(fù)能力,甚至逆轉(zhuǎn)腸化以及異型增生[2]。辨證論治體現(xiàn)了中醫(yī)診療的主要特色,通過對(duì)臨床癥狀、舌脈等四診信息提取后總結(jié)出的證候?qū)W類型,可反映出疾病的中醫(yī)病機(jī)特點(diǎn)。CAG作為脾胃系統(tǒng)疑難疾病之一,對(duì)其中醫(yī)病機(jī)的把握有助于在無癥狀情況下亦可指導(dǎo)臨床遣方用藥,因此本研究基于臨床采集CAG患者四診信息,運(yùn)用數(shù)據(jù)挖掘技術(shù)分析本病核心癥狀群,構(gòu)建四診信息間復(fù)雜關(guān)聯(lián)網(wǎng)絡(luò),闡釋癥狀—證候要素—病機(jī)之間的關(guān)鍵規(guī)律,從而為CAG臨床病機(jī)理論提供依據(jù),茲介紹如下。
2017年9月至2019年10月于北京中醫(yī)藥大學(xué)第三附屬醫(yī)院門診、北京中醫(yī)藥大學(xué)東方醫(yī)院消化內(nèi)鏡中心就診的慢性萎縮性胃炎患者。本研究共納入合格病例201例,其中男性81例,女性120例,性別比1∶1.48。年齡最小者31歲,年齡最大者84歲,平均年齡(60.78±10.90)歲。
參照2012年中華醫(yī)學(xué)會(huì)消化病學(xué)分會(huì)于上海召開的全國慢性胃炎診治共識(shí)會(huì)議中提出的共識(shí)意見[3],慢性萎縮性胃炎診斷有內(nèi)鏡診斷和病理診斷,確診應(yīng)以病理診斷為依據(jù)。
納入標(biāo)準(zhǔn):(1)符合慢性萎縮性胃炎診斷標(biāo)準(zhǔn),病歷資料及診斷報(bào)告詳實(shí);(2)年齡18歲以上患者;(3)患者知情同意,自愿加入本項(xiàng)研究。
排除標(biāo)準(zhǔn):(1)合并消化道潰瘍、胃腸道手術(shù)史、上消化道腫瘤、腹部手術(shù)等器質(zhì)性病變者;(2)合并心、腦、肝、腎等嚴(yán)重系統(tǒng)疾??;(3)有精神系統(tǒng)疾病及精神病病史;(4)妊娠及哺乳期婦女。
剔除標(biāo)準(zhǔn):(1)不符合納入標(biāo)準(zhǔn)而被誤納入的病例;(2)組織病理學(xué)報(bào)告資料不全者,予以剔除;(3)受試者未按研究要求回答或填寫臨床觀察表,導(dǎo)致無效問卷者,予以剔除。
基于前期臨床觀察研究及相關(guān)文獻(xiàn),參照《中藥新藥臨床研究指導(dǎo)原則(2002年版——試行)》[4]、《中醫(yī)臨床常見癥狀術(shù)語規(guī)范》[5]、《慢性萎縮性胃炎中醫(yī)診療共識(shí)意見》[6]綜合制定慢性萎縮性胃炎患者臨床觀察表,其具體內(nèi)容包括:一般資料(姓名、年齡、性別)、病歷信息(癥狀、體征、病程、既往史與家族史、中醫(yī)舌脈象)、輔助檢查(病理及胃鏡結(jié)果)、西醫(yī)診斷、中醫(yī)診斷。
采用臨床流行病學(xué)橫斷面研究方法,符合慢性萎縮性胃炎診斷標(biāo)準(zhǔn)的患者在取得知情同意后現(xiàn)場(chǎng)采集病史及四診信息資料并予回收臨床觀察表后納入數(shù)據(jù)統(tǒng)計(jì)。其中視為回收合格的臨床觀察表標(biāo)準(zhǔn)如下:(1)臨床觀察表中所納入符合本人情況的項(xiàng)目必須填寫;(2)慢性萎縮性胃炎疾病資料完備、四診信息資料填寫無缺失;(3)所有患者的胃鏡及病理檢查報(bào)告應(yīng)取得知情同意后拍照存檔,或根據(jù)患者意愿詳細(xì)記錄報(bào)告信息來代替拍照存檔。團(tuán)隊(duì)組在啟動(dòng)臨床研究前均完成臨床試驗(yàn)標(biāo)準(zhǔn)操作規(guī)程(SOP)培訓(xùn),明確臨床研究方案及人員分工,由至少兩名以上副高級(jí)專家進(jìn)行全程監(jiān)督指導(dǎo),嚴(yán)格按照納入、排除標(biāo)準(zhǔn)對(duì)病例進(jìn)行篩選,選擇完全符合標(biāo)準(zhǔn)的病人入組,針對(duì)每一位患者臨床調(diào)查至少由兩名專業(yè)研究生同時(shí)進(jìn)行信息采集,信息采集后依據(jù)剔除標(biāo)準(zhǔn)完善臨床數(shù)據(jù)質(zhì)量把控,以確保資料收集過程的真實(shí)可靠性,減少測(cè)量性偏倚。
將所得全部臨床資料錄入Microsoft Excel 2013建立數(shù)據(jù)庫,重復(fù)檢查排除錄入錯(cuò)誤。應(yīng)用SPSS 23.0軟件進(jìn)行頻數(shù)統(tǒng)計(jì),采用卡方檢驗(yàn)分析不同證素間差異性,其中P<0.05為存在差異,P<0.01為存在顯著差異。應(yīng)用SPSS Modeler 18.0軟件進(jìn)行關(guān)聯(lián)規(guī)則Apriori算法繪制四診信息核心組合網(wǎng)絡(luò)圖。應(yīng)用Lantern5.0對(duì)慢性萎縮性胃炎數(shù)據(jù)庫中癥狀數(shù)據(jù)進(jìn)行隱結(jié)構(gòu)分析,構(gòu)建隱結(jié)構(gòu)模型,并據(jù)此提取證候要素因子、歸納證候要素。
將慢性萎縮性胃炎患者全部四診信息進(jìn)行頻數(shù)頻率統(tǒng)計(jì),結(jié)果顯示建立的慢性萎縮性胃炎患者數(shù)據(jù)庫中共包括四診信息條目100個(gè),其中出現(xiàn)頻率為10%以上的條目共59個(gè),具體條目例舉見表1。
表1 慢性萎縮性胃炎患者四診信息頻次統(tǒng)計(jì)分布(N=201)
參照表1統(tǒng)計(jì)結(jié)果,應(yīng)用關(guān)聯(lián)規(guī)則Apriori算法對(duì)上述59個(gè)變量間關(guān)聯(lián)度進(jìn)行分析測(cè)量,篩選建立符合慢性萎縮性胃炎證候?qū)W研究要求的四診信息關(guān)聯(lián)規(guī)則模型。在 Apriori算法中,支持度與置信度是判斷關(guān)聯(lián)規(guī)則有效性的重要指標(biāo),其中支持度表示同時(shí)包含前項(xiàng)X與后項(xiàng)Y的事務(wù),反映了關(guān)聯(lián)規(guī)則的頻度;置信度是在給定前項(xiàng)X的前提下,后項(xiàng)Y的條件概率,反映了關(guān)聯(lián)規(guī)則的強(qiáng)度。本研究在最小支持度20%,最小置信度80%設(shè)置下,獲得四診信息關(guān)聯(lián)規(guī)則90條,據(jù)此將閾值限設(shè)置在140~200之間繪制出四診信息數(shù)據(jù)隱藏的關(guān)聯(lián)規(guī)則網(wǎng)絡(luò)圖。結(jié)果將置信度>85%的部分四診信息組合關(guān)聯(lián)規(guī)則列出見表2,關(guān)聯(lián)規(guī)則網(wǎng)絡(luò)圖見圖1。
表2 四診信息關(guān)聯(lián)規(guī)則節(jié)選表(支持度20%,置信度80%)
圖1 四診信息關(guān)聯(lián)規(guī)則網(wǎng)絡(luò)圖-1
為進(jìn)一步明確慢性萎縮性胃炎的核心四診信息,使在支持度20%,置信度80%篩選條件下網(wǎng)絡(luò)圖更為精簡(jiǎn),將網(wǎng)絡(luò)圖中顯示連線頻數(shù)值的閾值條提高,在高閾值下限時(shí)關(guān)聯(lián)程度低的四診信息不會(huì)再顯示在網(wǎng)絡(luò)圖中,屬性與屬性之間連接線的粗細(xì)表示連接強(qiáng)度,線條越粗則代表兩者之間關(guān)聯(lián)性越強(qiáng)。結(jié)果顯示,閾值限提高至150~165之間繪制出四診信息關(guān)聯(lián)規(guī)則網(wǎng)絡(luò)圖中,最終有12個(gè)四診信息納入圖像;由兩者之間連線粗細(xì)來判斷關(guān)聯(lián)強(qiáng)度得到胃刺痛與夜間痛甚關(guān)聯(lián)最強(qiáng),夜間痛甚與口臭、渴喜熱飲之間關(guān)聯(lián)、渴喜熱飲與夜間痛甚、四肢發(fā)涼、咽部異物感之間關(guān)聯(lián)較大,通過關(guān)聯(lián)規(guī)則算法得到的慢性萎縮性胃炎的核心四診信息為:胃刺痛、夜間痛甚、四肢發(fā)涼、心悸、口臭、口中粘膩、心煩易怒、納差、煩躁發(fā)熱、渴喜熱飲、氣短、咽部異物感。高閾值下限(150)的四診信息關(guān)聯(lián)規(guī)則網(wǎng)絡(luò)圖見圖2。
圖2 四診信息關(guān)聯(lián)規(guī)則網(wǎng)絡(luò)圖-2
參照表1統(tǒng)計(jì)結(jié)果,最終選取出現(xiàn)頻率≥20%的44條四診信息作為顯變量進(jìn)行爬山法LTM-EAST分析構(gòu)建慢性萎縮性胃炎的隱結(jié)構(gòu)模型,共計(jì)得到9個(gè)隱變量, 以Y0、Y1、Y2……Y9表示,見圖3。其中隱變量分類個(gè)數(shù)用隱變量后括號(hào)內(nèi)數(shù)字顯示,2個(gè)取值表示是/否2個(gè)隱類,變量間連線提示兩者之間存在相關(guān)性,連線粗細(xì)代表隱變量間的互信息大小,連線越粗則兩者間聯(lián)系越密切。為詮釋隱變量 Y 含義,Lantern會(huì)選取若干個(gè)與隱變量 Y相關(guān)度最高的顯變量,并基于這些顯變量來進(jìn)行詮釋。累積信息覆蓋度決定了所得到的詮釋結(jié)果覆蓋了多少隱變量 Y所含的信息,累積信息覆蓋度越高,選取的顯變量就越多,詮釋結(jié)果所覆蓋的Y的信息也就越多。在累計(jì)信息覆蓋度為95%時(shí),Y0由脈弦、舌淡、脈緩、齒痕、口干舌燥、口苦、痛有定處共7個(gè)顯變量來詮釋,隱變量Y0把數(shù)據(jù)分為2個(gè)隱類,即類Y0=S0和Y0=S1。隱類S0占人群總數(shù)24%,隱類S1占人群總數(shù) 76%。每個(gè)顯變量有兩個(gè)狀態(tài),癥狀不出現(xiàn)s0,癥狀出現(xiàn)s1,即所在每行的s1列為具有該癥狀出現(xiàn)的概率。圖3中的數(shù)據(jù)可以這樣理解:隱類S0這類人群中具有脈弦、舌淡、脈緩、齒痕、口干舌燥、口苦、痛有定處癥狀的概率依次為0、0.64、0.54、0.5、0.13、0.05、0.11;隱類S1這類人群中具有上述癥狀的概率依次為0.82、0.14、0.14、0.11、0.51、0.31、0.39。隱類S1=Y0類中,脈弦、口干舌燥、口苦、痛有定處的頻率較高,反映熱的證候要素,隱類S0=Y0類中,舌淡、脈緩、齒痕的頻率較高,反映氣虛的證候要素。然而兩者中S1=Y0類癥狀(脈弦、口干舌燥、口苦、痛有定處)在隱結(jié)構(gòu)模型圖與Y0連線較粗更為密切,因此判斷Y0的證候要素為S1=熱。Y0~Y9隱變量模型詮釋表見表3,通過隱結(jié)構(gòu)模型構(gòu)建共挖掘慢性萎縮性胃炎主要證候要素包括氣虛(Y3)、濕(Y2、Y4、Y5)、血瘀(Y6)、熱(Y0、Y1)、氣滯(Y8、Y9)、陽虛(Y3)共六種;由隱結(jié)構(gòu)模型圖觀察隱變量之間連線程度得到多種證候要素之間,熱(Y0)與濕(Y5)、血瘀(Y6)、氣滯(Y9)較為密切。
表3 慢性萎縮性胃炎證候要素隱變量模型詮釋表
圖3 慢性萎縮性胃炎四診信息隱結(jié)構(gòu)模型圖
中醫(yī)臨床四診信息數(shù)據(jù)具有鮮明的多維度、非線性、多關(guān)系性、模糊性等特征,因此基于多重非線性模型的數(shù)據(jù)挖掘方法更加適用于中醫(yī)證候?qū)W相關(guān)數(shù)據(jù)的解析[7]。Apriori算法是一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法,通過Apriori算法可以得到高頻四診信息的組合,組合與組合間高度關(guān)聯(lián)過程所產(chǎn)生的集合反映了慢性萎縮性胃炎的核心四診信息群,從核心四診信息中挖掘出的證候要素更易趨近于疾病關(guān)鍵病機(jī)。隱結(jié)構(gòu)分析是對(duì)多種顯變量特征進(jìn)行匯總聚類后獲得相應(yīng)隱變量的過程,其特點(diǎn)是隱變量與顯變量都取離散值,不必局限于變量間必須具有相關(guān)性,每個(gè)隱變量的詮釋是根據(jù)顯變量概率同現(xiàn)或概率互斥體現(xiàn)的。本研究中的顯變量即四診信息,隱變量即證候要素,證候要素(隱變量)是通過與之強(qiáng)關(guān)聯(lián)的四診信息(顯變量)出現(xiàn)概率判斷出來的,用數(shù)學(xué)統(tǒng)計(jì)描述后的證候要素具有定量性,實(shí)現(xiàn)了變量與變量間多重對(duì)應(yīng)關(guān)系的多層次、多維度結(jié)果[8]。
本研究在特定支持度與置信度設(shè)置下,應(yīng)用關(guān)聯(lián)規(guī)則Apriori算法進(jìn)行分析測(cè)量,結(jié)果獲得四診信息關(guān)聯(lián)規(guī)則90條,為進(jìn)一步明確慢性萎縮性胃炎的核心四診信息,將網(wǎng)絡(luò)圖閾值限提高后最終有12個(gè)四診信息納入圖像,建立的四診信息群包括:胃刺痛、夜間痛甚、四肢發(fā)涼、心悸、口臭、口中粘膩、心煩易怒、納差、煩躁發(fā)熱、渴喜熱飲、氣短、咽部異物感。核心四診信息群的建立不同于簡(jiǎn)單的頻數(shù)統(tǒng)計(jì),而是將關(guān)聯(lián)性較強(qiáng)的癥狀、體征組成多維、多層次空間網(wǎng)絡(luò),網(wǎng)絡(luò)內(nèi)的每條信息都與其他信息保持廣泛密切的關(guān)聯(lián),因此四診信息的核心組合并不完全等同于癥狀頻數(shù)出現(xiàn)高低,本研究中可看到四診信息出現(xiàn)頻率在前10位的苔白、胃脹痛、脈弦、舌暗、苔薄等并未出現(xiàn)在核心四診信息中,其原因在于頻次高低不是決定信息間關(guān)聯(lián)強(qiáng)度的必要條件,高頻次四診信息反映了普遍性存在規(guī)律,復(fù)雜關(guān)聯(lián)網(wǎng)絡(luò)中的四診信息是反映關(guān)聯(lián)性核心病機(jī)的高度概括。本研究結(jié)果中的核心四診信息可涵蓋以下證候要素:血瘀(胃刺痛、夜間痛甚)、熱(口臭、煩躁發(fā)熱、心煩易怒)、濕(口中粘膩、納差)、氣滯(氣短、咽部異物感、心煩易怒)、陽虛(四肢發(fā)涼、渴喜熱飲、氣短)、氣虛(納差、氣短),據(jù)此可以提出,針對(duì)慢性萎縮性胃炎基本證候要素氣虛、血瘀、熱、氣滯、濕、陽虛,益氣、活血、清熱、理氣、化濕、溫陽是本病的主要治法,但臨床用藥必應(yīng)辨證論治,若陰虛顯著則以滋陰立法。
此外,基于隱結(jié)構(gòu)分析提取慢性萎縮性胃炎證候要素,結(jié)果共得到9個(gè)隱變量,最終合并歸納為氣虛、濕、血瘀、熱、氣滯、陽虛共6種。隱結(jié)構(gòu)分析是在設(shè)置累計(jì)信息覆蓋度為95%時(shí)計(jì)算機(jī)自動(dòng)生成與隱變量最為相關(guān)的顯變量組合,屬于多維非線性客觀描述。值得注意的是,隱結(jié)構(gòu)分析所揭示的證候要素與核心四診信息涵蓋的證候要素組成基本吻合,并未明確顯示陰虛證候要素特點(diǎn),其原因可能與本研究樣本量過少、計(jì)算分析時(shí)過度篩選低頻癥狀造成結(jié)果存在一定偏倚有關(guān)。然而有研究表明在發(fā)展為慢性萎縮性胃炎的過程中,陰虛是至為關(guān)鍵的病理環(huán)節(jié)之一[9-10]。陰虛本證多因熱病之后,或雜病日久傷耗陰液所致,可與氣虛、血虛、陽虛、熱邪等證候同時(shí)存在,或互為因果[11],可能基于數(shù)據(jù)挖掘在證候要素提取中并未凸顯出其典型特點(diǎn)。不可否認(rèn)的是,CAG的發(fā)生與各種原因所致陰精耗損密切相關(guān),經(jīng)言“陽化氣,陰成形”,陰精為物質(zhì)形成的基礎(chǔ);陰精匱乏,腺體失養(yǎng),體態(tài)不充,最終導(dǎo)致胃黏膜萎縮的形成。因此本研究認(rèn)為,陰虛也是慢性萎縮性胃炎證候因素的組成部分,扶正補(bǔ)虛要考慮益胃滋陰之法,特別是癥見消瘦乏力、口干舌燥、舌紅裂紋、脈數(shù)等類似氣虛與熱并見之象,實(shí)為陰虛表現(xiàn)時(shí)可運(yùn)用如西洋參、沙參、石斛、人參葉等甘涼之品滋陰、清熱、益氣,實(shí)現(xiàn)補(bǔ)而不滯,瀉而不虛的效果。
綜上所述,本研究運(yùn)用隱結(jié)構(gòu)模型、關(guān)聯(lián)規(guī)則算法等數(shù)據(jù)挖掘方法對(duì)CAG患者核心癥狀進(jìn)行分析,得到包括氣虛、濕、血瘀等在內(nèi)的CAG證候要素六種,其所體現(xiàn)出的本虛標(biāo)實(shí)、寒熱錯(cuò)雜的病機(jī)特點(diǎn)與目前共識(shí)所述是一致的[1]。然而某單一或較少的數(shù)據(jù)挖掘方法可能會(huì)因樣本量過少、變量間缺乏相關(guān)性、過度篩選低頻率癥狀、龐大計(jì)算量等問題造成研究結(jié)果失準(zhǔn)[12],這也是無監(jiān)督數(shù)據(jù)挖掘所帶來的局限性。在本研究中,陰虛證候要素的不凸顯也可能與上述因素相關(guān)。因此,為了使研究結(jié)果盡可能地全面、客觀、準(zhǔn)確,需要以后研究考慮多數(shù)據(jù)挖掘方法聯(lián)合應(yīng)用,以達(dá)多角度、多元化、擇優(yōu)借鑒的方式探討CAG相關(guān)規(guī)律,使得數(shù)據(jù)挖掘在中醫(yī)理論、實(shí)踐研究中發(fā)揮更大的客觀性與科學(xué)性。