冷 冬 李桂芹 王 穎 繆 冉 陳 鐸 黃驍舾*
(1.首都醫(yī)科大學(xué)附屬北京朝陽醫(yī)院檢驗(yàn)科, 北京 100020;2.首都醫(yī)科大學(xué)附屬北京朝陽醫(yī)院疾病預(yù)防控制處, 北京 100020;3. 首都醫(yī)科大學(xué)附屬北京朝陽醫(yī)院醫(yī)學(xué)研究中心, 北京 100020;4. 首都醫(yī)科大學(xué)附屬北京朝陽醫(yī)院呼吸與危重癥醫(yī)學(xué)科, 北京 100020)
肺纖維化(pulmonary fibrosis,PF)是一類相對(duì)罕見的致死間質(zhì)性肺疾病。這類疾病的臨床表現(xiàn)主要包括呼吸急促、肺功能受限、肺損傷以及X線胸片上廣泛的陰影等[1]。大約三分之一的間質(zhì)性肺疾病與環(huán)境和工作因素相關(guān),如吸煙和粉塵或特殊化學(xué)品的吸入,其余三分之二的病因尚不清楚[2]。尋找有效的預(yù)測(cè)指標(biāo)顯得尤為關(guān)鍵和緊迫。
能夠預(yù)測(cè) PF 風(fēng)險(xiǎn)的指標(biāo)包括血清生物標(biāo)志物、肺功能及影像學(xué)特征。代表性的標(biāo)志物包括表面活性蛋白A和D,肺泡細(xì)胞表面抗原KL6和乳酸脫氫酶[2]。這些標(biāo)志物在間質(zhì)性肺疾病患者血中的含量上升,由于可重復(fù)性差、偏倚以及特異性不高等問題它們很難作為有效的生物標(biāo)志物。乳酸脫氫酶(lactic dehydrogenase,LDH)是一種常用的臨床生物化學(xué)檢測(cè)指標(biāo),它是一種分泌到細(xì)胞外的胞質(zhì)蛋白酶類,可以用來提示因損傷、細(xì)菌毒素暴露以及饑餓引起的細(xì)胞死亡,因此也常被用于監(jiān)測(cè)肺損傷和炎性反應(yīng)。α-羥丁酸脫氫酶(α-hydroxybutyric dehydrogenase,HBDH)是存在于心臟的LDH的同工酶,曾被報(bào)道[3]可以用于提示肺部炎性反應(yīng)。對(duì)血漿中LDH、HBDH、白介素-8的含量及白介素-6/白介素-10比值的聯(lián)合檢測(cè)可以用于肺孢子菌肺炎艾滋病患者的死亡風(fēng)險(xiǎn)評(píng)估。盡管目前采用單獨(dú)檢測(cè)血清中LDH或者其同工酶很難有效預(yù)測(cè)間質(zhì)性肺疾病,但聯(lián)合檢測(cè)LDH和其他血清生物化學(xué)指標(biāo),將會(huì)對(duì)從血清學(xué)角度預(yù)測(cè)肺纖維化產(chǎn)生積極影響。
臨床血清生物化學(xué)檢測(cè)可為呼吸系統(tǒng)疾病的診斷提供有關(guān)代謝相關(guān)的一般信息[4]。與基因表達(dá)數(shù)據(jù)相類似,生物化學(xué)檢測(cè)數(shù)據(jù)也具有高維度特點(diǎn),并可以進(jìn)行數(shù)據(jù)挖掘分析?;蛐酒瑪?shù)據(jù)分析已經(jīng)在呼吸系統(tǒng)疾病的研究中成功應(yīng)用,但目前還沒有對(duì)臨床生物化學(xué)檢測(cè)數(shù)據(jù)進(jìn)行挖掘分析的報(bào)道。本研究收集PF患者和健康對(duì)照組的血清生物化學(xué)檢測(cè)數(shù)據(jù),采用數(shù)據(jù)挖掘的方法進(jìn)行數(shù)據(jù)建模分析。研究結(jié)果將為PF的早期診斷提供有益線索。
從首都醫(yī)科大學(xué)附屬北京朝陽醫(yī)院檢驗(yàn)科臨床實(shí)驗(yàn)室報(bào)告系統(tǒng)搜集到臨床診斷為肺纖維化的患者生物化學(xué)檢測(cè)結(jié)果29份(患者年齡39~92歲)和健康對(duì)照組生物化學(xué)檢測(cè)結(jié)果55份(患者年齡50~87歲)。PF的臨床診斷符合美國(guó)胸科學(xué)會(huì)診斷標(biāo)準(zhǔn)[5],其中包括特發(fā)性肺纖維化、結(jié)締組織病相關(guān)PF、風(fēng)濕類疾病相關(guān)PF、干燥綜合征相關(guān)PF、血管炎相關(guān)PF和PF類病例。由于樣本數(shù)量限制,本研究?jī)H將各類PF病例作為一大類樣本與健康對(duì)照進(jìn)行比較分析。首都醫(yī)科大學(xué)附屬北京朝陽醫(yī)院醫(yī)學(xué)倫理委員會(huì)通過了關(guān)于采集患者檢查結(jié)果用于臨床研究的申請(qǐng)(2017-Science-10)。
所有血清樣本均檢測(cè)34個(gè)常用的生物化學(xué)指標(biāo),采用Z-計(jì)分指數(shù)化方法將數(shù)據(jù)進(jìn)行歸一化處理,該方法已被成功用于基因芯片數(shù)據(jù)分析。在數(shù)據(jù)歸一化處理過程中,各變量與該指標(biāo)的算術(shù)平均數(shù)的差值與標(biāo)準(zhǔn)差的比值被作為該樣本歸一化處理后的數(shù)據(jù)。與原始數(shù)據(jù)相比,數(shù)據(jù)經(jīng)過歸一化處理后轉(zhuǎn)變?yōu)闊o量綱化數(shù)據(jù),變量中位數(shù)處于同一水平,這使得樣本間各檢測(cè)指標(biāo)可進(jìn)行直接比較。處理后的數(shù)據(jù)加上一個(gè)最小正整數(shù)可使所有數(shù)據(jù)為非負(fù)數(shù),再將轉(zhuǎn)變后的數(shù)據(jù)可以通過Log2轉(zhuǎn)換,使數(shù)據(jù)趨于正態(tài)分布并使隨機(jī)變量趨于恒定,方便圖形展示。
PF與對(duì)照組樣本的生物化學(xué)檢測(cè)數(shù)據(jù)是一組高維度數(shù)據(jù),每一個(gè)生物化學(xué)檢測(cè)指標(biāo)與其他檢測(cè)指標(biāo)可能存在一定的聯(lián)系。主成分分析可以對(duì)數(shù)據(jù)進(jìn)行降維處理,可計(jì)算出用于鑒別PF與對(duì)照組樣本數(shù)據(jù)的主成分。同時(shí)也可計(jì)算出檢測(cè)指標(biāo)在主成分上的荷載。貝葉斯回歸分析可進(jìn)一步分析各主成分的顯著程度。本研究采用Students’ttest(美國(guó)微軟 http://products.office.com/)分析PF與對(duì)照組樣本間的差異有統(tǒng)計(jì)學(xué)意義生物化學(xué)指標(biāo)(P<0.05),累計(jì)貢獻(xiàn)率>80%的主成分被定義為可描述肺纖維化與對(duì)照組樣本分類的主成分,而樣本分類中的差異有統(tǒng)計(jì)學(xué)意義主成分可通過貝葉斯回歸分析進(jìn)行判定(P<0.05)。荷載系數(shù)大于0.6的生物化學(xué)指標(biāo)被定義為PF特征性生物化學(xué)檢測(cè)指標(biāo)。本研究中的數(shù)據(jù)分析是采用在R語言3.2.3環(huán)境下的pr和arm數(shù)據(jù)包完成的(http://www/r-project.org/,http://www.bioconductor.org/)[6]。PF特征性生物化學(xué)指標(biāo)的鑒別效果通過雙向聚類分析軟件Cluster3.0(http://bonsai.hgc.jp/~mdehoon/software/cluster/software.htm)和Java Treeview(http://jtreeview.sourceforget.net)進(jìn)行展示,該軟件是基于歐氏距離相似性度量與完全連鎖算法運(yùn)行的。
為了驗(yàn)證特征性生物化學(xué)指標(biāo)的判別能力,本研究采用貝葉斯判別方法對(duì)數(shù)據(jù)進(jìn)行深入分析。本研究中的特征性生物化學(xué)指標(biāo)被用于構(gòu)建樣本類型鑒別方程,采用SPSS 20.0軟件構(gòu)建具有特殊鑒別系數(shù)的PF與對(duì)照組樣本類型函數(shù)。隨機(jī)的血清樣本可根據(jù)該方程來判斷傾向于PF或者傾向于非PF健康對(duì)照類樣本屬性。如果血清樣本的PF方程函數(shù)值高于其健康對(duì)照函數(shù)值,則判定該血清樣本的患者屬于PF血清生物化學(xué)判別高風(fēng)險(xiǎn)人群。本研究同時(shí)進(jìn)行受試者操作特征(receiver operating characteristic,ROC)曲線分析,判斷PF特征性生物化學(xué)指標(biāo)的敏感度與特異度。具有較大ROC曲線下面積的生物化學(xué)指標(biāo)被認(rèn)定為更有效的PF診斷指標(biāo)。
采用Students’ttest方法(微軟Excel軟件)對(duì)PF病例組和正常對(duì)照組生物化學(xué)檢驗(yàn)數(shù)據(jù)進(jìn)行差異分析,P<0.05的生物化學(xué)檢測(cè)指標(biāo)為差異有統(tǒng)計(jì)學(xué)意義指標(biāo)。采用主成分分析和貝葉斯回歸分析的方法(R命令,R3.2.3版本軟件)提取可顯著區(qū)分PF病例組和正常對(duì)照組樣本的主成分,P<0.05的主成分為顯著主成分,荷載系數(shù)>0.6的生物化學(xué)指標(biāo)為特征性生物化學(xué)指標(biāo)。采用SPSS 20.0軟件進(jìn)行ROC分析,具有較大ROC曲線下面積的生物化學(xué)指標(biāo)被認(rèn)定為更有效的PF診斷指標(biāo),計(jì)算其敏感度與特異度。
從臨床報(bào)告系統(tǒng)中搜集到臨床診斷為PF與正常對(duì)照組的生物化學(xué)檢驗(yàn)報(bào)告,正常對(duì)照組樣本的各生物化學(xué)檢測(cè)值均不超出報(bào)告參考區(qū)間。整合后的數(shù)據(jù)經(jīng)過對(duì)數(shù)轉(zhuǎn)換,數(shù)據(jù)中各檢驗(yàn)指標(biāo)的中位數(shù)差異從0~300放縮到2.0~2.5(表1)。各樣本生物化學(xué)檢測(cè)數(shù)據(jù)可以直接比較。經(jīng)過Students’ttest分析,PF與正常對(duì)照組樣本比較,34個(gè)常用的生物化學(xué)指標(biāo)中有12個(gè)差異有統(tǒng)計(jì)學(xué)意義(P<0.05)(表2)。
表1 臨床生物化學(xué)檢測(cè)數(shù)據(jù)歸一化處理前、后中位數(shù)Tab. 1 Median of clinical biochemistry test data before and after normalization
表2 肺纖維化與正常對(duì)照間特征性生物化學(xué)指標(biāo)Tab.2 Serum biochemistry parameters differing between patients with PF and healthy controls
經(jīng)過主成分分析結(jié)合貝葉斯回歸分析,在有12個(gè)特征性生化指標(biāo)的數(shù)據(jù)中,前7個(gè)主成分的累計(jì)貢獻(xiàn)率>80%,其中顯著主成分包括PC1(P<0.001),PC2(P<0.01)和PC5(P<0.05)。PF患者血清樣本與正常對(duì)照組血清樣本可以在以這3個(gè)差異有統(tǒng)計(jì)學(xué)意義的主成分為坐標(biāo)的圖中明顯區(qū)分開(圖1)。
圖1 各樣本在3個(gè)顯著主成分上的定位Fig.1 Locations of samples on the three significantly altered principle components
12個(gè)特征性生物化學(xué)指標(biāo)在3個(gè)顯著主成分上的荷載系數(shù)見表3。其中有6個(gè)特征性生物化學(xué)指標(biāo)在PC1上的荷載系數(shù)的絕對(duì)值>0.6,分別為荷載系數(shù)為正的白蛋白 (albumin,ALB),鈣 (calcium,Ca),前白蛋白 (pre-albumin,PAB),白蛋白與球蛋白之比(albumin to globulin ratio,A∶G),其中荷載系數(shù)為負(fù)的有HBDH和LDH。HBDH、LDH和總膽固醇在PC2上的荷載系數(shù)的絕對(duì)值>0.6。PC5上沒有荷載系數(shù)絕對(duì)值大于0.6的特征性生物化學(xué)指標(biāo)。非監(jiān)督性聚類分析顯示,6個(gè)特征性生物化學(xué)指標(biāo)構(gòu)成血清生物化學(xué)檢測(cè)數(shù)據(jù)中,PF樣本與正常對(duì)照組樣本能夠較明顯的區(qū)分開,PF樣本的分辨率為93.10%(27/29),正常對(duì)照組樣本的分辨率為72.73%(40/55)(圖2)。
表3 12個(gè)特征性生物化學(xué)指標(biāo)在前3個(gè)顯著主成分上的荷載系數(shù)Tab.3 Loading coefficients of the twelve significant changed indexes on the first three principle components
圖2 樣本根據(jù)6個(gè)特征性生物化學(xué)指標(biāo)數(shù)據(jù)的雙向聚類熱圖Fig.2 Two-way clustering heat map of the six significantly altered biochemistry parameter data
用PC1的6個(gè)特征性生物化學(xué)指標(biāo)構(gòu)建了PF和正常對(duì)照血清生物化學(xué)判別函數(shù)。FPF=-117.423 + 63.601×HBDH + 12.166×ALB-11.059 × LDH + 17.867 × PAB + 5.776 × A:G + 12.790 ×Ca;FHealthy=-116.557 + 58.243 × HBDH + 13.468 × ALB-10.819 × LDH + 19.623 × PAB + 7.674 × A:G + 12.771 × Ca。其中具有較大貝葉斯判別系數(shù)絕對(duì)值的特征性生物化學(xué)指標(biāo)具有相對(duì)較強(qiáng)的判別能力。HBDH的貝葉斯判別系數(shù)絕對(duì)值,具有將PF從正常對(duì)照組樣本中區(qū)分開的判別能力。特征性生物化學(xué)指標(biāo)的ROC曲線見圖3。在6個(gè)特征生物化學(xué)指標(biāo)ROC曲線下面積分別為: HBDH=0.794(敏感度為0.759,特異度為0.818),LDH=0.769(敏感度為0.724,特異度為0.764),Ca=0.405,A:G=0.291,PAB=0.284,ALB=0.217。
圖3 受試者操作特征曲線分析Fig.3 Receiver operating characteristic (ROC) curve analysis
本研究以臨床生物化學(xué)檢驗(yàn)數(shù)據(jù)為依據(jù),運(yùn)用生物信息學(xué)技術(shù)成功構(gòu)建了用于預(yù)測(cè)PF風(fēng)險(xiǎn)的生物化學(xué)檢驗(yàn)數(shù)據(jù)模型?;谠撃P停迳锘瘜W(xué)檢測(cè)可用于監(jiān)測(cè)PF引起的體內(nèi)血液成分的改變。發(fā)現(xiàn)了區(qū)分PF和正常對(duì)照組樣本的特征性生物化學(xué)指標(biāo),將為PF診斷提供數(shù)據(jù)支持。
LDH和HBDH是兩個(gè)具有較強(qiáng)特異性診斷意義的生物化學(xué)指標(biāo)。LDH是無氧糖酵解和糖異生過程中的氫轉(zhuǎn)移酶,其5種LDH的同工酶(LDH-1-LDH-5)構(gòu)成的同型模式可用于肺部疾病的診斷[7]。有研究[8]顯示,血清中LDH-3水平的升高出現(xiàn)在肺損傷之后,因此常被認(rèn)為是急性肺損傷的判斷指標(biāo)。而又有研究[9]顯示支氣管肺泡灌洗液中的LDH水平能夠用于鑒別肺結(jié)節(jié)病的良性與惡性。盡管LDH曾被報(bào)道是多種間質(zhì)性肺疾病的潛在生物標(biāo)志物[10],但最終因特異性差的原因而沒有被廣泛應(yīng)用。本研究結(jié)果仍然顯示LDH區(qū)分肺纖維化與正常對(duì)照血清的能力較低,這是由于和細(xì)胞損傷相關(guān)的許多因素可能引起血清中LDH的改變,如過熱或者過冷條件下的局部缺血,饑餓或者化學(xué)品中毒等[3]。
HBDH是LDH的同工酶,它與α-酮丁酸具有高親和性,并在心肌組織中含量豐富,尤其在患有心肌疾病患者的血清中含量明顯偏高。有研究[11]顯示,肺心病患者血清中HBDH與LDH的比值能夠作為心肌組織損傷的標(biāo)記性指標(biāo)。也有研究[12]顯示,呼吸衰竭患者血清中的LDH和HBDH緩慢上升,主要是由于細(xì)胞損傷造成了血碳酸過高及線粒體功能不全,ATP合成下降,鈉離子泵功能紊亂和細(xì)胞腫脹,由此引發(fā)的膜通透性增加及最終的酶滲出。另外,HBDH與LDH也可作為預(yù)測(cè)艾滋病患者發(fā)生卡氏肺孢子菌肺炎嚴(yán)重程度及病死率的潛在標(biāo)志物[3],但因特異性不強(qiáng)而沒有被進(jìn)一步應(yīng)用。本研究結(jié)果與之前的結(jié)果類似,但通過對(duì)血清生物化學(xué)數(shù)據(jù)進(jìn)行挖掘分析,從數(shù)據(jù)模型角度揭示了HBDH和LDH與PF的相關(guān)性。
本研究從臨床生物化學(xué)檢測(cè)數(shù)據(jù)中提取PF的一般特征?;诟嗖煌愋蚉F樣本的研究將會(huì)在準(zhǔn)確甄別各類PF方面取得新的突破。本研究結(jié)果顯示,HBDH是將PF血清樣本從正常對(duì)照中區(qū)分開的最有效常用生物化學(xué)檢測(cè)指標(biāo)。更多關(guān)于HBDH在PF診斷方面的研究(如質(zhì)譜學(xué)),或者與其他血清標(biāo)志物(如LDH)的聯(lián)合應(yīng)用,將進(jìn)一步明確其在PF診斷方面的價(jià)值。