馬占君, 李振國(guó), 王 歡, 王仁軍, 韓曉菲*
(1.大連大學(xué)生命科學(xué)與技術(shù)學(xué)院,遼寧省糖脂代謝研究重點(diǎn)實(shí)驗(yàn)室,大連合成生物學(xué)重點(diǎn)實(shí)驗(yàn)室,遼寧 大連 116622;2.大連醫(yī)科大學(xué)附屬第二醫(yī)院,遼寧 大連 116023)
結(jié)腸癌(colon cancer,CC)已經(jīng)成為全球僅次于肺癌和乳腺癌的第三大惡性腫瘤,其發(fā)病不僅與年齡[1]、性別相關(guān),還與遺傳[2]、免疫和環(huán)境因素有關(guān),如炎癥[3]、飲酒[4]等,對(duì)生命和生活造成嚴(yán)重威脅。僅2018年就有大約200萬(wàn)病例被確診為CC[5]。有研究證實(shí),CC的發(fā)生發(fā)展與高脂低纖維飲食有著密切的聯(lián)系[6,7]。我國(guó)經(jīng)濟(jì)的快速發(fā)展以及西方飲食文化的滲入,一定程度上提高了我國(guó)的CC患病率。結(jié)腸鏡檢查是CC診斷的“金標(biāo)準(zhǔn)”[8],但它是侵入性的,可能引起患者的不適?;谘簷z測(cè)的標(biāo)記物如癌胚抗原和癌癥抗原可以用來(lái)監(jiān)測(cè)疾病以及對(duì)于治療的反應(yīng),但是其敏感性和特異性較低,因此不太適合用作早期篩查和診斷[9]。糞便潛血試驗(yàn)(FOBT)和免疫組化試驗(yàn)(FIT)是基于糞便的DNA檢測(cè)。其中FIT對(duì)CC有78%的敏感性和96%的特異性[10],但是人們厭惡處理糞便樣本,導(dǎo)致檢測(cè)存在一定程度的挑戰(zhàn)。因此發(fā)掘更加有效、能被廣泛接受的標(biāo)志物對(duì)于開(kāi)展CC早期診斷和干預(yù)跟蹤有重大意義。
膽固醇是細(xì)胞膜的重要組成部分,約占質(zhì)膜脂質(zhì)的20%,由于其在細(xì)胞中的特殊位置,對(duì)體內(nèi)任何細(xì)胞新陳代謝可能都有未知的協(xié)調(diào)作用,同時(shí)在調(diào)節(jié)細(xì)胞膜流動(dòng)性、細(xì)胞增殖等方面也發(fā)揮著關(guān)鍵作用[11]。一項(xiàng)研究表明,膽固醇是雌激素受體相關(guān)受體α(ERRα)的內(nèi)源性配體(多種癌癥的重要調(diào)節(jié)劑[12])。一項(xiàng)與疾病相關(guān)的遺傳因素研究證實(shí)了高膽固醇水平與CC風(fēng)險(xiǎn)之間的聯(lián)系[13]。氧固醇是膽固醇的氧化衍生物,雖然氧固醇的生理功能尚不清楚,但在惡性腫瘤中起著重要作用[14]。對(duì)CC細(xì)胞系的研究表明,不同類型的氧固醇對(duì)細(xì)胞生命有不同的影響,有的能夠促進(jìn)細(xì)胞凋亡,有的能夠抑制細(xì)胞增殖[15]。血清中的氧固醇含量非常低,大約是膽固醇含量的1/106~1/104[16]。如果濃度過(guò)高,會(huì)對(duì)細(xì)胞產(chǎn)生毒性作用,所以在健康機(jī)體中,過(guò)量的氧固醇被輸送到肝臟,在那里轉(zhuǎn)化為膽汁酸,重新進(jìn)入人體循環(huán)[17]。因此,這些通路中涉及的基因或酶的突變或表達(dá)水平的變化極有可能誘發(fā)CC。
近年來(lái)代謝組學(xué)的發(fā)展極為迅速,結(jié)合代謝組學(xué)分析研究疾病的發(fā)生發(fā)展已經(jīng)成為必不可少的一步。本文通過(guò)將液相色譜-串聯(lián)質(zhì)譜聯(lián)用鑒定的代謝物導(dǎo)入代謝組學(xué)分析軟件,篩選CC潛在標(biāo)志物,期望能夠?yàn)镃C的臨床診斷提供思路。
液相色譜儀配自動(dòng)進(jìn)樣器、Surveyor MS Pump plus溶劑運(yùn)輸泵和Hypersil GOLD C18柱(150 mm×2.1 mm,5 μm,Thermo Electron),TSQ Quantum Access Max三重四極桿質(zhì)譜儀(Thermo Fisher Scientific,美國(guó));G-560E渦旋振蕩儀(Scientific Industries,美國(guó));5804R離心機(jī)(Eppendorf,德國(guó));OA-SYS N-EVAP111氮吹儀(Organomation Associates,美國(guó));恒溫水浴鍋(Fisher Scientific,美國(guó));Milli-Q超純水系統(tǒng)(Millipore,美國(guó))。
氧固醇標(biāo)準(zhǔn)品(純度均≥98%),包括24-羥基膽固醇(24-OHC)、7α-羥基膽固醇(7α-OHC)、7-酮基膽固醇(7-KC)、25-羥基膽固醇(25-OHC)、4β-羥基膽固醇(4β-OHC)、3β,5α,6β-三羥基膽固醇(Triol)、19-羥基膽固醇(19-OHC)(Toronto Research Chemicals,加拿大);20α-羥基膽固醇(20α-OHC)、22β-羥基膽固醇(22β-OHC)、5β,6β-環(huán)氧膽固醇(5β,6β)(Sigma-Aldrich,美國(guó));5α,6α-環(huán)氧膽固醇(5α,6α)(Tokyo Chemical Industry,日本);27-羥基膽固醇(27-OHC)(Tocris Bioscience,英國(guó));膽固醇和氫氧化鉀(百靈威,中國(guó));甲酸、甲醇、乙腈均為色譜純;4-二甲氨基吡啶、吡啶甲酸、吡啶、三乙胺、2,6-二叔丁基-4-甲基苯酚(BHT)(Sigma-Aldrich,美國(guó));2-甲基-6-硝基苯酸酐(Bide Pharmatech,中國(guó))。
CC組(n=13)和健康對(duì)照組(HC,n=29)血液樣本均來(lái)自大連醫(yī)科大學(xué)附屬第二醫(yī)院,所有受試者的臨床樣本信息見(jiàn)表1。研究涉及的血液樣本及程序均獲得大連大學(xué)倫理委員會(huì)批準(zhǔn)。血液樣本室溫下靜置,凝固之后在3 500 r/min下離心15 min,收集上清液即為血清,之后將得到的血清樣本儲(chǔ)存于-80 ℃,待LC-MS/MS分析。
表1 血清樣本的臨床信息Table 1 Clinical information of serum samples
準(zhǔn)確稱取適量的氧固醇標(biāo)準(zhǔn)品,配制成1.5 mg/mL儲(chǔ)備液。取氧固醇儲(chǔ)備液,用乙腈制成2.5 μg/mL混合標(biāo)準(zhǔn)中間液。19-羥基膽固醇用乙腈制備成2.5 μg/mL內(nèi)標(biāo)中間液和0.25 μg/mL內(nèi)標(biāo)工作液。用移液槍按一定比例取適量的混合標(biāo)準(zhǔn)中間液和內(nèi)標(biāo)中間液,分別制成5、10、20、50、100、200 ng/mL的混合標(biāo)準(zhǔn)工作液。
準(zhǔn)確移取50 μL血清樣品,加入10 μL內(nèi)標(biāo)、10 μL BHT乙醇溶液(0.02 mol/L)和150 μL氫氧化鉀乙醇溶液(1 mol/L),之后在37 ℃水浴中反應(yīng)1 h。再向其中加入蒸餾水和正己烷,4 000 r/min下離心5 min,取上清液并用氮?dú)獯蹈?。吹干后加入衍生化試?-甲基-6硝基苯酸酐(1 mg)、4-二甲氨基吡啶(3 mg)、吡啶甲酸(8 mg)、吡啶(150 μL)、三乙胺(20 μL),置于37 ℃水浴反應(yīng)2 h。為提取氧固醇衍生物,向反應(yīng)后的混合物中加入1 mL正己烷,渦旋30 s混勻,4 000 r/min下離心5 min,收集上清液并在氮?dú)饬飨麓蹈伞V笥?00 μL乙腈復(fù)溶,取10 μL上樣。
Hypersil GOLD C18柱(150 mm×2.1 mm,5 μm,Thermo Electron);色譜流動(dòng)相組成:A(1%甲酸)-B(超純水)-C(甲醇)-D(乙腈)。色譜梯度洗脫條件如下[18]:0~15.0 min,5%A,15%B,10%C,70%D;15.0~15.2 min,5%A,10%C,85%D;15.2~20.2 min,10%C,90%D;20.2~26.0 min,5%A,15%B,10%C,70%D。質(zhì)譜參數(shù)設(shè)置:正離子模式檢測(cè),噴霧電壓為3 500 V,蒸發(fā)器溫度保持在300 ℃,碰撞氣體(氬氣)壓力固定在0.2 Pa。鞘氣和輔助氣均為氮?dú)?各自壓力保持在0.207 MPa和0.103 MPa。LC-MS/MS其他分析條件見(jiàn)文獻(xiàn)[18]。
采用質(zhì)譜儀配有的Xcalibur 2.1軟件對(duì)數(shù)據(jù)進(jìn)行采集與處理。最終將獲得的數(shù)據(jù)導(dǎo)入MetaboAnalyst 5.0平臺(tái)(https://www.metaboanalyst.ca/MetaboAnalyst/ModuleView.xhtml)進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化,并使用其中的統(tǒng)計(jì)學(xué)和生物標(biāo)志物分析功能模塊執(zhí)行最小二乘判別分析(PLS-DA)、正交偏最小二乘判別分析(OPLS-DA)以及受試者操作特征曲線(ROC)繪制。最后為了解篩選到的代謝物在體內(nèi)的相關(guān)代謝通路,闡明其在CC發(fā)病中的機(jī)制,我們使用GeneCards網(wǎng)站(https://www.genecards.org/)檢索代謝物相關(guān)基因,進(jìn)行后續(xù)的GO(基因本體論,gene ontology)功能注釋和KEGG(京都基因與基因組百科全書(shū),Kyoto Encyclopedia of Genes and Genomes)通路分析。富集分析的參數(shù)設(shè)置如下:最小重疊為3;截?cái)郟值<0.01;最小富集系數(shù)為1.5。
通過(guò)LC-MS/MS對(duì)CC患者和健康對(duì)照者血清中10種氧固醇進(jìn)行了定性定量分析,并使用GraphPad Prism 8.3.0對(duì)兩組間的代謝物進(jìn)行顯著性差異分析(P<0.05代表有顯著性差異),結(jié)果見(jiàn)表2。
表2 CC組和HC組的血清膽固醇和氧固醇含量差異分析Table 2 Difference analysis of serum cholesterol and oxysterols between CC and HC groups
通過(guò)MetaboAnalyst的統(tǒng)計(jì)學(xué)模塊對(duì)兩組樣本的所有代謝物進(jìn)行PLS-DA和OPLS-DA分析,可以看出兩組樣本均能夠得到較好的分離(見(jiàn)圖1)。對(duì)于PLS-DA模型,除了得分圖以外,另一個(gè)重要的指標(biāo)是變量投影重要性(VIP)。每一種代謝物的VIP值如圖2a所示,代謝物VIP值越大,代表其對(duì)該模型的貢獻(xiàn)度越大。依據(jù)每個(gè)組分對(duì)于模型的解釋度,越靠后的組分解釋度越低,因此我們選擇了前8個(gè)組分進(jìn)行10倍交叉驗(yàn)證(cross-validation,CV)。由于Q2表示模型的可預(yù)測(cè)性和準(zhǔn)確性,我們選擇了Q2來(lái)評(píng)估模型的性能。基于CV結(jié)果,我們發(fā)現(xiàn)當(dāng)組分?jǐn)?shù)量為3時(shí)(見(jiàn)圖2b),模型的性能最好。為了防止數(shù)據(jù)過(guò)度擬合,我們還對(duì)代謝物進(jìn)行了K-均值聚類(見(jiàn)表3),最終選擇每一類別中VIP值較大的化合物作為后續(xù)ROC曲線的聯(lián)合標(biāo)志物組,它們分別是4β-OHC、Triol、膽固醇。
圖1 CC組和HC組的PLS-DA和OPLS-DA模型Fig.1 Partial least square discriminant analysis (PLS-DA)and orthogonal partial least square discriminant analysis (OPLS-DA)models of CC and HC groups
圖2 PLS-DA模型的(a)VIP值和(b)最優(yōu)組分Fig.2 (a)Variable importance in the projection (VIP)values and (b)optimal compositions of the PLS-DA model*The optimal compositions of the PLS-DA model selected according to Q2.
表3 代謝物的K-均值聚類Table 3 K-mean clusters of the metabolites
ROC曲線是一種二元分類器,能夠用于分析陽(yáng)性/陰性、有病/無(wú)病等情況。該研究利用篩選出的3種生物標(biāo)志物聯(lián)合繪制ROC曲線(見(jiàn)圖3),曲線下面積(AUC)可以用來(lái)判斷該分類器的性能。一般認(rèn)為AUC值>0.5時(shí),其值越接近于1,說(shuō)明此分類器的診斷效果越好。圖3的AUC為0.998,表明聯(lián)合3種代謝物預(yù)測(cè)CC的效果較好。
圖3 聯(lián)合4β-OHC、Triol、膽固醇繪制ROC曲線Fig.3 Receiver operating characteristic (ROC)curve with 4β-OHC,Triol and cholesterolCI:confidence interval.
我們使用GeneCards網(wǎng)站檢索了4β-OHC、Triol和膽固醇的相關(guān)基因。由于與膽固醇相關(guān)的基因數(shù)目很多,我們選擇了前100個(gè)基因進(jìn)行后續(xù)分析。我們利用Metascape (https://metascape.org/gp/index.html#/main/step1)和微生信在線軟件(http://www.bioinformatics.com.cn/)識(shí)別到了110個(gè)基因中的103個(gè)人源基因,并對(duì)其進(jìn)行了GO注釋和KEGG通路分析。GO分析結(jié)果表明,代謝物相關(guān)基因主要參與的生物過(guò)程是膽固醇代謝、運(yùn)輸、調(diào)節(jié)脂蛋白沉積和重塑。它們所執(zhí)行的分子功能是膽固醇運(yùn)輸活性和低密度脂蛋白顆粒受體結(jié)合,定位于內(nèi)質(zhì)網(wǎng)和包被囊泡(見(jiàn)圖4a)。通路分析表明,最顯著富集的途徑是類固醇生物合成、PPAR(過(guò)氧化物酶體增殖物激活受體)信號(hào)通路和ABC(ATP結(jié)合盒)轉(zhuǎn)運(yùn)(見(jiàn)圖4b)。
通過(guò)LC-MS/MS對(duì)CC患者血清氧固醇的定性、定量,結(jié)合代謝組學(xué)多維度分析,篩選出4β-OHC、Triol、膽固醇作為CC的潛在生物標(biāo)志物,且這3種代謝物建立的分類器性能良好,為臨床診斷和治療疾病提供了可能。此外,對(duì)標(biāo)志物的通路分析揭示了其參與的相關(guān)生物學(xué)進(jìn)程,有助于更好地闡明CC的發(fā)病機(jī)理。