王 翔,徐煜皓,孫 宇,陸 超
南京醫(yī)科大學(xué)第一附屬醫(yī)院兒科,江蘇 南京 210029
急性淋巴細胞白血?。╝cute lymphoblastic leu-kemia,ALL)是兒童最常見的癌癥類型,占所有白血病的70%~80%,約占兒童癌癥的27.3%[1]。ALL 以未成熟前體細胞克隆性增殖為特征,進展迅速,通常出現(xiàn)時無明顯前驅(qū)癥狀[2]。ALL是在多種因素共同作用下發(fā)生的。目前的研究大多集中在蛋白質(zhì)成分上,對微環(huán)境代謝組如何影響腫瘤存活知之甚少[3]。
代謝組學(xué)是對細胞、生物體液、組織或生物體內(nèi)低分子量(<1 kDa)的內(nèi)源性小分子(通常稱為代謝物)的大規(guī)模研究。代謝組學(xué)與基因組學(xué)、轉(zhuǎn)錄組學(xué)和蛋白質(zhì)組學(xué)一起,在生理和病理過程中推動基因型和表型之間的聯(lián)系,成為生物標志物發(fā)現(xiàn)、藥物開發(fā)和個性化醫(yī)療的有力工具[4]。代謝組學(xué)研究診斷許多疾病的重要性已經(jīng)被證明,如白血病、卵巢癌、食管癌、口腔癌、乳腺癌和前列腺癌等[5]。本研究擬利用廣泛靶向代謝組學(xué)技術(shù)和外顯子測序技術(shù)分析,找到ALL 患者血清代謝組學(xué)的改變,尋找與ALL 相關(guān)的潛在代謝生物標志物及基因改變以指導(dǎo)臨床。
選取2021年9月—2022年5月首次在南京醫(yī)科大學(xué)第一附屬醫(yī)院兒科就診的初發(fā)且未經(jīng)治療的ALL 患兒4 例為ALL 組,選取同期在本院進行體檢的健康兒童4例為對照組。由于代謝產(chǎn)物受多種因素的影響,除疾病本身外,如患者飲食習慣、合并癥和藥物使用情況等均可能對實驗結(jié)果產(chǎn)生影響,在選取病例時參照以下標準:①ALL患兒為初發(fā)患者,尚未接受化療藥物治療;②無代謝性疾病及其他血液性疾??;③無長期服用藥物病史。本研究通過南京醫(yī)科大學(xué)第一附屬醫(yī)院倫理委員會審核(2017-SRFA-091),在研究對象簽署知情同意書的基礎(chǔ)上,進行血樣的采集。
乙腈、甲醇、Formic acid(Millipore 公司,美國);氨水(Merck 公司,美國);乙酸銨(Sigma 公司,美國)。質(zhì)譜儀(AB SCIEX公司,美國);超高壓液相色譜儀(Shimadzu公司,日本);色譜柱(Waters公司,美國);超聲波系統(tǒng)(Diagenode 公司,比利時);真空離心濃縮儀、離心機(Eppendorf公司,德國);可見紫外分光光度計(Thermo公司,美國)。
1.2.1 血清代謝物提取
收集血清樣本,每個樣本各取100 μL,加入100 μL 預(yù)冷的水和800 μL 甲醇/乙腈(2∶2,V/V),渦旋混合,冰浴中超聲30 min,-20 ℃靜置過夜,16 000g4 ℃離心30 min,取上清,上清在高速真空濃縮離心機揮干,樣本復(fù)溶于100 μL 50%甲醇水溶液中,20 000g4 ℃離心30 min,取上清液以備質(zhì)譜進樣分析。
1.2.2 LC-MS檢測
整個分析過程中樣品置于4 ℃自動進樣器中,樣品采用Shimadzu Nexera X2 LC-30AD 超高效液相色譜系統(tǒng)(UHPLC)使用HSS T3 色譜柱進行分離。其中進樣量5 μL,柱溫40 ℃,流速0.2 mL/min;色譜流動相A為0.1%甲酸水溶液,B為乙腈。
每例樣品分別采用電噴霧電離(electrospray ionization,ESI)進行正離子(+)和負離子(-)模式檢測。樣品經(jīng)UPLC 分離后用QTRAP 5500 質(zhì)譜儀進行質(zhì)譜分析,使用HESI 源進行離子化。采用MRM模式檢測待測離子對。
兩組間數(shù)據(jù)利用多元變量統(tǒng)計分析,包括主成分分析(principal component analysis,PCA)、偏最小二乘判別分析(partial least squares discrimination analysis,PLS-DA)、正交偏最小二乘判別分析(OPLS-DA)和單變量統(tǒng)計分析(Student’s-t檢驗和火山圖)進行聯(lián)合分析,本項目使用的卡值標準為P<0.05,同時OPLS-DA 模型第一主成分的變量投影重要度(variable Importance for the projection,VIP)>1。以倍數(shù)變化(fold change,F(xiàn)C)代表ALL 組與對照組的代謝物含量比值,選取FC≥1.5或FC≤0.5變化水平的差異代謝物,然后根據(jù)京都基因和基因組百科全書數(shù)據(jù)庫(Kyoto encyclopedia of genes and genomes,KEGG)進行差異代謝物通路分析以確定顯著變化的代謝途徑。
廣泛靶向代謝組學(xué)標準品正負離子模式下提取離子流色譜圖(extracted ion chromatogram,EIC 或XIC),從圖中可見各代謝物色譜峰分離較好,峰形尖銳對稱,能夠?qū)Ω鞔x物進行質(zhì)譜定量(圖1)。
圖1 標準品混合物XIC圖譜Figure 1 XIC pattern of standard mixtures
2.2.1 PCA、PLS-DA和OPLS-DA分析
將ALL 組和對照組的血清代謝物進行PCA 分析。結(jié)果顯示(圖2),第一主成分(PC1)的貢獻率為29.92%,第二主成分(PC2)的貢獻率為15.58%,兩組樣本表現(xiàn)出明顯的分離趨勢。圖3A 為比對組的PLS-DA得分圖,兩組間差異明顯,圖3B為比對組的PLS-DA 置換檢驗圖,200 次置換檢驗未發(fā)生擬合。模型評價參數(shù)見表1。比對組的R2X 為0.605,R2Y為1,Q2 為0.958,表明本次質(zhì)譜檢測模型的穩(wěn)定性及預(yù)測能力均較好。圖3C、D為OPLS-DA的模型驗證,進行200次置換檢驗,實驗數(shù)據(jù)建立的OPLS-DA模型未發(fā)生過擬合,代表模型非??煽?。上述結(jié)果表明,ALL和對照組的模型穩(wěn)定性和預(yù)測性較好,可用于后續(xù)差異代謝物的篩選。
表1 比對組的PLS-DA模型參數(shù)Table 1 Parameters of PLS-DA model in each group
圖2 比對組PCA得分圖Figure 2 PCA score plot of each group
圖3 比對組的PLS-DA和OPLS-DA得分圖和置換檢驗圖Figure 3 PLS-DA and OPLS-DA score plots and permutation test of OPLS-DA of each group
2.2.2 代謝差異物的篩選
結(jié)果發(fā)現(xiàn),與對照組相比,ALL 組中共篩選出61種差異性代謝物(圖4)。37種代謝物在ALL中表達上升,24種代謝物在ALL中表達降低。這些代謝物來自13個亞組,如氨基酸、多肽和類似物、?;鈮A、鞘脂、類固醇、激素和脂肪酸等(圖4B、D)。熱圖分析示ALL 組氨基酸、脂質(zhì)、核苷酸等代謝物改變明顯(圖4A)。ALL 組表達量上升最顯著的10 種差異代謝物是對甲酚、脫氧膽酸、12-酮石膽酸、7-酮石膽酸、DG(20∶0/20∶0)、24-OH 膽固醇、焦谷氨酰異亮氨酸、莽草酸、硫酸吲哚酯、肉堿-C16OH,表達量下降最顯著的10種差異代謝物是1-吡咯啉-5-羧酸、5-羥色胺,PE(O-18:0/22:5)、PG(16:0/18:1)、SM(34:2;3)、γ-谷氨酰半胱氨酸、亮氨酸、葉酸、SM(40:2;3)、肉堿-C(18:2)(圖4C)。
圖4 差異代謝物分析圖Figure 4 Differential metabolite analysis plot
2.2.3 代謝通路的富集分析
將鑒定出的差異代謝物通過KEGG進行通路分析(圖5)。研究發(fā)現(xiàn)ALL 組的通路富集于細胞過程、環(huán)境信息處理、人類疾病、代謝、生物體系統(tǒng)等一級通路。其中細胞過程富集于縫隙連接等二級通路,環(huán)境信息處理富集于鞘脂信號通路、Ras信號通路、Rap1信號通路、磷脂酶D信號通路、神經(jīng)活性配體-受體的相互作用、cAMP 信號通路、鈣信號通路、Apelin信號通路等二級通路,人類疾病通路富集于前列腺癌、癌癥的途徑、內(nèi)分泌抵抗、EGFR 酪氨酸激酶抑制劑耐藥性、化學(xué)致癌作用-受體激活等二級通路,代謝通路富集于鞘脂代謝、嘌呤代謝、氨基酸的生物合成,丙氨酸、天冬氨酸和谷氨酸的代謝等二級通路,生物體系統(tǒng)通路富集于甲狀腺激素合成、甲狀腺激素信號通路、生熱作用、蛋白質(zhì)消化吸收、催乳素信號通路、卵巢類固醇生成、GnRH分泌、谷氨酸能突觸、FcγR-介導(dǎo)的吞噬作用、雌激素信號通路、內(nèi)分泌和其他因子-調(diào)節(jié)鈣的重吸收、膽汁分泌等二級通路。
圖5 ALL與對照組的差異代謝物參與的通路富集分析Figure 5 Pathway enrichment analysis with differential metabolite participation of ALL and control groups
2.3.1 測序數(shù)據(jù)質(zhì)控結(jié)果
比例均達90%以上,說明堿基錯誤率較低。質(zhì)控結(jié)果如表2 所示。原始測序數(shù)據(jù)下機后經(jīng)過Fastp軟件的處理,過濾掉因測序儀、測序試劑、樣品等多個因素所導(dǎo)致的測序錯誤堿基,本研究8 個樣本有效測序序列(reads)占比均為99%以上,說明測序效果較好,質(zhì)量值大于Q20 的堿基占有效堿基的比例均為97%以上。
表2 樣本測序質(zhì)控結(jié)果統(tǒng)計匯總表Table 2 Summary of sample sequencing quality control results
2.3.2 變異檢測
將Clean Reads 比對到參考基因組(GRCh37/hg19)上,一般情況下若比對率≥95%、深度>10X,該位點處檢測出的突變可信度較高。本實驗8例樣本的比對率和覆蓋度完全滿足后續(xù)對比分析要求(表3)。
表3 比對信息統(tǒng)計表Table 3 Statisical information for ALL and control groups
單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)主要是指在基因組水平上由單個核苷酸變異所引起的DNA序列多態(tài)性,包括單個堿基的轉(zhuǎn)換、顛換等。InDel(insertion and deletion)是小型的插入和缺失的總稱。編碼區(qū)或剪接位點處發(fā)生的插入缺失都可能會改變蛋白的翻譯。移碼變異,其插入或缺失的堿基串的長度為3 的非整數(shù)倍,因此可能導(dǎo)致整個讀框的改變;移碼變異與非移碼變異相比較,前者對基因功能的影響更大,同時受到更大的篩選壓力。本實驗8例樣本各檢測出的SNP及InDel位點數(shù)量如表4所示,合計共222 280個SNP變異位點以及12 610個InDel位點。
表4 變異類型數(shù)量統(tǒng)計Table 4 Statistics of the number of variant types for ALL and control groups(n)
2.3.3 變異篩選及與疾病相關(guān)性的預(yù)測
全外顯子測序后得到的數(shù)據(jù)量極大,但大部分突變不具備致病性,故需要進一步篩選與疾病相關(guān)性更強的變異。根據(jù)保留滿足ALL 組兩位及兩位以上受試者共有并且未在健康對照組中出現(xiàn)的突變位點,8 位受試者共保留SNP 位點957 個,其中479 個為非同義突變,對應(yīng)基因334 個;InDel 位點37個,對應(yīng)28個基因。共有基因8個,分別是GOLGA8H、HOXB1、KIF20B、MUC16、MUC17、MUC4、TNRC6A、ZNF283。對354 個基因進行蛋白互作網(wǎng)絡(luò)分析(PPI)(圖6A)。然后利用Cytoscape 軟件中的“cytohubba"算法篩選出互作關(guān)系前10的基因,分別 為MUC17、MUC12、MUC16、MUC4、B3GNT3、GCNT4、B3GNT4、GALNT12、GALNT15、GALNT5(圖6B),可能為ALL的關(guān)鍵基因。
圖6 差異基因的蛋白互作網(wǎng)絡(luò)(A)和子網(wǎng)絡(luò)圖(B)Figure 6 Protein interaction networks(A)and subnetwork(B)diagrams of differential genes
ALL 是一種罕見的惡性血液病,兒童的發(fā)病率遠高于成人,臨床上ALL表現(xiàn)為骨髓、外周血、淋巴和非淋巴組織中惡性、未成熟的淋巴母細胞增殖和聚集,未經(jīng)治療的ALL患兒會在幾個月內(nèi)死亡[6]。本研究是基于LC-MS對ALL患兒的血液進行研究,找到ALL 患者血清代謝物的改變,尋找與ALL 相關(guān)的潛在代謝生物標志物以指導(dǎo)臨床。新陳代謝改變越來越被認為是癌癥的一個重要表現(xiàn),因此是識別治療靶點或標志物的潛在研究領(lǐng)域[7]。目前對白血病的治療雖然已經(jīng)取得了很大進展,但是很多患兒仍然達不到預(yù)期效果,甚至達不到緩解狀態(tài)。近年血漿代謝方向在白血病中的研究頗多,文獻報道血漿代謝組學(xué)檢測誘導(dǎo)治療后的ALL 患者脂質(zhì)代謝發(fā)生了顯著改變[8]。
本研究發(fā)現(xiàn)相比對照組,ALL 組的差異代謝物主要來源于氨基酸代謝、脂質(zhì)代謝、三羧酸循環(huán)及核苷酸代謝等通路。氨基酸是蛋白質(zhì)的基本組成單位,具有重要的生理功能,一些氨基酸,如酪氨酸、色氨酸、天冬氨酸、谷氨酰胺和甘氨酸分別是合成某些激素、神經(jīng)遞質(zhì)及核苷酸等含氮物質(zhì)的底物,一些氨基酸,如谷氨酸、精氨酸及天冬氨酸等可以轉(zhuǎn)化為α-酮酸參與三羧酸循環(huán)產(chǎn)能等。在ALL組中谷氨酰胺含量顯著升高,谷氨酰胺是3 種參與嘌呤核苷酸從頭合成的酶和2種參與嘧啶核苷酸從頭合成酶所需的底物。谷氨酰胺的表達量提高,可能是ALL 原始細胞合成并分泌谷氨酰胺,從而增加基質(zhì)細胞的細胞外谷氨酰胺可用性[9]。相關(guān)文章報道起源組織、遺傳學(xué)和腫瘤微環(huán)境都會影響癌細胞內(nèi)谷氨酰胺的利用,由于谷氨酰胺合成酶的低表達,一些惡性腫瘤依賴于谷氨酰胺的外源性供應(yīng)。因此,在谷氨酰胺酶的缺失或抑制下,依賴外源性谷氨酰胺供應(yīng)能量的惡性腫瘤將無法利用這種來源的營養(yǎng)物質(zhì)[10]。
ALL 組中5-羥色胺含量較對照組明顯下降,5-羥色胺是一種分子,屬于一類稱為吲哚胺的化合物,存在于所有生物體中,作為單胺神經(jīng)遞質(zhì)、生化信使和調(diào)節(jié)劑起作用。血清素能系統(tǒng)缺乏會導(dǎo)致抑郁癥、強迫癥、恐懼癥、創(chuàng)傷后應(yīng)激障礙、癲癇和廣泛性焦慮等疾病。ALL 組的信號通路富集明顯,可能與5-羥色胺相關(guān)。
ALL 組中葉酸含量較對照組明顯下降,葉酸是維生素B家族的成員,主要被稱為維生素B9。葉酸是人體制造DNA 和RNA 及細胞分裂所必需的。由于人類不能制造葉酸,因此它是飲食中必需的,ALL初期患兒體內(nèi)核苷酸代謝旺盛,可能導(dǎo)致葉酸含量顯著下降。
ALL 組膽汁酸表達量上升,當脫氧膽酸含量足夠高時,脫氧膽酸可作為肝毒素、代謝肉毒毒素和癌代謝物。長期高水平的脫氧膽酸也與多種癌癥有關(guān),包括結(jié)腸癌、胰腺癌、食道癌等胃腸道癌癥。
ALL 組差異代謝物富集于如Rap1 和Ras 等信號通路,Ras突變在B-ALL中有許多文獻報道過,而Rap1 信號通路卻相對較少[11]。絲裂原活化蛋白激酶(MAPK)途徑(其中Ras 是關(guān)鍵調(diào)節(jié)因子)在細胞生長、分化和凋亡中起關(guān)鍵作用,并與多種惡性腫瘤(包括ALL 和急性髓系白血?。┑陌l(fā)病機制有關(guān)。Ras/Raf/MEK/ERK通路基因突變是兒科ALL復(fù)發(fā)時最常見的突變之一[14]。
ALL組全外顯子測序檢測出的關(guān)鍵基因大多來自黏蛋白(mucoprotein,MUC)家族和多肽N-乙酰半乳糖胺基轉(zhuǎn)移酶(polypeptide N-acetylgalactosaminlyltransferase,GALNT)家族。MUC 家族是一組高度糖基化的大分子,在哺乳動物上皮細胞中大量表達。MUC有助于黏液屏障的形成,因此對感染具有保護作用。有趣的是,一些MUC蛋白在癌細胞中異常表達,并參與腫瘤的發(fā)生和發(fā)展,包括細胞生長、增殖、凋亡抑制、化療耐藥、代謝重編程和免疫逃避[12]。GALNT 家族的成員作為催化蛋白質(zhì)黏蛋白型O-糖基化的起始酶起作用,其表達失調(diào)可以改變癌細胞行為,例如腫瘤發(fā)生、增殖、遷移、轉(zhuǎn)移和耐藥性[13]。查閱資料后少見其在ALL 中的研究。未檢測出KRAS、NOTCH1、NRAS 等經(jīng)典突變,考慮可能是樣本量不夠多。部分基因在其他血液疾病中有過報道,如HOXB1在許多急性髓系白血病的原代細胞和細胞系中保持沉默,而在正常終末分化的外周血細胞中表達[15],ANKRD36 是早期慢性粒細胞白血病進展的潛在常見生物標志物和藥物靶點[16]。
綜上,本研究初步篩選了ALL 患者血清內(nèi)源性小分子代謝物和代謝差異物所屬代謝通路,外顯子組學(xué)揭示了蛋白互作數(shù)量排名前10 的基因有MUC17、MUC4 等。由于本研究沒有納入ALL 初次誘導(dǎo)分化后的血清代謝組學(xué)分析,因此無法確認篩選出的61 種代謝物在ALL疾病發(fā)展過程中的意義。在今后的研究中,有望通過ALL初次就診和ALL治療后的兒童,分析其血清代謝組學(xué)特征,篩選出ALL患者特異的生物標志物,為未來的精準醫(yī)學(xué)靶向治療提供依據(jù)。