何祉安, 林厚維, 桂 娟, 朱偉超, 何建華, 汪 航, 馮 蕾*
(1.上海交通大學(xué)藥學(xué)院,上海 200240;2.上海交通大學(xué)分析測試中心,上海 200240;3.上海交通大學(xué)醫(yī)學(xué)院附屬新華醫(yī)院小兒泌尿外科,上海 200092;4.嘉興學(xué)院附屬嘉興市婦幼保健院小兒外科,浙江 嘉興 314051;5.寧波大學(xué)醫(yī)學(xué)院附屬醫(yī)院小兒外科 浙江 寧波 315020)
代謝組學(xué)(metabolomics)是通過對某一生物或細(xì)胞內(nèi)所有相對分子質(zhì)量較低(<1 000)的代謝物質(zhì)進(jìn)行定性和定量分析,進(jìn)而將內(nèi)外因素作用下產(chǎn)生的代謝物質(zhì)的動(dòng)態(tài)變化與生理病理相關(guān)聯(lián)的學(xué)科[1]。作為系統(tǒng)生物學(xué)的最下游,代謝組學(xué)反映了生物體受到各種內(nèi)外環(huán)境擾動(dòng)后的實(shí)際狀態(tài)和不同個(gè)體之間的表型差異[2]。超高效液相色譜-高分辨質(zhì)譜技術(shù)(UPLC-HRMS)具有靈敏度高、分析通量大、覆蓋范圍廣的優(yōu)勢,是代謝組學(xué)采用的主要技術(shù)之一[3]。代謝組學(xué)在生物醫(yī)學(xué)領(lǐng)域具有廣泛的應(yīng)用,例如尋找早期診斷疾病的關(guān)鍵指征、評估手術(shù)預(yù)后的生物標(biāo)志物和開發(fā)新的藥物等[4,5]。
尿液在臨床上易大量獲取,并且與血液相比,受蛋白質(zhì)、脂質(zhì)的干擾小且可避免人體的侵入性傷害,是臨床代謝組學(xué)長期關(guān)注的體液樣本[6,7]。尿液中的內(nèi)源性代謝物濃度會因飲水、進(jìn)食及其他生物因素而改變,跨度可達(dá)15倍,造成個(gè)體間非疾病因素的差異[8]。因此,針對尿液樣本的代謝組學(xué)研究需要進(jìn)行一定的歸一化,以消除這一影響。
尿液代謝組學(xué)的歸一化處理通常分為數(shù)據(jù)采集前歸一化(以下簡稱“校正”)和數(shù)據(jù)采集后歸一化(下簡稱“歸一化”)兩個(gè)維度[9]?,F(xiàn)有研究中,校正可通過一定的濃度估計(jì)參數(shù)進(jìn)行固相萃取(SPE)[10]、調(diào)整進(jìn)樣量[11]或稀釋[12]等前處理過程來實(shí)現(xiàn)。歸一化主要有肌酐值或肌酐峰面積歸一化、總離子豐度(total ion abundance)、總有用峰面積(MSTUS)歸一化及24 h尿液總量歸一化[9,13]。
正常機(jī)體每天經(jīng)尿液排泄的肌酐總量是恒定的,因此肌酐是尿液代謝組學(xué)研究中最常被使用的校正或歸一化參數(shù)[14,15]。然而,肌酐的排泄仍可能受到性別、年齡、體重指數(shù)(BMI)、藥物以及腎損傷等因素的影響,進(jìn)而限制了這一方法的適用范圍[12,16,17]。滲透壓(osmolality,Π)的大小可以反映代謝物總量,并且受生理、環(huán)境因素的影響小,其測定可獨(dú)立完成,冰點(diǎn)法測定快速方便,所需樣本量少[18,19]。目前,滲透壓常常僅作為數(shù)據(jù)采集后的歸一化參數(shù)[9,20],基于滲透壓的數(shù)據(jù)采集前校正方法十分少見,有部分報(bào)道[10]采用滲透壓校正結(jié)合固相萃取實(shí)現(xiàn),前處理較為復(fù)雜,不利于重復(fù)操作,并且缺乏臨床樣本的評價(jià)和驗(yàn)證。
因此,本研究以先天性腎積水患者尿液為研究對象,建立了基于滲透壓的校正方法。利用單變量和多變量統(tǒng)計(jì)分析,從方法的重復(fù)性、組內(nèi)及組間差異、統(tǒng)計(jì)模型的擬合預(yù)測能力等角度對校正方法同已有研究做了比較和驗(yàn)證,旨在為后續(xù)的尿液代謝組學(xué)研究提供指導(dǎo)和參考。
Vanquish UPLC超高效液相色譜系統(tǒng)、Q Exactive plus四極桿-靜電場軌道阱質(zhì)譜儀(美國Thermo Fisher公司);OM-819.C冰點(diǎn)滲透壓儀(中國雅森公司);TGL-16臺式高速冷凍離心機(jī)(湖南湘儀實(shí)驗(yàn)儀器有限公司);ACQUITY UPLC HSS T3色譜柱(100 mm×2.1 mm,1.8 μm,美國Waters公司)。
乙腈、甲醇(質(zhì)譜級)均購自美國Thermo Fisher公司;甲酸(色譜級)購自德國CNW試劑公司;肌酐(東京化成工業(yè)株式會社);實(shí)驗(yàn)用水采用Milli-Q超純水系統(tǒng)(美國Millipore公司)制備。
尿液樣本來自2019年嘉興學(xué)院附屬嘉興市婦幼保健院小兒外科確診的10例先天性腎積水患者(疾病組,U)和同期性別、年齡匹配的13例健康志愿者(對照組,HC),收集后置于-80 ℃冰箱保存。本研究經(jīng)嘉興市婦幼保健院倫理委員會審定(編號:2019(倫)-69),合理可行。
使用純水和標(biāo)準(zhǔn)溶液對冰點(diǎn)滲透壓儀進(jìn)行0、300及900 mOsm 3點(diǎn)校準(zhǔn),校準(zhǔn)完成后即可開始測樣。取100 μL樣品,置于1.5 mL離心管中,固定樣品管位置,調(diào)整高度直至探針末端完全浸沒在溶液中。將樣品管推至下方冷阱,儀器自動(dòng)開始檢測。待示數(shù)穩(wěn)定后讀數(shù),棄去樣品管,無塵紙擦凈探針,測試下一樣品。每連續(xù)測定10個(gè)樣本,需測定1次純水作0點(diǎn)參比,超過±3 mOsm需重新校準(zhǔn)。
尿液樣本從-80 ℃冰箱中移至室溫下解凍,渦旋1 min。每個(gè)樣本取等量混合,制備質(zhì)控(QC)樣本。QC樣本隨其他樣本一起進(jìn)行前處理,它反映了樣本的平均水平。在進(jìn)行UPLC-HRMS分析時(shí),先連續(xù)進(jìn)樣10次QC樣本平衡儀器,每隔10個(gè)樣品插入1個(gè)QC樣本,序列最后重復(fù)進(jìn)樣3次QC樣本,用于監(jiān)控儀器的靈敏度和穩(wěn)定性。基于滲透壓的校正,關(guān)鍵在于保證樣本進(jìn)樣體積(V,μL)與滲透壓值的乘積處于同一水平。因此校正過程可通過調(diào)整V或Π兩種方式實(shí)現(xiàn)。
1.3.1調(diào)整進(jìn)樣體積
取尿液樣本500 μL,加入等體積甲醇,渦旋1 min,混合均勻,于-20 ℃靜置2 h,低溫離心(4 ℃,12 000 r/min)20 min,取上清液置于進(jìn)樣瓶中待測。假定所有樣本中滲透壓的最低值為ΠLowest,其余樣本的滲透壓值為ΠSample,則稀釋倍數(shù)FVolume=ΠSample/ΠLowest。在進(jìn)行儀器分析時(shí),假定滲透壓最低的樣本進(jìn)樣量為n(μL),則其他樣本的V為n/FVolume(μL)。
1.3.2稀釋樣本
根據(jù)實(shí)際樣本的滲透壓大小,確定稀釋后適宜的樣本滲透壓ΠReference,則稀釋倍數(shù)FDilution=ΠSample/ΠReference。取樣本mμL,加入超純水(FDilution-1)×mμL、甲醇m×FDilutionμL,渦旋1 min,混合均勻,于-20 ℃靜置2 h。靜置完成后,低溫離心(4 ℃,12 000 r/min)20 min,取上清置于進(jìn)樣瓶中待測。在進(jìn)行儀器分析時(shí),等體積進(jìn)樣。
1.4.1色譜條件
色譜柱:Waters HSS T3色譜柱(100 mm×2.1 mm,1.8 μm);柱溫:40 ℃;流動(dòng)相:(A)0.1%(v/v)甲酸水溶液和(B)0.1%(v/v)甲酸乙腈溶液;流速:0.4 mL/min,樣品室溫度:8 ℃。線性梯度洗脫程序:0~1.0 min,1%B;1.0~7.5 min,1%B~20%B;7.5~9.5 min,20%B~30%B;9.5~13.5 min,30%B~35%B;13.5~15.5 min,35%B~70%B;15.5~16.0 min,70%B~100%B;16.0~18.0 min,100%B;18.0~18.1 min,100%B~1%B;18.1~20.0 min,1%B。等體積進(jìn)樣實(shí)驗(yàn),進(jìn)樣量設(shè)為5 μL;校正進(jìn)樣體積實(shí)驗(yàn),進(jìn)樣量按照1.3.1節(jié)計(jì)算調(diào)整。
1.4.2質(zhì)譜條件
離子源為加熱電噴霧電離(HESI)源;噴霧電壓為3.2 kV;毛細(xì)管溫度為320 ℃;鞘氣流速為55 arb;輔助氣流速15 arb;不設(shè)反吹氣;加熱溫度350 ℃。在正離子掃描模式下獲得代謝物指紋圖譜;質(zhì)譜采集模式為輪廓(profile)模式;全掃描范圍為m/z60~900;全掃分辨率為70 000;自動(dòng)增益控制(AGC)設(shè)為1×106個(gè)離子;離子注入時(shí)間為100 ms。MS/MS在Top5模式下進(jìn)行數(shù)據(jù)依賴型采集( DDA);分辨率為17 500;最大進(jìn)樣時(shí)間為50 ms;隔離窗口m/z1.5;碰撞能為(30±15)eV。樣品在分析時(shí)隨機(jī)進(jìn)樣,以避免儀器波動(dòng)造成的影響。
1.5.1數(shù)據(jù)預(yù)處理
將原始數(shù)據(jù)(.raw格式)導(dǎo)入Progenesis QI軟件中進(jìn)行峰提取、峰對齊、去卷積等數(shù)據(jù)預(yù)處理。導(dǎo)入數(shù)據(jù)時(shí),過濾閾值設(shè)定為1.0,參比選擇QC樣本,峰提取的加合形式選擇M+H、M+2H、M+Na和M+NH4。對導(dǎo)出的數(shù)據(jù)矩陣進(jìn)行過濾,最終保留的提取峰應(yīng)同時(shí)滿足:1)“80%規(guī)則”,在一類組別中80%的樣本響應(yīng)不為0;2)QC樣本中峰面積變異系數(shù)(CV)<30%。
1.5.2歸一化
不同的歸一化法通過在Progenesis QI軟件的“Normalization method”項(xiàng)下選擇不同的參數(shù)實(shí)現(xiàn)。具體設(shè)置如下,1)肌酐峰面積歸一化:外標(biāo)確證肌酐m/z為114.066 7(±5 ppm(10-6)),保留時(shí)間(0.71±0.05) min。以每個(gè)樣本中肌酐的提取峰面積做歸一化;2)總離子豐度歸一化:選擇“Total ion abundance”,以樣本中所有離子豐度的總和進(jìn)行歸一化;3)MSTUS歸一化:選擇所有樣品中共有的離子,以其峰面積總和進(jìn)行歸一化。
1.5.3多變量統(tǒng)計(jì)分析
經(jīng)預(yù)處理后的數(shù)據(jù)矩陣導(dǎo)入SIMCA-P 14.0,經(jīng)Par標(biāo)準(zhǔn)化處理后,進(jìn)行主成分分析(PCA)和有監(jiān)督的正交偏最小二乘法判別分析(OPLS-DA)。對OPLS-DA模型做200次置換檢驗(yàn),考察是否存在過擬合。
將3個(gè)健康志愿者的尿液樣本分別梯度稀釋2、4、8和12倍,以模擬實(shí)際情況下尿液的濃度變化。所有樣本測定滲透壓,并進(jìn)行前處理,分別直接等體積進(jìn)樣和校正體積進(jìn)樣后,進(jìn)行UPLC-HRMS分析。校正進(jìn)樣體積的具體信息見表1,經(jīng)過校正后,所有樣本的滲透壓與進(jìn)樣體積的乘積處于同一水平。
表1 樣本的滲透壓及進(jìn)樣體積Table 1 Osmolalities (Π) and injection volumes (V) of samples
2.1.1樣本及其稀釋溶液的主成分分析
校正前后所得的數(shù)據(jù)集經(jīng)不同歸一化處理后,進(jìn)行主成分分析,所得PCA得分圖見圖1,相同顏色和形狀的點(diǎn)表示來源于同一樣本。未經(jīng)校正時(shí),樣本點(diǎn)散落并與稀釋倍數(shù)呈現(xiàn)一定的規(guī)律,僅通過歸一化無法改善同源樣本的聚集情況。經(jīng)過校正后,樣本及其稀釋溶液間的濃度差異被有效消除,呈現(xiàn)了良好的組內(nèi)聚集和組間分群效應(yīng)。肌酐峰面積作為尿液代謝組學(xué)常用的歸一化參數(shù),在校正前后均未得到理想結(jié)果,有研究表明,這可能與肌酐的排泄易受其他生理病理因素影響有關(guān)[15]。
2.1.2校正及歸一化對重復(fù)性的影響
原始的數(shù)據(jù)矩陣經(jīng)預(yù)處理共得到7 930個(gè)有效提取峰。經(jīng)不同歸一化處理后,分別統(tǒng)計(jì)3個(gè)樣本及其稀釋溶液中峰面積RSD值<30%的峰數(shù)量,結(jié)果見圖2。根據(jù)配對t檢驗(yàn)結(jié)果,確定方法間是否存在顯著性差異。峰面積RSD值<30%的峰數(shù)量在校正以后顯著增加,經(jīng)總離子豐度歸一化或MSTUS歸一化可進(jìn)一步提高。因此,滲透壓校正結(jié)合總離子豐度歸一化或MSTUS歸一化可有效改善方法的重復(fù)性。
2.1.3同源樣本的相關(guān)性分析
利用斯皮爾曼秩和相關(guān)系數(shù)(Spearman coefficient)評價(jià)樣本間代謝譜的相似程度,系數(shù)越接近于1,說明樣本間的相似程度越高[21,22]。稀釋溶液與其原樣本的Spearman相關(guān)系數(shù)隨稀釋倍數(shù)的變化如圖3所示,所有相關(guān)性經(jīng)檢驗(yàn)后p值均小于0.05。與不經(jīng)校正比較,經(jīng)校正后的相關(guān)系數(shù)受稀釋倍數(shù)影響更小,始終具有更好的相關(guān)性,并維持在較高水平(>0.8)。說明該校正方法可一定程度上減少尿液本身濃度帶來的組內(nèi)差異,使得樣本更接近于原樣本的真實(shí)狀態(tài)。
以上實(shí)驗(yàn)利用尿液樣本及其梯度稀釋溶液對方法進(jìn)行了初步評價(jià)。然而,對于稀釋的樣本進(jìn)行校正過程,近似于對同一樣本重復(fù)進(jìn)樣。本研究以10例先天性腎積水患者作為疾病組,10位健康志愿者作為對照組,做進(jìn)一步的方法學(xué)驗(yàn)證。尿液樣本分別經(jīng)等體積進(jìn)樣和稀釋至同一滲透壓水平后等體積進(jìn)樣兩次,然后進(jìn)行UPLC-HRMS分析。
2.2.1兩種濃度估計(jì)參數(shù)的比較
肌酐值和滲透壓值都可被用于估計(jì)尿液代謝物的濃度[12]。對照組與疾病組樣本的肌酐峰面積和滲透壓分布如圖4所示,兩組的滲透壓沒有顯著性差別,但疾病組的肌酐峰面積顯著低于對照組。有研究表明,腎功能的變化會影響尿肌酐的濃度,在某些情況下,利用肌酐來歸一化尿液代謝組學(xué)數(shù)據(jù),結(jié)果并不可靠[15]。
圖 1 校正前、后尿液樣本及其稀釋溶液的PCA得分圖(PC個(gè)數(shù)=4)Fig.1 Principal component analysis (PCA) score plots of urine and their sequentially diluted solution before and after calibration (number of principal components=4)A,B,C refer to three sample sources,the following numbers indicate different dilution multiples.
圖 2 峰面積RSD<30%的提取峰數(shù)量(n=3)Fig.2 Numbers of peaks with peak area RSD<30% (n=3)MSTUS:mass total useful signal;* p<0.05.
圖 3 樣品及其梯度稀釋溶液的Spearman相關(guān)系數(shù)Fig.3 Spearman coefficients of samples and their sequentially diluted solutions* Two regression curves were significantly different (p<0.01).
圖 4 樣本滲透壓值和肌酐峰面積的箱型圖(n=10)Fig.4 Box charts of osmolality and creatinine peak area (n=10)
此外,進(jìn)行校正過程的關(guān)鍵是濃度估計(jì)參數(shù)與質(zhì)譜信號間始終良好的線性相關(guān)。利用皮爾遜相關(guān)系數(shù)評價(jià)兩組數(shù)據(jù)間的線性關(guān)系,相關(guān)系數(shù)越接近1,兩組數(shù)據(jù)間的線性相關(guān)性越強(qiáng)[23,24]。肌酐峰面積與總峰面積僅在健康志愿者樣本中線性相關(guān),在患者和整體中無顯著相關(guān)性(p>0.05)。說明當(dāng)患者腎臟發(fā)生病變影響到肌酐的排泄時(shí),繼續(xù)使用肌酐作為濃度估計(jì)參數(shù)可能會產(chǎn)生較大偏差。而滲透壓與總峰面積間的相關(guān)系數(shù)始終大于0.8(p<0.01),呈現(xiàn)了良好的線性。還有研究提到,社會人口學(xué)和醫(yī)學(xué)條件對尿滲透壓的影響小于對尿肌酐的影響[25]。因此,使用滲透壓估計(jì)尿液代謝物的總濃度,結(jié)果更為準(zhǔn)確,且不易受到疾病和外界條件的干擾。
2.2.2主成分分析
用PCA比較兩次代謝組學(xué)實(shí)驗(yàn)的結(jié)果。紅色圓圈表示QC樣本(Q),聚集在原點(diǎn)附近,表明方法的重復(fù)性良好。綠色三角代表HC,藍(lán)色方塊代表U,顏色越深表明其對應(yīng)樣本的滲透壓越高。如圖5所示,未經(jīng)校正時(shí),樣本呈現(xiàn)了與滲透壓大小相關(guān)的分布,經(jīng)校正后,樣本點(diǎn)的分布趨勢與滲透壓無明顯相關(guān),并有更明顯的組內(nèi)聚集和組間分群效應(yīng)。
圖 5 健康志愿者和先天性腎積水患者尿液樣本的PCA得分圖(PC個(gè)數(shù)=5)Fig.5 PCA score plots of urine samples from healthy volunteers and patients with congenital hydronephrosis (Number of principal components=5)Q:quality control;HC:healthy control;U:children with congenital hydronephrosis.
2.2.3OPLS-DA
OPLS-DA可以去除與分類變量無關(guān)的組內(nèi)差異,使得分類信息主要集中在一個(gè)主成分(Y)中,在代謝組學(xué)中常被用于篩選組別間的差異代謝物,因此模型的可靠性十分重要[26,27]。
統(tǒng)計(jì)模型的R2Y表示模型所能解釋Y變量信息的百分比,Q2通過交叉驗(yàn)證得出,分別用以評價(jià)模型的擬合和預(yù)測能力。經(jīng)過校正以后,健康對照組和疾病組之間在OPLS-DA模型上有了更加明顯的區(qū)分,并且R2Y和Q2值更加接近于1,表明其擬合和預(yù)測能力得到了提升(見圖6)。利用置換檢驗(yàn)可得到一系列OPLS-DA模型變量解釋率R2的計(jì)算值,從而擬合出一條直線。直線在Y軸的截距越大,模型存在過擬合的可能性越高[28]。增加主成分的個(gè)數(shù),對模型進(jìn)行200次置換檢驗(yàn)。經(jīng)校正處理后的OPLS-DA模型,R2截距始終更小,更不易出現(xiàn)過擬合的情況。
圖 6 健康志愿者和腎積水患者尿液樣本的OPLS-DA得分圖(PC個(gè)數(shù)=2)Fig.6 Orthogonal partial least squares discrimination analysis (OPLS-DA) score plots of urine samples from healthy volunteers and patients with congenital hydronephrosis (Number of principal components=2)
本研究提出了一種在UPLC-HRMS數(shù)據(jù)采集前基于滲透壓校正,結(jié)合總離子豐度或MSTUS歸一化的策略,可克服尿液樣本本身的濃度變異性。經(jīng)過臨床樣本的驗(yàn)證表明,該方法有效提高了代謝組學(xué)方法的重復(fù)性,消除了因尿液本身代謝物濃度變化引起的組內(nèi)差異,在PCA上擁有更明顯的組內(nèi)聚集和組間分群效應(yīng),并且提高了OPLS-DA模型的可靠度,更不易出現(xiàn)過擬合。此外,以滲透壓為基準(zhǔn)的校正方法,受疾病因素的影響小,比肌酐校正法的適用范圍更廣,結(jié)果更加可靠。本研究可對后續(xù)各類來源的尿液代謝組學(xué)研究提供歸一化的參考和指導(dǎo)。
致謝 感謝上海交通大學(xué)藥學(xué)院蘇靖老師在滲透壓測定工作中的幫助和指導(dǎo)。