王子賢,賴偉華,鐘詩龍
1華南理工大學生物科學與工程學院,廣東 廣州510006;2廣東省人民醫(yī)院//廣東省醫(yī)學科學院藥學部,廣東廣州510080
冠狀動脈粥樣硬化性心臟病,簡稱冠心病,是世界范圍內最常見的心血管疾病,也是導致患者死亡的主要原因之一[1]。雖然藥物和手術治療在近年來取得了巨大的進步,但是冠心病患者的死亡率仍然很高[2-4]。因此,了解冠心病的發(fā)病機制和識別新的預防靶點對冠心病的防治具有重要意義。
血液中的代謝物作為一種環(huán)境暴露下的功能中間體,其往往可以反應個體的遺傳組成并能預測或影響疾病的發(fā)生發(fā)展[5]。近年來,血液代謝組學的研究已為預測心血管疾病的發(fā)生提供了眾多的生物標志物并建立了可靠的預測模型[6-8]。但是,許多代謝物往往只能提供與疾病發(fā)生的關聯(lián)性,其因果關系尚不明確。孟德爾隨機化(MR)作為一種流行的遺傳流行病學研究設計方法,它通過使用遺傳變異作為工具變量,可以探究暴露和結局之間的因果關系[9]。然而到目前為止,在探究與冠心病發(fā)生風險相關的MR分析中,其關注的暴露因素大多是廣泛表型,如身高[10]、腰圍[11]、臀圍[12]等,鮮有關注血液代謝物這樣的暴露因素集合?;诖x組學的全基因組關聯(lián)研究(mGWAS)是一種識別代謝物數(shù)量性狀位點[13]以了解疾病相關遺傳變異的代謝背景的有效途徑。Shin等于2014年發(fā)表了迄今為止最大規(guī)模的mGWAS,繪制了人類血液代謝物的遺傳圖譜[14],為血液代謝組學的遺傳基礎提供重要參考價值。Yang等[15]已經利用兩樣本MR的分析方法評估了這些血液中的代謝物與5種主要的精神疾病之間的因果關系,并成功地發(fā)現(xiàn)了兩個代謝物與精神分裂癥和注意缺陷或多動障礙之間存在穩(wěn)健的因果關系,為該類疾病的預測和治療提供了重要的參考?;诖朔椒▉硖骄窟@些血液代謝物與冠心病發(fā)生風險之間的因果關系。有助于更深入地了解冠心病的發(fā)病機制,并可能為冠心病患者的臨床診療提供新的見解,但目前尚未有相關的報道。
因此,本研究從分子機制角度出發(fā),采用兩樣本MR分析方法,使用上述大規(guī)模的mGWAS數(shù)據(jù)為暴露文件,以及另一項超大規(guī)模的冠心病GWAS數(shù)據(jù)為結局文件,以探究這些血液中的代謝物與發(fā)生冠心病之間的因果關系。本研究具有一定的理論依據(jù)和臨床轉化價值,研究結果可以為指導冠心病的風險預測和治療工具的開發(fā)提供參考。
本研究采用2014年Shin等[14]發(fā)表于Nature Genetics上的迄今為止最大規(guī)模的mGWAS數(shù)據(jù)作為暴露文件。該數(shù)據(jù)是一項包含7824例歐洲人的薈萃分析數(shù)據(jù),經過嚴格的質量控制,共210萬個SNP位點和486種血液代謝物(其中包含309種已知代謝物和177種未知代謝物)用于全基因組關聯(lián)分析。這些代謝物可分為8種代謝物大類:碳水化合物、氨基酸、核苷酸、輔因子和維生素、脂類、肽類、能量產物和異源性生物代謝產物。所有關聯(lián)分析的匯總數(shù)據(jù)可在數(shù)據(jù)庫網站公開獲?。篽ttp://metabo1omics.he1mho1tz-muenchen.de/gwas/.
冠心病的GWAS 數(shù)據(jù)來源于2011 年Schunkert等[16]發(fā)表于Nature Genetics 的一項包含22個獨立研究的超大規(guī)模的冠心病薈萃分析數(shù)據(jù),樣本來自歐洲人群的22 233例冠心病患者和64 762例健康人,共有約240萬個SNP 位點用于關聯(lián)分析。數(shù)據(jù)收錄在CARDIoGRAMp1usC4D,可在數(shù)據(jù)庫網站公開獲?。篽ttp://www.cardiogramp1usc4d.org/.
我們對486種代謝物的遺傳變異采用了統(tǒng)一的入選標準。選擇MR分析中常用的較為寬松的閾值,即P<1×10-5為顯著的關聯(lián)分析結果入選條件;在提取出每個代謝物對應的顯著的SNP后,以千人基因組中歐洲人(EUR)基因型為參考模板,進行連鎖不平衡分析,同時滿足以下三個條件認為連鎖不平衡并保留P值最小的SNP作為獨立的遺傳變異:(1)位于同個染色體;(2)相互距離在500 kb以內;(3)連鎖不平衡參數(shù)r2>0.1。
因為處于同個代謝通路的代謝物可能會受到相似的遺傳變異調控,即可能存在多個代謝物與同一個SNP顯著相關,這將違反MR假設標準。因此,本研究采用限制性選取工具變量的方法[17],排除與兩個以上代謝物均顯著相關的SNP。同時排除已知的冠心病風險因素相關的SNP(包括身體質量指數(shù)[18]、身高[10]、腰圍[11]、臀圍[12]、腰臀比[19]、血脂[20]相關的SNP)。
本研究涉及的暴露因素為血液中的代謝物,數(shù)量眾多,與既往的單一暴露因素的MR研究相比,有更為巨大的工作量。因此,本研究中通過編寫Per1代碼、R代碼和She11代碼進行批量處理,即依次探究每個代謝物與冠心病的因果關系。其中,連鎖不平衡分析采用PLINK(version 1.9)軟件[21];MR分析、基因多效性檢驗以及敏感性分析采用R 中的TwoSamp1eMR 軟件包(version 0.4.22)[22]于Linux系統(tǒng)上進行分析。
1.3.1 MR分析 本研究采用逆方差加權法(IVW)[23]作為首要的因果效應估計。IVW法是一種較為理想狀態(tài)下的估計,是假設在所有遺傳變異都是有效工具變量的基本前提下進行的有效分析,具有較強的因果關系檢測能力。但是IVW法特別要求遺傳變異僅通過研究中的暴露影響目標結局。盡管此研究已盡可能排除了已知的混雜的SNP,然而仍然有許多未知混雜因素會導致基因多效性并對效應值的估計產生偏倚。因此,我們采用了另外4種方法來檢驗結果的可靠性和穩(wěn)定性,即MREgger 回歸[24]、加權中位數(shù)法(WME)[25]、基于眾數(shù)的簡單估計[26]、基于眾數(shù)的加權估計[26]。依次對每個代謝物進行MR分析,如果以上五種不同的MR模型對因果效應產生了相似的估計值,我們則認為該代謝物與冠心病的因果關系是穩(wěn)定且可靠的。
IVW法分析的結果中,我們采用嚴格的多重假設檢驗的閾值P<1.03×10-4(P<0.05/486)來檢驗顯著的因果關系。并且同時關注P值大于等于1.03×10-4但小于0.05值的代謝物來作為冠心病潛在風險預測因子。P值小于0.05的因果關系將進行如下的異質性檢驗和基因多效性檢驗。
1.3.2 異質性檢驗 由于不同分析平臺、實驗條件、入選人群的以及SNP的差異,兩樣本MR分析法可能存在異質性,從而對因果效應的估計產生偏倚。因此,本研究中對主要的IVW分析法和MR-Egger回歸采取異質性檢驗,檢驗的結果中P值大于0.05則認為納入的工具變量不存在異質性,可以忽略異質性對因果效應估計產生的影響。
1.3.3 基因多效性檢驗 MR分析的假設之一是工具變量只能通過暴露影響結局,若工具變量不通過影響暴露而直接影響結局則違背了MR思想,所以需要檢驗暴露與結局之間的因果推斷是否存在基因多效性。采用
MR-Egger回歸分析可以來評價基因多效性產生的偏倚,其回歸截距可以評估多效性的大小,截距越接近于0,則基因多效性的可能性越小。本研究中通過判斷基因多效性檢驗的P值來衡量分析中是否存在基因多效性,若P>0.05,則認為因果分析中基因多效性的可能性較弱,可以忽略其產生的影響。
1.3.4 敏感性分析 除了采用上述4種方法(MR-Egger回歸法、加權中位數(shù)法、基于眾數(shù)的簡單估計法、基于眾數(shù)的加權估計法)來檢驗結果的可靠性和穩(wěn)定性。本研究還采用1eave-one-out 法來進行敏感性分析。即對IVW法中P值小于0.05,并且通過了異質性檢驗和基因多效性檢驗的代謝物,逐一去除各個相關的SNP并計算剩余的SNP的合并效應,以評估各個SNP對于代謝物的影響。
在486個代謝物中,與之關聯(lián)的P<1×10-5的共有39 142個SNP,連鎖不平衡分析后,得到10 905個獨立的SNP,其中,有447個SNP至少與兩個代謝物顯著相關。另外,與冠心病風險因素相關的SNP共有319個,這些SNP均不包含在本研究中。排除混雜的SNP后,共10 458個SNP納入后續(xù)分析,這些SNP在冠心病的GWAS數(shù)據(jù)中存在9108個,位點覆蓋率為87%。工具變量的質控流程圖如圖1所示。每個代謝物對應的工具變量的數(shù)量的中位數(shù)為13,后續(xù)分析中排除擁有工具變量的數(shù)量小于等于3的5個代謝物和大于等于100的5個代謝物。
本研究采用IVW法作為首要的評估代謝物與冠心病之間因果關系的方法。共有32個代謝物與冠心病的因果關系效應值達到名義上顯著(P<0.05),其中,包含已知代謝物11個,未知代謝物21個;未發(fā)現(xiàn)多重假設檢驗(P<1.03×10-4)后仍然顯著的代謝物(表1)。
在11個已知的代謝物中,包括4種可能與增加冠心病發(fā)生風險相關的代謝物,即犬尿氨酸,γ-谷氨酰異亮氨酸,丁二酰基肉堿,血紅素;7種可能與降低冠心病發(fā)生風險相關的代謝物,即1-甲基黃嘌呤,溶血磷脂酰膽堿,(Des-Arg9)-緩激肽,N-乙酰鳥氨酸,肉豆蔻酸酯,甘氨酸,甘露醇。
圖1 用于MR分析的工具變量質控流程圖Fig.1 Flow chart for quality control of the instrumental variables for MR analyses.
對以上11個已知的代謝物所對應的工具變量進行異質性檢驗和基因多效性檢驗,排除2個存在異質性或基因多效性的代謝物(犬尿氨酸和1-甲基黃嘌呤)。五種MR模型、異質性檢驗和基因多效性檢驗結果見表2。剩余的9個代謝物中,有3個代謝物對應的5種MR模型中有至少3種模型的P值小于0.05[N-乙酰鳥氨酸,(Des-Arg9)-緩激肽,丁二?;鈮A]。盡管五種MR模型都未能全部達到統(tǒng)計學意義上顯著,但是它們均具有相似的效應值,其原因可能是因為IVW法比其他四種MR模型擁有更高的檢驗效能。3個代謝物的MR分析結果散點圖見圖2。
用1eave-one-out法對以上3個代謝物[N-乙酰鳥氨酸,(Des-Arg9)-緩激肽,丁二?;鈮A]的因果效應進行敏感性分析。3個代謝物中都存在至少1個SNP對結果的效應值產生顯著影響,因此,對這些SNP進行剔除后,我們重新對這3個代謝物進行了MR分析。N-乙酰鳥氨酸,(Des-Arg9)-緩激肽和二?;鈮A的IVW法對應的效應值均不再顯著(表3)。
本研究運用了公共數(shù)據(jù)庫中大規(guī)模的mGWAS和GWAS數(shù)據(jù),采用無偏倚的兩樣本孟德爾隨機化分析方法探究了486種血液代謝物與冠心病發(fā)生風險之間的因果關系。然而經過嚴格的質量控制,尚未找到非常有力的證據(jù)表明這些血液代謝物與冠心病的發(fā)生之間存在直接的因果關聯(lián)。
此研究中涉及的486種血液中的代謝物,盡管均未能通過多重假設檢驗的閾值,但仍然為我們提供了11種潛在的冠心病風險預測因子。包括4種可能與增加冠心病發(fā)生風險相關的代謝物(犬尿氨酸,γ-谷氨酰異亮氨酸,丁二?;鈮A,血紅素)。其中包含的3個代謝物[即,N-乙酰鳥氨酸,(Des-Arg9)-緩激肽,丁二?;鈮A]在至少3種孟德爾隨機化模型中都達到了統(tǒng)計學顯著。本研究發(fā)現(xiàn)N-乙酰鳥氨酸和(Des-Arg9)-緩激肽可能作為潛在的保護性物質從而降低冠心病的發(fā)生風險。N-乙酰鳥氨酸是人血去蛋白血漿中的次要成分,暫未發(fā)現(xiàn)其關于心血管研究的報道。緩激肽作為一種血管活性激肽,具有改善心功能并可以降低遠期心臟事件的作用[27]。實驗研究表明,缺乏緩激肽B2受體基因的小鼠更容易出現(xiàn)高血壓,心臟肥大和心肌損傷[28]。由此可見,(Des-Arg9)-緩激肽在保護心血管疾病和降低冠心病發(fā)生風險之間可能具有重要作用。丁二?;鈮A是來自血液和肝臟中能量代謝的中間體,已有文獻報道其是心血管疾病的危險因素之一[29],然而其與冠心病發(fā)生之間的因果關系仍然需要后續(xù)的進一步研究來證實。
表1 IVW方法達名義上顯著的代謝物對應的效應值結果Tab.1 Nominally significant results of IVW method
本研究具有如下創(chuàng)新性:(1)本研究從分子機制角度出發(fā),以血液中的代謝物為暴露因素,探究其與冠心病發(fā)生風險之間的因果關系,具有較強理論依據(jù)和重要臨床研究價值;(2)本研究采用嚴格的質控條件和分析方法,運用多種模型來評估因果效應,研究結果具有可靠性和穩(wěn)定性;(3)與既往的單一暴露因素的孟德爾隨機化研究相比,本研究中涉及的暴露因素為血液中的代謝物,數(shù)量眾多,具有十分巨大的工作量和分析挑戰(zhàn)性。本研究中也存在一定的局限性:(1)mGWAS數(shù)據(jù)和冠心病的GWAS數(shù)據(jù)均來源于歐洲人群,后續(xù)更為全面的研究仍需在不同人種之間展開;(2)初步分析得到的冠心病風險預測因子大多為未知代謝物,其功能結構存在不確定性;(3)盡管我們采用迄今為止最大規(guī)模的mGWAS數(shù)據(jù),后續(xù)研究仍然需要進一步擴大的樣本量來為代謝物的遺傳影響提供更準確的評估。
表2 已知代謝物的5種MR分析以及異質性檢驗和基因多效性檢驗結果Tab.2 Results of 5 MR models of known metabolites and the heterogeneity and pleiotropy tests
圖2 三個具有潛在因果關系的代謝物的5種MR模型散點圖Fig.2 Scatter plots of the 5 MR models for 3 metabolites with potential causal relationship with CAD.A:Nacetylornithine;B:Bradykinin,des-arg(9);C:Succinylcarnitine.
表3 Leave-one-out法檢驗剔除混雜SNP后的3種代謝物MR分析結果Tab.3 MR analysis results of the 3 metabolites after removing mixed SNP by leave-one-out method
綜上,我們采用了兩樣本孟德爾隨機化的方法探究了486種血液代謝物與冠心病的因果關系。盡管沒有發(fā)現(xiàn)這些血液代謝物與冠心病發(fā)生風險之間存在穩(wěn)健的因果關系,但本研究中發(fā)現(xiàn)的潛在的冠心病風險預測因子仍為揭示遺傳-暴露相互作用在冠心病發(fā)病機制中的作用提供了新的見解。