宋聲雷,許開武,胡鴻運,李成龍,李光義,陳超武
(湖南省人民醫(yī)院,湖南師范大學(xué)附屬第一醫(yī)院胃腸外科,湖南 長沙 410000)
結(jié)直腸癌(Colorectal cancer,CRC)是臨床常見的惡性腫瘤之一,2020 年全球新發(fā)CRC 1 880 725例,死亡915 880 例,發(fā)病率及死亡率在所有腫瘤中分別排第3 位和第2 位,發(fā)病率高,預(yù)后差[1]。有研究指出,接近50% 的CRC 是可以預(yù)防的[2],探究CRC 危險因素以及預(yù)防、治療方案具有重要的意義。平均紅細胞體積(Mean corpuscular volume, MCV)是血常規(guī)指標之一,由紅細胞比容和紅細胞計數(shù)計算得出,它是判斷紅細胞平均大小的直接指標。最近有研究發(fā)現(xiàn),高MCV 與多種惡性腫瘤的發(fā)生密切相關(guān)[3-4],此外,還有研究發(fā)現(xiàn)高MCV 與CRC 和肝癌的預(yù)后之間存在關(guān)聯(lián)[5-6]。然而,這些關(guān)聯(lián)是否確實存在,以及存在正相關(guān)還是負相關(guān),仍然存在爭議。傳統(tǒng)的流行病學(xué)觀察研究在發(fā)現(xiàn)疾病病因和推斷因果關(guān)系方面存在許多局限,如反向因果關(guān)系、混雜因素和微觀有效暴露因素的存在,導(dǎo)致了推斷表型和疾病之間聯(lián)系的局限性。孟德爾隨機化(Mendelian randomization,MR)作為一種新的流行病學(xué)統(tǒng)計方法,基于“親代等位基因隨機分配給子代”的孟德爾遺傳規(guī)律,使用與暴露因素有關(guān)的單核苷酸多態(tài)性(single nucleotide polymorphisms, SNPs)位點作為工具變量(instrumental variables,IVs)來驗證風(fēng)險因素與結(jié)果之間的因果關(guān)系[7-8]。在本研究中,我們應(yīng)用兩樣本MR 方法來評估MCV 與CRC 之間的關(guān)系,為MCV 與CRC 發(fā)病風(fēng)險之間的關(guān)聯(lián)提供遺傳學(xué)方面的支持。
確認MCV 為暴露變量,CRC 為結(jié)局變量,搜索IEU Open GWAS 數(shù)據(jù)庫(https://gwas.mrcieu.ac.uk),得到來自日本生物銀行(BioBank Japan , BBJ)[9-10]的暴露(bbj-a-40)及結(jié)局(bbj-a-76)變量的全基因組關(guān)聯(lián)研究(genome-wide association study,GWAS)數(shù)據(jù)。MCV 樣本量及SNP 數(shù)分別為108 256、6 108 953,CRC 樣本量及SNP 數(shù)分別為33 870(病例組6692,對照組27 178)、7 492 477。上述GWAS 數(shù)據(jù)來自亞洲人群。
以P<5×10-8為篩選條件,挑選與暴露因素強相關(guān)的SNPs 作為工具變量。以r2<0.001,距離10 000 kb 為篩選條件,消除連鎖不平衡所帶來的偏倚[11],以保證各個SNP 之間相互獨立,排除基因多效性對結(jié)果的影響。通過設(shè)置SNP 的F值>10,去除弱工具變量。利用PhenoScanner 數(shù)據(jù)庫去除與混雜因素有關(guān)的工具變量。
利用5 種常用方法進行MR 分析,即逆方差加權(quán)法(inverse variance weighted,IVW)[12]、MR-Egger回歸法[13]、加權(quán)中位數(shù)法(weighted median)[14]、基于眾數(shù)的加權(quán)估計(weighted mode)以及基于眾數(shù)的簡單估計法(simple mode)。使用Cochran’s Q 檢驗進行異質(zhì)性檢驗,如異質(zhì)性檢驗P值小于0.05,證明分析結(jié)果具有異質(zhì)性,則重點關(guān)注隨機效應(yīng)IVW 法的結(jié)果,因為IVW 方法為隨機效應(yīng)模型,存在異質(zhì)性并不影響結(jié)果解讀;使用Egger-intercept 檢驗進行水平多效性檢驗;MR-PRESSO 方法可以檢測并校正離群的SNP ;以留一法檢驗作為敏感性分析方法。以上MR 分析通過使用R 4.3.1 軟件中的TwoSampleMR包實現(xiàn),檢驗水準α=0.05。
達到顯著差異的工具變量共10 609 個,排除連鎖不平衡影響后,篩選出SNP 共109 個作為有效工具變量,所有工具變量的F值均大于10。根據(jù)PhenoScanner 數(shù)據(jù)庫去除與混雜因素相關(guān)的工具變量(吸煙:rs12027999 ;炎性腸?。簉s2524100、rs12412214 ;體重指數(shù):rs1047891、rs11525583、rs2278557)。最終,被納入為MCV 工具變量的SNP共103 個。
我們從MR 分析的森林圖可以看出(圖1A),下面紅色的部分,是所有SNP 的綜合結(jié)果,其在0 的右側(cè),說明在使用MR Egger 和IVW 法下,MCV 的升高會增加CRC 的發(fā)病風(fēng)險。IVW 作為MR 的主要分析方法,結(jié)果表明,MCV 水平與CRC 存在相關(guān)性(OR=1.171,95% CI:1.048 ~1.308,P=0.005)。MR Egger(OR=1.380,95% CI:1.101 ~ 1.731,P=0.006)、Weighted median(OR=1.332,95%CI:1.133 ~ 1.567,P<0.001)、Weighted mode(OR=1.379,95% CI:1.113 ~1.708,P=0.004) 方法與IVW 方法分析的結(jié)果一致,進一步證明了MCV 水平與CRC 的相關(guān)性。Simple mode 分析結(jié)果(OR=1.335,95% CI:0.937 ~1.902,P=0.113)與上述分析結(jié)果存在差異。5 種方法得到的因果效應(yīng)方向及結(jié)果基本一致(圖1B,圖1C)。
由MR 的漏斗圖(圖2A)可見,所有納入的SNP 基本對稱,故以這些SNP 作為工具變量分析的結(jié)果比較穩(wěn)定,提示受到潛在偏倚影響的可能性較小。異質(zhì)性分析Cochran’s Q 檢驗結(jié)果Q=155.690,P<0.001,提示SNP 之間存在異質(zhì)性,故我們重點關(guān)注IVW 方法的檢驗結(jié)果。多效性檢驗結(jié)果顯示,MR-Egger 回歸的截距分別為-0.0098,接近于0(P>0.05),提示MR 分析結(jié)果不受水平多效性影響。MR-PRESSO 模型未發(fā)現(xiàn)離群SNP(P值均大于0.05)。采用留一法分析(圖2B),剔除單個SNP 后,MR 的分析結(jié)果均未出現(xiàn)明顯波動,說明本研究中MR 結(jié)果是穩(wěn)定的。
近年來,CRC 的發(fā)病率逐年升高,造成了較重的社會負擔。既往研究發(fā)現(xiàn),多種危險因素與CRC的發(fā)病及預(yù)后有關(guān),包括體重指數(shù)[15]、吸煙[16-17]等,針對上述風(fēng)險因素的一級和二級預(yù)防策略可能在預(yù)防和控制CRC 方面發(fā)揮重要作用。然而,除了上述危險因素外,我們還需要進一步探究一些新型的、檢測方便的CRC 危險因素,如血細胞相關(guān)的一些分析數(shù)據(jù)。
MCV 是血常規(guī)檢測中的常用指標,是指單個紅細胞的平均體積,以飛升(fL) 為單位。近年來,越來越多的研究發(fā)現(xiàn),MCV 參與了多種腫瘤的發(fā)生和進展[18-19]。一項回顧性研究發(fā)現(xiàn),570 例接受了食管癌根治術(shù)的患者中,高MCV(>99 fL)組患者的總生存期(Overall survival,OS)較MCV 正常組(83 ~99 fL)短,高MCV 是食管癌患者預(yù)后較差的獨立危險因素[20]。Nagai 等[6]對1174 例進行了R0 切除的Ⅰ~Ⅲ期CRC患者進行研究后發(fā)現(xiàn),無論是否行術(shù)后輔助化療,術(shù)前MCV 較低(<80 fL)患者的無病生存期(diseasefree survival,DFS)均優(yōu)于MCV 較高(80 ~100 fL)的患者。
本研究中通過使用GWAS 數(shù)據(jù)和MR 分析,為上述推論提供了更確切的依據(jù),確定了MCV 和CRC之間的因果關(guān)系。與隨機對照試驗相比,MR 的樣本量大,試驗設(shè)計也更接近隨機分配。與回顧性研究相比,MR 受反向因果關(guān)系的干擾更少。本研究證明了MCV 與CRC 之間存在正向因果關(guān)系(OR=1.171,95% CI:1.048 ~1.308,P=0.005),這與觀察性研究的結(jié)論一致,豐富了人們對CRC 危險因素的認識。
當然,本研究仍存在一定的局限性:首先,本研究中的數(shù)據(jù)主要來自亞洲人群,因此研究結(jié)果可能無法推廣到其他人群,未來需要更多的研究來驗證我們的研究成果在其他人群和種族中的適應(yīng)性。其次,MCV 的測量值一定程度上受到了不同檢測設(shè)備的影響,這可能導(dǎo)致結(jié)果存在一定的偏倚。
綜上所述,本研究應(yīng)用MR 方法得到了MCV 和CRC 的因果關(guān)系,初步證明了MCV 水平的升高增加了患CRC 的風(fēng)險。然而MCV 是如何影響CRC 的,未來仍需更多的生物學(xué)實驗進行進一步的研究。