尹 陽(yáng),孫巨軍,李 越,李 欣,何 謙
(1.西安交通大學(xué)第二附屬醫(yī)院檢驗(yàn)科,西安 710004;2.西電集團(tuán)醫(yī)院檢驗(yàn)科,西安 710077)
乳腺癌(breast cancer)是女性發(fā)病率最高的癌癥,占女性新患腫瘤的30%[1]。治療乳腺癌成功的關(guān)鍵很大程度上在于患者確診時(shí)疾病的分期情況[2],因此,及早發(fā)現(xiàn)乳腺癌是乳腺癌治療的關(guān)鍵因素。找尋能夠早期發(fā)現(xiàn)乳腺癌的標(biāo)志物是目前乳腺癌診治中的一個(gè)重大挑戰(zhàn)。
miRNA 是一類(lèi)在轉(zhuǎn)錄后水平起調(diào)控作用的基因家族,長(zhǎng)度約21 個(gè)核苷酸,在生物進(jìn)化過(guò)程中不易發(fā)生改變,其廣泛存在于真核生物中,它們?cè)诟鞣N生理和發(fā)育過(guò)程中控制基因的表達(dá),因此在轉(zhuǎn)錄后調(diào)控中起著至關(guān)重要的作用[3]。miRNA 與人類(lèi)各種疾病的聯(lián)系是近幾年來(lái)生物醫(yī)學(xué)領(lǐng)域的一個(gè)研究熱點(diǎn),多種miRNA 的突變或表達(dá)異??赡芘c癌癥的發(fā)生發(fā)展密切相關(guān),已發(fā)現(xiàn)有力的證據(jù)表明miRNA可以用于癌癥的診斷、分期及預(yù)后[4]。近幾年來(lái)很多研究將miRNA 作為原發(fā)性乳腺癌診斷標(biāo)志物,并顯示出良好的臨床前景。與單個(gè)miRNA 相比,聯(lián)合多個(gè)miRNA 顯示出更好的診斷性能,本文擬通過(guò)生物信息學(xué)技術(shù),篩選出合適的miRNA 用于早期診斷。
1.1 資料來(lái)源 從腫瘤基因組圖譜TCGA(http://cancergenome.nih.gov/)中獲取原發(fā)性乳腺癌組織和正常乳腺組織的miRNA 表達(dá)數(shù)據(jù)。使用miRwalk 2.0(http://zmf.umm.uni-heidelberg.de/apps/zmf/mirwalk2/)軟件預(yù)測(cè)miRNA 可能作用的基因,使用c-Bioportal(http://www.cbioportal.org/)數(shù)據(jù)庫(kù)篩選乳腺癌高頻突變基因。
1.2 方法
1.2.1 差異表達(dá)miRNA 篩選:使用TCGA biolinks R 包下載TCGA-BRCA miRNA 表達(dá)數(shù)據(jù)。使用Deseq2 R 包對(duì)TCGA-BRCA miRNA 表達(dá)數(shù)據(jù)進(jìn)行差異篩選,篩選條件為L(zhǎng)ogFC(foldchange)大于3,P< 0.05。并使用ggplot2 R 包繪制火山圖。
1.2.2 靶基因預(yù)測(cè):使用miRwalk 2.0 軟件預(yù)測(cè)差異miRNA 的可能作用的基因即靶基因。
1.2.3 高頻突變基因篩選:使用c-Bioportal 數(shù)據(jù)庫(kù)設(shè)置發(fā)生率閾值為5%,篩選高頻突變基因。
1.2.4 ROC 曲線分析:使用pROC 包對(duì)下載TCGA-BRCA miRNA 表達(dá)數(shù)據(jù)進(jìn)行ROC 分析。
1.3 統(tǒng)計(jì)學(xué)分析 使用Deseq2 R 包、pROC 包對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。ROC 曲線用于評(píng)價(jià)診斷效能,計(jì)算曲線下面積(AUC)。以P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
2.1 乳腺癌差異miRNA 的篩選 在TCGA 數(shù)據(jù)庫(kù)下載包含原發(fā)性乳腺癌組織1 075 例,正常對(duì)照乳腺組織95 例,共有1 870 條miRNA 的表達(dá)數(shù)據(jù)。共找到差異表達(dá)顯著miRNA 129 個(gè),上調(diào)miRNA 90 個(gè),下調(diào)miRNA 39 個(gè),見(jiàn)表1。并繪制火山圖,見(jiàn)圖1。篩選出了前20 名差異表達(dá)的miRNA,按排名先后依次是:hsa-miR-105-2,hsa-miR-1269a,hsa-miR-767,hsa-miR-105-1,hsa-miR-449a,hsa-miR-1269b,hsa-miR-184,hsa-miR-592,hsamiR-4724,hsa-miR-449b,hsa-miR-486, hsamiR-4501,hsa-miR-449c,hsa-miR-4732,hsamiR-210,hsa-miR-187,hsa-miR-190b, hsamiR-96,hsa-miR-196a-1 和hsa-miR-7705。
表1 差異表達(dá)的miRNA 結(jié)果
圖1 差異表達(dá)miRNA 的火山圖
2.2 篩選用于乳腺癌診斷的目標(biāo)miRNA 預(yù)測(cè)129 個(gè)差異miRNA 的可能作用的基因即靶基因,結(jié)果預(yù)測(cè)到18 413 個(gè)靶基因。在17 897 個(gè)發(fā)生突變的基因中突變發(fā)生率大于5%的基因12 個(gè),見(jiàn)表2。18 413 個(gè)靶基因中包含12 個(gè)高頻基因,所以說(shuō)這12 個(gè)基因?yàn)椴町恗iRNA 的靶基因,同時(shí)也是高頻基因,這些基因能被63 個(gè)miRNA 作用,見(jiàn)表3。將乳腺癌前20 名差異表達(dá)的miRNA 與這63 個(gè)作用于高頻突變的靶基因的miRNA 求交集,得到6 個(gè)目標(biāo)miRNA,他們是hsa-miR-592,hsamiR-486,hsa-miR-4732,hsa-miR-196a,hsa-miR-449b 和hsa-miR-187。
表2 突變發(fā)生率大于5%的基因結(jié)果
表3 作用于12 個(gè)高頻靶基因的miRNA 結(jié)果
2.3 目標(biāo)miRNA 的ROC 曲線分析 對(duì)上述篩選得到的6 個(gè)miRNA 進(jìn)行ROC 曲線分析(見(jiàn)圖2),各 miRNA 的ROC 曲線下AUC 面積越大,其作為腫瘤標(biāo)志物的診斷能力越強(qiáng)。其中hsa-miR-592 ROC 曲線下AUC 面積為0.950 ,hsa-mir-486 為0.938,說(shuō)明其作為腫瘤標(biāo)志物的診斷能力良好。
圖2 目標(biāo)miRNA 的ROC 曲線
由于乳腺癌的早期診斷對(duì)于患者預(yù)后至關(guān)重要,并且現(xiàn)在臨床常用的診斷方法顯示出某些局限性,miRNA 逐漸成為乳腺癌的新型診斷和預(yù)后生物標(biāo)志物。但是回顧當(dāng)前的研究成果,觀察到不同研究小組確定的miRNA 幾乎沒(méi)有一致性,因此尚無(wú)可用于臨床診斷的miRNA,原因可能是由于患者選擇的差異,用于分離和檢測(cè)miRNA 的技術(shù)限制,樣本量不足,統(tǒng)計(jì)分析不足以及測(cè)試其臨床效果的驗(yàn)證研究數(shù)量不足等[5]。TCGA 數(shù)據(jù)庫(kù)提供了代表30 多種不同癌癥的超過(guò)11 000 個(gè)個(gè)體的基因組序列、表達(dá)、甲基化和拷貝數(shù)變異數(shù)據(jù)[6],是迄今最成功的癌癥基因組學(xué)項(xiàng)目之一。本研究中我們利用TCGA 公開(kāi)數(shù)據(jù)篩選原發(fā)性乳腺癌相關(guān)miRNA,該方法基于大樣本大數(shù)據(jù),避免樣本量不足,弱化了個(gè)體差異,與用少量乳腺患者樣本或乳腺癌細(xì)胞系進(jìn)行miRNA 篩選相比將更加準(zhǔn)確和高效。
在miRNA 對(duì)原發(fā)性乳腺癌早期診斷價(jià)值的研究中,篩選敏感度特異度好的miRNA 作為血清學(xué)診斷標(biāo)志物尤為關(guān)鍵。為了讓篩選的miRNA 與原發(fā)性乳腺癌有更強(qiáng)的相關(guān)性,在篩選條件中首先要求miRNA 在乳腺癌組織中表達(dá)水平較正常乳腺組織變化3 倍以上,其次符合條件的至少與一個(gè)原發(fā)性乳腺癌突變基因發(fā)生相互作用,并且這種相互作用需要強(qiáng)力的證據(jù)支持[7]。為此,在利用TCGA 數(shù)據(jù)得到差異表達(dá)的miRNA 后,我們進(jìn)一步在 miRNA 靶基因預(yù)測(cè)工具上大范圍尋找差異表達(dá)miRNA 可能作用的靶基因,并將靶基因與原發(fā)性乳腺癌高頻突變基因進(jìn)行比較,有交集者所對(duì)應(yīng)的miRNA 列為重點(diǎn)考慮miRNA,以此找到與原發(fā)性乳腺癌有強(qiáng)相關(guān)性的miRNA。最近的研究表明,基于多個(gè)miRNA 的聯(lián)合分析比單個(gè)miRNA 分析具有更好的診斷性能[8],因?yàn)槎鄠€(gè)miRNA 控制多個(gè)靶基因,能夠更好地闡明它們是如何促進(jìn)腫瘤發(fā)展、逐步調(diào)控腫瘤進(jìn)程的生物學(xué)效應(yīng)[9]。也有研究者將miRNA 和臨床上已廣泛使用的腫瘤標(biāo)志物血清CEA,CA125 和CA153聯(lián)合用于診斷乳腺癌,以提高診斷敏感度和特異度[10]。綜合考慮實(shí)驗(yàn)可操作性和臨床應(yīng)用的經(jīng)濟(jì)性,診斷模型中聯(lián)合四五種miRNA 建立原發(fā)性乳腺癌診斷模型較為理想[11]。本文利用生物信息學(xué)方法篩選miRNA 進(jìn)行后續(xù)原發(fā)性乳腺癌的診斷研究,方法簡(jiǎn)單、操作簡(jiǎn)便、可信度高,值得參考。
現(xiàn)代檢驗(yàn)醫(yī)學(xué)雜志2021年5期