文雪梅 夏俊凱 張麗靜 賈彥彥 張文俊
[摘要] 目的 通過生物信息學(xué)篩選出結(jié)腸癌中的關(guān)鍵基因,為結(jié)腸癌分子生物研究及早期診斷相關(guān)生物標(biāo)志物篩選提供理論依據(jù)。方法 從GEO數(shù)據(jù)庫中選擇編號(hào)為GSE10950、GSE74602和GSE110224的基因芯片,利用R語言下載評(píng)估芯片質(zhì)量,對(duì)樣本進(jìn)行規(guī)范化處理并篩選出差異基因(DEG),通過TCGA下載結(jié)腸癌的表達(dá)數(shù)據(jù),驗(yàn)證DEG的準(zhǔn)確性,通過DAVID在線網(wǎng)站對(duì)DEG進(jìn)行GO分析和KEGG富集分析,通過STRING在線網(wǎng)站得到DEG的蛋白互作網(wǎng)絡(luò),利用Cytoscape 軟件篩選出樞紐基因(hub基因),Oncomine數(shù)據(jù)庫從基因?qū)用骝?yàn)證hub基因的表達(dá),cBioPortal數(shù)據(jù)庫分析hub基因在結(jié)腸癌中的突變情況,最后通過UALCAN及TCGA數(shù)據(jù)庫評(píng)估hub基因在結(jié)腸癌診斷方面的價(jià)值。結(jié)果 通過 GEO數(shù)據(jù)庫共篩選出結(jié)腸癌132個(gè)DEG,經(jīng)TCGA數(shù)據(jù)庫驗(yàn)證后最終得到131個(gè)DEG,其中表達(dá)下調(diào)DEG 78個(gè),表達(dá)上調(diào)DEG 53個(gè),通過STRING、Cytoscape篩選出10個(gè)hub基因,選取排名靠前的DTL等4個(gè)hub基因進(jìn)一步分析,最終證明了DTL、CCNA2、BUB1、KIF23基因在結(jié)腸癌中的高表達(dá)并可能作為早期診斷結(jié)腸癌的標(biāo)志物。結(jié)論 通過生物信息學(xué)分析研究篩選出結(jié)腸癌的關(guān)鍵基因,并證明蛋白編碼基因DTL、CCNA2、BUB1、KIF23有可能作為早期診斷結(jié)腸癌的生物標(biāo)志物。
[關(guān)鍵詞] 結(jié)腸癌;生物信息學(xué);GEO數(shù)據(jù)庫;TCGA數(shù)據(jù)庫;生物標(biāo)志物
[中圖分類號(hào)] R735.3? ? ? ? ? [文獻(xiàn)標(biāo)識(shí)碼] A? ? ? ? ? [文章編號(hào)] 1673-9701(2022)09-0001-07
Research on biomarkers of colon cancer based on GEO database
WEN Xuemei1? ?XIA Junkai1? ?ZHANG Lijing2? ?JIA Yanyan1? ?ZHANG Wenjun3
1.Xinhua Clinical College, Dalian University,Dalian? ?116021, China;2.Department of Gastroenterology, Xinhua Hospital Affiliated to Dalian University, Dalian? ?116021, China;3.Department of Anorectal Surgery, Xinhua Hospital Affiliated to Dalian University, Dalian? ?116021, China
[Abstract] Objective To screen out key genes in colon cancer through bioinformatics, and provide a theoretical basis for the molecular biology research of colon cancer and the screening of relevant markers for early diagnosis. Methods The gene chips numbered GSE10950, GSE74602, and GSE110224 were selected from GEO database. R language was used to download and evaluate the quality of the chip. The sample was standardized and the differential gene (DEG) was screened out. The expression data of colon cancer was downloaded through TCGA to verify the accuracy of DEG.GO analysis and KEGG enrichment analysis of DEG was performed through DAVID online website. The DEG′s protein interaction network was obtained through the STRING online website. The hub gene was screened out using the Cytoscape software. The expression of hub genes verified by Oncomine database. The mutation of hub gene in colon cancer was analyzed through cBioPortal database. And finally the value of hub gene in colon cancer diagnosis was evaluated through UALCAN and TCGA databases. Results A total of 132 DEGs for colon cancer were screened through the GEO database. After verification by the TCGA database, 131 DEGs were finally obtained. Ten hub genes were screened through STRING and Cytoscape. The top 4 hub genes, including DTL, were selected for further analysis. It was proved that DTL, CCNA2, BUB1, KIF23 genes were highly expressed in colon cancer and might be used as markers for early diagnosis of colon cancer. Conclusion This study screened out the key genes of colon cancer through bioinformatics analysis, and proved that the protein coding genes DTL, CCNA2, BUB1, KIF23 might be used as biomarkers for the early diagnosis of colon cancer.
[Key words] Colon cancer; Bioinformatics; GEO database; TCGA database; Biomarkers
結(jié)直腸癌是常見的消化道惡性腫瘤,其發(fā)病率、死亡率分別居全球惡性腫瘤的第4位和第2位[1],且仍處于上升階段[2]。結(jié)腸癌高死亡率的主要原因是缺乏早期癥狀,且臨床常用的腫瘤標(biāo)志物缺乏診斷早期結(jié)直腸癌的能力,某些分子的表達(dá)水平又因人而異,在此情況下,早期篩查和診斷的難度明顯增加。因此,找到新的能有效診斷早期結(jié)直腸癌的標(biāo)志物也就十分重要。
近年來,高通量測(cè)序技術(shù)及基因芯片研究受到醫(yī)藥領(lǐng)域的廣泛關(guān)注,一些數(shù)據(jù)庫含有大量樣本的特征為醫(yī)學(xué)研究的可靠性及可行性提供了一定的保證。通過對(duì)這些大數(shù)據(jù)的研究分析,可以從上萬個(gè)基因中篩選出在腫瘤發(fā)生發(fā)展中有重要作用的關(guān)鍵基因。本文通過生物信息學(xué)發(fā)現(xiàn)并研究一些關(guān)鍵基因在結(jié)腸癌中的表達(dá)情況,并進(jìn)一步分析關(guān)鍵基因診斷早期結(jié)腸癌的潛力,現(xiàn)報(bào)道如下。
1 材料與方法
1.1 材料來源
從公共基因芯片(gene expression omnibus,GEO)數(shù)據(jù)庫(http://www.ncbi.nlm.nih.g——ov/geo)選取表達(dá)譜芯片數(shù)據(jù)集GSE10950、GSE74602及GSE110224,芯片信息見表1。從癌癥和腫瘤基因圖譜(the cancer genome atlas,TCGA)數(shù)據(jù)庫(https://portal.gdc.cancer.gov/)選取結(jié)腸癌轉(zhuǎn)錄組數(shù)據(jù),共包含41例正常樣本和480例腫瘤樣本。分析工具主要為R語言(R×64 4.02版本)及各類R包、Cytoscape(3.8.0版本)、Graphad Prism 7統(tǒng)計(jì)軟件、MedCalc? Application統(tǒng)計(jì)軟件(19.1.0版本)以及各類在線數(shù)據(jù)分析網(wǎng)站。
1.2 方法
1.2.1 篩選差異基因? 通過GEOquery R包[3]對(duì)選取的GEO芯片數(shù)據(jù)進(jìn)行下載、預(yù)處理及規(guī)范化。對(duì)處理后的數(shù)據(jù)進(jìn)行分析,設(shè)置篩選條件為校驗(yàn)P值小于0.05(adj.P.value<0.05),表達(dá)變化倍數(shù)的絕對(duì)值大于2(|log2FC|>1),并利用limma R包[4]分別篩選出3個(gè)芯片數(shù)據(jù)集的表達(dá)差異基因(differentially expressed genes,DEG)。通過在線軟件draw Venn diagrams(http://bioinformatics.psb.uge--nt.be/webtools/Venn/)獲得3個(gè)數(shù)據(jù)集取交集后的重疊DEG。
1.2.2 驗(yàn)證差異基因? 通過TCGAbiolinks? R包[5]下載TCGA數(shù)據(jù)庫中結(jié)腸癌的轉(zhuǎn)錄組數(shù)據(jù),按照疾病部位為Colon,項(xiàng)目為 TCGA-COAD,數(shù)據(jù)種類為transcri ptome profiling,實(shí)驗(yàn)種類為RNA-seq,工作流程的類型為HTSeq-counts進(jìn)行數(shù)據(jù)下載。通過NCBI獲得人類基因組注釋文件GTF進(jìn)行數(shù)據(jù)合并及注釋轉(zhuǎn)換。設(shè)置DEG篩選條件為:|log2FC|>1,adj.P<0.05,利用DESeq2 R包[6]分析整理并得到DEG,并通過draw Venn diagrams與GEO得到的重疊DEG合并,以驗(yàn)證GEO數(shù)據(jù)庫得到的DEG。根據(jù)LogFC的大小使用pheatmap R包[7]繪制最終所得DEG的聚類熱圖。
1.2.3 差異表達(dá)基因的功能富集分析? 用于注釋可視化和集成發(fā)現(xiàn)的數(shù)據(jù)庫(database for annotation, visualization and integrated discovery,DAVID)(版本6.8)是一種在線數(shù)據(jù)庫( https: //David.ncifcrf.gov/),該數(shù)據(jù)庫集成了大量生物數(shù)據(jù)和相關(guān)分析工具,提供了系統(tǒng)而全面的生物信息高通量基因表達(dá)的功能注釋信息[8]。 將最終所得DEG導(dǎo)入DAVID數(shù)據(jù)庫中,進(jìn)行DEG的基因本體論(gene ontology,GO) 注釋、京都基因和基因組百科全書(kyoto encyclopedia of genes and genomes,KEGG)途徑分析,研究DEG在細(xì)胞組分(cellular component,CC)、分子功能(molecular func-tion,MF)、生物學(xué)過程(biological process,BP)及參與信號(hào)途徑方面的富集情況。設(shè)定 P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
1.2.4 篩選樞紐基因相互作用基因(或蛋白質(zhì))檢索工具STRING數(shù)據(jù)庫(search tool for the retrieval of interacting genes,STRING)是一種在線工具(http://string-db.org/),旨在評(píng)估和整合蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)信息,如物理和功能關(guān)聯(lián),迄今為止,STRING 11.0版涵蓋了來自2,031個(gè)生物體的9,643,763個(gè)蛋白質(zhì)[9]。通過STRING數(shù)據(jù)庫獲得DEG蛋白質(zhì)互作(protein-protein interaction ,PPI)網(wǎng)絡(luò),再將 PPI 網(wǎng)絡(luò)導(dǎo)入 Cyto-scape 軟件進(jìn)行可視化分析,并利用插件 cytoHubba 篩選出樞紐基因(hub) 基因。
1.2.5 驗(yàn)證hub基因? Oncomine數(shù)據(jù)庫(http://www.oncomine.org)是一種癌癥微陣列數(shù)據(jù)庫和基于Web的數(shù)據(jù)挖掘平臺(tái),旨在激發(fā)全基因組表達(dá)分析的新發(fā)現(xiàn),并比較大多數(shù)主要類型癌癥與各自正常組織中的轉(zhuǎn)錄組數(shù)據(jù)[10]。通過Oncomine數(shù)據(jù)庫分析hub基因在常見腫瘤中的表達(dá)情況。并選擇相應(yīng)數(shù)據(jù)集,下載hub基因在結(jié)腸癌與正常結(jié)腸組織中的表達(dá)數(shù)據(jù),利用Graphad Prism 統(tǒng)計(jì)軟件分析并繪制表達(dá)箱線圖,驗(yàn)證hub基因在結(jié)腸癌中的表達(dá)情況。
1.2.6 分析hub基因的基因突變率? cBioPortal數(shù)據(jù)庫(https://www.cbioportal.org/)主要用于探索多維度癌癥基因組數(shù)據(jù),以可視化分析基因、樣本和數(shù)據(jù)庫類型。使研究者可以交互探索不同樣本、基因、通路在遺傳學(xué)上的改變,并與臨床數(shù)據(jù)相結(jié)合[11]。通過cBioPortal數(shù)據(jù)庫選取合適的結(jié)腸癌數(shù)據(jù)集,分析hub基因在結(jié)腸癌中的突變率,研究在結(jié)腸癌中hub基因的表達(dá)變化是否因基因本身發(fā)生突變所致,以此推測(cè)hub基因在結(jié)腸癌中的表達(dá)穩(wěn)定性。
1.2.7 評(píng)估hub 基因?qū)Y(jié)腸癌的診斷價(jià)值? UALCAN數(shù)據(jù)庫(http://ualcan.path.uab.edu/index.html)是一個(gè)交互式Web資源,使研究人員能夠快速輕松地分析來自TCGA數(shù)據(jù)庫的數(shù)據(jù)[12]。利用UALCAN數(shù)據(jù)庫獲得hub基因在結(jié)腸癌不同分期的表達(dá)情況,確認(rèn)hub基因是否在早期結(jié)腸癌中出現(xiàn)表達(dá)升高的情況,然后整理TCGA獲得的基因表達(dá)數(shù)據(jù),并利用統(tǒng)計(jì)軟件MedCalc? Application(19.1.0版本)得到hub基因的受試者工作特征曲線(receiver operating characteristic curve,ROC)及曲線下面積(area under curve,AUC),評(píng)估hub用于診斷結(jié)腸癌的潛力。
1.3 統(tǒng)計(jì)學(xué)分析
本研究差異基因的統(tǒng)計(jì)學(xué)分析通過R軟件進(jìn)行,并采用非參數(shù)檢驗(yàn)中的Mann-Whitney檢驗(yàn)進(jìn)行統(tǒng)計(jì)分析。hub基因驗(yàn)證的統(tǒng)計(jì)學(xué)分析通過Graphad Prism 統(tǒng)計(jì)軟件,并采用非配對(duì)t檢驗(yàn)進(jìn)行分析。ROC曲線繪制及AUC計(jì)算通過MedCalc Application進(jìn)行。所有分析均采用雙尾檢驗(yàn),α=0.05 為檢驗(yàn)水準(zhǔn),P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
2 結(jié)果
2.1 DEG的篩選及驗(yàn)證
通過R語言對(duì)選取的3個(gè)GEO芯片數(shù)據(jù)集的各表達(dá)譜進(jìn)行分析,對(duì)數(shù)據(jù)集的各樣本表達(dá)譜進(jìn)行規(guī)范化處理,按篩選條件通過limma R包篩選出各芯片數(shù)據(jù)集的DEG,并取交集后,共得到132個(gè)重疊DEG(封三圖1A),其中表達(dá)上調(diào)DEG 53個(gè),表達(dá)下調(diào)DEG 79個(gè)。通過對(duì)自TCGA下載的結(jié)腸癌數(shù)據(jù)進(jìn)行分析,共得到上調(diào)DEG 2863個(gè),下調(diào)DEG 2552個(gè)。與GEO所得重疊DEG取交集后,排除GEO數(shù)據(jù)庫篩選得到的下調(diào)基因腺苷A3受體(adenosine A3 receptor,ADORA3),其余131個(gè)DEG均符合差異表達(dá)基因標(biāo)準(zhǔn)(封三圖1B),并通過pheatmap R包繪制最終所得DEG在各個(gè)數(shù)據(jù)集中的聚類熱圖(封三圖1C)。
2.2 DEG的GO分析和KEGG 途徑分析
通過DAVID 進(jìn)行DEG的GO 分析(封三圖2)和 KEGG 途徑富集分析(表2)。GO分析結(jié)果顯示,DEG主要富集在細(xì)胞外泌體(extracellular exosome)、細(xì)胞表面(cell surface)及頂端質(zhì)膜(apical plasma membrane)等細(xì)胞外部區(qū)域(封三圖2CC);主要參與細(xì)胞增殖(cell proliferation)、細(xì)胞外基質(zhì)的組織(extracellular matrix organization)、氯離子跨膜轉(zhuǎn)運(yùn)(chloride transmembrane transport)以及基因表達(dá)的正向調(diào)控(positive regulation of gene expression)等生物學(xué)過程(封三圖2 BP);主要參與轉(zhuǎn)運(yùn)活性(transporter activity)、蛋白激酶結(jié)合(protein kinase binding)、生長(zhǎng)因子活性(growth factor activity)、結(jié)構(gòu)分子活性(structural molecule activity)、鈣離子結(jié)合(calcium ion binding)等分子功能(封三圖2 MF)。KEGG 途徑分析顯示,補(bǔ)體及凝血級(jí)聯(lián)(complement and coagulation cascades)、氮代謝(nitrogen meta-bolism)、白細(xì)胞跨內(nèi)膜遷移(leukocyte transendothelial migration)、細(xì)胞周期(cell cycle)、NF-κB信號(hào)通路(NF-kappa B signaling pathway)等是DEG的主要富集信號(hào)途徑(表2)。
2.3 差異表達(dá)基因蛋白質(zhì)互建網(wǎng)絡(luò)分析
將最終得到的131個(gè)重疊DEG輸入STRING在線網(wǎng)站后得到PPI網(wǎng)絡(luò)(圖1A),將所得PPI信息下載后導(dǎo)入Cytoscape軟件中,利用 cytoHubba 插件篩選 hub基因并進(jìn)行可視化,分別按MCC、Degree等12種計(jì)算方法進(jìn)行分析,得到驅(qū)動(dòng)蛋白家族成員23(kinesin family member 23,KIF23)等10個(gè)hub基因,為了便于后續(xù)深入分析,選取KIF23、有絲分裂檢查點(diǎn)絲氨酸/蘇氨酸激酶(BUB1 mitotic checkpoint serine/threonine kinase,BUB1)、細(xì)胞周期蛋白A2(cyclin A2,CCNA2)、無齒E3泛素蛋白連接酶同源基因(denticleless E 3 ubiquitin protein ligase homolog,DTL) 4個(gè)排名靠前的蛋白編碼基因進(jìn)一步分析(圖3B)。
2.4 驗(yàn)證hub基因在結(jié)腸癌中的表達(dá)
基于Oncomine數(shù)據(jù)庫分析4個(gè)hub基因在多腫瘤中的表達(dá)趨勢(shì),結(jié)果顯示4個(gè)hub基因在腫瘤中多呈高表達(dá)狀態(tài)(圖2A)。進(jìn)一步選擇Ki Colon[5]、Sabates-Bellver Colon[6]兩個(gè)結(jié)腸癌數(shù)據(jù)集進(jìn)行分析,結(jié)果顯示相對(duì)于正常結(jié)腸組織,4個(gè)hub基因在結(jié)腸癌中明顯高表達(dá)(圖3)。
2.5分析hub基因的基因突變率
通過cBioPortal數(shù)據(jù)庫選取Kishore Guda等[13]、 Suhas Vasaikar等[14]的2項(xiàng)結(jié)腸癌數(shù)據(jù)集(CaseCCC、 PNAS 2015、CPTAC-2 Prospective、Cell 2019),共包括來自139例結(jié)腸癌患者的139份樣本。分析發(fā)現(xiàn),BUB1等4種基因在結(jié)腸癌中的基因突變率均較低,最高的為BUB1,但也僅為4.0%(圖4),說明DTL等4種基因在結(jié)直腸癌中通過自身突變致癌的可能性低,其高表達(dá)可能是受到上游基因調(diào)控的結(jié)果,間接證明DTL等基因在結(jié)腸癌中的表達(dá)具有較好的穩(wěn)定性。
2.6 hub 基因?qū)Y(jié)腸癌的診斷價(jià)值評(píng)估
通過UALCAN數(shù)據(jù)庫得到來自TCGA數(shù)據(jù)庫的315例臨床資料,分析 hub基因在結(jié)腸癌不同分期中的表達(dá)情況,結(jié)果顯示4個(gè)hub基因在結(jié)腸癌早期即出現(xiàn)了明顯的表達(dá)升高情況,并有隨著疾病進(jìn)展表達(dá)逐漸降低的趨勢(shì)(圖 5)。通過MedCalc得到4個(gè)基因的ROC及AUC,結(jié)果顯示4個(gè)hub基因的AUC均大于0.9(圖2B),說明DTL等4種基因具有潛力可能作為結(jié)腸癌的診斷標(biāo)志物。
3 討論
本文從GEO數(shù)據(jù)庫選取了3個(gè)結(jié)腸癌的芯片數(shù)據(jù)集,通過取交集的形式初步篩選出了132個(gè)在結(jié)腸癌中的差異表達(dá)基因,并進(jìn)一步通過TCGA的結(jié)腸癌數(shù)據(jù)驗(yàn)證了所得DEG的準(zhǔn)確性,最終得到131個(gè)DEG,其中上調(diào)的DEG 53個(gè),下調(diào)的DEG 79個(gè)。GO分析顯示這些DEG主要參與相關(guān)分子功能和生物學(xué)過程,KEGG分析提示DEG主要在細(xì)胞周期、NF-κB信號(hào)通路等信號(hào)途徑富集,而這些生物功能或通路均與腫瘤的發(fā)生發(fā)展有密切聯(lián)系。為了進(jìn)一步找到hub基因,將得到的131個(gè)DEG導(dǎo)入到STRING在線網(wǎng)站并得到PPI網(wǎng)絡(luò),將該P(yáng)PI網(wǎng)絡(luò)導(dǎo)入到Cytoscape中,通過cytoHubba 插件的12種計(jì)算方法篩選后,得到hub基因。本文選取其中排名靠前的DTL等4個(gè)hub基因進(jìn)一步分析。通過Oncomine數(shù)據(jù)庫發(fā)現(xiàn),DTL等4個(gè)hub基因在多種腫瘤中明顯高表達(dá)且較穩(wěn)定,亦驗(yàn)證了其在結(jié)腸癌中的高表達(dá)。為了研究4個(gè)hub基因診斷早期結(jié)腸癌的潛力,首先通過UALCAN在線數(shù)據(jù)庫分析來自TCGA數(shù)據(jù)庫的315例樣本發(fā)現(xiàn),DTL、KIF23、BUB1、CCNA2基因均在結(jié)腸癌的早期出現(xiàn)明顯高表達(dá)。此外,通過cBioPortal數(shù)據(jù)庫證實(shí)DTL等4種基因在結(jié)腸癌中的基因突變率偏低,說明DTL等4種基因表達(dá)具有較高的穩(wěn)定性,符合診斷生物標(biāo)志物的特點(diǎn)。最后,通過計(jì)算ROC曲線及AUC發(fā)現(xiàn),這4個(gè)hub基因的AUC均大于0.9,證明它們的診斷早期結(jié)腸癌的準(zhǔn)確率較高。
DTL又稱CDT2、DCAF2 或 RAMP,其在細(xì)胞周期、DNA復(fù)制及基因組穩(wěn)定過程中發(fā)揮重要作用[16]。有研究發(fā)現(xiàn),DTL在多種腫瘤中高表達(dá),并被視為一種促癌基因[17]。Chen等[18]在實(shí)驗(yàn)中發(fā)現(xiàn),抑制DTL的表達(dá)能進(jìn)一步抑制微管相關(guān)蛋白TPX2的表達(dá),并認(rèn)為DTL是通過癌細(xì)胞衰老誘導(dǎo)治療肝癌的潛在新靶基因。但在結(jié)腸癌中,尚無研究說明DTL的具體作用機(jī)制。CCNA2是一種高度保守的細(xì)胞周期蛋白,在控制細(xì)胞周期中起關(guān)鍵作用,CCNA2常在腫瘤中發(fā)揮促癌作用[19]。據(jù)Hung等[20]研究報(bào)道,在乳腺癌中,CCNA2缺失會(huì)導(dǎo)致蛋白激酶ERK活性受損和乳腺腫瘤細(xì)胞轉(zhuǎn)移減弱,在肝細(xì)胞癌中,CCNA2的表達(dá)通過激活PI3K/AKT促進(jìn)腫瘤細(xì)胞的遷移、侵襲和轉(zhuǎn)移[21],CCNA2還能通過整聯(lián)蛋白αVβ3信號(hào)傳導(dǎo)途徑促進(jìn)非小細(xì)胞肺癌的侵襲和遷移[22]。Gan等[23]在實(shí)驗(yàn)中發(fā)現(xiàn),在結(jié)腸癌中,CCNA2在癌組織中的表達(dá)高于正常組織,并且CCNA2敲低可以通過削弱細(xì)胞周期進(jìn)程并誘導(dǎo)細(xì)胞凋亡顯著抑制結(jié)腸癌細(xì)胞的生長(zhǎng)。
BUB1被認(rèn)為是一種癌基因。據(jù)Piao等[24]發(fā)現(xiàn),BUB1在胰腺癌組織中顯著過表達(dá),且表達(dá)與胰腺癌的腫瘤大小相關(guān)。在膠質(zhì)母細(xì)胞瘤中,通過抑制BUB1的表達(dá)出現(xiàn)癌細(xì)胞增殖減弱及腫瘤生長(zhǎng)延遲現(xiàn)象[25]。生物信息學(xué)研究顯示,BUB1在乳腺癌及肝癌等腫瘤中高表達(dá)并具有可能作為靶向治療的標(biāo)志物[26-27],在乳頭狀腎細(xì)胞癌中也得到同樣的結(jié)論[28]。有研究表明,BUB1的種系突變會(huì)增加結(jié)直腸癌的患病風(fēng)險(xiǎn),但這種突變?cè)诮Y(jié)腸癌中并不常見,且這種說法還未得到充分證明[29-30]。KIF23已被證明可在體外驅(qū)動(dòng)微管運(yùn)動(dòng),并能與絲氨酸/蘇氨酸激酶家族(Aurora家族)的蛋白激酶相互作用,在有絲分裂步驟中起關(guān)鍵作用[31]。在乳腺癌中,KIF23水平升高與癌相關(guān)核調(diào)節(jié)蛋白ANCCA在腫瘤中的水平相關(guān),且與ER陽性乳腺癌患者的無復(fù)發(fā)生存率低相關(guān)[32]。還有研究顯示,KIF23在肺癌中表達(dá)升高,是潛在的分子標(biāo)記[33],同BUB1一樣,有研究報(bào)道KIF23在腫瘤中的水平升高可能是由于染色體的額外復(fù)制導(dǎo)致[34]。在結(jié)腸癌中,KIF23可能受到長(zhǎng)鏈非編碼RNA UCA1的調(diào)控而發(fā)揮促癌作用[35]。目前針對(duì)DTL等基因表達(dá)升高的機(jī)制尚存在爭(zhēng)議,有研究者認(rèn)為這是由于自身基因突變導(dǎo)致[29-30,34]。
總之,本文將生物信息學(xué)方法、高通量測(cè)序技術(shù)及基因芯片和大數(shù)據(jù)分析結(jié)合起來,發(fā)現(xiàn)并驗(yàn)證了DTL、KIF23、BUB1、CCNA24個(gè)基因不僅在結(jié)腸癌早期出現(xiàn)中高表達(dá)且較穩(wěn)定,同時(shí)基因突變率偏低,符合診斷生物標(biāo)志物的特點(diǎn)并證明在早期結(jié)腸癌診斷中的準(zhǔn)確率較高,因此有可能作為早期診斷結(jié)腸癌的生物標(biāo)志物。且這4個(gè)基因在結(jié)腸癌中的高水平表達(dá)更多的是受到上游基因的調(diào)控導(dǎo)致,要進(jìn)一步研究DTL等基因在結(jié)腸癌中的作用及作用機(jī)制,需重點(diǎn)關(guān)注其上游的調(diào)控基因。
[參考文獻(xiàn)]
[1]? ?Jiang X,Tan J,Li J,et al. Dact3 is an epigenetic regulator of wnt/beta-catenin signaling in colorectal cancer and is a therapeutic target of histone modifications [J].Cancer Cell, 2008,13(6):529-541.
[2]? ?Vlachavas EI, Pilalis E, Papadodima O, et al. Radio genomic analysis of f-18-fluorodeoxyglucose positron emission tomography and gene expression data elucidates the epidemiological complexity of colorectal cancer lands-cape[J].Comput Struct Biotechnol J,2019,17(177-185):178-186.
[3]? ?Davis S,Meltzer PS.Geoquery:A bridge between the gene expression omnibus(geo) and bioconductor[J].Bioinfor-matics, 2007,23(14):1846-1847.
[4]? ?Ritchie ME,Phipson B,Wu D,et al. Limma powers differ-ential expression analyses for rna-sequencing and micr-oarray studies[J].Nucleic Acids Research,2015,43(7):e47.
[5]? ?Colaprico A, Silva TC, Olsen C, et al. Tcgabiolinks: An r/bioconductor package for integrative analysis of tcga data[J].Nucleic Acids Research, 2016,44(8):e71.
[6]? ?Love MI,Huber W,Anders S.Moderated estimation of fold change and dispersion for rna-seq data with deseq2[J]. Genome Biol, 2014,15(12):550-553.
[7]? ?Kolde R. Pheatmap: Pretty heatmaps. R package version 1.0.12. 2019.
[8]? ?Huang DW,Sherman BT,Tan Q,et al. The david gene functional classification tool: A novel biological module-centric algorithm to functionally analyze large gene lists [J]. Genome Biol, 2007,8(9):R183.
[9]? ?Szklarczyk D, Morris JH, Cook H, et al. The string database in 2017: Quality-controlled protein-protein association networks, made broadly accessible[J].Nucleic Acids Research, 2017,45(D1):D362-D368.
[10]? Rhodes DR, Kalyana-Sundaram S, Mahavisno V, et al. Oncomine 3.0: Genes, pathways, and networks in a collection of 18 000 cancer gene expression profiles[J]. Neoplasia, 2007,9(2):166-180.
[11]? Cerami E,Gao J,Dogrusoz U,et al. The cbio cancer genomics portal: An open platform for exploring multidi-mensional cancer genomics data[J].Cancer Discov, 2012, 2(5):401-404.
[12]? Chandrashekar DS,Bashel B,Balasubramanya SaH, et al. Ualcan: A portal for facilitating tumor subgroup gene expression and survival analyses[J].Neoplasia,2017,19(8):649-658.
[13]? Guda K,Veigl ML,Varadan V,et al. Novel recurrently mutated genes in African American colon cancers[J].Proc Natl Acad Sci USA,2015,112(4):1149-1154.
[14]? Vasaikar S,Huang C,Wang X,et al. Proteogenomic analysis of human colon cancer reveals new therapeutic opportunities[J].Cell,2019,177(4):1035-1049.
[15]? Cheung WM, Chu AH, Chu PW, et al. Cloning and ex- pression of a novel nuclear matrix-associated protein that is regulated during the retinoic acid-induced neuronal differentiation[J].The Journal of Biological Chemistry, 2001, 276(20):17083-17091.
[16]? Slenn TJ, Morris B, Havens CG, et al. Thymine DNA glycosylase is a crl4cdt2 substrate[J].The Journal of Biolo-gical Chemistry, 2014,289(33):23 043-23 055.
[17]? Kobayashi H,Komatsu S,Ichikawa D,et al. Over expr-ession of denticleless e3 ubiquitin protein ligase homolog (dtl) is related to poor outcome in gastric carcinoma[J]. Oncotarget, 2015,6(34):36 615-36 624.
[18]? Chen YC,Chen IS,Huang GJ, et al. Targeting dtl induces cell cycle arrest and senescence and suppresses cell growth and colony formation through tpx2 inhibition in human hepatocellular carcinoma cells[J].Onco Targets Ther, 2018,11:1601-1616.
[19]? Yang F,Gong J,Wang G, et al. Waltonitone inhibits pro-liferation of hepatoma cells and tumorigenesis via fxr-mir-22-ccna2 signaling pathway[J].Oncotarget,2016,7(46):75 165-75 175.
[20]? Hung YH, Huang HL,Chen WC,et al. Argininosuccinate lyase interacts with cyclin a2 in cytoplasm and modulates growth of liver tumor cells[J].Oncology Reports,2017,37(2):969-978.
[21]? Gopinathan L, Tan SLW, Padmakumar VC, et al. Loss of cdk2 and cyclin a2 impairs cell proliferation and tumor-igenesis[J].Cancer Research, 2014,74(14):3870-3879.
[22]? Ruan JS,Zhou H,Yang L,et al. Ccna2 facilitates epithe-lial-to-mesenchymal transition via the integrin αvβ3 signaling in nsclc[J].Int J Clin Exp Pathol,2017,10(8):8324-8333.
[23]? Gan Y,Li Y,Li T,et al. Ccna2 acts as a novel biomarker in regulating the growth and apoptosis of colorectal cancer[J].Cancer Manag Res, 2018,10:5113-5124.
[24]? Piao J,Zhu L,Sun J,et al. High expression of cdk1 and bub1 predicts poor prognosis of pancreatic ductal adeno-carcinoma[J].Gene, 2019,701:26-30.
[25]? Yu H,Zhang S,Ibrahim AN,et al. Serine/threonine kinase bub1 promotes proliferation and radio-resistance in glioblastoma[J].Pathol Res Pract,2019,215(8):152 508.
[26]? Yang K,Gao J,Luo M.Identification of key pathways and hub genes in basal-like breast cancer using bioinfor-matics analysis[J].Onco Targets Ther,2019,12:1319-1331.
[27]? Yang WX,Pan YY,You CG. Cdk1,ccnb1, cdc20, bub1, mad2l1,mcm3,bub1b, mcm2,and rfc4 may be potential therapeutic targets for hepatocellular carcinoma using integrated bioinformatic analysis[J].Biomed Res Int, 2019, 2019:1245 072.
[28]? Gao Z,Zhang D,Duan Y,et al. A five-gene signature predicts overall survival of patients with papillary renal cell carcinoma[J]. PLoS One,2019,14(3):e0211 491.