国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

人類蛋白組學(xué)草圖的肺癌分子標(biāo)記物初探

2016-04-26 09:29:05朱琰琰羅執(zhí)芬崔永霞盧創(chuàng)新
生物信息學(xué) 2016年1期
關(guān)鍵詞:數(shù)據(jù)挖掘肺癌

朱琰琰,羅執(zhí)芬,崔永霞,盧創(chuàng)新,周 云*

(1.河南省人民醫(yī)院腫瘤科, 鄭州 450003;

2.鄭州大學(xué)人民醫(yī)院腫瘤科, 鄭州 450003)

?

人類蛋白組學(xué)草圖的肺癌分子標(biāo)記物初探

朱琰琰1,2,羅執(zhí)芬1,2,崔永霞1,2,盧創(chuàng)新1,2,周云1,2*

(1.河南省人民醫(yī)院腫瘤科, 鄭州 450003;

2.鄭州大學(xué)人民醫(yī)院腫瘤科, 鄭州 450003)

摘要:傳統(tǒng)的肺癌分子標(biāo)記物探索通常基于基因組或者轉(zhuǎn)錄組研究,而基于蛋白質(zhì)水平的肺癌分子標(biāo)記物探索通常局限在低通量水平。 質(zhì)譜技術(shù)已經(jīng)開始產(chǎn)生高通量的全局正常及癌癥蛋白組。我們采用開源統(tǒng)計(jì)軟件R對(duì)人類蛋白組學(xué)草圖數(shù)據(jù)及已發(fā)表的肺癌蛋白質(zhì)組學(xué)數(shù)據(jù)進(jìn)行二次分析,篩選出91個(gè)潛在的候選肺癌分子標(biāo)記物?;蜃⒔夥治鲲@示候選肺癌基因富集了和代謝、TP53通路以及MicroRNA調(diào)控等相關(guān)的基因。最后,利用Human Protein Atlas數(shù)據(jù)庫及Pubmed對(duì)前20候選標(biāo)記物進(jìn)行驗(yàn)證, 結(jié)果顯示大部分候選肺癌基因大多能夠得到驗(yàn)證??梢姅?shù)據(jù)挖掘在即將到來的質(zhì)譜推動(dòng)的組學(xué)大數(shù)據(jù)時(shí)代將發(fā)揮重要作用。

關(guān)鍵詞:蛋白質(zhì)組;數(shù)據(jù)挖掘;肺癌;分子標(biāo)記物

人類基因組草圖的發(fā)表迄今已經(jīng)有15年。在這期間,測(cè)序技術(shù)的不斷成熟以及成本的不斷下降促使基因組學(xué)在生物醫(yī)學(xué)研究中占據(jù)舉足輕重的作用[1]?;蛭⑿酒夹g(shù)以及RNA測(cè)序則推動(dòng)了我們對(duì)于基因在RNA水平表達(dá)的認(rèn)識(shí)[2, 3]?;谵D(zhuǎn)錄組學(xué)數(shù)據(jù)的研究使我們得以發(fā)現(xiàn)很多在疾病發(fā)生發(fā)展中起重要作用的生物標(biāo)記物,比如腫瘤生物標(biāo)記。由于技術(shù)的限制,我們對(duì)于人類蛋白組學(xué)的認(rèn)識(shí)一直處于相對(duì)落后的狀態(tài)。 近年來,質(zhì)譜技術(shù)的發(fā)展正在催生一個(gè)嶄新的蛋白質(zhì)組學(xué)時(shí)代的到來[4, 5]。蛋白組學(xué)數(shù)據(jù)的存儲(chǔ)、分析、解析成為生物信息學(xué)的一個(gè)新挑戰(zhàn)[6]。越來越多的雜志要求研究人員將高通量數(shù)據(jù)上傳到公共數(shù)據(jù)庫,使得普通研究人員借助簡單的生物信息學(xué)方法能夠?qū)@些數(shù)據(jù)進(jìn)行挖掘、整合,以自己獨(dú)特的角度進(jìn)行數(shù)據(jù)的再分析。

癌癥分子標(biāo)志物的研究具有重大的臨床意義。一方面,分子標(biāo)記物可以大大提高癌癥早期診斷率。目前,前列腺癌特異抗原(PSA)、癌胚抗原(CEA)、及甲型胎兒蛋白(AFP)分別被廣泛用于前列腺癌、結(jié)腸癌和肝癌等的篩查,為高危人群提供了一個(gè)成本較低的篩查手段。另一方面,癌癥分子標(biāo)記物可以為靶向治療提供新的策略。BCL-ABL融合基因是慢性粒細(xì)胞性白血病常見的突變,針對(duì)這個(gè)突變酪氨酸激酶的靶向藥伊馬替尼大大提高了慢性粒細(xì)胞白血病的生存期。

目前,肺癌在全世界范圍內(nèi)是導(dǎo)致最多癌癥死亡的殺手[7]。盡管近年來我們?cè)诎邢蛑委熂霸缙谠\斷方面取得了許多激動(dòng)人心的進(jìn)展,很多肺癌病人的診斷往往已經(jīng)到了晚期,使得病人失去手術(shù)機(jī)會(huì)并且對(duì)標(biāo)準(zhǔn)化療方案鮮有反應(yīng)。對(duì)于肺癌分子標(biāo)志物的界定以及功能學(xué)研究有助于我們更深入的認(rèn)識(shí)肺癌發(fā)生發(fā)展的分子生物學(xué)機(jī)理,從而能在早期診斷以及靶向治療方面取得新的突破。

最近,兩個(gè)研究小組同時(shí)發(fā)表了人類蛋白組草圖[8, 9]。人類蛋白組草圖以及更多后續(xù)研究將成為一個(gè)寶貴的金礦,從而推動(dòng)我們對(duì)于生物標(biāo)記物的認(rèn)識(shí)。本研究將利用公開發(fā)表的人類蛋白質(zhì)組草圖數(shù)據(jù)[9],結(jié)合其他公共數(shù)據(jù)庫的數(shù)據(jù),探索潛在的有價(jià)值的肺癌分子標(biāo)記物。

1數(shù)據(jù)來源與方法

1.1數(shù)據(jù)來源

原始蛋白組數(shù)據(jù)來源于http://www.nature.com/nature/journal/v509/n7502/full/nature13319.html

1.2分析方法

R-project開發(fā)的開源統(tǒng)計(jì)語言R用于進(jìn)行所有的數(shù)據(jù)分析以及作圖。R編程使用圖形界面軟件Rstudio。數(shù)據(jù)錄入采用gdata庫中的read.xls函數(shù)。其他函數(shù)均為R基礎(chǔ)庫中包含的函數(shù)。肺癌表達(dá)數(shù)據(jù)來源于5株肺癌細(xì)胞系表達(dá)的平均值;正常參照蛋白組原始PSM數(shù)值進(jìn)行l(wèi)og10轉(zhuǎn)化。我們定義量化指標(biāo)以對(duì)1 816個(gè)肺癌基因表達(dá)水平進(jìn)行界定,即ratio = 肺癌細(xì)胞系表達(dá)均值/log10(PSM)。

采用馬克思普朗克分子遺傳研究所開發(fā)的在線工具ConsensusPathDB (http://cpdb.molgen.mpg.de/)進(jìn)行生物通路富集分析。ConsensusPathDB基于KEGG、WikiPathways等數(shù)據(jù)庫。p值大于0.01作為顯著性檢驗(yàn)的標(biāo)準(zhǔn)。我們使用Panther在線工具(http://pantherdb.org/)進(jìn)行基于生物功能的基因注解。

1.3論文圖文

使用微軟Word文本處理軟件準(zhǔn)備本論文草稿,Inkspace軟件準(zhǔn)備論文中矢量圖制作。

2結(jié)果分析

2.1候選肺癌分子標(biāo)志物篩選

首先,下載5株肺癌細(xì)胞系的蛋白質(zhì)表達(dá)數(shù)據(jù)[9]。這5株肺癌細(xì)胞系分別為:A549, h160, H226, H23和p22, 涵蓋了常見的肺癌類型。表1為5株肺癌細(xì)胞系在ATCC細(xì)胞系數(shù)據(jù)庫中的相關(guān)信息。在5株肺癌細(xì)胞系中檢測(cè)到蛋白質(zhì)表達(dá)的基因數(shù)目高達(dá)12 668個(gè)。其中,有1 816個(gè)基因在5株細(xì)胞系中均能檢測(cè)到蛋白質(zhì)表達(dá)(肺癌共表達(dá)基因)。

表1 本研究所涉及的肺癌細(xì)胞系

接下來,下載涵蓋18 097個(gè)基因表達(dá)的人類蛋白組草圖。所有蛋白質(zhì)表達(dá)水平由PSM表示,其中PSM是該蛋白質(zhì)在ProteomicsDB數(shù)據(jù)庫中的多肽譜配對(duì)數(shù)。人類蛋白質(zhì)草圖將作為人類蛋白質(zhì)表達(dá)的正常參照,用于和肺癌細(xì)胞系蛋白組進(jìn)行比較從而發(fā)現(xiàn)潛在的腫瘤標(biāo)記物。依次檢索1 816個(gè)肺癌共表達(dá)基因在人類蛋白組草圖中的表達(dá)水平(PSM),并且進(jìn)行l(wèi)og10轉(zhuǎn)換,轉(zhuǎn)換后的PSM數(shù)值可以同前面下載的肺癌共表達(dá)基因進(jìn)行比較。

為了獲得肺癌共表達(dá)基因的表達(dá)水平,首先將1 816個(gè)肺癌共表達(dá)基因在5株肺癌細(xì)胞中的表達(dá)進(jìn)行平均。然后,采用簡化的量化指標(biāo)以對(duì)1 816個(gè)肺癌基因表達(dá)水平進(jìn)行界定,即ratio = 肺癌細(xì)胞系表達(dá)均值/log10(PSM)。這個(gè)比率將作為肺癌生物標(biāo)記物指數(shù)。圖1(a)為肺癌生物標(biāo)記物指數(shù)的直方圖分布,處于柱狀圖中心位置的基因在肺癌組織的表達(dá)水平和在人類蛋白質(zhì)草圖中的表達(dá)水平最為接近。而處于柱狀圖兩側(cè)的基因則是表達(dá)水平偏離(高于或者低于)人類蛋白組草圖表達(dá)水平的基因。

利用Ratio對(duì)1 816個(gè)肺癌共表達(dá)基因進(jìn)行由高到低的排序見圖1(b),以篩選出在肺癌組織中表達(dá)水平遠(yuǎn)高于人類蛋白質(zhì)草圖參照的基因。以0.725 8作為log2(ratio)的閾值能夠篩選出5%在肺癌中上調(diào)表達(dá)的基因(合計(jì)91個(gè)),即肺癌的候選分子標(biāo)記物。表2為前20的候選分子標(biāo)記物。

圖1 候選肺癌標(biāo)記物篩選Fig.1 Screening of candidate biomarkers for lung cancer

為了研究哪些生物學(xué)功能在肺癌發(fā)生發(fā)展過程中被富集,基因注解(Gene Ontology)被用于對(duì)91個(gè)候選肺癌標(biāo)記物進(jìn)行分析。 圖2只顯示了基因注解顯著的結(jié)果,發(fā)現(xiàn)催化活性、蛋白結(jié)合等生物學(xué)功能被富集,其中包括已知的肺癌相關(guān)蛋白NRAS。被富集的生物學(xué)功能橫跨了細(xì)胞表面受體到轉(zhuǎn)錄因子及下游基因表達(dá)的“信號(hào)傳遞”過程,包括受體活性、 轉(zhuǎn)運(yùn)蛋白、DNA結(jié)合轉(zhuǎn)錄因子、 蛋白質(zhì)結(jié)合轉(zhuǎn)錄因子、酶調(diào)控因子及催化活性。這提示癌癥是一個(gè)復(fù)雜的疾病,細(xì)胞內(nèi)部細(xì)胞傳遞的各個(gè)步驟都可能被癌細(xì)胞利用產(chǎn)生對(duì)癌細(xì)胞有利的表型。

圖2 候選肺癌生物標(biāo)記物顯著富集的生物功能及其比例Fig. 2 Geneontology analysis for lung cancer biomarkers

為進(jìn)一步研究這91個(gè)肺癌候選標(biāo)記物所參與的生物通路。采用馬克思普朗克分子遺傳研究所開發(fā)的在線工具ConsensusPathDB獲取這91個(gè)肺癌候選標(biāo)記物所富集的生物通路。結(jié)果發(fā)現(xiàn)三羧酸循環(huán)和氧化呼吸鏈相關(guān)基因在肺癌當(dāng)中被大量富集,支持肺癌在發(fā)生發(fā)展過程中代謝通路的重塑。值得注意的是,和P53相關(guān)的基因在肺癌候選標(biāo)志物中也被富集,其中包括參與代謝的基因和受P53轉(zhuǎn)錄調(diào)控的基因。還發(fā)現(xiàn)許多肺癌候選標(biāo)記物受MicroRNA調(diào)控,提示基于MicroRNA的藥物研發(fā)可能為肺癌的治療提供新的方向,91個(gè)候選肺癌生物標(biāo)記物采用ConsensusPathDB進(jìn)行功能注解,顯示的是顯著富集的生物通路。節(jié)點(diǎn)大小表示該通路相關(guān)基因數(shù)目;節(jié)點(diǎn)顏色越深,p值越小;節(jié)點(diǎn)間連線越粗,兩個(gè)節(jié)點(diǎn)共有基因越多;節(jié)點(diǎn)間連線顏色指示候選基因中參與該通路的基因數(shù)目,粉色最多,灰色最少 (見圖3)。

2.2基于公共數(shù)據(jù)庫及Pubmed的驗(yàn)證

首先,我們采用human protein atlas數(shù)據(jù)庫[10, 11]對(duì)前二十個(gè)候選腫瘤標(biāo)記物進(jìn)行驗(yàn)證。前20個(gè)候選標(biāo)記物中除了PROX1和STMN2外,其他標(biāo)記物在數(shù)據(jù)庫均有免疫組化數(shù)據(jù)。我們發(fā)現(xiàn)除了YJEFN3、 RAB39A 和LRRC16B 3個(gè)基因只有1個(gè)病例出現(xiàn)低表達(dá), 大部分候選標(biāo)記物在肺癌組織中都有低、中、高等不同程度的表達(dá)。盡管免疫組織化學(xué)的數(shù)據(jù)和所采用的抗體關(guān)系密切,但是大部分候選基因在肺癌的表達(dá)能夠得到驗(yàn)證(見圖4)。

圖3 候選肺癌生物標(biāo)記物富集的生物通路Fig.3 Enrichment of biological pathways for lung cancer biomarkers

圖4 候選生物標(biāo)記物在人類蛋白質(zhì)圖譜數(shù)據(jù)庫中的驗(yàn)證Fig. 4 Validation of biomarkers in human protein altas

不同數(shù)目的肺癌組織用不同抗體對(duì)候選生物標(biāo)記物進(jìn)行染色,根據(jù)染色強(qiáng)度分為高表達(dá) (High),中表達(dá) (Medium),低表達(dá) (Low),無法檢測(cè) (ND)。

其次,利用Pubmed對(duì)部分候選肺癌基因進(jìn)行檢索。由于對(duì)于PROX1和STMN2在人類蛋白質(zhì)圖譜中沒有相應(yīng)的數(shù)據(jù)可以分析該基因在肺癌組織中的表達(dá),Pubmed將用于進(jìn)行文獻(xiàn)檢索。有研究表明PROX1在肺癌中過表達(dá),而采用慢病毒介導(dǎo)的shRNA敲低PROX1則會(huì)抑制肺癌細(xì)胞的增殖,提示PROX1很可能是一個(gè)潛在的肺癌標(biāo)志物[12]。另外,STMN2作為調(diào)控微管動(dòng)態(tài)的基因,是WNT通路的下游。研究表明STMN2在肝癌中高表達(dá)并且對(duì)于維持肝癌細(xì)胞錨定非依賴的生長狀態(tài)有重要意義[13],而它在肺癌中的作用尚不清楚。

3討論

利用公共數(shù)據(jù)庫的蛋白質(zhì)組學(xué)數(shù)據(jù)以及開源統(tǒng)計(jì)語言R對(duì)已發(fā)表的數(shù)據(jù)進(jìn)行再分析與再解析,探索肺癌共表達(dá)基因作為肺癌分子標(biāo)志物的可能性。發(fā)現(xiàn)NRAS在內(nèi)的已知肺癌標(biāo)記物,篩選出一系列具體功能尚未清楚的肺癌候選標(biāo)記物。進(jìn)一步的濕實(shí)驗(yàn)驗(yàn)證將為最終界定這些基因在肺癌發(fā)生發(fā)展中的作用以及它們作為肺癌分子標(biāo)記物的可行性。值得注意的是,該策略也可能富集一些正常肺組織相對(duì)一般組織高表達(dá)的基因,從而導(dǎo)致一定的假陽性率。比如,PEX13是一個(gè)在過氧化物酶體中高表達(dá)的基因,其上調(diào)有可能是正常肺組織為適應(yīng)高氧環(huán)境的常態(tài),也可能是腫瘤細(xì)胞特定代謝進(jìn)化而來的優(yōu)勢(shì)表型[14]。因此,候選標(biāo)記物具體生物學(xué)功能需要進(jìn)一步實(shí)驗(yàn)驗(yàn)證。

基因注解分析顯示:篩選出的候選肺癌標(biāo)志物富集了和代謝、TP53以及MicroRNA調(diào)控相關(guān)的基因。代謝和TP53通路被富集,說明肺癌發(fā)生發(fā)展過程中癌細(xì)胞進(jìn)化并且重塑了它們的代謝網(wǎng)絡(luò)且TP53通路被異常調(diào)節(jié)。代謝通路的重塑可能和癌細(xì)胞的“Warburg”效應(yīng)相關(guān)[15],即癌細(xì)胞傾向于上調(diào)無氧代謝通路;而P53作為抑癌基因在大多數(shù)癌癥中有直接突變或者其他相關(guān)蛋白的突變,使得P53無法行使正常功能[16]。

隨著質(zhì)譜技術(shù)的不斷發(fā)展,越來越多的實(shí)驗(yàn)室開始對(duì)蛋白質(zhì)組學(xué)研究產(chǎn)生新的興趣,這意味著未來會(huì)有越來越多的組學(xué)數(shù)據(jù)產(chǎn)生。而大部分組學(xué)數(shù)據(jù)將會(huì)被存儲(chǔ)在公共數(shù)據(jù)庫如PRIDE, proteomeicsDB等[9, 17]。借助開源軟件R對(duì)公共數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行二次分析、解析以及整合將有助于獲得新的認(rèn)知。而將這種“干”研究獲得的信息用于指導(dǎo)實(shí)驗(yàn)設(shè)計(jì)并進(jìn)行“濕”實(shí)驗(yàn)驗(yàn)證則將成為未來生物醫(yī)學(xué)研究的大趨勢(shì)[18],即計(jì)算生物學(xué)與實(shí)驗(yàn)生物學(xué)的互相補(bǔ)充。過去十幾年興起的系統(tǒng)生物學(xué)代表了這一新的趨勢(shì),并且已經(jīng)在生物和醫(yī)學(xué)研究中扮演著重要的角色[19]。

4結(jié)論

通過基于公共數(shù)據(jù)庫的數(shù)據(jù)挖掘篩選出91個(gè)潛在的肺癌分子標(biāo)志物。基因注解分析顯示這些肺癌標(biāo)志物富集了和代謝、TP53網(wǎng)絡(luò)相關(guān)的基因以及MicroRNA靶基因。人類蛋白組草圖的發(fā)表對(duì)于生物醫(yī)學(xué)研究人員有重大意義。蛋白質(zhì)組學(xué)產(chǎn)生的大數(shù)據(jù)以及這些數(shù)據(jù)通過公共數(shù)據(jù)庫的共享將深遠(yuǎn)的影響生物醫(yī)學(xué)研究。

參考文獻(xiàn)

[1]MARDIS E R.A decade’s perspective on DNA sequencing technology[J]. Nature, 2011,470(7333):198-203.

[2]SCHENA M, SHALON D, DAVIS R W, et al. Quantitative monitoring of gene expression patterns with a complementary DNA microarray[J]. Science, 1995, 270(5235):467-470.

[3]WANG Z, GERSTEIN M,AND SNYDER M.RNA-Seq:a revolutionary tool for transcriptomics[J].Nature Reviews Genetics,2009,10(1):57-63.

[4]AEBERSOLD R, MANN M.Mass spectrometry-based proteomics[J]. Nature, 2003,422(6928): 198-207.

[5]NILSSON T , MANN M , AEBERSOLD R, et al.Mass spectrometry in high-throughput proteomics: ready for the big time[J]. Nature Methods, 2010,7(9):681-685.

[6]BOGUSKI M S, MCINTOSH M W. Biomedical informatics for proteomics[J]. Nature, 2003,422(6928):233-237.

[7]HERBST R S , HEYMACH J V , LIPPMAN S M. Lung cancer[J]. New England Journal of Medicine, 2008,359(13):1367-1380.

[8]KIM M S , PINTO S M , GETNET D , et al.A draft map of the human proteome[J]. Nature, 2014,509(7502): 575-581.

[9]WILHELM M , SCHLEGL J , HAHNE H, et al. Mass-spectrometry-based draft of the human proteome[J]. Nature, 2014,509(7502):582-587.

[10]UHLEN M , OKSVOLD P , FAGERBERG L, et al.Towards a knowledge-based Human Protein Atlas[J]. Nature Biotechnology, 2010, 28(12):1248-1250.

[11]UHLéN M, FAGERBERG L, HALLSTR?M BM, et al. Proteomics. Tissue-based map of the human proteome[J]. Science, 2015,347(6220):1260419.

[12]ZHU S H , SHAN C J , WU Z F, et al.Proliferation of small cell lung cancer cell line reduced by knocking-down PROX1 via shRNA in lentivirus[J]. Anticancer Research, 2013, 33(8): 3169-3175.

[13]LEE H S , LEE D C , PARK M H , et al. STMN2 is a novel target of beta-catenin/TCF-mediated transcription in human hepatoma cells[J]. Biochemical ang Biophysical Research Communications, 2006,345(3):1059-1067.

[14]ORUQAJ G , KARNATI S , VIJAYAN V , et al. Compromised peroxisomes in idiopathic pulmonary fibrosis, a vicious cycle inducing a higher fibrotic response via TGF-beta signaling[J]. Proceedings of the National Academy of Sciences, 2015,112(16):E2048-2057.

[15]KOPPENOL W H , BOUNDS P L, DANG C V.Otto Warburg's contributions to current concepts of cancer metabolism[J]. Nature Reviews Cancer, 2011, 11(5):325-337.

[16]BIEGING K T, MELLO S S , ATTARDI L D. Unravelling mechanisms of p53-mediated tumour suppression[J]. Nature Reviews Cancer, 2014,14(5):359-370.

[17]VIZCAINO J A , COTE R G , CSORDAS A, et al.The PRoteomics IDEntifications (PRIDE) database and associated tools: status in 2013[J]. Nucleic Acids Research, 2013,41(Database issue):D1063-1069.

[18]黃曉韻,曹波,楊躍.基于SAS的多元統(tǒng)計(jì)方法實(shí)現(xiàn)芯片數(shù)據(jù)挖掘[J].生物信息學(xué),2010,8(2):147-149.

HUANG Xiaoyun, CAO Bo ,YANG Yue.Microarray data mining is achieved by multivariate statistics based on SAS[J]. Chinese Journal of Bioinformatics,2010,8(2):147-149.

[19] HOOD L. Systems biology and p4 medicine: past, present, and future[J]. Rambam Maimonides Medical Journal,2013,4(2): e0012.

Pilot study on biomarkers for lung cancer based on the draft of human proteome

ZHU Yanyan1,2, LUO Zhifen1,2,CUI Yongxia1,2, LU Chuangxin1,2, ZHOU Yun1,2*

(1.OncologyUnit,People’sHospital,Zhengzhou450003,China;2.OncologyUnit,People’sHospital,ZhengzhouUniversity,Zhengzhou450003,China)

Abstract:Traditional exploration over lung cancer molecular marker has been relied on genome or transcriptome research, while exploration at the protein level has been limited by throughput. Mass spectrometry based proteome research has started to generate global proteome data for normal and cancer tissue. Using the open source statistical language R, we mined the publicly available data of human proteome draft and lung cancer proteome for screening for candidate molecular markers for lung cancer.We identified 91 candidate biomarkers for lung cancer.Gene ontology analysis suggested that candidate lung cancer biomarkers have enriched genes associated with metabolism, TP53 network and microRNA regulation. Top hits on the list were then validated with Human Protein Atlas database and Pubmed, which shows that most hits can be validated. We believe data mining has an important role to play in the big omic data era that is being ushered in by mass spectrometry.

Keywords:Proteome;Data mining;Lung cancer;Biomarkers

中圖分類號(hào):Q51;Q279

文獻(xiàn)標(biāo)志碼:A

文章編號(hào):1672-5565(2016)01-043-06

doi:10.3969/j.issn.1672-5565.2016.01.08

作者簡介:朱琰琰,女,研究方向:腫瘤學(xué)、系統(tǒng)醫(yī)學(xué);E-mail:xjtu100@163.com.*通信作者:周云,男,主任醫(yī)師,研究方向:腫瘤學(xué);E-mail:zlk2092@126.com.

收稿日期:2015-10-26;修回日期:2015-12-16.

猜你喜歡
數(shù)據(jù)挖掘肺癌
中醫(yī)防治肺癌術(shù)后并發(fā)癥
對(duì)比增強(qiáng)磁敏感加權(quán)成像對(duì)肺癌腦轉(zhuǎn)移瘤檢出的研究
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
PFTK1在人非小細(xì)胞肺癌中的表達(dá)及臨床意義
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
microRNA-205在人非小細(xì)胞肺癌中的表達(dá)及臨床意義
基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
數(shù)據(jù)挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
进贤县| 林州市| 保亭| 富锦市| 闽清县| 乌海市| 乌兰县| 浦北县| 通辽市| 陕西省| 大田县| 叶城县| 仁寿县| 宁晋县| 郑州市| 项城市| 宁南县| 新营市| 延津县| 奉节县| 高陵县| 阳东县| 深圳市| 广安市| 乡城县| 崇左市| 天台县| 方山县| 天全县| 沂南县| 阳谷县| 乐亭县| 黑水县| 鄂伦春自治旗| 读书| 华蓥市| 永安市| 马龙县| 蒲城县| 西宁市| 栾城县|