周漩,吳韻瑤,鐘兆健
(廣東藥學院藥科學院,廣東廣州510006)
乳腺癌轉移相關分子標志物的篩選
周漩,吳韻瑤,鐘兆健
(廣東藥學院藥科學院,廣東廣州510006)
目的篩選與乳腺癌轉移相關的分子標志物,為乳腺癌的早期診斷、預后評估以及藥物靶點的研究提供參考。方法從NCBI的GEO數(shù)據(jù)庫中收集乳腺癌相關表達數(shù)據(jù),將未轉移與已轉移的乳腺癌數(shù)據(jù)進行對比,采用GeneSpring軟件篩選差異表達基因,并通過ROC曲線與主成分分析對得到的差異表達基因進行評價。結果篩選得到40個差異表達基因,對乳腺癌轉移與未轉移樣本分類良好。結論篩選得到的差異基因可作為乳腺癌轉移的分子標志物,對乳腺癌是否轉移進行預測。
乳腺癌;轉移;差異表達基因;分子標志物
乳腺癌是女性最常見的惡性腫瘤之一,發(fā)病率和死亡率居婦女各類惡性腫瘤之首,嚴重威脅著女性的身體健康[1]。近年來乳腺癌的治療手段和診斷方法不斷提高,但乳腺癌患者的死亡率仍然得不到有效的控制。遠處轉移是乳腺癌患者死亡的最主要原因,目前針對乳腺癌轉移的治療尚未有明顯突破。
表觀遺傳學改變所導致的基因表達異常是乳腺癌發(fā)生的重要因素。基因表達譜[2]是用作描繪特定細胞或組織在特定狀態(tài)下的基因表達種類和豐度信息,能夠反映出組織或細胞在某一特定狀態(tài)下的基因表達情況。在乳腺癌發(fā)生,發(fā)展和轉移的各個階段,基因表達譜均會發(fā)生相應的變化。乳腺癌轉移早,發(fā)展快,甚至在乳腺癌發(fā)展初期就已出現(xiàn)微小轉移灶,因此,如能篩選出與乳腺癌轉移相關的基因作為分子標志物,將有利于及時發(fā)現(xiàn)乳腺癌的轉移趨勢,對患者把握治療時機有著重要的意義。
因此,本文采用生物信息學方法,對乳腺癌未轉移與已轉移樣本進行差異表達譜的分析,并從中篩選出乳腺癌轉移的分子標志物,為乳腺癌的早期診斷,預后評估等提供理論依據(jù)。
本文研究所用的乳腺癌基因表達譜數(shù)據(jù)來自于NCBI的GEO[3]數(shù)據(jù)庫,包括GSE2603和GSE2034。其中,GSE2603包含了未出現(xiàn)轉移的乳腺癌樣本34例,已出現(xiàn)轉移的乳腺癌樣本65例;GSE2034包含了未出現(xiàn)轉移的乳腺癌樣本180例,已出現(xiàn)轉移的乳腺癌樣本106例。
2.1 差異表達基因譜分析
首先,采用GeneSpringGX11.5軟件對GSE2603進行基因差異表達分析。將已轉移的乳腺癌樣本作為實驗組樣本,未轉移的乳腺癌樣本作為對照組,采用非配對t檢驗方法[4],分析得到差異表達基因譜。分析中設置的P值越小,得到的基因差異程度越大,本文將默認的P<0.05調整為P<0.01,共得到475個差異表達基因。
2.2 分子標志物的篩選
上述篩選得到的差異表達基因數(shù)量仍然很多,將其全部作為分子標志物顯然不合理,也沒有實際應用意義。一般來說,差異程度越大的基因,其作為分子標志物的判斷準確性越高,但選取單個基因作為標志物,由于受到的影響因素很多,也難以實現(xiàn)準確判斷。因此,考慮將差異程度大的基因進行聯(lián)合作為分子標志物,預測未知樣本是否發(fā)生轉移。
分別取經(jīng)分析得到的差異程度靠前的10、20、30、40、50個差異表達基因在數(shù)據(jù)集GSE2034上進行驗證,考察其作為分子標志物預測乳腺癌是否轉移的準確性。GSE2034中已轉移的乳腺癌樣本設為樣本組(轉移狀態(tài)用“1”表示),未轉移的乳腺癌樣本設為對照組(轉移狀態(tài)用“0”表示),以各組差異表達基因為自變量,樣本的轉移狀態(tài)為因變量,進行Logistic回歸計算聯(lián)合預測分子[5],構建 ROC[6]曲線。經(jīng)試驗發(fā)現(xiàn),當取前40個差異基因(見表1)為分子標志物時,ROC曲線下的面積為 0.776,對GSE2034的預測效果最佳(見圖1)。
表1 分子標志物基因Table 1 Genes of molecular markers
P 2 3 8 1-2圖1 ROC曲線Figure 1 ROC curve
2.3 主成分分析
將篩選出的40個差異表達基因對GSE2603進行主成分分析[7-8]。經(jīng)計算,40個差異表達基因中第一主成分能夠代表原表達譜數(shù)據(jù)的70.85%,第二主成分能夠代表原表達譜數(shù)據(jù)的10.21%,第三主成分能夠代表原表達譜數(shù)據(jù)的10%。對各樣本的3個主成分數(shù)據(jù)進行三維作圖,結果見圖2。
圖2 GSE2603主成分分析Figure 2 Analysis of GSE2603 principal components
圖中可見,未發(fā)生轉移的乳腺癌組織和已經(jīng)發(fā)生轉移的乳腺癌組織被較好地分為2類,說明篩選出來的差異基因能有效區(qū)分乳腺癌是否轉移。這些差異基因可作為乳腺癌的分子標志物,檢測其在乳腺癌組織中的表達情況可對乳腺癌是否轉移進行預測,為乳腺癌的預后評估提供參考。
本文采用生物信息學方法,從GEO數(shù)據(jù)庫中收集并分析乳腺癌表達譜數(shù)據(jù),對已轉移的乳腺癌樣本和未轉移的乳腺癌樣本進行分子標志物的篩選,得到了40個差異表達基因為乳腺癌轉移相關的分子標志物。這些分子標志物對乳腺癌的早期診斷、預后評估以及藥物治療靶點的選擇有重要的意義。
[1]石微.DNA甲基化在乳腺癌早期診斷中的研究進展[J].科技信息,2012,32(7):643-644.
[2]WANG X,SPANDIDOS A,WANGK H,et al.PrimerBank: a PCR primer database for quantitative gene expression analysis,2012 update[J].Nucleic Acids Res,2012,40 (Database issue):1144-1149.
[3]余海浪,馬文麗,鄭文嶺.用于基因數(shù)據(jù)挖掘的基因表達數(shù)據(jù)庫GEO[J].中國生物工程雜志,2007,27(8):96-103.
[4]蔣定鋒,潘娟娟,趙耐青.差異表達基因篩選方法的比較[J].中國衛(wèi)生統(tǒng)計,2006,23(5):417-420.
[5]陳衛(wèi)中,潘曉平,倪宗瓚.四種與冠心病相關指標聯(lián)合診斷冠心病價值評價[J].現(xiàn)代預防醫(yī)學,2006,33(5): 723-740.
[6]陳衛(wèi)中,潘曉平,倪宗瓚.Logistic回歸模型在ROC分析中的應用[J].中國衛(wèi)生統(tǒng)計,2007,23(5):112-116.
[7]王強,許紅民.主成分分析在基因芯片分析中的應用[J].軍醫(yī)進修學院學報,2005,26(2):145-147.
[8]黃成玉,阮曉鋼,李建更.基于基因表達譜胃癌特征基因選取研究[J].微計算機信息,2009,26(4):254-259.
(責任編輯:王昌棟)
Screening of the molecular markers associated with breast cancer metastasis
ZHOU Xuan,WU Yunyao,ZHONG Zhaojian
(School of Pharmacy,Guangdong Pharmaceutical University,Guangzhou 510006,China)
ObjectiveTo screen the molecular markers associated with breast cancer metastasis,and provide a reference for early diagnosis,prognosis evaluation and drug target research of breast cancer.MethodsThe gene expression data of breast cancer was collected from the GEO database of NCBI.The non-metastasis and metastasis samples were compared to screen the differential expression genes by Genespring software,and the differential expression genes were evaluated by ROC curves and PCA.ResultsThe screened 40 differential expression genes well classified the non-metastasis and metastasis samples.ConclusionThe screened differential expression genes as the molecular markers associated with breast cancer metastasis provide a prediction tool of breast cancer metastasis.
breast cancer;metastasis;differential expression gene;molecular maker
R737.9
:A
10.3969/j.issn.1006-8783.2015.05.026
1006-8783(2015)05-0676-03
2015-06-08
周漩(1975—),女,博士,副教授,主要從事化學生物信息學研究,Email:veego_z@hotmail.com。
時間:2015-09-18 14:24
http://www.cnki.net/kcms/detail/44.1413.R.20150918.1424.002.html