弭苗苗 姜慧慧 魏曉楠 劉杰 辛鈺 孫成銘
[摘要] 目的 基于生物信息學技術,篩選與雌激素受體(ER)陽性乳癌相關的長鏈非編碼RNA(lncRNA),并初步探討其與病人預后的關系。
方法 通過基因芯片技術,對4對手術切除的ER陽性乳癌組織及其癌旁正常組織進行l(wèi)ncRNA和mRNA的表達譜分析,并對差異表達的mRNA進行GO功能注釋、KEGG通路富集分析及疾病富集分析;應用qRT-PCR方法對差異表達的lncRNA在40對ER陽性乳癌組織及癌旁組織中進行驗證,同時在ER陽性乳癌細胞株MCF-7及正常乳腺上皮細胞MCF-10A做進一步驗證;最后通過TCGA數(shù)據(jù)庫對lncRNA在ER陽性乳癌組織中的表達水平進行分組,使用Kaplan-Meier生存曲線分析其表達量與預后的關系。
結果 基因芯片技術分析顯示,在ER陽性乳癌組織及其癌旁正常組織共篩選出具有差異性表達的mRNA 3 949個、lncRNA 4 050個。選取其中差異表達最顯著的7個lncRNA在組織中做進一步驗證,發(fā)現(xiàn)LINC01614(t=10.380,P<0.01)、AC044784.1(t=3.490,P<0.01)、CTD-2510F5.4(t=3.235,P<0.01)在乳癌組織高表達;細胞學驗證結果顯示,LINC01614(t=3.714,P<0.05)、AC044784.1(t=5.827,P<0.01)、CTD-2510F5.4(t=4.415,P<0.05)在乳癌細胞株中同樣高表達。TCGA數(shù)據(jù)庫預后分析顯示,納入的791例ER陽性乳癌病人中,LINC01614高表達者預后相對更差(χ2=7.50,P<0.01)。
結論 LINC01614在ER陽性乳癌中高表達可能與乳癌的發(fā)生、發(fā)展及預后相關,可能成為乳癌治療新的作用靶點。
[關鍵詞] 乳房腫瘤;RNA,長鏈非編碼;寡核苷酸序列分析;計算生物學;受體,雌激素;預后
[中圖分類號] R737.9;R394-33
[文獻標志碼] A
[文章編號] 2096-5532(2021)03-0333-06
doi:10.11712/jms.2096-5532.2021.57.123
[開放科學(資源服務)標識碼(OSID)]
[網(wǎng)絡出版] https://kns.cnki.net/kcms/detail/37.1517.R.20210628.1618.005.html;2021-06-29 09:41:39
DIFFERENTIAL EXPRESSION OF LONG NON-CODING RNAS IN ESTROGEN RECEPTOR-POSITIVE BREAST CANCER
MI Miaomiao, JIANG Huihui, WEI Xiaonan,LIU Jie,? XIN Yu, SUN Chengming
(Center for Laboratory Diagnosis, Yantai Yuhuangding Hospital Affiliated to Qingdao University, Yantai 264000, China)
[ABSTRACT]Objective To screen out the long non-coding RNAs (lncRNAs) associated with estrogen receptor (ER)-positive breast cancer based on bioinformatics technology, and to investigate their association with patient prognosis.
Methods The gene microarray technique was used to analyze the expression profiles of lncRNAs and mRNAs in four pairs of surgically resected ER-positive breast cancer tissue samples and adjacent tissue samples, and GO functional annotation, KEGG pathway enrichment analysis, and disease enrichment analysis were performed for differentially expressed mRNAs. The qRT-PCR method was used to verify the differentially expressed lncRNAs in 40 pairs of ER-positive breast cancer tissue samples and adjacent tissue samples, and further verification was performed in the ER-positive breast cancer cell line MCF-7 and the normal breast epithelial cell line MCF-10A. The Cancer Genome Atlas (TCGA) database was used for grouping based on the expression level of lncRNAs in ER-positive breast cancer tissue, and the Kaplan-Meier survival curve was used to investigate the association of expression level with prognosis.
Results The gene microarray analysis showed that a total of 3 949 differentially expressed mRNAs and 4 050 differentially expressed lncRNAs were screened out between ER-positive breast cancer tissue and adjacent tissue. Further verification of the 7 lncRNAs with strongest differential expression showed that LINC01614 (t=10.380,P<0.01), AC044784.1 (t=3.490,P<0.01), and CTD-2510F5.4 (t=3.235,P<0.01) were highly expressed in breast cancer tissue, and cytological verification showed that LINC01614 (t=3.714,P<0.05), AC044784.1 (t=5.827,P<0.01), and CTD-2510F5.4 (t=4.415,P<0.05) were also highly expressed in the breast cancer cell line. The prognostic analysis based on TCGA database showed that among the 791 patients with ER-positive breast cancer, there was significant difference in the patients with high expression of LINC01614 tended to have poor prognosis (χ2=7.50,P<0.01).
Conclusion High expression of LINC01614 in ER-positive breast cancer may be associated with
the development, progression, and prognosis of breast cancer, and therefore, it may become a new target for targeted breast cancer therapy.
[KEY WORDS]breast neoplasms; RNA, long noncoding; oligonucleotide array sequence analysis; computational biology; receptors, estrogen; prognosis
乳癌是目前導致女性癌癥死亡的主要原因之一[1-2]。根據(jù)雌激素受體(ER)、孕激素受體(PR)和人表皮生長因子受體(HER2)的表達,乳癌被分為不同的亞型[3],其中ER陽性乳癌約占75%。長鏈非編碼RNA(lncRNA)是一種轉錄本長度> 200個核苷酸的非編碼RNA[4-5]。已有多項研究結果表明,lncRNA在多種癌癥的發(fā)展和進程中起著重要的作用[6-8]。但目前關于ER陽性乳癌中l(wèi)ncRNA的生物學作用和功能卻鮮見報道。本研究通過基因芯片技術與生物信息學分析相結合方法,篩選影響ER陽性乳癌預后的lncRNA,并初步探討其可能的作用機制,以期為ER陽性乳癌的診斷、治療提供參考。 現(xiàn)將結果報告如下。
1 材料和方法
1.1 樣本來源
2019年12月—2020年10月,選擇在青島大學附屬煙臺毓璜頂醫(yī)院乳腺外科確診并行乳癌切除術病人40例,均為女性,年齡33~70歲,平均(57.0±8.7)歲。符合以下納入標準:①術前快速穿刺病理結果為浸潤性乳癌;②術前均未接受放療、化療等針對腫瘤的治療;③術中切除乳癌組織病理免疫組化結果示ER陽性。排除標準:①既往有其他惡性腫瘤病史病人;②病理資料不完善者;③具有免疫系統(tǒng)疾病或高血壓等全身疾病等病史病人。術中留取200~300 mg乳癌組織和距病灶邊緣≥5 cm的癌旁正常組織,放入凍存管后置于液氮中保存。本研究經(jīng)醫(yī)院倫理委員會審批通過。
1.2 基因芯片表達譜的構建及差異基因的篩選
在40例ER陽性乳癌標本中選取4對癌組織及其癌旁正常組織標本,應用CapitalBio Technology Human LncRNA Arrayv4,4×80 K基因芯片(北京博奧晶典生物技術有限公司提供),分別檢測lncRNA及mRNA的差異性表達;4例均為女性、絕經(jīng)后、單側發(fā)病乳癌病人,術后病理為浸潤性導管癌Ⅱ級,免疫組化結果提示ER陽性率>80%、Ki-67陽性率≥14%,臨床確診為Luminal B型乳癌。使用Trizol方法(Invitrogen,USA)從4對樣本中提取總RNA,應用NucleoSpin RNA clean-up試劑盒(MACHEREY-NAGEL,德國)進行純化,用Nanodrop定量檢測純化后總RNA的濃度及純度,并用瓊脂糖凝膠電泳檢測其完整性。使用First Strand Enzyme Mix合成First strand cDNA,再用Second Strand Enzyme Mix將其轉化為Second Strand cDNA,通過CbcScriptⅡ酶進行反轉錄并進行純化,最后以Random Primer為引物,用Klenow Fragment酶合成cDNA互補鏈并摻入帶有熒光基團的dNTP,再次純化后定量標記產(chǎn)物用于芯片雜交,標記過程采用晶芯生物芯片通用標記試劑盒。用Agilent Feature Extraction(v10.7)軟件對雜交圖片進行分析并提取數(shù)據(jù),然后使用Agilent GeneSpring軟件對數(shù)據(jù)進行歸一化和差異分析,以差異倍數(shù)FC≥2、P<0.05為顯著差異表達的lncRNA及mRNA的篩選標準。lncRNA及mRNA的參考數(shù)據(jù)庫主要為Ensemble數(shù)據(jù)庫。
1.3 差異聚類分析
通過對4對乳癌病人的癌組織及其癌旁正常組織進行基因芯片檢測,對具有差異表達的lncRNA及mRNA進行監(jiān)督聚類分析,以展示不同組織樣本中所測基因的表達情況;通過監(jiān)督聚類分析反映樣本和基因間的相似性,觀察各組織樣本的表達模式相關性及離群樣本的存在情況。
1.4 基因注釋富集分析
對于通過基因芯片技術檢測到的mRNA中差異表達基因分別進行GO、KEGG通路富集分析及疾病注釋富集分析。GO富集分析又分為細胞學組件、生物學途徑、分子功能3個部分,對篩選出的具有差異表達的mRNA通過富集分析,預測其在乳癌疾病發(fā)生、發(fā)展中可能發(fā)揮的作用途徑。
1.5 lncRNA與mRNA的共表達分析
共表達分析是以相關性為基礎,從基因表達層面尋找表達譜相似的lncRNA-mRNA關系對。其方法為以各個探針在各個樣品中的標準化后信號值作為數(shù)據(jù)源進行兩兩相關性計算和假設驗證,采用Pearson相關性分析計算相關系數(shù)(r)和P值。篩選標準為:r>0.99或<-0.99,且P<0.05。
1.6 qRT-PCR方法驗證ER陽性乳癌組織及癌旁組織中l(wèi)ncRNA的表達
為驗證基因芯片結果的可靠性,在收集的40對ER陽性乳癌癌組織和癌旁正常組織(包括進行芯片檢測的4對組織),選擇芯片結果中表達差異倍數(shù)最大的7個lncRNA應用qRT-PCR方法進行驗證。通過Trizol法提取組織的總RNA,按照說明書方法使用HiScriptⅢ 1st Strand cDNA Synthesis Kit(+gDNA wiper)試劑盒將從組織中提取的總RNA反轉錄成cDNA,然后使用ChamQ UniversalSYBR qPCR Master Mix進行qRT-PCR,內參照基因為U6。反應完成后,應用溶解曲線確定引物特異性,使用2-ΔΔCt法計算lncRNA的相對表達量。其中PCR引物由Thermo Fisher公司合成,其序列見表1。
1.7 qRT-PCR驗證ER陽性乳癌細胞株MCF-7中l(wèi)ncRNA的表達
乳癌細胞株MCF-7(由青島大學附屬煙臺毓璜頂醫(yī)院中心實驗室饋贈)培養(yǎng)在含體積分數(shù)0.10胎牛血清DMEM培養(yǎng)基中,正常乳腺上皮細胞MCF-10A(購于賽百慷(上海)生物技術股份有限公司)培養(yǎng)在專用完全培養(yǎng)基中,并分別加入10 g/L青鏈霉素雙抗。細胞培養(yǎng)瓶置于含體積分數(shù)0.05 CO2的37 ℃培養(yǎng)箱中。應用TRIZOL法提取MCF-7及MCF-10A的總RNA,逆轉錄后應用qRT-PCR方法檢測LINC01614、AC044784.1、CTD-2510F5.4等lncRNA在細胞中的表達水平。
1.8 lncRNA表達與乳癌疾病預后關系分析
通過TCGA在GDC數(shù)據(jù)庫中下載相關數(shù)據(jù),篩選出ER陽性的乳癌病人共791例,根據(jù)病人的lncRNA的表達水平進行分組,以平均值為界分為高表達組和低表達組;通過R語言編輯器進行轉換包“survival”;對所選擇的lncRNA行Kaplan-Meier曲線分析,與疾病預后的關系使用long-rank檢驗進行分析。
1.9 統(tǒng)計學方法
應用GraphPad Prism 8軟件進行統(tǒng)計學分析。計量資料結果以±s形式表示,數(shù)據(jù)間比較采用t檢驗。以P<0.05為差異有統(tǒng)計學意義。
2 結? 果
2.1 ER陽性乳癌組織中mRNA以及l(fā)ncRNA的表達
通過基因芯片技術在4對ER陽性乳癌組織及癌旁正常組織中共篩選出3 949個具有差異表達的mRNA,其中,在癌組織中差異表達上調的mRNA有2 448個,差異表達下調的有1 501個,上調最明顯及下調最明顯的mRNA為CST2和CSF3,F(xiàn)C值分別為70.3和-14.4。用同樣的方法在癌組織中共篩選出4 050個具有差異表達的lncRNA,其中有1 589個lncRNA差異性高表達,而顯著性低表達lncRNA有2 461個。將差異表達的mRNA以及l(fā)ncRNA標準化數(shù)據(jù)分別制作成聚類圖(圖1)。按差異倍數(shù)排序,選取前7位差異表達的lncRNA進行驗證。見表2。
2.2 mRNA的功能分析
通過GO、KEGG及疾病富集通路分析,選取排名前30個最明顯富集的通路來進一步預測具有差異表達的mRNA的功能。GO細胞學組件分析顯示,具有差異表達的mRNA多分布在核小體、DNA包裝復合體、蛋白質-DNA復合體、細胞外基質、細胞外膜、細胞質膜等(圖2A);GO生物學功能分析表明,差異表達mRNA生物學過程主要在細胞黏附、生物黏附、核小體裝配、單細胞黏附、DNA包裝、染色體聚集等富集明顯(圖2B);GO分子功能分析顯示,具有差異表達的mRNA可能涉及的致病機制及通路極其豐富,如蛋白質異二聚體活性、糖胺聚糖結合、蛋白質二聚體活性、細胞黏附分子結合、MHC Ⅱ類受體活性等(圖2C)。KEGG富集通路分析顯示,mRNA主要通過T細胞激活、整合素信號通路、血液凝固、纖溶酶原級聯(lián)激活、FAS信號通路、半胱氨酸的生物學合成等在乳癌疾病的發(fā)生、發(fā)展中發(fā)揮作用(圖3A);疾病富集通路分析顯示,在ER陽性乳癌中具有差異表達的mRNA主要在免疫系統(tǒng)疾病、過敏及自身免疫疾病、埃-當二氏綜合征、骨骼肌疾病、成骨不全病、原發(fā)性免疫缺陷病中明顯富集(圖3B)。
2.3 差異表達的lncRNA與mRNA的相關性
通過對差異表達的lncRNA及mRNA進行共表達分析,共篩選出關聯(lián)度最大的前1 000個關系對,用Cytoscape軟件繪制其網(wǎng)絡圖,見圖3C。對網(wǎng)絡圖分析顯示,WDR55、CEP85、OR5L2、GRIK2等mRNA和眾多具有差異表達的lncRNA存在顯著相關性。
2.4 qRT-PCR驗證
基于基因芯片篩選具有差異表達的lncRNA,選擇了差異表達最大的前7個,應用qRT-PCR方法對40例ER陽性乳癌組織及癌旁正常組織進行進一步驗證,結果顯示LINC01614(t=10.380,P<0.01)、AC044784.1(t=3.490,P<0.01)、CTD-2510F5.4(t=3.235,P<0.01)共3個lncRNA在癌組織中表達較癌旁正常組織上調,與本研究芯片結果一致;CTD-2116N17.1、KIAA0101、linc-BCL2A1-3、AL365436.2 lncRNA雖然在乳癌組織中表達上調,但差異無統(tǒng)計學意義(P>0.05)。見表3。將上述具有差異性高表達的3個基因在ER陽性乳癌細胞株MCF-7及正常乳腺上皮細胞MCF-10A中驗證,結果顯示LINC01614(t=3.714,P<0.05)、AC044784.1(t=5.827,P<0.01)、CTD-2510F5.4(t=4.415,P<0.05)在乳癌細胞株MCF-7中同樣具有顯著性高表達。見表4。
2.5 lncRNA與ER陽性乳癌預后的關系
根據(jù)Kaplan-Meier生存曲線法,在納入791例ER陽性乳癌病人中,將LINC01614、AC044784.1、CTD-2510F5.4在ER陽性乳癌病人的表達水平與疾病的總存活率進行相關性分析。研究結果顯示,LINC01614表達水平的高低與疾病的預后生存顯著相關(χ2=7.50,P<0.01),LINC01614表達水平低的病人較LINC01614表達水平高者具有更長的無病生存期(圖4)。
3 討? 論
本文研究通過基因芯片技術,選取4例較Luminal A型乳癌預后更差、惡性程度更高的Luminal B型乳癌組織及其癌旁正常組織,篩選ER陽性乳癌具有差異表達的mRNA及l(fā)ncRNA,結果顯示,上調及下調最明顯的mRNA為CST2和CSF3。已有研究通過對6對乳癌的癌組織及癌旁組織進行轉錄組的高通量測序,證實CST2基因在乳癌組織中高表達,并推測可能與ECM-受體相互作用信號相關[9-10],但其具體作用機制尚有待進一步研究證實。CHEN等[11]對MCF-7乳癌細胞株進行成骨細胞培養(yǎng)基(OCM)及未分化成骨細胞條件培養(yǎng)基對照培養(yǎng),然后用細胞因子抗體陣列進行篩選,結果顯示OCM處理的MCF-7細胞株中CSF3表達顯著性上調,且OCM和乳癌細胞的遷移相關,推測CSF3可能與乳癌的遠處骨轉移有關。
對于本文組織驗證所選取的7個lncRNA,后續(xù)通過對TCGA數(shù)據(jù)庫中乳癌數(shù)據(jù)分析顯示,它們均在乳癌組織中具有差異性高表達,與本文芯片結果相吻合。有研究者通過TCGA數(shù)據(jù)庫對837個浸潤性乳癌組織及105個正常組織的lncRNA基因譜進行分析,結果顯示LINC01614在PR陽性、ER陽性和HER2陽性乳癌高表達,而在三陰性乳癌中呈現(xiàn)低表達,即在Luminal B/HER2陽性亞型乳癌中具有高表達;并通過生物信息學和通路分析發(fā)現(xiàn),LINC01614可能通過TGFβ和FAK信號的調控在乳癌疾病中發(fā)揮作用[12]。本研究基因芯片檢測結果同樣提示,LINC01614在ER陽性乳癌組織中具有差異性高表達,并且后續(xù)在ER陽性乳癌組織及細胞株中得到驗證;LINC01614可能成為預測ER陽性乳癌病人整體生存期的預后標志物,并在臨床中對判斷預后和預測乳癌的治療效果可能存在價值。另外有研究指出,KIAA0101在乳癌中起著中心體數(shù)目調節(jié)劑的作用,敲低該基因可通過促進乳癌中p53/Sp1復合物的形成來抑制細胞增殖和細胞周期的進程[13],并推測該基因可能與雌激素的表達相關[14-17]。本文基因芯片技術檢測的研究結果也證實,KIAA0101在ER陽性乳癌中同樣具有高表達;后續(xù)組織驗證結果提示該lncRNA在癌組織中雖有高表達,但差異無統(tǒng)計學意義。究其原因,可能為組織標本個體差異性大,導致結果出現(xiàn)偏差。
綜上所述,本文證實LINC01614、AC044784.1、CTD-2510F5.4在ER陽性乳癌組織及細胞中具有顯著性高表達。而LINC01614在ER陽性乳癌組織中的高表達可能與預后不良有關,其具體的細胞功能及作用機制需要進一步研究。這些在ER陽性乳癌組織中差異表達的lncRNA可能作為新型的生物標記物,為疾病的診斷及治療提供新的方向。
[參考文獻]
[1]KOLAK A, KAMISKA M, SYGIT K, et al. Primary and secondary prevention of breast cancer[J].? Annals of Agricultural and Environmental Medicine, 2017,24(4):549-553.
[2]CHEN W, ZHENG R, BAADE P D, et al. Cancer statistics in China, 2015[J].? CA: A Cancer Journal for Clinicians, 2016,66(2):115-132.
[3]雷正武,龍佳豐,徐鈺,等. 不同分子分型乳腺癌Ki67、P53的表達及臨床病理特點研究[J]. 現(xiàn)代醫(yī)藥衛(wèi)生, 2021,37(1):12-14,18.
[4]ANDERSSON R, GEBHARD C, MIGUEL-ESCALADA I, et al. An atlas of active enhancers across human cell types and tissues[J].? Nature, 2014,507(7493):455-461.
[5]CHAN J J, TAY Y. Noncoding RNA: RNA regulatory networks in cancer[J].? International Journal of Molecular Sciences, 2018,19(5):1310.
[6]PENG W X, KOIRALA P, MO Y Y. LncRNA-mediated re-
gulation of cell signaling in cancer[J].? Oncogene, 2017,36(41):5661-5667.
[7]BHAN A, SOLEIMANI M, MANDAL S S. Long noncoding RNA and cancer: a new paradigm[J].? Cancer Research, 2017,77(15):3965-3981.
[8]LI J, MENG H, BAI Y, et al. Regulation of lncRNA and its role in cancer metastasis[J].? Oncology Research, 2016,23(5):205-217.
[9]周星彤,沈松杰,孫強. 中國乳腺癌篩查現(xiàn)狀及進展[J].? 中國醫(yī)學前沿雜志(電子版), 2020,12(3):6-11.
[10]BAO Y L, WANG L, SHI L, et al. Transcriptome profiling revealed multiple genes and ECM-receptor interaction pathways that may be associated with breast cancer[J].? Cellular & Molecular Biology Letters, 2019,24:38.
[11]CHEN X J, LU J, JI Y H, et al. Cytokines in osteoblast-conditioned medium promote the migration of breast cancer cells[J].? Tumour Biology, 2014,35(1):791-798.
[12]VISHNUBALAJI R, SHAATH H, ELKORD E, et al. Long non-coding RNA (lncRNA) transcriptional landscape in breast cancer identifies LINC01614 as non-favorable prognostic biomarker regulated by TGFβ and focal adhesion kinase (FAK) signaling[J].? Cell Death Discovery, 2019,5:109.
[13]LV W, SU B H, LI Y Y, et al. KIAA0101 inhibition suppresses cell proliferation and cell cycle progression by promoting the interaction between p53 and Sp1 in breast cancer[J].? Biochemical and Biophysical Research Communications, 2018,503(2):600-606.
[14]MILLER W R. Clinical, pathological, proliferative and mole-
cular responses associated with neoadjuvant aromatase inhibitor treatment in breast cancer[J].? The Journal of Steroid Biochemistry and Molecular Biology, 2010,118(4/5):273-276.
[15]IWANAMI N, HIGUCHI T, SASANO Y, et al. WDR55 is a nucleolar modulator of ribosomal RNA synthesis, cell cycle progression, and teleost organ development[J].? PLoS Gene-
tics, 2008,4(8):e1000171.
[16]LIU Y, KIM J, PHILIP R, et al. Direct interaction between CEP85 and STIL mediates PLK4-driven directed cell migration[J].? Journal of Cell Science, 2020,133(8): jcs238352.
[17]YOUN J Y, DUNHAM W H, HONG S J, et al. High-density proximity mapping reveals the subcellular organization of mRNA-associated granules and bodies[J].? Molecular Cell, 2018,69(3):517-532.e11.
(本文編輯 黃建鄉(xiāng))