弭苗苗,姜慧慧,魏曉楠,劉杰,辛鈺,孫成銘
(1 青島大學(xué)附屬煙臺(tái)毓璜頂醫(yī)院檢驗(yàn)中心,山東 煙臺(tái) 264000;2 青島市婦女兒童醫(yī)院)
乳癌是目前導(dǎo)致女性癌癥死亡的主要原因之一[1-2]。根據(jù)雌激素受體(ER)、孕激素受體(PR)和人表皮生長(zhǎng)因子受體(HER2)的表達(dá),乳癌被分為不同的亞型[3],其中ER 陽性乳癌約占75%。長(zhǎng)鏈非編碼RNA(lncRNA)是一種轉(zhuǎn)錄本長(zhǎng)度>200個(gè)核苷酸的非編碼RNA[4-5]。已有多項(xiàng)研究結(jié)果表明,lnc RNA 在多種癌癥的發(fā)展和進(jìn)程中起著重要的作用[6-8]。但目前關(guān)于ER 陽性乳癌中l(wèi)nc RNA的生物學(xué)作用和功能卻鮮見報(bào)道。本研究通過基因芯片技術(shù)與生物信息學(xué)分析相結(jié)合方法,篩選影響ER陽性乳癌預(yù)后的lnc RNA,并初步探討其可能的作用機(jī)制,以期為ER 陽性乳癌的診斷、治療提供參考。現(xiàn)將結(jié)果報(bào)告如下。
2019年12月—2020年10月,選擇在青島大學(xué)附屬煙臺(tái)毓璜頂醫(yī)院乳腺外科確診并行乳癌切除術(shù)病人40例,均為女性,年齡33~70歲,平均(57.0±8.7)歲。符合以下納入標(biāo)準(zhǔn):①術(shù)前快速穿刺病理結(jié)果為浸潤(rùn)性乳癌;②術(shù)前均未接受放療、化療等針對(duì)腫瘤的治療;③術(shù)中切除乳癌組織病理免疫組化結(jié)果示ER 陽性。排除標(biāo)準(zhǔn):①既往有其他惡性腫瘤病史病人;②病理資料不完善者;③具有免疫系統(tǒng)疾病或高血壓等全身疾病等病史病人。術(shù)中留取200~300 mg乳癌組織和距病灶邊緣≥5 cm 的癌旁正常組織,放入凍存管后置于液氮中保存。本研究經(jīng)醫(yī)院倫理委員會(huì)審批通過。
在40例ER 陽性乳癌標(biāo)本中選取4對(duì)癌組織及其癌旁正常組織標(biāo)本,應(yīng)用CapitalBio Technology Human LncRNA Arrayv4,4×80 K 基因芯片(北京博奧晶典生物技術(shù)有限公司提供),分別檢測(cè)lncRNA 及mRNA 的差異性表達(dá);4 例均為女性、絕經(jīng)后、單側(cè)發(fā)病乳癌病人,術(shù)后病理為浸潤(rùn)性導(dǎo)管癌Ⅱ級(jí),免疫組化結(jié)果提示ER 陽性率>80%、Ki-67陽性率≥14%,臨床確診為L(zhǎng)uminal B 型乳癌。使用Trizol方法(Invitrogen,USA)從4對(duì)樣本中提取總RNA,應(yīng)用NucleoSpin?RNA clean-up 試劑盒(MACHEREY-NAGEL,德國)進(jìn)行純化,用Nanodrop定量檢測(cè)純化后總RNA 的濃度及純度,并用瓊脂糖凝膠電泳檢測(cè)其完整性。使用First Strand Enzyme Mix合成First strand cDNA,再用Second Strand Enzyme Mix 將其轉(zhuǎn)化為Second Strand cDNA,通過CbcScriptⅡ酶進(jìn)行反轉(zhuǎn)錄并進(jìn)行純化,最后以Random Primer為引物,用Klenow Fragment酶合成c DNA 互補(bǔ)鏈并摻入帶有熒光基團(tuán)的d NTP,再次純化后定量標(biāo)記產(chǎn)物用于芯片雜交,標(biāo)記過程采用晶芯?生物芯片通用標(biāo)記試劑盒。用Agilent Feature Extraction(v10.7)軟件對(duì)雜交圖片進(jìn)行分析并提取數(shù)據(jù),然后使用Agilent Gene-Spring軟件對(duì)數(shù)據(jù)進(jìn)行歸一化和差異分析,以差異倍數(shù)FC≥2、P<0.05 為顯著差異表達(dá)的lncRNA及mRNA 的篩選標(biāo)準(zhǔn)。lncRNA 及mRNA 的參考數(shù)據(jù)庫主要為Ensemble數(shù)據(jù)庫。
通過對(duì)4對(duì)乳癌病人的癌組織及其癌旁正常組織進(jìn)行基因芯片檢測(cè),對(duì)具有差異表達(dá)的lncRNA及mRNA 進(jìn)行監(jiān)督聚類分析,以展示不同組織樣本中所測(cè)基因的表達(dá)情況;通過監(jiān)督聚類分析反映樣本和基因間的相似性,觀察各組織樣本的表達(dá)模式相關(guān)性及離群樣本的存在情況。
對(duì)于通過基因芯片技術(shù)檢測(cè)到的m RNA 中差異表達(dá)基因分別進(jìn)行GO、KEGG 通路富集分析及疾病注釋富集分析。GO 富集分析又分為細(xì)胞學(xué)組件、生物學(xué)途徑、分子功能3個(gè)部分,對(duì)篩選出的具有差異表達(dá)的m RNA 通過富集分析,預(yù)測(cè)其在乳癌疾病發(fā)生、發(fā)展中可能發(fā)揮的作用途徑。
共表達(dá)分析是以相關(guān)性為基礎(chǔ),從基因表達(dá)層面尋找表達(dá)譜相似的lncRNA-m RNA 關(guān)系對(duì)。其方法為以各個(gè)探針在各個(gè)樣品中的標(biāo)準(zhǔn)化后信號(hào)值作為數(shù)據(jù)源進(jìn)行兩兩相關(guān)性計(jì)算和假設(shè)驗(yàn)證,采用Pearson相關(guān)性分析計(jì)算相關(guān)系數(shù)(r)和P值。篩選標(biāo)準(zhǔn)為:r>0.99或<-0.99,且P<0.05。
為驗(yàn)證基因芯片結(jié)果的可靠性,在收集的40對(duì)ER 陽性乳癌癌組織和癌旁正常組織(包括進(jìn)行芯片檢測(cè)的4對(duì)組織),選擇芯片結(jié)果中表達(dá)差異倍數(shù)最大的7 個(gè)lnc RNA 應(yīng)用qRT-PCR 方法進(jìn)行驗(yàn)證。通過Trizol法提取組織的總RNA,按照說明書方法使用HiScript?Ⅲ1stStrand cDNA Synthesis Kit(+gDNA wiper)試劑盒將從組織中提取的總RNA反轉(zhuǎn)錄成cDNA,然后使用Cham Q Universal SYBR qPCR Master Mix進(jìn)行qRT-PCR,內(nèi)參照基因?yàn)閁6。反應(yīng)完成后,應(yīng)用溶解曲線確定引物特異性,使用2-ΔΔCt法計(jì)算lncRNA 的相對(duì)表達(dá)量。其中PCR 引物由Thermo Fisher公司合成,其序列見表1。
表1 PCR 引物及其序列
乳癌細(xì)胞株MCF-7(由青島大學(xué)附屬煙臺(tái)毓璜頂醫(yī)院中心實(shí)驗(yàn)室饋贈(zèng))培養(yǎng)在含體積分?jǐn)?shù)0.10胎牛血清DMEM 培養(yǎng)基中,正常乳腺上皮細(xì)胞MCF-10A(購于賽百慷(上海)生物技術(shù)股份有限公司)培養(yǎng)在專用完全培養(yǎng)基中,并分別加入10 g/L青鏈霉素雙抗。細(xì)胞培養(yǎng)瓶置于含體積分?jǐn)?shù)0.05 CO2的37 ℃培養(yǎng)箱中。應(yīng)用TRIZOL 法提取MCF-7 及MCF-10A 的總RNA,逆轉(zhuǎn)錄后應(yīng)用q RT-PCR 方法檢測(cè)LINC01614、AC044784.1、CTD-2510F5.4等lncRNA 在細(xì)胞中的表達(dá)水平。
通過TCGA 在GDC 數(shù)據(jù)庫中下載相關(guān)數(shù)據(jù),篩選出ER 陽性的乳癌病人共791例,根據(jù)病人的lncRNA 的表達(dá)水平進(jìn)行分組,以平均值為界分為高表達(dá)組和低表達(dá)組;通過R 語言編輯器進(jìn)行轉(zhuǎn)換包“survival”;對(duì)所選擇的lncRNA 行Kaplan-Meier曲線分析,與疾病預(yù)后的關(guān)系使用long-rank 檢驗(yàn)進(jìn)行分析。
應(yīng)用Graph Pad Prism 8軟件進(jìn)行統(tǒng)計(jì)學(xué)分析。計(jì)量資料結(jié)果以形式表示,數(shù)據(jù)間比較采用t檢驗(yàn)。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
通過基因芯片技術(shù)在4對(duì)ER 陽性乳癌組織及癌旁正常組織中共篩選出3 949個(gè)具有差異表達(dá)的m RNA,其中,在癌組織中差異表達(dá)上調(diào)的m RNA有2 448個(gè),差異表達(dá)下調(diào)的有1 501個(gè),上調(diào)最明顯及下調(diào)最明顯的m RNA 為CST2 和CSF3,FC值分別為70.3和-14.4。用同樣的方法在癌組織中共篩選出4 050個(gè)具有差異表達(dá)的lncRNA,其中有1 589個(gè)lncRNA 差異性高表達(dá),而顯著性低表達(dá)lncRNA 有2 461個(gè)。將差異表達(dá)的m RNA 以及l(fā)ncRNA 標(biāo)準(zhǔn)化數(shù)據(jù)分別制作成聚類圖(圖1)。按差異倍數(shù)排序,選取前7位差異表達(dá)的lncRNA進(jìn)行驗(yàn)證。見表2。
圖1 ER陽性乳癌組織中l(wèi)ncRNA和mRNA差異表達(dá)譜
表2 按差異倍數(shù)排序前7位的差異表達(dá)lncRNA
通過GO、KEGG 及疾病富集通路分析,選取排名前30個(gè)最明顯富集的通路來進(jìn)一步預(yù)測(cè)具有差異表達(dá)的m RNA 的功能。GO 細(xì)胞學(xué)組件分析顯示,具有差異表達(dá)的m RNA 多分布在核小體、DNA包裝復(fù)合體、蛋白質(zhì)-DNA 復(fù)合體、細(xì)胞外基質(zhì)、細(xì)胞外膜、細(xì)胞質(zhì)膜等(圖2A);GO 生物學(xué)功能分析表明,差異表達(dá)m RNA 生物學(xué)過程主要在細(xì)胞黏附、生物黏附、核小體裝配、單細(xì)胞黏附、DNA 包裝、染色體聚集等富集明顯(圖2B);GO 分子功能分析顯示,具有差異表達(dá)的m RNA 可能涉及的致病機(jī)制及通路極其豐富,如蛋白質(zhì)異二聚體活性、糖胺聚糖結(jié)合、蛋白質(zhì)二聚體活性、細(xì)胞黏附分子結(jié)合、MHC Ⅱ類受體活性等(圖2C)。KEGG 富集通路分析顯示,m RNA 主要通過T 細(xì)胞激活、整合素信號(hào)通路、血液凝固、纖溶酶原級(jí)聯(lián)激活、FAS信號(hào)通路、半胱氨酸的生物學(xué)合成等在乳癌疾病的發(fā)生、發(fā)展中發(fā)揮作用(圖3A);疾病富集通路分析顯示,在ER 陽性乳癌中具有差異表達(dá)的m RNA 主要在免疫系統(tǒng)疾病、過敏及自身免疫疾病、埃-當(dāng)二氏綜合征、骨骼肌疾病、成骨不全病、原發(fā)性免疫缺陷病中明顯富集(圖3B)。
圖2 GO富集通路分析
通過對(duì)差異表達(dá)的lncRNA 及m RNA 進(jìn)行共表達(dá)分析,共篩選出關(guān)聯(lián)度最大的前1 000個(gè)關(guān)系對(duì),用Cytoscape軟件繪制其網(wǎng)絡(luò)圖,見圖3C。對(duì)網(wǎng)絡(luò)圖分析顯示,WDR55、CEP85、OR5L2、GRIK2等mRNA 和眾多具有差異表達(dá)的lncRNA 存在顯著相關(guān)性。
圖3 KEGG和疾病富集通路分析及l(fā)ncRNA與mRNA的共表達(dá)分析網(wǎng)絡(luò)
基于基因芯片篩選具有差異表達(dá)的lncRNA,選擇了差異表達(dá)最大的前7個(gè),應(yīng)用q RT-PCR 方法對(duì)40例ER 陽性乳癌組織及癌旁正常組織進(jìn)行進(jìn)一步驗(yàn)證,結(jié)果顯示LINC01614(t=10.380,P<0.01)、AC044784.1(t=3.490,P<0.01)、CTD-2510F5.4(t=3.235,P<0.01)共3個(gè)lncRNA 在癌組織中表達(dá)較癌旁正常組織上調(diào),與本研究芯片結(jié)果一致;CTD-2116N17.1、KIAA0101、linc-BCL2A1-3、AL365436.2 lnc RNA 雖然在乳癌組織中表達(dá)上調(diào),但差異無統(tǒng)計(jì)學(xué)意義(P>0.05)。見表3。將上述具有差異性高表達(dá)的3個(gè)基因在ER 陽性乳癌細(xì)胞株MCF-7及正常乳腺上皮細(xì)胞MCF-10A 中驗(yàn)證,結(jié)果顯示LINC01614(t=3.714,P<0.05)、AC044784.1(t=5.827,P<0.01)、CTD-2510F5.4(t=4.415,P<0.05)在乳癌細(xì)胞株MCF-7中同樣具有顯著性高表達(dá)。見表4。
表3 ER 陽性乳癌組織及癌旁組織lncRNA表達(dá)結(jié)果比較(n=40,)
表3 ER 陽性乳癌組織及癌旁組織lncRNA表達(dá)結(jié)果比較(n=40,)
表4 lncRNA 在乳癌細(xì)胞株MCF-7 和正常乳腺細(xì)胞MCF-10A中的差異性表達(dá)(n=3,)
表4 lncRNA 在乳癌細(xì)胞株MCF-7 和正常乳腺細(xì)胞MCF-10A中的差異性表達(dá)(n=3,)
根據(jù)Kaplan-Meier生存曲線法,在納入791例ER 陽性乳癌病人中,將LINC01614、AC044784.1、CTD-2510F5.4在ER 陽性乳癌病人的表達(dá)水平與疾病的總存活率進(jìn)行相關(guān)性分析。研究結(jié)果顯示,LINC01614表達(dá)水平的高低與疾病的預(yù)后生存顯著相關(guān)(χ2=7.50,P<0.01),LINC01614表達(dá)水平低的病人較LINC01614表達(dá)水平高者具有更長(zhǎng)的無病生存期(圖4)。
圖4 不同LINC01614 表達(dá)水平ER 陽性乳癌病人Kaplan-Meier生存曲線
本文研究通過基因芯片技術(shù),選取4例較Luminal A 型乳癌預(yù)后更差、惡性程度更高的Luminal B型乳癌組織及其癌旁正常組織,篩選ER 陽性乳癌具有差異表達(dá)的m RNA 及l(fā)ncRNA,結(jié)果顯示,上調(diào)及下調(diào)最明顯的m RNA 為CST2 和CSF3。已有研究通過對(duì)6對(duì)乳癌的癌組織及癌旁組織進(jìn)行轉(zhuǎn)錄組的高通量測(cè)序,證實(shí)CST2基因在乳癌組織中高表達(dá),并推測(cè)可能與ECM-受體相互作用信號(hào)相關(guān)[9-10],但其具體作用機(jī)制尚有待進(jìn)一步研究證實(shí)。CHEN 等[11]對(duì)MCF-7乳癌細(xì)胞株進(jìn)行成骨細(xì)胞培養(yǎng)基(OCM)及未分化成骨細(xì)胞條件培養(yǎng)基對(duì)照培養(yǎng),然后用細(xì)胞因子抗體陣列進(jìn)行篩選,結(jié)果顯示OCM 處理的MCF-7 細(xì)胞株中CSF3 表達(dá)顯著性上調(diào),且OCM 和乳癌細(xì)胞的遷移相關(guān),推測(cè)CSF3可能與乳癌的遠(yuǎn)處骨轉(zhuǎn)移有關(guān)。
對(duì)于本文組織驗(yàn)證所選取的7 個(gè)lncRNA,后續(xù)通過對(duì)TCGA 數(shù)據(jù)庫中乳癌數(shù)據(jù)分析顯示,它們均在乳癌組織中具有差異性高表達(dá),與本文芯片結(jié)果相吻合。有研究者通過TCGA 數(shù)據(jù)庫對(duì)837個(gè)浸潤(rùn)性乳癌組織及105個(gè)正常組織的lncRNA 基因譜進(jìn)行分析,結(jié)果顯示LINC01614在PR 陽性、ER陽性和HER2陽性乳癌高表達(dá),而在三陰性乳癌中呈現(xiàn)低表達(dá),即在Luminal B/HER2陽性亞型乳癌中具有高表達(dá);并通過生物信息學(xué)和通路分析發(fā)現(xiàn),LINC01614可能通過TGFβ和FAK 信號(hào)的調(diào)控在乳癌疾病中發(fā)揮作用[12]。本研究基因芯片檢測(cè)結(jié)果同樣提示,LINC01614在ER 陽性乳癌組織中具有差異性高表達(dá),并且后續(xù)在ER 陽性乳癌組織及細(xì)胞株中得到驗(yàn)證;LINC01614可能成為預(yù)測(cè)ER陽性乳癌病人整體生存期的預(yù)后標(biāo)志物,并在臨床中對(duì)判斷預(yù)后和預(yù)測(cè)乳癌的治療效果可能存在價(jià)值。另外有研究指出,KIAA0101在乳癌中起著中心體數(shù)目調(diào)節(jié)劑的作用,敲低該基因可通過促進(jìn)乳癌中p53/Sp1復(fù)合物的形成來抑制細(xì)胞增殖和細(xì)胞周期的進(jìn)程[13],并推測(cè)該基因可能與雌激素的表達(dá)相關(guān)[14-17]。本文基因芯片技術(shù)檢測(cè)的研究結(jié)果也證實(shí),KIAA0101在ER 陽性乳癌中同樣具有高表達(dá);后續(xù)組織驗(yàn)證結(jié)果提示該lncRNA 在癌組織中雖有高表達(dá),但差異無統(tǒng)計(jì)學(xué)意義。究其原因,可能為組織標(biāo)本個(gè)體差異性大,導(dǎo)致結(jié)果出現(xiàn)偏差。
綜上所述,本文證實(shí)LINC01614、AC044784.1、CTD-2510F5.4在ER 陽性乳癌組織及細(xì)胞中具有顯著性高表達(dá)。而LINC01614 在ER 陽性乳癌組織中的高表達(dá)可能與預(yù)后不良有關(guān),其具體的細(xì)胞功能及作用機(jī)制需要進(jìn)一步研究。這些在ER 陽性乳癌組織中差異表達(dá)的lnc RNA 可能作為新型的生物標(biāo)記物,為疾病的診斷及治療提供新的方向。
青島大學(xué)學(xué)報(bào)(醫(yī)學(xué)版)2021年3期