張曉敏,徐 坤,胡彩虹,何繼瑞
(蘭州大學(xué)第二醫(yī)院特需內(nèi)科(老年病科),甘肅 蘭州 730030)
甲狀腺癌(THCA)是內(nèi)分泌系統(tǒng)最為常見(jiàn)的惡性腫瘤,其在頭頸部惡性腫瘤中的發(fā)病率居于首位[1]。近年來(lái),THCA 在全世界范圍內(nèi)的發(fā)病率呈迅速增長(zhǎng)的態(tài)勢(shì)[2],根據(jù)腫瘤起源及分化差異,一般將THCA 分為4 種類(lèi)型:甲狀腺乳頭狀癌(PTC)、甲狀腺濾泡癌(FTC)、甲狀腺髓樣癌(MTC)以及甲狀腺未分化癌(ATC),其中PTC 與FTC 合稱(chēng)分化型甲狀腺癌(DTC)。THCA 中95%左右屬于DTC,其生物行為溫和,預(yù)后相對(duì)較好[3]。然而,依然有部分THCA 如局部進(jìn)展或復(fù)發(fā)的DTC、髓樣癌及所有未分化癌等多表現(xiàn)出高度的侵襲性,易復(fù)發(fā)、轉(zhuǎn)移,且預(yù)后較差,是導(dǎo)致患者死亡的主要原因,是THCA 治療所面臨的一大挑戰(zhàn)[4]。
后基因組時(shí)代,基于腫瘤發(fā)病機(jī)制與分子靶標(biāo)的精準(zhǔn)靶向治療已成為難治性和高侵襲性THCA 前沿治療方法[5]。近年來(lái),隨著人們對(duì)長(zhǎng)鏈非編碼RNA(lncRNA)生物學(xué)功能的認(rèn)識(shí)不斷加深,其在各類(lèi)腫瘤發(fā)生、發(fā)展過(guò)程中所發(fā)揮的作用受到了醫(yī)學(xué)界持續(xù)而廣泛的關(guān)注[6-7]。大量研究表明,lncRNA在THCA 中存在差異化表達(dá),并可通過(guò)多種方式參與THCA 的發(fā)生和發(fā)展[8-10]。然而,THCA 發(fā)病原因復(fù)雜,發(fā)病機(jī)制還不清楚,尤其對(duì)于高侵襲性THCA而言,臨床上缺乏有效的診斷、治療手段及預(yù)后指標(biāo)。因此,探究lncRNA 表達(dá)與THCA 之間的關(guān)系可為闡明后者的發(fā)病機(jī)制、尋找新的分子治療靶點(diǎn)和預(yù)后指標(biāo)提供理論依據(jù)。
H19是一個(gè)只在母系等位基因上表達(dá)(父系印記)的長(zhǎng)度為2.3 kb的lncRNA分子。研究表明,H19可通過(guò)多種機(jī)制調(diào)控細(xì)胞增殖、遷移、侵襲、抗凋亡和上皮-間質(zhì)轉(zhuǎn)化,具有致癌或抗癌作用[11],可作為腫瘤診斷、治療及預(yù)后的生物學(xué)標(biāo)志物。然而H19在THCA 中的表達(dá)規(guī)律及相關(guān)生物學(xué)機(jī)制目前仍知之甚少。因此,本研究旨在利用UALCAN 和RNA 相互作用百科全書(shū)(ENCORI)數(shù)據(jù)庫(kù)分析lncRNAH19在THCA 中的表達(dá)情況及其可能的作用機(jī)制,以期為T(mén)HCA 的診斷標(biāo)志物和治療靶點(diǎn)的選擇以及預(yù)后分析提供一定的理論依據(jù),為相關(guān)臨床轉(zhuǎn)化研究提供借鑒。
(1)UALCAN 數(shù)據(jù)庫(kù)。UALCAN(http://ualcan.path.uab.edu)是一個(gè)主要針對(duì)癌癥基因組圖譜(TCGA)數(shù)據(jù)庫(kù)進(jìn)行癌癥數(shù)據(jù)分析與挖掘的在線(xiàn)平臺(tái)。通過(guò)UALCAN 用戶(hù)可方便、快捷地對(duì)TCGA 已公開(kāi)的癌癥組學(xué)數(shù)據(jù)進(jìn)行訪問(wèn),也可進(jìn)行腫瘤生物標(biāo)志分子鑒定或者對(duì)目標(biāo)基因在腫瘤中的表達(dá)進(jìn)行在線(xiàn)模擬驗(yàn)證和預(yù)后生存分析等。
(2)ENCORI 數(shù)據(jù)庫(kù)。ENCORI(http://starbase.sysu.edu.cn)是由中山大學(xué)團(tuán)隊(duì)開(kāi)發(fā)的用于研究由大規(guī)模紫外交聯(lián)免疫沉淀結(jié)合高通量測(cè)序(CLIPSeq)產(chǎn)生的lncRNA、微小RNA(miRNA)、內(nèi)源競(jìng)爭(zhēng)RNA(ceRNA)、RNA 結(jié)合蛋白(RBP)和mRNA 互作網(wǎng)絡(luò)的數(shù)據(jù)庫(kù)。
(3)RegRNA 2.0 數(shù)據(jù)庫(kù)。RegRNA 2.0(http://regrna2.mbc.nctu.edu.tw)是一個(gè)專(zhuān)門(mén)用于RNA 功能性motif 預(yù)測(cè)的網(wǎng)站,可實(shí)現(xiàn)上下游調(diào)控分子的預(yù)測(cè)。
(4)DAVID 數(shù)據(jù)庫(kù)。DAVID(https://david.ncifcrf.gov)全名為注釋、可視化和綜合發(fā)現(xiàn)數(shù)據(jù)庫(kù)(the Database for Annotation,Visualization and Integrated Discovery),是一個(gè)集生物學(xué)數(shù)據(jù)和分析工具于一體的生物信息數(shù)據(jù)庫(kù),可對(duì)批量的基因或蛋白列表進(jìn)行系統(tǒng)全面的生物功能注釋?zhuān)瑥亩鴰椭脩?hù)獲取生物學(xué)信息。
(1)以“H19”為關(guān)鍵詞,利用UALCAN 數(shù)據(jù)庫(kù)分析H19在THCA 中的表達(dá)水平及其與腫瘤分期、種族、性別、年齡及病理亞型之間的關(guān)系及其預(yù)后。
(2)以“H19”為關(guān)鍵詞,利用ENCORI 數(shù)據(jù)庫(kù)中的“RNA-RNA 模塊”和“RBP-Target 模塊”分析預(yù)測(cè)可能與H19結(jié)合的上下游靶基因;利用RegRNA 2.0數(shù)據(jù)庫(kù)對(duì)可能與H19結(jié)合的miRNA 進(jìn)行預(yù)測(cè),檢索參數(shù)設(shè)定采用系統(tǒng)默認(rèn)值。將兩種數(shù)據(jù)庫(kù)預(yù)測(cè)得到的靶基因利用Excel軟件進(jìn)行去重復(fù)處理。
(3)利用DAVID 數(shù)據(jù)庫(kù),對(duì)(2)中預(yù)測(cè)得到的H19靶基因進(jìn)行GO和KEGG注釋及富集分析。
(4)結(jié)合靶基因功能注釋和通路富集分析結(jié)果,利用ENCORI 數(shù)據(jù)庫(kù)中的“Pan-Cancer 模塊”對(duì)H19和其靶基因SMAD4 在THCA 組織中表達(dá)相關(guān)性進(jìn)行分析。
(5)以“SMAD4”為關(guān)鍵詞,利用UALCAN 數(shù)據(jù)庫(kù)分析SMAD4在THCA中的表達(dá)規(guī)律及其預(yù)后。
THCA 基因表達(dá)和臨床患者資料源自TCGA 數(shù)據(jù)庫(kù),利用Perl 語(yǔ)言進(jìn)行了各組間基因表達(dá)水平的差異t檢驗(yàn);利用R語(yǔ)言繪制分組Kaplan-Meier生存曲線(xiàn),生存率曲線(xiàn)間的顯著性測(cè)定采用log-rank 檢驗(yàn);通過(guò)Fisher 精確檢驗(yàn)進(jìn)行GO 和KEGG 富集顯著性分析。以P<0.05表示具有統(tǒng)計(jì)學(xué)意義。
通過(guò)UALCAN 數(shù)據(jù)庫(kù),以THCA 為標(biāo)簽共檢索到564 例樣品:其中,正常對(duì)照組(Normal)59 例,原發(fā)性腫瘤組(Primary tumor)505例;按腫瘤分期計(jì),1期(Stage 1)284 例,2 期(Stage 2)52 例,3 期(Stage 3)112 例,4 期(Stage 4)55 例;按病理亞型計(jì),經(jīng)典型THCA(Classical Thyroid Papillary Carcinoma)358 例,高細(xì)胞型THCA(Tall Cell Thyroid Papillary Carcinoma)36 例,濾泡型THCA(Follicular Thyroid Papillary Carcinoma)102 例,其他類(lèi)型THCA(Others)9例;按性別計(jì),男性(Male)136 例,女性(Female)369例;按年齡計(jì),21~40周歲(Yrs)175例,41~60周歲(Yrs)200 例,61~80 周歲(Yrs)103 例,81~100 周歲(Yrs)10 例;按種族計(jì),高加索裔或白種人(Caucasian)334 例,非洲裔或黑種人(African-American)27例,亞洲裔或黃種人(Asian)51例。
H19在THCA 中的表達(dá)情況見(jiàn)圖1。結(jié)果顯示:與正常對(duì)照組相比,H19在THCA 中的表達(dá)無(wú)顯著差異(P<0.05,圖1-A),但與腫瘤分期顯著相關(guān),2期樣品中H19基因的表達(dá)量顯著下降,進(jìn)入3 期以后則顯著升高(P<0.05,圖1-B);H19在THCA 中的表達(dá)與性別、年齡、種族因素?zé)o顯著相關(guān)(P均>0.05),圖1-D、圖1-E、圖1-F);此外,H19在THCA 中的表達(dá)與病理亞型關(guān)系密切:H19基因在高細(xì)胞型THCA 中的表達(dá)顯著高于經(jīng)典型THCA、濾泡型THCA 和其他類(lèi)型THCA(P均<0.05);在經(jīng)典型THCA 中的表達(dá)顯著高于濾泡型THCA 和其他類(lèi)型THCA(P均<0.05),見(jiàn)圖1-C。
圖1 H19基因在甲狀腺癌中的表達(dá)
基因表達(dá)與預(yù)后相關(guān)分析表明,H19高表達(dá)的THCA 患者(n=127)其預(yù)后生存率顯著低于中低表達(dá)的患者(n=377,P<0.05),見(jiàn)圖2。
圖2 H19基因表達(dá)對(duì)甲狀腺癌患者生存預(yù)后的影響
對(duì)H19靶基因進(jìn)行GO 注釋?zhuān)蔡崛〉脚c其相關(guān)的103條GO 功能標(biāo)簽。GO 注釋標(biāo)簽富集分析顯示,上述靶基因主要涉及RNA 聚合酶II啟動(dòng)子的轉(zhuǎn)錄調(diào)控、序列特異性DNA 結(jié)合、轉(zhuǎn)錄因子活性、轉(zhuǎn)錄因子結(jié)合、轉(zhuǎn)錄激活因子活性等功能。
KEGG 通路注釋和富集分析顯示,H19靶基因主要富集在致癌錯(cuò)誤轉(zhuǎn)錄(transcriptional misregulation in cancer)、黏合連接(adherens junction)、癌癥相關(guān)通路(pathways in cancer)、多能干細(xì)胞調(diào)控信號(hào)通路(signaling pathways regulating pluripotency of stem cells)、結(jié)腸直腸癌(colorectal cancer)、轉(zhuǎn)化生長(zhǎng)因子-β 信號(hào)通路(TGF-beta signaling pathway)、HTLV-I 感染(HTLV-I infection)、Hippo 信號(hào)通路(hippo signaling pathway)、急性髓系白血?。╝cute myeloid leukemia)、細(xì)胞周期(cell cycle)、FoxO 信號(hào)通路(FoxO signaling pathway)、Wnt 信號(hào)通路(Wnt signaling pathway)、THCA等13條通路。
基于H19靶基因功能注釋和通路富集結(jié)果,在ENCORI 數(shù)據(jù)庫(kù)中的“Pan-Cancer 模塊”選擇“RNA-RNA CoExpression”,分析H19與其靶基因SMAD4 在THCA 組織中的表達(dá)相關(guān)性。結(jié)果顯示:THCA 中H19和SMAD4 基因的表達(dá)呈顯著負(fù)相關(guān)(r=-0.107,P<0.05)(圖3)。推測(cè)THCA 中H19可能通過(guò)靶向性地調(diào)節(jié)SMAD4基因的表達(dá),從而發(fā)揮其生物學(xué)效應(yīng)。
圖3 H19與SMAD4基因的表達(dá)相關(guān)性
SMAD4 在THCA 中的表達(dá)情況見(jiàn)圖4。結(jié)果表明:與正常對(duì)照組相比,SMAD4 在THCA 中的表達(dá)顯著降低(P<0.05),見(jiàn)圖4-A;SMAD4在THCA 中的表達(dá)與腫瘤分期、性別、年齡、種族因素?zé)o顯著相關(guān)(P>0.05),見(jiàn)圖4-B、圖4-D、圖4-E、圖4-F;不同病理亞型病灶組織中的表達(dá)差異分析顯示,SMAD4基因在經(jīng)典型THCA 中的表達(dá)顯著高于高細(xì)胞型THCA(P<0.05),與濾泡型THCA 和其他類(lèi)型THCA相比則無(wú)顯著差異(P均>0.05),見(jiàn)圖4-C。由圖5可以看出,SMAD4 高表達(dá)量THCA 患者與中低表達(dá)量患者的預(yù)后生存率無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05),但存在SMAD4 中低表達(dá)患者生存率低于高表達(dá)患者的趨勢(shì)。
圖4 SMAD4基因在甲狀腺癌中的表達(dá)
圖5 SMAD4基因表達(dá)對(duì)甲狀腺癌患者生存預(yù)后的影響
本研究利用UALCAN 數(shù)據(jù)庫(kù)考察了lncRNAH19在THCA 中的表達(dá)情況。結(jié)果顯示:H19在THCA 中的表達(dá)與腫瘤分期顯著相關(guān),尤其當(dāng)腫瘤發(fā)展至3期以后其表達(dá)水平顯著升高。此外,與中、低表達(dá)患者相比,H19高表達(dá)THCA 患者的預(yù)后生存率顯著降低。這與劉娜等[12]的研究結(jié)果是一致的。H19表達(dá)上調(diào)與不同類(lèi)型惡性腫瘤的發(fā)生具有相關(guān)性已被很多學(xué)者證實(shí)[13-17]。結(jié)合本研究的結(jié)果,我們推測(cè)H19可能是THCA 發(fā)生、發(fā)展過(guò)程中的重要生物學(xué)調(diào)控分子之一。
為了深入了解H19的分子作用機(jī)制,對(duì)H19的靶基因進(jìn)行了預(yù)測(cè),并對(duì)其進(jìn)行GO和KEGG注釋和富集分析。結(jié)果顯示,靶基因SMAD4的出現(xiàn)頻率最高且顯著富集到了TGF-β 信號(hào)通路。進(jìn)一步考察發(fā)現(xiàn),H19與SMAD4 的表達(dá)呈顯著的負(fù)相關(guān)關(guān)系;并且SMAD4在THCA中的表達(dá)顯著降低,而SMAD4低表達(dá)THCA 患者預(yù)后變差。眾所周知,TGF-β 信號(hào)通路在生理狀態(tài)下被認(rèn)為是惡性腫瘤發(fā)生的抑制性通路[18]。TGF-β 信號(hào)通路若出現(xiàn)紊亂,將使得細(xì)胞生長(zhǎng)和分化過(guò)程失去控制,從而促進(jìn)惡性腫瘤的發(fā)生與發(fā)展。SMAD4 是位于人類(lèi)核染色體18 q21.1 上的一種抑癌基因,一旦SMAD4 基因缺失或突變,整個(gè)TGF-β 超家族信號(hào)轉(zhuǎn)導(dǎo)網(wǎng)絡(luò)即會(huì)被破壞,TGF-β 信號(hào)通路在腫瘤發(fā)展中的抑制效應(yīng)便會(huì)消失[19]。相關(guān)研究也顯示,結(jié)節(jié)性甲狀腺腫與THCA 并存患者組織標(biāo)本中SMAD4 蛋白表達(dá)陽(yáng)性率相比于結(jié)節(jié)性甲狀腺腫組、結(jié)節(jié)性甲狀腺腫與甲狀腺瘤并存組均顯著降低[20]。因此,推測(cè)在THCA中,H19可能通過(guò)與SMAD4 相互作用使后者的表達(dá)量下調(diào),從而對(duì)TGF-β 信號(hào)通路產(chǎn)生抑制,進(jìn)而促進(jìn)THCA的發(fā)生、發(fā)展。
需要指出的是,在本研究中,與健康人群相比,THCA 患者病灶組織中H19未呈現(xiàn)出表達(dá)上的差異,而與其顯著相關(guān)的預(yù)測(cè)靶基因SMAD4則出現(xiàn)了顯著的表達(dá)變化。分析原因,一方面圖1-A 的結(jié)果中區(qū)只分了健康人群和THCA 患者2 個(gè)組,這就可能使得腫瘤分期導(dǎo)致的表達(dá)差異被掩蓋,因?yàn)闃颖局蠺HCA 患者可能處于不同的腫瘤分期,而如前所述,H19在THCA 中的表達(dá)與腫瘤分期顯著相關(guān);另一方面,基因轉(zhuǎn)錄調(diào)控具有非線(xiàn)性特點(diǎn),上游分子信號(hào)還可能在基因表達(dá)調(diào)控過(guò)程中被級(jí)聯(lián)放大[21]。另外,還要認(rèn)識(shí)到mRNA-miRNA-lncRNA 三元ceRNA 網(wǎng)絡(luò)是一個(gè)復(fù)雜生物學(xué)調(diào)控機(jī)制[22],lncRNA的分子功能具有多樣性的特點(diǎn)。因此,本研究中結(jié)果顯示H19基因的表達(dá)與腫瘤分期顯著相關(guān),而SMAD4 的表達(dá)則與腫瘤分期無(wú)關(guān),且H19高調(diào)表達(dá)的THCA 患者其預(yù)后生存率顯著低于中低表達(dá)的患者而SMAD4 高調(diào)表達(dá)與中低表達(dá)THCA 患者的預(yù)后生存率差異不顯著,這可能與H19在分子調(diào)控功能上的多樣性有關(guān),其可能通過(guò)與其他分子互作從而調(diào)控腫瘤分期。本研究是基于生物信息數(shù)據(jù)庫(kù)的預(yù)測(cè)和分析,H19和SMAD4 在THCA 中的表達(dá)規(guī)律及其互作關(guān)系尚有待今后通過(guò)體內(nèi)外試驗(yàn)和臨床加以驗(yàn)證;此外,在本研究中我們更多地著眼于H19和SMAD4 基因在THCA 中的表達(dá),而未完成ceRNA 網(wǎng)絡(luò)的構(gòu)建,后續(xù)可利用甲狀腺癌和正常配對(duì)組織的mRNA、miRNA、lncRNA 數(shù)據(jù),完成mRNA、miRNA、lncRNA 互作的可視化分析,并結(jié)合試驗(yàn)驗(yàn)證識(shí)別出更多的關(guān)鍵生物標(biāo)志物,以期為今后THCA的診斷、治療及預(yù)后評(píng)估,提供一定的參考依據(jù)。