国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

WGCNA聯(lián)合LASSO-COX方法篩選甲狀腺癌預(yù)后關(guān)鍵基因及其臨床價值分析

2023-12-11 02:48:24張澍漾郭松雪項承支飛虎謝立江趙萍
中國現(xiàn)代醫(yī)生 2023年32期
關(guān)鍵詞:通路預(yù)測模塊

張澍漾,郭松雪,項承,支飛虎,謝立江,趙萍

1.紹興市中醫(yī)院 浙江中醫(yī)藥大學(xué)附屬紹興中醫(yī)院普外科,浙江紹興 312000;2.浙江大學(xué)醫(yī)學(xué)院附屬第二醫(yī)院整形外科,浙江杭州 310009;3.浙江大學(xué)醫(yī)學(xué)院附屬第二醫(yī)院甲狀腺外科,浙江杭州 310009

甲狀腺癌(thyroid cancer,THCA)發(fā)病率逐年增長,是全球增長速度最快的癌癥之一,已經(jīng)成為內(nèi)分泌系統(tǒng)中最常見的惡性腫瘤。據(jù)統(tǒng)計,全球THCA患者已經(jīng)超過5.86萬例[1],女性的患病率是男性的3倍[2]。近30年,女性發(fā)病率上升了22倍,男性發(fā)病率上升了15倍,已經(jīng)成為了威脅人民健康的十大癌癥之一[3]。

近年來隨著生物信息學(xué)的發(fā)展與應(yīng)用,基因靶向治療成為精準(zhǔn)治療腫瘤的熱點(diǎn)。既往研究利用基因表達(dá)綜合數(shù)據(jù)庫(gene expression omnibus,GEO)和癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫確定了肺鱗癌的鐵死亡差異表達(dá)基因(differentially expressed genes,DEGs),為癌癥的治療靶點(diǎn)和預(yù)后預(yù)測提供指導(dǎo)[4]。有研究通過免疫微環(huán)境、免疫治療反應(yīng)和基因突變分析等方法,構(gòu)建了穩(wěn)健的腎透明細(xì)胞癌癥預(yù)后預(yù)測模型[5]。6-DNA甲基化特征是THCA患者無進(jìn)展生存率的獨(dú)立預(yù)后標(biāo)志物[6]。Hsa-miR-139-5p是一種THCA預(yù)后標(biāo)志物,參與HNRNPF介導(dǎo)的可變剪接,是一種與調(diào)節(jié)THCA主要信號通路和腫瘤毒性相關(guān)的新型調(diào)控機(jī)制[7]。GPX4表達(dá)的增加通過抑制鐵死亡促進(jìn)THCA的發(fā)生,且可以預(yù)測較差的臨床結(jié)果[8]。SERINC2在乳頭狀THCA中可作為潛在的腫瘤驅(qū)動生物標(biāo)志物[9]。目前我國已經(jīng)常規(guī)開展了BRAF基因、TERT基因、RET/PTC重排和RAS基因等突變檢測,用于THCA患者的輔助診斷[10]。

本研究通過TCGA-THCA數(shù)據(jù)集篩選出THCA和正常樣本間的DEGs,隨后進(jìn)行權(quán)重基因共表達(dá)網(wǎng)絡(luò)分析(weighted gene co-expression network analysis,WGCNA)和套索聯(lián)系COX回歸分析(least absolute shrinkage and selection operator regression COX analysis,LASSO-COX)獲得5個與預(yù)后相關(guān)的關(guān)鍵基因,然后由關(guān)鍵基因構(gòu)建預(yù)后預(yù)測模型,并采用免疫組化實驗進(jìn)行驗證基因的表達(dá),再進(jìn)行受試者工作特征(receiver operating characteristic,ROC)曲線分析和生存分析,最后基于基因表達(dá)譜和風(fēng)險評分進(jìn)行基因集富集分析(gene set enrichment analysis,GSEA)用以評估相關(guān)途徑和分子機(jī)制,為患者預(yù)后預(yù)測提供一個潛在選擇。

1 資料與方法

1.1 數(shù)據(jù)收集與處理

在TCGA官方網(wǎng)站上收集2011年至2015年共511例THCA患者的臨床數(shù)據(jù)和mRNA測序數(shù)據(jù),共569份組織樣本,其中THCA組織樣本511份,甲狀腺組織正常組織58份。隨訪時間至2015年,其中死亡人數(shù)為17例。使用Perl5.24.3軟件將原始mRNA測序數(shù)據(jù)轉(zhuǎn)換成mRNA表達(dá)矩陣。

1.2 差異基因的篩選

應(yīng)用Limma R軟件包對RNA-seq表達(dá)數(shù)據(jù)行歸一化處理,并以P<0.01和|log2FC|>2為差異有統(tǒng)計學(xué)意義的閾值,進(jìn)行差異基因表達(dá)分析篩選出THCA樣本組和正常組之間的DEGs。

1.3 WGCNA

利用基因表達(dá)譜分別計算每個基因的絕對中位差(median absolute deviation,MAD),剔除了MAD最小的前50%的基因,利用R軟件WGCNA包去除離群的基因和樣本。首先,定義β(軟閾值)的功效以確保標(biāo)準(zhǔn)的無標(biāo)度網(wǎng)絡(luò),然后使用網(wǎng)絡(luò)中每對節(jié)點(diǎn)基因與其Pearson相關(guān)系數(shù)之間的鄰接值構(gòu)造鄰接矩陣,鄰接矩陣用于計算拓?fù)渲丿B矩陣(topological overlap matrix,TOM)和相應(yīng)的不相似度(1-TOM),基于TOM的差異度量,通過平均連接層次聚類構(gòu)建樹狀圖,將高度相似的模塊聚集在一起,然后以0.25的高度截止合并。依據(jù)模塊劃分結(jié)果,計算模塊與性狀Pearson相關(guān)系數(shù),選擇與臨床特性相關(guān)性最顯著的模塊。

1.4 LASSO-COX

結(jié)合患者的生存信息,首先對上述得到的關(guān)鍵模塊基因進(jìn)行LASSO-COX,減少基因之間共線性的影響,防止后續(xù)構(gòu)建的風(fēng)險模型變量過度擬合。LASSO回歸分析通過引入懲罰系數(shù)(λ)將冗余變量的系數(shù)壓縮為0,最后剩余的系數(shù)非零的變量為最終變量。本研究中使用5折交叉驗證以確定最優(yōu)懲罰系數(shù),獲取有效基因構(gòu)建最佳預(yù)后模型。再將LASSO回歸分析得到的基因進(jìn)行多因素COX回歸分析,計算每個多因素回歸系數(shù),構(gòu)建風(fēng)險評分方程。

1.5 免疫組織化學(xué)檢測

2022年10月至12月在紹興市中醫(yī)院收集接受手術(shù)治療的THCA患者的腫瘤組織和癌旁組織3例(女性2例,男性1例),進(jìn)行免疫組化驗證基因的表達(dá)。免疫組化采用常規(guī)兩步染色法。組織通過石蠟包埋,然后切片脫蠟至水。微波加熱修復(fù)抗原。滴加PBS洗凈,滴加一抗。4℃孵育過夜,PBS沖洗干凈,滴加二抗37℃孵育30min,DAB顯色。蘇木精再染色,脫水,透明,封片。所有藥品均購自生工生物工程(上海)股份有限公司。

1.6 風(fēng)險預(yù)后模型的建立與分析

根據(jù)上述LASSO-COX的結(jié)果,構(gòu)建基于基因表達(dá)的風(fēng)險評分方程。選擇風(fēng)險評分的最優(yōu)截斷值將患者分為高、低風(fēng)險兩組,進(jìn)行Kaplan-Meier生存分析,利用R3.6.0軟件繪制模型的ROC曲線,計算曲線下面積(area under curve,AUC),若AUC≥0.8,且P<0.05,則認(rèn)為該模型具有較好的預(yù)測性能。利用R3.6.0軟件繪制模型預(yù)測預(yù)后的列線圖,以預(yù)測模型的C指數(shù)(C-index)評價模型的區(qū)分度。

1.7 根據(jù)模型評分分組進(jìn)行GSEA分析

利用GSEA研究風(fēng)險評分分組與京都基因和基因組百科全書(Kyotoencyclopdia of Genes and Genomes,KEGG)通路基因集的相關(guān)性。根據(jù)風(fēng)險評分值的最優(yōu)截斷值將患者分成高、低風(fēng)險兩組,采用GSEA軟件(version 3.0),設(shè)定參數(shù):最小基因集為5,最大基因集為5000,1000次重抽樣,以P< 0.05,F(xiàn)DR<0.25為差異有統(tǒng)計學(xué)意義條件,評估相關(guān)途徑和分子機(jī)制。

2 結(jié)果

2.1 DEGs篩選

利用P<0.01和|log2FC|>2為篩選條件,在THCA組織-正常組間篩選到DEGs共計2130個,包含865個上調(diào)基因和1265個下調(diào)基因。

2.2 WGCNA分析

通過平均連通性圖比較發(fā)現(xiàn)基因間聯(lián)系軟閾值為4后,設(shè)置模塊合并閾值為0.25,繪制聚類樹狀圖得到了9個關(guān)鍵模塊。然后根據(jù)模塊性狀關(guān)系熱圖,發(fā)現(xiàn)青綠色模塊與臨床性狀的關(guān)聯(lián)性最高,確定其為關(guān)鍵模塊,該模塊包含403個基因。

2.3 LASSO-COX

整合生存時間、生存狀態(tài)和基因表達(dá)數(shù)據(jù),使用LASSO-COX對青綠色模塊包含的403個基因進(jìn)一步篩選,設(shè)置λ值為0.023,最終獲得了5個關(guān)鍵基因LINC02550、STEAP2、ATP2C2、PLEKHG4B和SALL4,并構(gòu)建模型公式。STEAP2的免疫組化結(jié)果顯示該蛋白在腫瘤組織中的表達(dá)強(qiáng)于在正常組織中的表達(dá)(圖1)。

圖1 STEAP2蛋白在甲狀腺正常組織及腫瘤組織中的表達(dá)(DAB染色)

2.4 生存分析

生存分析表明,該風(fēng)險評分顯著影響THCA患者的預(yù)后,(P<0.001),并且高風(fēng)險評分組的患者生存率較低(圖2)。采用ROC分析獲得1、3、5年曲線下面積分別為0.93、0.88、0.86,均大于0.8,說明該模型具有良好的預(yù)測性能(圖3)。

圖2 預(yù)后基因風(fēng)險評分模型的生存分析

圖3 預(yù)后基因風(fēng)險評分模型的ROC曲線

2.5 諾莫圖

基于以上結(jié)果利用R3.6.0軟件繪制基于5個基因的綜合風(fēng)險評分和主要臨床特征的組合預(yù)測THCA患者生存的列線圖,結(jié)果顯示列線圖對THCA患者具有良好的預(yù)后預(yù)測能力(C-index=0.96,圖4)。

圖4 風(fēng)險評分聯(lián)合臨床特性建立的預(yù)測患者生存諾莫圖

2.6 GSEA分析

5基因構(gòu)建的預(yù)后預(yù)測模型具有良好的預(yù)測性能,因此認(rèn)為該模型可能與影響預(yù)后的信號通路有關(guān)。GSEA分析獲得關(guān)鍵通路mTOR信號通路、Hedgehog信號通路、細(xì)胞自噬調(diào)節(jié)及轉(zhuǎn)化生長因子-β信號通路,且均富集在高風(fēng)險評分組(圖5)。

圖5 GSEA富集信號通路

3 討論

THCA在內(nèi)分泌惡性腫瘤患者中占比超過90%,且女性患病率顯著高于男性,因為雌性激素有可能是甲狀腺良惡性細(xì)胞的一種有效生長因子[11-12]。基因突變是THCA發(fā)生、發(fā)展的重要因素之一,并與其疾病診斷、預(yù)后評估及分子靶向藥物治療密切相關(guān)。早期對THCA進(jìn)行風(fēng)險等級評定,不僅避免了對輕度患者過度治療,而且有利于精準(zhǔn)預(yù)測患者的預(yù)后[13]。

本研究結(jié)果表明,LINC02550、STEAP2、ATP2C2、PLEKHG4B和SALL4這5個基因與THCA預(yù)后緊密相關(guān)。關(guān)于LINC02550的研究目前還沒有報道。STEAP2作為STEAP家族的成員,是重要的體內(nèi)金屬還原酶,在維持鐵穩(wěn)態(tài)中發(fā)揮重要作用,對不同的癌種有不同的響應(yīng)[14]。本研究中該基因在甲狀腺腫瘤組織中是下調(diào)的,免疫組化結(jié)果顯示該蛋白在甲狀腺腫瘤組織中高表達(dá),與已報道研究發(fā)現(xiàn)其在乳頭狀THCA中的低表達(dá)相反,可能由于該蛋白在甲狀腺不同類型細(xì)胞的表達(dá)不同[15]。

ATP2C2基因與許多重要的生物學(xué)功能有關(guān),如調(diào)節(jié)鈣穩(wěn)態(tài)、調(diào)節(jié)語言障礙中的語音短期記憶[16-17]。既往研究發(fā)現(xiàn)ATP2C2可能是乳腺癌患者腫瘤微環(huán)境狀態(tài)的指標(biāo)[18-19]。PLEKHG4B在細(xì)胞之間連接成熟期間參與肌動蛋白細(xì)胞骨架重塑,在甲狀腺腫瘤中PLEKHG4B表達(dá)是下調(diào)的,可能由于其下調(diào),增加了甲狀腺腫瘤細(xì)胞間的黏附力形成時間,有益于其轉(zhuǎn)移[20]。SALL4是公認(rèn)的致癌基因,該基因不僅通過Wnt/β-catenin和PTEN/PI3K/AKT通路調(diào)節(jié)細(xì)胞生長,還通過細(xì)胞凋亡相關(guān)的基因,如CYC3和CUL3的表達(dá)影響細(xì)胞凋亡[21-22]。SALL4在不同的癌種中起不同的作用,在乳腺癌和肝癌中,通過激活Wnt/β-catenin信號,促進(jìn)癌細(xì)胞的增殖、遷移和侵襲;在胃癌中激活轉(zhuǎn)化生長因子-β/SMAD信號通路,促進(jìn)癌細(xì)胞轉(zhuǎn)移[23-25]。研究表明,SALL4基因在THCA組織中表達(dá)上調(diào),可能參與腫瘤細(xì)胞的發(fā)展和轉(zhuǎn)移[26]。

GSEA分析表明mTOR信號通路、Hedgehog信號通路、細(xì)胞自噬調(diào)節(jié)、轉(zhuǎn)化生長因子-β信號通路富集在高風(fēng)險評分組。Hedgehog信號通路作用于哺乳類動物的胚胎發(fā)育和組織分化,控制細(xì)胞的生長與增殖。該信號通路異常激活與多種惡性腫瘤的發(fā)生有密切關(guān)系,參與腫瘤增殖、遷移、血管生成、上皮-間質(zhì)轉(zhuǎn)化、腫瘤干細(xì)胞調(diào)控等,有研究表明在THCA患者中通過抑制Hedgehog信號通路可以激活TGF-β信號通路,從而抑制腫瘤細(xì)胞的凋亡[21]。此外,TGF-β是上皮-間質(zhì)轉(zhuǎn)化過程的主要開關(guān),可通過很多信號通路來誘導(dǎo)上皮-間質(zhì)轉(zhuǎn)化的發(fā)生。

綜上所述,本研究通過生物信息學(xué)方法分析THCA基因表達(dá)譜數(shù)據(jù),篩選了5個關(guān)鍵基因可為潛在預(yù)后標(biāo)志物,并通過免疫組化實驗進(jìn)行表達(dá)驗證。此外,建立了生存預(yù)后模型,有助于THCA的預(yù)后生存預(yù)測與基因靶向治療。

猜你喜歡
通路預(yù)測模塊
無可預(yù)測
黃河之聲(2022年10期)2022-09-27 13:59:46
28通道收發(fā)處理模塊設(shè)計
“選修3—3”模塊的復(fù)習(xí)備考
選修2-2期中考試預(yù)測卷(B卷)
選修2-2期中考試預(yù)測卷(A卷)
不必預(yù)測未來,只需把握現(xiàn)在
Kisspeptin/GPR54信號通路促使性早熟形成的作用觀察
選修6 第三模塊 International Relationships
proBDNF-p75NTR通路抑制C6細(xì)胞增殖
通路快建林翰:對重模式應(yīng)有再認(rèn)識
苗栗县| 柘城县| 张家川| 哈巴河县| 永仁县| 资溪县| 德昌县| 张家港市| 崇州市| 环江| 湖州市| 柳江县| 白河县| 怀柔区| 繁峙县| 桃江县| 雷波县| 治县。| 桓台县| 龙海市| 清水河县| 邯郸县| 大渡口区| 连平县| 泗水县| 达尔| 万安县| 林甸县| 西盟| 黄山市| 砚山县| 鞍山市| 乳山市| 海南省| 克什克腾旗| 林周县| 城市| 故城县| 长宁区| 金山区| 巨鹿县|