張慶雪,趙碩,張瑩瑩,高東程,李靖若
1 鄭州大學第三附屬醫(yī)院乳腺外科,鄭州 450052;2 鄭州大學第一附屬醫(yī)院乳腺外科
目前女性乳腺癌已超過肺癌成為2020 年全球發(fā)病率最高的癌癥,發(fā)病人數(shù)占所有新發(fā)癌癥患者的11.7%,同時,死亡人數(shù)占所有癌癥死亡患者的6.9%,是導致全球女性死亡人數(shù)最多的癌癥[1]。隨著手術(shù)、化療、放療、內(nèi)分泌治療、靶向治療以及免疫治療等多種治療策略的快速發(fā)展,女性乳腺癌患者的平均五年生存率達到了91%[2],但耐藥和復發(fā)轉(zhuǎn)移仍是導致乳腺癌患者預后不良的關(guān)鍵因素[3]。乳腺癌是一種高度異質(zhì)性疾病,根據(jù)雌激素受體、孕激素受體、人類表皮生長因子受體-2(HER-2)及細胞增殖指數(shù)ki-67 的表達水平,可分為Luminal A型、Luminal B 型、HER-2 陽性及三陰性乳腺癌四種類型[4-5],具有相同臨床分期和病理分型的患者預后也可能存在較大差異[6]。目前,21 基因檢測[7]、70 基因檢測[8]、7 基因乳腺癌指數(shù)[9]、50 基因復發(fā)風險[10]和12 基因檢測[11]等多基因檢測僅適用于激素受體陽性、HER-2陰性的早期乳腺癌患者,臨床暫無用于預測其他類型乳腺癌患者預后的預測模型。因此,迫切需要開發(fā)新的預測方法,為乳腺癌患者的預后預測和個體化抗癌治療提供指導。
銅是所有生物體必需的礦物質(zhì)營養(yǎng)素,與能量代謝、活性氧解毒、鐵攝取和信號傳導等多種生物過程相關(guān)[12]。研究[13]顯示,腫瘤對銅的需求更高,銅通過促進癌細胞增殖、血管生成和轉(zhuǎn)移參與多種腫瘤的進展,然而過量的銅可能會導致癌細胞銅死亡[14]。銅死亡是一種由TSVETKOV 等[15]于2022 年發(fā)現(xiàn)的新型調(diào)節(jié)性細胞死亡,不同于凋亡、壞死和鐵死亡等已知細胞死亡形式,它依賴于銅積累和線粒體呼吸。銅與三羧酸循環(huán)的酯?;煞种苯咏Y(jié)合,誘導酯?;鞍踪|(zhì)聚集及鐵硫簇蛋白質(zhì)丟失,從而誘發(fā)蛋白質(zhì)毒性應激導致細胞死亡[15]。因此,誘導癌細胞發(fā)生銅死亡在抗癌治療中具有巨大潛力。長鏈非編碼核糖核酸(lncRNA)是一類轉(zhuǎn)錄本長度超過 200 個核苷酸的線性非編碼RNA[16],通過在轉(zhuǎn)錄、轉(zhuǎn)錄后及表觀遺傳學水平調(diào)節(jié)基因的表達,參與細胞增殖、分化、干細胞重編程及腫瘤發(fā)生或耐藥等多種病理生理過程[17]。RNA 療法可以通過增加或沉默特定蛋白質(zhì)的表達調(diào)節(jié)靶細胞,在乳腺癌治療中具有高選擇性和低脫靶風險[18]。目前,銅死亡相關(guān)lncRNA在乳腺癌中的研究尚不全面,篩選銅死亡相關(guān)lncRNA,并構(gòu)建乳腺癌預后預測模型有助于實現(xiàn)精準抗癌治療。本研究篩選出與乳腺癌預后關(guān)系密切的銅死亡相關(guān)lncRNA,基于銅死亡相關(guān)lncRNAs 構(gòu)建了乳腺癌預后預測模型,并驗證了其效能。
1.1 數(shù)據(jù)及其來源 從TCGA 數(shù)據(jù)庫下載女性乳腺癌患者的轉(zhuǎn)錄組數(shù)據(jù)及臨床信息,截至2023 年2月17 日。共下載1 105 例乳腺癌樣本和112 例正常乳腺樣本的轉(zhuǎn)錄組數(shù)據(jù)。使用Perl 軟件(版本5.32.1)對轉(zhuǎn)錄組數(shù)據(jù)進行數(shù)據(jù)整理、ID 轉(zhuǎn)換,并分離mRNA 和lncRNA 表達譜,獲得19 962 個mRNAs和16 901 個lncRNAs。從已發(fā)表文獻中獲取銅死亡相關(guān)基因[15,19-22],共19 個,分別為NFE2L2、NLRP3、ATP7B、ATP7A、SLC31A1、FDX1、LIAS、LIPT1、LIPT 2、DLD、DLAT、PDHA1、PDHB、MTF1、GLS、CDKN2A、DBT、GCSH、DLST。TCGA 為公開可用的數(shù)據(jù)庫,本研究遵循TCGA 數(shù)據(jù)庫的訪問政策和出版指南,故無需倫理委員會批準。
1.2 乳腺癌預后關(guān)系密切的銅死亡相關(guān)lncRNA篩選及預后預測模型構(gòu)建 ①乳腺癌組織中銅死亡相關(guān)lncRNA 篩選:使用R 軟件(版本4.1.2)的R 包“l(fā)imma”對mRNA 表達譜和19 個銅死亡相關(guān)基因取交集,獲取乳腺癌組織中表達的銅死亡相關(guān)基因。進一步采用Pearson 相關(guān)性分析乳腺癌組織中表達的銅死亡相關(guān)基因與lncRNA 的相關(guān)性,以|r|>0.4和P<0.001為標準篩選出乳腺癌組織中的銅死亡相關(guān)lncRNA,并使用R 包“dplyr”、“ggalluvial”和“ggplot2”繪制?;鶊D。②乳腺癌組織中與預后關(guān)系密切的銅死亡相關(guān)lncRNA 篩選:選擇銅死亡相關(guān)lncRNA 表達譜與臨床資料均完整的患者885例(整體組),用R 包“caret”的“createDataPartition”函數(shù)按照1∶1 的比例將整體組患者隨機分為訓練組443 例與驗證組442 例,并使用χ2檢驗分析組間臨床資料(包括生存時間、生存狀態(tài)、年齡、臨床分期及T、N、M 分期)差異。在訓練組中,使用R 包“survival”進行單因素Cox 回歸分析初步篩選與乳腺癌患者預后相關(guān)的銅死亡相關(guān)lncRNA,篩選標準為P<0.05。為避免lncRNA 的過度擬合,使用R 包“survival”和“glmnet”進行最小絕對收縮和選擇算子(LASSO)回歸進一步篩選預后關(guān)系密切的銅死亡相關(guān)lncRNA。隨后,使用R 包“survival”和“survminer”進行多因素Cox 回歸分析。③乳腺癌預后預測模型的構(gòu)建:根據(jù)赤池信息準則(AIC)確定最佳預后預測模型(AIC值最小)。模型公式如下:
其中n表示納入模型的lncRNA 數(shù)量,coefi為各lncRNA的回歸系數(shù),Xi為各lncRNA的表達量。
1.3 乳腺癌預后預測模型的效能驗證 根據(jù)乳腺癌的預后預測模型,計算訓練組患者的風險評分。以訓練組患者的中位風險評分作為截斷值,將訓練組、驗證組和整體組的患者分別劃分為高風險組和低風險組。 乳腺癌預后預測模型的區(qū)分能力驗證:分別在訓練組、驗證組和整體組中使用R 包“survival”和“survminer”進行生存分析,繪制生存曲線,比較高、低風險組患者的生存率;將整體組患者按不同臨床特征分為亞組,使用R 包“survival”和“survminer”繪制生存曲線并比較不同亞組中高、低風險患者的生存率差異。乳腺癌預后預測模型的準確性驗證:使用R 包“timeROC”繪制ROC,并計算曲線下面積(AUC)評估預后預測模型對乳腺癌患者1、3、5 年生存率的預測效能。在整體組中,使用R 包“timeROC”、“rms”和“pec”繪制風險評分及臨床特征的多指標ROC 及一致性指數(shù)曲線比較不同指標的預測性能。乳腺癌預后預測模型的獨立性驗證:使用R包“survival”對風險評分及各臨床特征進行單因素及多因素 Cox 回歸分析評估風險評分是否是乳腺癌患者預后的獨立影響因素。臨床實用性驗證: 高、低風險組間差異表達基因本體功能及信號通路富集分析;高、低風險組患者免疫浸潤分析。
高、低風險組間差異表達基因本體功能及信號通路富集分析:使用R 包“l(fā)imma”篩選高、低風險組間差異表達的基因,篩選標準為|log2差異倍數(shù)|>1,錯誤發(fā)現(xiàn)率<0.05。使用R 包“clusterProfiler”、“org.Hs.eg.db”和“enrichplot”進行京都基因和基因組百科全書(KEGG)通路富集分析識別差異表達的基因主要參與的信號通路,進行基因本體功能(GO)分析差異表達的基因主要涉及的生物學過程、細胞成分和分子功能,P<0.05和校正后的P值<1被認為顯著富集。使用R包“ggplot2”將富集結(jié)果可視化。
高、低風險組患者免疫浸潤分析:使用R 包“estimate”進行ESTIMATE 算法計算乳腺癌患者的免疫細胞、基質(zhì)細胞、腫瘤純度及綜合評分[23],使用R 包“l(fā)imma”和“ggpubr” 進行Wilcoxon 檢驗比較高、低風險組間差異。對患者的表達譜進行歸一化校正,利用CIBERSORT 算法計算兩組患者免疫細胞的相對浸潤豐度[24],采用Wilcoxon檢驗比較組間差異。
2.1 乳腺癌預后預測模型 Pearson 相關(guān)分析結(jié)果顯示乳腺癌組織中銅死亡相關(guān)lncRNAs 719 個。訓練組(n=443)和驗證組(n=442)臨床特征比較,P均>0.05,見表1,說明兩組基線資料均衡可比。在訓練組中,單因素Cox 回歸分析初步篩選出17 個與乳腺癌患者預后相關(guān)的銅死亡相關(guān)lncRNAs,包括7個保護lncRNAs[風險比(HR)<1]和10 個危險lncRNAs(HR>1);LASSO回歸分析進一步確定了14個與乳腺癌預后關(guān)系密切的銅死亡相關(guān)lncRNAs。采用多因素Cox 回歸分析最后構(gòu)建了由10 個lncRNAs組成的乳腺癌預后預測模型,模型公式如下:風險評分=(-1.129 216 501 573 150×AKT3.IT1 表達量) +(-1.166 095 685 256 72×AL137847.1 表 達 量) +(0.729 804 497 137 164×LINC02043 表 達 量) +(0.745 696 645 441 295×AL683813.1 表 達 量) +(-0.903 562 388 041 113×AL807757.2 表達量) +(1.040 608 675 397 110×AC073127.1 表 達 量) +(2.160 133 554 898 460×MFF.DT 表 達 量) +(1.417 144 256 517 410×AC091588.1 表 達 量) +(-0.764 700 719 748 750×AC079766.1 表達量) +(-3.608 177 447 126 010×AL451123.1 表達量)。
表1 各組臨床病理特征
2.2 乳腺癌預后預測模型的效能驗證結(jié)果 根據(jù)乳腺癌預后預測模型公式,訓練組患者的中位風險評分為1.066,根據(jù)中位風險評分將患者分為高風險組和低風險組。生存曲線顯示在訓練組、驗證組和整體組中,高、低風險組患者的總體生存率差異均具有統(tǒng)計學意義(P<0.001),且高風險組患者預后較差,見圖1~3。亞組分析顯示不同年齡、臨床分期、T、N 和M0 分期亞組中高風險組患者的生存率均低于低風險組(T3-4 亞組P=0.003,其余P均<0.001)(圖4、5、6、7 及圖8 的M0 分期),M1 分期亞組中高、低風險組患者的生存率差異無統(tǒng)計學意義(P=0.139)(圖8)。
圖1 訓練組高、低風險組患者總生存率的生存曲線
圖2 驗證組高、低風險組患者的生存曲線
圖3 整體組高、低風險組患者的生存曲線
圖4 不同年齡亞組中高低風險組的生存曲線
圖5 不同臨床分期亞組中高低風險組的生存曲線
圖6 不同T分期亞組中高低風險組的生存曲線
圖7 不同N分期亞組中高低風險組的生存曲線
圖8 不同M分期亞組的生存曲線
訓練組中,乳腺癌預后預測模型預測乳腺癌患者1、3、5 年生存率的AUC 分別為0.848、0.783、0.793,驗證組中分別為0.764、0.697、0.675,在整體組中分別為0.807、0.739、0.709。在整體組中,多指標ROC(圖9)及一致性指數(shù)曲線(圖10)顯示風險評分的AUC 值和一致性指數(shù)均高于其他臨床特征。
圖9 整體組風險評分及各臨床特征的多指標預測乳腺癌患者生存率的ROC
圖10 整體組風險評分及各臨床特征的一致性指數(shù)曲線
單因素COX 回歸分析顯示,風險評分與乳腺癌患 者的預 后顯著 相關(guān)[(HR(95%CI)為1.063(1.045~1.081),P<0.001];多因素Cox回歸分析顯示,風險評分是乳腺癌患者的獨立預后影響因素[(HR(95%CI)為1.065(1.047~1.082),P<0.001]。
高、低風險組間差異表達基因129 個。GO 分析顯示,差異表達基因富集于銨離子代謝過程、體液免疫反應和內(nèi)分泌激素分泌等生物過程,血液微粒子、角蛋白絲和中間絲等細胞成分,以及氨基酸結(jié)合、免疫球蛋白結(jié)合和ATP 酶-偶聯(lián)的無機陰離子跨膜轉(zhuǎn)運蛋白活動等分子功能。KEGG 分析顯示,這些差異表達基因顯著富集于B 細胞受體信號通路、色氨酸代謝、PI3K-Akt 信號通路和鉑類耐藥性等通路。
免疫細胞評分、基質(zhì)細胞評分、腫瘤純度及綜合評分的中位數(shù)在高風險組分別為411.670、518.220、969.350、0.734,在低風險組中分別為594.006、757.348、1394.424、0.690。與低風險組比較,高風險組免疫細胞、基質(zhì)細胞及綜合評分低,腫瘤純度高(P<0.001)。低風險組中幼稚B 細胞、靜息自然殺傷細胞、活化自然殺傷細胞和靜息肥大細胞浸潤豐度較高,高風險組中M0 和M2 巨噬細胞浸潤豐度較高(P均<0.05),見表2。
表2 免疫細胞相對浸潤豐度
乳腺癌是高度異質(zhì)性的惡性腫瘤,在女性癌癥中占新診斷患者的31%,占死亡患者的15%,是導致20~59 歲女性死亡的首要原因[25]。耐藥和復發(fā)轉(zhuǎn)移是導致患者預后不良的關(guān)鍵因素。腫瘤的異質(zhì)性導致具有相同臨床病理特征的患者預后亦可能存在較大差異,迫切需要探索有效的乳腺癌預后預測模型來準確預測患者預后,以利于進一步的臨床決策。銅死亡是一種由銅觸發(fā)的線粒體細胞死亡方式[14]。研究發(fā)現(xiàn)乳腺癌[26]、黑色素瘤[27]和肝細胞癌[28]等高線粒體代謝的腫瘤可能對銅離子載體誘導的銅死亡更敏感[29]。雙硫侖已被證實能夠作為銅離子載體誘導銅死亡發(fā)生[15],研究[30]表明其在治療乳腺癌時還可以降低腫瘤抑制基因PTEN 的表達并激活乳腺癌組織中Akt 信號傳導,聯(lián)合應用PI3K 抑制劑可以顯著抑制乳腺癌細胞的生長。本研究基于銅死亡相關(guān)lncRNA構(gòu)建乳腺癌預后預測模型,旨在為乳腺癌的預后評估提供新的視角。
本研究從TCGA 數(shù)據(jù)庫中獲得719 個銅死亡相關(guān)lncRNAs,通過多因素Cox 回歸將10 個lncRNAs納入預后預測模型,LINC02043、AL683813.1、AC073127.1,MFF.DT 和AC091588.1 是 危 險lncRNAs,AKT3.IT1、AL137847.1、AL807757.2、AC079766.1 和AL451123.1 是 保 護lncRNAs,這 些lncRNAs 可能是乳腺癌的生物標志物及潛在治療靶點。據(jù)研究[31]報道,LINC02043 是酒精相關(guān)性肝細胞癌的危險lncRNA,與其他lncRNAs 相結(jié)合可以預測酒精相關(guān)性肝細胞癌的無復發(fā)生存期。本研究發(fā)現(xiàn)LINC02043 亦是乳腺癌的危險lncRNA,與患者的預后不良相關(guān)。YU 等[32]研究提示,MFF.DT 作為危險lncRNA 與其他幾種銅死亡相關(guān)lncRNAs 聯(lián)合構(gòu)成乳腺癌的獨立預后因素,本研究結(jié)果與之相符。然而暫時沒有關(guān)于其余8 種lncRNAs 的研究報道,它們在乳腺癌中的生物學機制未來有必要通過進一步的體內(nèi)外實驗來探索,且有望成為乳腺癌的潛在治療靶點。
根據(jù)風險評分將乳腺癌患者分為高風險組和低風險組,隨著風險評分升高患者死亡率增加。生存曲線顯示無論是訓練組、驗證組還是整體組,高風險組患者的生存率均更低,表明預后預測模型對不同風險的患者有較好的區(qū)分能力。ROC 顯示風險評分預測乳腺癌患者1 年、3 年和5 年生存率的AUC 值較高,表明預后預測模型具有較強的預測效能,且多指標ROC 及一致性指數(shù)曲線表明模型的預測能力和臨床應用效能優(yōu)于其他臨床特征。獨立預后分析表明,風險評分是乳腺癌的獨立預后因素。亞組生存分析表明,該預后預測模型適用于不同臨床階段的乳腺癌患者。由于樣本中M1 分期的患者人數(shù)較少,高、低風險組生存率的差異無統(tǒng)計學意義,但結(jié)果仍表現(xiàn)出高風險組患者總生存率較低的趨勢。
為了進一步驗證預后預測模型的效能,我們探索了高、低風險組患者之間的生物學功能差異,對兩組間差異表達的基因進行了功能富集分析。KEGG分析表明差異表達的基因主要富集于B細胞受體信號通路、PI3K-Akt 信號通路和鉑類耐藥性等通路。GO 分析表明差異表達的基因富集于體液免疫反應等生物過程。GARAUD 等[33]發(fā)現(xiàn),腫瘤浸潤性B 細胞可以產(chǎn)生持續(xù)的體液免疫反應,并有助于在乳腺癌腫瘤部位產(chǎn)生有效的抗腫瘤免疫反應。HARRIS等[34]在三陰性乳腺癌中發(fā)現(xiàn),B 淋巴細胞具有IgG偏向的克隆擴張,并與良好的預后相關(guān),這可能是抗原驅(qū)動的體液免疫反應。PI3K-Akt 信號通路在細胞代謝、細胞生長增殖、細胞凋亡和血管生成等基本細胞活動中起主要作用[35],大約70%的乳腺癌患者攜帶PI3K/AKT 突變[36],從而導致該通路的過度激活,促進腫瘤細胞生長、增殖和血管生成,是導致乳腺癌的內(nèi)分泌治療、靶向治療和化療耐藥性的重要機制之一[37-38]。因此,高、低風險組間的預后差異可能與乳腺癌患者的免疫狀態(tài)及化療耐藥性相關(guān)。
腫瘤微環(huán)境包括腫瘤中的所有非癌宿主細胞(如免疫細胞和基質(zhì)細胞)以及非細胞成分[39],不同浸潤性免疫細胞具有抗腫瘤或促腫瘤的功能,隨著免疫逃逸的發(fā)生,免疫療法成為癌癥治療的新策略[40]。ESTIMATE 算法顯示低風險組的基質(zhì)評分、免疫評分和綜合評分高,腫瘤純度低,表明低風險組患者的免疫細胞浸潤程度更高。腫瘤相關(guān)巨噬細胞可以分化為兩個亞型,M1型巨噬細胞主要通過介導ROS誘導的組織損傷發(fā)揮抗腫瘤作用,而M2型巨噬細胞通過激活血管生成、免疫抑制及細胞外基質(zhì)重塑表現(xiàn)出促腫瘤活性[41-42]。免疫浸潤分析發(fā)現(xiàn),高風險組患者M2 型巨噬細胞浸潤豐度較高,可能通過M2 型巨噬細胞的促腫瘤作用導致癌細胞發(fā)生免疫逃逸而促進乳腺癌進展。因此,高、低風險組患者之間可能存在免疫狀態(tài)差異,且低風險組患者的免疫原性更高,更可能從免疫治療中獲益。本研究構(gòu)建的預后預測模型能夠較為準確地反映乳腺癌抗腫瘤免疫狀態(tài),為評估乳腺癌患者對免疫治療敏感性提供參考。
綜上所述,本研究基于TCGA 數(shù)據(jù)庫構(gòu)建了由10 個銅死亡相關(guān)lncRNAs 構(gòu)成的乳腺癌預后預測模型,該模型具有良好的準確性、區(qū)分能力、獨立性,不僅可以有效地預測乳腺癌患者的預后,還可以評估患者的免疫浸潤狀態(tài),反映免疫治療敏感性,為實現(xiàn)個體化抗癌治療提供參考。本研究也存在一定的局限性。首先,由于其他數(shù)據(jù)庫中缺乏完整的lncRNA 表達譜或臨床信息,本研究采用了內(nèi)部驗證的方法,未來仍有必要基于獨立的外部數(shù)據(jù)集來驗證乳腺癌預后預測模型的有效性。此外,本研究在生物信息學層面分析了銅死亡相關(guān)lncRNAs 對乳腺癌患者預后的影響,未來需要通過體內(nèi)外實驗來進一步探索銅死亡相關(guān)lncRNAs 在乳腺癌中的病理生理功能。