陶 歡, 伯曉晨, 陳河兵*, 鄭曉飛*
(1)軍事科學院軍事醫(yī)學研究院輻射醫(yī)學研究所,放射生物學北京市重點實驗室, 北京 100850;2)軍事科學院軍事醫(yī)學研究院衛(wèi)生勤務與血液研究所, 北京 100850)
染色體構象捕獲技術的發(fā)展與應用加速了基因組三維結構的探索。細胞核內(nèi)每條染色體都占據(jù)著一個獨特且不重復的區(qū)域,稱為染色體疆域。染色體疆域中包括與常染色質(zhì)和異染色質(zhì)分別相關的A、B染色質(zhì)區(qū)室,染色質(zhì)區(qū)室由拓撲關聯(lián)結構域(topologically associated domain,TAD)組成,并可進一步細分為染色質(zhì)環(huán),例如調(diào)控基因表達的增強子-啟動子環(huán)等[1, 2]。環(huán)擠壓模型認為TAD是由染色質(zhì)環(huán)擠壓形成的,環(huán)狀擠壓因子——黏連蛋白沿著染色質(zhì)移動,當遇到另一個擠壓因子或兩個相反方向的邊界元素——CTCF(CCCTC binding factor,CTCF)時,將其擠壓成環(huán),繼而形成TAD[3, 4]。
TAD不僅是DNA復制、基因轉錄的基本功能單位,同樣是DNA損傷修復的功能單元[5]。已有研究表明,DNA雙鏈斷裂(DNA double strand break,DSB)發(fā)生時,DSB位點的黏連蛋白不斷積累,誘導斷裂位點的單側環(huán)擠出和擴大,并最終被阻滯在TAD邊界,當含H2AX的核小體通過DSB位點錨定的黏連蛋白時,會迅速被DNA損傷修復關鍵激酶毛細血管擴張性共濟失調(diào)突變(ataxia telangiectasia-mutated,ATM)蛋白磷酸化,使TAD內(nèi)部以正確的方式建立γH2AX-53BP1(P53-binding protein 1)染色質(zhì)域,該區(qū)域可作為DNA損傷修復位點的中心,使γH2AX迅速擴散至TAD邊界,在TAD內(nèi)部形成“易于DNA損傷修復”的環(huán)境,維持基因組三維結構的穩(wěn)定性[5-7]。此外,招募到DSB位點的黏連蛋白將未受損基因隔絕在γH2AX募集區(qū)域外,保護基因免受染色質(zhì)結構變化的影響,保證基因的正常轉錄,這種黏連蛋白依賴的DNA損傷響應機制從酵母到人類均保守,且與DSB修復途徑無關,而募集到TAD邊界的CTCF可以促進斷裂的DNA雙鏈進行同源重組修復[5, 6, 8, 9]。
TAD在不同的細胞系和物種中具有較高的保守性,其邊界有大量的CTCF和黏連蛋白富集,能夠形成相對獨立的局部環(huán)境[6]。近期研究表明,TAD并非是完全獨立的染色質(zhì)結構,其內(nèi)部常呈現(xiàn)多層級結構,與染色質(zhì)的表觀修飾及基因表達密切相關[10, 11]。根據(jù)TAD是否具有多層級結構,可將其分為兩類,一類是有多層級的TAD結構,一類是無多層級的TAD結構,兩類不同的TAD結構在生物學功能上具有差異[12]。比較而言,多層級的TAD具有更活躍的表觀遺傳狀態(tài)和較高的基因表達水平[12, 13]。此外,多層級的TAD間常共享同一TAD邊界,這些邊界常表現(xiàn)出非對稱性,較非共享邊界具有更活躍的表觀遺傳修飾和基因表達,且富集大量的啟動子,這些TAD邊界在基因組的結構維持及基因表達調(diào)控中具有重要作用[12, 13]。
已有文獻報道,TAD在DNA損傷修復中具有重要調(diào)控作用,TAD內(nèi)染色質(zhì)環(huán)擠出能夠確保DNA損傷修復結構的建立,并避免基因表達受到染色質(zhì)結構變化的影響[5, 6]。那么輻射誘導DNA損傷時,TAD多層級結構的拓撲變化是否在細胞輻射響應過程中發(fā)揮作用?本文基于前期已發(fā)表文獻中5Gy X射線照射后的淋巴細胞、成纖維細胞以及ATM缺陷的成纖維細胞的Hi-C測序數(shù)據(jù),探索了不同細胞系,輻射處理后不同時間,TAD多層級結構的變化規(guī)律,提出了輻射誘導TAD多層級結構變化調(diào)控基因表達參與輻射響應的模型,為理解染色質(zhì)高級結構如何參與細胞輻射響應提供了新視角。
本研究使用的26個Hi-C數(shù)據(jù)來自于GEO數(shù)據(jù)庫(GSE136899),包括淋巴細胞(GM12878)、成纖維細胞(BJ和MRC5,其中BJ細胞包含兩個克?。築J1和BJ5ta)和ATM缺陷的成纖維細胞(ATM基因突變的BJ細胞,ATM抑制劑KU-55933處理的BJ細胞和ATM缺失病人的原代成纖維細胞GM02052),5Gy X射線處理后30 min,24 h和5 d的Hi-C數(shù)據(jù)[5]。每個樣本的Hi-C數(shù)據(jù)來源于5×106個細胞的測序結果,每個細胞包含約100~200個DSB位點[5]。本研究中使用的Hi-C數(shù)據(jù)為Sanders等在GEO數(shù)據(jù)庫(GSE136899)中提供的經(jīng)過質(zhì)控和歸一化處理后的Hi-C相互作用矩陣[5]。
TAD多層級結構通過OnTAD算法識別,該算法是一種優(yōu)化的巢式TAD結構識別算法,可以從Hi-C數(shù)據(jù)識別多層級TAD結構[12]。OnTAD通過兩步實現(xiàn)對TAD多層級結構的識別:首先通過自適應局部最小化搜索算法,用WxW的菱形滑動窗口掃描并識別候選TAD邊界;隨后被識別的候補TAD邊界以基于評分的遞歸動態(tài)規(guī)劃算法組裝成多層級的TAD結構[12]。OnTAD方法將TAD分為5個層級,其中最外側的TAD為層級1,層級2為層級1直接嵌套的子TAD,以此類推。以40 kb分辨率的Hi-C矩陣作為OnTAD算法的輸入,將最大的TAD尺度定為50個bin(識別的最大的TAD為2 Mb),將最小的TAD尺度定為1個bin(識別的最小的TAD為40 kb),將“penalty”參數(shù)設置為 0.1。為保證樣本間的可比性,對所有樣本的計算使用同樣的參數(shù)。同時,對TAD邊界進行定義:根據(jù)某一邊界兩側TAD的數(shù)量,以TAD數(shù)量多的一側作為該邊界的層級,TAD邊界同樣分為5級。
通過OnTAD識別各樣本不同層級TAD,得到TAD兩端的位置信息,將TAD起點和終點的上下游60 kb定義為TAD邊界。對26個樣本進行TAD邊界識別,將重復樣本的TAD邊界層級進行整合,取兩重復樣本中TAD邊界層級數(shù)高的作為該樣本的TAD邊界層級。
在獲得TAD邊界信息后,將26個樣本的TAD邊界合并分析,采用ward層次聚類方法對26個Hi-C數(shù)據(jù)中保守的TAD邊界進行聚類,并使用R包corrplot對不同樣本TAD邊界間的相關性分析,并進行可視化。
通過獨立樣本的兩比例Z檢驗判斷淋巴細胞、成纖維細胞以及ATM缺失的淋巴細胞輻射后30 min、24 h的不同層級TAD邊界變化比例是否存在顯著差異。N.S.:P>0.05;*P<=0.05;**P<=0.01;***P<=0.001;****P<=0.0001。
TAD嵌套層級分數(shù)(TAD hierarchical score,TH score)的計算由bedtools軟件的coverage功能實現(xiàn),采用hg19基因注釋文件進行注釋,具有重復樣本的數(shù)據(jù),取基因在2個重復樣本中TH分數(shù)(score)的平均值,并對ΔTH score(實驗組-對照組)>1.5的基因進行篩選[14]。采用R包ggpubr中的非參數(shù)Wilcoxon符號秩和檢驗,并計算配對樣本間的基因TAD層級分數(shù)差異。
通過R包enrichR對GM12878細胞輻射后30 min TH score變化較大的基因進行功能富集分析[15]。
基因組位置信息通過UCSC基因組瀏覽器(http://genome.ucsc.edu)注釋[16]。
為了探究輻射后細胞TAD層級結構變化規(guī)律及其在細胞輻射響應中的作用,本研究選用了前期已發(fā)表的淋巴細胞,成纖維細胞和ATM缺陷的成纖維細胞,經(jīng)5Gy X射線處理后30 min,24 h和5 d 的Hi-C數(shù)據(jù)(Fig.1A)。獲得26個樣本的Hi-C數(shù)據(jù),對各樣本中的TAD層級、TAD邊界層級進行識別并計算了基因的TAD層級嵌套分數(shù)(Fig.1B),從細胞系、ATM及輻射后的時間三個方面,對TAD邊界層級和基因的TAD層級嵌套分數(shù)變化進行分析,比較不同輻射敏感性的細胞,在輻射后不同時間TAD層級結構的變化規(guī)律,探索ATM缺失對輻射后細胞TAD層級結構變化的影響及TAD層級結構變化在細胞輻射響應中的作用(Fig.1C)。
Fig.1 Scheme of analysis (A) 26 Hi-C data obtained from GEO database including irradiated lymphoblasts, fibroblasts and fibroblasts deficient in ATM with 5 Gy X-ray. (B) Identification of hierarchical TAD and TAD boundary and calculation of TH score. (C) Data comparison from three aspects: ① cell line,② ATM and ③ time after radiation
使用OnTAD算法對26個樣本中的多層級TAD進行識別,并定義TAD邊界層級。結果顯示,TAD多層級結構普遍存在于淋巴細胞和成纖維細胞中,以GM12878細胞系1號染色體的18.09 ~ 18.28 Mb區(qū)域為例,該區(qū)域為多層級的TAD嵌套結構,外部為大的1級TAD,內(nèi)部嵌套著多層級的TAD結構,并包含有不同層級的TAD邊界(Fig.2A、2B)。對各樣本不同層級的TAD和TAD邊界數(shù)量進行統(tǒng)計,平均每個樣本識別出了 4 054(±206)個 TAD 結構和3 805(±149)個 TAD 邊界,3層級及以上的TAD和TAD邊界數(shù)量較少(Fig.2B)。對26個樣本中的保守的TAD邊界進行相關性分析并聚類,可以區(qū)分淋巴細胞,成纖維細胞和ATM缺陷的成纖維細胞(Fig.2C),說明TAD邊界層級具有一定細胞特異性。
Fig.2 Identification of the hierarchical TAD and TAD boudary (A) Multilevel TAD and TAD boundary of the subregion on chromosome 1 of GM12878 cell visualized by 40 kb-resolution Hi-C data. (B) Numbers of TAD and TAD boundary in 26 samples. (C) Hierarchical clustering of samples using the similarity of TAD boundary positions. Color bar shows the correlation coefficient between different samples
為了確定輻射對TAD多層級結構的影響,對5Gy X射線照射后30 min和24 h的淋巴細胞(GM12878細胞)和成纖維細胞(BJ細胞)不同層級的TAD邊界與相應對照組進行比較。與未照射細胞相比,輻射后30 min和24 h,GM12878細胞和BJ細胞的各層級TAD邊界均發(fā)生了較大變化,其中發(fā)生變化的1層級和2層級TAD邊界有30% ~ 40%,發(fā)生變化的3層級及以上TAD邊界有40% ~ 50%。說明高層級TAD邊界對輻射更敏感,輻射條件下細胞的低層級的TAD結構更加穩(wěn)定。此外,GM12878細胞與BJ細胞輻射后30 min和24 h的TAD邊界層級變化表現(xiàn)出了不同的模式,GM12878細胞輻射后24 h較輻射后30 min,隨著TAD邊界層級升高,未變化TAD邊界和獲得層級的TAD邊界比例增加,缺失層級的TAD邊界的比例減少,BJ細胞輻射后24 h較輻射后30 min,不同層級的未變化TAD邊界比例均下降,而層級增加的TAD邊界比例變化較小,缺失層級邊界的TAD邊界比例上升(Fig.3A)。GM12878細胞與BJ細胞輻射后變化模式的不同,可能與淋巴細胞和成纖維細胞的輻射敏感性差異相關。為了觀察高層級TAD對輻射更敏感的規(guī)律是否在基因組范圍內(nèi)存在,對GM12878細胞5Gy X射線照射后24 h各染色體1層級TAD邊界和3層級TAD邊界變化情況進行分析,發(fā)現(xiàn)照射后GM12878細胞各染色體的低層級TAD邊界均表現(xiàn)出更高的保守性,說明輻射誘導的TAD邊界層級變化規(guī)律在全基因組范圍內(nèi)存在(Fig.3B)。
Fig.3 Changes of the hierarchical TAD boundary (A) Proportion of the hierarchical TAD boundary changed/unchanged in GM12878 and BJ cells after (30 min and 24 h) exposure to 5 Gy X-ray compared with control. N.S.: P > 0.05;*: P <= 0.05;**: P <= 0.01;***: P <= 0.001;****: P <= 0.0001). (B) Proportion of level 1 and level 3 TAD boundary changed/unchanged in GM12878 after (24 h) exposure to 5 Gy X-ray compared with control
前期研究表明,TAD層級結構與基因表達密切相關[14],為了探究輻射誘導的TAD層級結構變化是否參與細胞輻射響應,對各樣本中18 000多個基因的TAD層級嵌套分數(shù)“TH score”進行計算,并對各樣本中基因的TH score是否存在差異進行了統(tǒng)計學分析。結果顯示,輻射后30 min和24 h,GM12878細胞和BJ細胞的TH score均發(fā)生顯著變化,輻射敏感的淋巴細胞輻射后30 min基因的TH score變化較大,而輻射相對不敏感的成纖維細胞基因的TH score變化較小,說明輻射后TAD層級結構變化與細胞輻射敏感性相關。輻射后5 d,BJ細胞的TH score與對照組無顯著差異,說明BJ細胞完成輻射損傷修復后,基因的TAD層級恢復至初始水平(Fig.4A)。為了驗證細胞輻射后基因的TAD層級嵌套水平變化是否參與細胞的輻射響應,基于TH score變化較大的淋巴細胞輻射后30 min的Hi-C數(shù)據(jù),篩選出TAD嵌套結構變化較大的基因(Fig.4B),進行基因功能富集分析,發(fā)現(xiàn)TH score變化較大的基因富集了與淋巴細胞的功能紊亂及細胞輻射損傷修復相關的多種生物學功能,例如淋巴細胞黏附、B細胞激活、DNA雙鏈斷裂修復和細胞凋亡等,說明輻射誘導的基因TAD嵌套水平改變會影響細胞的生物學功能,并參與細胞的輻射響應(Fig.4C)。
為了評估ATM在輻射誘導的TAD邊界層級變化中的作用,對X射線照射后24 h的BJ細胞與ATM缺陷的BJ細胞各層級TAD邊界變化進行比較,發(fā)現(xiàn)ATM突變后,BJ細胞輻射后24 h的TAD層級結構變化減弱,未變化TAD邊界變化比例顯著增加,說明ATM在輻射誘導TAD邊界層級變化中具有重要作用(Fig.5A)。對ATM抑制和突變的BJ細胞5Gy X射線照射后24 h和對照組的TH score進行比較,發(fā)現(xiàn)正常BJ細胞輻射后5 d,基因的TH score恢復正常(Fig.4A),但ATM缺失的基因TH score并未完全恢復(Fig.5B),說明ATM對輻射后的基因TAD層級嵌套水平的恢復具有重要作用。
Fig.4 Radiation-induced changes of TH score (A) The TH score of lymphoblasts and fibroblasts. Statistical significance between two independent samples was calculated by the wilcoxon test (N.S.: P > 0.05;**: P <= 0.01;***: P <= 0.001;****: P <= 0.0001). (B) TH score heatmap of GM12878 before (control) and after (30 min) exposure to 5 Gy X-ray (gene names are partially displayed). (C) Gene ontology analysis of genes whose TH scores were significantly changed (ΔTH > 1.5, bule: TH score increased, orange: TH score decreased in GM12878 cells after (30 min) exposure to 5Gy X-ray
Fig.5 Changes of the TAD hierarchy in ATM-deficient cells (A) Proportion of hierarchical TAD boundary changed/unchanged in BJ cells and ATM mutant BJ cells after exposure (24 h) to 5 Gy X-ray compared with control. (B) TH scores of ATM-deficient BJ cells. Statistical significance between two independent samples was calculated by the wilcoxon test (N.S.: P > 0.05;**: P <= 0.01;***: P <= 0.001;****: P <= 0.0001)
前期研究表明,TAD層級結構與基因表觀遺傳狀態(tài)及表達活性密切相關,高層級TAD結構具有更活躍的表觀遺傳狀態(tài),隨著TAD層級增加,GM12878細胞的基因表達密度明顯上升,且TAD內(nèi)部嵌套的基因表達活性比外層更加活躍[12]。輻射后淋巴細胞和成纖維細胞的TAD邊界層級及基因TAD嵌套水平發(fā)生明顯改變,輻射后30 min淋巴細胞TH score變化較大的基因主要參與了細胞生物學功能變化及輻射響應,輻射誘導的淋巴細胞TAD層級結構變化可能通過改變基因的TAD嵌套水平調(diào)控基因表達參與細胞輻射響應。輻射誘導TAD層級結構變化,及其參與細胞輻射響應機制可總結為以下模型:首先細胞受到射線照射后,細胞的TAD層級結構發(fā)生顯著改變,基因的TAD嵌套水平隨之變化(Fig.6A);導致基因局部的染色質(zhì)相互作用改變,調(diào)控基因表達(Fig.6B);基因表達變化一方面導致細胞的生物學功能紊亂,另一方面通過DNA損傷修復、細胞周期調(diào)控等生物學過程參與細胞的輻射響應(Fig.6C)。
Fig.6 Models of radiation-induced TAD hierarchy change regulating cellular responses to radiation (A) Radiation-induced TAD hierarchy change. (B) Regulation of gene expression. (C) Radiation-induced cell dysfunction and cellular responses to radiation
基因組三維結構是DNA復制、基因表達調(diào)控、變異和進化的基礎,闡明基因組功能是理解遺傳物質(zhì)如何決定細胞命運的關鍵。TAD層級結構分析工具近年才開發(fā),目前對于輻射誘導TAD層級變化的機制及其在細胞輻射響應中的作用尚未有深刻探討。本文使用OnTAD算法分析了成纖維細胞、淋巴細胞和ATM缺陷的成纖維細胞5Gy X射線照射后30 min、24 h和5 d的TAD多層級結構,總結了不同細胞系、輻射后不同時間、不同層級TAD及邊界的變化規(guī)律,并觀察了ATM缺失對TAD層級變化的影響,發(fā)現(xiàn)TAD多層級結構變化是細胞輻射響應的潛在機制,并提出了輻射誘導的TAD層級結構變化參與細胞輻射響應的模型,為理解輻射條件下,細胞如何通過TAD層級結構變化維持基因組三維結構穩(wěn)定性提供了基礎,同時從TAD層級變化角度解釋了ATM誘導細胞輻射響應的潛在機制。
前期研究表明,輻射后TAD邊界通過富集CTCF和黏連蛋白得到加強,以維持基因組三維結構穩(wěn)定[5, 6]。TAD可以調(diào)控DNA損傷修復關鍵分子在輻射誘導的DNA斷裂位點的募集和擴散,一方面促進TAD內(nèi)部DNA損傷位點的快速修復,另一方面限制γH2AX在DNA損傷位點局部擴散,以免影響其他未受損位點基因的表達[5, 6]。本文從一個新的角度——TAD多層級結構出發(fā),分析了輻射條件下TAD多層級結構的變化規(guī)律,發(fā)現(xiàn)輻射對高層級TAD結構影響更大,低層級TAD相對保守。輻射誘導的TAD層級結構變化可能通過調(diào)節(jié)細胞輻射響應相關基因的表達,參與DNA損傷修復、細胞周期調(diào)控、凋亡等生物學過程,參與輻射后細胞的命運決定。
本研究從TAD邊界層級和基因的TAD嵌套水平角度分析了輻射對TAD多層級結構的影響。5Gy X射線照射后5 d,成纖維細胞的TAD邊界層級未完全恢復,而基因的TAD層級結構已經(jīng)恢復至對照水平,這可能是染色質(zhì)空間結構的高度動態(tài)變化導致的。輻射誘導的染色質(zhì)的拓撲性質(zhì)改變,伴隨著TAD邊界的不斷變化,這種變化既包括TAD層級結構改變導致的邊界層級丟失或獲得,也包含TAD邊界位置的動態(tài)變化。成纖維細胞基因的TAD層級在輻射5 d后恢復至對照水平,說明盡管輻射后TAD層級邊界發(fā)生了復雜的動態(tài)變化,但在TAD多層級結構的總體調(diào)控上,仍能保證基因的TAD層級恢復正常,保證細胞基因表達的穩(wěn)定性。此外,ATM缺失的成纖維細胞輻射后5 d,其基因嵌套水平與對照組仍存在明顯差異,說明ATM作為輻射誘導的DNA損傷修復的關鍵激酶,不僅可以參與TAD內(nèi)DNA損傷修復中心的形成,還能通過調(diào)控輻射誘導的TAD多層級結構變化和恢復,參與細胞輻射響應。輻射會導致TAD層級結構發(fā)生改變,伴隨基因TAD的嵌套水平顯著變化,5Gy X射線照射后30 min,GM12878細胞發(fā)生TAD嵌套水平顯著變化的基因與細胞輻射損傷修復功能密切相關。我們的前期研究表明,TAD層級結構與基因表達水平密切相關[14],據(jù)此我們提出了輻射誘導TAD層級結構變化,及其參與細胞輻射響應機制的模型:輻射誘導TAD層級結構變化介導基因表達改變,使細胞的生物學功能紊亂,并通過DNA損傷修復、細胞周期調(diào)控等生物學過程參與細胞的輻射響應。然而,Sanders等人提供的Hi-C數(shù)據(jù)缺少與之匹配的轉錄組測序數(shù)據(jù),輻射誘導TAD層級結構變化與細胞輻射響應基因表達之間的相關性還需進一步驗證。
TAD層級結構可能是細胞輻射敏感性的決定因素之一。盡管TAD結構在不同細胞和物種中高度保守,但不同細胞系的TAD層級結構仍存在一定異質(zhì)性,例如本研究中的淋巴細胞和成纖維細胞,成纖維細胞中低層級TAD比例相較于淋巴細胞細胞高,而低層級的TAD結構可能使成纖維細胞的基因組三維結構更加穩(wěn)定,輻射造成其TAD層級結構發(fā)生變化需要的能量更大,使其TAD多層級結構在輻射條件下更加保守。由于Hi-C數(shù)據(jù)的測序結果來自于數(shù)百萬個細胞,所以分析得到的TAD多層級結構通常是許多細胞TAD結構疊加的結果[17]。細胞的TAD層級結構具有一定的異質(zhì)性,即同一細胞系中存在不同TAD層級分布模式,基因組上的同一位置,部分細胞可能表現(xiàn)為高層級TAD結構,部分細胞表現(xiàn)為低層級TAD結構,這些細胞在輻射過程中受到的輻射損傷及響應機制可能存在差異。隨著單細胞測序技術逐漸成熟,目前已經(jīng)可以獲取單個細胞的染色質(zhì)高級結構,基因表達和表觀修飾的數(shù)據(jù),單細胞數(shù)據(jù)分析算法的開發(fā)也為細胞輻射響應異質(zhì)性機制研究提供了條件[18-21]。隨著單細胞測序技術的成熟和相關算法的進一步開發(fā),染色質(zhì)高級結構的異質(zhì)性及其對細胞輻射敏感性的影響將得到更深刻的理解。