王玲,李金環(huán),黃海燕,吳強
研究報告
串聯(lián)反向CTCF位點的系列刪除揭示增強子調(diào)控基因簇表達的平衡
王玲,李金環(huán),黃海燕,吳強
上海交通大學(xué)系統(tǒng)生物醫(yī)學(xué)研究院比較生物醫(yī)學(xué)研究中心,系統(tǒng)生物醫(yī)學(xué)教育部重點實驗室,上海 200240
三維基因組染色質(zhì)架構(gòu)蛋白CTCF (CCCTC-binding factor)能夠介導(dǎo)增強子與基因啟動子的遠距離染色質(zhì)相互作用,也可以結(jié)合調(diào)控區(qū)域的絕緣子發(fā)揮增強子絕緣功能,對發(fā)育中的基因表達調(diào)控具有重要作用。同源框基因家族(Homeobox gene family,)編碼一類控制動物發(fā)育的關(guān)鍵轉(zhuǎn)錄因子,在發(fā)育中主要沿胚胎首尾軸(head-to-tail axis)呈時空線性表達。在哺乳動物中,基因分為、和四個基因簇,在中樞神經(jīng)系統(tǒng)、骨骼和四肢發(fā)育中發(fā)揮重要功能?;虼刂饕{(diào)控四肢發(fā)育,受位于其兩側(cè)調(diào)控域內(nèi)的增強子調(diào)節(jié),沿肢體近遠軸(proximal-distal axis)呈時空線性表達。在人類基因組中,基因簇及其兩側(cè)的調(diào)控區(qū)域分布有串聯(lián)排列的CTCF結(jié)合位點(簡稱CTCF位點),參與9個基因的表達調(diào)控。本研究以基因簇為模式基因,探究CTCF對發(fā)育基因(developmental genes)轉(zhuǎn)錄調(diào)控的影響。利用CRISPR DNA片段編輯技術(shù)在人HEK293T細胞中獲得一系列的串聯(lián)反向CTCF位點刪除的單細胞克隆株。RNA-seq實驗揭示CTCF位點刪除后基因表達下降。定量高分辨率染色體構(gòu)象捕獲實驗顯示,與上游增強子簇的遠距離染色質(zhì)相互作用增強,與下游增強子簇的遠距離染色質(zhì)相互作用減弱。綜上所述,串聯(lián)反向的CTCF位點通過其絕緣子功能維持上下游增強子簇對基因簇表達調(diào)控的平衡,為探究動物發(fā)育過程中基因表達的精準調(diào)控機制提供參考。
基因簇;CTCF位點;調(diào)控平衡;增強子;絕緣子
染色質(zhì)架構(gòu)蛋白CTCF(CCCTC-binding factor)是一類結(jié)合DNA的鋅指蛋白,在哺乳動物中可與基因組上調(diào)控區(qū)域內(nèi)大量的絕緣子結(jié)合,對發(fā)育基因的精準調(diào)控起到關(guān)鍵作用[1~6]。CTCF最初在雞中被發(fā)現(xiàn)是一種轉(zhuǎn)錄抑制因子或共抑制因子[7],CTCF結(jié)合位點(CTCF-binding site,CBS)序列在脊椎動物中高度保守,超過30多萬的CBS廣泛分布在整個基因組中[8]。CTCF與cohesin復(fù)合物通過環(huán)擠出模型(loop extrusion model)共同介導(dǎo)遠距離染色質(zhì)相互作用,參與基因的調(diào)控[3,9,10]。CBS序列的方向性直接影響染色質(zhì)遠距離互作,分別被正向和反向CBS元件錨定的增強子和啟動子在CTCF/cohesin介導(dǎo)下形成遠距離染色質(zhì)環(huán)[2,3,5,11~14]。成對的反向–正向CBS (背靠背)通常分布在拓撲相關(guān)結(jié)構(gòu)域(topological- associated domain, TAD)邊界,發(fā)揮絕緣子的作用,阻止增強子跨區(qū)域異位激活基因表達[3]。CTCF除了能與cohesin一起介導(dǎo)染色質(zhì)環(huán),還能與其他的非編碼調(diào)控元件及架構(gòu)蛋白(如YY1)共同搭建三維基因組結(jié)構(gòu)[1,15,16]。CTCF參與調(diào)控的染色質(zhì)三維空間結(jié)構(gòu)是生物體發(fā)揮正常生理功能的基礎(chǔ),包括神經(jīng)系統(tǒng)中原鈣粘蛋白(protocadherin,)基因簇啟動子的選擇[4,13,14,17]、尿苷二磷酸葡萄糖醛酸轉(zhuǎn)移酶1 (UDP-glucuronosyltransferase 1,)的表達[12]、免疫球蛋白(Immunoglobulin,)和T細胞受體(T cell receptor,)的V(D)J重組[18~20]、四肢發(fā)育過程中的同源框基因家族(homeobox gene family,)控制[21~23]以及生物學(xué)的其他方面[1,24]。
脊椎動物和果蠅基因簇內(nèi)的CTCF結(jié)合位點經(jīng)過數(shù)億年進化仍然存在,這暗示了在兩側(cè)對稱動物進化歷程中CTCF參與基因表達調(diào)控的古老起源[25]?;虼鼐幋a的轉(zhuǎn)錄因子調(diào)控著細胞分化的多個方面,影響生物體四肢發(fā)育、器官形成等[26]。在哺乳動物中,基因分布在四個簇中,分別命名為、、和,根據(jù)序列同源性及在簇中的位置,基因分為13組(~) (圖1A),軀干和四肢的不同區(qū)域表達基因的不同組合[27]。在發(fā)育的最初階段,基因簇不表達,在發(fā)育過程中主要沿胚胎首尾軸(head-to-tail axis)呈時空線性表達[28]。
基因簇包括、、、~,整體位于兩個拓撲結(jié)構(gòu)域邊界,受上游增強子簇(upstream enhancer cluster)和下游增強子簇(downstream enhancer cluster)調(diào)控(圖1,A和B)。在小鼠胚胎肢芽(limb bud)發(fā)育早期,位于基因簇3′端粒側(cè)TAD(telomeric domain, T-DOM)處于激活狀態(tài),控制~在四肢的近端轉(zhuǎn)錄[29];隨后,在胚胎肢芽(limb bud)遠端細胞中,位于5′中心粒側(cè)TAD (centromeric domain, C-DOM)處于激活狀態(tài),負責(zé)~在手指細胞中的表達[30,31]。在小鼠胚胎肢芽中,上游增強子簇中的5個增強子(Island1~5)包含許多保守的非編碼調(diào)控元件,同時富集有H3K4me1、H3K27ac(活性增強子標記),與~有很強的互作[31]。刪除部分增強子只會影響它們與~基因的互作,但對~基因的表達影響不大;當完全刪除上游增強子簇,~基因表達才會完全消失。這些研究表明這些Island之間可能存在冗余性和互補性[31]。在小鼠生殖器結(jié)節(jié)(genital tubercle,GT)中,上游增強子簇中的GT1和GT2與啟動子也有遠距離DNA相互作用,但GT2僅在生殖器中表現(xiàn)出較強的活性,在肢端細胞中不能顯著激活基因轉(zhuǎn)錄[32]。在小鼠肢芽近端細胞中,下游增強子簇中的CS38-41 (conserved sequence element 38-41)參與調(diào)控~的表達[21]。這些上下游增強子簇通過轉(zhuǎn)錄因子或架構(gòu)蛋白介導(dǎo)的染色質(zhì)環(huán)與基因啟動子實現(xiàn)遠程互作,從而完成特定的基因調(diào)控[33~35]。然而,目前對于基因簇調(diào)控機制的研究主要借助于在小鼠中對其調(diào)控區(qū)域或者基因進行大片段刪除或反轉(zhuǎn)[21,22,31,32,36],對于人細胞中基因簇調(diào)控機制的研究較少。
本研究以人基因簇為模式基因,探索CTCF對發(fā)育基因(developmental genes)轉(zhuǎn)錄調(diào)控的影響。利用CRISPR DNA片段編輯系統(tǒng)[37~40]在人HEK293T細胞中獲得一系列的串聯(lián)反向CBS刪除的單細胞克隆株。進行RNA-seq實驗檢測CBS刪除后基因表達水平的變化,最后通過定量高分辨率染色體構(gòu)象捕獲(quantitative high resolution ch-romosome conformation capture copy, QHR-4C)[13]進一步觀測CBS刪除對基因簇三維基因組結(jié)構(gòu)的影響,發(fā)現(xiàn)成串反向排列的CTCF位點具有平衡上下游增強子簇對基因簇轉(zhuǎn)錄調(diào)控的作用,為揭示哺乳動物基因轉(zhuǎn)錄的復(fù)雜調(diào)控提供參考。
人胚胎腎細胞系HEK293T從中國科學(xué)院細胞庫購買;胰酶、青霉素/鏈霉素雙抗購自美國Gibco公司;DMEM培養(yǎng)基購自美國HyClone公司;胎牛血清購自南美ExCell公司;Lipofectamine 3000購自美國Invitrogen公司;pcDNA3.1-Cas9-WT質(zhì)粒來源于北京大學(xué)席建忠教授;Ⅰ限制性內(nèi)切酶、T4 DNA連接酶、Ⅱ限制性核酸內(nèi)切酶、RNA文庫制備試劑盒、Q5 Hot Start HiFi PCR Master Mix均從美國NEB公司采購;pGL3-U6-sgRNA-Puromycin- BsaⅠ質(zhì)粒由上??萍即髮W(xué)黃行許教授贈予;質(zhì)粒小量提取試劑盒、DNA凝膠回收試劑盒均從美國AXYGEN公司采購;MinElute Gel Extraction kit從德國QIAGEN公司采購;Green Taq Mix、dNTPs、高保真Phanta DNA聚合酶購自南京諾唯贊生物科技有限公司;pClone007 Versatile Simple Vector購自北京擎科新業(yè)生物技術(shù)有限公司;sgRNA、測序引物由上海生物工程(上海)股份有限公司合成;Triton X-100、10%SDS、DNA提取液、NP40等從美國SIGMA公司采購;三氯甲烷、硼酸和乙醇購自上海滬試實驗室器材股份有限公司;異丙醇和氯化鈉購自上海凌峰化學(xué)試劑有限公司;鏈霉親和素磁珠從美國Invitrogen公司采購;PCR文庫純化試劑盒從瑞士Roche公司采購;甲醛溶液、RNA酶A、糖原等均從美國Thermo公司采購;TRIzol Reagent從美國Ambion公司采購;AMPure XP Beads從美國BeckmanCoulter公司采購;CTCF抗體從英國Abcam公司采購。
圖1 CTCF位點在Hox基因簇及其調(diào)控區(qū)域內(nèi)的分布
A:果蠅及哺乳動物基因家族的基因組結(jié)構(gòu)。果蠅基因簇分為觸足復(fù)合群(ANT-C)和雙胸復(fù)合群(BX-C),其中ANT-C包含、、、和基因,BX-C包含、和基因。哺乳動物具有4個基因簇:、、和,共包含39個基因,其中基因簇包括、、、~。果蠅及哺乳動物相同顏色的基因為直系同源基因(orthologues),它們起源于同一祖先基因。B:人胚胎腎細胞系HEK293T中的CTCF蛋白、架構(gòu)蛋白YY1、增強子標記H3K4me1和H3K27ac、啟動子標記H3K4me3、轉(zhuǎn)錄活性標記PolⅡ和p300在人基因簇及其調(diào)控區(qū)域內(nèi)的分布。紅色虛線框指示增強子Island2、Island5、GT2、CS38-41和基因簇所在區(qū)域。哺乳動物的基因簇位于3′端粒側(cè)TAD (T-DOM)和5′中心粒側(cè)TAD (C-DOM)交界處,并受到上下游增強子簇(upstream enhancer cluster和downstream enhancer cluster)的調(diào)控。C:人類基因簇區(qū)域CTCF位點的分布。人腎臟和胚胎腎細胞系HEK293T的CTCF ChIP-seq結(jié)合峰分布圖:基因簇C-DOM和T-DOM交界區(qū)域均具有串聯(lián)排列的CTCF位點。紅色虛線框依次指示CBS a、b、c和e所在區(qū)域。D:小鼠基因簇區(qū)域CTCF位點的分布。小鼠腎臟和第12.5天胚胎肢芽CTCF ChIP-seq數(shù)據(jù)顯示小鼠基因簇中心粒側(cè)對應(yīng)的位置具有串聯(lián)反向排列的4個CTCF位點。圖C和D中箭頭代表CTCF位點,其中紅色箭頭代表正向CTCF位點,藍色箭頭代表反向CTCF位點。
HEK293T細胞的培養(yǎng)基為89% DMEM完全培養(yǎng)液、10%胎牛血清和1%青霉素/鏈霉素雙抗的混合液,在37℃、5% CO2的恒溫培養(yǎng)箱中培養(yǎng)。
收集2×107細胞后,首先用1%甲醛交聯(lián)細胞,再加入終濃度為0.125 mol/L的甘氨酸溶液終止反應(yīng),然后用預(yù)冷的ChIP緩沖液裂解細胞兩次(裂解條件均為4℃,緩慢旋轉(zhuǎn)10 min),離心后再用預(yù)冷的ChIP緩沖液重懸細胞,冰上孵育10 min。用非接觸式超聲儀進行超聲,凝膠電泳鑒定超聲后DNA片段長度為100~10,000 bp。將細胞懸液離心后的上清轉(zhuǎn)移至新的離心管中并加入50 μL的protein A/G磁珠孵育2 h。用磁力架棄去磁珠,將上清轉(zhuǎn)移至新的離心管中加入4 μg的CTCF抗體,4℃緩慢旋轉(zhuǎn)孵育過夜。第二天加入50 μL的protein A/G磁珠,4℃緩慢旋轉(zhuǎn)孵育3 h。然后用ChIP緩沖液、高鹽緩沖液、無鹽緩沖液、LiCl緩沖液清洗磁珠(每次4℃緩慢旋轉(zhuǎn)孵育10 min),最后用洗脫緩沖液洗脫DNA。含有DNA的溶液經(jīng)過RNA酶A (37℃震蕩孵育2 h)、蛋白酶K (55℃靜置孵育2 h)及酚氯仿試劑純化后,DNA沉淀用無核酸酶的水溶解,最后用諾唯贊公司的ChIP-seq試劑盒ND607-02構(gòu)建DNA文庫。文庫通過蘇州金唯智生物科技有限公司的Illumina HiSeq平臺進行測序,根據(jù)index序列(P7-index序列見表1)對數(shù)據(jù)進行拆分,通過Bowtie2比對到GRCh37/hg19基因組,用BamCoverage進行歸一化處理,標準化到RPKM (reads per kilobase per million mapped reads),共做兩個重復(fù),每個樣品文庫測序約2000萬條序列。
續(xù)表
sgRNA引物中帶下劃線部分為構(gòu)建質(zhì)粒所需的粘性末端。P7-index中粗體帶下劃線部分為index。
人胚胎腎細胞系HEK293T的H3K4me1和H3K27ac ChIP-seq數(shù)據(jù)來源于ENCODE數(shù)據(jù)庫,數(shù)據(jù)編號分別為ENCSR000FCG和ENCSR000FCH;YY1、H3K4me3、PolⅡ、p300來源于GEO,數(shù)據(jù)編號分別為GSM3636215、GSM945288、GSM935534、GSM1239071;人腎臟CTCF ChIP-seq數(shù)據(jù)的GEO編號為GSM1006886;小鼠腎臟及第12.5天胚胎肢芽CTCF ChIP-seq數(shù)據(jù)的GEO編號分別為GSE91529、GSM4665698;將數(shù)據(jù)分別比對到GRCh37/hg19及GRCm38/mm10基因組進行分析。
按照表1合成單鏈sgRNA (共10條,分別合成雙鏈sgRNA a1、sgRNA b1、sgRNA c1、sgRNA e1和sgRNA e2),按照如下體系(總體積為20 μL,)進行退火步驟:2 μL sgRNA-F,2 μL sgRNA-R,2 μL 10 × NEB Buffer 2,14 μL ddH2O;退火條件:95℃預(yù)變性5 min,緩慢降溫(從第二個循環(huán)開始,每個循環(huán)20 s、降溫0.2℃,共351個循環(huán))。環(huán)狀pGL3- U6-sgRNA-Puromycin-BsaⅠ質(zhì)粒經(jīng)過Ⅰ限制性核酸內(nèi)切酶處理后,得到線性的pGL3-U6-sgRNA- Puromycin載體。將退火后的雙鏈sgRNA引物與線性化的pGL3-U6-sgRNA-Puromycin載體在室溫進行連接,經(jīng)感受態(tài)細胞轉(zhuǎn)化培養(yǎng)后,挑取單菌落進行培養(yǎng)(每種sgRNA至少挑取3個單菌落),用質(zhì)粒小量提取試劑盒純化質(zhì)粒并測序。
待12孔板內(nèi)的HEK293T細胞匯合度達到70%~ 90%左右時進行轉(zhuǎn)染,一個離心管中加入Lipofec-tamine 3000與MEM混合均勻室溫靜置5 min,另一個管中加入Cas9質(zhì)粒、兩種sgRNA質(zhì)粒、p3000試劑和MEM培養(yǎng)基混合均勻后室溫靜置5 min (此步驟中sgRNA組合:sgRNA a1/sgRNA e2或sgRNA b1/sgRNA e2或sgRNA c1/sgRNA e2或sgRNA e1/sgRNA e2),然后將Lipofectamine 3000加入其中,混合均勻后室溫孵育約15 min,滴入培養(yǎng)細胞中。
待轉(zhuǎn)染時間達到48 h后,換用含有2 μg/mL嘌呤霉素的培養(yǎng)基對轉(zhuǎn)染細胞進行藥物篩選。藥物篩選大約4天后,更換為DMEM完全培養(yǎng)基繼續(xù)培養(yǎng)2天,然后用胰酶消化收集適量細胞至PCR管中,加入10 μL堿裂解液,混勻置于PCR儀中,98℃ 30 min使細胞裂解,再加入10 μL中和液,獲得細胞基因組。在sgRNA上下游位置設(shè)計PCR引物,鑒定轉(zhuǎn)染后的細胞中是否含有目的片段刪除的細胞,若存在,則對12孔板中剩余的轉(zhuǎn)染細胞進行計數(shù),用培養(yǎng)基稀釋至濃度約為1個細胞每100 μL培養(yǎng)液,轉(zhuǎn)移至96孔板中培養(yǎng)。待細胞生長一周左右,顯微鏡下查看單一細胞團并做好標記。sgRNA和PCR引物序列見表1。
將標記的單細胞克隆株(共1056個)用胰酶消化,轉(zhuǎn)移適量細胞到含有10 μL堿裂解液的PCR小管中進行裂解反應(yīng)獲取細胞基因組。兩個sgRNA對大片段DNA進行刪除時,會造成兩個切口,需要通過特異性引物鑒定排除片段反轉(zhuǎn)的情況[37,41]。通過PCR反應(yīng)(PCR引物序列見表1)及DNA瓊脂糖凝膠電泳實驗挑選出目的片段刪除的純合子單細胞克隆株,將細胞目的片段刪除型的擴增產(chǎn)物通過凝膠電泳分離,切膠回收并送測。若測序結(jié)果為雙峰,則需要進行TA克隆測序鑒定單細胞克隆株的基因型。
按照TA克隆產(chǎn)品推薦用量將PCR產(chǎn)物與pClone007 Versatile Simple Vector混合均勻,室溫孵育約10 min;在離心管中將連接產(chǎn)物與50 μL感受態(tài)細胞混合均勻,冰上靜置30 min后,進行42℃熱激45 s,然后迅速轉(zhuǎn)移至冰上,2 min后加入500 μL的LB無抗培養(yǎng)基,然后將離心管放在37℃搖床上培養(yǎng)1 h。離心后去除450 μL上清,重懸細胞后均勻涂布在含有氨芐抗性的LB固體培養(yǎng)基上,37℃恒溫箱中培養(yǎng)約16 h,次日挑取8~10個單菌落測序,然后將桑格測序結(jié)果與目的片段序列比對,確定單細胞克隆株基因型。最終獲得CBS e刪除、CBS c-e刪除、CBS b-e刪除和CBS a-e刪除的單細胞克隆株各兩株。
待12孔板中處于對數(shù)生長期的HEK293T細胞、單細胞克隆株匯合度達到90%時,先用1 × PBS清洗2遍,然后加入500 μL/孔TRIzol溶液處理15 min,然后轉(zhuǎn)移至無核酸酶的離心管中,用三氯甲烷、異丙醇、乙醇提取純化總RNA。根據(jù)試劑說明書進行如下操作:使用Poly(A) mRNA Magnetic Isolation Module試劑盒提取mRNA,利用磁珠對mRNA片段進行分離與片段化;通過PCR反應(yīng)先進行cDNA第一鏈合成,再進行cDNA第二鏈合成反應(yīng);雙鏈cDNA連接Adaptor之后,用AMPure XP Beads和新鮮配制的80%的乙醇對DNA進行純化,進行文庫擴增反應(yīng);擴增后產(chǎn)物用AMPure XP Beads和新鮮配制的80%的乙醇進行純化,最后用無核酸酶的水洗脫DNA文庫。用Qubit3 Fluorometer測量終產(chǎn)物濃度后送至蘇州金唯智生物科技有限公司的Illumina HiSeq平臺進行測序,根據(jù)特異性index序列(表1)拆分數(shù)據(jù),用STAR、cufflinks等軟件分析數(shù)據(jù)[42]。本研究共有30個RNA-seq樣品,每個樣品文庫測序約1000萬條序列。
用10 cm培養(yǎng)皿擴增培養(yǎng)HEK293T細胞、單細胞克隆株,待細胞匯合度達到80%~90%且生長良好時,用胰酶消化離心收集細胞;用1%甲醛交聯(lián)細胞,再加入終濃度為0.125 mol/L的甘氨酸溶液終止反應(yīng);用預(yù)冷的1 × PBS重復(fù)清洗細胞,然后配制4C裂解液(1 × inhibitor、pH 7.5 50 mmol/L Tris-HCl、150 mmol/L NaCl、5 mmol/L EDTA、0.5% NP-40和1% Triton X-100)重復(fù)裂解細胞;通過Triton X-100、Ⅱ限制性內(nèi)切酶處理使DNA片段化,用T4 DNA連接酶捕捉相互鄰近的DNA片段;純化連接后的DNA,然后進行超聲處理(不同長度的DNA片段經(jīng)瓊脂糖凝膠電泳鑒定呈彌散狀分布且主要片段長度小于1000 bp)、PCR線性擴增反應(yīng)及接頭連接反應(yīng),最后進行DNA文庫擴增。文庫送至蘇州金唯智生物科技有限公司的Illumina HiSeq平臺進行測序,根據(jù)index(序列見表1)對測序結(jié)果進行拆分,通過Bowtie2、Samtools、r3C-seq等方法處理數(shù)據(jù)[13]。本研究每個實驗三個重復(fù),共有78個4C樣品,每個樣品文庫測序約800萬條序列。
本研究的相關(guān)結(jié)果數(shù)據(jù)已收錄在國家基因庫生命大數(shù)據(jù)平臺(CNGBdb)[43]的國家基因庫序列歸檔系統(tǒng)(CNSA)[44],項目編號:CNP0001773。
基因簇最初因引起黑腹果蠅翅膀數(shù)目改變而被發(fā)現(xiàn),在兩側(cè)對稱動物中高度保守[45]。果蠅基因組中含有一個基因簇,由8個基因組成,分為觸足復(fù)合群(ANT-C)和雙胸復(fù)合群(BX-C),其中ANT-C包含、、、和基因,BX-C包含、和基因(圖1A)。而哺乳動物基因組具有四個基因簇:、、和,共包括39個基因[27](圖1A),這可能是由進化過程中的兩次DNA片段復(fù)制過程產(chǎn)生[46,47]。本研究以人HEK293T細胞為模型,通過分析ChIP-seq數(shù)據(jù)發(fā)現(xiàn)位于C-DOM和T-DOM邊界的基因簇串聯(lián)排列著多個CTCF位點,提示CTCF可能對的轉(zhuǎn)錄調(diào)控發(fā)揮重要作用(圖1B)。
利用ChIP-seq數(shù)據(jù)進一步分析了與轉(zhuǎn)錄調(diào)控密切相關(guān)的轉(zhuǎn)錄因子和各組蛋白修飾在基因簇及其兩側(cè)調(diào)控區(qū)域內(nèi)富集的情況,包括CTCF蛋白、架構(gòu)蛋白YY1、增強子標記H3K4me1、H3K27ac,啟動子標記H3K4me3,轉(zhuǎn)錄活性標記PolⅡ、p300(圖1B):基因簇所在的區(qū)域有大量的CTCF蛋白、YY1蛋白富集以及H3K27ac、H3K4me3組蛋白修飾,是一個轉(zhuǎn)錄活躍區(qū)域;Island2、Island5處有CTCF蛋白結(jié)合峰,但是沒有相應(yīng)的組蛋白修飾,也沒有轉(zhuǎn)錄活性標記(PolⅡ和p300),提示Island2、Island5在HEK293T細胞中可能沒有增強子活性。GT2處沒有CTCF蛋白結(jié)合,有YY1的結(jié)合峰、H3K4me1和H3K27ac等組蛋白修飾(圖1B),說明在HEK293T中增強子GT2可能不完全依賴CTCF激活基因轉(zhuǎn)錄;CS38-41處有CTCF、YY1結(jié)合以及H3K27ac組蛋白修飾,同時富集PolⅡ和p300,因此在HEK293T細胞中具有較強的增強子活性。
為了分析基因簇處CTCF分布的保守性,本研究比較了人腎臟和人胚胎腎細胞系HEK293T中CTCF的ChIP-seq結(jié)合峰分布,發(fā)現(xiàn)基因簇C-DOM和T-DOM交界區(qū)域均分布著成簇排列的CBS,靠近C-DOM處具有5個串聯(lián)排列的反向CBS,分別記為CBS a、b、c、d和e(圖1C)。此外,分析小鼠腎臟及第12.5天胚胎肢芽CTCF的ChIP-seq數(shù)據(jù)發(fā)現(xiàn),小鼠基因簇中心粒側(cè)對應(yīng)的位置串聯(lián)排列著類似的CBS簇(圖1D)。綜上所述,C-DOM和T-DOM邊界處串聯(lián)排列的反向CBS簇在哺乳動物中高度保守,CTCF可能通過結(jié)合該CBS簇參與指導(dǎo)兩側(cè)調(diào)控區(qū)域內(nèi)的增強子對基因簇的轉(zhuǎn)錄表達調(diào)控。
為了研究反向串聯(lián)排列的CBS a、b、c、d和e對人基因簇調(diào)控的作用,首先用CRISPR/ Cas9編輯技術(shù)對CBS e進行刪除。我們針對CBS e設(shè)計一對sgRNA (sgRNA e1和sgRNA e2),Cas9核酸酶在sgRNA介導(dǎo)下特異性識別CBS e兩側(cè)靶向序列后進行切割,經(jīng)過修復(fù)后能夠獲得CBS e刪除的編輯細胞(圖2A)。利用PCR篩選單細胞克隆株(圖2B),對獲得的單細胞克隆株進行TA克隆并測序確定其基因型(圖2C)。獲得的e#113存在兩種不同的染色體基因型,Allele 1是853 bp片段刪除的基因型,其切口連接處有小片段DNA刪除,Allele 2是Cas9蛋白在PAM位點上游第3位切割后精確DNA修復(fù)產(chǎn)生的831 bp片段刪除的基因型[41,48,49];e#126也存在兩種不同的染色體基因型,其中一種是Cas9蛋白精準切割在PAM位點上游第3位后修復(fù),另一種可能是Cas9蛋白切割在PAM位點上游第3位和第4位[48]:基因型鑒定及測序結(jié)果均證明e#113和e#126細胞中CBS e已被刪除(圖2C)。
圖2 CBS e刪除改變增強子與啟動子間的遠程互作從而影響HOXD基因簇的基因表達
A:利用CRISPR DNA片段編輯技術(shù)獲得CBS e刪除的單細胞克隆株(e#113和e#126)的示意圖。針對CBS e設(shè)計一對sgRNA(sgRNA e1和sgRNA e2),Cas9核酸酶在sgRNA e1和sgRNA e2的介導(dǎo)下特異性識別CBS e兩側(cè)靶向序列后進行切割,形成的兩個切口被修復(fù)后連接在一起獲得CBS e刪除的編輯細胞。B:采用特異性引物PCR后進行凝膠電泳實驗鑒定單細胞克隆株。引物對e1F/e2R在野生型(WT)細胞中擴增出1560 bp的片段,在e#113和e#126細胞株中擴增出CBS e刪除后的729 bp片段(紅色虛線框指示目的條帶)。C:TA克隆并進行桑格測序確定單細胞克隆株的基因型。引物對e1F/e2R在e#113和e#126細胞株中擴增的產(chǎn)物經(jīng)TA克隆后的測序結(jié)果圖。D:RNA-seq數(shù)據(jù)分析比較WT細胞、e#113和e#126細胞株中基因簇表達水平。*:<0.05;**:<0.01;FPKM:fragments per kilobase of transcript per million mapped reads。E:在染色質(zhì)構(gòu)象捕獲(QHR-4C)實驗中,以增強子Island5為觀測點(viewpoint,VP),分析e#113和e#126細胞株中Island5與基因簇啟動子及調(diào)控元件Island2、GT2和CS38-41的遠程互作。將e#113和e#126細胞株的數(shù)據(jù)分別與WT進行l(wèi)og2處理,紅色實線框內(nèi)為Island5與基因簇啟動子之間的染色質(zhì)相互作用,黑色虛線框依次指示調(diào)控元件Island2、GT2和CS38-41。F:以增強子GT2為VP,分析CBS e刪除后GT2與基因簇啟動子的遠程互作。紅色實線框內(nèi)為GT2與基因簇啟動子間的染色質(zhì)相互作用放大圖,黑色虛線框依次指示調(diào)控元件Island2、Island5和CS38-41。G:以啟動子為VP,分析e#113和e#126細胞株中調(diào)控元件Island2、Island5、GT2、CS38-41與啟動子之間的染色質(zhì)相互作用。黑色虛線框指示Island2,紅色實線框內(nèi)分別為Island5、GT2和CS38-41與啟動子之間的染色質(zhì)相互作用放大圖。
為了研究單個CBS e刪除是否會影響基因轉(zhuǎn)錄,對獲得的單細胞克隆株進行RNA-seq實驗。在HEK293T細胞中,~以及表達量較高;CBS e刪除后及的表達水平降低最顯著(圖2D)。為了探究CBS e刪除對基因表達影響的機制,對獲得的e#113和e#126單細胞克隆株進行QHR-4C實驗,分別以Island5、GT2及為觀測點,分析CBS e刪除后細胞內(nèi)基因簇染色質(zhì)高級結(jié)構(gòu)變化。在WT細胞中,增強子Island5、GT2與基因簇之間存在顯著的DNA相互作用(圖2,E和F),啟動子主要與下游增強子簇中的CS38-41有遠距離DNA相互作用(圖2G)。刪除CBS e后~啟動子與Island5之間相互作用有顯著增加(圖2E)。除了與,其余基因啟動子與GT2的相互作用略微增加(圖2F)。啟動子與Island5、GT2的遠程互作有明顯增加,與前述結(jié)果一致,其與CS38-41的相互作用略微減少(圖2G)。綜上所述,單個CBS e刪除引起基因簇啟動子與增強子之間的遠距離DNA相互作用改變,導(dǎo)致及表達水平降低。
為了探究多個CBS刪除對基因轉(zhuǎn)錄水平的影響,我們對CBS c-e (圖3)和CBS b-e (圖4)進行刪除。分別設(shè)計一對sgRNA (sgRNA c1/sgRNA e2和sgRNA b1/sgRNA e2)對HEK293T細胞進行編輯(圖3A和圖4A),再用特異性引物PCR進行凝膠電泳鑒定(圖3B和圖4B)。將目的條帶切膠純化、TA克隆并進行桑格測序鑒定細胞的基因型,最終獲得了CBS c-e刪除的c-e#49和c-e#54單細胞克隆株(圖3C)以及CBS b-e刪除的b-e#59和b-e#80單細胞克隆株(圖4C)。
通過RNA-seq實驗發(fā)現(xiàn),在CBS c-e和CBS b-e刪除的細胞(這些細胞的已刪除)中,、及的轉(zhuǎn)錄水平下降,其中下降最顯著;的轉(zhuǎn)錄水平分別降低了約40%和56%(圖3D和圖4D)。QHR-4C實驗顯示,無論在CBS c-e還是CBS b-e刪除的細胞中,~與Island5之間的遠程互作均增加(圖3E和圖4E),與GT2的互作也增加,且幅度比CBS e單獨刪除型細胞大(圖3F和圖4F)。在CBS b-e刪除的細胞中,啟動子與增強子Island5及GT2的遠程互作相對CBS c-e刪除型細胞進一步增強(圖3G和圖4G),并且在Island5介導(dǎo)的遠程互作中新增了下游增強子簇(CS38-41)(圖3E和圖4E);啟動子與CS38-41之間的相互作用沒有進一步減弱(圖3G和圖4G)。綜上所述,邊界處CBS刪除的數(shù)量對上游增強子簇與基因簇遠程互作的影響有疊加效應(yīng),但不會遞進式地影響整個基因(除了)的轉(zhuǎn)錄表達水平。
CTCF常富集于TAD區(qū)域邊界,對維持相關(guān)拓撲結(jié)構(gòu)域的穩(wěn)定具有重要作用。為了探究整個CBS a-e對基因簇表達調(diào)控的影響,設(shè)計一對sgRNA(sgRNA a1和sgRNA e2)將CBS a-e刪除(圖5A),進行PCR鑒定(圖5B)、TA克隆并進行桑格測序(圖5C)獲得a-e#93和a-e#108單細胞克隆株。對CBS a-e刪除的細胞進行RNA-seq實驗發(fā)現(xiàn),、與的基因表達顯著降低,其中最顯著,降低了約70% (圖5D)。QHR-4C實驗發(fā)現(xiàn),Island5與下游增強子簇(CS38-41)的互作進一步增加,原本與CBS a-e整體的互作進一步轉(zhuǎn)移至下游的一個反向CBS附近,從而使其與基因簇內(nèi)啟動子的互作從~擴展至~(圖5E);GT2與~啟動子的互作增強,同時與T-DOM的染色質(zhì)遠距離互作增強(圖5F)。以Island5、GT2為觀測點發(fā)現(xiàn)一個有意思的現(xiàn)象:有CTCF結(jié)合的Island5與基因簇的染色質(zhì)相互作用區(qū)域具有明顯的邊界(圖2E、3E、4E和5E),而沒有CTCF結(jié)合的增強子GT2與基因簇區(qū)域的染色質(zhì)相互作用呈現(xiàn)廣泛彌散式分布(圖2F、3F、4F和5F),沒有明顯的邊界,這提示具有CTCF結(jié)合的調(diào)控元件以及沒有CTCF結(jié)合的調(diào)控元件與基因啟動子之間的染色質(zhì)相互作用模式是不同的。以啟動子為VP發(fā)現(xiàn),在HEK293T野生型細胞中,啟動子主要與下游增強子簇有DNA相互作用;而在CBS a-e刪除的細胞中,啟動子與上游增強子簇(Island2、Island5、GT2、GCR和Prox)的遠程互作普遍顯著增強,與下游增強子簇(CS38-41)的遠程互作普遍減弱,CBS a-e刪除改變了的轉(zhuǎn)錄調(diào)控模式,由最初主要受下游增強子簇調(diào)控轉(zhuǎn)變?yōu)樯舷掠蝺蓚€增強子簇調(diào)控(圖5G),原有的調(diào)控平衡被破壞,這可能是導(dǎo)致~轉(zhuǎn)錄水平急劇降低的原因。
圖3 CBS c-e刪除引起上游增強子與近端HOXD基因相互作用的增強
A:設(shè)計一對sgRNA(sgRNA c1和sgRNA e2)對HEK293T野生型細胞進行編輯獲得CBS c-e刪除的單細胞克隆株(c-e#49和c-e#54)的示意圖。B:用引物c1F和e2R PCR鑒定c-e#49和c-e#54單細胞克隆株的凝膠電泳圖。C:TA克隆鑒定c-e#49和c-e#54單細胞克隆株基因型的測序結(jié)果圖。D:RNA-seq數(shù)據(jù)分析比較WT細胞、c-e#49和c-e#54細胞中基因簇表達水平。E:QHR-4C實驗中,以Island5為VP,分析c-e#49和c-e#54細胞株中Island5與基因簇啟動子的遠程互作。紅色實線框內(nèi)為Island5與基因簇啟動子之間的染色質(zhì)相互作用放大圖,黑色虛線框依次指示調(diào)控元件Island2、GT2和CS38-41。F:以GT2為VP,分析CBS c- e刪除后GT2與基因簇啟動子的遠程互作。紅色實線框內(nèi)為GT2與基因簇啟動子間的染色質(zhì)相互作用放大圖,黑色虛線框依次指示調(diào)控元件Island2、Island5和CS38-41。G:以啟動子為VP,c-e#49和c-e#54細胞株中Island2、Island5、GT2、CS38-41與啟動子之間的染色質(zhì)相互作用。黑色虛線框指示Island2,紅色實線框內(nèi)分別為Island5、GT2和CS38-41與啟動子之間的染色質(zhì)相互作用放大圖。
圖4 串聯(lián)排列CTCF位點對增強子遠程互作和HOXD基因表達具有疊加效應(yīng)
A:利用CRISPR/Cas9編輯系統(tǒng)獲得CBS b-e刪除的單細胞克隆株(b-e#59和b-e#80)的示意圖。B:用引物b1F和e2R1進行PCR鑒定b-e#59和b-e#80單細胞克隆株的凝膠電泳圖。C:TA克隆鑒定b-e#59和b-e#80單細胞克隆株基因型的測序結(jié)果圖。D:RNA-seq數(shù)據(jù)分析比較WT細胞、b-e#59和b-e#80細胞株細胞中基因簇表達水平。E:QHR-4C實驗中,以Island5為VP,分析CBS b-e刪除對Island5與基因簇啟動子遠程互作的影響。紅色實線框內(nèi)為Island5與基因簇啟動子之間的染色質(zhì)相互作用放大圖,黑色虛線框依次指示調(diào)控元件Island2、GT2和CS38-41。F:以GT2為VP,分析b-e#59和b-e#80細胞株中GT2與基因簇啟動子的遠程互作。紅色實線框內(nèi)為GT2與基因簇啟動子間的染色質(zhì)相互作用放大圖,黑色虛線框依次指示調(diào)控元件Island2、Island5和CS38-41。G:以啟動子為VP,分析b-e#59和b-e#80細胞株中Island5、GT2、CS38-41與啟動子間的染色質(zhì)相互作用。黑色虛線框指示Island2,紅色實線框內(nèi)分別為Island5、GT2和CS38-41與啟動子之間的染色質(zhì)相互作用放大圖。
以上結(jié)果說明,C-DOM和T-DOM邊界處的反向串聯(lián)排列的CBS主要調(diào)控~及的基因表達。在HEK293T細胞中,Island2、Island5沒有增強子活性,GT2不完全依賴于CTCF調(diào)控的表達,上游增強子簇與基因簇啟動子的遠程互作增加,削弱了下游增強子簇中的CS38-41對基因簇的激活強度。邊界處單個CBS刪除就會影響基因簇原有的三維基因組結(jié)構(gòu),改變和的基因表達。多個CBS刪除對基因簇三維基因組結(jié)構(gòu)以及轉(zhuǎn)錄的影響具有疊加效應(yīng),但是沒有大幅度改變其他基因的表達。當邊界處整個CBS a-e全部刪除后,基因簇與CS38-41的染色質(zhì)相互作用進一步減弱,轉(zhuǎn)錄水平急劇降低,并且上下游增強子簇之間出現(xiàn)了遠距離相互作用。綜上所述,基因簇靠近中心粒側(cè)區(qū)域的反向串聯(lián)排列CTCF位點具有絕緣子功能,通過阻斷上游增強子簇與的染色質(zhì)遠程互作,維持基因簇表達調(diào)控的平衡,使基因能夠精準有序地表達。
圖5 刪除全部反向CTCT位點破壞增強子調(diào)控HOXD基因表達的平衡
A:獲得CBS a-e刪除的單細胞克隆株(a-e#93和a-e#108)的示意圖。B:用引物a1F和e2R PCR鑒定a-e#93和a-e#108細胞株的凝膠電泳圖。C:TA克隆鑒定a-e#93和a-e#108單細胞克隆株基因型的測序結(jié)果圖。D:RNA-seq數(shù)據(jù)分析比較WT細胞、a-e#93和a-e#108細胞株細胞中基因簇轉(zhuǎn)錄水平。E:QHR-4C實驗中,以Island5為VP,分析CBS a-e刪除對Island5與基因簇啟動子及兩側(cè)調(diào)控區(qū)域染色質(zhì)相互作用的影響。紅色實線框內(nèi)為Island5與基因簇啟動子之間的染色質(zhì)相互作用放大圖,黑色虛線框依次指示調(diào)控元件Island2、GT2和CS38-41。F:以GT2為VP,分析a-e#93和a-e#108細胞株中GT2與基因簇啟動子的染色質(zhì)相互作用。紅色實線框內(nèi)為GT2與基因簇啟動子間的染色質(zhì)相互作用放大圖,黑色虛線框依次指示調(diào)控元件Island2、Island5和CS38-41。G:以啟動子為VP,分析CBS a-e刪除后的表達調(diào)控模式。黑色虛線框指示Island2,紅色實線框內(nèi)為Island5、GT2、CS38-41與9基因簇啟動子間的染色質(zhì)相互作用放大圖。
在哺乳動物中,增強子的數(shù)量遠遠超過基因的數(shù)量,復(fù)雜基因的表達往往受多個增強子組合調(diào)控,防止在其適當范圍之外的異位表達[50]。增強子活性的經(jīng)典模式是相對獨立的、自主的并且可疊加的,但是順式調(diào)控區(qū)域內(nèi)存在功能有冗余性(redundancy)的增強子[51,52]。增強子激活需要結(jié)合多個轉(zhuǎn)錄因子[53],轉(zhuǎn)錄因子結(jié)合增強子后,對基因表達起抑制作用或激活作用取決于結(jié)合的轉(zhuǎn)錄因子[54]。例如,轉(zhuǎn)錄因子RFX5與增強子的結(jié)合對原鈣粘蛋白基因簇的表達起抑制作用[55]。增強子活性的強弱取決于招募的共激活蛋白對染色質(zhì)的修飾和增強子的重塑,包括組蛋白乙?;D(zhuǎn)移酶(例如p300/CBP)、組蛋白甲基轉(zhuǎn)移酶(例如MLL3/4和CARM1)、染色質(zhì)重塑因子(例如Brg1和CHD7),以及在啟動子處促進轉(zhuǎn)錄的相關(guān)因子(例如中介體復(fù)合物)[56]。本研究中,CBS a-e刪除后,基因簇與上游增強子簇中的Island5、GT2的遠程互作顯著增加,而的表達下降,這表明Island5、GT2與啟動子之間有互作,但是它們沒有增強子活性,這可能是因為在這兩個增強子上結(jié)合了抑制性的共激活蛋白或轉(zhuǎn)錄因子[35,57]。小鼠胚胎發(fā)育過程中基因的表達就需要結(jié)合不同的轉(zhuǎn)錄因子[58]。
圖6 HOXD基因簇的表達調(diào)控模式圖
A:野生型(WT)細胞中基因簇的表達調(diào)控示意圖。在野生型細胞中,CTCF位點具有絕緣子作用,阻礙了上游增強子簇中的Island2、Island5、GT2與基因簇啟動子的遠程相互作用,基因簇主要受下游增強子簇中的CS38-41調(diào)控。B:CTCF位點刪除的細胞中基因簇的表達調(diào)控示意圖。在CBS刪除的細胞中,CTCF位點絕緣子作用消失,上游增強子簇與基因簇之間產(chǎn)生遠距離DNA相互作用,導(dǎo)致基因簇雙邊調(diào)控的平衡被破壞、基因表達降低。
CTCF與cohesin的結(jié)合是一個動態(tài)過程[59],成串的CBS可以阻礙滲透的cohesin滑動,形成類似于“葫蘆”結(jié)構(gòu)的染色質(zhì)環(huán)[1,17],由此介導(dǎo)的遠距離增強子與啟動子的相互作用可有效持久地調(diào)控基因的表達。我們先前利用小鼠和多種細胞模型對原鈣粘蛋白和珠蛋白模式基因進行系統(tǒng)的研究[13],發(fā)現(xiàn)單個CTCF位點可確保適當?shù)脑鰪娮咏^緣和啟動子激活,而串聯(lián)排列CTCF位點的絕緣作用可維持基因組三維空間的動態(tài)平衡及準確的啟動子選擇。在本研究中,我們進一步利用HEK293T細胞模型對基因簇中的CTCF位點進行了系統(tǒng)的組合性刪除實驗,發(fā)現(xiàn)串聯(lián)排列CTCF位點通過其絕緣功能維持上下游增強子簇調(diào)控基因表達的平衡。另外我們觀察到一個有趣的現(xiàn)象,包含CTCF位點的增強子Island5與基因的染色質(zhì)相互作用具有明顯的邊界,而不包含CTCF位點的增強子GT2與基因的染色質(zhì)相互作用區(qū)域則分布較廣泛,這和原鈣粘蛋白基因簇中的增強子HS5-1 (包含CTCF位點)、HS7 (不包含CTCF位點)與基因染色質(zhì)互作[13]的特點一致。
在本研究中,我們將基因簇C-DOM與T-DOM邊界處CTCF位點進行逐步刪除,隨著剩余的CTCF位點數(shù)量減少,基因簇啟動子與上游增強子簇DNA遠程互作逐漸增強,與下游增強子簇的DNA遠程互作逐漸減弱。當邊界串聯(lián)反向的CTCF位點全部刪除后,基因啟動子由最初與下游增強子簇有相互作用轉(zhuǎn)變?yōu)榕c上下游增強子簇均有相互作用,并且上下游增強子簇之間出現(xiàn)了DNA遠程互作(圖6)。
綜上所述,基因簇中串聯(lián)反向CTCF位點扮演著絕緣子的角色,阻礙上游增強子簇跨區(qū)域調(diào)控近端基因的表達,對基因簇在肢體發(fā)育中時空線性表達的精細調(diào)控具有重要意義,為深入研究基因簇復(fù)雜調(diào)控網(wǎng)絡(luò)提供了參考。
[1] Wu Q, Liu PF, Wang LY. Many facades of CTCF unified by its coding for three-dimensional genome architecture., 2020, 47(8): 407–424.
[2] Guo Y, Monahan K, Wu HY, Gertz J, Varley KE, Li W, Myers RM, Maniatis T, Wu Q. CTCF/cohesin-mediated DNA looping is required for protocadherin alpha promoter choice., 2012, 109(51): 21081– 21086.
[3] Guo Y, Xu Q, Canzio D, Shou J, Li JH, Gorkin DU, Jung I, Wu HY, Zhai YN, Tang YX, Lu YC, Wu YH, Jia ZL, Li W, Zhang MQ, Ren B, Krainer AR, Maniatis T, Wu Q. CRISPR inversion of CTCF sites alters genome topology and enhancer/promoter function., 2015, 162(4): 900– 910.
[4] Zhai YN, Xu Q, Guo Y, Wu Q. Characterization of a cluster of CTCF-binding sites in a protocadherin regulatory region., 2016, 38(4): 323–336.
翟亞男, 許泉, 郭亞, 吳強. 原鈣粘蛋白基因簇調(diào)控區(qū)域中成簇的CTCF結(jié)合位點分析. 遺傳, 2016, 38(4): 323–336.
[5] Yin M, Wang J, Wang M, Li X, Zhang M, Wu Q, Wang Y. Molecular mechanism of directional CTCF recognition of a diverse range of genomic sites., 2017, 27(11): 1365–1377.
[6] Guo Y, Wu Q. Inversion of CTCF binding sites by DNA fragment editing alters genome topology and enhancer/ promoter functions., 2015, 37(10): 1073–1074.
郭亞, 吳強. 采用DNA片段編輯技術(shù)反轉(zhuǎn)CTCF結(jié)合位點改變基因組拓撲結(jié)構(gòu)和增強子與啟動子功能. 遺傳, 2015, 37(10): 1073–1074.
[7] Filippova GN, Fagerlie S, Klenova EM, Myers C, Dehner Y, Goodwin G, Neiman PE, Collins SJ, Lobanenkov VV. An exceptionally conserved transcriptional repressor, CTCF, employs different combinations of zinc fingers to bind diverged promoter sequences of avian and mammalian c-myc oncogenes., 1996, 16(6): 2802–2813.
[8] Chen HB, Tian Y, Shu WJ, Bo XC, Wang SQ. Comprehensive identification and annotation of cell type-specific and ubiquitous CTCF-binding sites in the human genome., 2012, 7(7): e41374.
[9] Nasmyth K. Disseminating the genome: Joining, resolving, and separating sister chromatids during mitosis and meiosis., 2001, 35: 673–745.
[10] Kim Y, Shi ZB, Zhang HS, Finkelstein IJ, Yu HT. Human cohesin compacts DNA by loop extrusion., 2019, 366(6471): 1345–1349.
[11] Lu YJ, Shou J, Jia ZL, Wu YH, Li JH, Guo Y, Wu Q. Genetic evidence for asymmetric blocking of higher-order chromatin structure by CTCF/cohesin., 2019, 10(12): 914–920.
[12] Zheng XF, Huang HY, Wu Q. Chromatin architectural protein CTCF regulates gene expression of thecluster., 2019, 41(6): 509–523.
鄭曉飛, 黃海燕, 吳強. 染色質(zhì)架構(gòu)蛋白CTCF調(diào)控基因簇的表達. 遺傳, 2019, 41(6): 509–523.
[13] Jia ZL, Li JW, Ge X, Wu YH, Guo Y, Wu Q. Tandem CTCF sites function as insulators to balance spatial chromatin contacts and topological enhancer-promoter selection., 2020, 21(1): 75.
[14] Wu YH, Jia ZL, Ge X, Wu Q. Three-dimensional genome architectural CCCTC-binding factor makes choice in duplicated enhancers atlocus., 2020, 63(6): 835–844.
[15] Dekker J, Mirny L. The 3D genome as moderator of chromosomal communication., 2016, 164(6): 1110– 1121.
[16] Nichols MH, Corces VG. A tethered-inchworm model of SMC DNA translocation., 2018, 25(10): 906–910.
[17] Wu Q, Jia ZL. Wiring the brain by clustered protocadherin neural codes., 2021, 37(1): 117–131.
[18] Lin SG, Ba ZQ, Alt FW, Zhang Y. RAG chromatin scanning during V(D)J recombination and chromatin loop extrusion are related processes., 2018, 139: 93–135.
[19] Chen L, Carico Z, Shih HY, Krangel MS. A discrete chromatin loop in the mouse Tcra-Tcrd locus shapes the TCRdelta and TCRalpha repertoires., 2015, 16(10): 1085–1093.
[20] Majumder K, Koues OI, Chan EAW, Kyle KE, Horowitz JE, Yang-Iott K, Bassing CH, Taniuchi I, Krangel MS, Oltz EM. Lineage-specific compaction ofrequires a chromatin barrier to protect the function of a long-range tethering element., 2015, 212(1): 107–120.
[21] Rodríguez-Carballo E, Lopez-Delisle L, Zhan Y, Fabre PJ, Beccari L, El-Idrissi I, Huynh THN, Ozadam H, Dekker J, Duboule D. Thecluster is a dynamic and resilient TAD boundary controlling the segregation of antagonistic regulatory landscapes., 2017, 31(22): 2264– 2281.
[22] Rodríguez-Carballo E, Lopez-Delisle L, Yakushiji- Kaminatsui N, Ullate-Agote A, Duboule D. Impact of genome architecture on the functional activation and repression ofregulatory landscapes., 2019, 17(1): 55.
[23] Rodríguez-Carballo E, Lopez-Delisle L, Willemin A, Beccari L, Gitto S, Mascrez B, Duboule D. Chromatin topology and the timing of enhancer function at thelocus., 2020, 117(49): 31231– 31241.
[24] Jia ZL, Wu Q. Clustered protocadherins emerge as novel susceptibility loci for mental disorders., 2020, 14: 587819.
[25] Heger P, Marin B, Bartkuhn M, Schierenberg E, Wiehe T. The chromatin insulator CTCF and the emergence of metazoan diversity., 2012, 109(43): 17507–17512.
[26] Lewis EB. A gene complex controlling segmentation in Drosophila., 1978, 276(5688): 565–570.
[27] Mallo M. Reassessing the role ofgenes during vertebrate development and evolution., 2018, 34(3): 209–217.
[28] Kmita M, Duboule D. Organizing axes in time and space; 25 years of colinear tinkering., 2003, 301(5631): 331–333.
[29] Andrey G, Montavon T, Mascrez B, Gonzalez F, Noordermeer D, Leleu M, Trono D, Spitz F, Duboule D. A switch between topological domains underliesgenes collinearity in mouse limbs., 2013, 340(6137): 1234167.
[30] Beccari L, Yakushiji-Kaminatsui N, Woltering JM, Necsulea A, Lonfat N, Rodríguez-Carballo E, Mascrez B, Yamamoto S, Kuroiwa A, Duboule D. A role forproteins in the regulatory switch between TADs at thelocus., 2016, 30(10): 1172–1186.
[31] Montavon T, Soshnikova N, Mascrez B, Joye E, Thevenet L, Splinter E, de Laat W, Spitz F, Duboule D. A regulatory archipelago controlsgenes transcription in digits., 2011, 147(5): 1132–1145.
[32] Lonfat N, Montavon T, Darbellay F, Gitto S, Duboule D. Convergent evolution of complex regulatory landscapes and pleiotropy atloci., 2014, 346(6212): 1004–1006.
[33] Long HK, Prescott SL, Wysocka J. Ever-changing landscapes: Transcriptional enhancers in development and evolution., 2016, 167(5): 1170–1187.
[34] Schoenfelder S, Fraser P. Long-range enhancer-promoter contacts in gene expression control., 2019, 20(8): 437–455.
[35] Kim S, Shendure J. Mechanisms of interplay between transcription factors and the 3D genome., 2019, 76(2): 306–319.
[36] Noordermeer D, Leleu M, Splinter E, Rougemont J, De Laat W, Duboule D. The dynamic architecture ofgene clusters., 2011, 334(6053): 222–225.
[37] Li JH, Shou J, Guo Y, Tang YX, Wu YH, Jia ZL, Zhai YN, Chen ZF, Xu Q, Wu Q. Efficient inversions and duplications of mammalian regulatory DNA elements and gene clusters by CRISPR/Cas9., 2015, 7(4): 284–298.
[38] Chang N, Sun C, Gao L, Zhu D, Xu X, Zhu X, Xiong JW, Xi JJ. Genome editing with RNA-guided Cas9 nuclease in zebrafish embryos., 2013, 23(4): 465–472.
[39] Doudna JA, Charpentier E. Genome editing. The new frontier of genome engineering with CRISPR-Cas9., 2014, 346(6213): 1258096.
[40] Liu PF, Wu Q. Probing 3D genome by CRISPR/Cas9., 2020, 42(1): 18–31.
劉沛峰, 吳強. CRISPR/Cas9基因編輯在三維基因組研究中的應(yīng)用. 遺傳, 2020,42(1): 18–31.
[41] Li JH, Shou J, Wu Q. DNA fragment editing of genomes by CRISPR/Cas9., 2015, 37(10): 992–1002.
李金環(huán), 壽佳, 吳強. CRISPR/Cas9系統(tǒng)在基因組DNA片段編輯中的應(yīng)用. 遺傳, 2015,37(10): 992–1002.
[42] Trapnell C, Roberts A, Goff L, Pertea G, Kim D, Kelley DR, Pimentel H, Salzberg SL, Rinn JL, Pachter L. Differential gene and transcript expression analysis of RNA-seq experiments with tophat and cufflinks., 2012, 7(3): 562–578.
[43] Guo XQ, Chen FZ, Gao F, Li L, Liu K, You LJ, Hua C, Yang F, Liu WL, Peng CH, Wang LN, Yang XX, Zhou FY, Tong JW, Cai J, Li ZY, Wan B, Zhang L, Yang T, Zhang MW, Yang LL, Yang YW, Zeng WJ, Wang B, Wei XF, Xu X. CNSA: A data repository for archiving omics data., 2020; 2020: baaa055.
[44] Chen FZ, You LJ, Yang F, Wang LN, Guo XQ, Gao F, Hua C, Tan C, Fang L, Shan RQ, Zeng WJ, Wang B, Wang R, Xu X, Wei XF. CNGBdb: China National Genebank Database., 2020, 42(08): 799–809.
陳鳳珍, 游麗金, 楊帆, 王麗娜, 郭學(xué)芹, 高飛, 華聰, 談聰, 方林, 單日強, 曾文君, 王博, 王韌, 徐訊, 魏曉鋒. CNGBdb: 國家基因庫生命大數(shù)據(jù)平臺. 遺傳, 2020, 42(8): 799–809.
[45] Pearson JC, Lemons D, McGinnis W. Modulatinggene functions during animal body patterning., 2005, 6(12): 893–904.
[46] Lonfat N, Duboule D. Structure, function and evolution of topologically associating domains (TADs) atloci., 2015, 589(20): 2869–2876.
[47] Holland PW, Garcia-Fernàndez J, Williams NA, Sidow A. Gene duplications and the origins of vertebrate development., 1994, 125–133.
[48] Shou J, Li J, Liu Y, Wu Q. Precise and predictable CRISPR chromosomal rearrangements reveal principles of Cas9-mediated nucleotide insertion., 2018, 71(4): 498–509 e4.
[49] Fu YF, Foden JA, Khayter C, Maeder ML, Reyon D, Joung JK, Sander JD. High-frequency off-target mutagenesis induced by CRISPR-Cas nucleases in human cells., 2013, 31(9): 822–826.
[50] Perry MW, Boettiger AN, Levine M. Multiple enhancers ensure precision of gap gene-expression patterns in the Drosophila embryo., 2011, 108(33): 13570–13575.
[51] Frankel N, Davis GK, Vargas D, Wang S, Payre F, Stern DL. Phenotypic robustness conferred by apparently redun-dant transcriptional enhancers., 2010, 466(7305): 490–493.
[52] Barolo S. Shadow enhancers: Frequently asked questions about distributed cis-regulatory information and enhancer redundancy., 2012, 34(2): 135–141.
[53] Buecker C, Wysocka J. Enhancers as information integration hubs in development: Lessons from genomics., 2012, 28(6): 276–284.
[54] Jolma A, Yin YM, Nitta KR, Dave K, Popov A, Taipale M, Enge M, Kivioja T, Morgunova E, Taipale J. DNA- dependent formation of transcription factor pairs alters their binding specificity., 2015, 527(7578): 384–388.
[55] Wang N, Jia ZL, Wu Q. RFX5 regulates gene expression of thecluster., 2020, 42(8): 760–774.
王娜, 甲芝蓮, 吳強. RFX5調(diào)控原鈣粘蛋白基因簇的表達. 遺傳, 2020, 42(8): 760–774.
[56] Malik S, Roeder RG. The metazoan mediator co-activator complex as an integrative hub for transcriptional regulation., 2010, 11(11): 761–772.
[57] Bolt CC, Duboule D. The regulatory landscapes of deve-lopmental genes., 2020, 147(3): dev171736.
[58] Neijts R, Deschamps J. At the base of colineargene expression: Cis-features and trans-factors orchestrating the initial phase ofcluster activation., 2017, 428(2): 293–299.
[59] Xu DF, Ma RS, Zhang JH, Liu ZJ, Wu B, Peng JH, Zhai YN, Gong QG, Shi YY, Wu JH, Wu Q, Zhang ZY, Ruan K. Dynamic nature of CTCF tandem 11 zinc fingers in multivalent recognition of DNA as revealed by NMR spectroscopy., 2018, 9(14): 4020–4028.
Serial deletions of tandem reverse CTCF sites reveal balancedregulatory landscape of enhancers
Ling Wang, Jinhuan Li, Haiyan Huang, Qiang Wu
The genome architectural protein CTCF (CCCTC-binding factor) not only mediates long-distance chromatin interactions between distal enhancers and target promoters, but also functions as an important insulator-binding factor to block improper enhancer activation of non-target promoters, and is thus of great significance to transcriptional regulation of developmental genes.The(Homeobox) gene family plays an important role in the development of the brain, bones, and limbs. The spatiotemporal colinear expression of thecluster along the proximal-distal axis of limbs is regulated by two clusters of enhancers known as super-enhancers located in the flanking regulatory regions. We focused on thecluster to explore the architectural role of CTCF in transcriptional regulation of developmental genes. Thecluster contains 9 paralogous genes intermixed with a series of CBS (CTCF-binding site) elements. Using the CRISPR DNA-fragment editing system, we generated a series of single-cell HEK293T clones with deletion of increasing numbers of reverse CBS elements. RNA-seq experiments revealed decreased levels ofgene expression. In addition, chromosome conformation capture experiments revealed increased long-distance chromatin interactions betweenand the upstream enhancer cluster and corresponding decreased interactions betweenand the downstream enhancer cluster. Thus, tandem reverse CTCF sites function as insulators to maintainregulatory balance between the upstream and downstream enhancer clusters. This study has interesting implications on the precise gene expression control of thefamily during animal development.
gene cluster; CTCF site; balanced regulatory mechanism; enhancer; insulator
2021-04-11;
2021-05-12
國家自然科學(xué)基金項目(編號:31800636,31630039,91940303)和上海市科學(xué)技術(shù)委員會項目(編號:19JC1412500)資助[Supported by the National Natural Science Foundation of China (Nos. 31800636, 31630039, 91940303), and Science and Technology Commission of Shanghai Municipality (No. 19JC1412500)]
王玲,碩士研究生,專業(yè)方向:生物學(xué)。E-mail: wanglingmail0613@163.com
黃海燕,博士,副研究員,研究方向:藥物分子遺傳學(xué)。E-mail: hy_huang@sjtu.edu.cn
吳強,博士,教授,研究方向:基因表達調(diào)控及神經(jīng)發(fā)育。E-mail: qwu123@gmail.com
10.16288/j.yczz.21-132
2021/6/30 14:14:38
URI: https://kns.cnki.net/kcms/detail/11.1913.R.20210630.1109.002.html
(責(zé)任編委: 李大力)