国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

染色質(zhì)架構(gòu)蛋白CTCF調(diào)控UGT1基因簇的表達(dá)

2019-07-05 09:37鄭曉飛黃海燕吳強(qiáng)
遺傳 2019年6期
關(guān)鍵詞:基因簇單克隆外顯子

鄭曉飛,黃海燕,吳強(qiáng)

?

染色質(zhì)架構(gòu)蛋白CTCF調(diào)控基因簇的表達(dá)

鄭曉飛,黃海燕,吳強(qiáng)

上海交通大學(xué)系統(tǒng)生物醫(yī)學(xué)研究院比較生物醫(yī)學(xué)研究中心,系統(tǒng)生物醫(yī)學(xué)教育部重點(diǎn)實(shí)驗(yàn)室,上海 200240

尿苷二磷酸葡萄糖醛酸轉(zhuǎn)移酶(UDP-glucuronosyltransferase, UGT)是一類重要的Ⅱ相藥物代謝酶,通過葡萄糖醛酸接合反應(yīng)代謝大量內(nèi)外源小分子化合物,對(duì)機(jī)體維持內(nèi)部動(dòng)態(tài)平衡具有重要意義?;蛲蛔兓虮磉_(dá)異常會(huì)造成高膽紅素血癥等多種疾病、影響藥物療效或減弱代謝藥物能力,因此探索表達(dá)調(diào)控機(jī)制將會(huì)為人類疾病的預(yù)防和個(gè)體化醫(yī)療以及精準(zhǔn)醫(yī)學(xué)提供科學(xué)依據(jù)。脊椎動(dòng)物分為和兩個(gè)亞家族,基因簇結(jié)構(gòu)與原鈣粘蛋白(protocadherin,)、免疫球蛋白或B細(xì)胞受體(immunoglobulin or B-cell receptor)、T細(xì)胞受體(T-cell receptor)基因簇類似,但與結(jié)構(gòu)不同,分為可變區(qū)和恒定區(qū),可變區(qū)包含成串排列的外顯子,任意一個(gè)外顯子都可以被可變剪接到下游同一套恒定區(qū)外顯子上,形成9種信使RNA并翻譯成不同UGT1葡醛酸轉(zhuǎn)移酶亞型。本實(shí)驗(yàn)室前期工作發(fā)現(xiàn),染色質(zhì)架構(gòu)蛋白CTCF結(jié)合DNA的方向性在染色質(zhì)三維結(jié)構(gòu)構(gòu)建中發(fā)揮重要作用。基于此,為了進(jìn)一步解析復(fù)雜基因簇的三維轉(zhuǎn)錄調(diào)控機(jī)制,本研究分析和比較了人和小鼠基因簇的CTCF結(jié)合位點(diǎn)(CTCF binding site, CBS)的方向性分布,發(fā)現(xiàn)人和小鼠的基因簇中CBS分布差異很大。以人肺癌細(xì)胞系A(chǔ)549為模型,通過RNAi敲低細(xì)胞中CTCF和SMC3 (cohesin亞基),證明了CTCF和cohesin蛋白參與調(diào)控人基因簇的轉(zhuǎn)錄表達(dá)。進(jìn)一步采用CRISPR介導(dǎo)的DNA片段編輯技術(shù)對(duì)進(jìn)行了原位反轉(zhuǎn)(inversion)和刪除,并通過RNA-seq分析技術(shù)發(fā)現(xiàn)刪除能夠顯著降低、和的表達(dá)水平,然而反轉(zhuǎn)僅僅顯著降低的表達(dá)水平。上述研究表明參與、和的轉(zhuǎn)錄調(diào)節(jié),是人基因簇的潛在轉(zhuǎn)錄調(diào)控元件。本研究為未來進(jìn)一步探索基因簇的三維基因轉(zhuǎn)錄調(diào)控機(jī)制提供了實(shí)驗(yàn)基礎(chǔ)。

;CTCF;CRISPR/Cas9;DNA片段編輯;轉(zhuǎn)錄調(diào)控

脊椎動(dòng)物基因組包含一系列能夠編碼多種蛋白質(zhì)的特殊基因簇,它們由可變區(qū)和恒定區(qū)組成[1,2],這些基因簇包括免疫球蛋白()、T細(xì)胞受體()、原鈣粘蛋白()和尿苷二磷酸葡糖醛酸轉(zhuǎn)移酶1 ()等[1,3]。其中,基因簇編碼的UGT (UDP- glucuronosyltransferase)蛋白質(zhì)家族是一類Ⅱ相藥物代謝酶,這類酶能夠?qū)⑵咸烟侨┧峁w基團(tuán)轉(zhuǎn)移到各種內(nèi)外源疏水小分子化合物受體底物上,將它們轉(zhuǎn)化為水溶性物質(zhì)而排出體外,或者影響小分子藥物的藥代動(dòng)力學(xué)和藥物最終的生物學(xué)效應(yīng)[4]。內(nèi)源性底物包括許多在機(jī)體內(nèi)起重要作用的小分子化合物,如膽紅素、膽汁酸、脂酸、類固醇、甲狀腺激素和脂溶性維生素等;外源性底物則包括小分子藥物、環(huán)境污染物和致癌化合物等。它們先經(jīng)過Ⅰ相代謝酶P450氧化成極性化合物,再被UGT等Ⅱ相代謝酶進(jìn)一步極化后排出體外。

哺乳動(dòng)物UGT分為兩大類:UGT1和UGT2[3,5],分別被兩個(gè)基因簇編碼。其中UGT2又可分為兩個(gè)亞家族:UGT2A和UGT2B。分為可變區(qū)和恒定區(qū),可變區(qū)內(nèi)有2個(gè)外顯子,恒定區(qū)內(nèi)有5個(gè)外顯子,而有7個(gè)基因,每個(gè)基因都由一串外顯子單獨(dú)構(gòu)成[6,7]?;虼亟Y(jié)構(gòu)與基因簇明顯不同,但卻類似于原鈣粘蛋白基因簇[8],由可變區(qū)和恒定區(qū)組成,可變區(qū)包含9個(gè)成串排列的外顯子,恒定區(qū)包含4個(gè)外顯子,每一個(gè)可變區(qū)外顯子都有其自身的啟動(dòng)子,啟動(dòng)子激活后轉(zhuǎn)錄出的信使RNA前體能夠通過可變剪接形成9種不同的轉(zhuǎn)錄本[1,5]。每個(gè)可變區(qū)外顯子編碼信號(hào)肽和N端糖苷受體結(jié)合域,4個(gè)恒定區(qū)外顯子編碼高度保守的UDPGA供體結(jié)合域和C端內(nèi)質(zhì)網(wǎng)錨定跨膜段。因此,基因簇編碼的葡醛酸轉(zhuǎn)移酶家族可以催化大量親脂內(nèi)外源化合物與UDP-葡萄糖醛酸的接合反應(yīng),將它們轉(zhuǎn)化為親水的葡萄糖醛酸化合物[9]。盡管基因簇結(jié)構(gòu)類似于原鈣粘蛋白基因簇,但其架構(gòu)蛋白CTCF (CCCTC-結(jié)合因子)結(jié)合位點(diǎn)的分布特征與原鈣粘蛋白基因簇截然不同,解析復(fù)雜基因簇的三維轉(zhuǎn)錄調(diào)控機(jī)制將會(huì)進(jìn)一步拓寬人們對(duì)拓?fù)浣Y(jié)構(gòu)域(topological domain)內(nèi)這一類復(fù)雜基因簇的轉(zhuǎn)錄調(diào)控的認(rèn)知。

基因的表達(dá)調(diào)控和三維基因組中染色質(zhì)高級(jí)結(jié)構(gòu)密切相關(guān),特別是遠(yuǎn)端增強(qiáng)子和目標(biāo)啟動(dòng)子之間的特異性遠(yuǎn)程相互作用對(duì)于啟動(dòng)子激活至關(guān)重要。CTCF是一種高度保守和廣泛表達(dá)的轉(zhuǎn)錄因子,是組織發(fā)育必需的一種染色質(zhì)架構(gòu)蛋白[10],在染色質(zhì)折疊中起關(guān)鍵作用[11],依靠11個(gè)鋅指蛋白域(ZFs)方向性結(jié)合到人類基因組約4萬個(gè)特定序列元件(CTCF binding sites, CBSs)上[12,13],其中60%以上的結(jié)合都沒有組織特異性(tissue-invariant)[14~16]。早期認(rèn)為CTCF起到轉(zhuǎn)錄抑制作用,后來發(fā)現(xiàn)它也具有轉(zhuǎn)錄激活功能,近年來發(fā)現(xiàn)其在三維基因組架構(gòu)中起到關(guān)鍵作用??傊?,CTCF蛋白具有多種復(fù)雜甚至相反的功能,包括轉(zhuǎn)錄激活和抑制、基因印跡、RNA聚合酶暫停、選擇性剪接、DNA復(fù)制和修復(fù)、染色體縮合或凝結(jié)(chromosome condensation)和易位(translocation)、X染色體失活、腫瘤發(fā)生、免疫系統(tǒng)V(D)J重組和神經(jīng)系統(tǒng)啟動(dòng)子選擇等[12,13]。CTCF蛋白可能通過自二聚化[17],或與cohesin蛋白質(zhì)復(fù)合體相互作用參與形成染色質(zhì)環(huán)[18~22],一般成環(huán)的一對(duì)CTCF結(jié)合位點(diǎn)的方向是相向的[13,23~25]。染色質(zhì)架構(gòu)蛋白CTCF通過方向性結(jié)合決定著染色質(zhì)的環(huán)化方向[25]。在與基因簇結(jié)構(gòu)高度相似的原鈣粘蛋白基因簇中,CTCF通過方向性識(shí)別各增強(qiáng)子和啟動(dòng)子,形成長距離染色質(zhì)環(huán)化結(jié)構(gòu),從而實(shí)現(xiàn)了對(duì)原鈣粘蛋白基因時(shí)空表達(dá)的精密調(diào)控[23]。

利用Ⅱ型成簇規(guī)律間隔短回文重復(fù)系統(tǒng)CRISPR/Cas9 (clustered regularly interspaced short palindromic repeats (CRISPR)/CRISPR-associated nucelase 9)發(fā)展起來的基因組編輯技術(shù)為探索染色質(zhì)環(huán)化機(jī)制和研究染色質(zhì)高級(jí)結(jié)構(gòu)提供了良好的技術(shù)平臺(tái)[26,27]。CRISPR基因組編輯依賴于sgRNA (single-guide RNA)將Cas9酶定位到靶基因并進(jìn)行切割,然后通過非同源末端連接(nonhomologous end-joining, NHEJ)、同源重組(homologous recombi-nation, HR)、微同源介導(dǎo)的末端連接(microhomology- mediated end joining, MMEJ)或單鏈退火(single-strand annealing, SSA)方式修復(fù)切割末端[13,28,29]。采用雙位點(diǎn)的DNA片段編輯(DNA fragment editing)方法可以刪除、反轉(zhuǎn)或重復(fù)所研究的目標(biāo)片段[13,30]。本研究通過敲低細(xì)胞中CTCF或SMC3(cohesin亞基)的轉(zhuǎn)錄水平并利用CRISPR介導(dǎo)的DNA片段編輯技術(shù)對(duì)人類基因簇中保守的CBS元件進(jìn)行編輯,旨在探索基因簇中CTCF結(jié)合位點(diǎn)對(duì)基因簇轉(zhuǎn)錄調(diào)控的影響,對(duì)研究基因表達(dá)調(diào)控網(wǎng)絡(luò)的結(jié)構(gòu)基礎(chǔ)具有重要意義。

1 材料與方法

1.1 實(shí)驗(yàn)材料

人肺癌細(xì)胞系A(chǔ)549由上海交通大學(xué)電信學(xué)院儀器系付華林老師提供;人胚腎細(xì)胞系293T購買于中國科學(xué)院細(xì)胞庫;胎牛血清、青霉素/鏈霉素雙抗和DMEM購自美國Gibico公司;psPax2和pMD2.G質(zhì)粒購自美國Addgene公司;pLKO.1質(zhì)粒購自美國Sigma公司;CTCF、SMC3抗體購自英國Abcam公司;Cas9質(zhì)粒由北京大學(xué)席建忠教授饋贈(zèng);pGL3- U6-sgRNA-puro質(zhì)粒由南京大學(xué)黃行許教授饋贈(zèng);逆轉(zhuǎn)錄試劑購自南京諾唯贊生物科技有限公司;熒光定量PCR試劑購自瑞士Roche公司;Annealing bu-ffer、T4 DNA ligase以及RNA-seq試劑盒購自美國NEB公司;Lipo3000購自美國Invitrogen公司;rTaq酶購自日本TaKaRa公司;質(zhì)粒中抽試劑盒購自德國Qiagen公司;Trizol購自美國Ambion公司;所有引物均由上海生物工程股份有限公司合成。

1.2 CTCF方向性及結(jié)合基序分析

ChIP-seq數(shù)據(jù)來自NCBI,抽取富集CTCF的DNA序列。所分析的人源細(xì)胞系數(shù)據(jù)包括人肺癌細(xì)胞系A(chǔ)549 (GSM822289)、人肝癌細(xì)胞系HepG2 (GSM733645)、人慢性髓系白血病細(xì)胞系K562 (GSM749733)、人胚腎細(xì)CBS胞系HEK293 (GSM-749668)、正常人表皮角質(zhì)形成細(xì)胞NHEK (GSM-749707)、人乳腺癌細(xì)胞系MCF7 (GSM1022658)和人子宮內(nèi)膜腺癌細(xì)胞系HEC-1-B (來自于本課題組)。所分析的小鼠細(xì)胞系包括B細(xì)胞淋巴瘤CH12 (GSM923568)、GATA 1-紅系祖細(xì)胞G1E (GSM923570)和第0天的胚胎干細(xì)胞ES-B4 E0 (GSM918748);小鼠組織包括8周齡心臟(GSM918756)、腎臟(GSM-918731)、肝臟(GSM918715)和肺(GSM-918722)。

利用在線軟件CTCF BSDB2.0預(yù)測每個(gè)CTCF結(jié)合的motif,并判別其方向[31](http://insulatordb. uthsc.edu/storm_new.php)。利用軟件Clustal X和在線軟件BoxShade對(duì)CTCF結(jié)合基序進(jìn)行序列分析比對(duì)(https://embnet.vital-it.ch/software/BOX_form.html)。

1.3 cohesin與增強(qiáng)子標(biāo)志分析

ChIP-seq數(shù)據(jù)來自NCBI,分析cohesin亞基SMC3及增強(qiáng)子標(biāo)志p300和H3K27ac在不同人源細(xì)胞系的分布。人肺癌細(xì)胞系A(chǔ)549的SMC3、p300和H3K27ac GEO序列號(hào)分別是GSM3106366、GSM-1010827和GSM2421872;人肝癌細(xì)胞系HepG2的SMC3、p300和H3K27ac GEO序列號(hào)分別是GSM-935542、GSM935545和GSM733743;人宮頸癌細(xì)胞系HeLa-S3的CTCF、SMC3、p300和H3K27ac GEO序列號(hào)分別是GSM822285、GSM935384、GSM-935500和GSM733684。

1.4 細(xì)胞培養(yǎng)

A549細(xì)胞和293T細(xì)胞的培養(yǎng)基配方為DMEM中加入10%的胎牛血清和1%的青霉素/鏈霉素雙抗。培養(yǎng)條件為37℃、5% CO2。

1.5 shRNA慢病毒包裝和感染細(xì)胞

shRNA (short hairpin RNA)引物序列采用文獻(xiàn)[23]中的序列(表1)。寡核苷酸的兩條鏈經(jīng)過變性、退火后連接到pLKO.1載體,通過轉(zhuǎn)化感受態(tài)細(xì)菌和質(zhì)粒抽提得到shRNA的重組質(zhì)粒。

293T細(xì)胞用無抗培養(yǎng)基傳代到10 cm培養(yǎng)皿,密度為8×105cells/mL。第2天用Lipo3000轉(zhuǎn)染質(zhì)粒DNA (5.4 μg psPax2、0.6 μg pMD2.G、6 μg載體質(zhì)粒),24 h后換為正常培養(yǎng)基,分兩次回收病毒懸液,過濾得到病毒初始液,加入5×PEG母液,混勻、4℃放置過夜后4℃、4000×離心30 min,得到shRNA病毒沉淀,加入適量DMEM溶解沉淀并分裝存于?80℃。

在六孔板準(zhǔn)備A549細(xì)胞,密度為1×105cells/mL。第2天用慢病毒感染細(xì)胞,培養(yǎng)24 h后換培養(yǎng)基,48 h后收集細(xì)胞。

1.6 Western blot鑒定

收集細(xì)胞樣品中加入100 μL RIPA裂解液,冰上放置30 min,4℃、13000×離心15 min,收集上清并分裝,液氮速凍后放?80℃冰箱待用。配制10%分離膠:4 mL MilliQ水、2.4 mL 1.5 mol/L Tris-HCl (pH 8.8)、3.4 mL 30% Arc-Bis、100 μL 10% SDS、100 μL 10%過硫酸銨、10 μL四甲基乙二胺。4%積層膠包括:3 mL MilliQ水、500 μL 1 mol/L Tris-HCl (pH 6.8)、522 μL 30% Arc-Bis、40 μL 10% SDS、40 μL 10%過硫酸銨、6 μL四甲基乙二胺。取10 μL蛋白樣品于PCR管中,補(bǔ)MilliQ水至16 μL,加入4 μL 5× SDS Loading buffer混勻后,95℃ 5 min。點(diǎn)樣并電泳,首先80 V電泳30 min,然后120 V電泳2 h,剪切所需蛋白膠,按照濾紙-硝酸纖維素濾膜-凝膠-濾紙的順序疊加,在電泳槽中0.16 A電泳2 h。然后將印記后的膜轉(zhuǎn)入5%的脫脂牛奶中,室溫避光搖晃1 h后,按照目的條帶大小剪切膜,分別加入一抗稀釋液,4℃搖晃過夜。加入PBST,室溫?fù)u晃5 min,重復(fù)3次。加入1 mL二抗稀釋液,室溫?fù)u晃1 h,再用PBST洗膜3次。最后用Odyssey雙色紅外激光成像系統(tǒng)掃膜成像。

表1 本研究使用的引物序列

sgRNA引物序列中下劃線部分為構(gòu)建質(zhì)粒所需的粘性末端。P7-index引物序列中下劃線部分為index。

1.7 各細(xì)胞系RNA的提取

對(duì)12孔板中長滿的細(xì)胞進(jìn)行胰酶消化后,3000×離心10 min,收集沉淀加入500 μL Trizol溶液,室溫放置5 min,再加入100 μL氯仿,劇烈搖15 s,室溫放置3 min后,4℃、12000×離心15 min,取上層透明相于干凈1.5 mL的EP管中。在該管中加入250 μL異丙醇,充分混勻,室溫放置10 min后,4℃、12000×離心10 min,去上清收集沉淀,用75%的乙醇洗沉淀,4℃、7500×離心5 min,收集沉淀,倒置10 min,最后加入無核酸酶的水30 μL溶解沉淀得到RNA溶液。用NanoDrop2000測RNA濃度,并放?80℃冰箱待用。

1.8 熒光定量PCR檢測表達(dá)量

RNA逆轉(zhuǎn)錄為cDNA的方法為:在無核酸酶的PCR管加入4 μL gDNA wiper混合液、0.5 μg RNA模板,補(bǔ)無核酸酶水至總體積16 μL,輕輕吹打混勻,42℃ 2 min。繼續(xù)加入4 μL 5×HiScript II qRT SuperMix II,輕輕吹打混勻,50℃ 15 min;85℃ 5 s。產(chǎn)物即可用于qPCR反應(yīng)或存于?20℃冰箱待用。

qPCR反應(yīng)體系:5 μL 2×SYBR Green Master混合液、0.3 μL正向引物(10 μmol/L)、0.3 μL反向引物(10 μmol/L)、2 μL模板、2.4 μL MilliQ水。所用到正、反向引物序列見表1。qPCR擴(kuò)增條件:95℃ 10 min;95℃ 15 s,60℃ 33 s,40個(gè)循環(huán);95℃ 15 s,60℃ 1 min,95℃ 15 s。分析其ΔΔCt值及RQ (relative quantity)值,RQ=2-ΔΔCt。顯著性差異分析使用-test。

1.9 CBS元件的基因片段編輯

根據(jù)CRISPR/Cas9基因編輯原理設(shè)計(jì)sgRNA并合成(表1)。每一對(duì)sgRNA的兩條鏈經(jīng)過變性、退火后連接到pGL3-U6-sgRNA-puro載體上。通過轉(zhuǎn)化感受態(tài)細(xì)菌和質(zhì)粒抽提得到sgRNA的重組質(zhì)粒。

反轉(zhuǎn)和刪除的單克隆細(xì)胞株的獲得采用了兩組sgRNA。在24孔板準(zhǔn)備細(xì)胞,密度為8× 105cells/mL。第2天用Lipo3000轉(zhuǎn)染sgRNAs (均為169.9 ng)和Cas9 (940.392 ng)。轉(zhuǎn)染18 h后換培養(yǎng)基,24 h后加嘌呤霉素(1 mg/mL),每孔1 μL,連續(xù)4天,將存活下來的細(xì)胞繼續(xù)培養(yǎng)。待細(xì)胞足夠多時(shí),取一部分做模板。設(shè)計(jì)PCR引物,進(jìn)行細(xì)胞鑒定。鑒定到目標(biāo)基因型后,將該混合細(xì)胞逐漸放大培養(yǎng)。按照30 cells/mL的濃度接種到96孔板進(jìn)行單克隆化。兩周后對(duì)單克隆細(xì)胞進(jìn)行鑒定。在此過程,要保證這些單克隆細(xì)胞生長狀態(tài)良好。

1.10 CRISPR單克隆細(xì)胞的鑒定

采用細(xì)胞裂解法和PCR方法鑒定單克隆細(xì)胞。細(xì)胞DNA模板的制備方法:取部分細(xì)胞于PCR管,3000×離心10 min,留下細(xì)胞沉淀;加入20 μL裂解液,沸水煮5 min;再加入20 μL中和液,混勻即可??纱嬗?20℃。裂解液配方為25 mmol/L NaOH、0.2 mmol/L EDTA;中和液配方為40 mmol/L Tris- HCl。

PCR反應(yīng)體系:6.3 μL MilliQ水、1 μL 10 × Buffer (含Mg2+)、1 μL dNTP混合液(各2.5 mmol/L)、0.3 μL正向引物(10 μmol/L)、0.3 μL反向引物(10 μmol/L)、0.1 μL rTaq酶(5 U/μL)和1 μL DNA模板。所用到正、反向引物序列見表1。PCR 擴(kuò)增條件:94℃ 3 min;94℃ 15 s,60℃ 30 s,72℃ 1min,38個(gè)循環(huán);72℃ 7 min (退火溫度根據(jù)引物Tm適當(dāng)調(diào)整,延伸時(shí)間根據(jù)產(chǎn)物長度調(diào)整)。PCR擴(kuò)增產(chǎn)物用2%瓊脂糖凝膠進(jìn)行電泳分析鑒定。

1.11 RNA-seq建庫和高通量測序

待檢測細(xì)胞系RNA的抽提方法和上面方法相同。poly(A) mRNA的分離、cDNA合成和文庫構(gòu)建根據(jù)NEB RNA-sequencing試劑盒說明書操作,所用P7-index序列見表1。文庫采用Invitrogen公司的Qubit 3 Fluorometer儀器進(jìn)行定量,并送至蘇州金唯智生物科技有限公司進(jìn)行質(zhì)檢和高通量測序,測序儀器為Illumina HiSeq平臺(tái),測序長度雙端150 bp。RNA-seq數(shù)據(jù)用TopHat和Cufflinks進(jìn)行分析[32],顯著性差異分析使用-test。

2 結(jié)果與分析

2.1 CTCF和cohesin調(diào)控UGT1基因簇表達(dá)

CTCF在細(xì)胞中的多樣性功能與其在三維基因組中長距離染色質(zhì)環(huán)化作用相關(guān)。本研究分析了多類人源細(xì)胞系的CTCF ChIP-seq (chromatin immun-oprecipitation and massive parallel sequencing)數(shù)據(jù),發(fā)現(xiàn)人基因簇中存在3個(gè)CTCF可結(jié)合位點(diǎn):,其中位點(diǎn)在所分析的人肺癌細(xì)胞系(A549)、人肝癌細(xì)胞系(HepG2)、人慢性髓系白血病細(xì)胞系(K562)、人胚腎細(xì)胞系(HEK293)、正常人表皮角質(zhì)形成細(xì)胞系(NHEK)、人乳腺癌細(xì)胞系(MCF7)和人子宮內(nèi)膜腺癌細(xì)胞系(HEC-1-B)中均高度富集CTCF蛋白(圖1A)。

CBS基序通常被分為4個(gè)模塊(Module#1~4)[25,33],核心序列為Module#2~4,其中Module#2~3由CTCF的ZF4~7特異識(shí)別,Module#4由ZF3識(shí)別。核心序列上有一段保守的11 bp回文序列“CCACCAGGTGG”,位于Module#2~3內(nèi),中心的核苷酸堿基“A”被CTCF蛋白ZF6上的Gln418殘基特異性識(shí)別,對(duì)鑒別CBS的方向至關(guān)重要。約15%的CBS在核心序列上游存在Module#1,CTCF的ZF9~11纏繞在Module#1的DNA雙鏈上并將它們的α-螺旋插入Module#1的大溝里,對(duì)CTCF方向性結(jié)合也至關(guān)重要[34]。根據(jù)上述CBS的結(jié)合特征,結(jié)合BSDB2.0分析軟件,預(yù)測人基因簇中的方向?yàn)榉聪?圖1B),它們在核心序列Module#2~3處保守度較高(圖1B)。

圖1 CTCF和cohesin參與人UGT1基因簇的轉(zhuǎn)錄調(diào)控

A:人基因簇內(nèi)CBS分布。人位于2號(hào)染色體,類似于原鈣粘蛋白基因簇,由可變區(qū)和恒定區(qū)組成,可變區(qū)內(nèi)串聯(lián)排列著9個(gè)高度相似的可變區(qū)外顯子,下游恒定區(qū)包含4個(gè)恒定區(qū)外顯子。垂直框代表基因簇外顯子并用不同顏色標(biāo)記,綠色表示苯酚組可變外顯子,橘黃色表示膽紅素組可變外顯子,紅色表示恒定外顯子;人肺癌細(xì)胞系A(chǔ)549、人肝癌細(xì)胞系HepG2、人慢性髓系白血病細(xì)胞K562、人胚腎細(xì)胞HEK293、正常人表皮角質(zhì)形成細(xì)胞NHEK、人乳腺癌細(xì)胞MCF7和人子宮內(nèi)膜腺癌細(xì)胞HEC-1-B的CTCF ChIP-seq數(shù)據(jù)顯示人基因簇內(nèi)3個(gè)CTCF可結(jié)合位點(diǎn):,每個(gè)CBS方向由下方藍(lán)色三角形指示;B:人基因簇3個(gè)CBS序列及方向性預(yù)測;Module#4~1的CBS定義為反向CBS;C:熒光定量PCR技術(shù)檢測到A549細(xì)胞中敲低CTCF后CTCF的轉(zhuǎn)錄水平顯著降低,shNTC是對(duì)照組;D:蛋白免疫印跡實(shí)驗(yàn)證明CTCF蛋白被敲低;E:熒光定量PCR技術(shù)檢測敲低CTCF對(duì)A549細(xì)胞中高度表達(dá)的、和三個(gè)基因的轉(zhuǎn)錄的影響;F:熒光定量PCR技術(shù)檢測A549細(xì)胞中敲低SMC3后SMC3的轉(zhuǎn)錄水平顯著降低;G:蛋白免疫印跡實(shí)驗(yàn)證明SMC3蛋白被敲低;H:熒光定量PCR技術(shù)檢測敲低SMC3對(duì)A549細(xì)胞中高表達(dá)基因、和的轉(zhuǎn)錄影響;I:人肺癌細(xì)胞系A(chǔ)549、肝癌細(xì)胞系HepG2和宮頸癌細(xì)胞系HeLa-S3的cohesin蛋白亞基SMC3以及增強(qiáng)子標(biāo)志p300和H3K27ac在人基因簇的分布。*:<0.05 表示有統(tǒng)計(jì)學(xué)差異,**:<0.01表示有顯著的統(tǒng)計(jì)學(xué)差異,***:<0.001 表示有非常顯著的統(tǒng)計(jì)學(xué)差異。

A549細(xì)胞系中基因簇各基因的表達(dá)差異較大,和高度表達(dá),和低度表達(dá),而、、、和則處于沉默狀態(tài)。為研究CTCF是否參與調(diào)控基因簇的轉(zhuǎn)錄表達(dá),以人肺癌細(xì)胞系A(chǔ)549為模型,通過向細(xì)胞感染表達(dá)shRNA的慢病毒來敲低CTCF。CTCF靶向的shRNA病毒感染A549細(xì)胞后,CTCF的轉(zhuǎn)錄水平降低了93% (圖1C),CTCF的蛋白表達(dá)水平顯著降低(圖1D)。進(jìn)一步采用熒光定量PCR技術(shù)檢測了的表達(dá),發(fā)現(xiàn)轉(zhuǎn)錄水平升高了43%,和分別降低了79%和76% (圖1E)。表明CTCF顯著影響、和的表達(dá),參與調(diào)控基因簇的轉(zhuǎn)錄表達(dá)。

CTCF在染色質(zhì)高級(jí)架構(gòu)中的絕緣作用依賴于cohesin蛋白復(fù)合體,它們往往共定位于染色質(zhì)上的CBS處,本研究進(jìn)一步利用慢病毒介導(dǎo)的shRNA敲低了SMC3的表達(dá),SMC3的轉(zhuǎn)錄水平降低86.7% (圖1F)、蛋白量顯著降低(圖1G)。SMC3敲低后,轉(zhuǎn)錄水平升高8.25倍,而和轉(zhuǎn)錄水平幾乎沒有變化(圖1H),這和CTCF敲低時(shí)的情況不一樣,可能與cohesin在組織特異性轉(zhuǎn)錄中的CTCF非依賴性功能相關(guān)[20,35,36]。于是,進(jìn)一步分析了人肺癌細(xì)胞系A(chǔ)549、肝癌細(xì)胞系HepG2和宮頸癌細(xì)胞系HeLa-S3的cohesin亞基SMC3蛋白以及增強(qiáng)子標(biāo)志p300和H3K27ac在基因簇的結(jié)合分布,結(jié)果發(fā)現(xiàn)SMC3除了在CTCF位點(diǎn)富集,還在p300和H3K27ac位點(diǎn)處富集(圖1I)。

2.2 CRISPR刪除hCBS1片段對(duì)人細(xì)胞系A(chǔ)549中UGT1基因簇轉(zhuǎn)錄的影響

為進(jìn)一步研究人基因簇內(nèi)保守的CTCF結(jié)合元件對(duì)基因簇的轉(zhuǎn)錄調(diào)控的影響,以人肺癌細(xì)胞系A(chǔ)549為模型,利用CRISPR/Cas9片段編輯技術(shù)原位刪除包含的DNA片段。

本研究采用使用最廣泛的釀膿鏈球菌()來源的SpCas9酶。該酶被sgRNA帶入靶標(biāo)DNA處,其兩個(gè)核酸酶結(jié)構(gòu)域HNH和RuvC在5′ PAM (protospacer adjacent motif)序列(NGG)上游3 bp處分別對(duì)互補(bǔ)鏈和非互補(bǔ)鏈進(jìn)行切割,產(chǎn)生具有平頭末端的DSBs (double strand br-eaks)[37~40]。最新的研究發(fā)現(xiàn),SpCas9切割位點(diǎn)不局限于PAM上游3 bp處,非互補(bǔ)鏈上的切割可能發(fā)生在更上游位置,進(jìn)而產(chǎn)生突出末端[27]。在A549細(xì)胞中轉(zhuǎn)入SpCas9和sgRNAs (sgC1F和sgC1D,圖2A)表達(dá)質(zhì)粒后,在轉(zhuǎn)染細(xì)胞群中檢測到刪除的基因型,進(jìn)一步對(duì)轉(zhuǎn)染細(xì)胞群進(jìn)行單克隆化,獲得89個(gè)單克隆細(xì)胞株,對(duì)這些單克隆細(xì)胞進(jìn)行PCR鑒定,發(fā)現(xiàn)C1D2和C1D3是刪除純合型單克隆細(xì)胞株。片段刪除示意圖如圖2B所示,SpCas9在sgCIF和sgC1D引導(dǎo)下,特異性識(shí)別片段兩側(cè)靶標(biāo)位置并切割產(chǎn)生兩個(gè)切口,兩個(gè)切口連接到一起形成片段刪除的編輯細(xì)胞。

C1D2和C1D3的基因型鑒定結(jié)果如圖2C所示,切口處原野生型片段(上游C1F8/C1R9引物對(duì)PCR產(chǎn)物151 bp、下游C1F2/C1R引物對(duì)PCR產(chǎn)物301 bp)全部消失,反轉(zhuǎn)檢測條帶(C1F8/C1F2引物對(duì)PCR產(chǎn)物219 bp、C1R/C1R9引物對(duì)PCR產(chǎn)物233 bp)呈陰性,片段兩側(cè)引物C1F8/C1R擴(kuò)增產(chǎn)物從野生型細(xì)胞的1229 bp縮短為290 bp,表明編輯片段被刪除。對(duì)片段兩側(cè)引物C1F8/C1R擴(kuò)增的290 bp產(chǎn)物進(jìn)一步測序分析,發(fā)現(xiàn)C1D2和C1D3單克隆細(xì)胞株中刪除片段上下游的切割位點(diǎn)均恰好在PAM上游3 bp處(圖2D),這可能因?yàn)榧词筍pCas9在非互補(bǔ)鏈造成的切割位點(diǎn)超過PAM上游3 bp,細(xì)胞內(nèi)修復(fù)體系也會(huì)使其3¢端補(bǔ)齊,然后再連接到一起。

圖2 CRISPR刪除hCBS1片段對(duì)人細(xì)胞系A(chǔ)549中UGT1基因簇轉(zhuǎn)錄的影響

A:CRISPR刪除片段所使用的成對(duì)sgRNA (sgCIF和sgC1D)以及各鑒定引物的位置示意圖;B:片段刪除示意圖。Cas9在sgCIF和sgC1D引導(dǎo)下,特異性識(shí)別片段兩側(cè)靶標(biāo)位置并切割產(chǎn)生兩個(gè)切口,兩個(gè)切口連接到一起形成片段刪除的編輯細(xì)胞;C:片段刪除的單克隆A549細(xì)胞株C1D2和C1D3的基因型鑒定結(jié)果。野生型A549細(xì)胞(WT)和片段原位反轉(zhuǎn)型A549細(xì)胞(C1I5)被作為PCR鑒定對(duì)照;用C1F8/C1R9或C1F2/C1R引物對(duì)可在WT中擴(kuò)增出切點(diǎn)處151 bp或301 bp片段,用C1F8/C1F2或C1R/C1R9可在C1I5中擴(kuò)增出反轉(zhuǎn)后剪接處的219 bp或233 bp片段,C1D2和CID3中未檢測到以上4個(gè)片段;用片段兩側(cè)引物C1F8/C1R可在WT和C1I5中擴(kuò)增出1229 bp條帶,C1D2和CID3中擴(kuò)增條帶縮短為290 bp;D:C1F8/C1R在C1D2和C1D3細(xì)胞中的擴(kuò)增產(chǎn)物的測序結(jié)果示意圖;E:RNA-seq數(shù)據(jù)分析比較WT和C1D2或C1D3細(xì)胞中基因簇的轉(zhuǎn)錄水平。

采用RNA-seq分析方法檢測比較C1D2和C1D3單克隆與野生型A549細(xì)胞的轉(zhuǎn)錄水平(圖2E),發(fā)現(xiàn)在C1D2單克隆細(xì)胞中,表達(dá)降低64%,表達(dá)降低99%,表達(dá)降低97.6%,但是表達(dá)升高1.62倍,基因簇其他基因沒有變化。在C1D3單克隆細(xì)胞中,表達(dá)降低52%,表達(dá)降低93%,表達(dá)降低99%,但是表達(dá)升高1.75倍,基因簇其他基因沒有變化,這與C1D2克隆結(jié)果一致??傊?,刪除顯著影響基因簇的基因轉(zhuǎn)錄。

2.3 CRISPR反轉(zhuǎn)hCBS1片段對(duì)人細(xì)胞系A(chǔ)549中UGT1基因簇轉(zhuǎn)錄的影響

CTCF在DNA上的結(jié)合具有方向性,參與形成染色質(zhì)環(huán)化,在三維基因組復(fù)雜的空間結(jié)構(gòu)的形成和維持中起關(guān)鍵作用,上述研究證明刪除顯著影響基因簇的轉(zhuǎn)錄,表明是1基因簇的一個(gè)重要的轉(zhuǎn)錄調(diào)控元件。是反向的,那么如果把反轉(zhuǎn),變?yōu)檎颍虼鼐植康幕虮磉_(dá)會(huì)有怎樣的變化呢?

本研究在A549細(xì)胞中轉(zhuǎn)入SpCas9和sgRNAs (sgC1U和sgC1D,圖3A)表達(dá)質(zhì)粒后,在轉(zhuǎn)染細(xì)胞群中檢測到反轉(zhuǎn)的基因型,進(jìn)一步對(duì)轉(zhuǎn)染細(xì)胞群進(jìn)行單克隆化,獲得90個(gè)單克隆細(xì)胞株,對(duì)這些單克隆細(xì)胞進(jìn)行基因型鑒定,發(fā)現(xiàn)C1I4單克隆細(xì)胞株為反轉(zhuǎn)純合型。片段反轉(zhuǎn)示意圖如圖3B所示,Cas9在sgCIU和sgC1D引導(dǎo)下,特異性識(shí)別片段兩側(cè)靶標(biāo)位置并切割產(chǎn)生兩個(gè)切口,反轉(zhuǎn)后兩個(gè)切口分別連接到染色體斷點(diǎn)處形成片段反轉(zhuǎn)的編輯細(xì)胞。

C1I4的基因型鑒定結(jié)果如圖3C所示,切口處原野生型片段(上游C1F5/C1R6引物對(duì)PCR產(chǎn)物244 bp、下游C1F2/C1R引物對(duì)PCR產(chǎn)物301 bp)檢測為陰性,表明野生基因型不存在;用反轉(zhuǎn)檢測引物對(duì)C1F/C1F2或C1R/C1R2可在C1I4中擴(kuò)增出257 bp或289 bp大小的反轉(zhuǎn)條帶,表明發(fā)生反轉(zhuǎn);用片段兩側(cè)引物C1F/C1R可擴(kuò)增出和野生型條帶大小相當(dāng)約977 bp的條帶。對(duì)片段兩側(cè)引物C1F/C1R擴(kuò)增的產(chǎn)物進(jìn)一步測序分析,發(fā)現(xiàn)C1I4單克隆細(xì)胞株中編輯片段上下游的切割位點(diǎn)均恰好在PAM上游3 bp處(圖3D)。

采用RNA-seq分析方法檢測比較C1I4單克隆與野生型A549細(xì)胞中基因簇的轉(zhuǎn)錄水平(圖3E),發(fā)現(xiàn)當(dāng)反轉(zhuǎn)后,C1I4單克隆中和表達(dá)沒有明顯變化,但是表達(dá)降低74%,低表達(dá)的和變化幅度并不顯著,其余基因(、、、)依然處于沉默狀態(tài),幾乎不轉(zhuǎn)錄。總之,反轉(zhuǎn)主要影響基因的轉(zhuǎn)錄。

2.4 人和小鼠UGT1基因簇中CBS分布比較

人和小鼠基因簇分別長180 kb和200 kb,基因結(jié)構(gòu)相似,由高度同源且串聯(lián)排列的9個(gè)可變外顯子組成的可變區(qū)和4個(gè)恒定外顯子組成的恒定區(qū)組成(圖4A),可變區(qū)任意外顯子可被選擇性剪接到下游全套恒定外顯子上,共可形成9種轉(zhuǎn)錄本,表達(dá)9種UGT1同工酶。根據(jù)催化底物特異性,UGT1同工酶被分為膽紅素組和苯酚組,其編碼基因的可變區(qū)分別對(duì)應(yīng)圖4A中的橘黃色和綠色外顯子。膽紅素組中,人和小鼠基因?yàn)橹毕低搓P(guān)系,蛋白氨基酸序列相似度為66%。人與小鼠為直系同源關(guān)系,它們的平均氨基酸序列同源性約61%。苯酚組也有兩個(gè)分支,人與小鼠為直系同源關(guān)系,它們之間相似度為70%,小鼠的和基因是在兩個(gè)物種分開后復(fù)制衍生形成的,兩者編碼的氨基酸相似度為95%。人與小鼠基因直系同源,平均氨基酸序列相似度約67%[1,41]。除了9個(gè)功能性可變外顯子外,人和小鼠基因簇可變區(qū)內(nèi)還有多片分散排列的假基因和殘骸(relic)序列。

為解析基因簇內(nèi)分布的CBS在人和模式動(dòng)物小鼠間是否高度保守,本研究分析和比較了小鼠不同細(xì)胞和組織中基因簇的CTCF ChIP-seq數(shù)據(jù)(圖4B),包括B細(xì)胞淋巴瘤細(xì)胞系(CH12)、GATA 1-紅系祖細(xì)胞系(G1E)、第0天的胚胎干細(xì)胞(ES-B4 E0)和8周齡的心臟、腎臟、肝臟、肺,發(fā)現(xiàn)小鼠基因簇含有至少11個(gè)CTCF可結(jié)合位點(diǎn):,其中8個(gè)為正向、3個(gè)為反向,在核心序列Module#2~3處保守性較高(圖4,C和D)。比較人和小鼠基因簇中的CBS分布和方向性,發(fā)現(xiàn)小鼠基因簇含有CBS數(shù)目比人基因簇更多。

3 討論

脊椎動(dòng)物表達(dá)具有組織特異性,同一個(gè)體不同器官的表達(dá)水平有很大的差別[1,42],這和組織特異性轉(zhuǎn)錄因子及其配體激活密切相關(guān)[7]。UGT葡醛酸轉(zhuǎn)移酶的多樣性和其在各種組織中的表達(dá)差異與特定疾病以及治療藥物的療效或毒性有關(guān),新生兒黃疸、克里格勒-納賈爾(Crigler-Najjar)綜合征(Ⅰ型和Ⅱ型)和吉爾伯氏(Gilbert)綜合征等遺傳性高膽紅素疾病[43,44]均是由多態(tài)性或基因突變造成的膽紅素代謝功能降低或缺失引起,其中大部分變異位點(diǎn)位于非編碼區(qū)。非編碼區(qū)在基因簇的轉(zhuǎn)錄調(diào)控中發(fā)揮重要作用[45]。為了解析這些非編碼區(qū)如何在復(fù)雜的染色質(zhì)三維空間結(jié)構(gòu)上調(diào)控基因簇的表達(dá)以及在染色體拓?fù)浣Y(jié)構(gòu)域內(nèi)各啟動(dòng)子與遠(yuǎn)端DNA調(diào)控元件之間的特異性成環(huán)機(jī)制,本研究首次聚焦基因簇中染色質(zhì)架構(gòu)蛋白CTCF及其結(jié)合元件CBS,探索其對(duì)基因簇表達(dá)的影響。

圖3 CRISPR反轉(zhuǎn)hCBS1片段對(duì)人細(xì)胞系A(chǔ)549中UGT1基因簇轉(zhuǎn)錄的影響

A:CRISPR反轉(zhuǎn)片段所使用的成對(duì)sgRNA (sgCIU和sgC1D)以及各鑒定引物的位置示意圖;B:片段反轉(zhuǎn)示意圖。Cas9在sgCIU和sgC1D引導(dǎo)下,特異性識(shí)別片段兩側(cè)靶標(biāo)位置并切割產(chǎn)生兩個(gè)切口,反轉(zhuǎn)后兩個(gè)切口分別連接到染色體斷點(diǎn)處形成片段反轉(zhuǎn)的編輯細(xì)胞;C:片段反轉(zhuǎn)的單克隆A549細(xì)胞株C1I4的基因型鑒定結(jié)果。野生型A549細(xì)胞(WT)被作為PCR鑒定對(duì)照;用C1F5/C1R6或C1F2/C1R引物對(duì)可在WT中擴(kuò)增出切點(diǎn)處244 bp或301 bp的野生型條帶,C1I4中檢測結(jié)果均為陰性;用CBS1反轉(zhuǎn)檢測引物對(duì)C1F/C1F2或C1R/C1R2可在C1I4中擴(kuò)增出257 bp或289 bp片段;用片段兩側(cè)引物C1F8/C1R可在WT、C1I4中擴(kuò)增出約977 bp條帶;D:C1F/C1R在C1I4細(xì)胞中的擴(kuò)增產(chǎn)物的測序結(jié)果示意圖;E:RNA-seq數(shù)據(jù)分析比較WT和C1I4細(xì)胞中基因簇的轉(zhuǎn)錄水平。

圖4 小鼠Ugt1基因簇內(nèi)CTCF結(jié)合位點(diǎn)分布和方向性預(yù)測

A:人和小鼠基因簇內(nèi)各同工酶基因的線性進(jìn)化關(guān)系示意圖。人位于2號(hào)染色體,小鼠位于1號(hào)染色體,它們都類似于原鈣粘蛋白基因簇,由可變區(qū)和恒定區(qū)組成,可變區(qū)內(nèi)串聯(lián)排列著9個(gè)高度相似的可變區(qū)外顯子,下游恒定區(qū)包含4個(gè)恒定區(qū)外顯子。人基因簇可變區(qū)還有4個(gè)假基因和1個(gè)殘骸(relic)序列,而小鼠可變區(qū)含有5個(gè)假基因和4個(gè)殘骸序列。垂直框代表基因簇外顯子并用不同顏色標(biāo)記,綠色表示苯酚組可變外顯子,橘黃色表示膽紅素組可變外顯子,紅色表示恒定外顯子,灰色表示假基因或殘骸序列,分別用Ψ和r表示,直系同源基因之間由黑色虛線相連,藍(lán)色三角形表示CBS方向;B:小鼠基因簇內(nèi)CBS分布。小鼠B細(xì)胞淋巴瘤CH12、GATA 1-紅系祖細(xì)胞G1E和第0天的胚胎干細(xì)胞ES-B4 E0,以及小鼠(C57BL/6)8周齡心臟、腎臟、肝臟和肺的CTCF ChIP-seq數(shù)據(jù)顯示小鼠基因簇內(nèi)至少有11個(gè)CTCF可結(jié)合位點(diǎn):,每個(gè)CBS方向由下方藍(lán)色三角形指示;C:小鼠基因簇內(nèi)正向CBS序列及方向性預(yù)測。Module#1~4的CBS定義為正向CBS;D:小鼠基因簇內(nèi)反向CBS序列及方向性預(yù)測。Module#4~1的CBS定義為反向CBS。

本研究分析比較了人和模式動(dòng)物小鼠的不同細(xì)胞或組織中CTCF在基因簇的富集情況,發(fā)現(xiàn)人和小鼠的基因簇中CBS分布差異較大。通過對(duì)人和小鼠基因簇內(nèi)的CBS方向以及保守性的初步分析,發(fā)現(xiàn)這些CBS基序在Module#2-3處保守度較大。然后以人肺癌細(xì)胞系A(chǔ)549為模型,通過CTCF和cohesin蛋白靶向shRNA病毒感染細(xì)胞以敲低細(xì)胞中的CTCF和cohesin蛋白,發(fā)現(xiàn)CTCF敲低后,A549細(xì)胞中高度表達(dá)的和的轉(zhuǎn)錄水平顯著降低,而升高。cohesin蛋白敲低后,表達(dá)顯著升高,而和沒有變化。該現(xiàn)象表明CTCF和cohesin蛋白參與調(diào)控基因簇的轉(zhuǎn)錄表達(dá),可能通過影響局部基因簇的染色質(zhì)構(gòu)象而改變各啟動(dòng)子和增強(qiáng)子之間的相互作用。最后,本研究發(fā)現(xiàn)人和小鼠的所有基因啟動(dòng)子附近沒有CBS位點(diǎn),這與基因結(jié)構(gòu)類似的原鈣粘蛋白基因簇[8,46,47]存在明顯不同:原鈣粘蛋白基因簇中幾乎每個(gè)啟動(dòng)子附近都有CBS位點(diǎn),且CBS位點(diǎn)的位置和方向在人和小鼠原鈣粘蛋白基因簇中高度保守[48]。

進(jìn)一步通過CRISPR介導(dǎo)的DNA片段編輯技術(shù)研究了人基因簇內(nèi)高度保守的CTCF結(jié)合位點(diǎn)對(duì)轉(zhuǎn)錄的影響。同樣以人肺癌細(xì)胞系A(chǔ)549為研究模型,利用CRISPR/Cas9系統(tǒng)將片段刪除。從RNA-seq數(shù)據(jù)可以看出,刪除明顯降低了、和的表達(dá)。當(dāng)把方向反轉(zhuǎn)為正向時(shí),轉(zhuǎn)錄水平明顯降低。這可能是因?yàn)閯h除或反轉(zhuǎn)會(huì)改變?nèi)旧|(zhì)空間構(gòu)象,影響增強(qiáng)子和啟動(dòng)子之間遠(yuǎn)距離相互作用,例如,刪除使得調(diào)控、和啟動(dòng)子的增強(qiáng)子空間上遠(yuǎn)離這些啟動(dòng)子,使它們的轉(zhuǎn)錄活性降低。A549細(xì)胞中主要分布有2個(gè)CBS:和,兩者方向均向左(圖1A),反轉(zhuǎn)后僅表達(dá)下調(diào),可能是因?yàn)榉崔D(zhuǎn)后與方向相背,造成與下游CBS成環(huán)、與上游CBS成環(huán),使得和之間的3個(gè)基因和不再處于同一個(gè)調(diào)控拓?fù)溆騼?nèi),它們具體受哪些增強(qiáng)子調(diào)控有待進(jìn)一步研究。盡管如此,該現(xiàn)象表明參與調(diào)節(jié)、和的轉(zhuǎn)錄,是基因簇的潛在轉(zhuǎn)錄調(diào)控元件。

綜上所述,本研究證明了CTCF和cohesin蛋白參與調(diào)控人基因簇的轉(zhuǎn)錄,刪除或反轉(zhuǎn)該基因簇內(nèi)高度保守的CTCF結(jié)合位點(diǎn)顯著改變該基因簇活性基因的轉(zhuǎn)錄,這可能源于CTCF帶來的染色質(zhì)構(gòu)象改變。本研究工作將為后續(xù)對(duì)的三維基因轉(zhuǎn)錄調(diào)控機(jī)制研究奠定基礎(chǔ),為臨床合理用藥和人類疾病的預(yù)防提供科學(xué)依據(jù)。

[1] Zhang T, Haws P, Wu Q. Multiple variable first exons: a mechanism for cell- and tissue-specific gene regulation., 2004, 14(1): 79–89.

[2] Huang H, Wu Q. Cloning and comparative analyses of the zebrafish Ugt repertoire reveal its evolutionary diversity., 2010, 5(2): e9144.

[3] Li C, Wu Q. Adaptive evolution of multiple-variable exons and structural diversity of drug-metabolizing enzymes., 2007, 7: 69.

[4] Nagar S, Blanchard RL. Pharmacogenetics of uridine diphosphoglucuronosyltransferase (UGT) 1A family members and its role in patient response to irinotecan., 2006, 38(3): 393–409.

[5] Mackenzie PI, Bock KW, Burchell B, Guillemette C, Ikushiro S, Iyanagi T, Miners JO, Owens IS, Nebert DW. Nomenclature update for the mammalian UDP glycosy-ltransferase (UGT) gene superfamily., 2005, 15(10): 677–685.

[6] Yang N, Sun R, Liao X, Aa J, Wang G. UDP-glucuron-osyltransferases (UGTs) and their related metabolic cross- talk with internal homeostasis: a systematic review of UGT isoforms for precision medicine., 2017, 121: 169–183.

[7] Rowland A, Miners JO, Mackenzie PI. The UDP-glucuro-nosyltransferases: their role in drug metabolism and detoxification., 2013, 45(6): 1121– 1132.

[8] Wu Q, Zhang T, Cheng JF, Kim Y, Grimwood J, Schmutz J, Dickson M, Noonan JP, Zhang MQ, Myers RM, Maniatis T. Comparative DNA sequence analysis of mouse and human protocadherin gene clusters., 2001, 11(3): 389–404.

[9] Tukey RH, Strassburg CP. Human UDP-glucuronosy-ltransferases: metabolism, expression, and disease., 2000, 40: 581–616.

[10] Heath H, de Almeida CR, Sleutels F, Dingjan G, van de Nobelen S, Jonkers I, Ling KW, Gribnau J, Renkawitz R, Grosveld F, Hendriks RW, Galjart N. CTCF regulates cell cycle progression of alphabeta T cells in the thymus., 2008, 27(21): 2839–2850.

[11] de Wit E, Vos ES, Holwerda SJ, Valdes-Quezada C, Verstegen MJ, Teunissen H, Splinter E, Wijchers PJ, Krijger PH, de Laat W. CTCF binding polarity determines chromatin looping., 2015, 60(4): 676–684.

[12] Ong CT, Corces VG. CTCF: an architectural protein bridging genome topology and function., 2014, 15(4): 234–246.

[13] Huang H, Wu Q. CRISPR double cutting through the labyrinthine architecture of 3D genomes., 2016, 43(5): 273–288.

[14] Kim TH, Abdullaev ZK, Smith AD, Ching KA, Loukinov DI, Green RD, Zhang MQ, Lobanenkov VV, Ren B. Analysis of the vertebrate insulator protein CTCF-binding sites in the human genome., 2007, 128(6): 1231–1245.

[15] Nakahashi H, Kieffer Kwon KR, Resch W, Vian L, Dose M, Stavreva D, Hakim O, Pruett N, Nelson S, Yamane A, Qian J, Dubois W, Welsh S, Phair RD, Pugh BF, Lobanenkov V, Hager GL, Casellas R. A genome-wide map of CTCF multivalency redefines the CTCF code., 2013, 3(5): 1678–1689.

[16] Faure AJ, Schmidt D, Watt S, Schwalie PC, Wilson MD, Xu H, Ramsay RG, Odom DT, Flicek P. Cohesin regulates tissue-specific expression by stabilizing highly occupied cis-regulatory modules., 2012, 22(11): 2163–2175.

[17] Yusufzai TM, Tagami H, Nakatani Y, Felsenfeld G. CTCF tethers an insulator to subnuclear sites, suggesting shared insulator mechanisms across species., 2004, 13(2): 291–298.

[18] Watrin E, Kaiser FJ, Wendt KS. Gene regulation and chromatin organization: relevance of cohesin mutations to human disease., 2016, 37: 59–66.

[19] Kagey MH, Newman JJ, Bilodeau S, Zhan Y, Orlando DA, van Berkum NL, Ebmeier CC, Goossens J, Rahl PB, Levine SS, Taatjes DJ, Dekker J, Young RA. Mediator and cohesin connect gene expression and chromatin architecture., 2010, 467(7314): 430–435.

[20] Wendt KS, Yoshida K, Itoh T, Bando M, Koch B, Schirghuber E, Tsutsumi S, Nagae G, Ishihara K, Mishiro T, Yahata K, Imamoto F, Aburatani H, Nakao M, Imamoto N, Maeshima K, Shirahige K, Peters JM. Cohesin mediates transcriptional insulation by CCCTC-binding factor., 2008, 451(7180): 796–801.

[21] Splinter E, Heath H, Kooren J, Palstra RJ, Klous P, Grosveld F, Galjart N, de Laat W. CTCF mediates long- range chromatin looping and local histone modification in the beta-globin locus., 2006, 20(17): 2349– 2354.

[22] Handoko L, Xu H, Li G, Ngan CY, Chew E, Schnapp M, Lee CW, Ye C, Ping JL, Mulawadi F, Wong E, Sheng J, Zhang Y, Poh T, Chan CS, Kunarso G, Shahab A, Bourque G, Cacheux-Rataboul V, Sung WK, Ruan Y, Wei CL. CTCF-mediated functional chromatin interactome in pluripotent cells., 2011, 43(7): 630–638.

[23] Guo Y, Monahan K, Wu H, Gertz J, Varley KE, Li W, Myers RM, Maniatis T, Wu Q. CTCF/cohesin-mediated DNA looping is required for protocadherin α promoter choice., 2012, 109(51): 21081– 21086.

[24] Rao SS, Huntley MH, Durand NC, Stamenova EK, Bochkov ID, Robinson JT, Sanborn AL, Machol I, Omer AD, Lander ES, Aiden EL. A 3D map of the human genome at kilobase resolution reveals principles of chromatin looping., 2014, 159(7): 1665–1680.

[25] Guo Y, Xu Q, Canzio D, Shou J, Li J, Gorkin DU, Jung I, Wu H, Zhai Y, Tang Y, Lu Y, Wu Y, Jia Z, Li W, Zhang MQ, Ren B, Krainer AR, Maniatis T, Wu Q. CRISPR inversion of CTCF Sites alters genome topology and enhancer/promoter function., 2015, 162(4): 900–910.

[26] Li JH, Shou J, Wu Q. DNA fragment editing of genomes by CRISPR/Cas9., 2015, 37(10): 992–1002.李金環(huán), 壽佳, 吳強(qiáng). CRISPR/Cas9系統(tǒng)在基因組DNA片段編輯中的應(yīng)用. 遺傳, 2015, 37(10): 992–1002.

[27] Shou J, Li J, Liu Y, Wu Q. Precise and predictable CRISPR chromosomal rearrangements reveal principles of Cas9-Mediated nucleotide insertion., 2018, 71(4): 498-509.e4.

[28] Doudna JA, Charpentier E. Genome editing. The new frontier of genome engineering with CRISPR-Cas9., 2014, 346(6213): 1258096.

[29] Fellmann C, Gowen BG, Lin PC, Doudna JA, Corn JE. Cornerstones of CRISPR-Cas in drug discovery and therapy., 2017, 16(2): 89–100.

[30] Li J, Shou J, Guo Y, Tang Y, Wu Y, Jia Z, Zhai Y, Chen Z, Xu Q, Wu Q. Efficient inversions and duplications of mammalian regulatory DNA elements and gene clusters by CRISPR/Cas9., 2015, 7(4): 284–298.

[31] Ziebarth JD, Bhattacharya A, Cui Y. CTCFBSDB 2.0: a database for CTCF-binding sites and genome organization., 2012, 41(Database issue): D188–194.

[32] Trapnell C, Roberts A, Goff L, Pertea G, Kim D, Kelley DR, Pimentel H, Salzberg SL, Rinn JL, Pachter L. Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks., 2012, 7(3): 562–578.

[33] Rhee HS, Pugh BF. Comprehensive genome-wide protein-DNA interactions detected at single-nucleotide resolution., 2011, 147(6): 1408–1419.

[34] Yin M, Wang J, Wang M, Li X, Zhang M, Wu Q, Wang Y. Molecular mechanism of directional CTCF recognition of a diverse range of genomic sites., 2017, 27(11): 1365–1377.

[35] Schmidt D, Schwalie PC, Ross-Innes CS, Hurtado A, Brown GD, Carroll JS, Flicek P, Odom DT. A CTCF-independent role for cohesin in tissue-specific transcription., 2010, 20(5): 578–588.

[36] Rubio ED, Reiss DJ, Welcsh PL, Disteche CM, Filippova GN, Baliga NS, Aebersold R, Ranish JA, Krumm A. CTCF physically links cohesin to chromatin., 2008, 105(24): 8309–8314.

[37] Ran FA, Hsu PD, Lin CY, Gootenberg JS, Konermann S, Trevino AE, Scott DA, Inoue A, Matoba S, Zhang Y, Zhang F. Double nicking by RNA-guided CRISPR Cas9 for enhanced genome editing specificity., 2013, 154(6): 1380–1389.

[38] Bao A, Burritt DJ, Chen H, Zhou X, Cao D, Tran LP. The CRISPR/Cas9 system and its applications in crop genome editing., 2019, 39(3): 321–336.

[39] Jiang F, Doudna JA. CRISPR-Cas9 structures and mechanisms., 2017, 46: 505–529.

[40] Jinek M, Chylinski K, Fonfara I, Hauer M, Doudna JA, Charpentier E. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity., 2012, 337(6096): 816–821.

[41] Owens IS, Basu NK, Banerjee R. UDP-Glucuronosy-ltransferases: gene structures of UGT1 and UGT2 families., 2005, 400: 1–22.

[42] Wang Y, Huang H, Wu Q. Characterization of the zebrafish Ugt repertoire reveals a new class of drug-metabolizing UDP glucuronosyltransferases., 2014, 86(1): 62–75.

[43] Bartlett MG, Gourley GR. Assessment of UGT polymer-phisms and neonatal jaundice., 2011, 35(3): 127–133.

[44] Che F, Luo ZY. Research progress of UGT1A1 gene in the pathogenesis of Gilbert and Crigler-Najjar syndromes., 2015, 29(3): 219–222.車芳, 駱子義. UGT1A1基因在Gilbert綜合征及Crigler-Najjar綜合征發(fā)病機(jī)制中研究進(jìn)展. 中華實(shí)用診斷與治療雜志, 2015, 29(3): 219–222.

[45] Wang LY, Huang HY, Wu Q. The diversity of DNA fragment editing by CRISPR/Cas9 in highly homologous or repetitive sequences., 2017, 39(4): 313–325.汪樂洋, 黃海燕, 吳強(qiáng). 利用CRISPR/Cas9對(duì)基因組中高度同源DNA片段編輯多樣性的遺傳學(xué)研究. 遺傳, 2017, 39(04): 313–325.

[46] Wu Q, Maniatis T. A striking organization of a large family of human neural cadherin-like cell adhesion genes., 1999, 97(6): 779–790.

[47] Wu Q. Comparative genomics and diversifying selection of the clustered vertebrate protocadherin genes., 2005, 169(4): 2179–2188.

[48] Zhai Y, Xu Q, Guo Y, Wu Q. Characterization of a cluster of CTCF-binding sites in a protocadherin regulatory region., 2016, 38(4): 323–336.翟亞男, 許泉, 郭亞, 吳強(qiáng). 原鈣粘蛋白基因簇調(diào)控區(qū)域中成簇的CTCF結(jié)合位點(diǎn)分析. 遺傳, 2016, 38(04): 323–336.

Chromatin architectural protein CTCF regulates gene expression of thecluster

Xiaofei Zheng, Haiyan Huang, Qiang Wu

UDP-glucuronosyltransferases (UGTs) are an important family of phase Ⅱ drug-metabolizing enzymes that catalyze the glucuronidation of numerous endogenous or exogenous small compounds. The aberrant expression ofisoforms causes many diseases, such as hyperbilirubinemia and affect drug efficacy or toxicity. Understanding mechanisms ofgene regulation will provide scientific foundations for disease prevention and personalized or precision medicine. Vertebratefamily genes can be divided intoandsubfamilies. Similar to the protocadherin, immunoglobulin, and T-cell receptor gene clusters and different from thegene cluster, thegene cluster is organized into variable and constant regions. Thevariable region contains a tandem array of variable exons, each of which can be alternatively spliced to a single set of 4 downstream constant exons, generating at least ninemRNAs that could be translated into different UGT1 glucuronyltransferase isoforms. Our previous work reveals that the relative orientations and locations of CTCF binding sites play a key role in the three-dimensional organization of the mammalian genomes in cell nuclei. Thus in order to study the transcriptional mechanisms ofgene cluster, the distributions and orientations of CTCF binding sites (CBSs) are analyzed and compared between human and mousegene clusters. We find that the CBSs in thegene cluster are not conserved between human and mouse species. We show that CTCF and cohesin regulate the transcription of thegene cluster by knocking down the CTCF or the cohesin subunit SMC3 in the human A549 cell line. By using CRISPR DNA-fragment editing, we deleted and inverted. By RNA-seq experiments, we find thatdeletion results in a significant decrease of levels of the,andgene expression and thatinversion results in a significant decrease of levels of thegene expression. Our data suggest that the CTCF binding siteplays an important regulatory role in the regulation ofgene expression, providing an experimental basis for further mechanistic studies of the 3D genome regulation of thegenecluster.

; CTCF; CRISPR-Cas9;DNA fragment editing; transcriptional regulation

2019-03-15;

2019-04-08

國家自然科學(xué)基金項(xiàng)目(編號(hào):81872944, 31470820, 81302861)資助[Supported by the National Natural Science Foundation of China (Nos. 81872944, 31470820, 81302861)]

鄭曉飛,碩士研究生,專業(yè)方向:遺傳學(xué)。E-mail: 1159171993@qq.com

黃海燕,博士,副研究員,研究方向:藥物分子遺傳學(xué)。E-mail: hy_huang@sjtu.edu.cn

吳強(qiáng),博士,教授,研究方向:基因表達(dá)調(diào)控及神經(jīng)發(fā)育。E-mail: qwu123@gmail.com

10.16288/j.yczz.19-072

2019/5/28 15:50:37

URI: http://kns.cnki.net/kcms/detail/11.1913.R.20190528.1550.002.html

(責(zé)任編委: 方向東)

猜你喜歡
基因簇單克隆外顯子
外顯子跳躍模式中組蛋白修飾的組合模式分析
鏈霉菌沉默基因簇激活在天然產(chǎn)物生物合成中的研究進(jìn)展
外顯子組測序助力產(chǎn)前診斷胎兒骨骼發(fā)育不良
單克隆抗體在新型冠狀病毒和其他人冠狀病毒中的研究進(jìn)展
冬瓜高通量轉(zhuǎn)錄組測序及分析
外顯子組測序助力產(chǎn)前診斷胎兒骨骼發(fā)育不良
抗HPV18 E6多肽單克隆抗體的制備及鑒定
TSH受體單克隆抗體研究進(jìn)展
單克隆抗體制備的關(guān)鍵因素
腸球菌萬古霉素耐藥基因簇遺傳特性
靖江市| 涡阳县| 江口县| 勐海县| 新泰市| 阿巴嘎旗| 米脂县| 即墨市| 加查县| 东台市| 长葛市| 伊宁县| 汶上县| 韶关市| 三亚市| 红原县| 永昌县| 应用必备| 汤原县| 磐安县| 高碑店市| 鹤岗市| 义乌市| 紫云| 新化县| 浙江省| 鄂温| 常德市| 土默特右旗| 墨玉县| 祁东县| 庆阳市| 泰顺县| 海丰县| 堆龙德庆县| 萨嘎县| 阜城县| 饶河县| 交口县| 南投县| 井陉县|