轉(zhuǎn)錄因子“足跡”編碼一部龐大的人類調(diào)控“辭典”
調(diào)控因子與基因組DNA的結(jié)合能夠保護(hù)相關(guān)的基因序列不被胰脫氧核糖核酸酶(DNase I)剪切,并留下具有核苷酸解析度的“足跡(footprint)”。
Neph等用基因組DNase I足跡法處理41種不同的細(xì)胞和組織,檢測了4 500萬個(gè)位于調(diào)控區(qū)的轉(zhuǎn)錄因子占位事件(代表840萬個(gè)不同短序列元件的差異結(jié)合)。他們發(fā)現(xiàn)這些小的基因組序列區(qū)間(粗略估計(jì)兩倍于外顯子的長度)編碼了一系列DNA結(jié)合蛋白識別的保守序列,使人類順式調(diào)控“辭典(lexicon)”的容量幾乎增加一倍。他們還發(fā)現(xiàn)影響等位染色質(zhì)狀態(tài)的遺傳性變異體集中在這些“足跡”中,并優(yōu)先被遮蔽而免于DNA甲基化。高分辨率的DNase I剪切模式反映了進(jìn)化在核苷酸水平上的保守,并烙下了DNA和蛋白質(zhì)界面的結(jié)晶拓?fù)鋵W(xué)印記,提示在進(jìn)化過程中轉(zhuǎn)錄因子結(jié)構(gòu)已經(jīng)在基因組DNA序列中留下了印記。他們據(jù)此發(fā)現(xiàn)了一個(gè)50 bp的“足跡”序列,該序列能在數(shù)以千計(jì)的人類啟動(dòng)子中精確地定位轉(zhuǎn)錄起始點(diǎn)。最后,他們還揭示了一個(gè)宏大的調(diào)節(jié)因子識別基序的集合,這些識別基序無論是在序列上還是在功能上都高度保守,并且表現(xiàn)出細(xì)胞選擇性的占位模式,類似于大部分與發(fā)育、分化和多能性相關(guān)的調(diào)控因子。
Nature, 2012, 489(7414):83-90(張嬋娟)