国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

雞T細(xì)胞受體γ鏈基因位點(diǎn)重新測(cè)序和組裝

2015-10-13 08:25:20馬俊平楊犀律娜劉飛陳燕朱寶利
遺傳 2015年6期
關(guān)鍵詞:區(qū)段克隆基因組

馬俊平,楊犀,律娜,劉飛,陳燕,3,朱寶利

1.中國(guó)科學(xué)院微生物研究所,北京 100101;

2.中國(guó)科學(xué)院大學(xué),北京 100049;

3.中國(guó)農(nóng)業(yè)科學(xué)院北京畜牧獸醫(yī)研究所ASTIP-IAS03,北京 100193

雞T細(xì)胞受體γ鏈基因位點(diǎn)重新測(cè)序和組裝

馬俊平1,2,楊犀1,2,律娜1,劉飛1,陳燕1,3,朱寶利1

1.中國(guó)科學(xué)院微生物研究所,北京 100101;

2.中國(guó)科學(xué)院大學(xué),北京 100049;

3.中國(guó)農(nóng)業(yè)科學(xué)院北京畜牧獸醫(yī)研究所ASTIP-IAS03,北京 100193

動(dòng)物T細(xì)胞受體(T cell receptor,TCR)基因由多個(gè)不同的高度同源的基因家族組成,通過(guò)全基因組測(cè)序很難獲得準(zhǔn)確的基因序列和排列位置。文章通過(guò)在NCBI中發(fā)布的雞TCR的γ鏈(TCRγ或TRG)基因片段序列定位了雞TRG基因所在區(qū)域,并確定了與雞TRG基因位點(diǎn)對(duì)應(yīng)的細(xì)菌人工染色體(BAC)克隆(CH261-174P24)。對(duì)該克隆進(jìn)行高通量的重新測(cè)序和組裝后,得到含有10個(gè)scaffolds的基因組草圖,較完整地覆蓋了雞TRG基因位點(diǎn)及兩側(cè)區(qū)域。通過(guò)PCR擴(kuò)增和測(cè)序證明了scaffold內(nèi)部結(jié)構(gòu)的正確性,校正了雞參考基因組TRG基因位點(diǎn)一個(gè)可變基因和一個(gè)缺口序列(gap)附近各一處錯(cuò)誤序列,以及可變基因區(qū)多處序列錯(cuò)誤。文章通過(guò)校正雞參考基因組TRG基因位點(diǎn)的序列,為雞TRA/D和TRB基因位點(diǎn)的基因組序列分析提供了新方法。

雞;T細(xì)胞受體(TCR);伽馬鏈(TCRγ或TRG)基因位點(diǎn);測(cè)序;組裝

T細(xì)胞受體(T cell receptor,TCR)是T淋巴細(xì)胞表面特異性識(shí)別抗原的受體,在機(jī)體的免疫應(yīng)答和免疫調(diào)節(jié)中發(fā)揮著重要作用。對(duì)TCR基因結(jié)構(gòu)與功能的研究,是深入探索機(jī)體免疫應(yīng)答機(jī)理的重要內(nèi)容之一。

對(duì)人(Homo sapiens)和小鼠(Mus musculus)TCR的研究發(fā)現(xiàn)[1~4],TCR包括α、β、γ和δ 4種肽鏈,以兩種形式存在,它們是由二硫鍵連接形成的α/β或γ/δ異二聚體蛋白鏈。在胚系中,編碼TCR的基因序列是由多個(gè)可變的基因區(qū)域組成。TCRβ和TCRδ基因位點(diǎn)包括可變基因區(qū)(Variable gene region,V基因區(qū))、多樣基因區(qū)(Diversity gene region,D基因區(qū))、結(jié)合基因區(qū)(Joining gene region,J基因區(qū))和恒定基因區(qū)(Constant gene region,C基因區(qū))等,TCRα和TCRγ基因位點(diǎn)由V基因區(qū)、J基因區(qū)和C基因區(qū)組成。但這些基因之間有較高同源性,且基因個(gè)數(shù)和排列順序等較難確定,尤其是V基因區(qū)的基因數(shù)目眾多且以基因簇的形式存在。這些都成為TCR研究的難點(diǎn),使得TCR基因在染色體上很難進(jìn)行準(zhǔn)確定位。20世紀(jì)末期,隨著以Sanger雙脫氧鏈終止法為代表的第一代測(cè)序技術(shù)在研究領(lǐng)域的廣泛應(yīng)用,人和小鼠TCR基因位點(diǎn)的序列和結(jié)構(gòu)才逐漸被解析清楚,其功能也得到了注釋。

但到目前為止,雞TCR基因的相關(guān)研究開展得較少,其序列和結(jié)構(gòu)并不完全清晰。20世紀(jì)90年代以來(lái),Cooper等相繼發(fā)現(xiàn)了雞TCR的α、β、γ、δ等4種亞型,并對(duì)胸腺、肝臟等器官中的部分TCR基因序列進(jìn)行了測(cè)定和分析[5~13]。2004年,國(guó)際雞基因組測(cè)序中心在《自然》雜志上公布了紅原雞(Gallus gallus)的參考基因組草圖[14],采用鳥槍法對(duì)紅原雞的全基因組進(jìn)行了測(cè)序和組裝,并分別于2006年和2011年進(jìn)行過(guò)兩次補(bǔ)充。即便如此,NCBI數(shù)據(jù)庫(kù)中雞參考基因組上TCR基因位點(diǎn)仍然存在很多缺口序列。

本研究擬通過(guò)對(duì)雞TCRγ(TRG)基因片段序列的分析,在紅原雞BAC克隆文庫(kù)(CHORI-261)中挑選包含雞TRG基因的BAC克隆,采用Illumina公司的Miseq高通量測(cè)序系統(tǒng)對(duì)這些克隆進(jìn)行重新測(cè)序和組裝,以期獲得雞TRG基因位點(diǎn)的草圖,并對(duì)雞參考基因組上TRG基因位點(diǎn)的錯(cuò)誤信息進(jìn)行校正。

1 材料和方法

1.1 雞TCRγ鏈(TRG鏈)編碼序列的定位

從NCBI數(shù)據(jù)庫(kù)中下載雞TRG鏈的編碼序列。通過(guò)參考文獻(xiàn)中報(bào)道的雞TRG基因的一些特征[8~11],分別提取V區(qū)、J區(qū)和C區(qū)基因片段。然后與雞參考基因組(WUGSC2.1/galGal3)進(jìn)行比對(duì)。根據(jù)基因片段密集區(qū)域判斷雞TRG基因位點(diǎn)區(qū)間。

1.2 BAC克隆的確定

根據(jù)加州大學(xué)圣克魯茲分校基因組網(wǎng)站上(UCSC Genome Browser)雞參考基因組注釋的BAC克隆信息(galGal3),參照上一步定位的雞TRG基因位點(diǎn)區(qū)間,在雞TRG基因位點(diǎn)上下游約50~100 kb范圍內(nèi)挑選出載有雞全部TRG基因的1個(gè)BAC克隆,編號(hào)為CH261-174P24。

該克隆CHORI-261-174P24(以下簡(jiǎn)稱克隆174P24)由奧克蘭兒童醫(yī)院及研究中心(Children's Hospital Oakland research Institute,CHORI)構(gòu)建(網(wǎng)站:http: //bacpac.chori.org/library.php?id=120),所用載體為質(zhì)粒pTARBAC2.1,此BAC克隆長(zhǎng)度約為218 kb。

1.3 BAC DNA的提取

克隆174P24以半固體穿刺法保存,經(jīng)過(guò)在含有氯霉素(終濃度為12.5 ug/mL)的固體LB平板上劃線和活化培養(yǎng),得到單克隆。挑取單克隆于液體LB培養(yǎng)基中,采用氯霉素做誘導(dǎo),進(jìn)行過(guò)夜培養(yǎng)。利用QIAGEN公司的質(zhì)粒中量提取試劑盒(QIAGEN Plasmid Midi Kit)提取BAC DNA。

1.4 BAC DNA的初步鑒定

1.4.1 酶切鑒定

從NCBI網(wǎng)站下載克隆174P24的參考序列(雞參考基因組版本為ICGSC Gallus_gallus-4.0/galGal4)。運(yùn)用NEBcutter2.0軟件預(yù)測(cè)參考序列的限制性內(nèi)切酶酶切位點(diǎn)。在預(yù)測(cè)結(jié)果里篩選所用限制性內(nèi)切酶,篩選標(biāo)準(zhǔn)為:(1)在參考序列中酶切位點(diǎn)較少,以便于識(shí)別產(chǎn)物條帶;(2)需為常用限制性內(nèi)切酶,以便購(gòu)買和實(shí)驗(yàn)操作。經(jīng)過(guò)篩選,限制性內(nèi)切酶NotⅠ適合用于鑒定。經(jīng)內(nèi)切酶NotⅠ充分消化后,產(chǎn)物進(jìn)行脈沖場(chǎng)凝膠電泳。根據(jù)酶切產(chǎn)物的條帶初步判斷所選克隆。

1.4.2 PCR鑒定

依據(jù)克隆 174P24的已知末端序列,運(yùn)用Primer5.0軟件設(shè)計(jì)引物。以克隆174P24的DNA為模板,進(jìn)行PCR擴(kuò)增。產(chǎn)物由北京六合華大基因科技股份有限公司測(cè)序。測(cè)序序列再與該克隆末端序列比對(duì),證明所選克隆的正確性。

1.5 BAC克隆的高通量測(cè)序

克隆174P24的DNA經(jīng)純化后,采用美國(guó)柏爾生物技術(shù)公司的快速DNA測(cè)序試劑盒(Bioo Scientific NEXTflexTM Rapid DNA-Seq Kit)構(gòu)建500~700 bp的測(cè)序文庫(kù)。由北京諾禾致源生物信息科技有限公司進(jìn)行雙端250 bp的MiSeq測(cè)序。

1.6 BAC克隆的組裝、分析和證明

運(yùn)用HTQC軟件[15]和Bowtie軟件對(duì)測(cè)序的原始reads進(jìn)行預(yù)處理。獲得的高質(zhì)量序列對(duì),使用ABySS軟件[16]和 Phrap軟件[17]進(jìn)行組裝。組裝得到的scaffolds使用NCBI BLAST軟件與雞參考基因組(galGal4)進(jìn)行比對(duì),并找出同源區(qū)域。比對(duì)結(jié)果及找到的同源區(qū)域使用自定義腳本進(jìn)行提取與可視化。

針對(duì)scaffolds內(nèi)部分段的連接處,運(yùn)用Primer5.0軟件分別設(shè)計(jì)引物(表1)。以克隆174P24的DNA為模板,通過(guò)PCR擴(kuò)增、測(cè)序和BLAST比對(duì)進(jìn)行證明。

2 結(jié)果與分析

2.1 雞TCRγ鏈編碼序列的定位

從NCBI數(shù)據(jù)庫(kù)中下載雞TRG鏈的編碼序列,共有203條。從中提取V基因、J基因、C基因集合與雞參考基因組(galGal3)的比對(duì)結(jié)果(圖1)顯示,雞TRG基因定位于2號(hào)染色體的約49 150~49 230 kb區(qū)間內(nèi),其中C基因區(qū)、V基因區(qū)分別處于5′端和3′端,J基因區(qū)位于兩者中間。TRG V基因平均間距約為1.5 kb。從現(xiàn)有雞TRG鏈編碼序列在雞參考基因組上的比對(duì)位置發(fā)現(xiàn),雞TRG基因位點(diǎn)只含有一個(gè)TRG C基因,包含3個(gè)外顯子。

2.2 BAC克隆的確定和初步鑒定

參照UCSC數(shù)據(jù)庫(kù)中雞參考基因組(galGal3)上注釋的BAC克隆信息,根據(jù)編碼序列比對(duì)結(jié)果定位的雞TRG基因位點(diǎn)在染色體上的位置,在雞TRG基因位點(diǎn)上下游約50~100 kb范圍內(nèi)選取了載有雞全部TRG基因的一個(gè)克隆,編號(hào)為CH261-174P24 (圖1)。該克隆位于雞參考基因組(galGal3)2號(hào)染色體的約49 109~49 313 kb區(qū)間內(nèi)。

利用內(nèi)切酶NotⅠ充分消化克隆174P24的質(zhì)粒DNA,并對(duì)產(chǎn)物進(jìn)行脈沖場(chǎng)凝膠電泳??寺?74P24經(jīng)酶切后在10 kb左右有載體DNA條帶;該克隆的插入片段中僅有一個(gè)NotⅠ酶切位點(diǎn),約220 kb的插入片段被酶切為約190 kb和約30 kb的兩條帶。酶切結(jié)果表明,該克隆含有插入片段,且大小與克隆174P24相符。此外,PCR結(jié)果表明,克隆174P24

表1 克隆174P24組裝scaffolds內(nèi)部連接處證明的引物信息

圖1 雞TRG鏈編碼序列比對(duì)到雞參考基因組的示意圖及對(duì)應(yīng)的BAC克隆位置示意圖A:雞TRG鏈已知V基因(紫色豎線)、J基因(黃色豎線)、C基因(綠色豎線)集合比對(duì)到雞參考基因組的示意圖;B:雞TRG基因?qū)?yīng)的BAC克隆及其在雞參考基因組上的位置。

經(jīng)過(guò)擴(kuò)增得到約400 bp的單一產(chǎn)物,對(duì)產(chǎn)物的測(cè)序結(jié)果與已知末端序列完全一致。推測(cè)雞TRG基因位點(diǎn)位于克隆174P24中。

2.3 BAC克隆的高通量測(cè)序

克隆174P24的測(cè)序數(shù)據(jù)量約為237 Mb,獲得了473 548條reads。其中,宿主菌基因組的污染低于1/1000;兩側(cè)read質(zhì)量均在29以上,即測(cè)序準(zhǔn)確性在99%以上;測(cè)序深度為1331倍。

2.4 BAC克隆的組裝、分析和證明

2.4.1 BAC克隆的組裝和比對(duì)分析

本研究中雞TRG鏈克隆174P24的測(cè)序數(shù)據(jù)已提交至NCBI/SRA數(shù)據(jù)庫(kù)(登錄號(hào):SRR1615248),該克隆組裝的scaffolds信息已提交至GenBank數(shù)據(jù)庫(kù)(登錄號(hào):KP058483)。本文運(yùn)用ABySS軟件和Phrap軟件對(duì)該克隆進(jìn)行組裝。組裝過(guò)程中經(jīng)過(guò)多次嘗試(k-mer值:96~192)和優(yōu)化,發(fā)現(xiàn)當(dāng)k-mer值取192時(shí)組裝獲得的scaffolds最為完整。利用NCBI BLAST軟件對(duì)得到的scaffolds與雞參考基因組(galGal4)進(jìn)行比對(duì),并找出同源區(qū)域,結(jié)果使用自定義腳本進(jìn)行提取和可視化,組裝和比對(duì)結(jié)果見圖2。

克隆174P24參考序列的GC含量分布圖顯示,在該克隆約178 kb區(qū)間內(nèi),GC含量普遍低于50%,總GC含量為39.13%;在雞TRG基因集中分布的約49 670~49 730 kb(約60 kb)區(qū)間,GC含量為42.29%,較兩側(cè)序列高。參考序列6處gap中的5處也集中在這個(gè)區(qū)間內(nèi)。從該克隆測(cè)序reads的豐度分布圖可以看出,與兩側(cè)序列比較,TRG基因片段密集的約60 kb區(qū)間內(nèi)的reads豐度稍低且分布不均勻。

圖2 雞TRG鏈克隆174P24的組裝草圖和與參考序列的比對(duì)結(jié)果1:Assembled scaffold.(測(cè)序reads組裝的scaffold(500 bp以上),上方數(shù)字表示scaffold編號(hào));2:Mapping on ref.(scaffold與參考序列的比對(duì)情況);3:ref.GC content反應(yīng)參考序列的GC含量分布,水平線代表GC含量為50%;4:ref.annotation展示參考序列的gap注釋情況(gap1~gap6:100 bp、848 bp、100 bp、150 bp、958 bp、127 bp);5:V/J/C gene mapping(從雞TRG鏈mRNA序列提取的V、J、C基因片段比對(duì)到參考序列的位置,其中綠色代表C基因,黃色代表J基因,紫色代表V基因);6:BAC clone raw reads展示測(cè)序reads的豐度分布。

表2 雞TRG基因位點(diǎn)克隆174P24組裝的scaffold信息

經(jīng)過(guò)組裝本文得到了雞TRG鏈克隆174P24的基因組草圖,該草圖包含10個(gè)長(zhǎng)度介于1677~ 79 832 bp之間的scaffolds,與參考序列的比對(duì)結(jié)果見圖2和表2。這10個(gè)scaffolds的總長(zhǎng)度為18 6931 bp,與參考序列長(zhǎng)度(約178 kb)接近,平均長(zhǎng)度約為18 kb。經(jīng)過(guò)與參考序列的比較發(fā)現(xiàn),scaffold7長(zhǎng)度為62 793 bp,位于TRG基因位點(diǎn)上游,scaffold2長(zhǎng)度為79 832 bp,位于TRG基因位點(diǎn)下游,二者總長(zhǎng)度共占10個(gè)scaffolds序列總長(zhǎng)度的78%。這兩個(gè)scaffolds組裝得比較完整,并且位置與參考序列對(duì)應(yīng)。而在TRG基因密集的60 kb區(qū)間內(nèi)有以下8個(gè)長(zhǎng)度在1677~13 242 bp間的scaffolds,包括scaffold1、scaffold3、scaffold4、scaffold5、scaffold6、scaffold8、scaffold9和scaffold10等(圖2和表2),其平均長(zhǎng)度約為5.5 kb。從圖2可以看出,以上8個(gè)scaffolds在參考序列上出現(xiàn)多處重復(fù)比對(duì)現(xiàn)象(兩個(gè)及以上scaffolds的內(nèi)部區(qū)段比對(duì)到參考序列的相同或相近位置)以及同一個(gè)scaffold分段比對(duì)到參考序列不同位置的現(xiàn)象(圖2和表2)。例如,scaffold6的全部、scaffold9和scaffold10的左端均比對(duì)到參考序列上90 kb附近,scaffold10分3段比對(duì)到參考序列上70 kb、80 kb、90 kb左右的3個(gè)不同區(qū)段。同時(shí),本文統(tǒng)計(jì)了組裝scaffolds的GC含量:總 GC含量為40.12%,TRG基因位點(diǎn)的8個(gè)scaffolds的GC含量均高于平均值,且遠(yuǎn)高于兩側(cè)scaffold7和scaffold2的GC含量(36.77%、39.77%)(表2)。

2.4.2 scaffolds內(nèi)部連接的證明

克隆174P24組裝的scaffolds與雞參考基因組的比對(duì)結(jié)果表明,scaffold1、scaffold10、scaffold9、scaffold3、scaffold2等5個(gè)scaffolds的序列分2~3段分別比對(duì)到參考序列上相近或相距約10 kb的不同位置。針對(duì)這5個(gè)scaffolds內(nèi)部區(qū)段連接處的PCR結(jié)果表明,本研究組裝的這5個(gè)scaffolds內(nèi)部區(qū)段的順序、連接方向和序列正確:scaffold2內(nèi)部PCR證明了參考序列上gap6和gap6兩側(cè)共約296 bp的序列(克隆174P24參考序列123 628~123 924 bp)不存在;scaffold9內(nèi)部PCR結(jié)果表明9A和9C比對(duì)到參考序列上兩個(gè)區(qū)段之間約 154 bp(95 452 bp~ 95 606 bp)的間隔序列應(yīng)該為530 bp,且9A、9B和9C 3個(gè)區(qū)段相連;scaffold1、scaffold10和scaffold3的內(nèi)部分段按圖2中組裝的順序和方向相連,且序列與組裝結(jié)果一致。

3 討 論

目前,多數(shù)物種TCR基因位點(diǎn)的序列信息不完整、各基因片段的排列位置不清楚,對(duì)人和小鼠TCR近30多年的研究才得到了基本完整的TCR基因序列和基因片段的排列位置。TCR基因位點(diǎn)內(nèi)的基因數(shù)目眾多、排列位置難以確定,且每個(gè)家族內(nèi)的基因片段同源性均很高,這些都導(dǎo)致TCR基因位點(diǎn)的測(cè)序和組裝難度遠(yuǎn)遠(yuǎn)高于基因組上其他區(qū)段。以人TRB基因位點(diǎn)為例,位于7號(hào)染色體上約620 kb的區(qū)間內(nèi)集中了68個(gè)TCRβ V基因片段、2個(gè)TCRβ D基因片段、14個(gè)TCRβ J基因片段和2個(gè)TCRβ C基因片段;TCRβ V區(qū)排列在染色體的5′端,TCRβ D區(qū)、TCRβ J區(qū)和TCRβ C區(qū)以D-J-C為重復(fù)單元位于染色體的3′端,兩個(gè)重復(fù)單元的J基因片段個(gè)數(shù)分別為6個(gè)和8個(gè),整體結(jié)構(gòu)比較復(fù)雜[4,18~21]。與人和小鼠相似,雞TCR基因位點(diǎn)的V基因片段數(shù)目眾多、彼此間同源性很高,這使得測(cè)序和組裝難度也很大。自21世紀(jì)以來(lái),雞TRG基因的研究報(bào)道較少。目前為止,已有研究結(jié)果表明,雞TRG基因包括L區(qū)、V區(qū)、J區(qū)和C區(qū);在T細(xì)胞分化成熟的過(guò)程中,在特異性重組酶作用下,TRG胚系基因發(fā)生重排,由分割的、無(wú)轉(zhuǎn)錄活性的V區(qū)、J區(qū)和C區(qū)基因片段連接形成一個(gè)完整的、有轉(zhuǎn)錄功能的TRG重排基因,它編碼約含300個(gè)氨基酸的多肽[6,12]。但目前由全基因組鳥槍法測(cè)序得到的雞參考基因組中TRG基因位點(diǎn)的序列不完整也不完全準(zhǔn)確,并且基因個(gè)數(shù)和排列位置等數(shù)據(jù)依然缺乏。

為了獲得更加完整和準(zhǔn)確的雞TRG基因位點(diǎn)的序列,本研究利用Illumina公司的MiSeq高通量測(cè)序平臺(tái)對(duì)雞TRG鏈的克隆174P24進(jìn)行重新測(cè)序和組裝。與常規(guī)的鳥槍法測(cè)序相比,單個(gè)BAC克隆的測(cè)序和組裝有以下優(yōu)勢(shì):(1)BAC克隆僅插入約200 kb的目的片段,并且插入片段經(jīng)指紋圖譜法在染色體上進(jìn)行過(guò)準(zhǔn)確定位。與全基因組測(cè)序相比,BAC克隆測(cè)序的基因序列短,且目的性強(qiáng),準(zhǔn)確性會(huì)更高;(2)排除BAC克隆區(qū)間外染色體上同源序列的干擾,降低了組裝難度。綜上,BAC克隆的測(cè)序和組裝對(duì)基因片段數(shù)目眾多、排列位置難以確定的TCR基因位點(diǎn)更具有優(yōu)勢(shì)。

本研究對(duì)雞TRG鏈克隆174P24的測(cè)序和組裝分析,既獲得了新的信息,同時(shí)也發(fā)現(xiàn)了一些問(wèn)題。組裝scaffolds與雞參考基因組的比對(duì)結(jié)果顯示,雞TRG基因位點(diǎn)定位于克隆174P24中間約60 kb的區(qū)間內(nèi),V區(qū)、J區(qū)和C區(qū)等基因片段均以基因簇的形式分布。在這個(gè)區(qū)間內(nèi),總GC含量(42.29%)略高于兩側(cè)區(qū)域(39.13%),并且分布不均一。而Illumina測(cè)序在高GC和高AT區(qū)域產(chǎn)生的reads數(shù)偏少,這可能也是導(dǎo)致TRG基因位點(diǎn)區(qū)間測(cè)序reads豐度比兩側(cè)區(qū)域偏低的原因。本文運(yùn)用Celera軟件、ABySS軟件和Phrap軟件等進(jìn)行過(guò)多次嘗試,并把在參考基因組上定位到克隆174P24區(qū)間內(nèi)的fosmid文庫(kù)的兩側(cè)末端序列用作輔助定位。結(jié)果發(fā)現(xiàn),運(yùn)用ABySS軟件拼接獲得疊連群,進(jìn)一步采用Phrap軟件進(jìn)行融合,獲得的scaffolds最為完整;本研究中fosmid文庫(kù)末端序列對(duì)組裝的幫助并不大。

經(jīng)過(guò)多次優(yōu)化后,本文獲得了克隆174P24的基因組草圖,該草圖包含10個(gè)平均長(zhǎng)度約為18 kb的scaffolds。與參考序列的比對(duì)結(jié)果顯示,本文得到的10個(gè)scaffolds較完整地覆蓋了雞TRG基因位點(diǎn)及旁側(cè)區(qū)域。旁側(cè)區(qū)域包括scaffold7和scaffold2,其位置和序列與參考序列對(duì)應(yīng)。而TRG基因位點(diǎn)包含在8個(gè)平均長(zhǎng)度約為5.5 kb的scaffolds里,但它們的位置和序列與參考序列并不完全對(duì)應(yīng)。這種不完全對(duì)應(yīng)主要指多個(gè)scaffolds比對(duì)到參考序列的相近位置及一個(gè)scaffold分段對(duì)應(yīng)到參考序列的不同位置。針對(duì)這些scaffolds的內(nèi)部連接處的PCR結(jié)果顯示,本研究組裝的scaffold1、scaffold2、scaffold3、scaffold9、scaffold10等5個(gè)scaffolds內(nèi)部結(jié)構(gòu)正確。從圖2中可以看出,scaffold2分兩段比對(duì)到參考基因組約100 kb~178 kb的位置,且兩區(qū)段連接處與參考序列的 gap6(長(zhǎng)度為 127 bp)相互對(duì)應(yīng)。但該scaffold內(nèi)部PCR結(jié)果表明,這個(gè)gap和其兩側(cè)共約296 bp的序列(克隆174P24參考序列123 628~ 123 924 bp間)不存在。這表明由全基因組高通量測(cè)序組裝得到的參考序列并不完全準(zhǔn)確,組裝時(shí)這178 kb的區(qū)間摻入了染色體上其他區(qū)間的序列,從而出現(xiàn)PCR擴(kuò)增時(shí)參考序列并不存在或并不完全準(zhǔn)確的情況。而scaffold9的9A、9B和9C 3段分別比對(duì)到參考序列上約80 kb、90 kb和100 kb的3個(gè)位置,但PCR結(jié)果表明這3個(gè)區(qū)段按圖2中我們組裝的順序和方向連接形成一個(gè)完整的scaffold,而且9A和9C對(duì)應(yīng)參考序列上相距約154 bp(95 452~95 606 bp)的間隔處應(yīng)該為530 bp,這校正和補(bǔ)充了參考序列上不完全準(zhǔn)確的序列信息。同樣,scaffold10分成3段比對(duì)到參考序列上約70 kb、80 kb和90 kb附近的3個(gè)區(qū)域,而且前后順序與組裝結(jié)果不同。但該scaffold內(nèi)部PCR結(jié)果表明,這3個(gè)區(qū)段連接在一起,而且順序和方向與圖中scaffold10一致。另外,經(jīng)過(guò)PCR證明,scaffold1和scaffold3的內(nèi)部區(qū)段按圖2中組裝的順序和方向相互連接在一起。這表明雞參考基因組TRG基因位點(diǎn)上V基因區(qū)(70~100 kb)內(nèi)的序列信息不完全準(zhǔn)確。這種情況可能是由于重復(fù)序列的存在、基因結(jié)構(gòu)的復(fù)雜性和全基因組測(cè)序?qū)е陆M裝時(shí)出現(xiàn)了偏差。以上PCR結(jié)果表明單個(gè)BAC克隆的測(cè)序和組裝能得到更加準(zhǔn)確的序列信息,可以對(duì)現(xiàn)有參考基因組的序列信息進(jìn)行校正。此外,這10個(gè)scaffolds間的順序和方向雖然根據(jù)參考序列進(jìn)行了初步排序,但還需要進(jìn)一步的PCR證明。本研究雖然多次嘗試過(guò)PCR擴(kuò)增,但經(jīng)常出現(xiàn)無(wú)擴(kuò)增條帶、非特異性擴(kuò)增、測(cè)序時(shí)無(wú)反應(yīng)及非特異結(jié)合等現(xiàn)象,而不能獲得有用的序列信息。

綜上所述,本研究通過(guò)對(duì)雞TRG基因位點(diǎn)BAC克隆的重新測(cè)序和組裝分析,得到了雞TRG鏈克隆174P24的基因組草圖,并校正了雞參考基因組的多處序列錯(cuò)誤,為雞TRA/D、TRB基因位點(diǎn)及其他物種TCR基因位點(diǎn)等相關(guān)方面的研究提供科研思路和理論依據(jù),為基因組復(fù)雜區(qū)域的研究提供參考和建議。

[1]Glusman G,Rowen L,Lee I,Boysen C,Roach JC,Smit AFA,Wang K,Koop BF,Hood L.Comparative genomics of the human and mouse T cell receptor loci.Immunity, 2001,15(3):337–349.

[2]Clark SP,Arden B,Kabelitz D,Mak TW.Comparison of human and mouse T-cell receptor variable gene segment subfamilies.Immunogenetics,1995,42(6):531–540.

[3]Mackelprang R,Carlson CS,Subrahmanyan L,Livingston RJ,Eberle MA,Nickerson DA.Sequence variation in the human T-cell receptor loci.Immunol Rev,2002,190(1): 26–39.

[4]李揚(yáng)秋.T細(xì)胞受體的研究和應(yīng)用.北京:人民衛(wèi)生出版社,2009:53–55.

[5]Chen CL,Ager LL,Gartland GL,Cooper MD. Identification of a T3/T cell receptor complex in chickens. J Exp Med,1986,164(1):375–380.

[6]Sowder JT,Chen CL,Ager LL,Chan MM,Cooper MD.A large subpopulation of avian T cells express a homologue of the mammalian T gamma/delta receptor.J Exp Med, 1988,167(2):315–322.

[7]Vainio O,Lassila O,Cihak J,L?sch U,Houssaint E. Tissue distribution and appearance in ontogeny of α/β T cell receptor(TCR2)in chicken.Cell Immunol,1990, 125(1):254–260.

[8]Tjoelker LW,Carlson LM,Lee K,Lahti J,McCormack

WT,Leiden JM,Chen CL,Cooper MD,Thompson CB. Evolutionary conservation of antigen recognition:the chicken T-cell receptor beta chain.Proc Natl Acad Sci USA,1990, 87(20):7856–7860.

[9]McCormack WT,Tjoelker LW,Stella G,Postema CE, Thompson CB. Chicken T-cell receptor beta-chain diversity:an evolutionarily conserved D beta-encoded glycine turn within the hypervariable CDR3 domain.Proc Natl Acad Sci USA,1991,88(17):7699–7703.

[10]Cihak J,Hoffmann-Fezer G,Ziegler-Heibrock HW,Stein H,Kaspers B,Chen CH,Cooper MD,L?sch U.T cells expressing the V beta 1 T-cell receptor are required for IgA production in the chicken.Proc Natl Acad Sci USA, 1991,88(23):10951–10955.

[11]G?bel TW,Chen CL,Lahti J,Kubota T,Kuo CL, Aebersold R,Hood L,Cooper MD.Identification of T-cell receptor alpha-chain genes in the chicken.Proc Natl Acad Sci USA,1994,91(3):1094–1098.

[12]Six A,Rast JP,McCormack WT,Dunon D,Courtois D,Li Y,Chen CH,Cooper MD.Characterization of avian T-cell receptor γgenes.Proc Natl Acad Sci USA,1996,93(26): 15329–15334.

[13]Kubota T,Wang JY,G?bel TWF,Hockett RD,Cooper MD, Chen CH.Characterization of an avian(Gallus gallus domesticus)TCR αδ gene locus.J Immunol,1999,163(7): 3858–3866.

[14]International Chicken Genome Sequencing Consortium. Sequence and comparative analysis of the chicken genome provide unique perspectives on vertebrate evolution. Nature,2004,432(7018):695–716.

[15]Yang X,Liu D,Liu F,Wu J,Zou J,Xiao X,Zhao FQ,Zhu BL.HTQC:a fast quality control toolkit for Illumina sequencing data.BMC Bioinformatics,2013,14:33.

[16]Simpson JT,Wong K,Jackman SD,Schein JE,Jones SJM, Birol I.ABySS:a parallel assembler for short read sequence data.Genome Res,2009,19(6):1117–1123.

[17]Bonfield JK,Staden R.The application of numerical estimates of base calling accuracy to DNA sequencing projects.Nucleic Acids Res,1995,23(8):1406–1410.

[18]TillinghastJP,BehlkeMA,Loh DY.Structureand diversity of the human T-cell receptor beta-chain variable region genes.Science,1986,233(4766):879–883.

[19]Rowen L,Koop BF,Hood L.The complete 685-kilobase DNA sequence of the human β T cell receptor locus. Science,1996,272(5269):1755–1762.

[20]Ikuta K,Ogura T,Shimizu A,Honjo T.A joining-diversityjoining complex generated by inversion mechanism and a variable-diversity complex in the β-chain gene of the human T-cell receptor.Nucl Acids Res,1986,14(12): 4899–4909.

[21]Tunnacliffe A,Kefford R,Milstein C,Forster A,Rabbitts TH.Sequence and evolution of the human T-cell antigen receptor beta-chain genes.Proc Natl Acad Sci USA,1985, 82(15):5068–5072.

(責(zé)任編委:李輝)

Re-sequencing and assembly of chicken T cell receptor gamma locus

Junping Ma1,2,Xi Yang1,2,Na Lv1,Fei Liu1,Yan Chen1,3,Baoli Zhu1

1.Institute of Microbiology,Chinese Academy of Sciences,Beijing 100101,China;
2.University of Chinese Academy of Sciences,Beijing 100049,China;
3.Institute of Animal Sciences,Chinese Academy of Agricultural Sciences,ASTIP-IAS03,Beijing 100193,China

The genomic organization of the animal T cell receptor(TCR)loci is characterized by different gene families with high homology,and it is quite difficult to obtain accurate gene sequences and arrangements of these gene families.In this study,weidentified the location ofchicken TCR gammachain (TCRγ orTRG) genes by comparing those TRG gene sequences with the chicken reference genome,and the corresponding bacterial artificial chromosome(BAC)clone,CH261-174P24,was chosen for further high-throughput DNA re-sequencing and assembly.As a result,a draft genome assembly containing ten scaffolds was obtained,which almost covered the chicken TRG gene locus and the flanking regions.Subsequently,the internal structure of these scaffolds was confirmed by PCR amplification and Sanger sequencing.Our analysis corrected two errors in the sequence—one near a TRG variable gene and one close to a gap,respectively,and several errors in the TRG variable genes in the chicken reference genome.In conclusion,our work has partially corrected the erroneously assembled sequences of the TRG gene locus in the chicken reference genome and thus provides a new method for genome sequence analysis of chicken TRA/D and TRB gene loci.

chicken;T cell receptor(TCR);gamma gene locus;re-sequencing;assembling

2014-11-04;

2015-03-09

國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展規(guī)劃項(xiàng)目(編號(hào):2015CB554204)資助

馬俊平,碩士研究生,專業(yè)方向:遺傳學(xué)和基因組學(xué)。E-mail:majp12@im.ac.cn

朱寶利,博士,研究員,研究方向:微生物與免疫基因組學(xué)。E-mail:zhubaoli@im.ac.cn

陳燕,博士,助理研究員,研究方向:動(dòng)物遺傳育種。E-mail:chenyan0204@163.com

10.16288/j.yczz.14-382

時(shí)間:2015-3-16 10:49:31

URL:http://www.cnki.net/kcms/detail/11.1913.R.20150316.1049.001.html

猜你喜歡
區(qū)段克隆基因組
克隆狼
中老鐵路雙線區(qū)段送電成功
牛參考基因組中發(fā)現(xiàn)被忽視基因
浙江:誕生首批體細(xì)胞克隆豬
站內(nèi)特殊區(qū)段電碼化設(shè)計(jì)
站內(nèi)軌道區(qū)段最小長(zhǎng)度的探討
淺析分路不良區(qū)段解鎖的特殊操作
抗BP5-KLH多克隆抗體的制備及鑒定
Galectin-7多克隆抗體的制備與鑒定
基因組DNA甲基化及組蛋白甲基化
遺傳(2014年3期)2014-02-28 20:58:49
贵南县| 武鸣县| 阜康市| 抚顺县| 南城县| 山东省| 芮城县| 胶南市| 富平县| 扶沟县| 江城| 都昌县| 临泽县| 疏附县| 湖州市| 织金县| 榕江县| 宜城市| 象州县| 珠海市| 将乐县| 靖江市| 汽车| 陇南市| 信宜市| 张北县| 鄯善县| 翁源县| 砚山县| 博客| 兴城市| 浦县| 车致| 余江县| 自治县| 怀仁县| 偃师市| 金堂县| 通城县| 南陵县| 舒兰市|