黃世棟,冀洪芳,聶旋,成婷婷,楊艷梅,王金鵬
(河北聯(lián)合大學(xué)理學(xué)院,河北唐山 063009)
生物固氮(Biological nitrogen fixation)是固氮微生物特有的一種生理功能,這種功能是在固氮酶的催化作用下進(jìn)行的。固氮酶是一種能夠?qū)⒎肿拥€原成氨的酶。近20年來生物固氮已經(jīng)成為一個(gè)多學(xué)科的綜合性研究項(xiàng)目,分別在分子、細(xì)胞、個(gè)體和生態(tài)等多層次水平上,從微觀到宏觀不斷地展開著探索性研究。豆科植物根瘤的生化和分子生物學(xué)研究新陳代謝有大大促進(jìn)了我們的知識(shí)主要是植物碳,氮代謝,以及兩者之間的相互作用(萬斯埃塔爾,1994)。豆科植物與根瘤菌之間是一個(gè)復(fù)雜的過程,涉及雙方的合作伙伴從信號(hào)與識(shí)別,這種互利共生的植物和細(xì)菌,需要精湛的整合,以避免新陳代謝的一個(gè)伙伴剝削其他(Lodwig等,2003)。
基因倍增(Gene duplication)是指DNA片段在基因組中復(fù)制出一個(gè)或更多個(gè)拷貝,這種DNA片段可以是一小段基因組序列,也可以是整條染色體,甚至是整個(gè)基因組。基因倍增之后物種基因組的一個(gè)共同特征就是都會(huì)有大量重復(fù)基因產(chǎn)生。植物基因組中大量的重復(fù)基因產(chǎn)生于基因組的多倍化(Polyploidy),多倍化作為激變事件使基因組加倍,產(chǎn)生大量重復(fù)基因,重復(fù)基因的產(chǎn)生常會(huì)引起物種基因組大規(guī)模的變化,例如染色體重排、基因顛倒、基因丟失等等?;虮对鍪腔蚪M進(jìn)化的一種重要機(jī)制,是基因功能多樣化的前提,是物種演化最重要的動(dòng)力源泉?;虮对霈F(xiàn)象廣泛存在,在基因倍增的研究中,通過尋找同源片段并且結(jié)合片段中丟失的基因,來判斷大規(guī)?;虮对龅姆秶?。近年來基因倍增研究發(fā)現(xiàn)脊椎動(dòng)物、模式植物、酵母等中存在不同程度的大規(guī)?;虮对觯械纳踔潦侨虮对?。許多學(xué)者對(duì)于脊椎動(dòng)物、禾本科植物以及其它真核生物等的基因倍增進(jìn)行了研究,揭示了其基因組中存在由基因倍增產(chǎn)生的大量重復(fù)基因基因倍增在酵母基因組的存在狀況成為近來研究的熱點(diǎn)之一,科學(xué)家反復(fù)深入和詳盡的研究在不斷揭示其基因倍增現(xiàn)象。
而共生固氮相關(guān)的基因家族與基因倍增的相關(guān)性研究目前尚是空白。因此我們將生物固氮和基因培增的基因組信息融合在一起,基于比較基因組學(xué)的方法初步探索Lotus japonicus基因倍增發(fā)生的規(guī)模,并統(tǒng)計(jì)分析影響共生固氮相關(guān)的基因與重復(fù)基因間的相關(guān)性。本文通過基因序列數(shù)據(jù)的比較分析,推斷影響基因倍增發(fā)生的幾個(gè)重要因素,并初步獲得影響共生固氮的遺傳學(xué)因素,加深對(duì)基因倍增和共生固氮的理解。
首先是搜集模式植物L(fēng)otus japonicus基因組序列:Lotus japonicus基因組序列由www.kazusa.or.jp/lotus/下載得到,6條假染色體,15661個(gè)基因。下載得到的數(shù)據(jù)包含的信息有:①基因組CDS序列;②蛋白序列;③染色體序列;④基因在染色體上的位置。
序列比對(duì)(alignment)是指為確定兩個(gè)或多個(gè)序列之間的相似性以至于同源性,而將它們按照一定的規(guī)律排列。其目的是從核酸以及氨基酸的層次去分析序列的相同點(diǎn)和不同點(diǎn),以推測(cè)他們的結(jié)構(gòu)、功能以及進(jìn)化上的聯(lián)系。
通過判斷兩個(gè)序列之間的相似性來判定兩者是否具有同源性.而分析基因相似性的工具是運(yùn)用基于動(dòng)態(tài)規(guī)劃算法BLAST軟件。BLAST(Basic Local Alignment Search Tool基本局部比對(duì)搜索工具)是一套在蛋白質(zhì)數(shù)據(jù)庫或DNA數(shù)據(jù)庫中進(jìn)行相似性比較的分析工具。BLAST采用一種局部的算法獲得兩個(gè)序列中具有相似性的序列。
本文運(yùn)用的是BLAST的子程序blastp。blasp是蛋白序列到蛋白庫中的一種查詢。庫中存在的每條已知序列將逐一地同每條所查序列作一對(duì)一的序列比對(duì)。其使用取代矩陣尋找較遠(yuǎn)的關(guān)系,進(jìn)行SEG過濾。BLAST結(jié)果中的得分是對(duì)一種對(duì)相似性的統(tǒng)計(jì)說明。其中兩個(gè)重要的參數(shù)設(shè)置:Matrix(打分矩陣)選BLOSUM62;E值(E-value)表示僅僅因?yàn)殡S機(jī)性造成獲得這一比對(duì)結(jié)果的可能性。這一數(shù)值越接近零,發(fā)生這一事件的可能性越小。可以把每一個(gè)基因與其他任何一個(gè)基因相似性度量出來,最后篩選出具有相似性的基因。
現(xiàn)代分子生物學(xué)中的同源性描述的是基因與基因之間相似關(guān)系,它表明的是兩個(gè)相比較的序列之間的匹配程度。一般來說,如果兩條基因序列相似性達(dá)80%,就可以把它們稱為"同源基因(homologousgene)"。而基因重復(fù)是指在同一個(gè)基因組內(nèi)存在2個(gè)或者2個(gè)以上拷貝的同源基因序列,是非常普遍的生物學(xué)現(xiàn)象。在已完成或即將完成全基因組測(cè)序的三大界生物(細(xì)菌、古菌和真核生物)基因組中,也已發(fā)現(xiàn)存在大量的重復(fù)基因。在植物界,基因重復(fù)現(xiàn)象更為普遍,僅在被子植物中就有大約70% ~80%的物種存在基因重復(fù)或多倍化過程,且發(fā)生在不同的進(jìn)化階段,許多物種是多次全基因組重復(fù)的產(chǎn)物?;蛑貜?fù)在生物進(jìn)化過程中發(fā)揮著極其重要的作用,是基因組和遺傳系統(tǒng)分化的重要推動(dòng)力量。
基因倍增是指DNA片段在基因組中復(fù)制出一個(gè)或更多的拷貝,這種DNA片段可以是一小段基因組序列、整條染色體,甚至是整個(gè)基因組?;虮对鍪腔蚪M進(jìn)化最主要的驅(qū)動(dòng)力之一,是產(chǎn)生具有新功能的基因和進(jìn)化出新物種的主要原因之一?;虮对鍪腔蚪M進(jìn)化的一種重要機(jī)制,是基因功能多樣化的前提,也是物種進(jìn)化的主要推動(dòng)力。
我們通過比較分析確定同源基因以及基因在染色體的位置,繪制出二維平面圖。運(yùn)用MCscan來輸出共線性基因片段,其中重要的參數(shù)設(shè)置為min(-log10E_value,50)。獲得重復(fù)基因的個(gè)數(shù)以及確定由全基因倍增產(chǎn)生的重復(fù)基因規(guī)模。
系統(tǒng)學(xué)分類描述了不同生物之間的相關(guān)關(guān)系,通過系統(tǒng)學(xué)分類分析可以幫助人們了解所有生物的進(jìn)化歷史過程。這一過程并不能夠直接看到,人們只能通過相關(guān)線索了解歷史上曾經(jīng)發(fā)生了什么,而科學(xué)家就是用這些線索建立各種假說、模型,甚至是生命發(fā)生的歷史。系統(tǒng)發(fā)育學(xué)研究的是進(jìn)化關(guān)系,系統(tǒng)發(fā)育分析就是要推斷或者評(píng)估這些進(jìn)化關(guān)系。通過系統(tǒng)發(fā)育分析所推斷出來的進(jìn)化關(guān)系一般用分枝圖表(進(jìn)化樹)來描述,這個(gè)進(jìn)化樹就描述了同一譜系的進(jìn)化關(guān)系,包括了分子進(jìn)化(基因樹)、物種進(jìn)化以及分子進(jìn)化和物種進(jìn)化的綜合。在系統(tǒng)學(xué)分類的研究中,最常用的可視化表示進(jìn)化關(guān)系的方法就是繪制系統(tǒng)發(fā)育進(jìn)化樹,用一種類似樹狀分支的圖形來概括各種(類)生物之間的親緣關(guān)系。通過比較生物大分子序列差異的數(shù)值構(gòu)建的系統(tǒng)樹稱為分子系統(tǒng)樹。然后利用距離建樹方法是根據(jù)雙重序列比對(duì)的差異程度(距離)來建立進(jìn)化樹。
利用以上的基因比較所得到的共生固氮相關(guān)的同源基因在四個(gè)禾本科物種中進(jìn)行了系統(tǒng)進(jìn)化分析。首先運(yùn)用臨近距離方法,對(duì)共生固氮基因的蛋白序列進(jìn)行系統(tǒng)發(fā)育分析,構(gòu)建系統(tǒng)發(fā)育樹,實(shí)現(xiàn)是應(yīng)用集成軟件Phylip輸出結(jié)果基因親緣關(guān)系的括號(hào)樹,并且對(duì)于獲得的進(jìn)化樹進(jìn)行了置換檢驗(yàn)(Bootsrap test)。
其次為了實(shí)現(xiàn)括號(hào)樹的可視化,使用的是MEGA軟件得到了基因間的進(jìn)化關(guān)系,來確定全基因倍增是否有利于該基因家族的擴(kuò)增;為了更好地揭示基因間的進(jìn)化情況,應(yīng)用MEGA還構(gòu)建了不同形式的進(jìn)化樹,若觀察發(fā)現(xiàn)某些基因樹枝長度明顯較長,則表明,在生物進(jìn)化過程中某些基因進(jìn)化速率較快。
Lotus japonicus基因組序列由www.kazusa.or.jp/lotus/下載得到,6條假染色體,15661個(gè)基因。下載得到的數(shù)據(jù)包含的信息有:①基因組CDS序列;②蛋白序列;③染色體序列;④基因在染色體上的位置。
對(duì)Lotus japonicus基因組比較分析:用Bioperl程序包中的用Perl程序進(jìn)行翻譯,得到相應(yīng)的蛋白序列,應(yīng)用基于動(dòng)態(tài)規(guī)劃算法BLAST軟件的子程序blastp(參數(shù)設(shè)置:E值<1*10-5)做比較分析,把每一個(gè)基因與其他任何一個(gè)基因相似性度量出來,最后篩選出具有相似性的基因,部分結(jié)果如表1所示:
表1 Lotus japonicus基因組比對(duì)部分結(jié)果
通過比較分析確定同源基因以及基因在染色體的位置,繪制出二維平面圖,如圖1所示。運(yùn)用MCscan輸出共線性基因片段,其中參數(shù)設(shè)置為min(-log10E_value,50),共得到2197對(duì)重復(fù)基因。研究表明在Lotus基因組中存在大量的重復(fù)基因,由全基因倍增產(chǎn)生的重復(fù)基因規(guī)模為2197*2/15661=28.05%。
圖1 Lotus基因組中的重復(fù)基因
由NCBI下載得到12條共生固氮相關(guān)基因,與二葉短柄草、水稻、高粱、玉米這四種植物的全基因組進(jìn)行比較分析,在4個(gè)物種中獲得的同源基因個(gè)數(shù)分別是31,19,28,18。初步對(duì)這五種植物的共生固氮基因家族進(jìn)行了定義。運(yùn)用臨近距離方法,對(duì)共生固氮基因的蛋白序列進(jìn)行系統(tǒng)發(fā)育分析,構(gòu)建系統(tǒng)發(fā)育樹,實(shí)現(xiàn)是應(yīng)用集成軟件Phylip輸出結(jié)果基因親緣關(guān)系的括號(hào)樹(表2),并且對(duì)于獲得的進(jìn)化樹進(jìn)行了置換檢驗(yàn)(Bootsrap test);對(duì)于括號(hào)樹的可視化,使用的是MEGA,基因間的進(jìn)化關(guān)系如圖(圖2);值得注意的是,樹中有很多重復(fù)的基因?qū)Υ嬖?,這一結(jié)果表明全基因倍增可能有利于該基因家族的擴(kuò)增;另外為了更好地揭示基因間的進(jìn)化情況,課題應(yīng)用MEGA還構(gòu)建了不同形式的進(jìn)化樹(圖3),觀察可以發(fā)現(xiàn)有些基因樹枝長度明顯較長,這一現(xiàn)象表明,在生物進(jìn)化過程中有些基因進(jìn)化速率較快。
表2 水稻、高粱、二葉短柄草、玉米、Lotus共生固氮相關(guān)基因家族括號(hào)樹
本文以Lotus japonicas作為模式植物,首先鑒定出以Lotus japonicas為研究對(duì)象的基因倍增發(fā)生的規(guī)模占有28.5%;其次搜集了Lotus japonicas、水稻、高粱、二葉短柄草、玉米這五種植物的部分共生固氮基因家族,運(yùn)用臨近距離方法來構(gòu)建了系統(tǒng)發(fā)育樹的,通過對(duì)可視樹圖的分析,得出一個(gè)結(jié)論:全基因倍增可能有利于共生固氮基因相關(guān)的基因家族的擴(kuò)增;同時(shí)還發(fā)現(xiàn)在生物進(jìn)化的過程中有些基因進(jìn)化速率較快。
針對(duì)Lotus japonicas基因組進(jìn)行探索性研究,以共生固氮基因相關(guān)的基因家族與基因倍增的相關(guān)性為主題,有著重要的科學(xué)意義。它有助于回答一系列重要的科學(xué)問題,認(rèn)識(shí)到基因倍增的相關(guān)性、基因倍增發(fā)生的規(guī)模、發(fā)生的規(guī)律等。這一研究在方法上把數(shù)學(xué)、統(tǒng)計(jì)學(xué)、進(jìn)化理論與基因組學(xué)緊密結(jié)合,是很有意義的交叉學(xué)科研究,富有挑戰(zhàn)性。研究的結(jié)果使現(xiàn)代遺傳學(xué)深化對(duì)基因倍增和共生固氮的認(rèn)識(shí)。另外,這一研究有很強(qiáng)的可擴(kuò)展性,以Lotus japonicas為研究對(duì)象建立的相關(guān)方法和軟件在未來可被用于其他物種的進(jìn)一步探索,從而以更大的研究范圍來研究基因倍增與共生固氮的科學(xué)意義。
[1]XiyinWang,Udo Gowik,Haibao Tang,John E Bowers,PeterWesthoff and Andrew H Paterson* § .Comparative genomic analysis of C4 photosynthetic pathway evolution in grasses .Genome Biology 2009,10:R68.
[2]Gillian Colebatch?,§ ,Guilhem Desbrosses§ ,Thomas Ott,Lene Krusell,Ombretta Montanari,Sebastian Kloska?,Joachim Kopka and Michael K.Udvardi* .Global changes in transcription orchestrate metabolic differentiation during symbiotic nitrogen fixation in Lotus japonicus.Blackwell Publishing Ltd,The Plant Journal,(2004),39,487 -512.
[3]趙國屏.生物信息學(xué)[M].北京:科學(xué)出版社.2004.
[4]劉永秀、張福鎖、毛達(dá)如:根際微生態(tài)系統(tǒng)中豆科植物——根瘤菌共生固氮及其在可持續(xù)農(nóng)業(yè)發(fā)展中的應(yīng)用.中國農(nóng)業(yè)科技導(dǎo)報(bào).
[5]艾對(duì)元:基因組中重復(fù)基因序列的意義.生命化學(xué)報(bào).2008.
[6]黃家風(fēng)、李克梅等:豆科植物——根瘤菌共生固氮的分子機(jī)理 .石河子大學(xué)學(xué)報(bào).2002.3.