郭玉平等
摘要:本研究運用多種軟件對12種作物的 FAD2基因進行密碼子偏好性分析。結果表明:FAD2基因在12種作物中密碼子使用偏好性差異很大,禾本科作物玉米、水稻、高粱的FAD2基因有效密碼子數(shù)(Effective Number of Codons, ENC)在30左右,為偏好性很強的基因;油料作物油菜和亞麻的FAD2基因的ENC值分別為45.49和48.58,為一般偏好性基因;另外6種油料作物和模式植物擬南芥的FAD2基因ENC值都大于50,偏好性較弱。玉米、水稻、高粱、油菜、亞麻、花生和擬南芥的FAD2基因偏好以G或C堿基結尾的密碼子,其余5種油料作物的FAD2基因偏好使用以A或T結尾的密碼子。在12種作物中,密碼子CTC的RSCU值都大于1,屬于高頻使用的密碼子;而CTA、ATA、GTA、AGT、CCC屬于低頻密碼子。在聚類分析中,12種作物基于FAD2基因密碼子用法與基于CDS序列的聚類結果大體一致。
關鍵詞:FAD2基因;密碼子偏好性
中圖分類號:Q755文獻標識號:A文章編號:1001-4942(2013)07-0024-06
脂肪酸脫氫酶(Fatty Acid Desaturase, FAD2)是存在于作物細胞內質網(wǎng)表面的一種脫氫酶,可以向油酸(C18∶1)引入第二個雙鍵,提供質膜結構所需的亞油酸(C18∶2)等多元不飽和脂肪酸,是作物產生多聚不飽和脂肪酸的關鍵酶。不飽和脂肪酸在增加生物膜的流動性中發(fā)揮重要作用,其在生物膜中的含量和作物的抗寒性、抗高溫性、以及抗病性等有極其重要的作用;在人和動物體內也發(fā)揮著重要作用,包括脂類代謝、心血管功能調節(jié)、血糖濃度調節(jié)、癌細胞調控、免疫調節(jié)、對視力和腦的發(fā)育調控、骨質形成的調控等各個方面[1]。由于FAD2只存在于作物和微生物中,人體細胞中沒有FAD2基因,自身不能合成α-亞麻酸(ALA)、γ-亞麻酸(GLA)等多不飽和脂肪酸,必須從食物中攝取[2]。
目前,擬南芥[3]、油菜[4]、大豆[5]等多種植物的FAD2基因已被克隆并應用于轉基因作物的研究。本研究分析了棉花、花生、油菜、大豆、蓖麻、亞麻及千年桐、油桐等8種油料作物的FAD2基因的密碼子使用特征,并與模式植物擬南芥和禾本科植物玉米、水稻、高粱進行比較。根據(jù)FAD2基因密碼子的RSCU(Relative Synonymous Codon Usage)值對12種作物進行了聚類分析,并將其聚類結果與基于FAD2基因CDS(Coding DNA Sequences)序列的聚類結果做了比較。了解FAD2基因的密碼子在各個作物中的使用特性,為進一步深入研究FAD2基因及其表達調控機制等提供重要理論依據(jù)。
1材料與方法
1.1序列來源
本研究使用的FAD2基因蛋白編碼序列(CDS)來源于GenBank (http://www.ncbi.nlm.nih.gov/) ,不同作物的FAD2基因在數(shù)據(jù)庫中的登錄號見表1。
1.2分析方法
1.2.112種作物的FAD2基因同義密碼子堿基組成及偏好性分析運用Codon W1.4.2軟件(http://codonw.sourceforge.net/)對12種作物的FAD2基因的CDS序列進行分析,分別計算每條序列同義密碼子的相對使用度、有效密碼子數(shù)、GC及GC3s含量。并利用Mobyle在線工具(http://mobyle.pasteur.fr)中的CUSP計算GC1s和GC2s含量。
(1) 同義密碼子相對使用度(RSCU)是對同義密碼子使用偏愛性的評估,定義為某一同義密碼子使用次數(shù)的觀察值與該密碼子出現(xiàn)次數(shù)的期望值的比值。如果密碼子的使用無偏愛性,則 RSCU值為1;如果某一密碼子使用頻繁,則RSCU值大于1;如果某一密碼子使用頻率低,則RSCU值小于1。RSCU值直觀地反映了密碼子使用的偏好性[6]。
(2) 有效密碼子數(shù)(ENC)反映基因密碼子使用的偏愛程度,取值范圍為20(每個氨基酸只使用一個密碼子)~61(各個密碼子被均衡使用),其值越小,表明該基因的密碼子使用偏好性越強[7]。
(3) 密碼子的組成度量指標包括GC(鳥嘌呤和胞嘧啶)、GC1s(同義密碼子第1位的鳥嘌呤和胞嘧啶)、GC2s(同義密碼子第 2 位的鳥嘌呤和胞嘧啶)、GC3s(同義密碼子第 3 位的鳥嘌呤和胞嘧啶)含量。
1.2.2基于密碼子RSCU值及CDS序列的聚類分析利用SAS 8.1軟件(Institute Inc., Cary, North Carolina, USA)編程,以每條基因作為研究對象,將59個密碼子(去除3個終止密碼子和2個只編碼Trp、Met的密碼子)的RSCU值作為變量,根據(jù)其相對使用度之間的歐氏距離,采用系統(tǒng)聚類法中的最大距離法進行聚類,并對12種作物FAD2基因密碼子偏好性進行比較分析。
利用MEGA5.10軟件(http://www.megasoftware.net/mega.php)中的ClustalW模塊對FAD2的CDS序列進行多序列比對[8],然后采用UPGMA法對FAD2基因CDS序列進行聚類分析[16]。
2結果與分析
2.1有效密碼子數(shù)及堿基組成分析
12種作物FAD2基因的ENC值、GC堿基含量以及密碼子第一、二、三位的GC堿基含量計算結果見表2。結果顯示:在12種作物中,F(xiàn)AD2基因ENC值差異很大,其中玉米、水稻、高粱FAD2基因的ENC值均在30左右,表明它們具有較強的密碼子使用偏好性;油菜和亞麻FAD2基因的ENC值分別為45.49和48.58,說明它們的密碼子偏好性比禾本科作物要弱些,為一般偏好性基因;剩余6種油料作物FAD2基因的ENC值均大于50,說明它們的密碼子使用偏好性很弱。進一步分析12種作物FAD2基因GC含量及密碼子第一、二、三位的GC含量,發(fā)現(xiàn)玉米、水稻、高粱、油菜、亞麻、擬南芥FAD2基因GC含量呈現(xiàn)GC3s>GC1s>GC2s這一規(guī)律。除擬南芥外,它們的GC含量都大于50%,分別為67.18%、65.81%、62.89%、55.06%、54.53%。陸地棉、花生、大豆、蓖麻、千年桐、油桐FAD2基因GC含量呈現(xiàn)GC1s>GC3s>GC2s規(guī)律,且它們的GC含量都小于50%,分別為45.45%、48.00%、46.48%、46.35%、45.05%、44.79%。花生、油菜、亞麻、玉米、水稻、高粱以及擬南芥FAD2基因的GC3s含量都大于50%,說明這7種作物FAD2基因在編碼時偏好使用G或C結尾的密碼子。陸地棉、大豆、蓖麻、千年桐、油桐FAD2基因的GC3s含量小于50%,說明這5種作物FAD2基因在編碼時偏好使用A或T結尾的密碼子。
2.2FAD2基因密碼子使用特性分析
用CodonW1.4.2軟件計算12種作物FAD2基因密碼子的RSCU值(表3)。在12種作物中,密碼子CTC的RSCU值都大于1,屬于共同偏好使用的密碼子,而密碼子CTA、ATA、GTA、AGT、CCC的 RSCU值小于1,屬于使用頻率較低的密碼子。進一步分析發(fā)現(xiàn),密碼子ATC、AAG的RSCU值分別只在大豆、棉花中小于1,在其他11個作物中都是高頻使用的密碼子;密碼子CTG、GCG在玉米、水稻、高粱中高度偏好使用,但在8種油料作物和擬南芥中RSCU值都小于1;TCC只在兩種木本油料作物中是低頻密碼子。
綜上,F(xiàn)AD2基因在12種作物中,每個氨基酸在同義密碼子使用上都存在著明顯的不同,每種作物都有自己偏好使用的密碼子。在基因工程中可以根據(jù)每種作物FAD2基因的密碼子使用特征來設計基因序列,優(yōu)化基因密碼子,盡量避免使用頻率低的密碼子,使外源基因在受體物種中能夠高效穩(wěn)定地表達。
2.3基于密碼子用法和CDS序列的聚類分析
基于FAD2基因密碼子用法的聚類結果見圖1。12種作物可以分為兩大類,第一大類包括8種油料作物和擬南芥。其中,屬于油桐屬的油桐、千年桐最先聚在一起,后與同為大戟科的蓖麻聚為一小類;屬于蝶形花科的花生、大豆單獨聚為一小類;油菜和擬南芥為十字花科作物,油菜先與亞麻聚在一起,后與擬南芥聚為一類。另一大類包括3種禾本科作物玉米、水稻、高粱。這一結果與FAD2基因基于CDS序列的聚類結果(圖2)基本相符。由此可見,F(xiàn)AD2基因密碼子偏好性差異大小與物種的親緣關系遠近有關,親緣關系越遠,基因密碼子偏好性差異越大,親緣關系越近,密碼子偏好性差異越小?;贔AD2基因密碼子用法的聚類能很好地反映出植物之間的親緣關系。
3討論
影響密碼子使用偏好性的因素很多,如基因堿基組成、表達水平等[9,10],許多研究都表明禾本科作物GC含量高,雙子葉作物GC含量低[11,12]。禾本科作物少用或避免使用以A或T結尾的密碼子,偏好于使用以G或C結尾的密碼子,而雙子葉作物則相反[13,14]。本研究對8種油料作物(雙子葉)、3種禾本科作物(單子葉)和擬南芥(雙子葉)共12種作物的FAD2基因分析發(fā)現(xiàn),玉米、水稻、高粱3種禾本科作物FAD2基因GC含量都超過了60%,比雙子葉作物高,和前人研究結果一致[15,16]。但油料作物油菜、亞麻雖為雙子葉作物,GC含量在55%左右,超過了50%,這一結果與前人研究結果不符[15,16],出現(xiàn)這種現(xiàn)象可能是由于與前人分析的基因及作物不同造成的。進一步從ENC值和GC3s含量上看,玉米、水稻、高粱的GC3s含量都很高,玉米、水稻都在95%以上,高粱為87.37%,油菜和亞麻GC3s也在70%左右;同時玉米和水稻的ENC值都小于30,高粱的為35.48,油菜和亞麻分別為45.49和48.58,由此可知玉米、水稻、高粱、油菜、亞麻密碼子偏好性較強或一般。因此推測,GC堿基含量的多少可能會導致FAD2基因密碼子偏好性的強弱。
密碼子作為聯(lián)系核酸和蛋白質的紐帶,可用來推測基因組內部或基因組間的演化關系,即不同作物的同一基因或同一作物的不同基因對密碼子的用法特征有所不同,這種密碼子使用偏好性差異大小與作物的親緣關系遠近有關,親緣關系越遠,密碼子偏好性差異越大,親緣關系越近,密碼子偏好性差異越小[17]。對8種油料作物、3種禾本科作物和擬南芥FAD2基因密碼子用法進行了聚類分析,并與基于FAD2基因CDS序列的聚類分析進行了比較。兩種方法的聚類結果對比顯示,12種作物親緣關系大體上是一致的,驗證了前人的結論:在基因類型和功能一定的情況下,進化上親緣關系較近的作物間,同義密碼子的用法相似[15]。兩種聚類結果有一些作物在位置上存在差異,這種現(xiàn)象在前人的研究中也出現(xiàn)過[16],比如玉米、水稻、高粱三者之間的親緣關系,從基因組學上來說[18],玉米與高粱的親緣關系更近一些,但在基于FAD2基因密碼子用法的作物聚類分析中,玉米先與水稻聚在一起,后又與高粱聚為一類;油菜和擬南芥為十字花科作物,亞麻屬于薔薇亞綱作物,從親緣關系上來說,油菜與擬南芥應更近一些,但在FAD2基因密碼子用法上,油菜與亞麻比擬南芥要近些;而蝶形花科的花生與大豆的FAD2基因,在密碼子使用上很相似,但在FAD2基因CDS序列上存在較大的差異。出現(xiàn)這些現(xiàn)象可能是由于本研究只選取了一個FAD2基因,分析的作物種類也太少,在統(tǒng)計計算上可能出現(xiàn)一些誤差。單基因在進化上也可能存在較大的突變,導致其密碼子使用偏好性發(fā)生較大變化,因而表現(xiàn)出與真實的分類地位不同[15]。如果多選用一些基因,作物基于密碼子用法的聚類分析和基于基因CDS序列的聚類分析可能更接近于真實的系統(tǒng)分類。目前在基于分子序列的系統(tǒng)發(fā)育分析中,基于編碼區(qū)密碼子用法的聚類分析可為系統(tǒng)發(fā)育分析提供可靠信息,可作為各種系統(tǒng)發(fā)育分析方法的重要補充,用于作物進化關系和分子進化機制研究。
參考文獻:
[1]張洪濤, 單雷, 畢玉平.n-6和n-3多不飽和脂肪酸在人和動物體內的功能關系[J]. 山東農業(yè)科學,2006, 2:115-120.
[2]Liu Q, Bnibaker C L, Green A G, et al. Evolution of the FAD2-1 fatty acid desaturase 5′UTR intron and the molecular system atics of Gossypium (Malvaceae)[J]. American Journal of Botanv, 2001, 88(1): 92-102.
[3]Okuley J, Lightner J, Feldmann K, et a1. Arabidopsis FAD2 gene encodes the enzyme that is essential for polyunsaturated lipid synthesis[J]. Plant Cell, 1994, 6(1): 147-158.
[4]Wang M H, Liu M X, Li D K, et a1.Cloning and protoplast transient expression of BnFAD2 promoter in Brassica napus[J].Journal of Agricultural Science and Technology, 2009, 11(5):96-101.
[5]Heppard E P, Kinney A J, Stecca K L, et a1. Developmental and growth temperature regulation of two different microsomal ω-6 desaturase genes in soybeans[J]. Plant Physiol., 1996, 110(1): 311-319.
[6]Sharp P M, Li W H. An evolutionary perspective on synonymous codon usage in unicellular organisms [J]. Journal Molecular Evolution, 1986, 24(1-2): 28-38.
[7]Gupta S K, Bhattacharyya T K, Ghosh T C. Synonymous codon usage in lactococcus lactis: mutational bias versus translational selection[J]. Journal of Biomolecular Structure and Dynamics, 2004, 21(4): 1-9.
[8]王鳳德, 李利斌, 李化銀, 等. 大白菜GIF蛋白家族的生物信息學分析[J]. 山東農業(yè)科學, 2012, 44(1): 1-5.
[9]Carlini D B,Chen Y,Stephan W.The relationship between third-codon position nucleotide content,cocon bias,mRNA secondary structure and gene expression in the drosopilid alcohol dehydrogenase genes Adh and Adhr[J]. Genetics,2001,159(2):623-633.
[10]Karlin S, Campbell A M, Mrazek J. Comparative DNA analysis across diverse genomes [J]. Annual Reviews of Genetics, 1998, 32: 185-225.
[11]Wang H C, Hickey D A. Rapid divergence of codon usage patterns within the rice genome [J]. BMC Evolutionary Biology, 2007, 7(Suppl.1): 1-6.
[12]Liu H M, He R, Zhang H Y, et al. Analysis of synonymous codon usage in Zea mays [J]. Molecular Biology Reports, 2010, 37(2): 677-684.
[13]Wang L, Roossinck M J. Comparative analysis of expressed sequences reveals a conserved pattern of optimal codon usage in plants [J]. Plant Molecular Biology.2006, 61(4-5):699-710.
[14]劉慶坡, 馮英, 董輝. 20個物種同義密碼子偏性的比較分析[J]. 西北農林科技大學學報, 2004, 32(7): 67-71.
[15]劉漢梅,趙耀,顧勇,等.幾種植物waxy基因的密碼子用法特性分析[J]. 核農學報,2010,24(3):476-481.
[16]晁岳恩, 吳政卿, 楊會民, 等. 11種植物psbA基因的密碼子偏好性及聚類分析[J]. 核農學報, 2011, 25(5): 927-932.
[17]胡桂冰, 張上隆, 徐昌杰, 等. 不同種類柑橘的密碼子用法分析[J]. 華南農業(yè)大學學報, 2006, 27(1): 13-16.
[18]Hulbert S H, Richter T E, Axtell J D, et al. Genetic mapping and characterization of sorghum and related crops by means of maize DNA probes[J]. Proceedings of the National Academy of Sciences of the United States of America, 1990, 87(11): 4251- 4255.