国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

橄欖轉錄組密碼子使用偏好性及其影響因素

2019-01-09 08:04賴瑞聯(lián)鐘春水陳義挺吳如健
核農學報 2019年1期
關鍵詞:密碼子橄欖樣本

賴瑞聯(lián) 馮 新 陳 瑾 鐘春水 陳義挺 吳如健

(福建省農業(yè)科學院果樹研究所,福建福州 350013)

密碼子是生物體遺傳和變異的基本單元,生物體中,一種氨基酸一般對應多個密碼子,稱為同義密碼子,而生物體基因編碼氨基酸對同義密碼子的選擇并非完全隨機,存在密碼子使用偏好性(codon usage bias,CUB)[1]。 物種之間[2-3]、器官之間[4]、細胞核基因和細胞器基因之間[5]、基因家族成員之間[6]均存在不同的密碼子使用偏好模式,但一般認為近緣物種密碼子使用偏好性相對一致。大量研究表明,生物體對同義密碼子的選擇不改變其蛋白質種類,但會影響蛋白質的翻譯效率,且在長期進化過程中,突變的最優(yōu)密碼子往往更傾向存在于高表達的基因和具有豐富多態(tài)性的位點中,從而保持密碼子選擇的有效性[7-9]。

密碼子使用偏好性是突變壓力和自然選擇2種作用力相互平衡的結果,但作用力的主成分卻往往不一致[10-11],如柑橘[12]、白花蠅子草[13]和云杉[14]等主要是自然選擇的結果,咖啡[15]主要受突變壓力,而玉米[16]、菊花[17]和二穗短柄草[18]被認為是2種因素共同作用的結果。研究表明,密碼子使用偏好性的形成還與基因長度、基因功能、基因表達水平[19]、內含子數(shù)量[20]、蛋白親水性[19]、mRNA 二級結構[21]、tRNA 豐度[22]等有關。此外,在基因異源表達和遺傳轉化過程中,目標基因與宿主基因組之間的密碼子使用偏好性差異也會導致基因甲基化或表達沉默,根據(jù)宿主基因組密碼子使用偏好性優(yōu)化和改造目標序列密碼子,對異源轉化試驗的順利開展也具有重要意義[23]。

橄欖[Canarium album(Lour.)R.]為橄欖科橄欖屬常綠喬木果樹,其果實富含大量酚類化合物、黃酮類化合物、多糖、氨基酸等營養(yǎng)成分,是一種深受消費者青睞的藥食兩用作物[24]。橄欖也是我國熱帶和亞熱帶地區(qū)特色名貴果樹,然而其耐寒性差,在福建閩侯、閩清、尤溪、上杭等橄欖主產(chǎn)區(qū)均發(fā)生過大規(guī)模凍害,導致產(chǎn)量銳減甚至絕收,低溫凍害已成為橄欖產(chǎn)業(yè)穩(wěn)定發(fā)展的重要制約因素[25]。此外,橄欖遺傳背景和分子進化研究起步較晚,目前國內外對橄欖密碼子偏好性相關報道也并不常見[26]。開展橄欖密碼子尤其是低溫脅迫下轉錄組密碼子偏好性分析,對進一步揭示橄欖遺傳背景及其抗寒機制具有重要作用。

本研究以低溫脅迫處理后通過Illumina HiSeq平臺測序獲得的福欖1號橄欖轉錄組數(shù)據(jù)為基礎,利用codonW、EMBOSS等軟件對橄欖轉錄組密碼子使用偏好特征及其可能的影響因素進行分析,以期為橄欖遺傳背景和分子進化研究提供一定的科學依據(jù)。

1 材料與方法

1.1 材料及處理

2017年3月,福建省農業(yè)科學院果樹研究所橄欖課題組對選育的橄欖鮮食優(yōu)良品種福欖1號進行低溫脅迫處理,并基于Illumina HiSeq平臺進行轉錄組測序和數(shù)據(jù)分析。隨后,參照張?zhí)萚27]的方法編寫perl腳本程序,從轉錄組中篩選并提取滿足以下條件的編碼序列用于后續(xù)分析:包含起始密碼子ATG并以終止密碼子TAA、TAG或TGA結尾的完整CDS序列;不含有內含子,編碼區(qū)長度大于300 bp的蛋白質編碼區(qū)序列。此外,擬南芥 (Arabidopsisthaliana)、煙草(Nicotiana tabacum)、大腸桿菌(Escherichia coli)和酵母菌(Saccharomyces cerevisiae)的密碼子使用偏好性數(shù)據(jù)來源于Codon Usage Database在線數(shù)據(jù)庫(http://www.kazusa.or.jp/codon/),其中用于數(shù)據(jù)分析的4個物種基因樣本數(shù)分別為 80 395、1 534、5 347和1 611 503,所涉及的密碼子個數(shù)分別為31 098 475、609 684、1 611 503 和 6 534 504。

1.2 方法

1.2.1 密碼子使用偏好性參數(shù)分析 采用codonW軟件分析橄欖轉錄組密碼子使用偏好性參數(shù),包括有效密碼子數(shù)(effective number of codon,ENc)、密碼子適應指數(shù)(codon adaptation index,CAI)、同義密碼子相對使用度(relative synonymous codon usage,RSCU)、密碼子G和C(GC)平均含量、密碼子第3位上G和C(GC3s)含量、密碼子第1、第2位上G和C(GC12)的平均含量及密碼子第3位上 A、G、C和T(A3、G3、C3和T3)含量。采用EMBOSS在線程序的CUSP模塊分析密碼子使用頻率(frequency of optional codons,F(xiàn)OP)(http://emboss.toulouse.inra.fr/cgi-bin/ emboss/cusp)。

1.2.2 中性繪圖分析 中性繪圖分析(neutrality plot)以GC12為縱坐標,GC3s為橫坐標,通過分析編碼區(qū)密碼子GC12和GC3s的相關性衡量自然選擇和突變壓力對密碼子使用偏好性的影響程度。如果GC12和GC3s存在相關性,則密碼子不同位置上堿基的組成無差異,密碼子使用偏好性主要受突變壓力影響;如果二者不相關,說明密碼子第1和第2位上堿基組成與第3位差異顯著,密碼子使用偏好性主要受自然選擇作用。

1.2.3 ENc-GC3s關聯(lián)分析 ENc-GC3s關聯(lián)分析(ENc-GC3s plot)以ENc為縱坐標,GC3s為橫坐標,繪制散點圖和標準曲線,如果基因分布在標準曲線附近,其密碼子使用偏好性主要受突變壓力影響,若基因分布在標準曲線下方較遠位置,則認為密碼子使用偏好性主要受自然選擇作用。其中,ENc比值頻率作為重要參考標準,反映了ENc實際值與期望值之間的差異,通常認為ENc比值頻率介于-0.05~0.05[28]時,密碼子使用偏好性主要受突變壓力影響。

1.2.4 偏倚分析 偏倚分析(PR2-plot)以A3/(A3+T3)為縱坐標,G3/(G3+C3)為橫坐標,分析編碼區(qū)中嘌呤和嘧啶之間的相對關系。若基因樣本主要分布在平面圖的中心位置,說明4種堿基出現(xiàn)的概率相對一致,密碼子使用偏好性主要受突變壓力影響,若偏離中心位置較遠說明該樣本可能還存在其他作用因素。

1.2.5 最優(yōu)密碼子分析 參照Yang等[29]和吳彥慶等[30]的方法,對篩選的橄欖轉錄組基因樣本按CAI值由高到低排序,分別提取前后各5%的序列作為高低表達基因樣本并分析其RSCU值。將高表達轉錄本中RSCU值明顯高于低表達轉錄本的密碼子確定為橄欖轉錄組最優(yōu)密碼子群。

2 結果與分析

2.1 GC含量與中性繪圖分析

橄欖低溫脅迫轉錄組中篩選獲得符合條件的CDS序列2 664條,包含492 676個密碼子,將樣本進行密碼子偏好性分析。由圖1-A可知,橄欖轉錄組密碼子GC變化范圍為0.325~0.588,平均為0.435,其中大部分基因介于0.4~0.5之間,占總數(shù)的93.56%,表明橄欖轉錄組密碼子總體上偏好使用堿基A和T;由圖1-B可知,橄欖轉錄組密碼子GC3s變化范圍為0.234~0.802,基因樣本間差異較大,但大部分介于0.3~0.5之間,占總數(shù)的94.16%,平均值僅為0.377,說明橄欖轉錄組密碼子末位堿基同樣偏好使用A或T。

中性繪圖分析結果如圖2所示,基因樣本集中在中性圖回歸線兩側(y=0.033x+0.451),GC12和GC3s呈正相關,相關性系數(shù)為0.033(R2=0.004),即密碼子3個位置上的堿基組成無差異,表明橄欖轉錄組密碼子使用偏好性主要受突變壓力影響。

圖1 橄欖轉錄組GC(A)和GC3s(B)的GC含量直方分布Fig.1 Distribution of GC content of GC(A)and GC3s(B)in Canarium album(Lour.)R.transcriptome

圖2 橄欖轉錄組中性繪圖Fig.2 Neutrality plot of Canarium album(Lour.)R.transcriptome

2.2 ENc與GC3s關聯(lián)分析

ENc是衡量密碼子使用偏好性的重要參考指標,其值介于20~61之間,越接近61則密碼子使用偏好性越弱,當ENc值為61時表明該基因樣本對密碼子的使用完全隨機,反之越接近20則密碼子使用偏好性越強,35是基因密碼子使用偏好性強弱的重要參考依據(jù)[31]。由圖3可知,橄欖轉錄組密碼子ENc值介于34.65~61.00之間,平均為51.80,且大部分基因ENc介于45.00~60.00之間,表明其偏好性普遍較弱。在這些基因樣本中,ENc值小于35的基因僅有1個,為功能未知的蛋白;而ENc值達到61的基因樣本數(shù)目為25,占總數(shù)的2.15%,主要涉及編碼tRNA特異性腺苷脫氨酶、DNA聚合酶亞基、細胞色素、環(huán)指蛋白、糖基轉移酶,以及一些功能未知的蛋白。

進一步對ENc和GC3s關聯(lián)分析發(fā)現(xiàn),橄欖轉錄組各基因樣本均勻分布在標準曲線(y=-170.82x2+169.48x+ 12.965,R2=0.276)兩側(圖4)。 ENc比值頻率取值范圍為-0.159~0.344,其中介于-0.1~0.1之間的基因樣本數(shù)占總數(shù)86.08%,-0.05~0.05之間的基因樣本數(shù)占總數(shù)59.54%,實際ENc值和理論ENc值差異相對較小(圖5),說明橄欖轉錄組密碼子使用偏好性主要受堿基組分影響,突變壓力是其形成的主要作用方式。

圖3 橄欖轉錄組ENc值直方分布Fig.3 Distribution of ENc value of Canarium album(Lour.)R.transcriptome

圖4 橄欖轉錄組ENc-GC3s關聯(lián)繪圖Fig.4 ENc-GC3s plot of Canarium album(Lour.)R.transcriptome

2.3 偏倚分析

由圖6可知,橄欖轉錄組基因樣本平均分布位置為(0.438,0.555),說明總體上密碼子腺嘌呤A的比例高于胸腺嘧啶T,鳥嘌呤G的比例低于胞嘧啶C。轉錄組中大部分基因樣本位于平面中心點附近,嘌呤和嘧啶出現(xiàn)的概率相對一致,密碼子使用偏好性可能主要受突變壓力影響。此外,也存在部分基因樣本偏離中心點較遠,其密碼子使用偏好性可能還受其他作用力影響。綜上,橄欖轉錄組密碼子使用偏好性是以突變壓力為主,多種作用方式共同影響的結果。

圖5 橄欖轉錄組ENc比值頻率分布Fig.5 Frequency distribution of ENc ratio of Canarium album(Lour.)R.transcriptome

2.4 轉錄組最優(yōu)密碼子分析

以CAI作為衡量依據(jù),對CAI指數(shù)由高到低前后各5%的序列作為橄欖高低表達基因樣本進行RSCU分析,結果如表1所示。高低表達基因樣本之間的RSCU值差異相對較小,這可能與橄欖轉錄密碼子使用偏好性較弱有關。但CGC、ATC、CTC和ACC等在高表達樣本組中的RSCU值仍明顯高于低表達樣本組,可作為橄欖轉錄組最優(yōu)密碼子群。這些最優(yōu)密碼子均以C結尾,表明橄欖轉錄組最優(yōu)密碼子偏好使用G或C結尾,而橄欖轉錄組密碼子整體偏好使用A或T結尾,可能是造成其使用偏好性較弱的關鍵因素之一。

圖6 橄欖轉錄組PR2-plot分析Fig.6 PR2-plot analysis of Canarium album(Lour.)R.transcriptome

表1 橄欖轉錄組高低表達基因樣本的RSCU比較Table1 Comparison of RSCU in Canarium album(Lour.)R.transcriptome with high and low level of expression

2.5 密碼子使用頻率分析

物種間嚴格的密碼子使用偏好性是影響異源轉化效率的重要因素,通常以密碼子使用頻率作為參考標準[23]。由圖7可知,橄欖與擬南芥和煙草這2種模式植物之間的整體密碼子使用偏好性差異極小,除擬南芥GCG外(比值為0.499),其他密碼子均無明顯差異;而與大腸桿菌和酵母菌相比,存在使用偏好性差異的密碼子個數(shù)分別為11和3。表明煙草和酵母菌可作為橄欖目標基因遺傳轉化功能驗證或異源表達的理想受體系統(tǒng)。

3 討論

在長期進化過程中,特定物種往往形成適應自身基因組環(huán)境的密碼子使用模式[32]。本試驗中,橄欖轉錄組密碼子平均ENc為51.80,遠高于35,與橄欖類黃酮異構酶基因CHI的ENc值(50.89)較為接近[26],表明橄欖轉錄組密碼子使用偏好性較弱,同時橄欖中不同基因密碼子在長期進化過程中可能保持較高的同步性。而在GC含量方面,橄欖轉錄組偏好使用富含A和T且以A或T結尾的密碼子,符合大部分雙子葉植物密碼子組成規(guī)律[33]。此外,橄欖最優(yōu)密碼子群體數(shù)目較少,且高低表達基因樣本間RSCU值差異不明顯,已確定的最優(yōu)密碼子偏好以G或C結尾。由此推斷,橄欖本身密碼子使用偏好性弱且主要偏好使用以A或T結尾的密碼子是造成其最優(yōu)密碼子缺乏的重要原因之一。

密碼子使用偏好性是突變壓力和自然選擇共同作用的結果。橄欖密碼子組分、中性繪圖、ENc-GC3s關聯(lián)和偏倚繪圖等綜合分析認為,橄欖轉錄組密碼子使用偏好性是突變壓力為主,多種作用方式共同影響的結果。結合橄欖轉錄組密碼子組分、賴瑞聯(lián)等[34]和Novembre[35]的觀點推斷,這種可能從GC向AT突變?yōu)橹?,即橄欖轉錄組密碼子可能在突變壓力作用下,由GC向AT突變從而形成了橄欖特定密碼子使用偏好性,而偏好性強弱也與突變作用力大小有關。

密碼子使用頻率常被用于比較不同物種對特定密碼子的選擇和使用偏好,為目標基因進行模式生物異源轉化提供參考[36]。本研究中,橄欖轉錄組與模式植物基因組間的密碼子使用頻率較為一致,預示在長期進化過程中其密碼子使用偏好性并未發(fā)生特異性改變,這也是造成其密碼子使用偏好性偏弱的可能因素之一。在后續(xù)研究中,可進一步與楝科、蕓香科和苦木科等物種密碼子進行比較,同時對密碼子的具體區(qū)域分布進行精細分析,研究基因蛋白編碼區(qū)與非編碼區(qū)之間、內含子與外顯子之間,以及可變剪接體之間密碼子的使用偏好模式等。此外,通過結合現(xiàn)代高通量測序技術對橄欖品質、產(chǎn)量和抗性等相關轉錄本間密碼子使用偏好模式進行分析,可為橄欖目標性狀形成的遺傳機理研究提供重要依據(jù)。

圖7 橄欖轉錄組與模式生物基因組密碼子使用頻率比較Fig.7 Comparison of codon bias between Canarium album(Lour.)R.transcriptome and representative organism genomes

4 結論

本研究通過對橄欖轉錄組的密碼子進行分析發(fā)現(xiàn),橄欖轉錄組密碼子使用偏好性較弱,但傾向使用富含A和T并以A或T結尾的密碼子,而這種使用偏好模式是以突變壓力為主,多種作用方式共同影響的結果。此外,煙草和酵母菌可作為橄欖目標基因異源轉化的理想受體系統(tǒng)。本試驗結果初步揭示了橄欖密碼子使用規(guī)律,為進一步深入研究橄欖遺傳背景和分子進化提供了一定的科學依據(jù)。

猜你喜歡
密碼子橄欖樣本
橄欖林中的鄉(xiāng)村酒店
用樣本估計總體復習點撥
密碼子與反密碼子的本質與拓展
推動醫(yī)改的“直銷樣本”
10種藏藥材ccmFN基因片段密碼子偏好性分析
冬清肺火用橄欖
橄欖情
隨機微分方程的樣本Lyapunov二次型估計
村企共贏的樣本
榨橄欖器