, ,,
(1.湖南農業(yè)大學 農學院,湖南 長沙 410128;2.桃源縣第三中學,湖南 桃源 415701;3.湖南文理學院 生命與環(huán)境科學學院,湖南 常德 415000)
我國小麥在種植面積、總產量和消費量上,皆居世界首位,是我國第三大糧食作物。小麥的蛋白質占小麥籽粒重量的8%~20%,分為麥谷蛋白和醇溶蛋白,它們是決定面團彈性和延伸性的物質基礎。面食的品質優(yōu)劣主要依賴于小麥籽粒貯藏蛋白——面筋蛋白的結構及其相互作用。用水或者稀鹽溶液沖洗面團,剩下的物質稱為面筋。面筋中有80%由蛋白質組成,它們稱為面筋蛋白,由醇溶蛋白和麥谷蛋白組成[1]。面筋蛋白之間通過很強的共價鍵和非共價鍵相互作用,賦予面團粘彈特性[2]。醇溶蛋白是單體蛋白,主要影響面團的粘性和延展性;而麥谷蛋白可以形成多聚體蛋白,主要影響面團的彈性,并最終影響小麥面粉的加工品質。因此對麥谷蛋白組成、結構和功能的研究一直是小麥品質改良領域的研究熱點[3]。麥谷蛋白根據分子量大小可分為高分子量麥谷蛋白(HMW-GS)和低分子量麥谷蛋白(LMW-GS)。LMW-GS基因沒有內含子,是一個單一的開放閱讀框,其編碼序列一般含有900~1200個堿基,其編碼的成熟蛋白亞基的分子量大小約30~45kDa。重復區(qū)域一般以PPFSQQ為主要的重復單元,重復單元的個數直接影響著LMW-GS分子量的大小;C-I區(qū)比較保守,是半胱氣酸富集的區(qū)域,C-II區(qū)則是脯氨酸富集的區(qū)域,序列結構不保守,C-III區(qū)域含有一個半胱氨酸,其氨基酸序列也比較保守[4]。我國小麥蛋白質含量并不低,經過多年定向選擇,也不乏優(yōu)質亞基,但面筋質量仍然較差,說明貯藏蛋白組成不合理,組份比例及絕對含量可能是主要問題。谷蛋白總量及組份含量主要受品種遺傳特性決定,而麥谷蛋白含量與面團特性和面包加工品質高度相關,可以通過培育谷蛋白高表達量的品種,提高品質性狀的環(huán)境穩(wěn)定性。本研究以河東烏麥為實驗材料,對其低分子量麥谷蛋白編碼基因進行生物信息學分析,為小麥低分子量谷蛋白基因研究增添新內容,為優(yōu)化小麥加工品質提供參考。
培養(yǎng)保存于湖南文理學院生命與環(huán)境科學學院種質資源庫的河東烏麥的黃化幼苗提取其總基因組DNA。
利用CTAB法提取供試材料總基因組DNA,1%瓊脂糖凝膠檢測DNA質量。根據NCBI數據庫中已報道的低分子量谷蛋白基因序列的保守區(qū),分別設計可擴增低分子量谷蛋白基因完整編碼區(qū)的兼并性引物,對其進行PCR擴增,1%瓊脂糖電泳檢測擴增結果,用PCR產物瓊脂糖凝膠回收試劑盒(天根生化科技有限公司)對目的片段進行回收純化。
將回收純化的PCR產物送專業(yè)公司進行測序,本研究序列測定由南京金斯瑞生物科技有限公司完成。測序結果比較分析采用NCBI網址中的Blast(http://www.ncbi.nlm.nib.gov/BLAST/)程序進行;DNA序列分析、系統(tǒng)演化、蛋白質序列分析等用DNAMAN8.0軟件完成。
對提取獲得的河東烏麥總基因組DNA進行擴增,擴增產物用1%瓊脂電泳進行檢測,結果表明擴增出1條約920bp的亮帶(圖1)。
通過測序,獲得一條長918bp,分子量為565.94kDa的核苷酸序列(圖2)。
序列包括275個腺嘌呤核糖核苷酸(A),占整條DNA核苷酸鏈的30.0%;294個胞嘧啶核糖核苷酸(C),占32.0%;156個鳥嘌呤核糖核苷酸(G),占17.0%;193個胸腺嘧啶核糖核苷酸(T),占21.0%(表1)。
該DNA序列GC含量約為49.0% ,AT含量約為51.0%。其中GC在序列含量越高,DNA的雙螺旋結構越穩(wěn)定,在PCR擴增過程中所需要的退火溫度就越高。
圖1 PCR擴增產物瓊脂糖凝膠電泳結果 表1 核苷酸序列的各種堿基的數目及百分數
堿基堿基數目所占百分比/%A27530.0T19321.0C29432.0G15617.0A-T46851.0G-C45049.0
圖2 河東烏麥低分子量谷蛋白基因編碼的核酸序列
在河東烏麥低分子量谷蛋白編碼的基因核酸序列中通過DNAMAN用了117種常見酶進行篩選。共篩選出18個限制性酶切位點,其中包括了17種酶,ApaBI在序列中有兩個酶切位點,分別在47bp和566bp處,其它16種酶Acc65I,AlwNI,Asp718I,BbvII,BglI,Bpu1102I,Bsc91I,Bsp1407I,Eco31I,EspI,KpnI,MstI,NcoI,SpeI,XcmI,XmnI在序列中各有一個位點(圖3)。
圖3 河東烏麥低分子量谷蛋白編碼基因DNA限制酶切圖譜
利用NCBI對河東烏麥低分子量谷蛋白基因序列進行基因比對,發(fā)現有9條基因序列與河東烏麥基因的相似性達到99%。隨機選取相似性較高的8條序列進行比對分析。結果發(fā)現與河東烏麥相似性最高的是普通小麥,兩者同源性最高,其次是烏拉爾圖小麥、Taeniatherum crinitum、節(jié)節(jié)麥(表2)。
表2 河東烏麥LMW-GS基因序列的同源性比對
用這8條核酸序列和研究的目的核算序列利用DNAMAN軟件進行堿基同源性比對分析,構建系統(tǒng)發(fā)育樹(圖4)。
結果顯示FJ549935和KM085255的該基因堿基排列順序及種類極其相似,具有很高的同源性,最先聚為一類。說明這2個基因序列可能是由于環(huán)境等因素變化引起該種群的基因頻率發(fā)生了變化,即趨異進化而形成的兩個基因。它們擁有一個共同的祖先,因此可聚為一類。而河東烏麥的低分子量谷蛋白基因最先與FJ549935,KM085255,KX879103,FJ755302,KU522466聚成一類,最后才與JX828341聚成一類,說明該河東烏麥的基因與FJ549935,KM085255,KX879103,FJ755302,KU522466親緣關系較近,與后者親緣關系較遠。
圖4 系統(tǒng)發(fā)育樹
利用DNAMAN軟件對同源相似性程度較高的8個序列進行堿基同源性分析(圖5)。堿基高度保守的區(qū)域:位點在388~403bp、415~429bp、447~470bp、491~506bp、508~524bp、620~644bp、665~719bp、775~790bp處堿基序列完全一致,所以這幾種不同生物體的不同基因在這些區(qū)域內是高度保守的DNA序列,不易突變。堿基發(fā)生缺失的區(qū)域:EF190322在347~352bp處,KM085255在534~536bp處都發(fā)生了一個堿基的缺失,而在348~350bp處7條序列都出現了堿基的基因缺失。
目的序列在區(qū)域中一共發(fā)生了5處堿基突變。在490bp,A突變成C,在539bp,C突變成T,在556bp,G突變成C,在663bp,A突變成G,591bp處,A突變成G。
圖5 基因核酸序列比對
蛋白質二級結構是蛋白質復雜空間構象的物質基礎,是蛋白質可以行使各種各樣生命活動功能的前提。利用DNAMAN分析軟件對目的核酸序列編碼的氨基酸序列進行分析。其中Gln谷氨酰胺的含量最高,為35.00%,其次Pro脯氨酸含量較高,為10.34%,Asp天冬氨酸含量最低,僅為0.33%(圖6)。
對該序列所翻譯的蛋白質二級結構進行了預測,結果發(fā)現,該蛋白質二級結構主要為無規(guī)則卷曲(coils),主要分布于第20~154個氨基酸片段內,有零星片層結構。其中氨基酸為306個,分子量大小為34588.0kDa(圖7)。
圖6 河東烏麥低分子量谷蛋白編碼基因氨基酸序列信息
圖7 蛋白質二級結構預測
利用DNAMAN分析軟件對該序列編碼的氨基酸序列進行了疏水性分析,結果顯示,1~25bp,256~306bp處為疏水性,26~120bp,190~250bp處為親水性(圖8)。
圖8 蛋白質疏水性分析結果
利用DNAMAN分析軟件對該序列編碼的氨基酸序列進行了分析,結果得出河東烏麥蛋白質信號肽序列為MKTFLVFALLAVVATSAIA(圖9)。
圖9 蛋白質信號肽序列
利用PCR擴增技術,從河東烏麥基因中分離得到一條長度為918bp的低分子量谷蛋白編碼基因序列,其上共有18個酶切位點,GC含量為49.0%。
利用NCBI網站對該段序列BLAST同源比對結果表明,該基因與來自于普通小麥低分子量麥谷蛋白中得亞基GluA3-21和GluA3-1基因高度相似,相似值達到99%。系統(tǒng)演化分析表明,該基因與編號1、2、3、4、5的序列先聚到一類,表明這6個基因片段的堿基序列同源程度高,其親緣關系較近。
利用DNAMAN分析軟件對該核苷酸序列編碼得氨基酸序列進行分析,結果得出河東烏麥蛋白質信號肽序列為MKTFLVFALLAVVATSAIA。進行人工翻譯后,得到306個氨基酸,分子量大小為34588.0kDa。其中,含量最高的氨基酸為Gln谷氨酰胺,含量為35.00%,周琴等人[5]研究中表明,隨著谷氨酰胺水平的提高,籽粒的淀粉含量呈現遞減趨勢,與淀粉含量變化趨勢相反,籽粒蛋白質的含量隨谷氨酰胺供應水平的的提高而迅速上升,而對于單個籽粒中的淀粉和蛋白質的積累量有促進作用,但是對蛋白質的促進作用大于淀粉的促進作用。二級結構分析表明,該蛋白質主要由卷曲(coil)結構組成,在第20-154號氨基酸區(qū)段分布最為密集,其次為片層結構。蛋白質的結構主要影響小麥的加工品質。