張軍,尹珺 伊,王巖,田秋豐,劉秋瑾,何佳琦,黃宇翔,王麗坤,史同瑞,翟瑩
(1.黑龍江省農(nóng)業(yè)科學院畜牧獸醫(yī)分院,黑龍江 齊齊哈爾161005;2.齊齊哈爾大學 生命科學與農(nóng)林學院,抗性基因工程與寒地生物多樣性保護黑龍江省重點實驗室,黑龍江 齊齊哈爾161006)
植物表皮毛普遍存在于陸生植物的體表,這種特化的結構可以在植物的生長發(fā)育過程中發(fā)揮保護作用,例如減少植物熱量和水分的散失,保護植物免受昆蟲和病原體的侵害等[1-2]。無表皮毛增強子結合蛋白(Glabrous-enhancer binding protein,GeBP)是植物中特有的一類非經(jīng)典亮氨酸拉鏈轉(zhuǎn)錄因子蛋白,它們在表皮毛的發(fā)生過程發(fā)揮重要的調(diào)控作用,這種作用是通過調(diào)控GL1(GLABROUS1)基因(擬南芥中控制表皮毛發(fā)生的基因之一)的表達來實現(xiàn)的[3]。目前,已經(jīng)在擬南芥、水稻、番茄和毛竹中分別鑒定了16[3]、15[4]、10[5]和16[6]個GeBP 基因家族成員。擬南芥AtGeBP 并不參與細胞的增殖過程,而是通過調(diào)控擬南芥體內(nèi)赤霉素和細胞分裂素來控制表皮毛細胞的伸長[5,7]。毛竹中12 個PeGeBP 的表達量在有表皮毛的組織中高于無表皮毛的組織,表明這些基因參與了表皮毛形成的調(diào)控。
大豆是重要的油料作物,其表皮毛的發(fā)生具有重要的研究價值。大豆基因組測序的完成以及植物轉(zhuǎn)錄因子數(shù)據(jù)庫PlantTFDB 的構建[8],為大豆轉(zhuǎn)錄因子家族的獲取及功能研究提供了便利。但到目前為止,有關大豆GeBP 轉(zhuǎn)錄因子家族基因的功能研究尚未開展。本研究利用生物信息學方法對大豆中的9 個GmGeBP基因進行了預測分析,為后續(xù)GmGeBP 基因的功能研究提供參考和理論依據(jù)。
從植物轉(zhuǎn)錄因子數(shù)據(jù)庫PlantTFDB(http://planttfdb.gao-lab.org/index.php)中下載大豆GmGeBP 轉(zhuǎn)錄因子家族的基因及蛋白質(zhì)序列。
通過DNAMAN 軟件將下載的GmGeBP 蛋白質(zhì)序列進行比對,剔除重復序列。使用在線網(wǎng)站ExPASy(https://web.expasy.org/compute_pi/)對GmGeBP 蛋白的分子量和等電點進行預測;使用在線網(wǎng)站SMART(http://smart.embl-heidelberg.de/smart/set_mode.cgi?NORMAL=1)對GmGeBP 蛋白序列的保守結構域及位置進行預測;使用在線網(wǎng)站NetPhos 3.1 Server(http://www.cbs.dtu.dk/services/NetPhos/)對GmGeBP 蛋白的磷酸化位點進行預測;使用在線網(wǎng)站W(wǎng)oLF PSORT(https://wolfpsort.hgc.jp/)對GmGeBP 蛋白的亞細胞定位進行預測;使用在線網(wǎng)站MEME(http://meme-suite.org/tools/meme)對GmGeBP 蛋白的保守基序進行搜索。
從PlantTFDB 數(shù)據(jù)庫中獲取擬南芥GeBP 蛋白序列。利用MEGA5 軟件中的鄰接法(NJ)法構建大豆和擬南芥GeBP 蛋白的系統(tǒng)進化樹,Boot-strap 重復次數(shù)默認1 000,其他均為默認參數(shù)。
在植物轉(zhuǎn)錄因子數(shù)據(jù)庫PlantTFDB 中獲得10 個大豆候選GmGeBP 基因序列。通過蛋白質(zhì)序列比對,剔除1 個重復基因序列,將剩余的9 個GmGeBP 基因依次命名為GmGeBP1-9。進一步對GmGeBP 基因及蛋白序列進行分析,結果如表1 所示,9 個GmGeBP 基因分別分布在大豆的7 條染色體上(3、5、10、13、15、19 和20 號染色體),其中10 號和20 號染色體上分別含有2 個GmGeBP 基因。它們所編碼的肽鏈長度在353~448 個氨基酸之間,蛋白序列長度差異較大,因此它們的蛋白分子量差異也較大,范圍在39.65~49.24 之間。除GmGeBP2 蛋白的等電點為9.08,其他GmGeBP 蛋白的等電點范圍處在4.65~5.48 之間,偏酸性類型。
表1 9 個大豆GmGeBP 基因及蛋白序列的鑒定及特性
保守結構域預測分析結果如圖1 所示,9 個GmGeBP 蛋白序列中均含有1 個功能未知的DUF573 基序。因為DUF573 基序是GeBP 轉(zhuǎn)錄因子的中央結合DNA 結構域[5],進一步證明所鑒定的9 個蛋白均為GeBP家族成員。此外,GmGeBP1、3、5、6、7、9 含有多個低重復序列區(qū)和1 個螺旋區(qū)域,GmGeBP2、4、8 僅含有多個低重復序列區(qū),GmGeBP7 還含有1 個SCOP 結構域。9 個GmGeBP 基因序列中DUF573 基序所處位置存在一定差異,且除了DUF573 基序較為保守外,其他序列部分相似度較低。此外,9 個GmGeBP 基因所編碼的肽鏈長度差異也較大,等電點也各不相同。這些都可能與GmGeBP 基因功能差異相關。
磷酸化位點預測結果顯示(表1),除GmGeBP6 蛋白僅含有絲氨酸(Ser)和蘇氨酸(Thr)磷酸化位點外,其他8 個GmGeBP 蛋白均含有不同數(shù)量的Ser、Thr 和酪氨酸(Tyr)磷酸化位點,且Ser 數(shù)量﹥Thr數(shù)量﹥Tyr 數(shù)量。根據(jù)GmGeBP 蛋白中大量磷酸化位點的存在,推測它們可以借助磷酸化及去磷酸化作用調(diào)節(jié)GmGeBP 蛋白與DNA 順式作用元件的結合[9]。
亞細胞定位預測結果顯示(表1),9 個GmGeBP 蛋白定位于細胞核中的概率均大于89%,且它們均含有1~3 個明顯的核定位信號。這與毛竹PeGeBP 蛋白亞細胞定位預測結果相符[6],但不同于水稻OsGeBP蛋白亞細胞定位預測結果[4]。
使用MEGA5 軟件對 9 個GmGeBP 蛋白和18 個擬南芥AtGeBP 蛋白進行系統(tǒng)進化分析。如圖2 所示,27 個GeBP 家族成員可分為5 個進化枝,分別含有11 個(Ⅰ)、4 個(Ⅱ)、1 個(Ⅲ)、4 個(Ⅳ)和7 個(Ⅴ)GeBP 蛋白。進化枝Ⅰ和Ⅳ為擬南芥和大豆共有,進化枝Ⅱ和Ⅴ為擬南芥獨有,進化枝Ⅲ為大豆獨有,且僅含有一個大豆GmGeBP4 蛋白。大豆GmGeBP 家族中存在3 組旁系同源蛋白(GmGeBP1 和GmGeBP7、GmGeBP3 和GmGeBP9、GmGeBP5 和GmGeBP6)。而大豆和擬南芥AtGeBP 家族之間不存在直系同源蛋白,說明GeBP 家族的分化晚于大豆和擬南芥物種的分化。親緣關系越近,可能意味著基因的功能越相似。進化枝Ⅰ和進化枝Ⅳ為擬南芥和大豆共有,因此這兩個進化枝中的GeBP 基因很可能具有相似的生物學功能。
圖1 GmGeBP 保守結構域分析
圖2 大豆和擬南芥GeBP 家族系統(tǒng)進化樹
蛋白保守基序預測結果顯示,9 個GmGeBP 中共存在15 個保守基序(圖3)。系統(tǒng)進化樹中親緣關系越近的GmGeBP 蛋白所含有的保守基序分布也越相似。例如GmGeBP1 和GmGeBP7、GmGeBP3 和GmGeBP9、GmGeBP5 和GmGeBP6,所包含的保守基序在類型、數(shù)量和順序上非常相似。這也反映了GeBP 蛋白系統(tǒng)發(fā)育分析結果的準確性。
圖3 大豆GmGeBP 蛋白保守基序
本研究利用生物信息學方法鑒定了9 個大豆GmGeBP 基因,并對基因及蛋白結構和性質(zhì)、染色體分布、亞細胞定位、系統(tǒng)進化關系等進行分析,為后續(xù)GmGeBP 基因的功能研究提供參考和理論依據(jù)。