李金鑫,周海城,王玉文,關乃千,孫 昆,穆懷志
(1.長白山自然保護管理中心,吉林 二道白河 133613;2.北華大學林學院,吉林 吉林 132013)
糠椴(Tiliamandshurica)又稱遼椴,為椴樹科(Tiliaceae)椴樹屬(Tilia)高大喬木,在我國主要分布于東北三省及河北、內(nèi)蒙古、山東和江蘇北部等地.糠椴枝繁葉茂、生長迅速,不僅廣泛應用于園林綠化,也是重要的蜜源樹種[1].近年來,關于糠椴的研究主要集中在種群分布格局[2-4]、解剖結(jié)構(gòu)[5-7]、扦插生根[8]、化學成分[9-10]、光合特性[11]、傳粉生物學[12]等方面.核酮糖-1,5-二磷酸羧化酶/加氧酶(Rubisco)是植物光合作用過程中催化CO2固定和光呼吸的關鍵酶,直接影響植物的凈光合速率[13].目前,關于糠椴Rubisco基因的研究相對較少.因此,本研究對糠椴Rubisco基因進行生物信息學分析,為進一步研究糠椴Rubisco基因的結(jié)構(gòu)和功能提供參考.
NCBI(https:∥www.ncbi.nlm.nih.gov)數(shù)據(jù)庫中糠椴葉綠體基因組的序列號為NC_028589.1.選取NCBI中糠椴Rubisco基因轉(zhuǎn)錄和翻譯產(chǎn)生的mRNA序列和氨基酸序列為材料,利用ORF Finder分析基因開放閱讀框[14];利用ProtParam分析氨基酸組成[15];利用Protscale的Hphob./Kyte & Doolittle標準分析親水性/疏水性[16];利用TMHMM分析蛋白質(zhì)跨膜結(jié)構(gòu)域[17];利用Predict Protein進行亞細胞定位[18];利用JPred4分析氨基酸序列的二級結(jié)構(gòu)[19];利用SWISS-MODEL通過同源建模構(gòu)建氨基酸序列的三級結(jié)構(gòu)[20].
開放閱讀框(Open Reading Frame,ORF)是指從起始密碼子開始,結(jié)束于終止密碼子的連續(xù)堿基序列,具有編碼蛋白質(zhì)的潛能[21].經(jīng)ORF Finder分析,糠椴Rubisco基因共獲得5個開放閱讀框(ORF1~ORF5).其中,ORF1的長度最大,為1 455 bp,起始密碼子位于葉綠體基因組的60 980 bp,終止密碼子位于62 434 bp(圖1),共編碼484個氨基酸.
ProtParam分析結(jié)果表明:糠椴Rubisco共含有20種氨基酸.其中,甘氨酸的比例最高,占所有氨基酸的9.71%;其次為丙氨酸和亮氨酸,占比分別為9.09%和8.88%;其后依次為谷氨酸(7.44%)、纈氨酸(6.61%)、蘇氨酸(6.40%)、精氨酸(6.20%)、天冬氨酸(5.58%)、賴氨酸(5.17%)、異亮氨酸(4.34%)、苯丙氨酸(4.34%)、脯氨酸(4.34%)、絲氨酸(3.72%)、酪氨酸(3.72%)、天冬酰胺(3.10%)、組氨酸(3.10%)、谷氨酰胺(2.27%)、甲硫氨酸(2.27%)、半胱氨酸(2.07%);色氨酸的比例最低,僅占所有氨基酸的1.65%(圖2).糠椴Rubisco的分子式為C2400H3719N663O704S21,相對分子質(zhì)量為53 798.21,理論等電點為6.04,不穩(wěn)定指數(shù)為40.36,為不穩(wěn)定蛋白.
在糠椴Rubisco中,甘氨酸、蘇氨酸、絲氨酸、半胱氨酸、天冬酰胺、谷氨酰胺、酪氨酸、賴氨酸、精氨酸、組氨酸、天冬氨酸和谷氨酸為親水性氨基酸,丙氨酸、纈氨酸、亮氨酸、異亮氨酸、苯丙氨酸、色氨酸、甲硫氨酸和脯氨酸為疏水性氨基酸,氨基酸的親/疏水性會對蛋白質(zhì)的高級結(jié)構(gòu)產(chǎn)生影響[22].ProtScale分析結(jié)果表明:糠椴Rubisco氨基酸序列的352 bp得分最高,達到2.05,315 bp得分最低,僅為-2.60(圖3);GRAVY值為-0.279,小于0,說明糠椴Rubisco為親水蛋白.
跨膜蛋白在細胞增殖和分化、能量轉(zhuǎn)換、信號轉(zhuǎn)導及物質(zhì)運輸?shù)确矫婢哂兄匾饔?,是介導細胞間物質(zhì)和能量信號的傳遞者[23].通過TMHMM分析糠椴Rubisco的跨膜區(qū)發(fā)現(xiàn),糠椴Rubisco在膜內(nèi)的概率為0,在膜外的概率為100%(圖4),說明糠椴Rubisco不存在跨膜結(jié)構(gòu)域.
利用Predict Protein對糠椴Rubisco進行亞細胞定位發(fā)現(xiàn),糠椴Rubisco廣泛分布在葉綠體中.靶位點分析表明:糠椴Rubisco共有12個蛋白結(jié)合區(qū).其中,長度為2的蛋白結(jié)合區(qū)有2個,分別位于1~2位氨基酸和100~101位氨基酸;長度為3的蛋白結(jié)合區(qū)有1個,位于50~52位氨基酸;長度為6的蛋白結(jié)合區(qū)有1個,位于362~367位氨基酸;長度為1的蛋白結(jié)合區(qū)有8個,分別位于4、36、171、243、310、438、440、442位氨基酸(圖5).
蛋白質(zhì)二級結(jié)構(gòu)是指多肽主鏈骨架原子沿一定軸盤旋或折疊而形成的特定構(gòu)象,主要包括α螺旋、β折疊、β轉(zhuǎn)角和無規(guī)則卷曲[24].利用JPred4分析糠椴Rubisco氨基酸序列的二級結(jié)構(gòu),結(jié)果發(fā)現(xiàn):糠椴Rubisco由α螺旋、β折疊和無規(guī)則卷曲等3種二級結(jié)構(gòu)組成.組成α螺旋、β折疊和無規(guī)則卷曲的氨基酸數(shù)目分別為169、55和260個,分別占所有氨基酸的34.92%、11.36%和53.72%(圖6).利用SWISS-MODEL對糠椴Rubisco氨基酸序列進行同源建模,得到的三維結(jié)構(gòu)見圖7.
Rubisco是廣泛存在于植物葉綠體基質(zhì)中的一種雙功能酶,既能催化C3與CO2的羧化反應進行光合作用,又能催化C5的加氧反應進行光呼吸,處于光合碳氧化和碳還原的交叉點上,對于植物的凈光合速率具有決定性影響[25].周曉馥等[26]對21個常綠杜鵑亞組的Rubisco大亞基基因進行了生物信息學分析,結(jié)果發(fā)現(xiàn),雖然不同常綠杜鵑的Rubisco催化位點和大亞基具有高度的保守性,但在進化上仍存在差異.魏軍亞等[27]利用PCR技術克隆了香蕉Rubisco小亞基的基因序列,并分析了香蕉Rubisco小亞基的理化性質(zhì)、親/疏水性、信號肽、跨膜區(qū)、二級結(jié)構(gòu)和高級結(jié)構(gòu).本研究分析了NCBI數(shù)據(jù)庫中的糠椴Rubisco基因序列,該序列共有5個開放閱讀框,其中最長的開放閱讀框為1 455 bp;翻譯產(chǎn)生的Rubisco位于葉綠體中,為親水蛋白,共有12個蛋白結(jié)合區(qū),不含跨膜區(qū),由484個氨基酸組成,其中α螺旋、β折疊和無規(guī)則卷曲的比例分別為34.92%、11.36%和53.72%.上述結(jié)果為研究糠椴Rubisco基因的功能和表達機制提供了依據(jù),為下一步克隆糠椴Rubisco基因、增加Rubisco基因表達量、提高Rubisco利用效率和活力,進而促進糠椴的光合作用奠定了基礎.