付 春,甘東平,楊瑤君
[竹類病蟲防控與資源開發(fā)四川省重點實驗室(樂山師范學院),四川 樂山 614000]
長足大竹象,屬鞘翅目(Coleoptera)象蟲科(Curculionidea)彎頸象屬(Cyrtotrachelus),主要分布于我國的西南地區(qū)、沿海地區(qū)廣東和上海、等地以及東南亞越南、泰國等國家[1-2]。該蟲完全變態(tài),需要經歷成蟲、卵、幼蟲和蛹四個階段[3]。成蟲是靠取食竹筍補充營養(yǎng),該蟲的卵產在筍殼下,幼蟲孵化后再鉆食竹筍并咬破竹筍后在土里化蛹并以成蟲越冬,而由卵發(fā)育成五齡幼蟲大約只需15 d,且長足大竹象為寡食性昆蟲,主要取食叢生幼嫩的竹筍尖部[4-5]。長足大竹象的隱蔽性很強且是當前竹林的主要害蟲之一,在2003年國家林業(yè)局將該蟲列為我國林業(yè)主要有害生物之一[6]。
超長鏈脂肪酸延長酶(Elongation of very long chain fatty acids protein)在植物中,名為FAE[7],在昆蟲及真菌酵母中,名為ELO[8],而在魚類以及哺乳動物中,名為ELOVL[9],是脂肪酸延伸反應第一步的限速性縮合酶[8]。超長鏈脂肪酸(VLCFA)合成時碳鏈的縮合延長過程是類似于β-氧化逆反應的循環(huán)過程,以脂酰CoA(fatty acyl-CoA)作為起始點,通過縮合、加氫、脫水、再加氫四個步驟循環(huán)完成碳鏈的延伸,其中脂肪酸碳鏈的延伸主要發(fā)生在線粒體,內質網、過氧化物酶體中[10]。其中的縮合反應是由ELO 催化,丙二酸單酰CoA 提供2 個碳原子,使脂肪酸碳鏈延長,而活性位點與賴氨酸殘基之間的距離決定ELO 脂肪酸的長度[11]。由此可見ELO 對脂肪酸代謝調控以及脂類的生物合成起著至關重要的作用。昆蟲領域研究中,Chertemps 等首次報道了昆蟲的ELO基因并命名為elo68α 和一種在雌果蠅中特異性表達的ELO,命名為eloF[12]。對ELO研究主要集中在黑腹果蠅,其中主要包括在ELO對形成受精卵過程中生殖能力的影響[13]、對表皮功能的影響[14]、對運動功能影響,降低其生存力[15]、對絳色細胞的影響[16],以及在信息素合成中影響合成酯類、烴類和醇類化合物等信息素。研究發(fā)現ELO對意大利蜂(Apis mellifera)中表皮轉錄功能也有影響[17]。Juárez 研究了德國小蠊(Blatella germanica)表皮中ELO的功能[18]。在黃粉蟲中也略有報道,其中主要集中在ELO可以干擾黃粉蟲幼蟲的基因,影響黃粉蟲的成長從而導致黃粉蟲死亡率的增加[19]。
目前對于長足大竹象的研究主要集中在消化系統(tǒng)、呼吸系統(tǒng)、生殖系統(tǒng)、形態(tài)結構、生活習性、以及防治方法等方面[20-24]。而對于長足大竹象遺傳學方面的研究還相對較少,主要為汪振宇等研究的染色體核型分析[25]。尚且沒有關于長足大竹象全基因組的研究報道,而解密基因組里的遺傳信息是研究長足大竹象的分子進化、生理結構的基礎。本研究以長足大竹象超長鏈脂肪酸延長酶全基因組為材料,采用生物信息學方法,研究長足大竹象全基因組中的CbuELO 蛋白的理化性質、亞細胞定位情況、跨膜域結構、蛋白親水性疏水性、磷酸化位點情況、蛋白二級結構、蛋白三級結構、保守結構以及染色體定位。同時構建系統(tǒng)發(fā)育樹分析基因間的同源性以及種族間親緣關系。為深入分析長足大竹象的生物學功能提供可靠的數據支持和理論依據。
長足大竹象基因組序列、其所有蛋白質序列文件和注釋文件均來自于本科研團隊完成的全基因組測序數據[26]。同時在InsectBase2.0 數據庫(http://v2.insect-genome.com/)通過查找下載所有鞘翅目昆蟲的ELO 蛋白序列用于構建長足大竹象與其他鞘翅目昆蟲的ELO基因家族的系統(tǒng)發(fā)育樹(表1)。
表1 用于本研究的鞘翅目昆蟲物種名稱
1.2.1 長足大竹象ELO基因家族鑒定、染色體定位預測及基因結構的分析
利用ELO基因家族的Pfam 模型對長足大竹象全基因組的編碼蛋白質序列PfamSearch 檢索其基因組中所有ELO基因家族的蛋白編碼序列,然后結合SMART 工具對經pfam 鑒定的所有蛋白成員序列檢索保守結構域,剔除不存在ELO保守結構域的序列后即為ELO基因家族的所有蛋白質序列。從長足大竹象的gff 信息中獲得ELO基因所在染色體和基因起始位置,然后利用MapChart 軟件對CbuELO基因家族進行染色體定位分析。利用在線網站Gene Structure Display Server2.0(http://gsds.gao-lab.org)分析基因結構中外顯子與內含子的情況。
1.2.2 CbuELO 蛋白理化性質的分析與亞細胞定位
利用EXPASY-ProtParam tool(https://web.expasy.org/protparam/)預測CbuELO蛋白理化性[27]??梢苑治龀龅鞍椎姆肿恿看笮?、氨基酸數目、不穩(wěn)定指數、脂肪族氨基酸指數、等電點、總平均親水性以及正負帶電荷殘基總數。利用CELL:Subcellular(http://cello.life.nctu.edu.tw/)進行亞細胞定位[28]。
1.2.3 CbuELO 蛋白的跨膜域分析、親疏水分析以及蛋白氨基酸序列的磷酸化位點預測
利用TMHMM-2.0-Services(https://services.healthtech.dtu.dk/service.)進行蛋白的跨膜域分析,利用EXPASY-Proscale(https://web.expasy.org/protscale/)進行蛋白親疏水分析[29]。用NetPhos-3.1-Services(https://services.healthtech.dtu.dk/service.)預測磷酸化位點,輸入的是蛋白質序列fasta格式,默認參數[30]。
1.2.4 CbuELO 蛋白的二級結構、三級結構以及保守結構的分析
利用SOPMA Secondary Structure Prediction(https://npsa-prabi.ibcp.fr/) 預測蛋白質的二級結 構,利 用SWISS-MODEL(https://swissmodel.expasy.org/interactive)預測蛋白質的三級結構,利用MEME-Submission Form(https://meme-suite.org/)分析蛋白的保守結構,初始基序數目設置為10,輸入的蛋白質序列是fasta 格式[31]。
1.2.5 CbuELO 構建系統(tǒng)發(fā)育樹
為了了解長足大竹象ELO基因與其他物種的ELO基因的進化關系,利用在線網站InsectBase 中下載與長足大竹象同科、同目的物種的ELO基因的蛋白序列,并通過MEGA11 軟件構建進化樹,其蛋白序列為fasta 格式,采用鄰接法(Neighbor-Joining),采用bootstrap 方法進行重復檢驗,bootstrap 次數設置為1000。采用最大似然法(MaxmummLikelihood,ML)構建多個物種的ELO 蛋白序列的系統(tǒng)發(fā)育樹[32]。
通過對長足大竹象ELO基因的鑒定,已知長足大竹象ELO基因共有15 個,按照基因順序,分別命名為CbuELO01-CbuELO15(表2)。利用MapChart 軟件對CbuELO基因家族進行染色體定位分析可知,CbuELO的基因分別位于0、5、8、9 號染色體上,其中0 號染色體占比最多,共有11 個CbuELO基因,其基因分別為CbuELO01-CbuELO11。而基因CbuELO12-15分別位于5 號、8 號、9 號染色體上(圖1)。
圖1 長足大竹象ELO 基因家族染色體定位圖
表2 長足大竹象CbuELO 家族基因的基本信息
續(xù)表2
利用在線網站Gene Structure Display Server2.0分析CbuELO基因結構可知,每個CbuELO基因的序列長度與編碼長度之間不是完全相同的,15 個CbuELO基因的序列長度的在1958~31756 bp 之間,而編碼長度則在863~29913 bp 之間。由圖2 可知CbuELO家族蛋白成員都含有外顯子(CDS);除了CbuELO12沒有內含子(Intron)外,其余家族成員都有內含子;除了CbuELO04沒有非編碼區(qū)(UTR)外,其余家族成員都有非編碼區(qū)。每個家族成員含有外顯子的數量為1~10 個,內含子的數量為0~9 個,非編碼區(qū)為0~2 個。其中成員CbuELO14含有最多的外顯子和內含子,分別為10、9 個。
圖2 長足大竹象ELO 家族基因結構圖
基于長足大竹象ELO的氨基酸序列,利用EXPASY-ProtParam tool 對蛋白質的理化性質(分子量、等電點、不穩(wěn)定性等)進行分析。結果表明CbuELO 蛋白家族的氨基酸數目在219~368 之間,其中所含氨基酸數目最多的是CbuELO03 蛋白,為368。所含氨基酸最少的是CbuELO02 蛋白,為219,而整個CbuELO 家族里的蛋白平均氨基酸含量為285.4。CbuELO 蛋白家族的分子量在25.99~43.33kDa 之間。其中分子量最大的是CbuELO03,為43.33 kDa。分子量最小的是CbuELO,為25.99kDa。而整個CbuELO 蛋白家族的平均分子量為33.67 kDa。CbuELO 蛋白家族的理論等電點在9.22~9.68 之間。由此可知,整個CbuELO 蛋白家族為堿性蛋白,此結果與黃粉蟲ELO 基因家族一致[11]?;诶碚摬环€(wěn)定指數大于40 的為不穩(wěn)定性蛋白,小于四十的為穩(wěn)定性蛋白。由此可得,不穩(wěn)定性蛋白的有6個分別為CbuELO03、CbuELO04、CbuELO06、CbuELO07、CbuELO10、CbuELO12。其余的皆為穩(wěn)定性蛋白,總體上穩(wěn)定性蛋白數量大于不穩(wěn)定性蛋白。脂肪族氨基酸指數總體含量范圍在72.28~120.22 之間,說明CbuELO 蛋白家族之間熱穩(wěn)定性差異較大。從總平均親水性上分析,負值代表親水性,正值代表疏水性,絕對值代表其親疏水性大小。除了CbuELO03 蛋白為親水性蛋白外,其余蛋白皆為疏水性蛋白,整體CbuELO蛋白家族親水性平均系數為0.433,說明其為疏水性蛋白。從帶正負電荷數分析,整體CbuELO蛋白家族帶正電荷殘基總數(Arg+Lys)要遠大于帶負電荷殘基總數(Asp+Glu),說明CbuELO 蛋白家族整體是帶正電荷。利用CELL:Subcellular進行亞細胞定位分析,結果表明CbuELO 蛋白家族全定位在細胞膜上,說明CbuELO 蛋白家族在 細胞膜上發(fā)揮著生物學作用(表3)。
表3 長足大竹象CbuELO 蛋白的理化性質
利用TMHMM-2.0-Services進行CbuELO蛋白家族的跨膜域分析,結果表明蛋白家族中的每個成員都有數量不一的跨膜結構,其中蛋白CbuELO01、CbuELO003、CbuELO05~CbuELO008、CbuELO15都含有最多的跨膜結構,7 個(表4、圖3)。因此可以推斷CbuELO 蛋白家族為跨膜蛋白。
圖3 長足大竹象CbuELO 蛋白的跨膜域分析
表4 長足大竹象CbuELO 蛋白的跨膜域分析
利用EXPASY-Proscale 進行CbuELO 蛋白家族親疏水分析,結果表該蛋白家族最大疏水性的數值范圍在2.311~3.378 之間,成員CbuELO05有最大數值3.378。而最大親水范圍在-3.344~-2.067 之間,成員CbuELO01 有最小數值-3.344(表5)。由分值絕對值代表親疏水性大小可知疏水性氨基酸殘基數量遠大于親水性氨基酸殘基(圖4),可知,ELO 蛋白為疏水性蛋白,因此可以推斷出為不溶性蛋白。
圖4 長足大竹象ELO 疏水性分析結果
表5 長足大竹象CbuELO 蛋白的親水性/疏水性分析
用NetPhos-3.1-Services 預測磷酸化作用位點,結果表明CbuELO 蛋白家族具有多個不同的磷酸化位點,總體上該蛋白家族共有247個絲氨酸可磷酸化位點、125 個蘇氨酸可磷酸化位點、102 個酪氨酸可磷酸化位點。其中成員CbuELO03 蛋白含有最多的磷酸化位點,為51 個,而成員CbuELO10 含有最少的磷酸化位點,為15 個。含絲氨酸磷酸化位點最多的是成員CbuELO12,有29 個,而含量最少的是成員CbuELO13,有9 個,其中極有可能的磷酸化位點位于27、276 上,其數值為0.996(遠大于閾值0.500);含蘇氨酸磷酸化位點最多的是成員CbuELO13、14,有13 個,含量最少的是成員CbuELO10,僅有1 個,其中極有可能的磷酸化位點位于85 上,其數值為0.964;含酪氨酸磷酸化位點最多的是成員CbuELO03,有16 個,而含量最少的是成員CbuELO10,僅有1 個,其中極有可能的磷酸化位點位于147 上,其數值為0.973(表6)。
表6 長足大竹象CbuELO 蛋白氨基酸序列的磷酸化位點預測
利用SOPMA Secondary Structure Prediction 預測蛋白質的二級結構,結果表明,CbuELO 家族整體上的二級結構以α-螺旋為主,由2064 個氨基酸殘基組成,占整體的48.51%;擴展鏈結構由802 個氨基酸殘基組成,占整體的18.72%;β-轉角由126 個氨基酸殘基組成,占整體的2.98%;而無規(guī)則卷曲由1289 個氨基酸組成,占整體的29.79%。其中α-螺旋中,CbuELO10 蛋白占比最高,有55.84%是α-螺旋,由129 個氨基酸殘基組成,而最少的是CbuELO14 蛋白有42.39%是α-螺旋,由156 個氨基酸殘基組成;在擴展鏈結構中,CbuELO04 蛋白占比最高,有24.64%是擴展鏈結構,由65 個氨基酸殘基組成,而占比最少的是CbuELO13 僅有15.13%是擴展鏈結構,由46 個氨基酸殘基組成;在β-轉角中,CbuELO12占比最高,有4.53%是β-轉角,由13 個氨基酸殘基組成;而占比最少的是CbuELO01,僅有1.67%是β-轉角,由5 個氨基酸殘基組成;在無規(guī)則卷曲中,占比最高的是CbuELO05,所含量35.92%,由111 個氨基酸殘基組成,而占比最少的是CbuELO10,所含量有22.08%,由51 個氨基酸殘基組成(表7、圖5)。
表7 CbuELO 蛋白的二級結構分析
圖5 大竹象CbuELO 蛋白的二級結構
利用SWISS-MODEL 預測蛋白質的三級結構,根據結構的相似程度共分為四類,為了方便觀察每張圖按順序用A、B、C、D、E、F、G、H、I、G、K、L、M、N、O 表示。首先第一類是I、J、K、L、M、N、O,數目最多,有7個,分別對應蛋白CbuELO04、CbuELO06~08、CbuELO10、CbuELO13、CbuELO15;第二類是E、F、G、H,分別對應蛋白CbuELO09、CbuELO11、CbuELO12、CbuELO14;第三類是B、C、D,分別對應蛋白CbuELO01、CbuELO03、CbuELO05;第四類僅有1個A所對應蛋白為CbuELO02。從三級結構圖中可以看出,CbuELO蛋白家族中α-螺旋與無規(guī)則卷曲為主要結構元件,而無β-轉角則零星散落,這一點結構預測與二級結構分析一致(圖6)。
圖6 長足大足象ELO 蛋白的三級結構圖
利用MEME-Submission Form分析蛋白的保守結構,結果表明,CbuELO 蛋白家族共鑒定出10 個保守基序,其基序長度在10~50aa之間。在CbuELO 蛋白家族中有最重要的4個保守基序,分別為motif1、motif2、motif3、motif4,其中motif4 在每個成員中都存在。蛋白CbuELO06~09 含有最多的保守基序,都有9 個,而含有最少的保守基序是蛋白CbuELO12,僅有1 個保守基序(表8、圖7)。
表8 保守基序序列l(wèi)ogo
續(xù)表8
圖7 保守基序序列
通過MEGA11 軟件構建CbuELO 蛋白家族進化樹,校驗參數Bootstrap 重復1000 次。結果表明,15 個家族成員根據其在進化樹中的聚集程度分成了3 個亞家族(依此標記為Group1、Group2、Group3)。其中Group1 家族成員最多,有6 個家族成員,占整體的40%;而Group2 家族成員最少,有四個家族成員,占整體的26%。根據進化樹的自展值可以得到基因的同源性,可以看出,蛋 白CbuELO02 與CbuELO10,CbuELO06與CbuELO07、CbuELO11、CbuELO15 這些基因的自展值均為100%。在整個家族中Group2 是最原始的,而Group3 則是進化最快的(圖8)。
圖8 長足大竹象ELO 基因系統(tǒng)進化樹
長足大竹象與中歐山松大小蠹的ELO 蛋白序列構建系統(tǒng)進化樹。把兩者之間的進化關系分為了四組(標記為Group1、Group2、Group3、Group4)。在1組里面有4個CbuELO成員分別為CbuELO01、CbuELO08、CbuELO09、CbuELO14;2組里面也有4個CbuELO成員分別為CbuELO03、CbuELO06、CbuELO07、CbuELO10;3組有3個,分別為CbuELO05、CbuELO12、CbuELO13;4組里面有4個,分別為CbuELO02、CbuELO04、CbuELO11、CbuELO15。而中歐山松大小蠹的ELO蛋白在Group1~4的數量分別為3、1、4、1。根據進化樹自展值得到了長足大竹象與中歐山松大小蠹的直系同源基因對,如CbuELO08與DpoELO07,CbuELO05 與DpoELO05、DpoELO06,CbuELO12與DpoELO04,這些基因對的自展值均大于95%(圖9)。
圖9 長足大竹象和中歐山松大小蠹的ELO 基因家族系統(tǒng)發(fā)育進化樹
長足大竹象與紅棕象甲的ELO 蛋白序列構建系統(tǒng)進化樹。根據進化分析,把兩者之間的進化關系分為了四組(標記為Group1、Group2、Group3、Group4)。在1 組里面有5 個CbuELO成員分別為CbuELO01、CbuELO08、CbuELO09、CbuELO12、CbuELO13;2 組里面也有2 個CbuELO成員分別為CbuELO02、CbuELO05;3組有3個,分別為CbuELO03、CbuELO10、CbuELO14;4組里面有5個,分別為CbuELO04、CbuELO06、CbuELO07、CbuELO11、CbuELO15。而紅棕象甲的ELO 蛋白在Group1~4的數量分別為5、3、1、4。根據進化樹自展值得到了長足大竹象與紅棕象甲的直系同源基因對,如CbuELO12 與RfeELO03,CbuELO13 與RfeELO04,CbuELO09與 RfeELO10、RfeELO12,CbuELO05 與RfeELO01、RfeELO07、RfeELO08 這些基因對的自展值均大于99%(圖10)。
圖10 長足大竹象和紅棕象甲的ELO 基因家族系統(tǒng)發(fā)育進化樹
長足大竹象與赤擬谷盜的ELO蛋白序列構建系統(tǒng)進化樹,研究其進化關系。根據進化分析,把兩者之間的進化關系分為了5組(標記為Group1、Group2、Group3、Group4、Group5)。在1組里面有1個CbuELO成員為CbuELO05;2組里面也有3個CbuELO成員分別為CbuELO08、CbuELO12、CbuELO13;3組有5個,分別為CbuELO04、CbuELO06、CbuELO07、CbuELO011、CbuELO15;4組里面有1個,為CbuELO02;5組有5個,分別為CbuELO01、CbuELO03、CbuELO09、CbuELO10、CbuELO12。而赤擬谷盜的ELO蛋白在Group1~5的數量分別為8、1、4、1、4。其中Group2 最原始,而Group1 進化最快。根據進化樹自展值得到了長足大竹象與赤擬谷盜的直系同源基因對,如CbuELO05 與TcaELO14,CbuELO12 與TcaELO02,CbuELO09 與TcaELO01這些基因對的自展值均100(圖11)。
圖11 長足大竹象和赤擬谷盜的ELO 基因家族系統(tǒng)發(fā)育進化樹
長足大竹象ELO 家族蛋白與中歐山松大小蠹、紅棕象甲、咖啡果小蠹、象鼻蟲、光臀八齒小蠹、云杉八齒小蠹、米象的ELO 序列構建系統(tǒng)進化樹。根據進化分析,把兩者之間的進化關系分為了5 組標記為(Group1、Group2、Group3、Group4、Group5)。在1 組里面有2 個CbuELO成員為CbuELO05、CbuELO12;2組也有5個,分別為CbuELO06、CbuELO07、CbuELO11、CbuELO13、CbuELO15;4組里面有5個,為CbuELO01~4、CbuELO09;5 組有3 個,分別為CbuELO10、CbuELO08、CbuELO14。從整個發(fā)育樹來看長足大竹象ELO 家族蛋白與赤擬谷盜的親緣關系最近,除此之外中歐山松大小蠹和象鼻蟲也近(圖12)。
圖12 長足大竹象和所有象蟲科昆蟲的ELO 基因家族系統(tǒng)發(fā)育進化樹
長足大竹象ELO 家族蛋白與所有鞘翅目的ELO 序列構建系統(tǒng)進化樹,根據CbuELO 與所有鞘翅目的ELO 家族蛋白的進化關系,共分為了8 個亞家族(分別用Group1、Group2、Group3、Group4、Group5、Group6、Group7 和Group8 標記。其中CbuELO 家族蛋白在Group1 中有3 個成員;在Group3 中有1 個成員;在Group5 中有2 個成員,在Group7 中有3 個成員;Group8 含有最多成員,有6 個。由圖13 可以看出,Group1 進化最快,而Group8 則最為原始(圖13)。
圖13 長足大竹象和所有鞘翅目的ELO 基因家族系統(tǒng)發(fā)育進化樹
長足大竹象在四川1年發(fā)生1代,以成蟲在土中蛹室內越冬[33]。成蟲在清晨活動性較弱但隨著溫度的升高,活動性會增強且飛行能力較強[34]。幼蟲、成蟲均會食竹筍,導致有大量斷頭竹和畸形竹的出現,且成蟲有假死性,壽命一般在50~70 d,竹林中成蟲于10 月上旬絕跡[35]。長足大竹象是主要的林業(yè)害蟲,危害率可達50%~80%,嚴重的達100%[36]。主要危害青皮竹(Bambusa textilis)、慈竹(Neosino Calamusaffinis)等叢生竹竹筍[36]。
超長鏈脂肪酸延伸酶(ELO)參與長鏈脂肪酸(C16、C18 和C20)的生成[37],在ELO 的作用下形成超長鏈脂肪酸,此反應需要NADPH 提供能量[38]。近年,ELO 在脂肪酸的具體作用得到廣泛的關注。在哺乳動物中,ELOVL 家族蛋白不僅可以控制脂肪酸碳鏈的長度外,其中ELOVL2 對雄性鼠的精子成熟有影響[39]。除此之外研究發(fā)現ELOVL 家族蛋白與糖尿病[40]、肥胖癥[41]、癌癥[42]等疾病都有所關聯。在釀酒酵母(Saccharomyces cerevisiae)中,發(fā)現了三條編碼脂肪酸延伸酶基因,對其功能進行研究發(fā)現它們可以將C14 催化生成不同長度的長鏈脂肪酸[43]。在昆蟲中,ELO參與交配、繁殖、信息素生物合成以及表皮形成等生命活動過程[44]。同一種昆蟲中,不同的ELO具有不同的底物偏好性和組織特異性表達。如今,對于ELO 在昆蟲這方面的研究主要集中在果蠅上,共發(fā)現了20 條ELO 家族蛋白并研究出ELO是果蠅發(fā)育過程中的關鍵基因[45]。研究白紋伊蚊(Aedes albopictus)ELO 發(fā)現,ELO 家族蛋白對于其滯育卵和抵抗干燥具有重要作用[46]。在褐飛虱中,共鑒定出20 條ELO 家族蛋白,它們具有不同的表達部位和表達圖譜,從而行使不同的生物學功能[44]。盡管ELO 基因在一些昆蟲中有了深入的研究,但在長足大竹象中ELO 基因的研究還是一個空白。
本研究利用生物信息學手段對長足大足象ELO 全基因家族進行了全面分析。對其基因家族鑒定發(fā)現,CbuELO 蛋白家族共有15 個成員,15個成員位于4 條染色體上。通過Gene Structure Display Server2.0 分析基因結構發(fā)現,CbuELO 家族蛋白成員都含有外顯子(CDS);除了CbuELO12沒有內含子(Intron)外,其余家族成員都有內含子;除了CbuELO04沒有非編碼區(qū)(UTR)外,其余家族成員都有非編碼區(qū)。通過EXPASY-ProtParam預測蛋白理化性質發(fā)現CbuELO 蛋白家族的理論等電點在9.22~9.68 之間,總體穩(wěn)定性蛋白數量大于不穩(wěn)定性蛋白,脂肪系數在72.28~120.22 之間。整體CbuELO 蛋白家族親水性平均系數為0.433,說明其為疏水性蛋白,這與苗璐等研究預測一致[46]。整體CbuELO 蛋白家族Arg+Lys 總數要遠大于Asp+Glu,說明CbuELO 蛋白家族整體是帶正電荷。利用CELL:Subcellular 進行亞細胞定位分析,CbuELO 蛋白家族全定位在細胞膜上。利用TMHMM-2.0-Services 進行CbuELO 蛋白家族的跨膜域分析,結果表明蛋白家族中的每個成員均有跨膜結構,因此可以推斷CbuELO 蛋白家族為跨膜蛋白,這與雷娜娜研究預測一致[47]。用在線軟件NetPhos 預測磷酸化位點發(fā)現該蛋白家族有多個磷酸化位點。用SWISS-MODEL 預測蛋白質的三級結構,發(fā)現CbuELO 蛋白家族中α-螺旋與無規(guī)則卷曲為主要結構元件。利用MEME分析蛋白的保守結構,結果表明,CbuELO 蛋白家族共鑒定出10 個保守基序,其中motif4 在每個成員中都存在,這與郭兵研究預測一致[48]。通過MEGA11 軟件構建CbuELO 蛋白家族進化樹分析,長足大竹象ELO 家族蛋白與赤擬谷盜多個基因序列同源性達到100%,說明長足大竹象與赤擬谷盜的ELO 蛋白家族親緣關系最近,除此之外與中歐山松大小蠹和象鼻蟲最近。
綜上所述,本文對長足大竹象ELO基因家族進行了詳細的生物信息學研究,研究結果為揭示長足大竹象分子機制奠定了基礎,同時也為害蟲綠色防治提供了新的靶標[49]。