柳 偉,安佳琪,高 熹 ,楊 璞,3
(1.中國(guó)林業(yè)科學(xué)研究院 高原林業(yè)研究所,云南 昆明 650224;2.云南農(nóng)業(yè)大學(xué) 植物保護(hù)學(xué)院,云南 昆明 650201;3.國(guó)家林業(yè)和草原局,資源昆蟲培育與利用重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650224)
蠟酯在動(dòng)物、植物和微生物中廣泛存在,具有多種重要的生物學(xué)功能,其功能多與生存環(huán)境相適應(yīng)[1]。蠟酯在植物中主要形成表皮蠟,可防止病菌和紫外線的侵害,還可以保護(hù)水分,或以高濃度的形式積累在一些種子油中[2]。動(dòng)物蠟酯具有保護(hù)作用,如工蜂用分泌的蜂蠟筑巢,為自己提供庇護(hù)場(chǎng)所;還具有防水作用,如水禽用喙將尾脂腺分泌的蠟酯涂抹在羽毛上,使羽毛光潤(rùn)防水。蠟酯也是微生物中重要的儲(chǔ)存脂類,各種細(xì)菌通過(guò)積累蠟酯將其作為主要的碳源和能量?jī)?chǔ)存物質(zhì)。蠟酯具有多種功能和性質(zhì),可作為人類生活中重要的經(jīng)濟(jì)油脂,廣泛應(yīng)用于醫(yī)藥、化妝品和食品工業(yè),尤其是能源和化工等領(lǐng)域。
蠟酯由長(zhǎng)鏈脂肪酸與長(zhǎng)鏈醇通過(guò)酯化反應(yīng)結(jié)合形成,其合成過(guò)程較為保守[1]。脂酰輔酶A 還原酶 (fatty acyl-CoA reductase,F(xiàn)AR) 將脂酰輔酶A 還原成相應(yīng)的脂肪醇,然后與脂酰輔酶A 在蠟酯合成酶催化下形成蠟酯[3-5]。脂酰輔酶A 還原酶所催化的還原反應(yīng)依賴NADPH。序列分析表明:動(dòng)物和植物的FAR 較為保守,在N 端氨基酸有1 個(gè)長(zhǎng)度約為300 aa 的NADPH 結(jié)合結(jié)構(gòu)域,在C 端含有1 個(gè)Sterile 蛋白結(jié)構(gòu)域[6-7]。
已有研究表明:FAR 催化生成的脂肪醇主要參與蠟酯、甘油三酯和信息素的合成[1]。同一生物體中有多個(gè)far基因,在不同組織的表達(dá)有不同的生理功能。擬南芥far3基因在葉、莖、花和根中均有表達(dá),參與角質(zhì)層蠟的合成[8-9];擬南芥中far1、far4和far5在根的內(nèi)皮細(xì)胞中表達(dá),主要參與軟木脂的形成;意蜂far1基因主要在蜜蜂頭部表達(dá),參與信息素或醚酯的合成[10]。
白蠟蟲 (Ericerus pela) 是一種有巨大經(jīng)濟(jì)價(jià)值的資源昆蟲,在雄蟲二齡時(shí)期分泌大量白蠟。白蠟的主要成分是蠟單酯,占白蠟總量的93%~95%。在機(jī)械、化工、食品、農(nóng)林和信息技術(shù)等領(lǐng)域應(yīng)用廣泛[11-12],以白蠟為原料生產(chǎn)的高級(jí)烷醇也具有極大的藥用價(jià)值[13]。FAR 在白蠟合成中起關(guān)鍵作用,但白蠟蟲far基因家族缺少系統(tǒng)的進(jìn)化分析研究。本研究對(duì)白蠟蟲far家族基因進(jìn)行鑒定,并進(jìn)行序列特征分析,同時(shí)與其他物種中參與蠟酯合成的FAR 進(jìn)行系統(tǒng)進(jìn)化分析,以期為進(jìn)一步探究白蠟蟲蠟酯合成基因的特點(diǎn)與進(jìn)化奠定分子基礎(chǔ)。
FAR 的結(jié)構(gòu)域信息下載自Pfam 數(shù)據(jù)庫(kù)(http://pfam.xfam.org/),再利用HMMER 3.0 在白蠟蟲蛋白庫(kù)搜索含有far基因結(jié)構(gòu)域的序列。為避免基因組注釋有遺漏的far基因,從Uniport 數(shù)據(jù)庫(kù)(https://www.uniprot.org/)下載FAR 蛋白序列,在白蠟蟲轉(zhuǎn)錄組蛋白庫(kù)中進(jìn)行本地BLAST 搜索,由此獲得白蠟蟲轉(zhuǎn)錄組預(yù)測(cè)的FAR。結(jié)合白蠟蟲轉(zhuǎn)錄組注釋信息,將這些FAR 對(duì)應(yīng)的轉(zhuǎn)錄本在白蠟蟲基因組序列上進(jìn)行本地BLAST 搜索,獲得的序列作為far候選基因。此外,在Nr (nonredundant protein sequence)、Nt (nucleotide sequence)和Swissport 數(shù)據(jù)庫(kù)中注釋為FAR 的基因組預(yù)測(cè)基因同樣作為far候選基因。將以上far候選基因上傳到CDD (https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)進(jìn)行結(jié)構(gòu)域分析,得到2 種序列,一種包含2 個(gè)完整的FAR 結(jié)構(gòu)域(即NADB Rossmann 結(jié)構(gòu)域和FAR C 結(jié)構(gòu)域),另一種僅含有1 個(gè)FAR 結(jié)構(gòu)域,對(duì)這些序列進(jìn)行在線BLAST 分析,2 種方法都注釋為FAR 的基因保留作為最終的候選far家族基因。
利用在線網(wǎng)站MEME (http://meme-suite.org/tools/meme)[14]對(duì)白蠟蟲FAR 蛋白保守基序進(jìn)行分析,基序的最大數(shù)值設(shè)為15,基序的長(zhǎng)度設(shè)置介于6~200 之間,其他參數(shù)使用默認(rèn)參數(shù)。對(duì)得到的保守基序使用CDD 進(jìn)行功能注釋;使用在線網(wǎng)站GSDS 2.0 (http://gsds.gao-lab.org/)[15]分析內(nèi)含子和外顯子;使用ExPASy (https://web.expasy.org/protparam/)在線工具[16]對(duì)篩選的白蠟蟲FAR 蛋白序列進(jìn)行等電點(diǎn)和蛋白分子量等屬性分析。
將far基因在scaffold 上進(jìn)行定位,得到起始位置信息,使用在線網(wǎng)站MapGene2Chrom web v2 (http://mg2c.iask.in/mg2c v2.0/)[17]將所有白蠟蟲far基因在染色體上的物理位置繪制成圖。單個(gè)染色體寬度設(shè)置為100 px,染色體邊界寬度為2 px,其他參數(shù)設(shè)置保持默認(rèn)值。
使用Mauve 2.3.0 軟件對(duì)白蠟蟲far基因進(jìn)行共線性分析,參數(shù)和視圖使用默認(rèn)值。得到far基因的共線性區(qū)域,連接共線性較好的far基因;利用Circos 對(duì)共線性結(jié)果進(jìn)行可視化。
利用ClustalX 軟件對(duì)白蠟蟲far基因氨基酸序列進(jìn)行多序列比對(duì),然后將得到的結(jié)果導(dǎo)入MEGA 6.0 軟件,使用鄰接法(Bootstrap=1 000)構(gòu)建系統(tǒng)進(jìn)化樹[18];使用ClustalX 軟件對(duì)不同物種的FAR (表1)進(jìn)行多序列比對(duì),在MEGA 6.0 中采用最大似然法(Bootstrap=500)繪制不同物種FAR蛋白進(jìn)化樹[19-20]。其中,擬南芥、西德蒙木和小鼠的FAR 來(lái)自NCBI;意蜂、果蠅、豌豆蚜和扶桑綿粉蚧的昆蟲FAR 來(lái)自昆蟲基因組與轉(zhuǎn)錄組數(shù)據(jù)庫(kù)InsectBase (http://www.insect-genome.com/)。
表1 物種的FAR 信息Tab.1 FAR information for species
為了進(jìn)一步檢測(cè)白蠟蟲far基因與其他物種far基因[21-23]的共線關(guān)系,采用Mauve 2.3.0 軟件進(jìn)行共線性分析。參數(shù)設(shè)置和視圖樣式同1.4 節(jié)。
為了探討不同物種間FAR 序列的相似性,利用在線BLAST 計(jì)算每2 對(duì)FAR 序列之間的相似性,將統(tǒng)計(jì)結(jié)果導(dǎo)入在線網(wǎng)站Heatmapper (ht-tp://www.heatmapper.ca/expression/),氨基酸與高、中、低值的相似性以紅、白、綠三色表示,并根據(jù)統(tǒng)計(jì)結(jié)果進(jìn)行聚類分析。
根據(jù)轉(zhuǎn)錄組注釋信息,197 條序列注釋為far基因。利用197 個(gè)候選基因的轉(zhuǎn)錄本序列進(jìn)行基因分析。一些基因被發(fā)現(xiàn)是同一基因的不同轉(zhuǎn)錄本。根據(jù)轉(zhuǎn)錄本在scaffold 中的位置,共鑒定出17 個(gè)基因。
根據(jù)基因組預(yù)測(cè)基因的注釋信息,26 條序列注釋為far基因。與轉(zhuǎn)錄組得到的序列進(jìn)行比對(duì),在白蠟蟲far基因家族中有30 個(gè)far基因;其中有22 個(gè)具有2 個(gè)完整的結(jié)構(gòu)域和合適的序列長(zhǎng)度,可以進(jìn)行后續(xù)分析。
對(duì)15 個(gè)保守基序(圖1)進(jìn)行分析,MEME分析結(jié)果顯示:基序1~6、9、12 和14 屬于NADB Rossmann 結(jié)構(gòu)域,基序7、8、10 和13 屬于FAR C 結(jié)構(gòu)域。CDD 分析結(jié)果顯示:基序1~4、9 和14 屬于NADB Rossmann 結(jié)構(gòu)域,基序8 和13 屬于FAR C 結(jié)構(gòu)域。MEME 分析與CDD 分析結(jié)果基本一致。此外,基序11 和15 位于域間區(qū)域,所有FAR 都包含基序11 或15,但二者并不同時(shí)存在于1 個(gè)FAR 中。
圖1 白蠟蟲FAR 保守基序分析Fig.1 Conserved motif analysis of FAR in Ericerus pela
白蠟蟲far基因有6~11 個(gè)外顯子、5~10 個(gè)內(nèi)含子。外顯子平均長(zhǎng)度為145~225 bp,內(nèi)含子平均長(zhǎng)度為777~7 098 bp。Epfar-5包含10 個(gè)內(nèi)含子和11 個(gè)外顯子,數(shù)量最多(圖2)。在22 條白蠟蟲FAR 中,氨基酸序列長(zhǎng)度為467~587 aa,僅有FAR-19 的等電點(diǎn)小于7。
圖2 白蠟蟲far 基因結(jié)構(gòu)分析Fig.2 Gene structure analysis of the far genes in E.pela
圖3 顯示:22 個(gè)far基因分布在16 個(gè)重疊群(contig)上,contig113 的far基因最多(4 個(gè)),其次 是contig1166 (3 個(gè)),即contig113 和1 166 有far基因簇;contig683 有2 個(gè)far基因;其余13 個(gè)contig 上各有1 個(gè)far基因。
圖3 白蠟蟲far 基因在基因組上的分布Fig.3 Genomic distribution of the far genes of E.pela
由圖4 可知:22 個(gè)far基因共有11 個(gè)共線性模塊。其中,far6 號(hào)基因與其他far基因有最多的共線性模塊,與far5、9、13、18 號(hào)基因都有連線。far9 號(hào)有3 個(gè)連線。far2 號(hào)和27 號(hào)各有2 個(gè)連線。其余5 個(gè)基因只有1 個(gè)連線。
由圖5 可知:白蠟蟲的22 個(gè)far基因聚為2 類。第1 類有12 個(gè)far基因,聚為4 組;第2類有9 個(gè)far基因,聚為2 組。由圖6 可知:不同物種的FAR 大多按所屬物種的親緣關(guān)系聚為3 類。白蠟蟲的FAR 主要在第1 類,豌豆蚜(Acyrthosiphon pisum)和黑腹果蠅(Drosophila melanogaster)的FAR 主要在第2 類,扶桑綿粉蚧(Phenacoccus solenopsis)的FAR 在第1、2 類中都有分布,第1 類中的FAR 基本與白蠟蟲聚在一起。
圖5 白蠟蟲FAR 的系統(tǒng)發(fā)育樹Fig.5 Phylogenetic tree of FAR in E.pela
圖6 8 個(gè)物種的FAR 的系統(tǒng)發(fā)育樹Fig.6 Phylogenetic tree of FAR in eight species
由圖7 可知:白蠟蟲與扶桑綿粉蚧的共線性最好,二者之間的共線性連線最多,共線性模塊覆蓋率最高。白蠟蟲far基因與小鼠、意蜂、豌豆蚜和黑腹果蠅far基因的共線性較差,共線性連線較少,共線性模塊覆蓋率較低。白蠟蟲far基因與擬南芥和西德蒙木的far基因共線關(guān)系最差,幾乎沒(méi)有共線性連線。
圖7 白蠟蟲與擬南芥和扶桑綿粉蚧的far 基因共線性分析Fig.7 Synteny analysis of far genes among E.pela,Arabidopsis thaliana and Phenacoccus solenopsis
由圖8 可知:不同物種的FAR 的氨基酸相似性在25%~60%,高相似性 (50%~60%) 的FAR蛋白主要來(lái)自同一物種。擬南芥和西德蒙木的FAR 相似性約為50%;不同昆蟲體內(nèi)FAR 蛋白的相似性大多不高 (25%~40%);具有泌蠟功能的FAR 氨基酸與其他物種的FAR 相似性僅為25%~40%。
圖8 不同物種的FAR 相似性熱圖Fig.8 Heat maps of FAR similarity of different eight species
脂酰輔酶A 還原酶是生物體內(nèi)蠟質(zhì)合成的關(guān)鍵酶之一,在動(dòng)物、植物和微生物中廣泛存在。截至目前,蠟質(zhì)合成途徑以及關(guān)鍵酶的研究較少,僅有少部分植物(擬南芥和希蒙德木等)[24]、動(dòng)物(小鼠和鵝等)[25-26]和昆蟲(褐飛虱和巢蛾等)[27-29]開(kāi)展了FAR 的功能研究。隨著研究工作的深入展開(kāi),發(fā)現(xiàn)far基因在昆蟲基因組中一般以基因家族存在,如對(duì)褐飛虱far基因家族進(jìn)行了功能分析[30]。本研究基于白蠟蟲的全基因組數(shù)據(jù),結(jié)合生物信息學(xué)分析方法對(duì)其far基因家族進(jìn)行鑒定,獲得30 個(gè)far候選基因,多數(shù)含有NADB_Rossmann 結(jié)構(gòu)域和FAR C 結(jié)構(gòu)域;氨基酸普遍等電點(diǎn)大多在7 以上,說(shuō)明其可能多在弱堿性環(huán)境發(fā)揮作用。
基因家族成員可以緊密排列在一起,形成1 個(gè)基因簇(一般認(rèn)為200 kb 的核苷酸單位中含有3 個(gè)以上基因的基因群)[31],更多的家族基因分布在同一染色體的不同部位,或者分散于不同的染色體,具有各自不同的表達(dá)調(diào)控模式。對(duì)白蠟蟲far基因的染色體分布和基因重復(fù)進(jìn)行分析后發(fā)現(xiàn)2 個(gè)基因簇,其中的11 對(duì)基因有一定的共線性。白蠟蟲far基因家族僅有2 個(gè)基因簇,其他基因大多存在于不同contig 上。這些成簇排列的far基因可能由基因復(fù)制產(chǎn)生,具有共線性的far基因可能有相同的起源?;蛟诎紫炏xfar基因家族成員內(nèi)分布相似,在白蠟蟲FAR 的NJ 樹中,含有基序11 的聚為一小支,表明含有相同基序的FAR 序列或者功能可能更相似。
不同物種的FAR 氨基酸相似性分析表明:多數(shù)相似性高的FAR 都是同一物種或親緣關(guān)系近的物種。同屬泌蠟功能相關(guān)的FAR 在相同物種間相似性高,在不同物種間相似性低。不同物種的FAR 進(jìn)化分析表明:同物種的FAR 大多聚在一起,親緣關(guān)系近的聚為1 小支。系統(tǒng)進(jìn)化的分析結(jié)果與共線性分析的結(jié)果一致,從共線性分析來(lái)看,白蠟蟲與親緣關(guān)系最近的扶桑綿粉蚧的far基因有更多的共線性連線,而與擬南芥的far基因共線性連線非常少。
本研究獲得30 個(gè)白蠟蟲far基因候選基因,其中22 個(gè)具有完整的結(jié)構(gòu)域。序列分析和系統(tǒng)進(jìn)化分析表明:這些基因存在很多保守基序,基因之間共11 個(gè)共線性模塊,聚類為2 大支,不同物種之間的FAR 親緣關(guān)系較遠(yuǎn)。該研究為了解白蠟蟲far基因的功能分化提供了參考。
云南農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué))2022年5期