劉紫艷,鄭 誠(chéng),牛迎鳳,毛常麗,柳 覲
(云南省熱帶作物科學(xué)研究所,云南景洪 666100)
澳洲堅(jiān)果(Macadamia ternifoliaF.Muell)源自澳大利亞,因其商業(yè)化栽培始于美國(guó)夏威夷,故又稱夏威夷果。澳洲堅(jiān)果果仁香酥、滑嫩、可口,吃上去有一股獨(dú)特的奶油香味,因此備受消費(fèi)者青睞。而且,澳洲堅(jiān)果營(yíng)養(yǎng)豐富,富含脂肪酸,多種微量元素、維生素[1]及礦物質(zhì)(錳、鐵、鎂)等,與杏仁等其他可使用堅(jiān)果相比,澳洲堅(jiān)果含有大量的脂肪酸(約75%),尤其是不飽和脂肪酸占其總脂肪酸含量的59%,長(zhǎng)期食用對(duì)降低心腦血管疾病的發(fā)病率有顯著作用[2]。目前澳洲堅(jiān)果在云南省的種植面積超過(guò)26萬(wàn)hm2,占全國(guó)種植面積的90%以上,已成為云南重要的經(jīng)濟(jì)林[3]。
澳洲堅(jiān)果果仁中含15種脂肪酸成分,如豆蔻酸、棕櫚酸、棕櫚油酸、亞麻酸、亞油酸等,這些脂肪酸中含量較大的有油酸、亞油酸、棕櫚油酸等,都是不飽和脂肪酸[4],這些脂肪酸在澳洲堅(jiān)果果仁中通過(guò)脂肪酸生物合成途徑合成并積累。澳洲堅(jiān)果是云南重要的經(jīng)濟(jì)作物,過(guò)去的研究主要集中在栽培和育種,與澳洲堅(jiān)果果仁油脂合成相關(guān)的分子機(jī)制研究較少。因此,對(duì)參與澳洲堅(jiān)果脂肪酸生物合成途徑的基因調(diào)控機(jī)制研究有助于更好地闡述澳洲堅(jiān)果果仁中油脂合成的分子機(jī)制,從而為通過(guò)分子育種定向選擇富含優(yōu)質(zhì)油脂的澳洲堅(jiān)果以更適應(yīng)澳洲堅(jiān)果的市場(chǎng)需求奠定理論基礎(chǔ)。
在研究中發(fā)現(xiàn),盡管國(guó)外已經(jīng)有澳洲堅(jiān)果基因組數(shù)據(jù)發(fā)表,但是并未將數(shù)據(jù)完全釋放,為此,本研究采用RNA-seq這一可以進(jìn)行無(wú)參分析的方法對(duì)不同發(fā)育時(shí)期澳洲堅(jiān)果果仁進(jìn)行比較研究,用以揭示澳洲堅(jiān)果果仁的脂肪酸合成途徑及其基因的表達(dá)變化規(guī)律,以期為植物油脂合成機(jī)制研究的揭示提供理論參考,并能進(jìn)一步為澳洲堅(jiān)果遺傳育種提供改良的方向。
實(shí)驗(yàn)材料HAES246、HAES294、HAES816來(lái)自云南省熱帶作物科學(xué)研究所澳洲堅(jiān)果種質(zhì)圃。2020年5—9月,選擇花期一致的花序掛牌,于授粉后第62 d開始采樣,間隔15 d。每個(gè)種質(zhì)5棵樹,每次每棵樹隨機(jī)采2個(gè)掛牌的果做混樣,貯存于-80℃?zhèn)溆谩?/p>
將采摘的7個(gè)發(fā)育階段的澳洲堅(jiān)果果仁分別進(jìn)行標(biāo)記:授粉后第62 d標(biāo)記為Ⅰ期,授粉后第94 d標(biāo)記為Ⅱ期,授粉后第109 d標(biāo)記為Ⅲ期,授粉后第124 d標(biāo)記為Ⅳ期,授粉后第139 d標(biāo)記為Ⅴ期,授粉后第154 d標(biāo)記為Ⅵ期,授粉后第172 d標(biāo)記為Ⅶ期。
1.2.1 總RNA提取與測(cè)序文庫(kù)建立
提取7個(gè)不同發(fā)育階段的澳洲堅(jiān)果果仁的總RNA,用Aglient2100生物分析儀進(jìn)行檢測(cè),以保證RNA質(zhì)量。進(jìn)行文庫(kù)構(gòu)建,隨后用AMPure XP beads純化雙鏈cDNA。純化的雙鏈cDNA再進(jìn)行末端修復(fù)、加A尾并連接測(cè)序接頭,然后用AMPure XP beads進(jìn)行片段大小選擇,最后進(jìn)行PCR富集得到最終的cDNA文庫(kù)。對(duì)文庫(kù)進(jìn)行質(zhì)檢,檢測(cè)結(jié)果達(dá)到要求后,用Illumina HiSeq平臺(tái)進(jìn)行測(cè)序。
1.2.2 數(shù)據(jù)分析
原始測(cè)序數(shù)據(jù)經(jīng)過(guò)濾、測(cè)序錯(cuò)誤率檢查、GC含量分布檢查,獲得后續(xù)分析使用的clean reads。采用Trinity對(duì)cleanreads進(jìn)行拼接,經(jīng)過(guò)Trinity拼接得到的轉(zhuǎn)錄本序列作為后續(xù)分析的參考序列。以Corset層次聚類后得到最長(zhǎng)Cluster序列作為Unigene進(jìn)行后續(xù)的分析。使用BLAST軟件將Unigene序列與KEGG(Kyoto Encyclopedia of Genes and Genomes)、NR(NCBI non-redundant)、Swiss-Prot(Swiss-Protein)、GO(Gene Ontology)、KOG(euKaryotic Orthologous Groups)、Trembl數(shù)據(jù)庫(kù)比對(duì),預(yù)測(cè)完Unigene的氨基酸序列之后使用HMMER軟件與Pfam(Protein family)數(shù)據(jù)庫(kù)比對(duì),獲得Unigene的注釋信息。利用DESeq2進(jìn)行差異表達(dá)基因的分析,差異基因的篩選條件為∏log2Fold Change∏>=1,且FDR<0.05。進(jìn)一步對(duì)差異表達(dá)基因的通路進(jìn)行注釋分析,為進(jìn)一步解讀基因的功能打下基礎(chǔ)。
Ⅰ~Ⅶ期的澳洲堅(jiān)果果仁的RNA在RNA-seq中共拼接得到289 889條轉(zhuǎn)錄本,通過(guò)組裝得到218 976條Unigene序列,兩者長(zhǎng)度主要分布在200~3 000 nt,大于2 000 nt的轉(zhuǎn)錄本有29 237條,Unigene序列有2 936條,占總序列的10.09%。隨著序列長(zhǎng)度增加,Unigene的數(shù)量呈現(xiàn)逐級(jí)遞減的趨勢(shì),沒有明顯間斷,說(shuō)明RNA-Seq的質(zhì)量很好(圖1)。Unigene序列通過(guò)GO富集之后,分為三大類,即分子功能(molecular function)、細(xì)胞組分(cellular component)和生物過(guò)程(biological process),其中催化活動(dòng)(catalytic activity)、運(yùn)輸活動(dòng)(transporter activity)都表現(xiàn)出很高的富集,這說(shuō)明澳洲堅(jiān)果果仁在發(fā)育過(guò)程中有多種酶參與活動(dòng),且發(fā)生多個(gè)跨膜運(yùn)動(dòng)(圖2),推測(cè)是果仁中的油脂合成過(guò)程是在多個(gè)不同的細(xì)胞器中進(jìn)行并發(fā)生轉(zhuǎn)運(yùn)而導(dǎo)致的。本研究中的富集性分析將86 587條Unigene歸于406個(gè)代謝途徑(pathway),約占總Unigene的43.86%,而我們重點(diǎn)關(guān)注的脂肪酸的生物合成(fatty acid biosynthesis)途徑共富集到437條Unigene,另外兩條脂肪酸的延長(zhǎng)(fatty acid elongation)途徑和脂肪酸的降解(fatty acid degradation)途徑分別富集到125條Unigene和501條Unigene。
圖1 Unigene序列的程度分布
圖2 Unigene的GO分類
此外,將Unigene序列通過(guò)與NR、Swissport、Trembl、KOG和Pfam數(shù)據(jù)庫(kù)進(jìn)行比對(duì),分別注釋到119 737、81 176、119 448、71 423、84 683條序列,分別約占總Unigene的60.65%、41.12%、60.51%、36.18%、42.9%。在注釋過(guò)程中,經(jīng)過(guò)NR數(shù)據(jù)庫(kù)比對(duì),可以發(fā)現(xiàn)澳洲堅(jiān)果轉(zhuǎn)錄本序列與蓮科(Nelumbonucifera)植物較為相近,相似度達(dá)39.56%,其次是博落回(Macleayacordata),相似度為10.74%(圖3)。經(jīng)過(guò)KOG數(shù)據(jù)庫(kù)進(jìn)行富集后,將所有Unigene序列分為25類同源蛋白簇,一般功能預(yù)測(cè)(General function prediction only)富集到18 636個(gè)Unigene,翻譯后的修飾、蛋白周轉(zhuǎn)、分子伴侶(Posttranslational modification,protein turnover,chaperones)富集到7 503個(gè)Unigene,信號(hào)轉(zhuǎn)導(dǎo)機(jī)制(Signal transduction mechanisms)富集到6 890個(gè)Unigene,這 三個(gè)簇是Unigene富集最多的,細(xì)胞運(yùn)動(dòng)(Cell motility)富集到43個(gè),是Unigene富集最少的(圖4)。
圖3 Unigene的NR分類
圖4 Unigene的KOG分類
從RNA-Seq結(jié)果中可以看出,在澳洲堅(jiān)果果仁發(fā)育過(guò)程中,有很多Unigene基因表達(dá)呈現(xiàn)上調(diào)或下調(diào)(表1),表 明 果 實(shí) 發(fā)育過(guò)程中有很多基因及其產(chǎn)物參與到脂肪酸的合成和積累中。
對(duì)7個(gè)發(fā)育階段的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)富集到脂肪酸生物合成(fatty acid biosynthesis)途徑的Unigene共437條,占總Unigene的0.5%。將437條Unigene序列在KEGG數(shù)據(jù)庫(kù)中比對(duì)后找到17個(gè)同源脂肪酸合成相關(guān)蛋白。生物機(jī)體中脂肪酸的合成都是通過(guò)脂肪酸合成途徑來(lái)完成的,對(duì)脂肪酸合成途徑中相關(guān)基因的研究有助于人們深入認(rèn)識(shí)這一合成途徑的運(yùn)行機(jī)制。
將7個(gè)發(fā)育階段分別進(jìn)行兩兩比較,對(duì)每組兩兩比較獲得的差異表達(dá)Unigene分別進(jìn)行富集性分析,結(jié)果顯示,每組差異表達(dá)的Unigene中都有一些在KEGG數(shù)據(jù)庫(kù)(https://www.kegg.jp/)中可以富集到脂肪酸生物合成途徑中(代謝圖登錄號(hào)為ko00061),并找到同源蛋白。這些Unigene的變化在果仁油脂合成中起著重要作用,可能引起澳洲堅(jiān)果在不同發(fā)育階段中不同類型脂肪酸的合成和積累,其基本信息見表1。本文重點(diǎn)挑選9個(gè)澳洲堅(jiān)果果仁脂肪酸生物合成途徑中的關(guān)鍵酶的功能作用進(jìn)行介紹,并觀察它們?cè)?個(gè)不同發(fā)育時(shí)期的表達(dá)變化規(guī)律。
表1 澳洲堅(jiān)果果仁7個(gè)不同發(fā)育時(shí)期差異基因
(1)乙酰輔酶A羧化酶(Acetyl CoA carboxylase)
在植物的脂肪酸生物合成過(guò)程的起始反應(yīng)中,催化乙酰輔酶A生成丙二酰輔酶A[5]。乙酰輔酶A羧化酶是一個(gè)多酶復(fù)合體,由乙酰輔酶A羧化酶生物素羧基載體蛋白(Acetyl-CoAcarboxylase biotin carboxyl carrier protein,accB)、乙酰輔酶A羧化酶生物素羧化酶(Acetyl-CoAcarboxylase biotin carboxylase,accC)和乙酰輔酶A羧化酶羧基轉(zhuǎn)移酶(Acetyl-CoAcarboxylase carboxyl transferase)組成,而羧基轉(zhuǎn)移酶又包含α-亞基(accA)和β-亞基(accD)[6]。其機(jī)理是以ATP提供反應(yīng)活化能,將碳酸氫鹽上的羧基轉(zhuǎn)移到生物素羧基載體蛋白的長(zhǎng)臂上,繼而在羧基轉(zhuǎn)移酶的催化下隨機(jī)轉(zhuǎn)移到乙酰-CoA上形成丙二酰-CoA[7]。accB基因在Ⅵ期和Ⅶ期與Ⅰ期、Ⅱ期相比,都有所上調(diào),Ⅵ期與Ⅳ期相比,則表達(dá)量有所下調(diào)。accC、accA、accD基因在兩兩比對(duì)結(jié)果中既有上調(diào),也有下調(diào)。但上調(diào)時(shí)期都保持一致,只有下調(diào)的時(shí)期略有不同,accD在第Ⅲ期與第Ⅶ期相比較,沒有上下調(diào)的明顯變化(表2)。
(2)ACP-S丙二酰轉(zhuǎn)移酶([acyl-carrier-protein]S-malonyltransferase)
該酶催化酰基載體蛋白(ACP)與丙二酰輔酶A中的丙二酰進(jìn)行轉(zhuǎn)?;磻?yīng),形成丙二?!狝CP[8],從而為后續(xù)的縮合反應(yīng)提供底物。ACPS丙二酰轉(zhuǎn)移酶基因Ⅶ期與前幾個(gè)時(shí)期相比,呈現(xiàn)明顯的下調(diào)(表2)。
(3)3-酮脂酰-ACP合酶III(3-oxoacyl-[acylcarrier-protein]synthase III)
該酶在脂肪酸合成起始反應(yīng)階段中起作用,催化乙酰輔酶A和丙二酰ACP進(jìn)行縮合,生成3-酮基丁酰ACP,并進(jìn)入循環(huán)反應(yīng)[9]。3-酮脂酰-ACP合酶III的第Ⅶ期與第Ⅱ期、第Ⅲ期、第Ⅳ期、第Ⅴ期相比,呈現(xiàn)明顯的下調(diào)(表2)。
(4)3-氧代?;?ACP合酶II(3-oxoacyl-[acylcarrier-protein]synthase II)
與酮?;铣擅割愃?,該酶在肽鏈上有一個(gè)活性位點(diǎn)(半胱氨酸殘基),通過(guò)硫脂鍵與延長(zhǎng)的酰基鏈連接[10]。隨著澳洲堅(jiān)果的發(fā)育,發(fā)育前期與后期相比,3-氧酰基-ACP合酶基因也呈現(xiàn)下調(diào)(表2)。
(5)3-氧代?;?ACP還原酶(3-oxoacyl-[acylcarrier-protein]reductase)
該酶主要參與多不飽和脂肪酸的生物合成過(guò)程,是一種以NAD+或NADP+為受體、作用于供體CH-OH基團(tuán)上的氧化還原酶,即在NAD+或NADP+參與下,催化底物生成β-羥?;?ACP(βhydroxyacyl-ACP)[11]。3-氧?;?ACP還原酶基因在整個(gè)發(fā)育階段,既有上調(diào),也有下調(diào)(表2)。
(6)3-羥?;?ACP脫水酶(3-hydroxyacyl-[acyl-carrier-protein]dehydratase)
該酶能催化羥酰-ACP脫掉一個(gè)水分子,生成丁烯酰-ACP[12],與第Ⅱ期相比。該基因在Ⅶ期既有所上升,也有所下降,第Ⅶ期與第Ⅰ期、第Ⅱ期、第Ⅲ期、第Ⅳ期、第Ⅴ期相比都有所上升(表2)。
(7)烯脂酰-ACP還原酶I(enoyl-[acyl-carrier protein]reductase I)
在植物脂肪酸合成途徑中,該酶催化脂肪酸合成第一個(gè)循環(huán)的最后一步,通過(guò)NADH減少連接?;d體蛋白的脂肪酸酰基鏈C2和C3之間的反式雙鍵參與脂肪酸的生物合成[13,14],即催化反-2-烯脂酰ACP還原為脂酰ACP。與前5個(gè)時(shí)期相比,第Ⅵ期和第Ⅶ期都呈現(xiàn)明顯的下調(diào)(表2)。
(8)長(zhǎng)鏈?;鵆oA合酶(long-chain acyl-CoA synthetase)
該酶是?;せ蠲讣易宄蓡T之一,分為5種不同的亞型,由不同的基因編碼。主要催化12~20碳鏈的脂肪酸合成脂酰輔酶A。這也是機(jī)體體內(nèi)甘油三酯合成及脂肪酸β氧化的第一步反應(yīng)[15]。該酶在不同階段都表現(xiàn)出既有上升又有下降的趨勢(shì),也是因?yàn)槎鄠€(gè)基因編碼該酶,因此在結(jié)果中能看到既有上升也有下降(表2)。
表2 澳洲堅(jiān)果果仁脂肪酸生物合成途徑關(guān)鍵酶基因在不同階段的表達(dá)模式
(9)脂?;?ACP硫脂酶(fatty acyl-ACP thioesterase)
該酶在決定植物細(xì)胞中合成的游離脂肪酸的種類和鏈長(zhǎng)起著重要的作用。常分為兩類不同但又相關(guān)的酶,即FATA和FATB[16]。大部分FATA由核基因編碼,具有很高的C18∶1-ACP活性和相對(duì)較低的C18∶0-ACP活性,因此,F(xiàn)ATA可能決定這植物體內(nèi)的C18∶1輸出到質(zhì)體外的水平[15]。FATB傾向于生成百合的acyl-ACP脂酰碳鏈,雖然其也參與非飽和acyl-ACP脂肪酸的生物合成。在大多數(shù)的植物中,F(xiàn)ATB催化C16∶0的生成[17-18]。
到目前為止,澳洲堅(jiān)果果仁脂肪酸的分子生物學(xué)研究基礎(chǔ)仍然很薄弱,能夠?qū)ζ溲芯窟M(jìn)行參考的相關(guān)山龍眼科作物的脂肪酸背景研究較少,這嚴(yán)重制約著澳洲堅(jiān)果生物學(xué)性狀的分子機(jī)制研究。在本次研究中,利用澳洲堅(jiān)果在不同發(fā)育階段的果仁為材料進(jìn)行轉(zhuǎn)錄組測(cè)序,將差異表達(dá)的基因進(jìn)行GO分類和代謝途徑等分類,初步明確了各個(gè)基因編碼的蛋白質(zhì)功能,這為進(jìn)一步研究澳洲堅(jiān)果果仁發(fā)育的分子機(jī)制提供了必要的數(shù)據(jù)支撐,并為揭示基因表達(dá)變化脂肪酸積累之間的關(guān)系奠定了研究基礎(chǔ)。
澳洲堅(jiān)果果仁富含的不飽和脂肪酸具有很高的經(jīng)濟(jì)價(jià)值,研究果仁中油脂的轉(zhuǎn)化和積累的分子機(jī)制有助于為澳洲堅(jiān)果遺傳育種提供改良方向,同時(shí)對(duì)其他油料作物的基礎(chǔ)研究也有一定的參考價(jià)值。本研究富集得到與脂肪酸合成相關(guān)的重要酶類,同時(shí)初步分析了它們?cè)诠拾l(fā)育中的表達(dá)變化規(guī)律,這對(duì)我們后續(xù)的研究具有重要的啟迪作用。澳洲堅(jiān)果從Ⅰ~Ⅶ個(gè)時(shí)期的發(fā)育過(guò)程中,有4個(gè)酶在后期都出現(xiàn)明顯下調(diào),分別是:ACP-S丙二酰轉(zhuǎn)移酶、3-酮脂酰-ACP合酶III、3-氧代?;?ACP合成酶Ⅱ和烯脂酰-ACP還原酶I。脂肪酸合成途徑分起始反應(yīng)和循環(huán)反應(yīng)兩個(gè)部分,前兩個(gè)酶在脂肪酸合成的起始反應(yīng)中起重要作用,后兩個(gè)在循環(huán)反應(yīng)中起作用。當(dāng)前兩個(gè)酶減少,會(huì)影響到脂肪酸的后期合成,猜測(cè)是因?yàn)榘闹迗?jiān)果發(fā)育到后期,臨近采摘時(shí)已經(jīng)成熟,果仁中不再繼續(xù)合成和積累新的脂肪酸,因此,在脂肪酸合成的起始反應(yīng)階段就有所減少。在脂肪酸從頭合成過(guò)程中,烯脂酰-ACP還原酶I第一次發(fā)生作用是還原巴豆酰-S-ACP,消耗一個(gè)NADPH和一個(gè)H+,形成丁酰-S-ACP,此后進(jìn)入脂肪酸合成的延伸循環(huán),第一輪延伸產(chǎn)生含4個(gè)C的丁酰-S-ACP,經(jīng)過(guò)幾次重復(fù),與丙二酰-ACP發(fā)生縮合反應(yīng),每一輪增加2個(gè)C原子,從而延伸了?;?S-ACP的鏈長(zhǎng)。經(jīng)過(guò)7次循環(huán),最終形成C16-S-ACP,該產(chǎn)物可經(jīng)軟脂酰-ACP硫脂酶的催化形成游離的軟脂酸。此時(shí),C16脂肪酸作為一方面可以進(jìn)一步延伸碳鏈形成C18脂肪酸,另一方面在去飽和酶的作用下,可以形成單不飽和,單不飽和脂肪酸進(jìn)一步去飽和形成多不飽和脂肪酸。從這個(gè)催化過(guò)程中可以推測(cè),烯脂酰-ACP還原酶I的存在能影響C16烯酸和C16烷酸的初步形成,在澳洲堅(jiān)果發(fā)育后兩個(gè)時(shí)期該酶有所減少,該酶可能在前5個(gè)發(fā)育時(shí)期起重要作用,能直接影響C16烷酸的形成和積累,后期則因?yàn)榈孜顲16烷酸積累到一定量,因而合成速率減緩,從而影響C16烯酸和C18烷酸的形成和積累,進(jìn)而影響澳洲堅(jiān)果的果仁品質(zhì)。這與澳洲堅(jiān)果后期積累不飽和脂肪酸的趨勢(shì)是相關(guān)的,表明這些基因的表達(dá)量與果仁發(fā)育過(guò)程中脂肪酸合成和積累是有影響的。但是關(guān)于這些酶在澳洲堅(jiān)果果仁脂肪酸合成過(guò)程中的表達(dá)模式還未探明,鮮有報(bào)道,因此,對(duì)其在澳洲堅(jiān)果果仁中的分子機(jī)制還有待進(jìn)一步研究。其他有明顯差異的酶既有上調(diào)也有下調(diào),則是因?yàn)槎鄠€(gè)基因可以形成該種酶,為此,在分析過(guò)程中還要注意多個(gè)不同基因的變化,進(jìn)一步去分析每個(gè)基因在不同發(fā)育階段的變化趨勢(shì)。
本研究通過(guò)RNA-Seq揭示了澳洲堅(jiān)果果仁的脂肪酸合成機(jī)制,并分析其基因的表達(dá)變化規(guī)律,這有望為植物油脂合成機(jī)制的解析提供理論參考,豐富油脂合成的研究?jī)?nèi)容,并為進(jìn)一步的理論研究和澳洲堅(jiān)果的遺傳改良提供潛在的基因資源。