干思宸,師 悅,梁立軍
(浙江農(nóng)林大學 風景園林與建筑學院,浙江 杭州 311300)
山麥冬Liriope spicata為百合科Liliaceae多年生草本植物,在園林綠化中多栽培于林下或林緣半陰處,掩飾裸露土壤,起到補充綠地改善不良景觀的作用。山麥冬屬Liriope植物只有8種,中國栽培6種,其中包含3個特有種,但山麥冬屬植物分布廣泛,除極寒地區(qū)及高海拔地區(qū)外,中國各省均有分布,其地理分布受人為栽培引種因素影響很大,沒有特定的地理分布規(guī)律[1]。山麥冬成熟時果實表皮由綠轉(zhuǎn)黑,9月結(jié)果后觀果時期可長達整個冬季,且其花葶較長多矗立于葉子的上方,易于觀察,具有很高的園林應(yīng)用價值。目前,針對山麥冬成熟過程中呈色物質(zhì)及調(diào)控基因尚未報道,但花青素合成途徑在植物中是保守的,合成途徑中上游合成基因是決定植物組織能否積累花青素的關(guān)鍵[2],而下游修飾基因的表達常與花青素的積累一致,是加深果色花色的關(guān)鍵基因[3-5]。此外,花青素的積累還受轉(zhuǎn)錄因子的調(diào)控,其中以MYB轉(zhuǎn)錄因子與bHLH轉(zhuǎn)錄因子最為常見[6]。
用于基因表達定量分析的方法比較多,其中實時熒光定量PCR(RT-qPCR)由于定量準確、成本低且高通量,被廣泛應(yīng)用于基因表達水平研究。但其結(jié)果常受RNA質(zhì)量、反轉(zhuǎn)錄效率、引物特異性、初始樣品量及擴增效率等因素的影響[7-8],需要引入1個或多個表達穩(wěn)定的內(nèi)參基因(reference genes, RGs)來評估目的基因的相對表達[9]。在植物學研究中,曾以肌動蛋白(actin,ACT)[10-12]、組蛋白(histone)[11]、蛋白磷酸酶(protein phosphatase,PP2A)[13]、甘油醛-3-磷酸-脫氫酶(glyceraldehyde-3-phosphate dehydrogenase,GAPDH)[12]、泛素結(jié)合酶(ubiquitin conjugating enzyme, UBC)[14-15]以及18S核糖體RNA(18S ribosomal RNA,18S)[16]等基因作為內(nèi)參基因。但是常見的內(nèi)參基因也并非適用于任何研究,且目前還未見山麥冬內(nèi)參基因的報道。鑒于此,本研究基于山麥冬轉(zhuǎn)錄組數(shù)據(jù),對山麥冬果實發(fā)育中穩(wěn)定表達的內(nèi)參基因進行研究,為提高果色轉(zhuǎn)變關(guān)鍵基因RT-qPCR分析的準確性提供科學依據(jù)。
在浙江農(nóng)林大學資源圃,選取生長環(huán)境相同,且植株生長狀況良好、長勢整齊的山麥冬,隨機均勻采集15~20株山麥冬植株的各一簇花葶的上、中、下部分果實,基于山麥冬果實生長特性,采集山麥冬幼果期(2020年9月)及成熟期(2020年11月) 2個時期樣品,果實從花葶中取下后立即存于-80 ℃冰箱備用。設(shè)置3次生物學重復(fù)。
使用天根離心柱型RNA試劑盒(天根生物科技有限公司)從每個時期樣本中提取總RNA。采用質(zhì)量分數(shù)為1%的瓊脂糖凝膠電泳檢測RNA的完整性??俁NA的純度和質(zhì)量濃度采用NanoDrop ONE微量核酸蛋白濃度測定儀(Therm,美國)測定??俁NA樣本質(zhì)量濃度均高于4×10-5ng·L-1以上,總RNA純度 [D(260)/D(280)]為 1.9~2.1 。cDNA 的合成使用 PrimerScript? RT Master Mix cDNA (Perfect Real Time)反轉(zhuǎn)錄試劑盒,所有樣本總RNA加入量按照3×10-5ng·L-1稀釋至同一質(zhì)量濃度,cDNA置于-20 ℃冰箱保存。
基于已獲得的山麥冬轉(zhuǎn)錄組數(shù)據(jù)及京都基因與基因組百科全書(KEGG)注釋,篩選了多條通路的基因作為內(nèi)參基因參考庫,包括參與山麥冬果實運輸和分解代謝的基因(SLC36等),參與代謝過程的基因(PP2C、MGL、PDP、G6PD等),參與信號傳導(dǎo)與轉(zhuǎn)運的基因(AUX、GPR107、CNNM等),參與細胞過程的基因(CFL等),參與植物免疫的基因(Trx等),參與遺傳信息處理的基因(UGT、PP2A、EF1-α等)共1 648個,參考前人對內(nèi)參基因的篩選閾值稍作修改后[11-13],以每千個堿基轉(zhuǎn)錄每百萬映射讀取的片段(FPKM)高于5的基因(低表達的難以檢測)、變異系數(shù)<0.1、變化倍數(shù)<0.2為篩選條件,得到前15個候選內(nèi)參基因(表1)。
表1 山麥冬 15 個候選的內(nèi)參基因Table 1 15 candidate reference genes of L. spicata
根據(jù)轉(zhuǎn)錄組獲得的核酸序列信息,利用primer 5軟件設(shè)計引物,并交由杭州有康生物技術(shù)有限公司合成 (表2)。利用 TB Green 染料 (Takara)預(yù)反應(yīng),體積 20 μL,并使用 LightCycler? 480 Ⅱ型熒光定量PCR 儀 (羅氏,瑞士)進行 RT-qPCR。反應(yīng)程序:95 ℃ 預(yù)變性 5 min;95 ℃ 變性 10 s;60 ℃ 退火延伸 30 s,40個循環(huán)。實驗設(shè)置3次生物學重復(fù)。擴增效率(cDNA稀釋濃度梯度為5-1、5-2、5-3、5-4、5-5)計算公式為E=[10(-1/K)-1]×100%,其中:E為擴增效率,K為斜率。15個候選內(nèi)參基因的擴增效率為91.7%~108.0%(表2)。
表2 15個候選內(nèi)參基因的引物序列和擴增子特征Table 2 Primer sequences and amplicon characteristics of 15 candidate reference genes
通過4種方法分析內(nèi)參基因的穩(wěn)定性:ΔCt值法[17]、geNorm[18]、NormFinder[19]和BestKeeper[20]。利用Excel 2010計算4種方法對候選內(nèi)參基因幾何平均數(shù)的排名,綜合篩選最適的內(nèi)參基因。同時根據(jù)前期轉(zhuǎn)錄組數(shù)據(jù)篩選了10種目的基因,涵蓋花青素合成通路上下游基因以及調(diào)控基因。這10種基因在轉(zhuǎn)錄組數(shù)據(jù)加權(quán)共表達分析中屬于中樞基因,表達量高、與花青素相關(guān)性強,且在果實成熟過程中顯著上調(diào)。目的基因包括C4H、CHS、MT、UFGT、MYB、bHLH,上述基因引物序列及擴增子特征見表3,最后利用 SPSS 19.0 與 Graphpad Prism 8.0 分析及作圖。
表3 10 個目的基因的引物序列和擴增子特征Table 3 Primer sequences and amplicon characteristics of 10 target genes
15個候選內(nèi)參基因的溶解曲線均為單一峰(圖1),瓊脂糖凝膠電泳檢測后出現(xiàn)與預(yù)期大小一致的單一條帶(圖2)。該結(jié)果表明引物具有良好的特異性。
圖1 15 個候選內(nèi)參基因的溶解曲線Figure 1 Melting curves of fifteen reference genes
圖2 15個候選內(nèi)參基因PCR擴增產(chǎn)物的瓊脂糖凝膠電泳Figure 2 Agarose gel electrophoresis of the PCR products of the fifteen reference genes
根據(jù)原始循環(huán)閾值(Ct)分布發(fā)現(xiàn):所有候選內(nèi)參基因的Ct為15.53~28.81,Ct越高,基因的表達量越低,反之表達量越高。本研究中,EF1-α基因表達量最高,PP2C基因表達量最低,其余基因表達量介于兩者之間。此外,由箱線圖(圖3)跨度可初步判定內(nèi)參基因的穩(wěn)定性。PP2C、Trx-1、AUX、PP2A、PDP基因的Ct跨度廣,不穩(wěn)定,而GPR107、CNNM、EF1-α、G6PD-2、Trx-2基因最為穩(wěn)定,其中GPR107、CNNM、G6PD-2基因的Ct中位數(shù)與平均數(shù)接近,即上述基因相對表達量離散程度低,表達更穩(wěn)定。然而對原始Ct分析內(nèi)參基因穩(wěn)定性的不足,還需引入其他的方法。
圖3 15 個候選內(nèi)參基因的 CtFigure 3 Ct values of the 15 candidate reference genes
利用ΔCt法、geNorm、NormFider和BestKeeper對15個候選內(nèi)參基因的穩(wěn)定性進行分析(表4)。
表4 4種方法評價 15個候選內(nèi)參基因表達的穩(wěn)定性Table 4 Expression stability of 15 candidate reference genes evaluated by 4 methods
ΔCt法是在原始Ct值的基礎(chǔ)上,計算每個基因所有樣本與其他基因的Ct值之差,并計算其標準差。一般平均標準差越低,基因穩(wěn)定性越高。該方法中,EF1-α、PP2C、CFL、CNNM是山麥冬果實發(fā)育階段最穩(wěn)定的內(nèi)參基因;PDP、G6PD-1、PP2A是最不穩(wěn)定的內(nèi)參基因。
geNorm軟件通過平均表達值來描述候選內(nèi)參基因的穩(wěn)定性,同時還能計算歸一化因子之間的兩兩變異(Vn/n+1,其中n為可使RT-qPCR結(jié)果準確的最少基因數(shù)目)。該方法中,所有基因的平均表達值都在1.5以下(穩(wěn)定內(nèi)參基因的臨界值),即該方法判定下的所有基因都可作為內(nèi)參基因,其中GPR107(0.817)與CNNM(0.847)基因的平均表達值最低,說明最穩(wěn)定。同時PDP、G6PD-1基因的平均表達值最高,分別為1.390、1.204,最不穩(wěn)定,這與ΔCt法判定結(jié)果一致。此外,利用geNorm計算2個歸一化基因的Vn/n+1,確定適合量化果實生長過程的最優(yōu)內(nèi)參基因數(shù)目。geNorm首先計算2個最穩(wěn)定的候選內(nèi)參基因的歸一化因子值,然后將剩余候選內(nèi)參基因按其表達穩(wěn)定性下降的順序依次相加。如果基因之間的Vn/n+1大于或等于0.15,則進行RT-qPCR分析時應(yīng)該再添加1個基因才能達到可靠的結(jié)果,一旦Vn/n+1低于0.15,就不需要添加額外的基因[21]。由圖4可見:從V4/5開始Vn/n+1小于0.15,即需要使用4個內(nèi)參基因才能得到可靠的RT-qPCR結(jié)果。
圖4 精確歸一化的最佳內(nèi)參基因數(shù)量Figure 4 Optimal number of control genes for accurate normalization
NormFinder軟件可分析候選內(nèi)參基因的兩兩變異性,其中穩(wěn)定值越小,候選內(nèi)參基因越穩(wěn)定。CNNM與GPR107基因的穩(wěn)定值最小,分別為0.157、0.167,即CNNM與GPR107基因最穩(wěn)定,這與geNorm分析結(jié)果一致;此外,對最差的內(nèi)參基因評價也與上述2種方法一致:PDP、G6PD-1、AUX是量化果實發(fā)育階段最不適合的內(nèi)參基因。
Bestkeeper與geNorm、NormFinder軟件不同,需導(dǎo)入原始Ct值平均數(shù),計算候選內(nèi)參基因在所有樣品中的標準差、變異系數(shù)、相關(guān)系數(shù)。一般地,穩(wěn)定的內(nèi)參基因擁有低的標準差、變異系數(shù)及高的相關(guān)系數(shù)。在Bestkeeper評價中,與geNorm、NormFinder分析結(jié)果一致,CNNM與PDP基因分別還是最穩(wěn)定與最不穩(wěn)定的內(nèi)參基因。除此之外,還發(fā)現(xiàn)G6PD-2為該方法中最穩(wěn)定的內(nèi)參基因,其標準差與變異系數(shù)最低,分別為0.290、1.323,相關(guān)系數(shù)為0.750。
最后通過幾何平均數(shù)對這4種方法的分析結(jié)果進行綜合性排序(表5)。根據(jù)表5的排名與geNorm推薦的內(nèi)參基因數(shù)目,篩選CNNM、GPR107、EF1-α、G6PD-2作為標準化山麥冬果實RT-qPCR的最優(yōu)內(nèi)參組合,PDP為最差內(nèi)參基因,通過4種算法得出的結(jié)果也與最初候選內(nèi)參基因原始Ct值分布箱線圖分析結(jié)果一致。
表5 15 個候選內(nèi)參基因的綜合排名Table 5 Comprehensive ranking of reference genes for normalization
為驗證內(nèi)參基因的有效性,選擇10種花青素合成結(jié)構(gòu)基因與調(diào)控基因作為目的基因。用單一內(nèi)參基因:最優(yōu)內(nèi)參(CNNM)、最差內(nèi)參(PDP),及2種內(nèi)參組合:排名前2位的內(nèi)參基因(CNNM、GPR107)和排名前4位的內(nèi)參基因(CNNM、GPR107、EF1-α、G6PD-2)進行歸一化。從圖5可見:在山麥冬果實花青素合成過程中,使用4種內(nèi)參方式歸一化時,所有的目的基因都上調(diào)表達,但變化倍數(shù)稍有不同。在山麥冬果實成熟期,使用PDP基因作為內(nèi)參時,所有目的基因相對表達量均顯著高于其他3類,特別是對轉(zhuǎn)錄因子bHLH基因的量化時產(chǎn)生嚴重偏差,使用PDP基因與CNNM+GPR107+EF1-α+G6PD-2基因組合作為內(nèi)參,bHLH基因的相對表達量分別為6.28與15.70,兩者差異高達2.5倍。然而,當使用最優(yōu)內(nèi)參基因CNNM進行標準化時,除UFGT基因外,CNNM、GPR107、EF1-α、G6PD-2內(nèi)參組合無顯著差異,使用CNNM基因標準化時,UFGT相較幼果期上調(diào)表達50.71倍,使用4種內(nèi)參組合時,UFGT上調(diào)72.49倍。此外,本研究還分析了候選內(nèi)參排名前2位的基因(CNNM、GPR107)作為目的基因的表達量,發(fā)現(xiàn)選用2種內(nèi)參基因與geNorm軟件推薦使用4種內(nèi)參基因,在10個目的基因中均無顯著差異。
圖5 不同內(nèi)參基因歸一化后10個目的基因的相對表達量Figure 5 Relative expression levels of ten target genes after normalized by different reference genes
從圖6可見:利用最差內(nèi)參PDP得到的目的基因表達量與4種內(nèi)參基因組合得到的目的基因表達量相關(guān)系數(shù)為0.868 6 (P<0.01),當使用最優(yōu)基因CNNM作為內(nèi)參時,與4種內(nèi)參組合相關(guān)系數(shù)可達0.991 6 (P<0.01)。對2種內(nèi)參組合與geNorm推薦的4個數(shù)目內(nèi)參組合比較發(fā)現(xiàn):通過這2種方法標準化得到的目的基因相關(guān)性可達0.999 9 (P<0.01),即僅使用CNNM、GPR107基因作為雙內(nèi)參也可達到geNorm軟件推薦的4個內(nèi)參數(shù)目組合的效果。
圖6 不同內(nèi)參基因標準化后10種目的基因表達量的相關(guān)性分析Figure 6 Correlation analysis for relative expression levels of ten target genes after normalized by different reference genes
山麥冬作為一種優(yōu)良的地被園林植物及藥用植物,研究多集中于提高栽培技術(shù)及塊莖產(chǎn)量,而針對園林觀賞應(yīng)用的研究較少。在本研究之前沒有山麥冬內(nèi)參的研究報道,作為沿階草族植物,其近源種也僅有麥冬Ophiopogon japonicus抗逆性研究中曾以微管蛋白基因(tubulin)[22]及Actin[23]作為參考基因。但這2類基因在前期轉(zhuǎn)錄組篩選中由于變異系數(shù)及變化倍數(shù)在候選內(nèi)參中就已經(jīng)被排除。本研究根據(jù)幾何平均數(shù)的綜合排名,推薦使用內(nèi)參基因CNNM、GPR107、EF1-α、G6PD-2作為研究山麥冬花青素合成的最優(yōu)內(nèi)參組合。EF1-α、G6PD-2屬于常見的內(nèi)參基因,在植物生長發(fā)育、抗逆反應(yīng)、代謝合成中已被廣泛應(yīng)用[24-25]?;谇捌谵D(zhuǎn)錄組數(shù)據(jù),新型內(nèi)參基因CNNM、GPR107也可作為RT-qPCR分析的內(nèi)參基因,CNNM編碼過渡金屬轉(zhuǎn)運蛋白,可參與多種金屬吸收、排除及區(qū)分化[26],GPR107編碼G蛋白偶聯(lián)受體107,廣泛存在于細胞表面的膜蛋白,可參與植物體多種細胞信號轉(zhuǎn)導(dǎo)及調(diào)控機制保守[27]。上述2種基因在山麥冬果實中表達穩(wěn)定,其相對表達量平均值與中位數(shù)相近,離散程度低,且表達量適中,符合內(nèi)參基因的標準。在觀賞植物中,由于新型內(nèi)參基因穩(wěn)定性強于傳統(tǒng)內(nèi)參基因,常被選用標準化目的基因的表達。例如,在異型花柱連翹Forsythia suspensa中,轉(zhuǎn)錄組中變化微小的未知基因是研究花開放最適合的內(nèi)參基因[28];太行花Taihangia rupestris花器官有復(fù)雜的性別決定機制,鑒定兩性花與雄性花的內(nèi)參基因是編碼鐵硫簇組裝蛋白、3-巰基丙酮酸硫轉(zhuǎn)移酶與跨膜蛋白50的新型內(nèi)參基因[11]。SmDnaJ基因在旱柳Salix matsudana各種非生物脅迫下表達最為穩(wěn)定[29]。bHLH在觀賞百合Lilium oriental×Trumpet hybrid體胚誘導(dǎo)、體胚發(fā)育中表達最穩(wěn)定[30],但bHLH是植物顏色育種中的重要靶基因,并不適合作為本研究的內(nèi)參基因候選,這也證實了不同目標性狀需采用不同的內(nèi)參基因,沒有一種內(nèi)參基因是普適的。
花青素合成路徑在植物中是保守的,其中MYB轉(zhuǎn)錄因子與bHLH轉(zhuǎn)錄因子可形成二元復(fù)合體,激活花青素合成酶基因[31-32]。大量研究表明:MYB、bHLH轉(zhuǎn)錄因子基因與花青素合成酶基因在紫色系植物組織發(fā)育過程中協(xié)同上調(diào)[3, 33-34]。為驗證內(nèi)參基因的結(jié)果,挑選了10個在山麥冬花青素合成調(diào)控網(wǎng)絡(luò)的中樞基因(相關(guān)性強且表達量高)作為驗證,其中包括轉(zhuǎn)錄因子與結(jié)構(gòu)基因(C4H、CHS、MT、UFGT、MYB、bHLH),這10種基因在4種歸一化方法下表達模式均顯著上調(diào),但趨勢稍有不同,選用較差內(nèi)參PDP標準化結(jié)果偏差最大,在山麥冬成熟黑果中所有基因都顯著高于其他基因。盡管最優(yōu)內(nèi)參基因CNNM對目的基因的歸一化可以達到與4種內(nèi)參組合很高的相關(guān)系數(shù),但對UFGT基因的量化存在顯著差異,而UFGT基因作為花青素合成通路的下游修飾,對花青素積累至關(guān)重要,特別是在山麥冬這類組織顏色深即富含花青素的類型[2, 35],例如在葡萄Vitis vinifera果皮[36]、玫瑰Rosa rugosa[37]、紫皮石刁柏Asparagus officinalis[33]中UFGT都被驗證為關(guān)鍵基因,因此僅選用單一基因作為研究山麥冬果皮花青素積累的內(nèi)參是不合適的,繼而在CNNM基因基礎(chǔ)上又引入GPR107來規(guī)避單內(nèi)參基因的誤差,該內(nèi)參組合與geNorm推薦的內(nèi)參組合相關(guān)系數(shù)最高,在10種目的基因的驗證結(jié)果中與4種內(nèi)參組合均無顯著差異,且選用雙內(nèi)參組合比4種內(nèi)參組合可操作性強,因此判定使用CNNM、GPR107作為雙內(nèi)參即可得到可靠的RT-qPCR結(jié)果。雙內(nèi)參組合聯(lián)合使用可以減少實驗因素對基因表達的影響,且結(jié)果更為準確。暴露于UV-B輻射下的番茄Lycopersicon esculentum幼苗不同組織都應(yīng)選用特定的內(nèi)參組合,例如葉中選用肌動蛋白基因與微管蛋白基因,而根中選用微管蛋白與UV-B抗性位點基因更加適合[38];UBQ和EF1-α基因由于表達穩(wěn)定,可作為內(nèi)參基因用于鵝掌草Anemone flaccida各器官的不同發(fā)育階段[39]。
本研究基于轉(zhuǎn)錄組數(shù)據(jù)篩選了15個候選內(nèi)參基因,分析其在山麥冬果實不同時期的表達穩(wěn)定性。經(jīng)過10種目的基因驗證后,表明以CNNM、GPR107基因作為組合是山麥冬果實花青素生物合成研究的最佳內(nèi)參基因,而常用的內(nèi)參基因卻并不適用于本研究,這為篩選新型內(nèi)參基因提供了新思路。