宋 韡, 尹旭崗, 何中石, 王 偉, 樊 悅, 高 帆
(1. 山西體育職業(yè)學(xué)院, 太原 030006; 2. 山西大學(xué) 生命科學(xué)學(xué)院, 太原 030006)
張氏江蘺(Gracilariachangii)是江蘺屬(Gracilaria)中的一種大型經(jīng)濟(jì)海藻,多分布于我國(guó)的東南和西南沿海以及東南亞諸島海域[1]。該藻富含多糖、藻膽蛋白及不飽和脂肪酸等生物活性成分,已廣泛應(yīng)用于食品、醫(yī)藥及化工領(lǐng)域[2-4]。隨著沿海環(huán)境的日益惡化,包括張氏江蘺在內(nèi)的江蘺屬資源正面臨著嚴(yán)峻的生存危機(jī)。作為江蘺屬的重要代表,張氏江蘺的研究目前主要集中在藻體的培養(yǎng)與繁殖[5]、物種分類(lèi)與多樣性研究[6]、生物活性物質(zhì)的提取及功能分析[7]、富營(yíng)養(yǎng)化[8]和重金屬污染海域的生物修復(fù)[9]。目前,對(duì)于分子水平上江蘺的相關(guān)研究多集中在分子鑒定及功能基因的挖掘[10-11],對(duì)于非編碼RNA的研究較少。
mciroRNA(miRNA)是一類(lèi)重要的非編碼小RNA,長(zhǎng)度約19~22 nt,是一種重要的基因轉(zhuǎn)錄后調(diào)控子[12]。研究表明,miRNA對(duì)其靶基因的抑制方式主要為mRNA切割和翻譯后抑制兩種[13]。很多報(bào)道顯示,miRNA對(duì)于植物組織與器官的形成、生物信號(hào)的轉(zhuǎn)導(dǎo)、非生物脅迫響應(yīng)以及生理代謝等重要的生物學(xué)過(guò)程均起著至關(guān)重要的調(diào)控作用[14]。作為一類(lèi)重要的大型經(jīng)濟(jì)栽培海藻,江蘺資源的品質(zhì),包括瓊膠、多糖等含量及其對(duì)氮磷以及重金屬的吸附等亟待提高。利用傳統(tǒng)的遺傳育種開(kāi)發(fā)藻類(lèi)資源具有周期長(zhǎng)、穩(wěn)定性差等不足。基于分子生物學(xué)方法對(duì)江蘺關(guān)鍵基因的有效調(diào)控可極大地提高其品質(zhì)優(yōu)化效率。
國(guó)內(nèi)外對(duì)植物miRNA的研究多集中于一些模式植物或經(jīng)濟(jì)作物[14],對(duì)藻類(lèi)的相關(guān)研究相對(duì)滯后。張氏江蘺是江蘺屬的重要代表,目前仍未有關(guān)于該藻miRNA及其靶基因的相關(guān)報(bào)道。相比動(dòng)物,植物miRNA序列相對(duì)保守,利用生物信息學(xué)手段[15],搜索潛在的植物miRNA檢索數(shù)據(jù)庫(kù),我們可以預(yù)測(cè)一些植物的未知miRNA信息,這是一種高效地獲取植物miRNA及其靶基因信息的重要手段。本研究利用生物信息學(xué)方法預(yù)測(cè)張氏江蘺miRNAs,分析miRNAs及其前體二級(jí)結(jié)構(gòu);分析張氏江蘺miRNA序列在不同植物間的保守性與多態(tài)性,并對(duì)其系統(tǒng)進(jìn)化地位進(jìn)行分析;對(duì)miRNA靶位點(diǎn)及其抑制類(lèi)型進(jìn)行預(yù)測(cè),以期彌補(bǔ)江蘺屬miRNAs研究的空白,也為其后轉(zhuǎn)錄水平基因的調(diào)控及資源的開(kāi)發(fā)利用奠定基礎(chǔ)。
從中國(guó)水產(chǎn)科學(xué)研究院購(gòu)置張氏江蘺野生樣本3份(采集地:中國(guó)青島沿海)。從miRBase 22.0 數(shù)據(jù)庫(kù)下載已知植物miRNAs及其前體序列[16]。去除其中的重復(fù)序列,剩余序列作為預(yù)測(cè)張氏江蘺miRNA的參考序列。從GenBank數(shù)據(jù)庫(kù)下載該紅藻的EST序列(8147條)及核苷酸序列(125條)。
比對(duì)軟件BLAST 2.2.28從NCBI下載[17]。MiRNAs 保守性分析利用Clustal W軟件[18]及weblogo在線(xiàn)分析工具進(jìn)行[19]。Mireap軟件預(yù)測(cè)前體二級(jí)結(jié)構(gòu)[20]。TargetFinder軟件預(yù)測(cè)miRNA潛在靶標(biāo)基因[21]。psRNATarget軟件預(yù)測(cè)miRNA對(duì)其靶基因的抑制方式。BLAST P分析核酸序列編碼蛋白信息。MiRNA前體序列系統(tǒng)進(jìn)化樹(shù)運(yùn)用Clustal W聯(lián)合MEGA 5.0軟件構(gòu)建[22]。
以張氏江蘺已公布的EST為參考序列,以已公布植物miRNA為探針,預(yù)測(cè)張氏江蘺miRNA信息。信息分析程序參考Zhang等[23],預(yù)測(cè)標(biāo)準(zhǔn)參考Ambros等[24]:配對(duì)序列間≤3個(gè)堿基錯(cuò)配;前體序列能形成典型的莖環(huán)狀二級(jí)結(jié)構(gòu);成熟miRNA序列位于莖環(huán)結(jié)構(gòu)的一條臂上,miRNA*位于另一條臂上;miRNA與其互補(bǔ)鏈間錯(cuò)配堿基數(shù)≤6個(gè);且無(wú)環(huán)狀或泡狀結(jié)構(gòu);miRNA中A/U含量在30%~70%;前體結(jié)構(gòu)最小折疊自由能值<-75.35 kJ/mol。
參考Xu等提取江蘺總RNA的方法[25],從3個(gè)張氏江蘺樣本各取2~3 cm葉狀體組織液氮速凍后混勻,Triozl法提取總RNA;參考Varkonyi-Gasic的方法[26]設(shè)計(jì)引物,RNA逆轉(zhuǎn)錄后以稀釋10倍的cDNA為模板,運(yùn)用2×SYBR Green PCR Master Mix進(jìn)行qRT-PCR;以U6 snRNA為陽(yáng)性對(duì)照,以18S rRNA為內(nèi)參基因,對(duì)gch-miRNA進(jìn)行驗(yàn)證。試驗(yàn)引物由上海生工合成,詳細(xì)信息見(jiàn)表1。
整理張氏江蘺miRNA前體序列數(shù)據(jù),利用Clustal X 1.83,將其分別與不同植物的miRNA基因家族序列進(jìn)行多重序列比對(duì)。利用MEAG 5.0對(duì)預(yù)測(cè)miRNA前體序列進(jìn)行系統(tǒng)進(jìn)化分析,利用改進(jìn)的Neighbor-Joining算法(NJ法)構(gòu)建其系統(tǒng)進(jìn)化樹(shù)[27],即由默認(rèn)的Jukes-Cautor單參數(shù)模型修改為Kimura兩參數(shù)模型,bootstrap檢驗(yàn)值為1000,刪除空位及缺失。
表1 張氏江蘺miRNA驗(yàn)證引物信息
根據(jù)植物miRNA與其靶位點(diǎn)互補(bǔ)配對(duì)原則,通過(guò)張氏江蘺miRNA與其EST或mRNA的序列聯(lián)配分析。參考Xie等的預(yù)測(cè)標(biāo)準(zhǔn)[28],TargetFinder篩選出可靠的miRNA靶標(biāo)序列:miRNAs與靶標(biāo)間的錯(cuò)配<4個(gè)(G-U配對(duì)記作0.5個(gè)錯(cuò)配);miRNA::靶標(biāo)少于2處相鄰位點(diǎn)錯(cuò)配;miRNA::靶標(biāo)第2~12位相鄰位點(diǎn)無(wú)錯(cuò)配;miRNA::靶標(biāo)第10~11位無(wú)錯(cuò)配;miRNA::靶標(biāo)第1~12位≤2.5個(gè)錯(cuò)配。根據(jù)miRNA::靶標(biāo)第9~11位是否嚴(yán)格互補(bǔ)配對(duì),psRNATarget預(yù)測(cè)miRNA對(duì)其靶標(biāo)是否為切割抑制方式[29]。
依據(jù)多數(shù)植物中相同MIRNA家族內(nèi)的miRNA成員間序列保守性較高的原則,通過(guò)序列比對(duì)與去冗余,從張氏江蘺中共預(yù)測(cè)6條miRNA序列,分屬5個(gè)MIRNA家族(表2)。由表1可知,新預(yù)測(cè)的gch-miRNA長(zhǎng)度在20~22 nt,A+U含量在20%~57%之間,堿基含量最高為G(占比32.26%),最少為A(占比20.97%)。Gch-miRNAs的堿基偏好性顯示(圖1-A),gch-miRNA的首位堿基偏好于U,第4位和第11位分別偏好于C和G,第13和15位分別偏好于G/A和G/U。Gch-miR5386b產(chǎn)生于成熟體序列的3′端,在藻體組織中易降解,屬于潛在的miRNA*。所有g(shù)ch-miRNAs前體二級(jí)結(jié)構(gòu)形態(tài)較為穩(wěn)定,MFE值均低于-75.35 kJ/mol(表1),均呈典型的RNA頸環(huán)狀(圖1-B)。以上結(jié)果基本符合植物miRNAs及其前體序列特征。
根據(jù)不同植物miRNA成熟體序列間的聯(lián)配分析(含gch-miRNA)結(jié)果(圖2-A),我們發(fā)現(xiàn),張氏江蘺新預(yù)測(cè)的miRNAs在不同植物間較為保守。其中,gch-miR5658與ath-miR5658的序列保守性最高(同源一致度85.7%,僅在第5、20和21位發(fā)生堿基的變化),表明兩者具有較高的同源性,這也與miR5658序列報(bào)道較少有關(guān)(高等植物僅在擬南芥中被發(fā)現(xiàn))。Gch-miR399與其它15種代表性植物miR399s同源性較差(同源一致度42.86%,高度保守的堿基位點(diǎn)僅有9個(gè),且存在錯(cuò)位缺失現(xiàn)象),表明不同物種間miR399序列還具有一定的多態(tài)性。此外,5個(gè)miRNA基因家族的成員數(shù)量也存在一定的差異。如:MIR5386和MIR534分別僅在包括張氏江蘺在內(nèi)的3個(gè)植物物種中被發(fā)現(xiàn),而MIR156家族則在包括張氏江蘺在內(nèi)的44個(gè)植物物種中被發(fā)現(xiàn)(圖2-B)。
A:gch-miRNA成熟體堿基的偏好性; B:gch-miRNA前體二級(jí)結(jié)構(gòu)圖
圖1張氏江蘺miRNA堿基偏好性及其前體二級(jí)結(jié)構(gòu)
Figure 1 Base bias of gch-miRNAs and structures of their precursors
表2 張氏江蘺miRNAs及其前體序列信息
A:4種miRNA在不同植物間的聯(lián)配; B:植物中4種miRNA基因家族成員數(shù)量
圖2不同植物間miRNA序列保守性與多態(tài)性分析
Figure 2 Conservation and diversity of miRNAs across different plant speices
2.3.1 植物miR534基因家族的NJ系統(tǒng)進(jìn)化樹(shù)
在張氏江蘺新預(yù)測(cè)miRNAs中,除miR5386和miR5658因發(fā)現(xiàn)物種太少(均少于3個(gè)),無(wú)法構(gòu)建基于NJ算法的系統(tǒng)進(jìn)化樹(shù)外,其余3種miRNA基因家族均可檢測(cè)完整的NJ系統(tǒng)進(jìn)化樹(shù)。由圖3-A可知,張氏江蘺miR534前體序列與水稻pre-miR534單獨(dú)成簇,作為水生和陸生植物的過(guò)渡物種——小立碗蘚的miR534基因家族的兩條前體序列聚為一簇,有較近的進(jìn)化距離。
2.3.2 植物miR399基因家族的NJ系統(tǒng)進(jìn)化樹(shù)
由圖3-B可知,124條植物pre-miR399s可聚為6個(gè)大組。多數(shù)高等植物miR399前體序列同源性較高,被聚在第1組(36條)和第2組(33條)。第3組(共22條)既包括水稻(1條)、玉米(2條)、小麥(1條)、高粱(3條)等大宗作物的pre-miR399s,也包括柑橘(2條)、二穗短柄草(1條)、丹參(1條)等其它植物。第4組以桃的pre-miR399為主(12條),另包括毛果楊、蒺藜苜蓿、蓖麻和蘋(píng)果中各一條miR399前體序列。第5與第6組均為小規(guī)模聚類(lèi)群,分別有10條和7條pre-miRN399s。第5組以歐洲云杉pre-miR399為主(5條),另包含玉米(1條)、水稻(1條)、甜瓜(2條)及高粱(1條)4種植物。第6組包含大豆(2條)、可可豆(1條)、棉花(2條)、歐洲云杉(1條)和張氏江蘺(1條),其中g(shù)ch-pre-miR399與pab-pre-miR399a一起同為該組的外類(lèi)群,表明它們與其它miR399前體的序列同源性較低。
A:基于NJ法的miR534基因家族系統(tǒng)進(jìn)化樹(shù); B:基于NJ法的miR399基因家族系統(tǒng)進(jìn)化樹(shù); C:基于NJ法的miR156基因家族系統(tǒng)進(jìn)化樹(shù)
圖3基于NJ法的植物部分miRNA基因家族系統(tǒng)進(jìn)化樹(shù)
Figure 3 Phylogenetic trees of some miRNA gene families in plants based on NJ
2.3.3 植物miR156基因家族的NJ系統(tǒng)進(jìn)化樹(shù)
由圖3-C可知,依據(jù)不同植物間miR156序列的同源性高低,141條植物miR156前體序列(含張氏江蘺)可聚為6個(gè)大組。第1組聚類(lèi)成員最多(74條),其次是第2組(48條)。其中,第1組以水稻(8條)、擬南芥(7條)、二穗短柄草(5條)、蘋(píng)果(5條)、玉米(5條)等高等植物為主。第2組包括26種不同的植物物種,但無(wú)任何一種占據(jù)明顯的數(shù)量?jī)?yōu)勢(shì),最多的為亞麻miR156前體(5條lus-pre-miR156s),其它miR156家族成員以1~3條居多。第3組僅有5條pre-miR156s,分屬玉米、高粱、向日葵、毛地黃和甜瓜,每種植物各一條pre-miR156。第4組包含高羊茅(2條)、二穗短柄草(1條)、紫球藻(1條)和溫泉紅藻(1條)。第5組包括張氏江蘺在內(nèi)的共5個(gè)物種,其中,gch-pre-miR156c、gma-pre-miR156c和mtr-pre-miR156a同源性較高,聚為一族;hci-pre-miR156a和ppu-pre-miR156d同源性較高,聚為另一簇。第6組miR156前體序列最少,僅有4條,分屬紫球藻、煙草、玉米和豇豆(每個(gè)物種各一條)。
由圖4-A可知,張氏江蘺總RNA的28S rRNA和18SrRNA條帶明顯,提取的總RNA較為完整。由圖4-B可知,驗(yàn)證的6條gch-miRNAs均呈陽(yáng)性,且大小在80~90 bp,表明本研究鑒定的gch-miRNA基本可信。由圖4-C可知,重復(fù)3次定量檢測(cè)后,6條gch-miRNA基因相對(duì)定量值(2-△△Ct)均>0.9,最高為gch-miR5386a(表達(dá)值3.07),最低為其基因家族的另一個(gè)成員gch-miR5386b(表達(dá)值0.82),兩者表達(dá)差異較大。因gch-miR5386a產(chǎn)生于前體序列5′端,而gch-miR5386b產(chǎn)生于前體3′端,我們推測(cè)gch-miR5386b可能是一條星狀miRNA,在前體序列加工為成熟體后,發(fā)生了部分降解。
經(jīng)過(guò)去冗余處理,共預(yù)測(cè)到8個(gè)潛在的gch-miRNA靶標(biāo)(表3)。除gch-miR534未預(yù)測(cè)到任何靶標(biāo)外,其余5條gch-miRNA均在gch-mRNA上預(yù)測(cè)到對(duì)應(yīng)的靶標(biāo)序列。其中,gch-miR156和gch-miR399分別預(yù)測(cè)到1條靶標(biāo),gch-miR5658,gch-miR5386a/b均預(yù)測(cè)到2條靶標(biāo)。經(jīng)注釋分析發(fā)現(xiàn),這些靶標(biāo)均為張氏江蘺EST的cDNA克隆序列,迄今尚未有研究發(fā)現(xiàn)其在張氏江蘺中對(duì)應(yīng)的目的基因及其功能。基于miRNA與其靶標(biāo)的互補(bǔ)配對(duì)情況(9~11位均無(wú)錯(cuò)配發(fā)生),我們預(yù)測(cè)其對(duì)靶基因的抑制類(lèi)型為切割抑制(表3)。
A:張氏江蘺總RNA的電泳檢測(cè); B:基于頸環(huán)引物RT-PCR的張氏江蘺miRNA檢測(cè); C:張氏江蘺miRNA的相對(duì)定量表達(dá)
圖4張氏江蘺miRNA的試驗(yàn)驗(yàn)證
Figure 4 Experimental validation of miRNAs inGracilariachangii
表3 張氏江蘺miRNA靶標(biāo)信息
對(duì)于基因組測(cè)序未完成且非編碼RNA研究較薄弱的物種,利用生物信息學(xué)技術(shù)預(yù)測(cè)其miRNA是一種較便捷的方法。本研究共預(yù)測(cè)到6條gch-miRNA且符合典型的植物miRNA特征。QRT-PCR驗(yàn)證結(jié)果均為陽(yáng)性,證實(shí)了鑒定結(jié)果基本可信。隨著高通量測(cè)序技術(shù)的完善及其價(jià)格的降低,運(yùn)用深度測(cè)序法從張氏江蘺獲取大量的miRNAs已不是難題,這也為其關(guān)鍵靶向基因后轉(zhuǎn)錄水平的表達(dá)調(diào)控,分子改良江蘺資源奠定了基礎(chǔ)。
鑒定的gch-miRNAs分屬5個(gè)MIRNA家族,其中,miR156和miR399在植物中屬保守MIRNA家族,在不同植物物種間保守性較高,進(jìn)化速率較一致。MiR534、miR5386和miR5658屬非保守MIRNA家族,進(jìn)化時(shí)間較保守MIRNA晚,成員數(shù)量少,且不同物種間存在序列的多態(tài)性(前體序列更明顯)。
考查gch-miRNA所屬基因家族在不同植物物種間的系統(tǒng)進(jìn)化地位很有必要。改進(jìn)的NJ算法,Kimura兩參數(shù)模型可體現(xiàn)核苷酸的突變規(guī)律,遺傳距離更為準(zhǔn)確,更適合核苷酸系統(tǒng)進(jìn)化樹(shù)構(gòu)建?;诖耍覀冞x取較保守的3個(gè)MIRNA家族進(jìn)行系統(tǒng)發(fā)生分析。3條張氏江蘺pre-miRNAs均位于NJ樹(shù)的外類(lèi)群,顯示了其不同的miRNA進(jìn)化速率及序列的差異性。MIR399和MIR156的NJ樹(shù)分支均為6組,且均以2個(gè)大的分支為主輔以若干小分支及外類(lèi)群。不同植物的miRNA系統(tǒng)進(jìn)化與宿主生物本身的進(jìn)化不同步,暗示了植物miRNA產(chǎn)生與進(jìn)化方式的復(fù)雜性與多樣性。
MiR156靶基因?yàn)镾PL家族,對(duì)擬南芥、玉米等植物的葉原基間距、開(kāi)花及器官發(fā)育起重要的調(diào)控作用。MiR399是控制植物磷代謝平衡的一種調(diào)控子,其靶基因多為缺磷響應(yīng)基因。MiR5386和miR5658因進(jìn)化時(shí)間較晚,其基因家族對(duì)應(yīng)的靶基因功能仍然未知。本研究雖然在張氏江蘺中鑒定到miRNA靶標(biāo)cDNA,但其完整的靶基因仍需通過(guò)降解組測(cè)序及RACE-PCR等方法獲得。對(duì)gch-miRNA靶基因進(jìn)行鑒定將有助于深入了解miRNA在江蘺生長(zhǎng)發(fā)育、生理調(diào)節(jié)、應(yīng)激反應(yīng)中的分子機(jī)制。