李夢(mèng)尋,黃 濤,馬力鵬,劉 乙,李 濤,公紅斌,邱梅玉,謝 蘇,孫曉梅
(石河子大學(xué)動(dòng)物科技學(xué)院,石河子 832000)
非編碼RNA(non-coding RNA, ncRNA)是指一大類(lèi)不編碼蛋白質(zhì),卻具有生物活性的RNA[1],這類(lèi)RNA曾一度被認(rèn)為是轉(zhuǎn)錄的“暗物質(zhì)”或“噪音”[2-3],但是隨著研究的不斷深入,越來(lái)越多的研究者證實(shí)了非編碼RNA在轉(zhuǎn)錄水平上發(fā)揮著廣泛的生物學(xué)作用[4]。非編碼RNA根據(jù)鏈的長(zhǎng)度可劃分為短鏈非編碼RNA和長(zhǎng)鏈非編碼RNA(lncRNA)。lncRNA是非編碼RNA中重要的組成部分,其長(zhǎng)度一般大于200 nt[5]。目前,根據(jù)lncRNA及其相關(guān)蛋白編碼基因之間的關(guān)系將其分為反義lncRNA(antisense lncRNA)、雙向lncRNA(bidirectional lncRNA)、內(nèi)含子lncRNA(intronic lncRNA)、正義重疊區(qū)lncRNA(sense overlapping lncRNA)和基因間隔區(qū)(lincRNA)與加工轉(zhuǎn)錄本[6-8];根據(jù)功能,lncRNA可分為信號(hào)因子、引導(dǎo)因子、誘餌因子和支架因子[9]。不同類(lèi)型的lncRNAs具有不同的作用。目前l(fā)ncRNA在動(dòng)物繁殖方面的生物學(xué)研究較少。lncRNA在動(dòng)物早期生殖細(xì)胞形成、早期胚胎的著床和發(fā)育以及有關(guān)激素調(diào)節(jié)中扮演著必不可少的角色[10]。科學(xué)家們通過(guò)RNA-Seq對(duì)人、小鼠、牛等受精卵與受精前的配子、不同發(fā)育階段的早期胚胎間的比較,發(fā)現(xiàn)大量與不同胚胎發(fā)育時(shí)期相關(guān)的lncRNAs[11-12],如Meg3與JARID2基因互作從而招募PRC2以反式作用抑制胚胎發(fā)育相關(guān)基因表達(dá)[13]。Chen等[14]在小鼠胚胎發(fā)育不同階段的卵巢中發(fā)現(xiàn)了24個(gè)lncRNA差異表達(dá),在相同胎齡的雌雄生殖器官中發(fā)現(xiàn)147個(gè)lncRNA差異表達(dá),在卵巢中表達(dá)最高的oncRNA3是泛酸激酶1。Roeszler等[15]研究發(fā)現(xiàn),在母雞沉默lnc-MHM會(huì)造成卵巢不對(duì)稱發(fā)育。Brown等[16]在對(duì)果蠅和小鼠卵巢lncRNA研究中發(fā)現(xiàn)了大量與啟動(dòng)子相關(guān)的反義lncRNAs,這些lncRNAs可能調(diào)控其同源基因的轉(zhuǎn)錄激活。Macaulay等[17]利用共聚焦透射電子顯微鏡和RNA-Seq發(fā)現(xiàn),牛卵母細(xì)胞周?chē)穆亚鸺?xì)胞為成年母牛的卵母細(xì)胞運(yùn)輸大量的營(yíng)養(yǎng)和物質(zhì),包括mRNA和lncRNA,由于卵母細(xì)胞及其周?chē)?xì)胞細(xì)胞質(zhì)間的信息傳遞和物質(zhì)運(yùn)輸方式有限,差異表達(dá)的lncRNA可能對(duì)卵子的發(fā)生具有重要作用。
目前在豬卵泡發(fā)育上,對(duì)于基因表達(dá)調(diào)控的研究主要集中在蛋白質(zhì)編碼基因上,而對(duì)參與豬卵泡發(fā)育的非編碼RNA的研究相對(duì)較少,這遺漏了大量的遺傳信息。本課題組前期通過(guò)高通量測(cè)序技術(shù)獲得了梅山和杜洛克豬中等卵泡lncRNA 3 554個(gè),其中已注釋的為1 997個(gè),未注釋的為1 557個(gè)[18]。lncRNA-ENSSSCT00000018610是從梅山豬和杜洛克豬中等卵泡差異lncRNA數(shù)據(jù)庫(kù)中獲得的已注釋長(zhǎng)鏈非編碼RNA。
為了對(duì)lncRNA-ENSSSCT00000018610進(jìn)行深入的研究,本試驗(yàn)采用3′和5′ Rapid Amplification of cDNA Ends (RACE)技術(shù)擴(kuò)增得到其全長(zhǎng)序列,利用Real-time PCR對(duì)其進(jìn)行組織表達(dá)譜分析,并對(duì)其在梅山豬和杜洛克豬的各級(jí)卵泡中的相對(duì)表達(dá)量進(jìn)行檢測(cè),揭示了其在兩個(gè)豬種不同組織和各級(jí)卵泡中的表達(dá)規(guī)律,有助于探究該lncRNA在卵泡發(fā)育過(guò)程中的作用機(jī)理,為深入研究豬種間排卵數(shù)差異的分子機(jī)理提供了科學(xué)依據(jù)。
試驗(yàn)選取同一胎次、發(fā)情正常、繁殖表現(xiàn)符合品種特征的梅山和杜洛克成年母豬各3頭,相同條件下飼喂,每天對(duì)其發(fā)情狀況進(jìn)行觀測(cè),以發(fā)情出現(xiàn)靜立反應(yīng)時(shí)記做發(fā)情周期第0天,發(fā)情周期第14天沿耳緣靜脈注射獸用氯前列烯醇注射液1支·頭-1,注射后第4天屠宰,取不同級(jí)別卵泡(按直徑分類(lèi),S卵泡:1.0~3.0 mm;M1卵泡:3.1~5.0 mm;M2卵泡:5.1~7.0 mm;L卵泡:7.0 mm以上)于液氮中凍存,同時(shí)取卵巢、下丘腦、心、肝、脾、肺、腎、小腸、肌肉、子宮、垂體、黃體、輸卵管,用錫紙包裹,液氮速凍后于-80 ℃保存?zhèn)溆谩?/p>
主要試劑:TRIzol試劑(Invitrogen,Carlsbad,CA,USA);反轉(zhuǎn)錄試劑盒PrimerScriptTM RT regagent Kit(TaKaRa);LightCycler 480 SYBR Green、八連管(Roche);SMARTer?RACE cDNA Amplification Kit、SeqAmp DNA Polymerse、NucleoSpin Gel and PCR Clean-Up Kit、In-Fusion HD Cloning Kit、Stellar Competent Cells(Clontech);DNA Maker、西班牙進(jìn)口Agarose瓊脂糖、營(yíng)養(yǎng)瓊脂、胰蛋白胨、酵母提取物(北京天根)等。
主要儀器:超低溫冰箱(-80 ℃)、恒溫水浴鍋、高壓滅菌鍋、移液槍、PCR儀、超凈工作臺(tái)、NanoDrop 2000、LightCycler 480實(shí)時(shí)熒光定量PCR儀、分析天平、高速離心機(jī)、電熱恒溫培養(yǎng)箱、水平電泳槽、電泳儀;GelDoc X R型凝膠成像系統(tǒng)等。
根據(jù)lncRNA-ENSSSCT00000018610在Ensembl上注釋的序列信息,采用Phast Cons Score工具對(duì)lncRNA進(jìn)行保守性評(píng)估,并用Coding-Potential Assessment Tool(CAPT)[19]對(duì)lncRNA-ENSSSCT00000018610編碼能力進(jìn)行預(yù)測(cè)。
根據(jù)lncRNA-ENSSSCT00000018610部分已知核苷酸序列,用Primer Primer 5.0軟件設(shè)計(jì)引物,分別用于實(shí)時(shí)熒光定量PCR、5′和3′ RACE PCR擴(kuò)增,用于RACE克隆的特異性引物在5′末端添加15 bp序列“GATTACGCCAAGCTT”用于后續(xù)試驗(yàn)的連接測(cè)序,所有試驗(yàn)所需引物見(jiàn)表1,引物序列由新疆烏魯木齊市昆泰銳公司合成。
表1lncRNA-ENSSSCT00000018610及內(nèi)參引物序列
Table1TheprimersforlncRNA-ENSSSCT00000018610andinternalreferencegene
基因名稱Gene name引物序列(5'→3')Primer sequence產(chǎn)物長(zhǎng)度/bpProduct lengthGAPDHF:TTCCAGTATGATTCCACCCACGR:TCGGCAGAAGGGGCAGAGAT242lncRNA-ENSSSCT00000018610F:TGTGTCTGTACTGCTGTGCTTR:AACTGGTTTTTTCCTTTGGG235RACE克隆通用引物RACE cloning universal primerLong:TAATACGACTCACTATAGGGCAA-GCAGTGGTATCAACGCAGAGT5'RACE特異性引物5' RACE specific primerGSP:GATTACGCCAAGCTTT-CACACACACCTGTAGGCACGCA3'RACE特異性引物3' RACE specific primerGSP:GATTACGCCAAGCTTCAGGAAG-AGTTTGAACCCTTTGGC
表中5′ RACE和3′ RACE基因特異性引物中的下劃線序列為添加的序列,用于后續(xù)產(chǎn)物與pUC 19線性載體連接測(cè)序;無(wú)下劃線序列為基因引物
The sequences with underline in the 5′ RACE and 3′ RACE gene-specific primers are added sequences that are sequenced with subsequent products and pUC 19 linearized vectors; the sequences without underline are primers for genes
取兩品種豬的各級(jí)卵泡和不同組織100 mg于液氮中研磨,TRIzol法分別提取樣本總RNA,用2%瓊脂糖凝膠電泳和NanoDrop 2000驗(yàn)證總RNA的完整性、濃度及純度。-80 ℃保存?zhèn)溆?。?shí)時(shí)熒光定量PCR所用cDNA的合成分別按照TaKaRa反轉(zhuǎn)錄試劑盒說(shuō)明書(shū)進(jìn)行操作,5′和3′ RACE PCR擴(kuò)增參照SMARTer?RACE cDNA第一鏈合成說(shuō)明書(shū)進(jìn)行操作,獲得的cDNA置于-20 ℃保存?zhèn)溆谩?/p>
5′ RACE PCR反應(yīng):試驗(yàn)以5′卵泡cDNA為模板,Long和5′ GSP分別為上、下游引物,采用Touch Down PCR對(duì)lncRNA-ENSSSCT00000018610進(jìn)行5′序列擴(kuò)增。反應(yīng)體系:5′RACE Ready cDNA 2.5 μL,10×UPM(Long) 5 μL,5′GSP 1 μL,PCR Grade H2O 15.5 μL,2×SeqAmp Buffer 25 μL,SeqAmp DNA Polymerse 1 μL。反應(yīng)條件:95 ℃ 5 min;(95 ℃ 30 s,72 ℃ 3 min)5個(gè)循環(huán);(95 ℃ 30 s,70 ℃ 30 s,72 ℃ 3 min)10個(gè)循環(huán);(95 ℃ 30 s,62 ℃ 30 s,72 ℃ 3 min)20個(gè)循環(huán)。1.2%瓊脂糖凝膠電泳檢測(cè),將出現(xiàn)的明顯條帶膠回收,并連接pUC 19 Linearized Vector轉(zhuǎn)化并進(jìn)行菌液測(cè)序。
3′ RACE PCR反應(yīng):試驗(yàn)以3′卵泡cDNA為模板,Long和3′GSP分別為上、下游引物,采用Touch Down PCR對(duì)lncRNA-ENSSSCT00000018610進(jìn)行3′序列擴(kuò)增。反應(yīng)體系:3′ RACE Ready cDNA 2.5 μL,10×UPM (Long)5 μL,3′GSP 1 μL,PCR Grade H2O 15.5 μL,2×SeqAmp Buffer 25 μL,SeqAmp DNA Polymerse 1 μL。反應(yīng)條件:95 ℃ 5 min;(95 ℃ 30 s,72 ℃ 3 min)5個(gè)循環(huán);(95 ℃ 30 s,70 ℃ 30 s,72 ℃ 3 min)15個(gè)循環(huán);(95 ℃ 30 s,62 ℃ 30 s,72 ℃ 3 min)25個(gè)循環(huán)。1.2%瓊脂糖凝膠電泳檢測(cè),將出現(xiàn)的明顯條帶膠回收,并連接pUC 19 Linearized Vector轉(zhuǎn)化并進(jìn)行菌液測(cè)序。
試驗(yàn)以各組織與卵泡cDNA為模板,GAPDH為內(nèi)參,對(duì)lncRNA-ENSSSCT00000018610進(jìn)行實(shí)時(shí)熒光定量PCR檢測(cè)以分析其在豬不同組織中的表達(dá)情況。反應(yīng)體系:SYBR?Green I PCR Mix 10 μL,上、下游引物各1 μL,cDNA模板2 μL,加ddH2O至20 μL。反應(yīng)條件:95 ℃預(yù)變性5 min;95 ℃ 變性20 s,56 ℃退火30 s,72 ℃延伸30 s。
試驗(yàn)通過(guò)cis(co-location)和trans(co-expression)兩種方式對(duì)lncRNA-ENSSSCT00000018610靶基因進(jìn)行預(yù)測(cè)。搜索lncRNA上游和下游100 kb內(nèi)的編碼基因作為順式作用;反式作用是指通過(guò)表達(dá)水平鑒定彼此,并選擇具有Pearson相關(guān)系數(shù)|r|>0.95的結(jié)果[20-21]。
以2-△△ Ct法[22]計(jì)算lncRNA-ENSSSCT00000018610在各組織及梅山豬和杜洛克豬各級(jí)卵泡中的相對(duì)表達(dá)量,用SPSS17.0軟件中One-Way ANOVA方法分析比較其在兩豬種內(nèi)不同級(jí)別卵泡及品種間同級(jí)別卵泡表達(dá)水平的差異。
lncRNA-ENSSSCT00000018610位于豬基因組16號(hào)染色體,具有5個(gè)外顯子,但均不具有編碼潛能,對(duì)其保守性進(jìn)行總體評(píng)估,保守性評(píng)分=0(表2),符合lncRNA具有不保守性特征。此外,利用Coding-Potential Assessment Tool(CAPT)法對(duì)lncRNA-ENSSSCT00000018610編碼能力進(jìn)行預(yù)測(cè),結(jié)果表明,lncRNA-ENSSSCT00000018610的編碼能力預(yù)測(cè)結(jié)果為0.159 346 863,該數(shù)據(jù)比已使用的人lncRNA編碼能力閾值0.364[23]要小,這進(jìn)一步說(shuō)明lncRNA-ENSSSCT00000018610不具有編碼蛋白的潛能。
表2lncRNA-ENSSSCT00000018610序列保守性評(píng)估
Table2ConservativeevaluationoflncRNA-ENSSSCT00000018610sequence
轉(zhuǎn)錄本編號(hào)Transcript_ID區(qū)域Region染色體號(hào)Chromosome起始位置/bpStart position結(jié)尾位置/bpEnd position保守性評(píng)分PhastCons scoreENSSSCT00000018610 Promoterchr1678 280 29478 282 2930ENSSSCT00000018610 Exonchr1678 282 29478 282 4450ENSSSCT00000018610 Intronchr1678 282 44678 287 1360ENSSSCT00000018610 Exonchr1678 287 13778 287 2900ENSSSCT00000018610 Intronchr1678 287 29178 288 7870ENSSSCT00000018610 Exonchr1678 288 78878 288 9050ENSSSCT00000018610 Intronchr1678 288 90678 289 3520ENSSSCT00000018610 Exonchr1678 289 35378 289 4520ENSSSCT00000018610 Intronchr1678 289 45378 289 8580ENSSSCT00000018610 Exonchr1678 289 85978 290 9160
5′ RACE獲得一條長(zhǎng)度約為1 000 bp的明亮條帶(圖1A),3′ RACE獲得一條長(zhǎng)度超過(guò)1 000 bp的明亮條帶(圖1B),克隆測(cè)序分別獲得長(zhǎng)度為1 027、1 343 bp的序列。
5′ RACE得到的1 027 bp序列中有940 bp與已知序列相同,獲得5′ 端未知序列74 bp。3′ RACE得到的1 343 bp左右序列中有1 269 bp與已知序列相同,且3′末端有明顯的Poly A尾巴,獲得3′端75 bp的未知序列。通過(guò)5′和3′ RACE擴(kuò)增結(jié)果拼接,總共獲得lncRNA-ENSSSCT00000018610的全長(zhǎng)序列1 731 bp(圖2)。
試驗(yàn)采用RT-PCR技術(shù)對(duì)lncRNA-ENSSSCT00000018610在豬不同組織中的表達(dá)情況作了分析,結(jié)果表明,其在下丘腦、垂體、心、肝、脾、肺、腎、小腸、肌肉、子宮、輸卵管、黃體、卵巢中均有不同程度的表達(dá)(圖3)。
M. DNA相對(duì)分子質(zhì)量標(biāo)準(zhǔn);5′. 5′ RACE PCR電泳條帶; 3′. 3′ RACE PCR電泳條帶M. Marker 10000; 5′. 5′ RACE PCR electrophoresis band; 3′. 3′ RACE PCR electrophoresis band圖1 lncRNA-ENSSSCT00000018610 5′-RACE(A)和3′-RACE(B)擴(kuò)增結(jié)果電泳產(chǎn)物圖Fig.1 The electrophoresis of PCR products of 5′-RACE(A)and 3′-RACE (B) of lncRNA-ENSSSCT00000018610
圖中第一行藍(lán)色大寫(xiě)字母序列為lncRNA-ENSSSCT00000018610的高通量測(cè)序結(jié)果文件序列,第二行兩端綠色大寫(xiě)字母序列分別為5′ 和3′ RACE末端克隆獲得序列,中間為5′與3′ RACE拼接序列。第三行小寫(xiě)字母序列為RACE克隆得到的lncRNA-ENSSSCT00000018610 cDNA序列The first row of blue capital letters in the figure is the lncRNA-ENSSSCT00000018610 high-throughput sequencing result file sequence. The second row of green capital letters are the sequence of the 5′ and 3′ RACE clones, and the middle is 5′ and 3′ RACE splicing sequence. The third row of lowercase letters sequence is the lncRNA-ENSSSCT00000018610 cDNA sequence cloned from RACE圖2 5′與3′ RACE測(cè)序序列比對(duì)與拼接結(jié)果Fig.2 The result of 5′ and 3′ RACE sequence comparison and splicing
圖3 lncRNA-ENSSSCT00000018610在豬不同組織中的表達(dá)情況Fig.3 Tissues expression profile of lncRNA-ENSSSCT00000018610 in pigs
試驗(yàn)采用RT-PCR技術(shù)檢測(cè)了梅山與杜洛克豬不同級(jí)別卵泡中l(wèi)ncRNA-ENSSSCT0000-0018610的表達(dá)情況(圖4)。結(jié)果表明,lncRNA-ENSSSCT00000018610在梅山豬M2卵泡中的表達(dá)量高于S、M1、L卵泡(P<0.05),在杜洛克豬M1、M2卵泡中的表達(dá)量極顯著高于S和L卵泡(P<0.01),提示該lncRNA可能與卵泡發(fā)育有關(guān)。在杜洛克豬S、L卵泡中的表達(dá)量分別顯著高于在梅山豬S、L卵泡中的表達(dá)量(P<0.05),在杜洛克豬的M1、M2卵泡中的表達(dá)量分別極顯著高于在梅山豬的M1、M2卵泡中的表達(dá)量(P<0.01)。
本研究通過(guò)構(gòu)建蛋白編碼基因的位置關(guān)系(co-location),以及與蛋白編碼基因表達(dá)相關(guān)性(co-expression)預(yù)測(cè)得到lncRNA-ENSSSCT00000018610有多個(gè)潛在靶基因(表3)。
同一品種不同級(jí)別卵泡間,**表示差異極顯著(P<0.01);*表示差異顯著(P<0.05)。不同品種同級(jí)卵泡間,肩標(biāo)大寫(xiě)字母不同表示差異極顯著(P<0.01);肩標(biāo)小寫(xiě)字母不同表示差異顯著(P<0.05)Among the different follicles in the same breed, ** mean extremely significant difference(P<0.01);* mean significant difference(P<0.05). In the same follicles of different breeds, the different capital letters mean extremely significant difference(P<0.01); the different small letters mean significant difference(P<0.05)圖4 lncRNA-ENSSSCT00000018610在梅山和杜洛克母豬各級(jí)卵泡中的相對(duì)表達(dá)量Fig.4 The relative expression of lncRNA-ENSSSCT00000018610 in follicles at different stages of Meishan and Duroc sows
表3lncRNA-ENSSSCT00000018610靶基因預(yù)測(cè)
Table3lncRNA-ENSSSCT00000018610targetgenesprediction
lncRNA名稱lncRNA name靶基因預(yù)測(cè)方法Target gene prediction method靶基因名稱Target gene name信號(hào)通路Signal pathwayENSSSCT00000018610co-locationTNIP1NF-κB signaling pathwayENSSSCT00000018610co-expressionCOL11A2PI3K-Akt signaling pathwayENSSSCT00000018610co-expressionPCK1PI3K-Akt signaling pathwayENSSSCT00000018610co-expressionIBSPPI3K-Akt signaling pathwayENSSSCT00000018610co-expressionSCARB1Ovarian steroidogenesisENSSSCT00000018610co-expressionHSD3B1Ovarian steroidogenesisENSSSCT00000018610co-expressionHSD17B2Ovarian steroidogenesisENSSSCT00000018610co-expressionHSD17B7Ovarian steroidogenesisENSSSCT00000018610co-expressionCYP2J2Ovarian steroidogenesis
TNIP1是通過(guò)lncRNA-ENSSSCT00000018610位置關(guān)系(co-location)預(yù)測(cè)得到的潛在靶基因,KEGG富集分析發(fā)現(xiàn),TNIP1被富集在NF-κB信號(hào)通路上,GO分析發(fā)現(xiàn)其參與19種生物學(xué)過(guò)程;CYP2J2、SCARB1、IBSP等基因是通過(guò)lncRNA-ENSSSCT00000018610表達(dá)相關(guān)性(co-expression)預(yù)測(cè)得到的潛在靶基因,它們分別被富集在卵巢類(lèi)固醇激素通路和PI3K-Akt信號(hào)通路,參與豬卵巢類(lèi)固醇激素合成、細(xì)胞生長(zhǎng)分化以及卵泡發(fā)育等生物學(xué)過(guò)程。這提示,lncRNA-ENSSSCT00000018610可能通過(guò)對(duì)其靶基因的調(diào)控間接參與豬卵泡發(fā)育。
lncRNA在各類(lèi)生命活動(dòng)中發(fā)揮著重要的調(diào)節(jié)作用,受到了更多科學(xué)家的關(guān)注。目前l(fā)ncRNA的研究多停留在芯片檢測(cè)和高通量測(cè)序?qū)用嫔?,?duì)其機(jī)理的探究更是局限于人類(lèi)的疾病、免疫及模式生物上,而在重要的經(jīng)濟(jì)動(dòng)物生長(zhǎng)發(fā)育及繁殖上,lncRNA的研究相對(duì)滯后,仍然處于摸索階段。
隨著基因芯片和測(cè)序技術(shù)的不斷發(fā)展,對(duì)lncRNA的獲取和鑒定方法也在不斷更新,不同的研究者提出了不同的研究方法和鑒定流程,主要是高通量測(cè)序技術(shù)和基于lncRNA特征的計(jì)算機(jī)預(yù)測(cè)鑒定。高通量測(cè)序技術(shù)被廣泛應(yīng)用于非編碼RNA研究,lncRNA測(cè)序能夠通過(guò)rRNA去除法對(duì)含有和不含有PolyA尾巴的RNA一同富集建庫(kù)測(cè)序,使得數(shù)據(jù)不浪費(fèi),從而能夠鑒定到更多的lncRNA[23-24],這也使得lncRNA測(cè)序在更多的研究中應(yīng)用?;趌ncRNA特征的計(jì)算機(jī)預(yù)測(cè)包括CPAT、CPC、PhyloCSF等軟件[25]。CPAT能從大量的候選轉(zhuǎn)錄物中迅速確認(rèn)出編碼和非編碼記錄,它用了一種全新的序列匹配的方法。CPAT預(yù)測(cè)方法采用邏輯回歸模型,使用4種序列特征:ORF長(zhǎng)度、覆蓋率特征、Fickett Score和六聚體偏好性特征[11]。就軟件的預(yù)測(cè)性能而言,CPAT (敏感性 0.96,異性:0.97)精度更優(yōu)于CPC (敏感性 0.99,異性:0.74)、PhyloCSF (敏感性 0.90,異性:0.63)[26]等方法,此外CPAT運(yùn)算速度比其他軟件快大約4個(gè)數(shù)量級(jí)[27]。因此這個(gè)運(yùn)算速度快、方便且精度高的編碼能力預(yù)測(cè)軟件被研究者所認(rèn)可。本試驗(yàn)所用的lncRNA是通過(guò)高通量測(cè)序技術(shù)結(jié)合計(jì)算機(jī)軟件分析獲得的,高通量測(cè)序結(jié)果顯示,lncRNA-ENSSSCT00000018610在梅山和杜洛克豬中等卵泡中的表達(dá)差異極顯著,加之使用CPAT對(duì)其進(jìn)行編碼能力預(yù)測(cè),結(jié)果顯示其編碼能力分值為0.159,比已使用的人長(zhǎng)鏈非編碼RNA篩選閾值0.364[28]小。lncRNA-ENSSSCT00000018610含有一個(gè)長(zhǎng)度為360 nt的ORF,編碼120個(gè)氨基酸,而許多研究比較深入的lncRNA,如HOTAIR家族和H19都存在長(zhǎng)度大于100 aa的ORF[29],這些ORF極有可能不翻譯或翻譯效率很低,也可能翻譯出來(lái)的蛋白質(zhì)會(huì)被快速的降解。所以盡管lncRNA-ENSSSCT00000018610的ORF >100 aa,其也不具有編碼能力或者編碼能力很弱。當(dāng)然,也有一些RNA在最初的研究中被鑒定為lncRNA,但隨著研究的不斷深入,發(fā)現(xiàn)其也有編碼能力[30],這些都需要更進(jìn)一步驗(yàn)證。
RACE(rapid amplification of cDNA ends)是一種快速克隆cDNA末端的技術(shù),此方法被廣泛應(yīng)用于未知堿基序列基因的克隆。該方法基于PCR技術(shù),步驟少、耗時(shí)短,只需知道RNA內(nèi)部很短的一小段cDNA序列就能快速克隆出基因的未知序列。RACE技術(shù)包括3′和5′末端序列擴(kuò)增,完整且純度高的總RNA和高質(zhì)量3′和5′RACE ready cDNA是RACE成功的基礎(chǔ),而根據(jù)已知核酸序列設(shè)計(jì)出的優(yōu)良特異性引物是RACE成功的決定性因素。本試驗(yàn)通過(guò)RACE技術(shù)成功克隆出了lncRNA-ENSSSCT00000018610全長(zhǎng)為1 731 bp的cDNA。這為進(jìn)一步研究lncRNA-ENSSSCT00000018610的生物學(xué)功能奠定了基礎(chǔ)。
本研究通過(guò)在杜洛克豬不同組織中對(duì)lncRNA-ENSSSCT00000018610進(jìn)行的熒光定量PCR發(fā)現(xiàn),這個(gè)lncRNA在杜洛克豬各組織中廣泛表達(dá)且范圍波動(dòng)較大,說(shuō)明它具有組織表達(dá)特異性,其在子宮和卵巢中的較高表達(dá)可能提示,lncRNA-ENSSSCT00000018610可能參與母豬生殖活動(dòng)過(guò)程。在梅山豬和杜洛克豬不同級(jí)別卵泡中的定量PCR顯示,lncRNA-ENSSSCT00000018610在梅山豬中等卵泡M1、M2中的表達(dá)量均極顯著低于杜洛克豬的M1和M2卵泡,與高通量測(cè)序結(jié)果一致,這說(shuō)明了高通量測(cè)序具有一定的準(zhǔn)確性。
此外,本研究通過(guò)構(gòu)建lncRNA與蛋白編碼基因的位置關(guān)系(co-location)預(yù)測(cè)得到其潛在靶基因TNIP1(又名ABIN-1),可通過(guò)結(jié)合A20調(diào)節(jié)對(duì)NF-κB信號(hào)的抑制作用,與細(xì)胞的生長(zhǎng)分化以及動(dòng)物胚胎發(fā)育相關(guān)[31],并且是一個(gè)影響長(zhǎng)白豬產(chǎn)仔性狀的候選基因[32];lncRNA與蛋白編碼基因表達(dá)相關(guān)性(co-expression)預(yù)測(cè)得到其潛在靶基因CYP2J2、SCARB1、HSD3B1、HSD17B2、HSD17B7參與卵巢類(lèi)固醇激素合成信號(hào)傳導(dǎo),參與卵泡發(fā)育及排卵過(guò)程,COL11A2、FGFR1、IBSP參與PI3K-Akt信號(hào)通路,而PI3K-Akt通路在哺乳動(dòng)物卵泡發(fā)生和排卵的過(guò)程中起著關(guān)鍵的調(diào)控作用[33-34]。因此,lncRNA-ENSSSCT00000018610可能通過(guò)對(duì)其靶基因的調(diào)控作用間接參與卵泡發(fā)育過(guò)程,但lncRNA-ENSSSCT00000018610與預(yù)測(cè)得到的蛋白質(zhì)編碼基因之間的靶向關(guān)系仍需進(jìn)一步驗(yàn)證。
lncRNA-ENSSSCT00000018610是一個(gè)不具編碼潛能的非編碼RNA,RACE克隆獲得其全長(zhǎng)序列1 731 bp。lncRNA-ENSSSCT00000018610在豬腎、子宮、卵巢中表達(dá)水平相對(duì)較高。lncRNA-ENSSSCT00000018610在梅山豬M2卵泡中的表達(dá)量顯著高于S、M1、L卵泡,在杜洛克豬M1、M2卵泡中的表達(dá)量極顯著高于S和L卵泡,在杜洛克豬S、L卵泡中的表達(dá)量分別顯著高于梅山豬,在杜洛克豬M1、M2卵泡中的表達(dá)量分別極顯著高于梅山豬。靶基因預(yù)測(cè)結(jié)果說(shuō)明,lncRNA-ENSSSCT00000018610可能通過(guò)對(duì)其靶基因的調(diào)控作用間接參與卵泡發(fā)育過(guò)程。該試驗(yàn)對(duì)lncRNA-ENSSSCT00000018610的研究為進(jìn)一步揭示其在豬卵泡發(fā)育中的作用機(jī)制提供了重要參考依據(jù)。