国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

桑品種桂桑優(yōu)12的轉錄組生物信息學分析*

2021-10-08 05:30:14張朝華
蠶學通訊 2021年3期
關鍵詞:文庫桑樹基因組

張朝華 王 霞

(廣西壯族自治區(qū)蠶業(yè)技術推廣站,南寧 530007)

桑樹(MorusL.)作為養(yǎng)蠶業(yè)的飼料樹種具有重要的經(jīng)濟價值,近10多年桑樹的生態(tài)價值、藥食用價值、畜禽用飼料價值等被逐漸發(fā)掘利用[1],因而桑樹已受到農(nóng)林業(yè)、畜牧業(yè)及醫(yī)療保健行業(yè)的關注。然而,目前桑樹的基礎研究還相對滯后,例如桑樹對不良環(huán)境的適應能力、桑樹含有的許多活性物質及藥用功效等,雖然都有一定的試驗證據(jù)支持,但還不能從分子水平解析其產(chǎn)生、形成機制。利用基因組、轉錄組及蛋白質組學等組學技術探討植物的生理活動規(guī)律及生物代謝的機制[2],成為當下的研究熱點。自2013年西南大學何寧佳的研究團隊完成了川桑(Morusnotabilis)的基因組測序工作[3]之后,桑樹功能基因組的研究也取得了重要進展[4-6]。轉錄組學是由Velculescu等[7]在1997年提出,了解轉錄組對于分析基因表達和鑒定未知基因,揭示細胞與組織的分子成分以及理解生長發(fā)育和抗性形成等是必不可少的,目前轉錄組學已應用于多種植物的研究[8-10]。我們擬對桑樹品種桂桑優(yōu)12的根部總RNA進行轉錄組測序,利用生物信息學軟件對測序數(shù)據(jù)進行拼接組裝分析,對unigene進行功能分類注釋等,希望能夠為桑樹重要性狀基因的發(fā)掘及功能分析,為桑樹遺傳圖譜構建以及分子育種積累一定的基礎數(shù)據(jù)。

1 材料與方法

1.1 桑樹材料

桂桑優(yōu)12為廣西蠶業(yè)技術推廣站育成的桑樹品種,以該品種的3年生植株根部材料供試。

1.2 總RNA提取及檢測

按照天根植物總RNA提取試劑盒DP432的說明書操作提取桑樹根尖總RNA,經(jīng)1%瓊脂糖凝膠電泳檢測RNA提取質量。電壓180 V電壓,電泳16 min,Agilent 2100檢測RNA的完整性(RIN值≥6.6)。

1.3 轉錄組測序及測序組裝

總RNA樣品檢測合格后,轉錄組測序由北京諾禾致源科技股份有限公司完成。

cDNA文庫的構建:用帶有Oligo(dT)的磁珠富集mRNA,隨后加入fragmentation buffer將mRNA打斷成短片段,以mRNA為模板;用六堿基隨機引物(random hexamers)合成第1鏈cDNA,然后加入緩沖液、 dNTPs和DNA polymeraseⅠ和RNase H合成第2鏈cDNA,再用AMPure XP beads純化雙鏈cDNA;純化的雙鏈cDNA先進行末端修復、加A尾并連接測序接頭,再用AMPure XP beads進行片段大小選擇;最后進行PCR擴增,并用AMPure XP beads純化PCR產(chǎn)物,得到最終的文庫。

文庫構建完成后,先使用Qubit2.0進行初步定量,稀釋文庫至1.5 ng/μL,隨后使用Agilent 2100對文庫的insert size進行檢測,insert size符合預期后,使用Q-PCR方法對文庫的有效濃度進行準確定量(文庫有效濃度>2 nmol/L)。文庫檢驗合格后,把不同文庫按照有效濃度及目標下機數(shù)據(jù)量的需求pooling后進行Illumina HiSeq測序。

1.4 測序數(shù)據(jù)信息分析

將測序獲得的轉錄組原始數(shù)據(jù)進行轉錄本拼接,拼接后用Corset程序進行聚類,以聚類后的序列進入各大功能數(shù)據(jù)庫比對,進行功能注釋,包括GO注釋、KEGG注釋和COG注釋。

2 結果與分析

2.1 轉錄組測序及組裝結果分析

對桂桑優(yōu)12根尖組織的轉錄組測序后共獲得50 844 314條原始測序數(shù)據(jù)(Raw data),原始測序數(shù)據(jù)經(jīng)過濾后得到Clean data 50 540 436條。對Clean reads進行從頭組裝和序列去冗余后共獲得了102 254個轉錄本,轉錄本的總長度、平均長度和N50值分別為64 665 080 bp,771 bp和1 473 bp。轉錄本的長度分布情況見圖1。

圖1 桂桑優(yōu)12根尖組織轉錄本的長度分布

通過將轉錄本比對到NR,NT,SwissProt,COG,GO,KEGG,PFAM,InterPro等8大功能數(shù)據(jù)庫, 對轉錄組測定的序列進行功能注釋, 其中有86 332個轉錄本獲得了注釋結果。同時,在本項目中總共預測出68 218個編碼序列(Coding DNA sequence,CDS),其中通過注釋結果檢測出57 348個CDS,使用ESTScan預測出10 870個CDS。此外,還在27 068個轉錄本中檢測到41 882個簡單重復序列(Simple sequence repeat,SSR)。

2.2 轉錄本功能注釋

2.2.1 KEGG功能注釋

KEGG是一個生物信息學的系統(tǒng)數(shù)據(jù)庫,其將基因組和系統(tǒng)功能信息等整合在一起,通過將基因在基因組或轉錄組的含量映射到KEGG數(shù)據(jù)庫的代謝通路的過程,將基因組與有機體的系統(tǒng)行為連接起來[11]。本次對桂桑優(yōu)12根尖組織的轉錄組分析中:有2 143個unigene被歸到運輸和分解代謝途徑,599個unigene被歸到膜輸送途徑,1 020個unigene被歸到信號傳導途徑,3 354個unigene被歸到折疊分類降解途徑等(圖2)。

圖2 桂桑優(yōu)12根尖組織轉錄組序列的KEGG途徑分布

2.2.2 COG功能注釋

蛋白質直系同源簇(COGs)是通過對某些真核及原核生物等完整基因組編碼蛋白質,根據(jù)生物系統(tǒng)的進化分類關系而構建的,可應用于預測單個蛋白質或整個新基因組中蛋白質的功能[12]?;贑OG數(shù)據(jù)庫可以對蛋白質進行系統(tǒng)進化分類的功能,將獲得的桂桑優(yōu)12根尖組織的轉錄組序列比對到COG數(shù)據(jù)庫,可將這些序列分為25類(圖3)。其中,有5 087個序列歸為蛋白質功能預測類,有4 104個序列被歸為翻譯、核糖體結構及生物發(fā)生一類,有2 690個序列被歸為翻譯后修飾、蛋白質折疊及分子伴侶類。

圖3 桂桑優(yōu)12根尖組織轉錄組序列的COG功能注釋分布

2.2.3 GO功能注釋

GO(Gene Ontology, http://www.geneontology.org)數(shù)據(jù)庫將所有與基因有關的研究結果進行分類匯總,形成標準化的基因和基因產(chǎn)物的生物學術語,該數(shù)據(jù)庫對基因和蛋白質功能進行統(tǒng)一的界定和描述。GO數(shù)據(jù)庫從3個方面,即組建細胞成分功能(CC)、參與生物過程功能(BP)和分子生物功能(MF)等,對基因及其產(chǎn)物進行分類注釋。桂桑優(yōu)12根尖組織的轉錄組序列被歸為55大類(圖4),其中參與代謝過程類等7類的轉錄序列均超過10 000個,參與膜結構和生物調節(jié)類等16個分類的序列均超過1 000個,其它分類中參與的序列相對較少,最少的如翻譯調節(jié)活性類僅有1個序列。

圖4 桂桑優(yōu)12根尖組織轉錄組序列的GO功能注釋分布

3 結 論

本研究以廣西蠶區(qū)大面積種植桑品種桂桑優(yōu)12的根尖組織總RNA進行轉錄組測序,并將序列在KEGG,GO及COG等數(shù)據(jù)庫中進行分析歸類。測序共獲得50 844 314條原始測序數(shù)據(jù)(Raw data),經(jīng)過濾原始測序數(shù)據(jù)后獲得得到99.4%的Clean data,共計50 540 436條,得到7.38 G的數(shù)據(jù),GC含量為46.58%。對Clean Reads進行拼接組裝及去冗余后得到102 254個轉錄本。利用COG,GO,KEGG等功能數(shù)據(jù)庫對序列進行功能注釋, 其中有86 332個轉錄本獲得了注釋結果,總共預測出的68 218個CDS中,有57 348個CDS獲得注釋。86 332個unigenes在KEGG中獲得注釋的有40 254個,在COG中獲得注釋的有26 832個,在GO中獲得注釋的有27 766個。本次測序獲得的桂桑優(yōu)12轉錄組數(shù)據(jù)及功能注釋結果,為今后探索了解桑樹的多種生理生化過程及代謝機制,挖掘桑樹的特殊性狀及開展桑樹遺傳育種等方面的研究,積累了具有一定參考意義的基礎數(shù)據(jù)。

猜你喜歡
文庫桑樹基因組
馬桑樹兒搭燈臺
牛參考基因組中發(fā)現(xiàn)被忽視基因
專家文庫
桑樹變身增收“搖錢樹”
優(yōu)秀傳統(tǒng)文化啟蒙文庫
幽默大師(2020年10期)2020-11-10 09:07:22
關于推薦《當代詩壇百家文庫》入選詩家的啟事
中華詩詞(2019年1期)2019-11-14 23:33:56
專家文庫
奶奶家的桑樹
哭泣的桑樹
學生天地(2016年16期)2016-05-17 05:46:06
基因組DNA甲基化及組蛋白甲基化
遺傳(2014年3期)2014-02-28 20:58:49
卢氏县| 舞阳县| 连云港市| 深水埗区| 玉溪市| 商洛市| 湖南省| 安徽省| 新河县| 鹤峰县| 正宁县| 双牌县| 临沭县| 临颍县| 临沧市| 鄂托克旗| 溧水县| 顺昌县| 庆城县| 同德县| 弥渡县| 波密县| 安岳县| 剑阁县| 新化县| 山东省| 罗源县| 繁昌县| 米林县| 福清市| 辽宁省| 咸阳市| 兴和县| 楚雄市| 黔西| 怀化市| 藁城市| 建昌县| 巩义市| 通渭县| 赤水市|