王 丹 鄒桂偉 羅相忠
(中國水產(chǎn)科學(xué)研究院長江水產(chǎn)研究所, 武漢 430223)
鰱(Hypophthalmichthys molitrix), 是我國“四大家魚”之一, 是老百姓重要的動物蛋白來源之一。近年來, 人工近親繁殖和親本選育等問題已導(dǎo)致鰱的主要經(jīng)濟(jì)性狀退化、生長速度減慢、性成熟個體變小、抗逆性下降等問題, 環(huán)境污染導(dǎo)致鰱天然種群數(shù)量明顯下降和種質(zhì)資源破壞較嚴(yán)重[1,2]。然而利用傳統(tǒng)的育種技術(shù)培育優(yōu)良品種或品系需要進(jìn)行多代選育, 費(fèi)時費(fèi)力。分子標(biāo)記輔助育種技術(shù)可快速、準(zhǔn)確地檢測到與性狀基因緊密連鎖的分子標(biāo)記, 在親子鑒定、回交育種、雜種優(yōu)勢預(yù)測和品種鑒定等各個育種階段發(fā)揮重要作用, 從而加速育種進(jìn)程, 提高育種效率[3]。開展鰱功能基因組學(xué)研究, 篩選鑒定鰱生長相關(guān)的分子標(biāo)記及QTL, 對鰱的分子標(biāo)記輔助育種體系具有重要的理論意義和生產(chǎn)價值。
分子標(biāo)記可按有無基因功能分為Type Ⅰ與Type Ⅱ標(biāo)記兩大類。Type Ⅰ標(biāo)記指來源于基因編碼區(qū), 與功能基因相聯(lián)系的標(biāo)記; Type Ⅱ標(biāo)記則指與未知功能片段關(guān)聯(lián)的標(biāo)記。Type Ⅰ標(biāo)記在群體遺傳研究、比較基因組學(xué)研究、基因組進(jìn)化研究、候選基因鑒定、數(shù)量性狀位點(diǎn)定位、分子標(biāo)記輔助育種等方面比Type Ⅱ標(biāo)記更具優(yōu)勢[4]。
來自EST的SSR標(biāo)記通常被稱作EST-SSR標(biāo)記,屬于Type Ⅰ標(biāo)記, 它結(jié)合了SSR和EST標(biāo)記的優(yōu)點(diǎn):(1)如果發(fā)現(xiàn)某個EST-SSR標(biāo)記與某個遺傳性狀相連鎖, 這個EST可能是直接影響這個性狀的基因片段。(2)EST來自基因編碼區(qū), 具有一定的保守性,因此在近緣種中有良好的通用性。(3)利用ESTSSR標(biāo)記進(jìn)行種群遺傳多樣性分析時, 所揭示的是在不同群體中基因的功能多樣。
在遺傳連鎖圖譜構(gòu)建和分子標(biāo)記輔助育種研究中, Liu等[5]報道了15個二堿基重復(fù)的EST-SSR標(biāo)記用于斑點(diǎn)叉尾鮰(Ictalurus punctatus)的圖譜構(gòu)建。Wang等[6]用數(shù)據(jù)挖掘的方法得到25個鯉(Cyprinus carpioL.)的EST-SSR標(biāo)記, 其中有23條ESTSSR序列與已知基因功能相關(guān), 如編碼新陳代謝的酶、抗病因子、結(jié)構(gòu)蛋白、以及轉(zhuǎn)錄因子等。Fuji等[7]得到牙鲆(Paralichthys olivaceus)抗淋巴囊腫病的微衛(wèi)星標(biāo)記, 利用這個位點(diǎn)輔助培育的牙鲆品種在日本市場的占有率為35%。魯翠云等[8]找到4個QTL位點(diǎn)與鏡鯉的體質(zhì)量、體長性狀具有相關(guān)性,可作為指導(dǎo)鏡鯉家系選配的首選標(biāo)記用于新品系培育。郭薇等[9]研究篩選出與鯽(Carassius auratus)體重、體厚、生長相關(guān)的EST-SSRs標(biāo)記及基因型,為鯽的分子標(biāo)記輔助育種及目標(biāo)性狀的遺傳改良提供依據(jù)。
在種質(zhì)資源研究中, Vasemg等[10]將EST-SSR標(biāo)記用于分析波羅的海五個大西洋鮭(Salmo salarL.)自然群體和四個人工養(yǎng)殖群體的遺傳多樣性和遺傳分化, 結(jié)果發(fā)現(xiàn)人工養(yǎng)殖群體中有一個等位基因丟失。魯翠云等[11]用鯉的EST-SSR引物分析了長江鯉和黑龍江鯉的種群結(jié)構(gòu), 找到2個位點(diǎn)在長江鯉的多態(tài)信息含量明顯高于黑龍江鯉, 可以作為兩個群體的鑒別。赫崇波等[12]用EST-SSR標(biāo)記對我國斑點(diǎn)叉尾鮰種質(zhì)資源進(jìn)行評估, 認(rèn)為斑點(diǎn)叉尾鮰的遺傳分化程度很弱。鄭國棟等[13]利用EST-SSR標(biāo)記對不同地域草魚(Ctenopharyngodon idellus)群體進(jìn)行鑒定和遺傳多樣性分析, 對草魚的種質(zhì)資源保存、種群鑒定和良種選育具有重要意義。
迄今, 有關(guān)鰱在遺傳連鎖圖譜構(gòu)建[14—16]和種質(zhì)資源遺傳結(jié)構(gòu)[1,2,17]的研究中已取得重要進(jìn)展, 但是缺乏分子標(biāo)記輔助育種的研究。本實(shí)驗(yàn)通過鰱的卵組織轉(zhuǎn)錄組數(shù)據(jù)挖掘EST-SSR標(biāo)記, 從中篩選出與生長性狀相關(guān)或連鎖的位點(diǎn), 探討其用于分子標(biāo)記輔助育種的應(yīng)用潛力, 為鰱遺傳育種的親本選擇提供理論基礎(chǔ)。
用于檢測引物多態(tài)的鰱采自石首老河野生群體共16尾。轉(zhuǎn)錄組測序材料和構(gòu)建全同胞家系的實(shí)驗(yàn)魚由中國水產(chǎn)科學(xué)研究院長江水產(chǎn)研究所窯灣試驗(yàn)場提供。轉(zhuǎn)錄組測序材料取自鰱的卵組織。TaKaRa試劑盒提取總RNA, 反轉(zhuǎn)錄得到cDNA,對cDNA片段進(jìn)行末端修復(fù)并連接測序接頭, 進(jìn)行Illumina HighSeq 2000高通量測序。本實(shí)驗(yàn)構(gòu)建鰱的全同胞家系, 隨機(jī)挑選子代共計144尾。采集的鰭條置于95%的酒精中。基因組DNA的提取參照鹽析法[18]。對144尾鰱的外觀性狀體長和體重進(jìn)行測量, 并計算肥滿度(K=100W/L3,W為體重,L為體長)。
轉(zhuǎn)錄組測序和微衛(wèi)星的查找將測序原始數(shù)據(jù)進(jìn)行初步拼接, 去除低質(zhì)量和短序列, 獲得高質(zhì)量的序列, 然后進(jìn)行參考序列組裝和de novo組裝。基于轉(zhuǎn)錄組SSR檢測是以組裝出來Unigene作為參考序列, 用SSR軟件MicroSatellite (MISA)來找出所有的SSR。Primer 6設(shè)計鰱EST-SSR引物。
PCR反應(yīng)條件94℃預(yù)變性5min; 94℃變性35s, 退火溫度為35s, 72℃延伸50s, 循環(huán)35次; 最后72℃終延伸10min。PCR反應(yīng)體系: 總體積25 μL,包括大約20 ng總DNA, 上、下游引物各1 μL(5 μmol/L), 1 μL dNTP(10 mmol/L), 0.6UTaq聚合酶(TIANGEN), 2.5 μL緩沖液(含Mg2+1.5 mmol/L)。本實(shí)驗(yàn)參照Schuelke[19]發(fā)明的單管巢式PCR擴(kuò)增方法進(jìn)行基因型分型研究, GeneMapper4.0分析基因型數(shù)據(jù)。
數(shù)據(jù)處理與分析多態(tài)位點(diǎn)和生長性狀指標(biāo)的關(guān)聯(lián)性分析用SPSS軟件中的廣義線性模型(General linear model)處理。顯著性檢驗(yàn)用新復(fù)極差法(Duncan’s new multiple range test)[20]。
通過Illumina Hiseq2000平臺測序, 總計產(chǎn)出28691557200nt數(shù)據(jù)。組裝結(jié)果總Unigene77129個,總長98834445nt, 平均長度1281nt, N50達(dá)到2228nt。Unigene功能注釋, 注釋到NR、NT、Swiss-Prot、KEGG、COG、GO庫的Unigene分別是46540個、64879個、41522個、35574個、16426個、30224個,所有注釋上的Unigene是66985個。預(yù)測編碼蛋白框(CDS), 比對到蛋白庫的CDS有46113個, 預(yù)測出的CDS有1512個, 共47625個。SSR共24458個, 占所測EST數(shù)據(jù)的31.7%。
鰱轉(zhuǎn)錄組微衛(wèi)星類型特征如圖1所示。鰱包含SSR的EST序列主要有二堿基、三堿基、四堿基和五堿基組成。二堿基中, AC/GT含量最豐富, CG含量最少。三堿基重復(fù)的序列最多類型是ATC和ATG。
我們從所測序列挑選175條鰱的EST進(jìn)行SSR引物設(shè)計。PCR檢測結(jié)果顯示, 共有148對引物有擴(kuò)增產(chǎn)物, 其中單態(tài)有60對, 雜帶有52對, 多態(tài)有36對。36對多態(tài)引物的核心重復(fù)類型、退火溫度、引物序列和Blast結(jié)果見表1。
我們一共測量了144尾鰱。體長最大值為17.0 cm,最小值為11.2 cm, 平均值為14.1 cm;體重最大值是82.3 g, 最小值為25.8 g, 平均值為49.4 g; 肥滿度最大值為2.07, 最小值為1.41, 平均值為1.7(表2)。
本研究共篩選得到兩個與鰱生長性狀有關(guān)的SCE位點(diǎn), SCE26和SCE65。如表3所示, 2個SCE位點(diǎn)按基因型分類, SCE26位點(diǎn)有3種基因型, A148-148、A148-154和A154-154。其中A148-154為優(yōu)勢基因型, 基因頻率為0.68?;蛐虯148-154和A154-154與體長和體重性狀差異顯著, 而與肥滿度性狀無相關(guān)性。
SCE65有四種基因型, A149-157、A157-159、A149-159和A159-159, 與體長和體重性狀均無顯著相關(guān)性, 但基因型A149-159和A159-159與肥滿度性狀差異顯著。
圖1 鰱轉(zhuǎn)錄組數(shù)據(jù)微衛(wèi)星類型特征Fig. 1 Characterization of SSR from silver carp transcriptome data
表1 鰱36對EST-SSR引物特征Tab. 1 Characterization of 36 EST-SSR in silver carp
續(xù)表1
表2 144尾鰱測量指標(biāo)Tab. 2 Measurements from 144 silver carp individuals
Serapion等[21]的方法從斑點(diǎn)叉尾鮰開發(fā)TypeⅠ標(biāo)記(EST-SSR), 首次報道魚類用此方法研究的先例。隨后, 在其他魚類[22—24]、蝦類[25,26]和貝類[27]中也有EST-SSR標(biāo)記開發(fā)報道。本研究, 我們得到的結(jié)果有31.7%的鰱EST序列包含SSR, 這個比例遠(yuǎn)遠(yuǎn)高于斑節(jié)對蝦(13.7%)[26]、河豚(11.5%)[28]和斑點(diǎn)叉尾鮰(11.2%)[21]、中國對蝦(2.2%)[29]、海灣扇貝(4%)[27]和真鯛(4%)[24]。植物包含SSR的EST序列百分比在1%—5%[30,31]。可見, 水生生物包含SSR的EST序列是非常豐富的。本研究中SSR豐富度較高, 可能是因?yàn)闇y序方法、序列拼接方式和計算法則更優(yōu)化, 去除了更多的冗余數(shù)據(jù), 提高了SSR的百分比。也有可能是鰱卵組織EST序列的一個自身特點(diǎn), 有待我們進(jìn)一步研究。
大多數(shù)動物的EST數(shù)據(jù)庫中SSR核心重復(fù)類型以二堿基居多數(shù), 而植物則是三堿基重復(fù)最豐富[30,31]。在鯉科魚中, 包括非編碼區(qū)SSR和編碼區(qū)SSR中的研究[28,32], 二堿基CA重復(fù)的序列最多[6,33,34]。也有少數(shù)學(xué)者提出相反觀點(diǎn), 認(rèn)為AT二堿基重復(fù)次數(shù)最常見[22]。在本研究中, 鰱EST數(shù)據(jù)中二堿基CA重復(fù)次數(shù)最多, 與大部分鯉科魚類研究相同。
多態(tài)位點(diǎn)不僅僅依賴于核心重復(fù)次數(shù), 有些二堿基重復(fù)五次檢測結(jié)果是多態(tài), 而重復(fù)六次甚至更多卻是單態(tài)[35,36]。編碼區(qū)的突變概率要小于非編碼區(qū), 源于基因受選擇壓力的影響[35]。與Type Ⅱ標(biāo)記的SSR(來自非編碼區(qū))相比, EST-SSR的多態(tài)比例略低[25,37]。本研究的結(jié)果, 共設(shè)計了175對ESTSSR引物, 有148對有擴(kuò)增產(chǎn)物, 說明測序的EST質(zhì)量是可靠的。多態(tài)有36對, 占總比例24.3%; 單態(tài)有60對, 占40.1%, 可能是源于基因的保守性。有27對無擴(kuò)增產(chǎn)物, 可能是因?yàn)橐镌O(shè)計位點(diǎn)跨外顯子擴(kuò)增[37]。
表3 鰱生長性狀有關(guān)的EST-SSR多態(tài)位點(diǎn)信息Tab. 3 Effects of EST-SSR polymorphisms on growth traits of silver carp
本研究共篩選得到兩個與鰱生長性狀有關(guān)的EST-SSR位點(diǎn), SCE26和SCE65。如表3所示, 兩個位點(diǎn)按基因型分類, SCE26位點(diǎn)A148-154為優(yōu)勢基因型, 基因型頻率為0.68。A148-154與A154-154的體長和體重差異顯著, 而肥滿度無相關(guān)性。SCE65的基因型A149-159和A159-159的肥滿度差異顯著, 體長和體重則無顯著相關(guān)。群體的等位基因頻率受人工選擇、親本數(shù)目及隨機(jī)遺傳漂變的影響較大[38]。本研究的實(shí)驗(yàn)材料144尾鰱不受這些情況的影響。因此, 可以排除上述可能干擾等位基因頻率的因素。
候選基因的效應(yīng)可能只存在某個群體或者特定世代, 即這種數(shù)量性狀的連鎖關(guān)系需要在該群體子代、同品種不同群體及不同品種中進(jìn)行驗(yàn)證[39]。因此本研究對鰱微衛(wèi)星的多態(tài)位點(diǎn)與外觀性狀的關(guān)系將進(jìn)一步驗(yàn)證, 以期得到更準(zhǔn)確的結(jié)果。這兩個標(biāo)記有可能作為生長有關(guān)的候選基因, 進(jìn)行鰱分子標(biāo)記輔助育種研究。
有關(guān)鰱EST-SSR標(biāo)記的報道比較少。Wang等[6]用鯉的EST-SSR引物對鰱進(jìn)行跨種擴(kuò)增研究, 得到的EST-SSR多態(tài)率偏低。Guo等[16]構(gòu)建鰱的微衛(wèi)星文庫, 篩選的大部分EST-SSR引物以GT二堿基核心重復(fù)為主。本研究直接從鰱的轉(zhuǎn)錄組測序產(chǎn)物中尋找SSR進(jìn)行驗(yàn)證, 屬于測序的副產(chǎn)品研究, 省時省力, 且涉及的引物核心重復(fù)序列覆蓋二堿基、三堿基、四堿基和五堿基。
Blast結(jié)果顯示, 36條鰱EST-SSR序列中有10條序列確定已知基因功能, 如轉(zhuǎn)運(yùn)蛋白、蛋白激酶、去甲基化酶及白細(xì)胞介素等, 有助于已知功能基因的定位。在目前的研究中, 關(guān)于鰱生長、繁殖、抗病等分子標(biāo)記的相關(guān)報道較少。可根據(jù)不同的生產(chǎn)目的選擇相應(yīng)的基因型標(biāo)記進(jìn)行標(biāo)記輔助育種研究, 重點(diǎn)研究生長速度快、耐低氧、抗病性強(qiáng)的基因, 全基因組測序工作的開展, 將加快研究進(jìn)程。