田 濤, 王偉繼, 陳再忠, 胡玉龍, 王陌桑, 呂 丁,4, 李之鄉(xiāng)
(1.上海海洋大學(xué)水產(chǎn)與生命學(xué)院,上海 201306;2.中國(guó)水產(chǎn)科學(xué)研究院黃海水產(chǎn)研究所農(nóng)業(yè)部海洋漁業(yè)可持續(xù)發(fā)展重點(diǎn)實(shí)驗(yàn)室,山東 青島 266071;3.海洋國(guó)家實(shí)驗(yàn)室海洋漁業(yè)科學(xué)與食物產(chǎn)出過程功能實(shí)驗(yàn)室,山東 青島 266071;4.南京農(nóng)業(yè)大學(xué)無(wú)錫漁業(yè)學(xué)院,江蘇 無(wú)錫 214081)
?
大菱鲆生長(zhǎng)性狀相關(guān)單核苷酸多態(tài)位點(diǎn)的多家系驗(yàn)證?
田 濤1,2,3, 王偉繼2,3??, 陳再忠1, 胡玉龍2,3, 王陌桑1,2,3, 呂 丁2,3,4, 李之鄉(xiāng)1,2,3
(1.上海海洋大學(xué)水產(chǎn)與生命學(xué)院,上海 201306;2.中國(guó)水產(chǎn)科學(xué)研究院黃海水產(chǎn)研究所農(nóng)業(yè)部海洋漁業(yè)可持續(xù)發(fā)展重點(diǎn)實(shí)驗(yàn)室,山東 青島 266071;3.海洋國(guó)家實(shí)驗(yàn)室海洋漁業(yè)科學(xué)與食物產(chǎn)出過程功能實(shí)驗(yàn)室,山東 青島 266071;4.南京農(nóng)業(yè)大學(xué)無(wú)錫漁業(yè)學(xué)院,江蘇 無(wú)錫 214081)
為在多家系群體中進(jìn)一步驗(yàn)證與大菱鲆生長(zhǎng)性狀緊密關(guān)聯(lián)的SNP位點(diǎn),本研究以QTL定位作圖篩選獲得的100個(gè)與大菱鲆(ScophthalmusmaximusL.)生長(zhǎng)性狀相關(guān)的候選單核苷酸多態(tài)(SNP)位點(diǎn)為基礎(chǔ),利用飛行質(zhì)譜法,在4個(gè)大菱鲆家系群體中進(jìn)行基因分型,并與體重、體長(zhǎng)2個(gè)生長(zhǎng)性狀數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析。對(duì)關(guān)聯(lián)顯著的位點(diǎn),統(tǒng)計(jì)位點(diǎn)在家系群體中的多態(tài)性,并進(jìn)行連鎖不平衡分析和單倍型分析;根據(jù)顯著位點(diǎn)所在基因序列信息,在NCBI數(shù)據(jù)庫(kù)中進(jìn)行比對(duì)分析,對(duì)匹配到的基因功能進(jìn)行初步探討。關(guān)聯(lián)分析發(fā)現(xiàn),有9個(gè)SNP位點(diǎn)與生長(zhǎng)性狀關(guān)聯(lián)顯著(P<0.05)。9個(gè)位點(diǎn)中,4個(gè)位點(diǎn)與體重關(guān)聯(lián)顯著(P<0.05),7個(gè)位點(diǎn)與體長(zhǎng)關(guān)聯(lián)顯著(P<0.05),其中,SNP51和SNP111與體重和體長(zhǎng)2個(gè)性狀均關(guān)聯(lián)顯著(P<0.05)。SNP位點(diǎn)的多態(tài)性分析發(fā)現(xiàn),觀測(cè)雜合度在0.126~0.719之間(平均為0.387),期望雜合度在0.118~0.501之間(平均為0.338);9個(gè)位點(diǎn)的平均多態(tài)信息含量為0.267,屬于中度多態(tài)性位點(diǎn);哈迪溫伯格平衡檢驗(yàn)結(jié)果顯示,9個(gè)位點(diǎn)中有5個(gè)位點(diǎn)偏離平衡。連鎖不平衡和單倍型分析發(fā)現(xiàn),標(biāo)記間存在顯著的連鎖不平衡;單倍型CTTGT和CTTGA是2個(gè)主要的單倍型,單倍型頻率分別為26.8%和25.9%。根據(jù)關(guān)聯(lián)顯著SNP位點(diǎn)所在的序列信息,在NCBI數(shù)據(jù)庫(kù)比對(duì)分析后發(fā)現(xiàn),COL11A1和Notch1基因可能是與大菱鲆生長(zhǎng)性狀相關(guān)的重要功能基因。本研究結(jié)果將推進(jìn)大菱鲆生長(zhǎng)相關(guān)分子標(biāo)記的研究,為下一步基因定位和分子標(biāo)記輔助育種提供更多的標(biāo)記基礎(chǔ)。
大菱鲆;生長(zhǎng)性狀;單核苷酸多態(tài)性(SNP);關(guān)聯(lián)分析
大菱鲆(ScophthalmusmaximusL.)屬于鰈形目(Pleuronectiformes)鲆科(Scophthalmidae)菱鲆屬(Scophthalmus),俗稱“多寶魚”,是原產(chǎn)于歐洲沿海的一種名貴的比目魚。中國(guó)于1992年首次從英國(guó)引進(jìn),因其生長(zhǎng)快,易馴化,抗逆性強(qiáng)等特點(diǎn),迅速成為北方海水養(yǎng)殖的主要經(jīng)濟(jì)魚類[1]。然而,隨著集約化養(yǎng)殖水平的不斷提高,大菱鲆養(yǎng)殖面臨諸多問題。由于苗種資源匱乏、累代養(yǎng)殖以及近親交配,使得大菱鲆種質(zhì)資源退化嚴(yán)重,加上大菱鲆疾病頻發(fā),生長(zhǎng)周期已從原來(lái)的12個(gè)月增長(zhǎng)到18個(gè)月,嚴(yán)重制約了大菱鲆養(yǎng)殖產(chǎn)業(yè)的可持續(xù)發(fā)展[2-4]。因此對(duì)大菱鲆進(jìn)行遺傳改良,選育具有優(yōu)良生長(zhǎng)性狀的大菱鲆新品種成為發(fā)展大菱鲆養(yǎng)殖產(chǎn)業(yè)的當(dāng)務(wù)之急。
生長(zhǎng)性狀是影響大菱鲆經(jīng)濟(jì)價(jià)值最重要的性狀,在大菱鲆育種工作中也主要是針對(duì)生長(zhǎng)性狀進(jìn)行遺傳改良。傳統(tǒng)的育種方式主要是通過雜交育種或者選擇育種的方法,經(jīng)過多代選育來(lái)改良水產(chǎn)動(dòng)物的生長(zhǎng)性狀。隨著生物技術(shù)的不斷創(chuàng)新與發(fā)展,分子標(biāo)記技術(shù)被引入到育種工作中,利用分子標(biāo)記能夠準(zhǔn)確的標(biāo)記遺傳性狀,并且在生物體的各個(gè)生長(zhǎng)時(shí)期均能進(jìn)行檢測(cè),顯著縮短育種年限,彌補(bǔ)了傳統(tǒng)育種中的不足。分子標(biāo)記輔助育種(Marker assisted selection, MAS)逐漸成為一種新的育種模式,在水產(chǎn)動(dòng)物育種領(lǐng)域也取得了快速的發(fā)展[5]。
單核苷酸多態(tài)性(Single nucleotide polymorphism, SNP)是基因組DNA中由于單個(gè)核苷酸變異所引起的序列多態(tài)性,包括單堿基的轉(zhuǎn)換、顛換、插入及缺失等形式,最早由Lander于1996年提出[6]。因SNP標(biāo)記在基因組中密度高,遺傳穩(wěn)定性好,并且易于自動(dòng)化分析,被廣泛應(yīng)用于人類、動(dòng)物和植物的遺傳研究中。在動(dòng)物遺傳育種領(lǐng)域,SNP標(biāo)記可用于遺傳連鎖圖譜的構(gòu)建、群體遺傳多樣性分析、親緣關(guān)系鑒定以及性狀的關(guān)聯(lián)分析研究[7-9]。其中,SNP標(biāo)記與動(dòng)物經(jīng)濟(jì)性狀的關(guān)聯(lián)分析研究近幾年逐漸興起,它基于全基因組范圍內(nèi)高密度的SNP位點(diǎn)或者候選基因內(nèi)部的SNP標(biāo)記,通過關(guān)聯(lián)分析,研究遺傳標(biāo)記和表型性狀的關(guān)聯(lián)性,進(jìn)而尋找與重要遺傳性狀相關(guān)聯(lián)的SNP標(biāo)記[10]。生長(zhǎng)性狀是水產(chǎn)動(dòng)物最重要的經(jīng)濟(jì)性狀之一,國(guó)內(nèi)外學(xué)者利用SNP標(biāo)記與生長(zhǎng)性狀進(jìn)行關(guān)聯(lián)分析已經(jīng)取得一定進(jìn)展。Lv等[11]基于三疣梭子蟹轉(zhuǎn)錄組學(xué)數(shù)據(jù),利用關(guān)聯(lián)分析方法在三疣梭子蟹生長(zhǎng)性狀分離群體中發(fā)現(xiàn)一個(gè)與生長(zhǎng)性狀關(guān)聯(lián)的SNP位點(diǎn)(comp58070-R31);Li等[12]研究大口黑鱸魚(Micropterussalmoniodes)胰島素樣生長(zhǎng)因子基因(IGF-1)5’側(cè)翼區(qū)域,通過關(guān)聯(lián)分析發(fā)現(xiàn),該基因內(nèi)部SNP位點(diǎn)的多樣性與體重、體長(zhǎng)顯著關(guān)聯(lián)。另外,SNP位點(diǎn)與性狀的關(guān)聯(lián)分析研究在櫛孔扇貝(Chlamysfarreri)[13]和鯉魚(Cyprinuscarpio)[14]等水產(chǎn)動(dòng)物中也有報(bào)道,但在大菱鲆的研究中還鮮有報(bào)道。
水產(chǎn)動(dòng)物的生長(zhǎng)性狀是典型的數(shù)量性狀,具有連續(xù)遺傳的特點(diǎn),受多基因位點(diǎn)的控制,而這些位點(diǎn)被稱為數(shù)量性狀位點(diǎn)(Quantitative traits locus)。Wang等[8]以一個(gè)大菱鲆家系共149個(gè)父母本及子代個(gè)體為作圖群體,構(gòu)建了基于SNP標(biāo)記的遺傳連鎖圖譜,最終定位了220個(gè)與大菱鲆性別及生長(zhǎng)性狀相關(guān)的QTL位點(diǎn)。本研究以此為基礎(chǔ),選取其中100個(gè)與生長(zhǎng)性狀相關(guān)的候選SNP位點(diǎn),利用飛行質(zhì)譜法(Time of flight mass spectrometer,TOF-MS)在4個(gè)大菱鲆家系群體中進(jìn)行SNP位點(diǎn)基因分型,并結(jié)合大菱鲆的體重和體長(zhǎng)數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析。接著,對(duì)于關(guān)聯(lián)顯著的SNP標(biāo)記位點(diǎn),統(tǒng)計(jì)各位點(diǎn)在大菱鲆家系群體中的觀測(cè)雜合度、期望雜合度、基因型頻率和等位基因頻率等群體遺傳參數(shù),并進(jìn)行連鎖不平衡分析和單倍型分析;最后,根據(jù)SNP標(biāo)記位點(diǎn)周圍的序列信息,在NCBI數(shù)據(jù)庫(kù)中進(jìn)行序列比對(duì)分析,對(duì)相似性高的基因的功能進(jìn)行討論。本研究旨在大菱鲆多個(gè)家系群體中進(jìn)一步驗(yàn)證與生長(zhǎng)性狀相關(guān)聯(lián)的SNP標(biāo)記位點(diǎn),為加快大菱鲆分子標(biāo)記輔助育種進(jìn)程及生長(zhǎng)性狀相關(guān)基因研究提供理論基礎(chǔ)。
1.1 實(shí)驗(yàn)材料
試驗(yàn)群體為2014年構(gòu)建的大菱鲆家系,飼養(yǎng)于煙臺(tái)海陽(yáng)市黃海水產(chǎn)有限公司。隨機(jī)挑選同一批次構(gòu)建的4個(gè)大菱鲆家系,4個(gè)家系的父母本各不相同。受精卵孵化后100天左右在大菱鲆腹部注射熒光標(biāo)記以區(qū)分不同的家系,每個(gè)家系隨機(jī)挑選100條魚,混養(yǎng)于同一水泥池中。12月齡時(shí)每個(gè)家系隨機(jī)選取40尾魚,測(cè)量體重和體長(zhǎng),并記錄數(shù)據(jù),同時(shí)剪取鰭條放入液氮中,之后轉(zhuǎn)移至-80℃超低溫冰箱中保存,用于后續(xù)基因組DNA的提取。
1.2 基因組DNA的提取
采用醋酸銨法提取大菱鲆鰭條組織基因組DNA,使用紫外光分光光度計(jì)測(cè)定基因組DNA的濃度和純度,所有基因組DNA用雙蒸水將濃度統(tǒng)一定量到100ng/μL,OD260/OD280值在1.8~2.0之間,符合后續(xù)實(shí)驗(yàn)要求。利用1%濃度的瓊脂糖凝膠電泳檢測(cè)基因組DNA的完整性,條帶明亮且無(wú)拖尾現(xiàn)象可用于下一步實(shí)驗(yàn)。
1.3 SNP位點(diǎn)的篩選
根據(jù)Wang等[8]利用QTL定位作圖篩選獲得的與大菱鲆生長(zhǎng)性狀相關(guān)的QTL位點(diǎn),選取其中的100個(gè)候選SNP位點(diǎn)((LOD>3),部分位點(diǎn)的詳細(xì)信息見表1。同時(shí),根據(jù)SNP位點(diǎn)所在的序列,選取SNP位點(diǎn)突變堿基前后各200個(gè)堿基長(zhǎng)度的序列用于飛行質(zhì)譜引物設(shè)計(jì)。
表1 部分SNP位點(diǎn)信息
Note:①SNP locus; ②Variants; ③Linkage group; ④Scaffold length
1.4 SNP位點(diǎn)的分型
SNP位點(diǎn)基因分型采用飛行質(zhì)譜法(TOF-MS),結(jié)合SNP所在序列信息,共設(shè)計(jì)4個(gè)多重PCR反應(yīng),每個(gè)PCR反應(yīng)分別包括26/26/26/22個(gè)SNP位點(diǎn),飛行質(zhì)譜分型由北京翔燕凱杰科技有限公司完成,質(zhì)譜反應(yīng)結(jié)束后根據(jù)質(zhì)譜峰圖判讀各樣本目標(biāo)位點(diǎn)基因型。
1.5 統(tǒng)計(jì)分析
統(tǒng)計(jì)4個(gè)家系所有個(gè)體在每個(gè)SNP標(biāo)記位點(diǎn)上的基因型,利用SPSS19.0軟件的一般線性模型(General linear model, GLM),對(duì)基因型數(shù)據(jù)與生長(zhǎng)性狀(體重和體長(zhǎng))數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,模型為:
Y=μ+Gi+eij。
式中:Y為性狀觀察值(體重和體長(zhǎng));μ為總體平均值;Gi為SNP的效應(yīng)值;eij為隨機(jī)誤差。利用POPGENE32軟件[15]統(tǒng)計(jì)顯著關(guān)聯(lián)位點(diǎn)的觀測(cè)雜合度(Observed heterozygosity,Ho)、期望雜合度(Expected heterozygosity,He)、有效等位基因數(shù)(Ne)以及進(jìn)行哈迪-溫伯格平衡(Hardy-Weinberg equilibrium, HWE)檢驗(yàn)。利用PIC_CALC(0.6)[16]計(jì)算各SNP標(biāo)記位點(diǎn)的多態(tài)信息含量(Polymorphism information content,PIC)。利用SHESIS軟件[17]統(tǒng)計(jì)關(guān)聯(lián)位點(diǎn)的基因型頻率和等位基因頻率,并進(jìn)行連鎖不平衡分析和單倍型分析。
1.6 基因功能預(yù)測(cè)
根據(jù)關(guān)聯(lián)顯著的SNP位點(diǎn)所在序列信息,在美國(guó)國(guó)家生物技術(shù)中心((National center for biotechnology information,NCBI)利用BLAST功能進(jìn)行序列比對(duì)分析,查找相似度比較高的基因序列,通過基因注釋信息以及查閱相關(guān)文獻(xiàn),研究基因的功能,為進(jìn)一步研究提供參考。
2.1 SNP位點(diǎn)分型結(jié)果統(tǒng)計(jì)
利用飛行質(zhì)譜法對(duì)100個(gè)SNP位點(diǎn)進(jìn)行分型,結(jié)果88個(gè)位點(diǎn)成功分型,分型成功率為88%。在成功分型的88個(gè)位點(diǎn)中,41個(gè)屬于轉(zhuǎn)換,47個(gè)屬于顛換,具體變異類型分布見圖1。
圖1 SNP位點(diǎn)變異類型分布圖
2.2 SNP位點(diǎn)與生長(zhǎng)性狀關(guān)聯(lián)分析結(jié)果
大菱鲆4個(gè)家系生長(zhǎng)性狀(體重和體長(zhǎng))數(shù)據(jù)見表2。利用一般線性模型(GLM)對(duì)SNP位點(diǎn)的基因型和生長(zhǎng)性狀進(jìn)行關(guān)聯(lián)分析,結(jié)果見表3。從表3的結(jié)果中可見共有2個(gè)SNP標(biāo)記(SNP51和SNP111)位點(diǎn)與體重和體長(zhǎng)2個(gè)性狀均顯著關(guān)聯(lián)。4個(gè)SNP標(biāo)記位點(diǎn)(SNP51、SNP55、SNP101和SNP111)與體重顯著關(guān)聯(lián)(P<0.05),7個(gè)位點(diǎn)(SNP50、SNP51、SNP56、SNP86、SNP92、SNP105和SNP111)與體長(zhǎng)顯著關(guān)聯(lián)(P<0.05),其中SNP56和SNP105與體長(zhǎng)性狀極顯著關(guān)聯(lián)(P<0.01)。
表2 生長(zhǎng)性狀(體重和體長(zhǎng))詳細(xì)信息
表3 SNP位點(diǎn)與生長(zhǎng)性狀的關(guān)聯(lián)分析結(jié)果
注:*表示關(guān)聯(lián)顯著(P<0.05);**表示關(guān)聯(lián)極顯著(P<0.01)。
Note:* indicates significant association;** indicates very significant association.
2.3 關(guān)聯(lián)顯著位點(diǎn)的多態(tài)性分析
9個(gè)SNP位點(diǎn)在大菱鲆家系群體中的多態(tài)性信息見表4。9個(gè)位點(diǎn)中,4個(gè)位點(diǎn)(SNP50、SNP51、SNP56和SNP101)在群體中只檢測(cè)到2種基因型,其它5個(gè)位點(diǎn)為3種基因型,平均有效等位基因數(shù)為1.600個(gè)。觀測(cè)雜合度在0.126~0.719之間,平均觀測(cè)雜合度為0.387;期望雜合度在0.118~0.501之間,平均期望雜合度為0.338。9個(gè)位點(diǎn)的平均多態(tài)信息含量為0.267,其中SNP50、SNP56和SNP111為低度多態(tài)位點(diǎn)(PIC<0.25),其它6個(gè)位點(diǎn)為中度多態(tài)位點(diǎn)(0.25 2.4 單倍型和連鎖不平衡分析 關(guān)聯(lián)顯著的9個(gè)SNP位點(diǎn)中,有5個(gè)位點(diǎn)位于同一連鎖群(LG18)(SNP50、SNP51、SNP55、SNP56和SNP92),連鎖不平衡分析結(jié)果見表5。從表5的結(jié)果中看出有2對(duì)SNP位點(diǎn)之間屬于完全連鎖不平衡(D’=1),另外,6對(duì)位點(diǎn)之間存在緊密連鎖(D’>0.9)。同時(shí),對(duì)5個(gè)位點(diǎn)進(jìn)行單倍型分析(見表6),結(jié)果表明,5個(gè)位點(diǎn)共組成9種單倍型,其中有6種單倍型的頻率大于0.03,CTTGT的頻率最高,為26.8%,其次是CTTGA,頻率為25.9%。 表4 顯著位點(diǎn)的多態(tài)性信息 注:HE為期望雜合度;HO為觀測(cè)雜合度;PIC為多態(tài)信息含量;HWE為哈迪溫伯格平衡;Ne為有效等位基因數(shù);A表示腺嘌呤;T表示胸腺嘧啶;G表示鳥嘌呤;C代表胞嘧啶。 Note:HOandHEindicate observed and expected heterozygosity;PICis Polymorphism information content; HWE means Hardy-Weinberg equilibrium;Neindicates effective number of alleles; A, T, G, C is adenine, thymine, guanine and cytosine respectively. 2.5 關(guān)聯(lián)顯著SNP位點(diǎn)基因功能預(yù)測(cè) 根據(jù)關(guān)聯(lián)顯著SNP位點(diǎn)所在序列信息,在NCBI數(shù)據(jù)庫(kù)中進(jìn)行序列比對(duì)查找相似度高的基因(E值<10-10)(見表7),其中7個(gè)位點(diǎn)的序列能匹配到相關(guān)基因,共6種不同的基因,分別為補(bǔ)體成分9基因(Complement compoment 9 gene)、細(xì)胞珠蛋白-2(Cytoglobin-2)、干擾素4a1基因(Requlatory factor-4a1 gene)、Collagen alpha-1(Ⅺ)chain-like (COL11A1)基因、StrainHd-rR基因以及Notch1基因。 表5 連鎖不平衡檢驗(yàn)D’值 表6 單倍型分析結(jié)果 注:*代表單倍型頻率大于0.03(LFT>0.03); A表示腺嘌呤;T表示胸腺嘧啶;G表示鳥嘌呤;C代表胞嘧啶。 Note: *indicate the haplotype frequency>0.03(LFT>0.03)A, T, G, C is adenine, thymine, guanine and cytosine respectively. 本研究利用飛行質(zhì)譜法對(duì)100個(gè)與生長(zhǎng)性狀相關(guān)的候選SNP位點(diǎn)進(jìn)行分型,其中成功分型88個(gè),成功率為88%。飛行質(zhì)譜法是基于單堿基延伸技術(shù)和質(zhì)譜檢測(cè)技術(shù),通過檢測(cè)延伸產(chǎn)物和未延伸產(chǎn)物的分子量大小來(lái)確定SNP位點(diǎn)的堿基信息。作為一種中通量的SNP分型方法,具有準(zhǔn)確率高、檢出速度快等特點(diǎn)[18]。另外,此技術(shù)還可以同時(shí)對(duì)多個(gè)位點(diǎn)進(jìn)行檢測(cè),提高分型的效率,節(jié)省基因分型的成本,比如,如美國(guó)Sequenom公司的Sequenom MassArray可設(shè)計(jì)多達(dá)40重的基因型檢測(cè)[19]。本研究在分型過程中設(shè)計(jì)了4個(gè)多重PCR反應(yīng),每個(gè)反應(yīng)里面包括20多個(gè)位點(diǎn),節(jié)省了實(shí)驗(yàn)的成本。統(tǒng)計(jì)位點(diǎn)的突變類型(見圖1),A/G類型最多(24個(gè)),其次是T/C突變(17個(gè)),這類突變屬于轉(zhuǎn)換突變。理論上,發(fā)生轉(zhuǎn)換突變和顛換突變的比例應(yīng)該相同的,但是實(shí)際情況下,發(fā)生轉(zhuǎn)換突變的概率要大一些,比例約2∶1,這種現(xiàn)象稱為“轉(zhuǎn)換偏差”。WANG等[20]統(tǒng)計(jì)分析人類基因組SNP突變類型的結(jié)果也證明了這一點(diǎn)。原因可能是因?yàn)镃pG二核苷酸上的胞嘧啶殘基通常會(huì)自發(fā)地脫去氨基,進(jìn)而形成胸腺嘧啶,在一定程度上增加了轉(zhuǎn)換的比例。 關(guān)聯(lián)分析在復(fù)雜性狀關(guān)聯(lián)標(biāo)記的發(fā)掘上發(fā)揮了重要的作用,尤其在全基因組序列已知的高等動(dòng)物中,利用高密度的SNP基因芯片,在全基因組水平上篩選與高等動(dòng)物經(jīng)濟(jì)性狀相關(guān)聯(lián)的SNP位點(diǎn),如羊的肉質(zhì)性狀、牛的生長(zhǎng)性狀及京海黃雞生長(zhǎng)性狀等[21-23]。但在大菱鲆的研究中,由于基因組數(shù)據(jù)的缺乏,無(wú)法完成全基因組水平的關(guān)聯(lián)分析。對(duì)于像大菱鲆這樣缺乏基因組數(shù)據(jù)的非模式生物來(lái)說,兩階段研究正被更多的研究者所采用[24]。2個(gè)階段研究是指第一階段通過小樣本的QTL定位得到與數(shù)量性狀相關(guān)聯(lián)的SNP位點(diǎn),第二階段在更大的樣本中對(duì)第一階段得到的陽(yáng)性結(jié)果進(jìn)行驗(yàn)證,結(jié)合2個(gè)階段結(jié)果進(jìn)行分析。本研究以QTL定位作圖初步篩選獲得的100個(gè)與大菱鲆生長(zhǎng)性狀相關(guān)聯(lián)的候選SNP位點(diǎn)為基礎(chǔ),利用關(guān)聯(lián)分析的方法,在多個(gè)大菱鲆家系群體中進(jìn)一步驗(yàn)證。許多研究證實(shí),連鎖圖譜與關(guān)聯(lián)分析在數(shù)量性狀的定位中都具有不可替代的作用,兩者在定位的精度和廣度、提供的信息量、統(tǒng)計(jì)分析方法等方面具有良好的互補(bǔ)性[25-26]。通過關(guān)聯(lián)分析(見表3),共有9個(gè)位點(diǎn)與體重或體長(zhǎng)性狀顯著關(guān)聯(lián),其中,SNP51和SNP111與2個(gè)性狀均關(guān)聯(lián)顯著。9個(gè)位點(diǎn)共分布于3個(gè)連鎖群,其中18號(hào)連鎖群(LG18)有5個(gè)顯著位點(diǎn)。結(jié)合第一階段通過QTL作圖得到的結(jié)果,2/3的位點(diǎn)都位于18號(hào)連鎖群上,而且SNP51也在此連鎖群上,因此可以推測(cè)18號(hào)連鎖群可能是與大菱鲆生長(zhǎng)性狀緊密關(guān)聯(lián)的,下一階段可以針對(duì)此連鎖群做進(jìn)一步的研究。 表7 9個(gè)SNP位點(diǎn)所在序列基因功能預(yù)測(cè) 對(duì)9個(gè)關(guān)聯(lián)顯著的SNP位點(diǎn)在家系群體中的多態(tài)性進(jìn)行分析,其中,3個(gè)位點(diǎn)存在基因型缺失(見表4),其他6個(gè)位點(diǎn)基因型分布比較均勻;群體的平均觀測(cè)雜合度為0.387,稍大于期望雜合度(0.338)。9個(gè)位點(diǎn)的多態(tài)信息含量(PIC)都小于0.5,屬于低度或中度多態(tài)性位點(diǎn)。哈迪溫伯格平衡(HWD)檢驗(yàn)結(jié)果顯示9個(gè)位點(diǎn)中5個(gè)位點(diǎn)偏離了平衡(P<0.05)。本研究實(shí)驗(yàn)群體是人工選育的大菱鲆家系群體,在選育過程中因多代選育使得部分等位基因的頻率發(fā)生了改變。張德寧等[27]對(duì)“黃選1號(hào)”三疣梭子蟹生長(zhǎng)性狀SNP的鑒定中,也有部分位點(diǎn)偏離了哈迪溫伯格平衡,這表明與生長(zhǎng)性狀相關(guān)聯(lián)SNP位點(diǎn)可能容易受到選種選配的影響。 連鎖不平衡(Linkage disequilibrium,LD)是指同一條染色體上等位基因間的非隨機(jī)相關(guān),包括2個(gè)標(biāo)記間、2個(gè)基因或QTL間的非隨機(jī)關(guān)聯(lián)。SNP標(biāo)記之間的連鎖不平衡在群體遺傳學(xué)、基因精確定位以及關(guān)聯(lián)分析中有重要應(yīng)用[28]。尤其在關(guān)聯(lián)分析研究中,從根本上講,關(guān)聯(lián)分析就是檢測(cè)的遺傳標(biāo)記和表型性狀的連鎖不平衡[29]。LD一般通過D’來(lái)進(jìn)行度量。D’的取值從0~1,當(dāng)D’=1時(shí),意味著2個(gè)標(biāo)記之間完全LD。本研究中,有2對(duì)SNP位點(diǎn)之間完全LD(D’=1),6對(duì)位點(diǎn)之間緊密LD(D’>0.9),在18號(hào)連鎖群上(LG18)80%位點(diǎn)間存在連鎖不平衡,因此該連鎖群是與生長(zhǎng)性狀關(guān)聯(lián)緊密的區(qū)域,具有很高的研究?jī)r(jià)值。生長(zhǎng)性狀是復(fù)雜的數(shù)量性狀,受多基因和多通路的調(diào)控。針對(duì)于復(fù)雜的性狀,基于單倍型的關(guān)聯(lián)分析在很多研究中被證明要比單個(gè)的位點(diǎn)分析更有統(tǒng)計(jì)效力[30-31]。因此,單倍型的研究更有利于發(fā)掘基因與表型性狀的相關(guān)性。在本研究中,對(duì)位于同一連鎖群的5個(gè)顯著關(guān)聯(lián)SNP進(jìn)行了單倍型分析(見表6),5個(gè)SNP位點(diǎn)共組成9種單倍型,其中,6種單倍型的頻率大于3%。CTTGA和CTTGT的單倍型頻率都大于25%,是2種主要的單倍型。通過連鎖不平衡分析和單倍型分析得知,18號(hào)連鎖群的某段區(qū)域和生長(zhǎng)性狀密切關(guān)聯(lián),是連鎖不平衡區(qū)域,這與關(guān)聯(lián)分析得到的結(jié)果是一致的。 在對(duì)9個(gè)SNP位點(diǎn)序列進(jìn)行比對(duì)分析后發(fā)現(xiàn),共匹配到6個(gè)功能基因。其中補(bǔ)體9基因(Complement compoment 9 gene)和干擾素因子4a1基因(Requlatory factor-4a1 gene)是與免疫相關(guān)的基因,與生長(zhǎng)相關(guān)的功能還沒有報(bào)道。細(xì)胞珠蛋白(Cytoglobin-2)是血紅素蛋白家族中的一員,具有攜氧、氧感受器的功能,在脊椎動(dòng)物中普遍存在,有研究表明,它可能與膠原的形成有關(guān)[32]。COL11A1基因功能報(bào)道目前只出現(xiàn)在人類疾病研究中,它編碼Ⅺ型膠原α1亞基,與軟骨膠原纖維的組裝有關(guān)。COL11A1基因突變會(huì)導(dǎo)致人類身高發(fā)育異常,有研究表明,這可能與骨骼中膠原纖維的錯(cuò)配有關(guān)[33]。周伏圣等[34]利用全基因組關(guān)聯(lián)分析的方法,發(fā)現(xiàn)COL11A1基因啟動(dòng)子2個(gè)SNP位點(diǎn)與漢族人的身高顯著有關(guān)。另外,小鼠的Cho基因與人類COL11A1基因是同源基因,有研究發(fā)現(xiàn)[35],Cho純合子的缺失導(dǎo)致小鼠軟骨發(fā)育不全,體長(zhǎng)明顯變短。Notch1基因編碼一類高度保守的細(xì)胞表面受體,它主要功能是調(diào)節(jié)生物細(xì)胞的發(fā)育,影響細(xì)胞正常形態(tài)發(fā)生的多個(gè)過程,包括細(xì)胞分化、細(xì)胞凋亡、細(xì)胞增殖以及細(xì)胞邊界的形成。目前,Notch1基因在魚類的研究中已有相關(guān)報(bào)道,在斑馬魚中,Notch1基因主要參與魚類中樞神經(jīng)系統(tǒng)的分化,特別是與體節(jié)中胚層的形成密切相關(guān);而在虹鱒魚中,Notch1基因的功能與生殖細(xì)胞的發(fā)育有關(guān)[36-37]。COL11A1基因和Notch1基因在大菱鲆的研究中還未見報(bào)道,但相關(guān)研究結(jié)果表明此類基因與細(xì)胞生長(zhǎng)以及胚胎發(fā)育息息相關(guān),某些基因的突變會(huì)對(duì)生長(zhǎng)性狀造成影響,因此后續(xù)的研究中可以將這些基因作為影響大菱鲆生長(zhǎng)性狀的候選基因,進(jìn)一步研究基因的功能。 本研究根據(jù)QTL作圖篩選獲得的100個(gè)與大菱鲆生長(zhǎng)性狀相關(guān)的候選SNP位點(diǎn),在多個(gè)大菱鲆家系中利用關(guān)聯(lián)分析的方法進(jìn)一步驗(yàn)證,結(jié)果發(fā)現(xiàn)9個(gè)位點(diǎn)與大菱鲆體重或體長(zhǎng)性狀顯著關(guān)聯(lián)。9個(gè)位點(diǎn)在大菱鲆家系群體中的多態(tài)性顯著,屬于中度多態(tài)性位點(diǎn)。連鎖不平衡和單倍型分析結(jié)果表明,位點(diǎn)間存在顯著的連鎖不平衡,其中,CTTGA和CTTGT是2種主要的單倍型。最后,通過分析顯著位點(diǎn)的序列信息探討了相關(guān)基因的功能,推測(cè)COL11A1和Notch1基因可能是與大菱鲆生長(zhǎng)相關(guān)的重要功能基因。這些結(jié)果將有利于推進(jìn)大菱鲆生長(zhǎng)相關(guān)分子標(biāo)記的研究,為下一步基因定位以及分子標(biāo)記輔助育種提供更多的標(biāo)記基礎(chǔ)。 [1] 雷霽霖, 劉新富. 大菱鲆ScophthalmusmaximusL. 引進(jìn)養(yǎng)殖的初步研究[J]. 現(xiàn)代漁業(yè)信息, 1995, 10(11): 1-3. Lei J L, Liu X F. An primary study on culture of turbot,ScophthalmusmaximusL [J]. Modern Fisheries Information, 1995, 10(11): 1-3. [2] 雷霽霖, 馬愛軍, 陳超, 等. 大菱鲆(ScophthalmusmaximusL.)養(yǎng)殖現(xiàn)狀與可持續(xù)發(fā)展[J]. 中國(guó)工程科學(xué), 2005, 7(5): 30-34. Lei J L, Ma A J, Chen C, et al. The present status and sustainable development of turbot (ScophthalmusmaximusL. ) culture in China [J]. Engineering Science, 2005, 7(5): 30-34. [3] 申雪艷, 宮慶禮, 雷霽霖, 等. 進(jìn)口大菱鲆ScophthalmusmaximusL. 苗種的遺傳結(jié)構(gòu)分析[J]. 海洋與湖沼, 2004, 35(4): 332-341. Shen X Y, Gong Q L, Lei J L, et al. Population genetic structure analysis of the imported turbot seedlingsScophthalmusmaximusL. using RAPD and microsatellite technique [J]. Oceanologia et Limnologia Sinica, 2004, 35(4): 332-341. [4] 許可, 馬愛軍, 王新安, 等. 大菱鲆(Scophthalmusmaximus)生長(zhǎng)性狀相關(guān)的微衛(wèi)星標(biāo)記篩選[J]. 海洋與湖沼, 2009, 40(5): 577-583. Xu K, Ma A J, Wang X A, et al. microsatellites molecular markers and the correlation to growth trait ofScophthalmusmaximus[J]. Oceanologia et Limnologia Sinica, 2009, 40(5): 577-583. [5] 孫效文, 魯翠云, 智英, 等. 水產(chǎn)動(dòng)物分子育種研究進(jìn)展[J]. 中國(guó)水產(chǎn)科學(xué), 2009, 16(6): 981-990. Sun X W, Lu C Y, Jia Z Y, et al. The progress of molecular marker-based breeding for aquatic species [J]. Journal of Fishery Sciences of China, 2009, 16(6): 981-990. [6] Vignal A, Milan D, SanCristobal M, et al. A review on SNP and other types of molecular markers and their use in animal genetics[J]. Genetics Selection Evolution, 2002, 34(3): 275-306. [7] Creelman E K, Hauser L, Simmons R K, et al. Temporal and geographic genetic divergence: characterizing sockeye salmon populations in the Chignik Watershed, Alaska, using single-nucleotide polymorphisms[J]. Transactions of the American Fisheries Society, 2011, 140(3): 749-762. [8] Wang W, Hu Y, Ma Y, et al. High-density genetic linkage mapping in Turbot (ScophthalmusmaximusL. ) based on SNP markers and major sex and growth-related regions detection[J]. Plos One, 2015, 10(3): 120410. [9] Buzanskas M E, Grossi D A, Ventura R V, et al. Genome-wide association for growth traits in Canchim beef cattle[J]. Plos One, 2014, 9(4): 94802. [10] McCarthy M I, Abecasis G R, Cardon L R, et al. Genome-wide association studies for complex traits: Consensus, uncertainty and challenges[J]. Nature Reviews Genetics, 2008, 9(5): 356-369. [11] Lv J, Liu P, Gao B, et al. Transcriptome analysis of the Portunus trituberculatus: de novo assembly, growth-related gene identification and marker discovery[J]. Plos One, 2014, 9(4): 94055. [12] Li XH, Bai JJ, Ye X, et al. Polymorphisms in the 5′flanking region of the insulin-like growth factor I gene are associated with growth traits in largemouth bassMicropterussalmoides[J]. Fisheries Science, 2009, 75(2): 351-358. [13] Wang X, Meng X, Song B, et al. SNPs in the myostatin gene of the molluskChlamysfarreri: association with growth traits[J]. Comparative Biochemistry and Physiology Part B: Biochemistry and Molecular Biology, 2010, 155(3): 327-330. [14] Sun Y, Yu X, Tong J. Polymorphisms in myostatin gene and associations with growth traits in the common carp (CyprinuscarpioL.)[J]. International Journal of Molecular Sciences, 2012, 13(11): 14956-14961. [15] Yeh F, Yang R, Boyle T, et al. Pop Gene32, Microsoft Windows-based freeware for population genetic analysis, version 1. 32[CP]. Edmonton, Alberta, Canada: Molecular Biology and Biotechnology Centre, University of Alberta, 2000. [16] Nagy S, Poczai P, Cernák I, et al. PICcalc: an online program to calculate polymorphic information content for molecular genetic studies[J]. Biochemical Genetics, 2012, 50(9-10): 670-672. [17] Yong Y, Lin H. SHEsis, a powerful software platform for analyses of linkage disequilibrium, haplotype construction, and genetic association at polymorphism loci[J]. Cell Research, 2005, 15(2): 97-98. [18] 趙瓊一, 李信, 周德貴, 等. 后基因組時(shí)代下作物的 SNP 分型方法[J]. 分子植物育種, 2010, 8(1): 125-133. Zhao Q Y, Li X, Zhou D G, et al. SNP genotyping methods for crops in post-genomic Era [J]. Molecular Plant Breeding, 2010, 8(1): 125-133. [19] Tang K, Opalsky D, Abel K, et al. Single nucleotide polymorphism analyses by MALDI-TOF MS[J]. International Journal of Mass Spectrometry, 2003, 226(1): 37-54. [20] Wang D G, Fan J B, Siao C J, et al. Large-scale identification, mapping, and genotyping of single-nucleotide polymorphisms in the human genome[J]. Science, 1998, 280(5366): 1077-1082. [21] Li Z, Jiasen L, Fuping Z, et al. Genome-wide association studies for growth and meat production traits in sheep[J]. Plos One, 2013, 8(6): 66569. [22] 樊慶燦, 王金玉, 張跟喜, 等. 京海黃雞生長(zhǎng)性狀與15個(gè)單核苷酸多態(tài)(SNP)位點(diǎn)的關(guān)聯(lián)分析[J]. 農(nóng)業(yè)生物技術(shù)學(xué)報(bào), 2014, 22(8): 1009-1017. Fan Q C, Wang J Y, Zhang G X, et al. Association analysis of fifteen single nucleotide polymorphism(SNP) loci with growth traits in Jinghai yellow chicken(Gallusgallus) [J]. Journal of Agricultural Biotechnology, 2014, 22(8): 1009-1017. [23] Bolormaa S, Hayes B J, Savin K, et al. Genome-wide association studies for feedlot and growth traits in cattle[J]. Journal of Animal Science, 2011, 89(6): 1684-1697. [24] 胡艷玲. 復(fù)雜性狀與基因組多位點(diǎn)的關(guān)聯(lián)分析方法研究[D]. 上海: 上海交通大學(xué), 2009: 4-6. Hu Y L. Study on the Methods of Genome Multi-loci Association Analysis for Complex Traits[D]. Shanghai: Shanghai Jiao Tong University School of Agriculture and Biology, 2009: 4-6. [25] Gupta P K, Rustgi S, Kulwal P L. Linkage disequilibrium and association studies in higher plants: Present status and future prospects[J]. Journal of Microbiological Methods, 2005, 57(4): 461-485. [26] 于海霞, 肖靜, 田紀(jì)春, 等. 關(guān)聯(lián)分析及其在植物中的應(yīng)用[J]. 基因組學(xué)與應(yīng)用生物學(xué), 2009, 28(1): 187-194. Yu H X, Xiao J, Tian J C, et al. Association analysis and its application in plants genetics[J]. Genomics and Applied Biology, 2009, 28(1): 187-194. [27] 張德寧, 呂建建, 劉萍, 等. 三疣梭子蟹生長(zhǎng)相關(guān) SNP 位點(diǎn)的鑒定[J]. 中國(guó)水產(chǎn)科學(xué), 2015, 22(3): 393-401. Zhang D J, Lv J J, Liu P, et al. Identifying SNP markers correlated with growth of swimming crab (Portunustrituberculatus) based on a comparative transcriptome[J]. Journal of Fishery Sciences of China, 2015, 22(3): 393-401. [28] Marty A, Amigues Y, Servin B, et al. Genetic variability and linkage disequilibrium patterns in the bovine DNAJA1 gene[J]. Molecular Biotechnology, 2010, 44(3): 190-197. [29] 何云剛, 金力, 黃薇. 單核苷酸多態(tài)性與連鎖不平衡研究進(jìn)展[J]. 基礎(chǔ)醫(yī)學(xué)與臨床, 2004, 24(5): 78-81. He Y G, Jin L, Huang W. Advance in the research of single nucleotide polymorphism and linkage disequilibrium [J]. Basic Medical Sciences and Clinics, 2004, 24(5): 78-81. [30] BaderJ S. The relative power of SNPs and haplotype as genetic markers for association tests[J]. Pharmacogenomics, 2001, 2(1): 11-24. [31] Zhang K, Calabrese P, Nordborg M, et al. Haplotype block structure and its applications to association studies: power and study designs[J]. The American Journal of Human Genetics, 2002, 71(6): 1386-1394. [32] Hankeln T, Ebner B, Fuchs C, et al. Neuroglobin and cytoglobin in search of their role in the vertebrate globin family[J]. Journal of Inorganic Biochemistry, 2005, 99(1): 110-119. [33] Majava M, Hoornaert K P, Bartholdi D, et al. A report on 10 new patients with heterozygous mutations in the COL11A1 gene and a review of genotype-phenotype correlations in type XI collagenopathies[J]. American Journal of Medical Genetics Part A, 2007, 143(3): 258-264. [34] 周伏圣, 孫良丹, 高敏, 等. COL11A1 基因啟動(dòng)子多態(tài)與漢族人身高的關(guān)聯(lián)分析[J]. 安徽醫(yī)科大學(xué)學(xué)報(bào), 2009, 44(3): 331-334. Zhou F S, Sun L D, Gao M, et al. Association between polymorphisms of COLl 1A1 gene promoter and adult height in Chinese Han population[J]. Acta Universitatis Medicinalis Anhui, 2009, 44(3): 331-334. [35] Li Y, Lacerda D A, Warman M L, et al. A fibrillar collagen gene, Col11a1, is essential for skeletal morphogenesis[J]. Cell, 1995, 80(3): 423-430. [36] Yano A, Von Schalburg K, Cooper G, et al. Identification of a molecular marker for type a spermatogonia by microarray analysis using gonadal cells from pvasa-GFP transgenic rainbow trout (Oncorhynchusmykiss)[J]. Molecular Reproduction & Development, 2009, 76(3): 246-254. [37] Westin J, Lardelli M. Three novel Notch genes in zebrafish: implications for vertebrate Notch gene evolution and function[J]. Development Genes & Evolution, 1997, 207(1): 51-63. 責(zé)任編輯 朱寶象 Validation of Single Nucleotide Polymorphism (SNP) Loci Related to Growth Traits in Turbot (Scophthalmus maximus L.) Families TIAN Tao1,2,3, WANG Wei-Ji2,3, CHEN Zai-Zhong1, HU Yu-Long2,3, WANG Mo-Sang1,2,3,LV Ding2,3,4, LI Zhi-Xiang1,2,3 (1.College of Fisheries and Life Science, Shanghai Ocean University, Shanghai 201306, China; 2.The Key Laboratory of Sustainable Development of Marine Fisheries, Ministry of Agriculture, Yellow Sea Fisheries Research Institute, Chinese Academy of Fisheries Science, Qingdao 266071, China; 3.Function Laboratory for Marine Fisheries Science and Food Production Processes, National Laboratory for Ocean Science and Technology, Qingdao 266071, China; 4.Wuxi Fisheries College, Nanjing Agriculture University, Wuxi 214081, China) In order to further identify single nucleotide polymorphism (SNP) associated with the growth traits of turbot (ScophthalmusmaximusL.), the time of flight mass spectrometer(TOF-MS)was used to genotyping 100 SNP loci of four turbot families, 160 individuals in total, and the association of SNPs with growth traits (body weight and body length)was analyzed based on the high-density linkage map of turbot. For the significant SNP loci, polymorphism of loci each was detected in the population, meanwhile, linkage disequilibrium (LD) and haplotype analysis were performed for the significant SNPs located in the same linkage group (LG). At last, the sequence around the site was aligned in NCBI database and then detected the function of the matched gene. The results showed that 9 SNPs were identified to be associated with the growth traits (P<0.05). Among these SNPs, four loci were associated with body weight and seven were associated with body length significantly (P<0.05). SNP51 and SNP111 were identified to be associated with both body weight and body length (P<0.05). The genetic parameters showed that the observed heterozygosity (Ho) ranged from 0.126 to 0.719 (Mean=0.387) and expected heterozygosity (He) estimates from 0.118 to 0.501 (Mean=0.338). The average polymorphism information content (PIC) was 0.267, indicating that the 9 loci were reasonably informative. Five of the 9 SNP loci deviated significantly from Hardy-Weinberg equilibrium (HWE). Strong linkage disequilibrium occurred among the five SNPs in the LG18 according to the LD analysis results. Moreover, haplotype CTTGT and CTTGA were two important types as they accounted for 26.8% and 25.9% of total haplotypes, respectively. Finally, the alignment results showed thatCOL11A1 gene andNOTCH1 gene may be related to the growth traits. However, further studies are needed to explore their function in the turbot development. These findings will boost molecular marker relating to growth traits screening and provide theoretical basis to the marker assisted selection (MAS) and gene location. ScophthalmusmaximusL.; growth trait; single nucleotide polymorphism(SNP); association analysis 國(guó)家十二五“863”重要鲆鰈魚類良種培育子課題大菱鲆良種培育項(xiàng)目(2012AA10A408-7)資助 Supported by the National High Technology Research and Development Program of China (2012AA10A408-7) 2016-03-03; 2016-05-04 田 濤(1991-)男,碩士生,主要從事水產(chǎn)動(dòng)物遺傳育種方向研究。 ?? 通訊作者:E-mail:wangwj@ysfri.ac.cn Q754; S917.4 A 1672-5174(2016)12-032-09 10.16441/j.cnki.hdxb.20160055 田濤, 王偉繼, 陳再忠, 等. 大菱鲆生長(zhǎng)性狀相關(guān)單核苷酸多態(tài)位點(diǎn)的多家系驗(yàn)證[J]. 中國(guó)海洋大學(xué)學(xué)報(bào)(自然科學(xué)版), 2016, 46(12): 32-40. TIAN Tao, WANG Wei-Ji, CHEN Zai-Zhong, et al. Validation of single nucleotide polymorphism (SNP) loci related to growth traits in turbot (ScophthalmusmaximusL.) families[J]. Periodical of Ocean University of China, 2016, 46(12): 32-40.3 討論
4 結(jié)語(yǔ)