岳慶春 傅迦得 章辰飛 吳月燕
摘要:隨著分子生物學和基因組學的快速發(fā)展,關聯(lián)分析成為近些年來在植物數(shù)量性狀研究和植物良種選育中行之有效的分析方法。利用關聯(lián)分析在分子水平闡明植物表型性狀的遺傳變異規(guī)律和機制,從而為植物的農(nóng)藝性狀改良及新品種選育提供新思路。系統(tǒng)詳實綜述了關聯(lián)分析基本原理、關聯(lián)作圖的基本策略、關聯(lián)分析的應用以及各種分子標記在關聯(lián)分析中的應用,并討論了關聯(lián)分析在未來研究中的發(fā)展前景。
關鍵詞:關聯(lián)分析;植物;表型性狀;遺傳變異;農(nóng)藝性狀改良;新品種選育;連鎖不平衡;研究發(fā)展趨勢;應用前景
中圖分類號: S184文獻標志碼: A
文章編號:1002-1302(2019)18-0024-06
收稿日期:2018-06-01
基金項目:浙江省寧波市重大科技專項(編號:2015C110016)。
作者簡介:岳慶春(1994—),男,甘肅定西人,碩士研究生,研究方向為果樹種質(zhì)資源開發(fā)與利用。E-mail:yueqingchun1118@163.com。
通信作者:吳月燕,碩士,教授,研究方向為果樹種質(zhì)資源。E-mail:wyynb2009@163.com。
關聯(lián)分析(association analysis)也稱連鎖不平衡作圖(LD mapping)或者關聯(lián)作圖(association mapping),該方法通常以自然群體為研究對象,以連鎖不平衡(linkage disequilibrium,LD)為基礎,將目的性狀表型的多樣性以及遺傳標記或候選基因的多態(tài)性聯(lián)結起來分析,鑒定某一群體內(nèi)目的性狀與遺傳標記或候選基因之間的關系[1]。從而在分子水平解釋植物表型性狀的遺傳變異規(guī)律和機制,為植物表型性狀的標記輔助選擇以及目的基因的分離、檢測、利用提供依據(jù),進而為植物性狀遺傳改良研究提供理論基礎,為植物雜交育種和性狀改良尋求新途徑[2]。
到目前為止,關聯(lián)分析已經(jīng)在部分植物性狀研究中取得進展,如玉米的開花期[3]、小麥的籽粒大小和研磨品質(zhì)[4]、水稻的柱頭[5]、葡萄的果穗長度[6]等,關聯(lián)分析已經(jīng)成為當前植物遺傳育種研究的熱點。
本文經(jīng)過系統(tǒng)全面的介紹關聯(lián)分析基本原理以及分析策略,詳細論述關聯(lián)分析在目前植物遺傳學研究中的應用進展以及各類分子標記技術在關聯(lián)分析中的應用,探討關聯(lián)分析在今后的研究發(fā)展趨勢和在植物遺傳研究中的應用前景。
1?關聯(lián)分析基本原理
1.1?連鎖不平衡
關聯(lián)分析是以連鎖不平衡(linkage disequilibrium,LD)為基礎,也可稱為配子相不平衡(gametic phase disequilibrium)、配子不平衡(gametic disequilibrium)、等位基因關聯(lián)(allelic association)等,是指群體內(nèi)不同座位等位基因(可以是標記,也可以是基因/QTL間與標記)間的非隨機關聯(lián)[7]。也就是說假設2個不同位點的等位基因一同出現(xiàn)的頻率比理論上同時出現(xiàn)頻率高時,那么稱這2個位點處于連鎖不平衡狀態(tài)[8]。LD的基本定義式為Dij=fij-PAi·PBj,其中fij是AiBj基因型的頻率,PAi和PBj分別是等位基因Ai和Bj的頻率。由于Dij可以假定的最大值是所觀察到的等位基因頻率的函數(shù),因此對于雙等位基因和多等位基因,LD的強度有多種標準化度量,其中2種最常見的LD強度測量方法是:(1)單個LD值的標準化度量,Dij′=Dij/Dmax;(2)雙等位基因數(shù)據(jù)的相關系數(shù)r,常用定義為r2=Dij2/(PA1·PA2·PB1·PB2)[9]。同一染色體或者不同染色體的基因座之間均可出現(xiàn)連鎖不平衡狀態(tài),群體內(nèi)存在的LD均是由突變造成的等位基因出現(xiàn)后座位間所有重組響應累積的結果,位點間連鎖越緊密,其LD程度越高[10]。
1.2?影響連鎖不平衡的因素
遺傳因素和非遺傳因素綜合作用影響群體的LD水平[11]。一般情況下,在隨機匹配群體里沒有突變、遷移或選擇因素的影響時,多態(tài)性位點則處于連鎖平衡狀態(tài);與此相反,連鎖、群體混合和選擇將增加LD水平[12]。影響LD程度最重要的2個要素是突變和重組,突變是造成LD的一個重要因素,新突變的發(fā)生可沖破原有LD,進而導致新的多態(tài)性產(chǎn)生;然而重組則是經(jīng)過重新組合序列變異,進而減弱染色體內(nèi)部的LD。無連鎖和自由交配的重組使位點間等位基因處于連鎖平衡狀態(tài),因此LD的水平與重組率成反比[10]。群體中的LD是突變、重組和其他因素影響共同累積的結果[13]。
此外,其他非生物要素和生物要素也影響LD程度,例如物種之間的交配體系、染色體位置、群體大小以及自然與人工選擇[10]。基因轉(zhuǎn)換或染色體片段所受的選擇強度、遺傳漂變[14-15]等也是影響LD水平的因素。
1.3?連鎖不平衡與關聯(lián)分析
在自然群體中,表型差異的根本原因主要是個體等位基因間的差異。連鎖分析則是采用標記位點與引起表型差異位點之間的重組來定位數(shù)量性狀基因座(quantitativetraitlocus,QTL),而關聯(lián)分析利用引起表型差異的位點與標記之間的LD來定位QTL[10]。因此,進行關聯(lián)分析的前提和基礎是了解群體基因組LD的構造和規(guī)律。往往因為群體的基因組中存在數(shù)目巨大的多態(tài)性,因此多態(tài)位點的等位基因間存在廣泛的非隨機關聯(lián),亦稱為LD狀態(tài)。多個基因座等位基因間的連鎖不平衡結構會產(chǎn)生一系列的單倍型,單倍型的大小則受LD衰減程度的影響。不同物種的連鎖不平衡衰減距離不同,同一物種不同群體、同一群體不同座位的LD衰減距離也不同[16]。染色體上不同位置的連鎖不平衡程度也不相同,研究發(fā)現(xiàn)位于著絲粒附近片段的重組率比較低,LD水平則較高;然而染色體臂上的片段區(qū)域重組率相對較高,相應LD水平則較低[17]。連鎖不平衡的衰減程度越高,則形成的單倍型越小[10]。
1.4?關聯(lián)分析與傳統(tǒng)連鎖分析的差異
關聯(lián)分析與傳統(tǒng)連鎖分析相比具有以下優(yōu)勢:(1)關聯(lián)分析不必構建專門作圖群體,而是運用自然群體的遺傳多樣性,將復雜的性狀變異進行分解。利用關聯(lián)分析構建的群體不須要管制研究對象的交配方式,而傳統(tǒng)的連鎖分析以父母本雜交產(chǎn)生的子代群體為研究對象。相比而言,關聯(lián)分析可應用的種質(zhì)材料更加廣泛。(2)關聯(lián)分析所研究的材料有較為寬泛的遺傳基礎,因此可同時對同一基因座的多個等位基因進行檢測分析,相比絕大部分傳統(tǒng)連鎖分析,其所研究群體通常為2個親本雜交重組的后代,所以基因座一般只觸及2個等位基因。關于具備更小效應的基因,關聯(lián)分析的發(fā)掘能力顯著高于傳統(tǒng)連鎖分析[13]。(3)關聯(lián)分析定位更精準,能夠抵達單基因程度,由于關聯(lián)分析應用在長期進化進程中自然群體所積累的重組信息,因而可到達更高的分辨率,從而達到對QTL的精準定位,甚至可直接定位到基因本身[10]。而傳統(tǒng)連鎖分析往往受到重組發(fā)生率的影響,進而導致分辨率較低,一般認為初級群體只能將QTL定位到10~20 cM的基因組區(qū)間內(nèi),而次級群體可達到單基因水平[18-19]。(4)運用的統(tǒng)計分析方法不同,傳統(tǒng)的連鎖作圖措施包含了單標記分析、區(qū)間作圖、復合區(qū)間作圖以及貝葉斯區(qū)間作圖[13]。與此相比,適用于關聯(lián)分析作圖的統(tǒng)計方法較為匱乏。
2?關聯(lián)分析的基本策略
2.1?基于全基因組掃描的關聯(lián)分析
全基因組關聯(lián)分析(genome-wide association study,GWAS)是采用自然變異群體,聯(lián)合高密度分子標記圖譜進行掃描,進而分析表型性狀與分子標記之間關聯(lián)關系的有效方法,現(xiàn)已發(fā)展成為發(fā)掘復雜農(nóng)藝性狀遺傳變異的有效手段[20]。在以全基因組掃描為基礎的的關聯(lián)分析中,須要用散布于全基因組的高通量分子標記對某物種大群體的全部基因進行同時檢測[8]。GWAS以群體中LD水平為基礎,借助成百上千的個體組成的定位群體,采用一定數(shù)量的SNP標記構建的高密度遺傳圖譜,從而與表型數(shù)據(jù)進行關聯(lián)分析。近年來,基于GWAS技術已在多種植物表型研究中取得一定的進展。代力強等以80份玉米核心自交系為關聯(lián)作圖群體,通過全基因組測序,篩選出16個與玉米粒長緊密關聯(lián)的顯著性SNP標記和3個候選基因[21]。劉靜利用高密度的小麥90K單核苷酸多態(tài)性(SNP)芯片對西南麥區(qū)192份小麥品種進行株高性狀的全基因組關聯(lián)分析,發(fā)現(xiàn)57個與株高顯著相關的SNP位點[22]。Feng等利用全基因組測序的472份油菜種質(zhì),在染色體A03、A05、A07和C07上鑒定出8個QTL與株高顯著相關,在染色體A01、A03、A07和C07上的5個QTL被鑒定為與主枝數(shù)顯著相關[23]。目前,基于全基因組關聯(lián)分析已在各類植物物種深入研究,但在園藝植物中應用報道較為匱乏。
GWAS一般采用5步進行:(1)關聯(lián)群體的選擇。應選擇遺傳變異豐富、表型差異較大、遺傳基礎較寬泛且應盡量包含某物種全部的遺傳變異。(2)樣本基因分型。基于常用的分子標記主要包括RFLP、AFLP、SSR及SNP等,隨著全基因測序技術的不斷發(fā)展,SNP標記方法得到廣泛運用。除了使用基因芯片進行基因分型以外,還可直接重新測序獲得研究樣本個體的基因型,進而更加全面地挖掘樣本基因組變異[20]。(3)群體構造與個體親緣關系分析。GWAS通常以自然變異群體為研究對象,存在一定的遺傳結構,其個體間也存在一定的親緣關系,因而有可能導致染色體間的LD水平提高,使得目標性狀與不相關的標記產(chǎn)生偽關聯(lián)。因此,檢測分析并矯正種質(zhì)材料的群體結構有一定的必要。(4)目標性狀的鑒定。目標性狀評價的準確性對于關聯(lián)分析的結果有重要影響,應反復對種質(zhì)材料進行多重表型分析鑒定。(5)關聯(lián)統(tǒng)計分析模型的選擇。隨著生物統(tǒng)計學的不斷發(fā)展,關聯(lián)統(tǒng)計分析模型不斷得到完善,主要包含一般線性模型(GLM)和混合線性模型(MLM),通??衫肨ASSEL軟件或ANOVA計算方法進行關聯(lián)分析[24]。
隨著第3代測序技術即單分子測序技術的發(fā)展,植物中主要物種全基因組測序逐步完成,物種的基因組信息越來越豐富,進而開發(fā)出大量的SNP標記。全基因組關聯(lián)分析將成為今后植物數(shù)量性狀研究的有利工具[25]。
2.2?基于候選基因的關聯(lián)分析
基于候選基因關聯(lián)分析主要針對于目標QTL區(qū)段內(nèi)候選基因進行生物信息學分析,推定其生物學功能是否與數(shù)量性狀表型位于同一調(diào)控網(wǎng)絡,或是輔以生理生化分析,從而快速確定QTL區(qū)間內(nèi)的候選基因,最終只針對篩選后的少數(shù)候選基因開展關聯(lián)分析[26]。早在2001年,Thornsberry等初次將關聯(lián)分析方法引入植物領域研究[27]。根據(jù)前人研究發(fā)現(xiàn),dwarf8基因是一個與赤霉素的代謝相關且顯著影響玉米株高的基因[28],而后Thornsberry等選用92份玉米自交系種質(zhì)對dwarf8基因的多態(tài)性進行驗證,研究表明dwarf8基因不僅影響玉米的株高,而且首次發(fā)現(xiàn)其中幾個多態(tài)性位點與玉米開花期的變異性狀顯著相關[27]。此項研究發(fā)現(xiàn)意味著基于連鎖不平衡的關聯(lián)分析可能是進行基因功能驗證以及基因發(fā)掘的一種行之有效的辦法,為植物表型性狀研究提供了新思路[16]。近年來,基于候選基因的關聯(lián)分析已經(jīng)成功應用于部分植物研究。Yu等以295份水稻材料在苗期進行水稻耐鹽相關表型的全基因組關聯(lián)研究,獲得了93個候選基因,其中有6個與耐鹽表型具有高關聯(lián)[29]。Perez等以315份不同高粱材料,利用候選基因關聯(lián)作圖的方法,檢測油菜素內(nèi)酯生物合成和信號傳導基因與植物結構性狀之前的標記-性狀關聯(lián),共檢測出26個油菜素內(nèi)酯基因的73個SNPs與目標表型顯著相關[30]。于永濤利用94份玉米自交系驗證了rab17基因與玉米籽粒產(chǎn)量相關聯(lián)[31]。Andersen等利用SNP分子標記驗證了PAL基因與玉米飼用品質(zhì)間相互關聯(lián)[32]。劉翠霞以150份葡萄雜交后代為試驗材料,聯(lián)合RNA-seq技術初步篩選了32個候選基因參與單萜代謝[33]。國內(nèi)外研究結果均表明,基于候選基因關聯(lián)分析是一個進行鑒定候選基因功能的強有力的工具。
運用關聯(lián)分析與功能基因標記進行分子標記輔助育種(molecular marker-as-sisted selection,MAS),有以下2個方面的優(yōu)勢:(1)由于選擇的就是基因本身,因而可以保證選擇的準確性,從而提高選擇效率;(2)能夠采用關聯(lián)分析針對定向的影響性狀變異的功能區(qū)域進行特定選擇,從而保障選擇效果。關聯(lián)分析聯(lián)合功能基因標記將是今后分子輔助育種發(fā)展的目標。采用功能性分子標記的辦法進行MAS以及植物種質(zhì)鑒定,對加速育種世代選擇、縮短育種年限、保護植物知識產(chǎn)權具有極其重要的意義[56]。
3.4?關聯(lián)分析與數(shù)量性狀的研究
植物中許多重要的表型性狀如產(chǎn)量、生理特征、營養(yǎng)品質(zhì)以及抗逆性等多屬于數(shù)量性狀,往往采用傳統(tǒng)的常規(guī)育種時效率不高,基于目前的科技發(fā)展,采用分子育種技術育種將是未來的發(fā)展方向。關聯(lián)分析作為一種高效的QTL鑒定工具,未來可在分子育種中起到一定的重要作用[10]。連鎖分析以及關聯(lián)分析均在數(shù)量性狀的研究中起關鍵作用,由于它們對數(shù)量性狀基因座定位的精確和寬泛、提供的信息量豐富以及統(tǒng)計方法準確等方面具備顯著的互補效應,因此研究者通常可先利用連鎖分析初步定位控制目標表型性狀等位基因的位置,進而使用關聯(lián)分析則可快速對目標基因進行精細定位,且根據(jù)特定候選基因提供豐富信息,從而驗證候選基因功能。因此,應當聯(lián)結連鎖分析和關聯(lián)分析各自的優(yōu)點,對數(shù)量性狀開展縱向和橫向的分析,以達到加快數(shù)量性狀基因的鑒定、分離以及克隆,最終為深入了解數(shù)量性狀的遺傳學和分子生物學基礎,更重要的是為植物數(shù)量性狀的遺傳改良提供新的契機[16]。
4?各類分子標記在關聯(lián)分析中的應用
4.1?SRAP分子標記
相關序列擴增多態(tài)性(sequence-related amplified polymorphism,SRAP)標記是基于PCR技術的第2代分子標記,目前已廣泛運用于植物的遺傳多樣性分析、遺傳連鎖圖譜的構建、測序以及基因克隆等方面[64]。李仁偉利用SRAP分子標記對58份大菊種質(zhì)的數(shù)量性狀進行關聯(lián)研究,結果表明有6個標記位點與花部性狀顯著相關[65]。丁澤婷等采用20份柱花草種質(zhì)進行表型性狀與SRAP標記關聯(lián)分析,結果發(fā)現(xiàn)有15個SRAP標記與鮮質(zhì)量相關聯(lián),1個SRAP標記與株高顯著相關[66]。羊杏平等利用46對SRAP引物組合對35份西瓜核心種質(zhì)進行關聯(lián)分析,將枯萎病抗性與SRAP多態(tài)性標記進行回歸分析,檢測到1個與抗病性顯著關聯(lián)的SRAP位點[67]。隨著第3代分子標記的發(fā)展,基于SRAP分子標記的關聯(lián)分析研究應用越來越少。
4.2?SSR分子標記
簡單序列重復(simple sequence repeats,SSR)原理為基因組中一般由1~6個核苷酸組成的基本單位反復多次構成的一段DNA,其廣泛分布在基因組中的不同位置。譚文麗采用80對SSR引物對149份木薯種質(zhì)進行全基因組多態(tài)性位點掃描,并通過關聯(lián)分析方法,結果表明,有151個多態(tài)性位點與21個性狀相關聯(lián),最終發(fā)現(xiàn)m224-c位點與株高極顯著關聯(lián)[68]。吳靜等利用經(jīng)過篩選得到的11對SSR標記對99份紫斑牡丹種質(zhì)進行多態(tài)性掃描,進而分析其遺傳多樣性和群體結構,采用一般線性模型進行標記與表型性狀關聯(lián)分析,結果發(fā)現(xiàn)5個標記位點與6個性狀顯著關聯(lián)[69]。潘磊等利用156對多態(tài)性SSR引物對83份豇豆種質(zhì)材料進行產(chǎn)量性狀與分子標記全基因組關聯(lián)分析,結果表明,有10個SSR標記位點與8個表型性狀關聯(lián),主要散布在LG2、LG3、LG4、LG7、LG11連鎖群上[70]。Yu等以99份多年生黑麥草種質(zhì)為材料,利用109對SSR標記進行關聯(lián)分析,發(fā)現(xiàn)其中15個SSR標記與淹水脅迫下葉色、葉綠素熒光、最大株高以及相對生長速率的降低顯著相關[71]。近年來,利用SSR分子標記進行關聯(lián)分析以及挖掘基因功能位點的研究越來越多,由此可見,關聯(lián)分析對于找尋與植物表型性狀緊密連鎖的SSR標記有顯著作用,從而可有效應用于分子標記輔助育種。
4.3?SNP分子標記
植物基因組中的核苷酸多態(tài)性主要有3種,包括插入、缺失以及單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)。其主要工作原理是在基因組水平上,由單個核苷酸堿基轉(zhuǎn)換或顛倒而引起的DNA序列多態(tài)性,又因為基因組DNA的任何堿基均有可能發(fā)生變異,因此單核苷酸多態(tài)性幾乎遍布整個基因組,SNP是植物中普遍存在的一種分子標記[72]。Zhou等利用533份水稻種質(zhì)中的650萬個SNP進行柱頭外露和相關花性狀的全基因組關聯(lián)分析,共鑒定了23個與柱頭外露和相關花性狀顯著相關的基因組位點[5]。Wang等對144份玉米自交系種質(zhì)中的45 868個SNP位點進行分析,結果發(fā)現(xiàn),18個SNP與玉米中黑穗病抗性顯著相關[73]。劉翔攀采用238份玉米自交系種質(zhì)材料,利用關聯(lián)分析找到相應的SNP,最終發(fā)現(xiàn)與單株產(chǎn)量降幅相關的SNP有15個,分別位于2、3、4、5、6、7、8號染色體上[74]。蔣俊利用593份雜交桃后代為試驗材料,對親本及雜交群體進行SNP位點檢測,從而構建遺傳連鎖圖譜以及針對簡單性狀的全基因組關聯(lián)分析,最后得到與果實酸度關聯(lián)的SNP標記,為SNPIGA545261[75]。許理文等采用240份DH系為關聯(lián)作圖群體,利用SNP芯片進行基因型分析,構建連鎖圖譜,對DH群體進行容重性狀鑒定,結果表明,共檢測到5個控制玉米容重的QTL[76]。隨著分子標記技術的快速發(fā)展,SNP標記技術在遺傳多樣性、遺傳基礎分析、針對重要性狀的基因定位、進行分子輔助育種與SNP標記開發(fā)、種質(zhì)鑒定等植物育種方面的研究進展中起到了不可替代的作用[77]。
4.4?SCoT分子標記
目標起始密碼子多態(tài)性分子標記(start codon targeted polymorphism,SCoT)則是在2009年由Collard和Mackill共同開發(fā)的一種新型分子標記方法[78],該方法具備操作簡單、可有效產(chǎn)生與性狀連鎖的標記、重復性好、引物設計簡單并具有通用性等一系列優(yōu)點。Rahimi等利用24個SCoT引物對39份車前草種質(zhì)進行全基因關聯(lián)作圖,使用Q和K因子的MLM模型進行關聯(lián)分析,結果得到16個與穗質(zhì)量、株高、穗長以及千粒質(zhì)量等性狀相關的SCoT標記[79]。Yan等使用18個EST-SSR和21個SCoT標記檢測了75份果園草種質(zhì)中的銹病性狀,利用TASSEL軟件進行關聯(lián)分析,發(fā)現(xiàn)了20個標記與銹病性狀顯著相關[80]。楊旭旭利用59份大菊種質(zhì),通過測量其表型性狀,進而結合SCoT分子標記進行關聯(lián)分析,共發(fā)現(xiàn)23個標記位點與7個性狀關聯(lián),其中有18個位點與花部性狀顯著相關[81]。袁王俊等采用10條SCoT引物對99份菊花種質(zhì)的基因組變異進行掃描,從而分析種質(zhì)的群體結構,運用一般線性模型和混合線性模型方法對10個表型性狀進行關聯(lián)分析,共發(fā)現(xiàn)3個SCoT位點與花序直徑相關聯(lián)[82]。韓國輝利用20條SCoT引物對92株Wan2橘橙×Li2甜橙雜交群體進行多樣性分析,最終得到30個SCoT標記被定位在已構建的9個連鎖群上[83]。SCoT作為一種新型的目的基因分子標記,目前已在部分植物中得到應用,包括種質(zhì)資源遺傳多樣性與親緣關系分析、種質(zhì)鑒定與指紋圖譜等,但絕大多數(shù)只停留在對研究材料PCR體系的優(yōu)化,而在基因差異表達和高密度分子遺傳連鎖圖譜以及重要性狀精細定位和功能基因克隆等方面應用相對較少[84]。
5?展望
植物關聯(lián)分析正處在快速發(fā)展的時期,隨著關聯(lián)分析方法的日益完善和更加便利準確的分析軟件不斷開發(fā),特別是高通量測序技術以及基因芯片技術研究的不斷發(fā)展,基于全基因組掃描的關聯(lián)分析方法將會幫助研究者在更多的植物物種中、更大的范圍內(nèi)完成關聯(lián)分析。到目前為止,關聯(lián)分析只在少數(shù)經(jīng)濟作物如油菜、大豆、油菜等中研究較為廣泛,而在一些園藝植物中,應用關聯(lián)分析進行功能基因定位研究報道極其匱乏,尤其基于候選基因關聯(lián)研究只掃描到植物基因組的一小部分,且基于候選基因關聯(lián)作圖的成功的研究成果很少。因此,具有高密度的SNP覆蓋度、大的樣本、小的群體結構的關聯(lián)分析在復雜性狀的分解上具有非常重要的發(fā)展前景[13]。值得關注的是,關聯(lián)分析對于遺傳多樣性偏低的群體作圖效果不如傳統(tǒng)QTL作圖,因此對于一些植物復雜數(shù)量性狀的解析中仍然不能撇棄傳統(tǒng)的連鎖作圖。在研究中應當將關聯(lián)分析和傳統(tǒng)QTL作圖優(yōu)勢互補,可先用連鎖分析來對QTL進行初步定位,然后采用關聯(lián)作圖來對其進行精細定位,QTL作圖與關聯(lián)分析的綜合利用將會是未來遺傳連鎖分析的發(fā)展方向。伴隨著植物基因組學的飛速發(fā)展和不斷完善,基于關聯(lián)分析挖掘新的功能基因、開發(fā)新標記以及定位優(yōu)異性狀將成為未來植物種質(zhì)資源研究以及良種選育的重要方法和手段。
參考文獻:
[1]Flint S A,Thornsberry J M,Buckler E S. Structure of linkage disequilibrium in plants[J]. Annual Review of Plant Biology,2003,54:357-374.
[2]彭?波. SSR標記與桑樹表型性狀的關聯(lián)分析[C]. 中南五省區(qū)蠶桑育種協(xié)作組,國家蠶桑產(chǎn)業(yè)技術體系遺傳育種研究室.中南五省區(qū)蠶桑育種協(xié)作研討會論文集,2009:5.
[3]Salvi S,Sponza G,Morgante M,et al. Conserved noncoding genomic sequences associated with a flowering-time quantitative trait locus in maize[J]. Proc Natl Acad Sci USA,2007,104:11376-11381.
[4]Breseghello F,Sorrells M E. Association mapping of kernel size and milling quality in wheat (Triticum aestivum L.) cultivars[J]. Genetics,2006,172:1165-1177.
[5]Zhou H,Li P B,Xie W B,et al. Genome-wide association analyses reveal the genetic basis of stigma exsertion in rice[J]. Molecular Plant,2017,10(4):634-644.
[6]Vafaee Y,Ghaderi N,Khadivi A. Morphological variation andmarker-fruit trait associations in a collection of grape (Vitis vinifera L.)[J]. Scientia Horticulturae,2017,225:771-782.
[7]Gaut B S,Long A D. The lowdown on linkage disequilibrium[J]. Plant Cell,2003,15(7):1502-1506.
[8]王榮煥,王天宇,黎?裕. 關聯(lián)分析在作物種質(zhì)資源分子評價中的應用[J]. 植物遺傳資源學報,2007,8(3):366-372.
[9]Single R M,Strayer N,Thomson G,et al. Martin asymmetric linkage disequilibrium:tools for assessing multiallelic LD[J]. Human Immunology,2016,77(3):288-294.
[10]譚賢杰,吳子愷,程偉東,等. 關聯(lián)分析及其在植物遺傳學研究中的應用[J]. 植物學報,2011,46(1):108-118.
[11]丁?霞,王林海,張艷欣,等. 芝麻核心種質(zhì)株高構成相關性狀的遺傳變異及關聯(lián)定位[J]. 中國油料作物學報,2013,35(3):262-270.
[12]蔣思霞,倪正斌,印志同,等. 糯玉米自交系遺傳多樣性及其產(chǎn)量、農(nóng)藝性狀與SSR分子標記的關聯(lián)研究[J]. 安徽農(nóng)業(yè)科學,2012,40(6):3212-3217,3283.
[13]王彩潔,徐?冉,于明飛. 關聯(lián)分析在植物育種中的應用現(xiàn)狀[J]. 山東農(nóng)業(yè)科學,2012,44(6):32-38,62.
[14]Gupta P K,Rustgi S,Kulwal P L. Linkage disequilibrium and association in higher plants:present status and future prospects[J]. Plant Mol Biol,2005,57:461-485.
[15]Oraguzie N C,Wilcox P L,Rikkerink E H A,et al. Linkage disequilibrium[M]// Oraguzie N C,Rikkerink E H A,Gardiner S E,et al. Association mapping in Plants. New York:Springer Verlag,2007:11-39.
[16]楊小紅,嚴建兵,鄭艷萍,等. 植物數(shù)量性狀關聯(lián)分析研究進展[J]. 作物學報,2007,33(4):523-530.
[17]倪正斌. 糯玉米自交系遺傳多樣性及產(chǎn)量,農(nóng)藝性狀與SSR分子標記的關聯(lián)研究[D]. 揚州:揚州大學,2010.
[18]Doerge R W. Mapping and analysis of quantitative trait loci in experimental populations[J]. Nat Rev Genet,2002,3:43-52.
[19]Holland J B.Genetic architecture of complex traits in plants[J]. Curr Opin Plant Biol,2007,10:156-161.
[20]魯?清. 水稻種質(zhì)資源重要農(nóng)藝性狀的全基因組關聯(lián)分析[D]. 北京:中國農(nóng)業(yè)科學院,2016.
[21]代力強,吳?律,董青松,等. 玉米籽粒長度的全基因組關聯(lián)分析[J]. 西北農(nóng)林科技大學學報(自然科學版),2018,46(6):1-8.
[22]劉?靜. 小麥株高性狀的全基因組關聯(lián)分析[C]. 第八屆全國小麥基因組學及分子育種大會摘要集,2017:1.
[23]Feng L,Chen B Y,Xu K,et al. A genome-wide association study of plant height and primary branch number in rapeseed(Brassica napus)[J]. Plant Science,2016,242:169-177.
[24]李海權,刁現(xiàn)民. 關聯(lián)分析及其在植物研究中的應用[J]. 河北農(nóng)業(yè)科學,2010,14(11):157-160.
[25]于海霞,肖?靜,田紀春,等. 關聯(lián)分析及其在植物中的應用[J]. 基因組學與應用生物學,2009,28(1):187-194.
[26]霍冬敖. 玉米穗粒數(shù)相關性狀QTL定位與候選基因關聯(lián)分析[D]. 武漢:華中農(nóng)業(yè)大學,2016.
[27]Thornsberry J M,Goodman M M,Doebley J,et al. Dwarf8 polymorphisms associate with variation in flowering time[J]. Nature Genetics,2001,28(3):286-289.
[28]Fujioka S,Yamane H,Spray C R,et al. The dominant non-gibberellin-responding dwarf mutant (D8) of maize accumulates native gibberellins[J]. Proceedings of the National Academy of Sciences of the United States of America,1988,85(23):9031-9035.
[29]Yu X,Bai G H,Luo N,et al. Association of simple sequence repeat (SSR) markers with submergence tolerance in diverse populations of perennial ryegrass[J]. Plant Science,2011,180(2):391-398.
[30]Perez M B,Zhao J,Yin Y H,et al. Association mapping of brassinosteroid candidate genes and plant architecture in a diverse panel of Sorghum bicolor[J]. Theoretical and Applied Genetics,2014,127(12):2645-2662.
[31]于永濤. 玉米核心自交系群體結構及耐旱相關候選基因rab17的等位基因多樣性分析[D]. 北京:中國農(nóng)業(yè)科學院研究生院,2006.
[32]Andersen J R,Zein I,Wenzel G,et al. High levels of linkage disequilibrium and associations with forage quality at a phenylalanine ammonia-lyase locus in European maize (Zea mays L.) inbreds[J]. Theoretical and Applied Genetics,2007,114(2):307-319.
[33]劉翠霞. 葡萄果實單萜化合物含量的QTL定位及其合成調(diào)控的候選基因篩選[D]. 武漢:中國科學院武漢植物園,2017.
[34]段繼鳳. 甘藍型油菜含油量性狀全基因組關聯(lián)分析[D]. 武漢:華中農(nóng)業(yè)大學,2013.
[35]Lander E,Kruglyak L. Genetic dissection of complex traits:guidelines for interpreting and reporting linkage results[J]. Nat Genet,1995,11:241-247.
[36]Pritchard J K,Rosenberg N A .Use of unlinked genetic markers to detect population stratification in association studies[J]. Am J Hum Genet,1999,65:220-228.
[37]Yu J M,Pressoir G,Briggs W H,et al.A unified mixedmodel method for association mapping that accounts for multiple levels of relatedness[J]. Nat Genet,2006,38:203-208.
[38]Spielman R S,McGinnis R E,Ewens W J. Transmission test for linkage disequilibrium:the insulin gene region and insulin-dependent diabetes mellitus (IDDM)[J]. American Journal of Human Genetics,1993,52(3):506-516.
[39]Devlin B,Roeder K.Genomic control for association studies[J]. Biometrics,1999,55:997-1004.
[40]Patterson N,Price A L,Reich D. Population structure and eigenanalysis[J]. PLoS Genetics,2006,2(12):2074-2093.
[41]Price A L,Patterson N J,Plenge R M,et al.Principal components analysis corrects for stratification in genome-wide association studies[J]. Nat Genet,2006,38:904-909.
[42]Li Q Z,Yu K. Improved correction for population stratification in genome-wide association studies by identifying hidden population structures[J]. Genetic Epidemiology,2008,32(3):215-226.
[43]Zhu C,Yu J.Nonmetric multidimensional scaling corrects for population structure in whole genome association studies[J]. Genetics,2009,182:875-888.
[44]Stich B,Melchinger A E.Comparison of mixedmodel approaches for association mapping in rapeseed,potato,sugar beet,maize,and Arabidopsis[J]. BMC Genomics,2009,10:94-94.
[45]馮建英,溫陽俊,張?瑾,等. 植物關聯(lián)分析方法的研究進展[J]. 作物學報,2016,42(7):945-956.
[46]Purcell S,Neale B,Todd-Brown K,et al. PLINK:a tool set for whole-genome association and population-based linkage analyses[J]. American Journal of Human Genetics,2007,81(3):559-575.
[47]Bradbury P J,Zhang Z,Kroon D E,et al. TASSEL:software for association mapping of complex traits in diverse samples[J]. Bioinformatics,2007,23(19):2633-2635.
[48]張福濤. 遺傳分析方法的GPU并行計算與優(yōu)化研究[D]. 杭州:浙江大學,2014.
[49]Wang S B,F(xiàn)eng J Y,Ren W L,et al. Improving power and accuracy of genome-wide association studies via a multi-locus mixed linear model methodology[J]. Scientific Reports,2016,6:19444.
[50]楊曉旭. 葡萄果實香氣物質(zhì)的QTL定位及關聯(lián)分析研究[D]. 沈陽:沈陽農(nóng)業(yè)大學,2017.
[51]武玉國,吳承來,秦保平,等. 黃淮冬麥區(qū)175個小麥品種的遺傳多樣性及SSR標記與株高和產(chǎn)量相關性狀的關聯(lián)分析[J]. 作物學報,2012,38(6):1018-1028.
[52]金?亮. 水稻關聯(lián)定位群體的構建及若干品質(zhì)性狀的關聯(lián)分析[D]. 杭州:浙江大學,2009.
[53]郝德榮. 大豆產(chǎn)量相關性狀QTL的關聯(lián)分析及候選基因GmGA3ox單倍型鑒定[D]. 南京:南京農(nóng)業(yè)大學,2011.
[54]賴?勇,王鵬喜,范貴強,等. 大麥SSR標記遺傳多樣性及其與農(nóng)藝性狀關聯(lián)分析[J]. 中國農(nóng)業(yè)科學,2013,46(2):233-242.
[55]申聰聰. 利用水稻MAGIC群體和種質(zhì)資源關聯(lián)分析定位抽穗期和株高QTL[D]. 北京:中國農(nóng)業(yè)科學院,2017.
[56]王云云. 關聯(lián)分析在植物遺傳學中的應用[J]. 黑龍江科學,2016,7(11):1-3.
[57]趙?曦. 玉米耐旱相關候選基因dhn2與表型性狀的關聯(lián)分析[D]. 北京:中國農(nóng)業(yè)科學院,2008.
[58]楊勝先,牛?遠,李?夢,等. 栽培大豆農(nóng)藝性狀的關聯(lián)分析及優(yōu)異等位變異挖掘[J]. 中國農(nóng)業(yè)科學,2014,47(20):3941-3952.
[59]孫曉棠,盧冬冬,歐陽林娟,等. 水稻紋枯病抗性關聯(lián)分析及抗性等位變異發(fā)掘[J]. 作物學報,2014,40(5):779-787.
[60]Andersen J R,Lübberstedt T. Functional markers inplants[J]. Trends Plant Sci,2003,8 (11):554-560.
[61]胡明建. 小麥粒重相關基因TaTGW6、TaTGW-7A克隆及其功能標記開發(fā)[D]. 合肥:安徽農(nóng)業(yè)大學,2016.
[62]張照貴. 小麥TaSnRK2.10基因的克隆、標記開發(fā)和功能分析[D]. 泰安:山東農(nóng)業(yè)大學,2014.
[63]Kumar B,Abdel-Ghani A H,Pace J A,et al. Association analysis of single nucleotide polymorphisms in candidate genes with root traits in maize (Zea mays L.) seedlings[J]. Plant Science,2014,224:9-19.
[64]張?飛,房偉民,陳發(fā)棣,等. 切花菊花器性狀的遺傳變異與相關性研究[J]. 浙江林學院學報,2008(3):293-297.
[65]李仁偉. 大菊品種遺傳多樣性及基于SRAP標記的分類研究[D]. 北京:北京林業(yè)大學,2011.
[66]丁澤婷,尹曉暢,唐燕瓊,等. 柱花草重要性狀與SSR、SRAP分子標記的關聯(lián)分析[J]. 分子植物育種,2017,15(5):1839-1845.
[67]羊杏平,劉?廣,侯喜林,等. 西瓜核心種質(zhì)枯萎病抗性與SRAP分子標記的關聯(lián)分析[J]. 園藝學報,2013,40(7):1298-1308.
[68]譚文麗. 木薯SSR標記與表型的關聯(lián)分析[D]. 海口:海南大學,2014.
[69]吳?靜,成仿云,龐利錚,等. 紫斑牡丹表型性狀與SSR分子標記的關聯(lián)分析[J]. 北京林業(yè)大學學報,2016,38(8):80-87.
[70]潘?磊,李?依,余曉露,等. 豇豆產(chǎn)量性狀與SSR分子標記的關聯(lián)分析[J]. 湖北農(nóng)業(yè)科學,2015,54(16):3952-3958,3962.
[71]Yu J,Zao W G,He Q,et al. Genome-wide association study and gene set analysis for understanding candidate genes involved in salt tolerance at the rice seedling stage[J]. Molecular Genetics and Genomics,2017,292(6):1391-1403.
[72]任鳳陽. 玉米自交系萌發(fā)特性的評價及SNP關聯(lián)分析[D]. 泰安:山東農(nóng)業(yè)大學,2014.
[73]Wang M,Yan J B,Zhao J R,et al. Genome-wide association study (GWAS) of resistance to head smut in maize[J]. Plant Science,2012,196:125-131.
[74]劉翔攀. 玉米自交系耐密性評價及SNP關聯(lián)分析[D]. 泰安:山東農(nóng)業(yè)大學,2017.
[75]蔣?俊. 桃高密度SNP圖譜構建于果實質(zhì)地和酸度全基因組關聯(lián)分析[D]. 杭州:浙江大學,2016.
[76]許理文,段民孝,田紅麗,等. 基于SNP標記的玉米容重QTL分析[J]. 玉米科學,2015,23(5):21-25.
[77]寧?洽,劉文國,楊偉光,等. SNP標記在玉米研究上的應用進展[J]. 玉米科學,2017,25(1):57-61.
[78]Collard B C Y,Mackill D J. Start codon targeted (SCoT) polymorphism:a simple,novel DNA marker technique for generating gene-targeted markers in plants[J]. Plant Molecular Biology Reporter,2008,27(1):86-93.
[79]Rahimi M,Nazari L,Kordrostami M,et al. Scot marker diversity among Iranian Plantago ecotypes and their possible association with agronomic traits[J]. Scientia Horticulturae,2018,233:302-309.
[80]Yan H D,Zhang Y,Zeng B,et al. Genetic diversity and association of EST-SSR and SCoT markers with rust traits in orchardgrass (Dactylis glomerata L.)[J]. Molecules,2016,21(1):66.
[81]楊旭旭. 菊花品種表型性狀與SCoT分子標記的關聯(lián)分析[D]. 開封:河南大學,2015.
[82]袁王俊,葉?松,董美芳,等. 菊花品種表型性狀與SSR和SCoT分子標記的關聯(lián)分析[J]. 園藝學報,2017,44(2):364-372.
[83]韓國輝. 基于EST-SSR、Genomic-SSR和SCoT標記的柑橘連鎖圖譜構建及雜種和多倍體遺傳分析[D]. 重慶:西南大學,2012.
[84]龍治堅,范理璋,徐?剛,等. SCoT分子標記在植物研究中的應用進展[J]. 植物遺傳資源學報,2015,16(2):336-343.