章細(xì)英,孔祥瑞
(福建省農(nóng)業(yè)科學(xué)院茶葉研究所,福建 福安 355015)
茶樹種質(zhì)資源作為開展茶樹種質(zhì)創(chuàng)制、育種和新產(chǎn)品開發(fā)的重要基礎(chǔ),是茶葉科技創(chuàng)新和產(chǎn)業(yè)可持續(xù)發(fā)展的重要依托[1]。所以,茶樹種質(zhì)資源的研究始終是茶學(xué)研究的重要組成部分。早期的研究基于茶樹生長(zhǎng)的復(fù)雜生態(tài)環(huán)境、長(zhǎng)期演化及自然選擇等明確了茶樹種質(zhì)資源的涵蓋范圍。之后,研究的重點(diǎn)則集中于收集、保存與保護(hù)方面[2]。隨著分析手段的不斷發(fā)展,圍繞茶樹種質(zhì)逐漸形成了茶樹種質(zhì)評(píng)價(jià)鑒定、核心種質(zhì)構(gòu)建等的細(xì)化研究方向[3,4]。尤其是近幾年,各大組學(xué)和交叉學(xué)科的飛速發(fā)展更對(duì)茶樹種質(zhì)資源的研究起到了積極的推動(dòng)作用。
共詞分析作為一種新的文獻(xiàn)評(píng)價(jià)方法,可以定量化探討特定學(xué)科領(lǐng)域的研究現(xiàn)狀,通過不同詞對(duì)之間的關(guān)系來反映各主題之間的內(nèi)在聯(lián)系[5]。本文應(yīng)用共詞分析對(duì)近20年我國(guó)國(guó)內(nèi)茶樹種質(zhì)資源研究主題進(jìn)行歸納分析,以期揭示該領(lǐng)域的主題結(jié)構(gòu)及熱點(diǎn)領(lǐng)域,不僅有助于了解茶樹種質(zhì)資源的最新研究進(jìn)展,也可為該領(lǐng)域的深入研究提供參考。
從CNKI的全部文獻(xiàn)中,以主題“茶樹”,詞頻并含“種質(zhì)資源”為檢索條件進(jìn)行高級(jí)檢索,時(shí)間范圍設(shè)定為1997年-2017年,并以Refworks格式導(dǎo)出TXT格式題錄,及文獻(xiàn)來源為學(xué)術(shù)期刊,共獲得相關(guān)研究文獻(xiàn)記錄218條。
所有數(shù)據(jù)統(tǒng)計(jì)分析均在R3.4及SPSS 19中完成。
利用R軟件文本處理函數(shù)寫成用于生成關(guān)鍵詞共詞矩陣的腳本,根據(jù)齊普夫第二定律T=[-1+(1+8I1)0.5]/2及經(jīng)驗(yàn)判斷(其中I1為出現(xiàn)1次的詞的數(shù)量)[6],凡是詞頻大于3(T=3)的都選入,利用這一方法可以得到22個(gè)關(guān)鍵詞(表1)。
表1 國(guó)內(nèi)茶樹種質(zhì)資源研究論文高頻關(guān)鍵詞
將相異矩陣導(dǎo)入SPSS 19進(jìn)行聚類分析,選擇Ward法、Phi方度量計(jì)數(shù)、Z得分標(biāo)準(zhǔn)化,聚類結(jié)果見圖1,近20年茶樹種質(zhì)資源領(lǐng)域的研究可分為4個(gè)類團(tuán)。各類間的距離映射到0~25之間,反映這些關(guān)鍵詞之間的親疏程度,將“親緣關(guān)系”較近的關(guān)鍵詞重新組合起來,能反映出這些關(guān)鍵詞所代表的主題結(jié)構(gòu),從而獲得目前茶樹種質(zhì)資源研究的熱點(diǎn)。
多維尺度分析是將多維空間的研究對(duì)象簡(jiǎn)化到低維空間(通常為二維)進(jìn)行定位、分析和歸類,同時(shí)保留對(duì)象間原始關(guān)系的分析方法[9]。關(guān)鍵詞的多維尺度分析,其實(shí)質(zhì)是利用關(guān)鍵詞之間平面“距離”的緊密程度對(duì)研究問題進(jìn)行聚類,可全面反映某一研究領(lǐng)域主要研究方向與熱點(diǎn),并以直觀的視覺距離來找到本研究領(lǐng)域內(nèi)客觀存在的通用屬性。將上述相異矩陣通過SPSS統(tǒng)計(jì)軟件的Scale-多維尺度分析功能(multidimensional scale,ALSCAL),選取平面對(duì)稱的圖形(square symmetric)描述茶樹種質(zhì)資源研究關(guān)鍵詞的數(shù)據(jù)結(jié)構(gòu),用序數(shù)數(shù)值(ordinal)作為數(shù)據(jù)測(cè)度水平的指標(biāo),進(jìn)行二維尺度分析,得到可視化結(jié)果(圖2)。
表2 國(guó)內(nèi)茶樹種質(zhì)資源研究論文高頻關(guān)鍵詞相異矩陣(局部)
圖1 高頻詞Ward法聚類結(jié)果樹狀圖Fig.1 High frequency word clustering results treeusing Ward method
圖2 多維尺度分析結(jié)果Fig.2 Derived stimulus configuration using Euclidean distance model
由圖2可知,EST-SSR、RAPD、ISSR與遺傳多樣性、親緣關(guān)系聚在一起,核心種質(zhì)、鑒定、篩選、多樣性與生化成分聚在一起,這與聚類分析結(jié)果相似。
通過聚類分析和多維尺度分析,可將國(guó)內(nèi)茶樹種質(zhì)資源研究熱點(diǎn)分為4個(gè)方面,即應(yīng)用EST-SSR、RAPD、ISSR分子標(biāo)記技術(shù)進(jìn)行遺傳多樣性和親緣關(guān)系分析,分析方法涉及到聚類分析和主成分分析;野生茶樹種質(zhì)資源的開發(fā)利用;基于生化成分進(jìn)行種質(zhì)的多樣性分析,并實(shí)現(xiàn)篩選鑒定,從而獲得核心種質(zhì);涉及到分子標(biāo)記技術(shù)的抗寒與功能性成分育種。
茶樹種質(zhì)資源的遺傳多樣性分析是種質(zhì)資源遺傳利用的基礎(chǔ),一方面對(duì)資源的保存起指導(dǎo)作用,同時(shí)也是雜交育種親本選擇的重要依據(jù)。目前在茶樹種質(zhì)資源遺傳多樣性分析中常用的分子標(biāo)記主要是EST-SSR、RAPD和ISSR,其中SSR類標(biāo)記應(yīng)用最多[9-11],但不足之處是鑒定結(jié)果會(huì)因使用的標(biāo)記數(shù)量不同而有較大變幅,使得不同研究間很難獲得高度吻合的研究結(jié)論。而親緣關(guān)系分析面臨的最大難題也與此類同。
分析方法方面,常見的就是應(yīng)用PowerMarker等軟件進(jìn)行Nei’s多樣性指數(shù)、等位位點(diǎn)頻率等的簡(jiǎn)單統(tǒng)計(jì)[12-14],及基于歐氏遺傳距離和主成分分析的聚類分析,一方面分析結(jié)果無法得到進(jìn)一步科學(xué)合理的驗(yàn)證,另一方面,這些研究結(jié)果大多在理論指導(dǎo)上很難有實(shí)際的應(yīng)用價(jià)值,使得現(xiàn)有研究很難深入進(jìn)行。
我國(guó)作為茶樹(camelliasinensis)的物種起源中心[15],占有茶樹種質(zhì)資源的豐富程度在世界范圍內(nèi)具有絕對(duì)優(yōu)勢(shì)。依據(jù)茶樹種質(zhì)資源描述規(guī)范,茶樹種質(zhì)主要分為野生資源、地方品種、選育品種、品系和遺傳材料等[16]。其中,野生資源屬未知程度最高,且極具深入挖掘價(jià)值的重要茶樹種質(zhì)組成部分。雖然在本研究中可以推斷出野生資源開發(fā)利用是國(guó)內(nèi)茶樹種質(zhì)資源研究中的熱點(diǎn)領(lǐng)域,但是詳細(xì)查閱近20年來的研究資料之后,發(fā)現(xiàn)實(shí)際上這方面取得的研究進(jìn)展十分有限,甚至很少見到有系統(tǒng)開發(fā)利用的報(bào)道。
茶葉生化與品質(zhì)相關(guān)分析的研究已經(jīng)有很多報(bào)道,隨著分析技術(shù)的不斷發(fā)展,GC-MS、LC-MS等的大量使用,使得茶葉生化成分分析逐漸向高通量方向發(fā)展,所以相應(yīng)地出現(xiàn)了基于生化成分的茶樹種質(zhì)資源多樣性分析,這在資源篩選鑒定方面已經(jīng)有大量的報(bào)道和成功應(yīng)用案例[17-19]。特別是功能性成分成為育種目標(biāo)之后,基于生化成分的種質(zhì)資源多樣性分析變得更受重視,也就成了除基于分子標(biāo)記的遺傳多樣性分析之后篩選核心種質(zhì)的不二選擇。隨著組學(xué)聯(lián)合分析方法的不斷完善,這一技術(shù)將會(huì)在種質(zhì)篩選鑒定和品種選育中發(fā)揮更為重要的作用。
作為種質(zhì)資源研究的最終回歸點(diǎn),茶樹育種對(duì)茶樹種質(zhì)資源研究起決定作用,所以在共詞分析中會(huì)顯示為種質(zhì)研究的熱點(diǎn),這完全符合實(shí)際情況。就該分析結(jié)果而言,兒茶素、花青素顯然已經(jīng)成為茶學(xué)研究的熱點(diǎn),且品種選育已經(jīng)涉及到分子標(biāo)記技術(shù),表明功能性成分品種的選育已經(jīng)成為我國(guó)茶樹育種的重要研究方向[20,21],且分子標(biāo)記作為輔助選擇手段也已開始被加以重視利用。
共詞聚類分析的方法可以定量化探討特定學(xué)科領(lǐng)域的研究現(xiàn)狀,通過不同詞對(duì)之間的關(guān)系來反映各主題之間的內(nèi)在聯(lián)系,但是,這種方法由于存在關(guān)鍵詞標(biāo)引的限制,只能抽取文獻(xiàn)自擬的關(guān)鍵詞進(jìn)行分析,且國(guó)內(nèi)有多數(shù)報(bào)道都發(fā)表在國(guó)外的期刊上,容易出現(xiàn)詞匯離散問題,致使無法反映全部主題內(nèi)容。因此,共詞聚類方法用于分析某一領(lǐng)域研究熱點(diǎn)仍需進(jìn)一步完善。