張軍毅,孫蓓麗,朱冰川,石浚哲,周克茹,呂學(xué)研,葛芹玉,張 詠,陸祖宏,張虎軍
(1:江蘇省無錫環(huán)境監(jiān)測中心,無錫 214121)(2:東南大學(xué)無錫分校,無錫市生物芯片重點(diǎn)實(shí)驗(yàn)室,無錫 214135)(3:江蘇宏眾百德生物科技有限公司,無錫 214028)(4:江蘇省環(huán)境監(jiān)測中心,南京 210019)
藻類是一類能夠以葉綠素a作為主要光合色素,沒有真正根 、莖、葉分化,利用單細(xì)胞的孢子或合子進(jìn)行繁殖的低等植物[1]. 藻類大多存在于水體中,淡水、咸水和半咸水均有分布,但是在空氣和土壤等其他環(huán)境要素中也廣泛分布,可以說幾乎存在于地球的每一個(gè)角落. 藻類是重要的生物資源,在生物能源、保健食品、藥物開發(fā)、生物飼料等領(lǐng)域具有重要的作用和價(jià)值[2-4]. 同時(shí),藻類與環(huán)境有著非常密切的關(guān)系,往往是環(huán)境的指示生物,尤其是水華、赤潮、褐潮和綠潮等藻類暴發(fā)事件頻發(fā)及其對公共衛(wèi)生的危害已引起世界范圍內(nèi)的關(guān)注[5-7]. 上述工作離不開藻類物種的鑒定,即對物種的定性. 對于物種的定義, 至今仍然存在廣泛的爭論. 本質(zhì)上,物種是一個(gè)可檢驗(yàn)的科學(xué)假設(shè),經(jīng)反復(fù)檢驗(yàn)并確認(rèn)無誤后,即是一個(gè)合格的科學(xué)假設(shè),為有效物種;反之,經(jīng)不住檢驗(yàn)的物種就是不合格的科學(xué)假設(shè),則需要被合并和修訂. 物種的形態(tài)特征、生理結(jié)構(gòu)和遺傳學(xué)信息等往往構(gòu)成了科學(xué)假設(shè)的條件. 藻類物種主要包括形態(tài)種(morphological species)、進(jìn)化種(evolutionary species)、生態(tài)種(ecotypic species)、發(fā)育種(phylogenetic species)和單源種(monophyletic species)5個(gè)概念[8]. 形態(tài)種是主要依賴形態(tài)學(xué)特征來進(jìn)行藻類分類的概念,然而往往存在有些形態(tài)難以區(qū)分,但實(shí)際在遺傳上已經(jīng)發(fā)生顯著分化的情況. 進(jìn)化種概念適用于真核生物種的界定而不太適用于原核生物種的界定. 發(fā)育種概念中說明了屬是包含屬內(nèi)所有種的單系類群,但是分支分析并沒有延伸到屬內(nèi)的分類單元,即該概念沒有界定“種”也是單源類群. 生態(tài)種概念強(qiáng)調(diào)了生態(tài)特征對藻類分類學(xué)的重要作用,也反映了物種間的進(jìn)化關(guān)系,在某類群僅有形態(tài)特征和生態(tài)特征而缺乏分子數(shù)據(jù)的時(shí)候特別適用. 單源種是最適用于藍(lán)藻種的概念,解決了大多數(shù)藍(lán)藻種是多系起源的問題,但種的界定識(shí)別主要是基于基因類型的相似性,相似性閾值一直是爭議的焦點(diǎn). 因此,上述5個(gè)種的概念各有局限性[8].
藻類分類學(xué)是對藻類進(jìn)行準(zhǔn)確描述、命名、分群歸類,并探索各類群之間親緣關(guān)系遠(yuǎn)近和趨向的一門學(xué)科. 其不僅包括藻類的準(zhǔn)確鑒定,也包含藻類進(jìn)化與系統(tǒng)發(fā)育的內(nèi)容[9]. 2006年,胡鴻鈞等結(jié)合藻類系統(tǒng)發(fā)育和演化,將藻類分為微藻(主要包括藍(lán)藻門(Cyanophyta)、硅藻門(Bacillariophyta)、金藻門(Chrysophyta)、黃藻門(Xanthophyta)、隱藻門(Cryptophyta)、甲藻門(Pyrrophyta)、裸藻門(Euglenophyta)、綠藻門(Chlorophyta)等)和大型藻類(主要包括紅藻門(Rhodophyta)、褐藻門(Phaeophyta)、輪藻門(Charophyta)等)[10]. 2018年,Lee根據(jù)內(nèi)共生學(xué)說作為藻類系統(tǒng)演化的基本理論,將藻類分為原核藻類和真核藻類,其中原核藻類為藍(lán)藻門,真核藻類根據(jù)葉綠體及其內(nèi)質(zhì)網(wǎng)膜的進(jìn)化分為雙層被膜葉綠體(Chloroplast)類群:灰色藻門(Glaucophyta)、紅藻門和綠藻門3門;單層葉綠體內(nèi)質(zhì)網(wǎng)膜(one membrane of chloroplast endoplasmic reticulum)類群:裸藻門、甲藻門、頂復(fù)門(Apicomplexa)3門;雙層葉綠體內(nèi)質(zhì)網(wǎng)膜(two membranes of chloroplast endoplasmic reticulum)類群:隱藻門、異鞭藻門(Heterokontophyta)、普林藻門(Prymnesiophyta)和網(wǎng)綠藻門(Chlorarachniophyta)4門[1].
藻類鑒定作為藻類分類學(xué)中的重要組成部分,曾經(jīng)主要以藻類的形態(tài)結(jié)構(gòu)為基礎(chǔ),結(jié)合生理、生化和生態(tài)等特點(diǎn)為補(bǔ)充的傳統(tǒng)分類系統(tǒng)為依據(jù). 但是,對于一些形態(tài)分類特征沒有出現(xiàn)或不典型的藻類,無法進(jìn)行準(zhǔn)確的物種鑒定. 例如脫落于群體的單個(gè)細(xì)胞藻類,孢子(akinete)、異形胞(heterocyte)、孢囊(stomatocyst)、似親孢子(autospores)和鞭毛(flagellum)等分類特征未出現(xiàn)的藻類,以及需要根據(jù)生活史來進(jìn)行鑒定的類群等. 同時(shí),難以進(jìn)行物種鑒定的藻類還包括一些不容易采集和顯微鏡難以觀察的樣本;生物群落復(fù)雜,但待測藻類物種豐度又非常低的樣本;采樣環(huán)境惡劣,采樣過程會(huì)對人體造成危害,例如生長在極端環(huán)境和高輻射環(huán)境的樣本[11]. 此外,基于形態(tài)的藻種鑒定對分類學(xué)專業(yè)知識(shí)依賴度高,技術(shù)人員需要經(jīng)多年培養(yǎng)和實(shí)踐才能擅長某一門類的分類,且基于形態(tài)特征描述不可避免的存在主觀理解和判斷的偏差,傳統(tǒng)分類學(xué)專家隊(duì)伍正在急劇縮減. 基于分子標(biāo)記的藻類鑒定是通過獲取和分析一段或多段基因序列實(shí)現(xiàn)藻種鑒定,具有高效、可靠、易于標(biāo)準(zhǔn)化等優(yōu)點(diǎn),是生態(tài)學(xué)研究和藻類監(jiān)測的重要手段. 因此,分子標(biāo)記作為藻類鑒定的通用手段已經(jīng)被廣泛應(yīng)用[9,12-13]. 近年來,隨著藻類學(xué)的不斷發(fā)展,盡管藻類分類系統(tǒng)不斷更新和完善,然而至今尚沒有一個(gè)可被國內(nèi)外學(xué)者完全認(rèn)可的系統(tǒng). 為此,本文主要參照國內(nèi)應(yīng)用較為廣泛的胡鴻鈞等所著《中國淡水藻類——系統(tǒng)、分類及生態(tài)》中的分類系統(tǒng)[10]. 同時(shí),由于藻類類群眾多,本文僅就主要常見門類(藍(lán)藻、硅藻、綠藻、甲藻、裸藻、隱藻、金藻、黃藻、紅藻和褐藻等)分子標(biāo)記的物種鑒定研究進(jìn)展進(jìn)行總結(jié).
分子標(biāo)記可以簡單的分為兩類. 第一類主要用于系統(tǒng)發(fā)育樹的構(gòu)建,要求分子標(biāo)記序列足夠長,且具有直系同源性,以提供盡可能多的系統(tǒng)發(fā)育信息,其鑒定一般采用一代Sanger測序技術(shù). 第二類主要用于生物學(xué)評價(jià)(Bioassessment),選擇的基本原則主要包括:1) 片段長度適中,既不能過長影響測序又不能過短影響文庫構(gòu)建和序列比對;2) DNA片段兩端連接相對保守的區(qū)域,用于設(shè)計(jì)通用引物實(shí)現(xiàn)在盡可能多的物種中擴(kuò)增該分子標(biāo)記;3) DNA片段要有足夠的變異,既包含足夠的種系進(jìn)化信息,又可將物種區(qū)分開;4)分子標(biāo)記標(biāo)準(zhǔn)化,盡量采用同一DNA片段鑒定相關(guān)物種;5)所選分子標(biāo)記數(shù)據(jù)庫需準(zhǔn)確和完善. 相較第一類分子標(biāo)記,第二類分子標(biāo)記往往采用高通量測序(NGS)技術(shù),數(shù)據(jù)通量高但序列讀長短,因此在引物的選擇上和第一類有較大差異. 圖1展示了藻類分子標(biāo)記法鑒定的常規(guī)流程.
圖1 藻類分子鑒定流程圖Fig.1 Workflow of algae identification based on DNA
目前分子標(biāo)記基因測序方法已相對成熟. 對于藻類分子標(biāo)記體系建立的研究,需要依據(jù)分子標(biāo)記選擇的原則,并通過實(shí)驗(yàn)篩選出適宜待測藻類的單個(gè)或組合分子標(biāo)記,其中分子標(biāo)記的確定、引物選擇和序列數(shù)據(jù)庫構(gòu)建和選擇是研究的重點(diǎn). 對于未知藻類的分子鑒定,了解待檢藻類群體已建立分子標(biāo)記的適用范圍,并根據(jù)研究目的選定合適的分子標(biāo)記是研究的重點(diǎn). 分子標(biāo)記鑒定體系的完善和未知藻類的分子鑒定,兩方面研究是相輔相成的,未知藻的鑒定可以發(fā)現(xiàn)新種、擴(kuò)充藻種分子數(shù)據(jù)庫資源;而鑒定體系的構(gòu)建完善,使得通過系統(tǒng)發(fā)育進(jìn)化分析鑒定未知藻類變得更加快速和準(zhǔn)確.
用于藻類分子鑒定的常見分子標(biāo)記包括編碼核糖體RNA的基因(rDNA)、核糖體基因內(nèi)轉(zhuǎn)錄間隔區(qū) (internal transcribed spacer, ITS)以及保守蛋白編碼基因. 核糖體基因普遍存在于細(xì)胞中,進(jìn)化保守性相對較高,一般用于屬及以上分類階元的藻種初步鑒定. 其作為分子標(biāo)記發(fā)展早,應(yīng)用廣泛,相應(yīng)數(shù)據(jù)庫較完善. 編碼原核藻類的核糖體亞基包含5S rDNA、16S rDNA和23S rDNA,目前應(yīng)用最廣泛的是16S rDNA[9,14];編碼真核藻類的核糖體亞基的基因包含5S rDNA、5.8S rDNA、18S rDNA和28S rDNA等,其中18S rDNA在真核藻類鑒定中應(yīng)用最廣泛[9,15]. 對于屬內(nèi)種或株系水平的區(qū)分可以結(jié)合進(jìn)化速率較快的種間保守基因間區(qū)序列,如核糖體基因內(nèi)轉(zhuǎn)錄間隔區(qū)ITS[16]. 蛋白編碼基因通常用于在較低的分類階元,如在種水平區(qū)分物種. 蛋白編碼同源基因在用于藻種鑒別的同時(shí),還可進(jìn)行編碼蛋白功能研究,對生態(tài)學(xué)、生物地球化學(xué)研究具有重要意義,例如固氮基因nifH[17]. 基于藻類特點(diǎn)和以上原則,本文列舉了常見藻類在分子鑒定中常用的分子標(biāo)記,詳見表1.
表1 藻類鑒定常用分子標(biāo)記Tab.1 Universal molecular markers for algae identification
分子標(biāo)記的數(shù)據(jù)庫完善情況是藻類分子標(biāo)記體系構(gòu)建進(jìn)展的重要指征. 表2詳細(xì)列舉了藻類分子鑒定常用分子標(biāo)記的信息、應(yīng)用范圍及數(shù)據(jù)庫情況,其中常見的數(shù)據(jù)庫有:
表2 常用藻類分子標(biāo)記信息Tab.2 Information of universal molecular makers for algae
1) GenBank(https://www.ncbi.nlm.nih.gov/genbank/): 由美國國立生物技術(shù)信息中心(NCBI)建立和維護(hù)的,數(shù)據(jù)直接來源于測序工作者提交的序列以及與其它數(shù)據(jù)機(jī)構(gòu)協(xié)作交換數(shù)據(jù)而來,數(shù)據(jù)庫包含了所有已知的核酸序列和蛋白質(zhì)序列,以及與它們相關(guān)的文獻(xiàn)著作和生物學(xué)注釋. 另外,Genbank每天都會(huì)與歐洲分子生物學(xué)實(shí)驗(yàn)室(EMBL)的數(shù)據(jù)庫、日本的DNA數(shù)據(jù)庫(DDBJ)交換數(shù)據(jù),使這3個(gè)數(shù)據(jù)庫實(shí)現(xiàn)同步更新.
2) RDP數(shù)據(jù)庫: 全稱“Ribosomal Database Project”,該數(shù)據(jù)庫提供質(zhì)控、比對、注釋的細(xì)菌、古菌16S rRNA基因和真菌28S rRNA基因序列. 目前其數(shù)據(jù)庫最新版本為RDP Release 11.5,于2016年9月30日更新. 更新后的數(shù)據(jù)庫包含3356809條比對、注釋的原核16S rRNA基因序列和125525條真菌28S rRNA基因序列.
3) GreenGene:該數(shù)據(jù)庫是針對細(xì)菌和古菌16S rRNA基因的數(shù)據(jù)庫,該數(shù)據(jù)庫更新較慢,目前版本為2013年8月更新的gg_13_8版本. 由于是人工整理,準(zhǔn)確度較高. 分類層級(jí)采用七級(jí)界門綱目科屬種,方便理解和閱讀,目前也是很多科研工作者的選擇.
4) Silva數(shù)據(jù)庫:是一個(gè)包含三域微生物(細(xì)菌、古菌、真核)rRNA基因序列的綜合數(shù)據(jù)庫. 其數(shù)據(jù)庫涵蓋了原核和真核微生物的小亞基rRNA基因序列(SSU,即16S和18S rRNA)和大亞基rRNA基因序列(LSU,即23S和28S rRNA),更新頻繁,但其缺點(diǎn)是假陽性較高.
5) Cyanotype:是對NCBI數(shù)據(jù)庫中具有代表性的藍(lán)藻基因組信息的羅列,包括分類學(xué)和進(jìn)化地位信息等信息,但收錄條目較少,包括124個(gè)屬,332個(gè)株系.
6) CyanoHub數(shù)據(jù)庫:于2019年構(gòu)建,目前收錄245個(gè)屬的16S rRNA基因序列,其收錄序列通過人工矯正保證其準(zhǔn)確性,并采用了最新的八目分類系統(tǒng),屬水平注釋率為100%,為藍(lán)藻藻種鑒定和16S多樣性分析提供準(zhǔn)確而全面的數(shù)據(jù)庫. 同時(shí),作為Algae-Hub數(shù)據(jù)庫的重要組成部分,將逐步建設(shè)為序列和圖片共有的藻類數(shù)據(jù)庫.
7) PR2(Protist Ribosomal Reference database)數(shù)據(jù)庫:是針對真核微生物小亞基SSU rRNA(即18S rRNA)基因的數(shù)據(jù)庫. 該數(shù)據(jù)庫主要由核編碼的原生生物序列構(gòu)成,但為方便分析18S的高通量測序數(shù)據(jù),也包含了后生生物、陸地植物、大型真菌和真核細(xì)胞器(線粒體、質(zhì)體等)的SSU序列.
8) UNITE數(shù)據(jù)庫:是針對真菌ITS序列的數(shù)據(jù)庫,目前已經(jīng)更新至版本7.1,更新時(shí)間為2016年11月20日,包含8180條高質(zhì)量ITS參考序列. 另外,UNITE網(wǎng)站也可對單條ITS序列進(jìn)行進(jìn)行在線鑒定(https://unite.ut.ee/analysis.php).
9) BOLD數(shù)據(jù)庫:收錄了來源于動(dòng)物、植物、真菌和原生生物基因組的cytochrome c-oxidase subunit 1(COI, cox 1)基因,包括226184個(gè)物種的4099776條序列,并且提供了在線序列比對功能.
10) Rsyst::diatom數(shù)據(jù)庫:收入的基因包括硅藻的rbcL和18S rRNA兩類基因,經(jīng)過3個(gè)步驟的過濾和優(yōu)化,最終收錄1813條高質(zhì)量硅藻rbcL基因序列.
11) FunGene(functional gene)數(shù)據(jù)庫:這是RDP延伸的一個(gè)針對微生物功能基因序列的數(shù)據(jù)庫. 其按照功能分為抗性基因(antibiotic resistances)、植物致病基因(plant pathogenicity)、生物地球化學(xué)循環(huán)(biogeochemical cycles)、系統(tǒng)進(jìn)化marker(phylogenetic markers)、生物降解(biodegradation)、金屬循環(huán)(metal cycling)及其他(other)七類功能基因. 每類都包含幾到上百種功能marker基因,可被用于功能marker基因高通量測序后的比對及功能基因引物設(shè)計(jì)等.
分子標(biāo)記數(shù)據(jù)庫構(gòu)建之初,用于引物設(shè)計(jì)和比對分析的原始序列基本來自GenBank,GenBank數(shù)據(jù)全面但存在大量未經(jīng)驗(yàn)證或校對的和冗余的數(shù)據(jù),導(dǎo)致數(shù)據(jù)庫中存在錯(cuò)誤及大量冗余序列. 各門類專業(yè)研究人員通過序列搜集、去冗余、人工校正或分離純化培養(yǎng)藻種進(jìn)行分子標(biāo)記測序分析等方式構(gòu)建相應(yīng)物種的分子標(biāo)記數(shù)據(jù)庫[50],集約共享,促進(jìn)藻類分子數(shù)據(jù)庫的完善.
藍(lán)藻是地球上最古老的生物之一,藍(lán)藻類群的分類極具復(fù)雜性和特殊性,經(jīng)歷了多次分類系統(tǒng)的變革. 2014年Komárek等根據(jù)植物命名系統(tǒng)中的傳統(tǒng)分類體系,結(jié)合分子和形態(tài)等多相特征,將藍(lán)藻分類劃分為更小的屬,每個(gè)屬包含更少的種并選定相應(yīng)的模式種,形成現(xiàn)代藍(lán)藻分類體系[51]. 依照該體系,藍(lán)藻分類學(xué)者致力于完善體系中各個(gè)分子標(biāo)記序列和形態(tài)信息的結(jié)合.
16S rDNA是目前應(yīng)用最廣泛的藍(lán)藻分子標(biāo)記,普遍存在于原核細(xì)胞中,含量較高、功能同源性高、遺傳信息量適中、種屬內(nèi)較保守,一般用于揭示藍(lán)藻的屬及其以上分類單元的進(jìn)化關(guān)系. 16S V4區(qū)、V3~V4區(qū)、V5~V6區(qū)、V9區(qū)以及16S全長序列(圖2)在藍(lán)藻分類鑒定中均有應(yīng)用[52],這些標(biāo)記的引物通用性好,PCR擴(kuò)增成功率高. 原核生物中ITS指16S-23S rDNA間隔區(qū)序列,其二級(jí)結(jié)構(gòu)(圖3)為分類提供了更多信息,在藍(lán)藻精細(xì)分類水平的劃分中應(yīng)用廣泛[53-54]. 目前,16S rDNA和ITS的組合已經(jīng)成為藍(lán)藻定性到種水平的重要分子鑒定標(biāo)記.
圖2 16S rDNA一級(jí)結(jié)構(gòu)示意圖[55]Fig.2 Schematic diagram of primary structure of 16S rDNA[55]
圖3 原核ITS結(jié)構(gòu)示意圖Fig.3 Schematic diagram of structure of ITS for prokaryote
藻藍(lán)蛋白(phycocyanin, PC)是藍(lán)藻中的一種捕光色素蛋白,cpcBA-IGS是PC基因序列上的一個(gè)間隔區(qū),對于藍(lán)藻種內(nèi)的區(qū)分具有顯著作用. 譚文華等發(fā)現(xiàn)cpcBA-IGS可以將惠氏微囊藻(Microcystiswesenbergii)與其他微囊藻區(qū)分開來[56]. 王中杰等基于cpcBA-IGS對太湖中的水華長孢藻(Dolichospermumflos-aquae)進(jìn)行了系統(tǒng)發(fā)育分析,結(jié)果表明其可以區(qū)分長孢藻和其他絲狀藍(lán)藻屬[57]. Choi等對來自世界各地的10株可食用藍(lán)藻Arthrospira藻株基于16S rDNA和cpcBA-IGS進(jìn)行了系統(tǒng)進(jìn)化樹構(gòu)建,發(fā)現(xiàn)Arthrospira為單系類群,cpcBA-IGS比16S rDNA更能體現(xiàn)種內(nèi)差異性[58].cpcBA-IGS已成為繼16S rDNA和ITS后頗具潛力的低分類水平鑒定分子標(biāo)記.
近年來不斷有藍(lán)藻門新屬和新種的報(bào)道,結(jié)合形態(tài)、超微結(jié)構(gòu)、生理生化和分子生物學(xué)等的多相手段已經(jīng)是藍(lán)藻新物種鑒定的主流方式. 目前,多個(gè)分子標(biāo)記的組合應(yīng)用是藍(lán)藻分子鑒定的主流. Cellamare等采用物種分離培養(yǎng)的方式對鹽堿火山口湖泊中的光養(yǎng)微生物多樣性進(jìn)行分析,分子鑒定采用16S rDNA、16S-23S ITS和cpcBA-IGS等標(biāo)記,描述了藍(lán)藻門中顫藻目的2個(gè)新屬和4個(gè)新種[59]. Nelson等從苔蘚共生藍(lán)藻中分離篩選到4株藍(lán)藻,其16S rDNA未呈現(xiàn)差異性,但通過全基因組信息揭示了4株藻之間的差異,并通過比較基因組分析獲得了一種保守基因簇vnf[60]. González-Resendiz等在對從沙漠中分離得到的顫藻目藻株進(jìn)行形態(tài)、分子、生理生態(tài)等多相學(xué)的鑒定中,發(fā)現(xiàn)基于16S rDNA和ITS的結(jié)果與其他結(jié)果存在不完全匹配的問題[61]. Pietrasiak等在北非及南非26處沙漠位點(diǎn)分離得到42株絲狀藍(lán)藻,從形態(tài)和分子層面進(jìn)行識(shí)別,發(fā)現(xiàn)了2個(gè)新種[62]. 水華危害是研究學(xué)者重點(diǎn)關(guān)注的問題之一,Casero等使用16S rDNA和多個(gè)產(chǎn)毒基因(mcyE、anaF、sxtl)作為分子標(biāo)記,分析了水庫中的有害藻類,發(fā)現(xiàn)主要產(chǎn)毒藍(lán)藻為低豐度物種,采用分子生物學(xué)的方法對有害藻的評估和監(jiān)控非常有必要[63]. 劉平等在湖南長沙分離培養(yǎng),并鑒定得到一株產(chǎn)毒微囊藻,根據(jù)16S rDNA提供的信息鑒定為Microcystissp. YFM1,并研究了其產(chǎn)毒特性[64]. 基于形態(tài)學(xué)和分子標(biāo)記的微囊藻屬內(nèi)種類分類,在幾十年來一直爭議很大[65-66]. 微囊藻屬在水體中可形成水華,并與其附生微生物形成穩(wěn)定的藻類群體顆粒,共同承擔(dān)相應(yīng)的生態(tài)學(xué)功能,從而在水體生態(tài)系統(tǒng)中占據(jù)有利生態(tài)位[67]. 張軍毅等利用基因組學(xué)和宏基因組學(xué)的手段從附生微生物的角度進(jìn)行微囊藻屬內(nèi)種類的分類探索,認(rèn)為微囊藻屬內(nèi)個(gè)別物種的宿主特異性明顯[68-70]. 藍(lán)藻的分子鑒定已經(jīng)從單純的分子標(biāo)記逐步拓展到了基因組、宏基因組和宏轉(zhuǎn)錄組水平的探索.
硅藻是一類營光合作用的單細(xì)胞真核生物. 在自然界中,硅藻通常是單細(xì)胞或細(xì)胞彼此連接成帶狀、鏈狀、輻射狀或叢狀群體,浮游或著生生活. 硅藻的分類系統(tǒng)目前主要有3種:Hustedt(1930)系統(tǒng)、Krammer & Lange-Bertalot(1988)系統(tǒng)和 Round等(1990)系統(tǒng),其中 Round等(1990)系統(tǒng)是國際上比較通用的一個(gè)系統(tǒng). 我國硅藻學(xué)家金德祥先生(1978)根據(jù)殼面花紋的特征將硅藻類群分為兩個(gè)綱:中心綱和羽紋綱,綱下設(shè)9目,提出了符合我國現(xiàn)狀的硅藻分類系統(tǒng)[71]. 然而,近年來Lee根據(jù)葉綠素體系統(tǒng)演化又將硅藻歸為異鞭藻門的一個(gè)綱[1]. 在分子標(biāo)記建立及應(yīng)用方面,硅藻門有以下特點(diǎn):1)硅藻類群眾多,形態(tài)學(xué)分類體系中仍存在大量同物異名的情況,需要對其進(jìn)一步整合修訂,而硅藻分子系統(tǒng)發(fā)育研究為硅藻分類提供了分子證據(jù),加快了硅藻分類系統(tǒng)修訂的步伐[72];2)雖然硅藻分子分類體系尚不完善,但因18S rDNA序列信息較全面,基于18S rDNA V4區(qū)擴(kuò)增子的硅藻多樣性研究已經(jīng)廣泛開展,而rbcL等其他分子標(biāo)記有待進(jìn)一步發(fā)展,目前主要用作對某特定類群的分類系統(tǒng)重構(gòu)中的形態(tài)學(xué)佐證[73];3)相關(guān)數(shù)據(jù)庫的命名信息不統(tǒng)一,一定程度上阻礙了硅藻分子標(biāo)記應(yīng)用的發(fā)展,如在Silva數(shù)據(jù)庫中的真核藻類的分類等級(jí)為14級(jí)分類,存在亞門和亞綱等分類等級(jí)信息,而非常規(guī)的七級(jí)分類體系(界門綱目科屬種).
18S rDNA、28S rDNA、ITS、rbcL、psbA以及COI是常用的硅藻鑒定標(biāo)記[74-75]. 18S rDNA保守區(qū)域反映物種間親緣關(guān)系,可變區(qū)則能體現(xiàn)物種間的差異,適用于種以上分類階元的鑒定. 18S rDNA 結(jié)構(gòu)示意圖詳見圖4. 18S rDNA V4區(qū)因數(shù)據(jù)庫信息較全、引物通用性好、擴(kuò)增成功率高而被最廣泛使用. 目前對于硅藻分類體系的修訂和完善通常在特定類群中進(jìn)行. Stepanek等采用一組四標(biāo)記(SSU、LSU、rbcL、psbC)方法對美國及日本沿海和內(nèi)陸棲息地的淡水、微咸水及咸水中Amphora屬的31個(gè)分類單元和Halamphora屬的77個(gè)分類單元進(jìn)行分子系統(tǒng)發(fā)育分析,結(jié)果表明在基于形態(tài)學(xué)和生態(tài)學(xué)的進(jìn)化中存在一個(gè)復(fù)雜的模式. 因此,需要更加有效的形態(tài)學(xué)分類特征,提供一個(gè)可靠的屬內(nèi)形態(tài)學(xué)鑒定依據(jù),從而平衡這種系統(tǒng)進(jìn)化上的模棱兩可[76]. Gargas等選擇分離培養(yǎng)的藻種、藻種庫購買的藻種以及GenBank數(shù)據(jù)庫中209個(gè)物種為研究對象,進(jìn)行基于核SSU和葉綠體rbcL、psbC、psbA和psaB基因的多基因系統(tǒng)發(fā)育分析,確定了硅藻中Orthoseira的系統(tǒng)發(fā)育位置,從而建議將直鏈目(Orthoseirales)轉(zhuǎn)移到角毛藻亞綱(Chaetocerotophycidae)[77]. Gaonkar等從443株經(jīng)形態(tài)學(xué)鑒定為角毛藻科(Chaetocerotaceae)的藻株中收集得到413個(gè)28S rDNA片段序列和216個(gè)18S rDNA序列,形成參考序列集并構(gòu)建系統(tǒng)進(jìn)化樹,通過2個(gè)基因分子標(biāo)記之間的比較,為該科藻株分子鑒定及應(yīng)用提供了參考數(shù)據(jù)[78]. 因此,硅藻的分類修訂需要分子標(biāo)記技術(shù)發(fā)揮更多的作用[79-80].
圖4 18S rDNA結(jié)構(gòu)示意圖Fig.4 Schematic diagram of 18S rDNA structure
在真核生物中,18S rDNA和5.8S rDNA形成基因間區(qū)ITS1,5.8S rDNA和28S rDNA 形成基因間區(qū)ITS2. 真核ITS結(jié)構(gòu)示意圖詳見圖5. ITS是進(jìn)化過程中的中度較保守區(qū)域,種間差異值一般大于14%,常作為研究藻屬內(nèi)種間水平的一個(gè)分子標(biāo)記.rbcL(RuBis-Co)是光合作用中促進(jìn)初級(jí)CO2固定的酶,具有催化CO2還原和1,5-二磷酸核酮糖氧化的雙重功能,廣泛存在于光合細(xì)菌、藻類和高等植物中,GenBank里的rbcL序列信息多且保守,作為分子標(biāo)記具有通用、易擴(kuò)增、易比對的特點(diǎn). 龔少華等總結(jié)了DNA分子標(biāo)記技術(shù)在硅藻中的應(yīng)用,推薦使用的分子標(biāo)記組合為rbcL-3P、5.8S rDNA 和 ITS2,對于Sellaphora、Pinnularia、Eunotia、Tabularia等種屬的鑒定則通常使用COI[81]. COI指線粒體細(xì)胞色素C氧化酶第一亞基,無內(nèi)含子且大多嚴(yán)格遵循母系遺傳,重組頻率極低. 絕大多數(shù)類群的COI序列存在明顯的分子標(biāo)記間隙,蘊(yùn)含從種內(nèi)到種間不同水平的系統(tǒng)發(fā)育信號(hào),可以分辨種間物種及種內(nèi)不同株系. COI基因5′末端約658 bp的片段兩側(cè)序列非常保守,易于引物設(shè)計(jì),較高的拷貝數(shù)使得其PCR擴(kuò)增簡單且可靠. COI在GenBank中的資源雖少,但其高變區(qū)序列可區(qū)分關(guān)系較近的硅藻藻種,其在褐藻、紅藻及硅藻鑒定中均取得良好的效果[48]. 郭立亮等對18S rDNA、ITS、UPA、COI和rbcL作為硅藻分子標(biāo)記的有效性進(jìn)行了評估,研究發(fā)現(xiàn)18S rDNA和rbcL對硅藻種類在更高分類階元的區(qū)分表現(xiàn)良好,ITS和COI提供更多的基因差異性信息,而UPA過于保守不適用于硅藻的分類鑒定[24]. 在滿足擴(kuò)增子獲取及測序成功率的條件下,COI可以應(yīng)用于一些屬內(nèi)種水平的分類,但其在硅藻某些類群中較難擴(kuò)增和測序. 綜上,DNA分子標(biāo)記能夠?qū)柙宕蟛糠址N類正確鑒定,其中以18S rDNA、ITS、COI和rbcL應(yīng)用最為廣泛,且多標(biāo)記組合已經(jīng)成為必然選擇.
圖5 真核ITS結(jié)構(gòu)示意圖Fig.5 Schematic diagram of ITS structure for eukaryocyte
綠藻種類繁多,淡水、海洋、潮濕地表、池塘等均有綠藻分布. 應(yīng)用于綠藻分子鑒定的分子標(biāo)記主要包括18S rDNA、ITS、rbcL、tufA等.tufA基因在藻類中普遍存在,tufA在綠藻和輪藻中為葉綠體編碼,在其他藻門類為核基因編碼. 綠藻tufA序列數(shù)據(jù)幾乎都不含內(nèi)含子,擴(kuò)增成功率高;相較于LSU、rbcL、UPA而言有更高的進(jìn)化速率,分辨效果明顯,污染水平較低,是綠藻門分類的標(biāo)準(zhǔn)分子標(biāo)記[82];tufA在GenBank 中有大量可獲取的序列信息,利于該分子標(biāo)記的應(yīng)用和發(fā)展. Sauvage等構(gòu)建了包含4057個(gè)非冗余序列的tufA數(shù)據(jù)庫,設(shè)計(jì)通用引物完成珊瑚著生物種Ostreobiumspp.的系統(tǒng)發(fā)育樹構(gòu)建,進(jìn)一步完善了tufA在綠藻分子鑒定中的應(yīng)用[82].
綠藻的分類鑒定通常針對特定生境中的藻種進(jìn)行,選擇多個(gè)分子標(biāo)記聯(lián)合分析. Muggia等提出通過無菌培養(yǎng)獲得純藻種,記錄整合藻種的形態(tài)、生境信息與基因信息,從而構(gòu)建穩(wěn)定可信的共球藻屬(Trebouxia)分類體系和數(shù)據(jù)庫. 數(shù)據(jù)庫收集該屬已發(fā)表藻株的超過1600個(gè)樣本及序列信息,這些序列信息主要來自前期公開發(fā)表的研究、無菌培養(yǎng)的株系、及人跡罕至的樣本,包含多位點(diǎn)序列數(shù)據(jù)(ITS、rbcL、cox2)信息,推動(dòng)了地衣類共生藻類的研究[83]. Martins等從南極采集的樣品中分離純化培養(yǎng)得到一個(gè)綠藻新種,基于18S rDNA全長序列信息,發(fā)現(xiàn)其在進(jìn)化樹上形成獨(dú)立的一支,并結(jié)合ITS二級(jí)結(jié)構(gòu)信息確認(rèn)為新種[84]. 與藍(lán)藻和硅藻相同,分子標(biāo)記在進(jìn)化關(guān)系上的數(shù)據(jù)支撐,讓綠藻新種的發(fā)現(xiàn)更易被同行接受.
此外,近年來基于葉綠體基因組的分類學(xué)手段逐漸被實(shí)踐和應(yīng)用. Cremen等利用來自葉綠體基因組的數(shù)據(jù)集重新評估了綠藻門羽藻目(Bryopsidales)的系統(tǒng)發(fā)育,通過對32個(gè)新的葉綠體基因組進(jìn)行測序,并增加了分類單元的取樣量,提出了一種新的分類方案,能很好的支撐羽藻目主要譜系(亞目和大多數(shù)科)的劃分[85]. 朱歡等通過形態(tài)學(xué)鑒定確認(rèn)了從海南熱帶植物園分離得到的Trentepohliaodorata,使用18S rDNA和rbcL對該新種進(jìn)行了系統(tǒng)發(fā)育分析,并完成了該藻種的葉綠體基因組測序,獲得43個(gè)核心綠藻葉綠體基因組中31個(gè)編碼基因的分析結(jié)果,為石莼綱(Ulvophyceae)藻種的進(jìn)化分析提供了重要參考[86]. 劉本文等基于葉綠體基因組對綠藻門膠毛藻目(Chaetophorales)的進(jìn)化關(guān)系進(jìn)行重構(gòu),從中國各地采集樣品中分離培養(yǎng)屬于膠毛藻目中各科的12株藻種,測定18S rDNA、ITS(包含部分28S rDNA序列)以及葉綠體基因組,同時(shí)收集了7個(gè)完整的葉綠體基因組和5個(gè)葉綠體片段基因組,同步進(jìn)行葉綠體基因組結(jié)構(gòu)分析、共線性分析、游動(dòng)孢子萌發(fā)分析與基于葉綠體基因組的系統(tǒng)發(fā)育分析,有力地確定了膠毛藻目獨(dú)特的分類模式. 同時(shí)發(fā)現(xiàn),基于葉綠體基因組的分析結(jié)果與基于18S rDNA和ITS片段的結(jié)果具有差異[87]. 一定意義上,葉綠體基因組是一種超級(jí)分子標(biāo)記,其基因序列長度遠(yuǎn)遠(yuǎn)超過其他分子標(biāo)記序列,包含了巨大的信息量,是目前分子標(biāo)記應(yīng)用的延伸和發(fā)展. 更多樣本的系統(tǒng)發(fā)育分析結(jié)果,更具說服力的基因組數(shù)據(jù),以及對葉綠體基因組進(jìn)化的進(jìn)一步理解,或許會(huì)指向葉綠體基因組分析成為構(gòu)建可靠的綠藻分子分類系統(tǒng)的重要突破口.
根據(jù)林森杰等的研究,在2014年之前已經(jīng)嘗試應(yīng)用于甲藻的分子標(biāo)記包括ITS、28S rDNA、COI和cob,其中ITS和28S rDNA顯示出更好的適用性[88],而甲藻的特殊性導(dǎo)致甲藻分子標(biāo)記技術(shù)應(yīng)用過程中存在較多問題. 已知的甲藻具有真核生物中最大的核基因組,且基因組結(jié)構(gòu)復(fù)雜. 受到基因組內(nèi)多態(tài)性的影響,ITS的使用需要其他分子標(biāo)記的輔助;cob種類分辨率不理想,且引物通用性差、數(shù)據(jù)庫不健全;COI雖然較cob表現(xiàn)出更強(qiáng)的種間差異性,但也無法完成對特定屬內(nèi)所有物種的區(qū)分[89].
經(jīng)長期實(shí)踐,甲藻群體關(guān)系仍有待解決,為此Janou?kovec等建立了甲藻轉(zhuǎn)錄組的數(shù)據(jù)集,基于系統(tǒng)轉(zhuǎn)錄組學(xué)揭示甲藻進(jìn)化的主要轉(zhuǎn)變及群體內(nèi)部的系統(tǒng)發(fā)育關(guān)系,通過甲藻主要分子和形態(tài)轉(zhuǎn)變的重建,強(qiáng)調(diào)了水平基因轉(zhuǎn)移在其獨(dú)特核結(jié)構(gòu)起源中的作用,提出了一個(gè)預(yù)測框架,用于研究甲藻群體的細(xì)胞生物學(xué)(核組織、質(zhì)體進(jìn)化)、分子生物學(xué)和古生物學(xué)等多方面的問題[89]. 針對ITS和cob無法區(qū)分Apocalathium屬中形態(tài)不同的3個(gè)種系的問題,Annenkova等基于系統(tǒng)基因組學(xué)的分析方式,選用轉(zhuǎn)錄組數(shù)據(jù)作為分析對象,成功確認(rèn)了3個(gè)種系的系統(tǒng)發(fā)育關(guān)系[90]. 轉(zhuǎn)錄組數(shù)據(jù)包含一系列同源蛋白編碼基因,且目前測序成本較全基因組低、分析組裝難度較全基因組小,是解決甲藻分子鑒定及分類體系存在問題的有效方法. 但基于轉(zhuǎn)錄組多個(gè)同源蛋白序列的分析方法并非萬全之策,一些非系統(tǒng)發(fā)育信號(hào)的干擾會(huì)給分析帶來障礙,因此結(jié)合分子標(biāo)記、甲藻生境信息的多相學(xué)分析方法,將為甲藻的分類鑒定帶來更多可能.
裸藻門和隱藻門類下的分支相較于其他藻類比較少,采用分子標(biāo)記法對屬及其以上的分類階元具有較好的效果. 裸藻是單細(xì)胞真核生物的一個(gè)單系類群,其特征是具有二次內(nèi)共生的葉綠體. Ciugulea等采用分子標(biāo)記和電鏡技術(shù)對裸藻存在爭議的2個(gè)屬Strombomonas和Trachelomonas的物種多樣性進(jìn)行了分析,指出需要收集來自單細(xì)胞分離藻種的形態(tài)學(xué)和分子數(shù)據(jù),找到特有而穩(wěn)定的形態(tài)學(xué)特征來匹配分子鑒定的物種,才能實(shí)現(xiàn)兩個(gè)屬的區(qū)分[91]. 2010年,Kim等利用核18S rDNA、葉綠體16S rDNA和葉綠體23S rDNA分析了108株裸藻,得到兩個(gè)大分支的進(jìn)化樹,同時(shí)結(jié)合該兩大分支中藻株在超微結(jié)構(gòu)上的差異,建議從原裸藻科(Euglenaceae)中分離出一個(gè)新科Phacaceae,在Phacaceae下設(shè)Phacus、Lepocinlis和Discoplastis3個(gè)屬[35]. 2013年,Kim等基于分離得到的46個(gè)藻株對Euglenaceae下的Monomorphina屬進(jìn)行了深入的分析,發(fā)現(xiàn)該屬中的藻種具有廣泛的基因多樣性,建議將核基因組18S rDNA的二級(jí)結(jié)構(gòu)作為各個(gè)藻種區(qū)分的重要標(biāo)識(shí)之一[92]. 隨后在2014年,Kim等又基于細(xì)胞質(zhì)核糖體大小亞基(18S rDNA和28S rDNA)以及葉綠體核糖體大小亞基序列,結(jié)合形態(tài)學(xué)特征對Phacaceae 下Phacus屬內(nèi)系統(tǒng)發(fā)育關(guān)系進(jìn)行了分析,再一次豐富了裸藻的精細(xì)分類[93]. 王艷梅使用16S rDNA、18S rDNA和23S rDNA三種基因序列對8種不同形態(tài)性狀的裸藻進(jìn)行系統(tǒng)發(fā)育關(guān)系分析,發(fā)現(xiàn)這幾種基因序列對裸藻性狀進(jìn)化具有指示作用[36]. 2020年,ukomska-Kowalczyk等利用形態(tài)學(xué)和SSU rDNA數(shù)據(jù)對波蘭和捷克境內(nèi)的常見種類扁裸藻屬進(jìn)行了較為系統(tǒng)的研究,對于確認(rèn)的19個(gè)種類,不僅修訂了分類學(xué)特征,而且指定了表位型(epitypes)[94]. 2021年,Gumińska等利用18S rDNA V2高可變區(qū)的特殊引物對分子標(biāo)記和形態(tài)學(xué)方法進(jìn)行了對比研究,發(fā)現(xiàn)幾乎90%的序列可以鑒定到種水平,同時(shí)前者所獲50個(gè)物種在光鏡下幾乎均有發(fā)現(xiàn),驗(yàn)證了分子鑒定的有效性和可靠性[95]. 此外,對裸藻葉綠體基因組的分析顯示其具有屬內(nèi)特異性,主要體現(xiàn)在基因簇排列以及內(nèi)含子多樣性,可用來識(shí)別基因組的元特征從而補(bǔ)充完善裸藻的系統(tǒng)發(fā)育分析[96-97].
隱藻是重要的光合單細(xì)胞真核生物群,其質(zhì)體來源于內(nèi)共生的紅藻,宿主細(xì)胞中保留4個(gè)不同的基因組(宿主核、線粒體、質(zhì)體和藻核型體). 隱藻分子標(biāo)記的選擇主要包括18S rDNA、ITS、rbcL等,目前應(yīng)用最多的為18S rDNA. 夏爽在對隱藻的分類研究中指出應(yīng)用分子標(biāo)記的系統(tǒng)發(fā)育學(xué)分析顯示了隱藻與紅藻之間密切的親緣關(guān)系,且分子系統(tǒng)發(fā)育分析的結(jié)果與基于形態(tài)學(xué)和色素的隱藻門分類系統(tǒng)在屬以上水平上相一致,但是在屬以下水平上存在分歧. 例如基于系統(tǒng)發(fā)育分析無法很好區(qū)分彎隱藻屬和隱藻屬內(nèi)的種[98],通過形態(tài)學(xué)觀察與18S rDNA分子系統(tǒng)發(fā)育分析相結(jié)合可有效改善隱藻鑒定效果. Majaneva等應(yīng)用18S rDNA和ITS分子標(biāo)記完成了采集樣品中隱藻綱的分子系統(tǒng)發(fā)育分析[37]. Kim等測定了4株典型隱藻的葉綠體基因組并與數(shù)據(jù)庫中已有數(shù)據(jù)集進(jìn)行比較分析,基于88個(gè)蛋白構(gòu)建系統(tǒng)發(fā)育樹,該研究拓展了藻類數(shù)據(jù)庫的廣度,有助于確定細(xì)胞器基因組進(jìn)化的總體趨勢[99]. 對于隱藻的線粒體,Kim等同樣對隱藻7個(gè)代表藻種的線粒體基因組進(jìn)行了分析,發(fā)現(xiàn)其線粒體基因組保留了其他真核生物中發(fā)現(xiàn)的幾乎所有基因,基因聚類分析表明,隱藻具有與雅各巴蟲(Jakoba)和異養(yǎng)鞭毛蟲(Reclinomonas)相似的基因序列,分別基于葉綠體和線粒體基因組數(shù)據(jù)集的系統(tǒng)發(fā)育樹的比較分析顯示,隱藻宿主和內(nèi)共生體成分的不同進(jìn)化歷史[100]. 由于裸藻和隱藻進(jìn)化的特殊性,分子層面的系統(tǒng)發(fā)育分析對藻種的分類和進(jìn)化史研究具有更強(qiáng)的指導(dǎo)作用,葉綠體和線粒體基因組的測定及分析為該兩大類藻的分類鑒定提供了更多支撐.
金藻門和黃藻門主要分子標(biāo)記選擇包括18S rDNA、ITS、psaA、rbcL和COI等. 楊澤民對金藻部分類群的分子系統(tǒng)進(jìn)行了研究,測定了我國常見的包括等鞭金藻屬(Isochrysis)、棕囊藻屬(Phaeocystis)和巴夫藻屬(Pavlova)在內(nèi)的8株金藻的18S rDNA基因序列,并對相關(guān)屬種進(jìn)行了系統(tǒng)發(fā)育關(guān)系分析,同時(shí)將psaA和psbA基因序列和RNA二級(jí)結(jié)構(gòu)應(yīng)用于特定藻屬的親緣關(guān)系分析[39]. 姜小蝶等在金藻門錐囊藻科的研究中,采用18S rDNA、ITS1、5.8S rDNA和ITS2等分子標(biāo)記,同時(shí)結(jié)合形態(tài)學(xué)特征提議了新種Dinobryontaiyuanensis[40]. Daniel等分離得到金藻綱兩個(gè)新種,測定并分析18S rDNA和rbcL基因序列及其在進(jìn)化樹中的位置[41]. 金藻在分子水平的研究并不深入,為了解金藻的營養(yǎng)策略及系統(tǒng)發(fā)育關(guān)系,Beisser等完成了18株金藻轉(zhuǎn)錄組測序及深度分析,為金藻的系統(tǒng)發(fā)育研究及物種多樣性分析提供了新方法和新方向[101]. Br?te等完成了金樹藻Hydrurusfaetidus的基因草圖及轉(zhuǎn)錄組圖譜,這些新的數(shù)據(jù)有助于更好地理解金藻的進(jìn)化和生態(tài)作用,以及在更大的系統(tǒng)發(fā)育規(guī)模上解決分枝模式問題[102].
黃藻門的分子分類系統(tǒng)發(fā)展研究較金藻門薄弱,Rybalka等在區(qū)分黃藻門中親緣關(guān)系較近物種的研究中使用高變性的psbA/rbcL間隔區(qū)序列和rbcL分子標(biāo)記,為黃藻門黃絲藻科(Tribonemataceae)的物種區(qū)分提供了大量信息[103]. Negrisolo等基于18S rDNA和rbcL的分析揭示了黃藻門進(jìn)化過程中的形態(tài)趨同特征,發(fā)現(xiàn)這2個(gè)分子標(biāo)記組合可以很好地區(qū)分一些近緣問題物種,對于黃藻門是可靠的分子標(biāo)記[42]. 基于分子標(biāo)記的黃藻分類研究較少,通常存在用于研究的藻株數(shù)量過少或只關(guān)注于某一狹窄的黃藻類群等問題. 2009年,Maistro等為了研究黃藻的分類系統(tǒng),選用18S rDNA、rbcL和psaA3種分子標(biāo)記對31個(gè)藻株進(jìn)行測定,結(jié)合已有黃藻相應(yīng)分子標(biāo)記的數(shù)據(jù)集對單個(gè)分子標(biāo)記及不同分子標(biāo)記組合(SSU、psaA、rbcL、rbcL+psaA、SSU+psaA、SSU+rbcL、SSU+rbcL+psaA)進(jìn)行系統(tǒng)發(fā)育分析,確定了黃藻綱中的主要類群的進(jìn)化關(guān)系[104].
紅藻和褐藻是海洋中的常見藻類,兩者體形龐大、形態(tài)差異大且易變化,形態(tài)學(xué)分類較困難. 已研究應(yīng)用于紅藻的分子標(biāo)記包括COI、UPA、28S rDNA、rbcL、tufA、psbA等基因. Zuccarello等分別基于rbcL單個(gè)分子標(biāo)記以及18S rDNA、psbA、tufA和rbcL間隔序列4種分子標(biāo)記組合對紅藻門Stylonematales綱的系統(tǒng)發(fā)育關(guān)系進(jìn)行分析,探究世界各地樣品的生物地理學(xué)關(guān)系,也為該類群的分類體系提供了參考數(shù)據(jù)集[105]. Lin等利用rbcL序列分析了臺(tái)灣和印度洋地區(qū)紅藻Yonagunia屬和部分海膜藻科(Halymeniaceae)的系統(tǒng)發(fā)育,很好地解決了Yonagunia屬內(nèi)種的系統(tǒng)發(fā)育問題,可用于闡明物種邊界、多樣性和生物地理格局,并描述了分離自臺(tái)灣的2個(gè)新種[106]. Gomes等應(yīng)用分子和形態(tài)學(xué)相結(jié)合的方法對來自巴西22個(gè)不同采樣位點(diǎn)的68株蓋氏藻屬(Ceramieae)進(jìn)行rbcL、cox1、rbcL+cox1、rbcL+cox1+LSU 4種分子標(biāo)記組合的系統(tǒng)發(fā)育分析,發(fā)現(xiàn)了該屬的4個(gè)新種[107]. 2014年茅云翔等綜述了紅藻DNA分子標(biāo)記研究進(jìn)展,對常用分子標(biāo)記COI、UPA、28S rDNA和rbcL的優(yōu)缺點(diǎn)進(jìn)行了總結(jié),COI和rbcL被認(rèn)為較適合作為紅藻門的分子標(biāo)記,為國內(nèi)紅藻分子標(biāo)記研究提供了參考[108].
褐藻的分子系統(tǒng)學(xué)研究主要集中于rDNA、COI、rbcL和rbcS等序列. 薛紅凡對用于褐藻分子鑒定的COI、ITS和28S rDNA進(jìn)行了評估,結(jié)果發(fā)現(xiàn)COI的擴(kuò)增效率高于其他2個(gè)基因,在鑒定能力方面,COI基因適合鑒定種水平的物種[109]. COI相對于rbcL無法揭示種間的系統(tǒng)進(jìn)化關(guān)系,但仍可用于種內(nèi)的物種鑒定,所以2個(gè)基因相結(jié)合才能準(zhǔn)確鑒定該類群并反映它們的系統(tǒng)進(jìn)化關(guān)系. Montecinos等基于COI-5P和ITS1兩種分子標(biāo)記對褐藻門的Ectocarpus屬進(jìn)行系統(tǒng)發(fā)育分析,發(fā)現(xiàn)其至少存在15個(gè)隱存種[110]. Ng等利用ITS2核標(biāo)記和COI線粒體標(biāo)記對西北太平洋(NWP)分布范圍內(nèi)采集的褐藻種群連通性和系統(tǒng)地理結(jié)構(gòu)的進(jìn)化影響進(jìn)行了研究,解釋了海藻的種群連接和分布問題[111]. Bruno等使用COI、23S rDNA和23S-tRNAVal intergenic spacer (mt-spacer)3個(gè)分子標(biāo)記分析了Cystoseira的系統(tǒng)發(fā)育關(guān)系,將該群體劃分為更精細(xì)的3個(gè)進(jìn)化枝,對更準(zhǔn)確地分離和鑒定天然化合物以及實(shí)施目標(biāo)物種保護(hù)措施具有重要意義[112]. Ortega等致力于創(chuàng)建一種新的大型藻類分子識(shí)別方法,從組織樣本中尋找能夠識(shí)別海洋植物的短條形碼并創(chuàng)建了DNA參考數(shù)據(jù)庫,用于從沿海沉積物的eDNA中識(shí)別大型植物,并選用rbcL、matK、trnL、ITS2、COI和18S rDNA等分子標(biāo)記的18對引物,對海草、紅樹林和海洋大型藻類(綠藻門、紅藻門和褐藻科)進(jìn)行了擴(kuò)增分析,促進(jìn)了分子標(biāo)記法在大型藻類監(jiān)測中的應(yīng)用[113].
Saunders等總結(jié)了包括褐藻、紅藻、綠藻在內(nèi)的大型藻類和硅藻等的DNA分子標(biāo)記研究方法,提出了針對不同藻群體的雙分子標(biāo)記組合法:LSU D2/D3作為這幾類藻的二級(jí)分子標(biāo)記,用于種間水平的分類,分別配合用于種內(nèi)水平分類的COI-5P、rbcL、tufA作為褐藻和紅藻、硅藻、綠藻的一級(jí)分子標(biāo)記,能達(dá)到較好的分類效果. 該研究提供了從DNA提取、分子標(biāo)記選用到引物設(shè)計(jì)及序列擴(kuò)增測序的詳細(xì)技術(shù)方案,為構(gòu)建大型藻類分子分類體系提供了行之有效的參考方法[26]. 在很長一段時(shí)間內(nèi),針對特定環(huán)境及特定類群的多個(gè)分子標(biāo)記相結(jié)合的系統(tǒng)發(fā)育分析仍是紅藻和褐藻分類系統(tǒng)研究的主要內(nèi)容.
測序技術(shù)的不斷發(fā)展極大地促進(jìn)了分子標(biāo)記在藻類鑒定領(lǐng)域的運(yùn)用. 2020年,Hatfield等首次利用納米孔測序技術(shù)(Oxford Nanopore technologies)的超讀長優(yōu)勢,借助MinION測序平臺(tái)(MinION sequencing platform)以真核藻類為研究對象,目標(biāo)擴(kuò)增區(qū)域包含了幾乎整個(gè)18S rDNA、完整的ITS1、5.8S rDNA、ITS2以及28S rDNA的D1和D2,有效地完成了甲藻有害水華物種的鑒定. 這種技術(shù)成本低,測序讀長長(超過20 kb),而且設(shè)備體積小便于攜帶,被認(rèn)為是未來解決野外藻類物種快速檢測和多樣性分析的重要手段[114]. 目前,測序成本進(jìn)一步下降,三代測序技術(shù)趨于成熟,生物信息學(xué)分析方法逐漸標(biāo)準(zhǔn)化,線粒體基因組、葉綠體基因組、核基因組、轉(zhuǎn)錄組和宏基因組等也逐漸成為藻類系統(tǒng)進(jìn)化和分類鑒定的重要補(bǔ)充. 尤其是葉綠體基因組包含大量的遺傳信息,相對單個(gè)或少數(shù)幾個(gè)分子標(biāo)記而言,葉綠體基因組提供了更多可供分析的位點(diǎn),尤其適用于難以鑒定的近緣物種或分類混亂的類群[115]. 此外,測序技術(shù)的不斷突破與生物信息學(xué)發(fā)展也極大地促進(jìn)了分子標(biāo)記的篩選工作. 盡管目前不斷有新的分類標(biāo)記和引物被報(bào)道和應(yīng)用[116-117],但是充分利用基因組信息篩選候選基因,仍將是一段時(shí)間內(nèi)藻類分子標(biāo)記研究的主要任務(wù). 單一分子標(biāo)記已經(jīng)很難準(zhǔn)確完成藻類鑒定,多標(biāo)記組合已是必然選擇.
基于分子標(biāo)記的藻類鑒定離不開基礎(chǔ)數(shù)據(jù)庫的構(gòu)建及完善,尤其是在種水平上的鑒定[118]. 然而,藻類是一個(gè)龐大的生物體系,藻類類群的復(fù)雜性和生境的特殊性,往往給該項(xiàng)工作帶來了很大的挑戰(zhàn). 數(shù)據(jù)庫面臨的主要挑戰(zhàn)是不斷擴(kuò)充更多的物種信息,以及提升數(shù)據(jù)準(zhǔn)確性和剔除冗余信息. 樣品采集及藻種分離培養(yǎng)方法,三代測序和單細(xì)胞捕獲微流控技術(shù),以及生物信息學(xué)等技術(shù)的發(fā)展都是影響數(shù)據(jù)庫建設(shè)的重要方面. AlgaeBase數(shù)據(jù)庫(www.algaebase.org)是一個(gè)在國際上廣泛使用的綜合性藻類數(shù)據(jù)庫,遺憾的是其缺乏DNA序列方面的內(nèi)容. 近年來,為了整合藻類形態(tài)學(xué)和DNA方面的信息,在國內(nèi)藻類學(xué)家的努力下,Algae-Hub數(shù)據(jù)庫(www.algaehub.cn)獲得了一定的發(fā)展. 值得注意的是,一個(gè)準(zhǔn)確、全面和有效的數(shù)據(jù)庫往往需要形態(tài)學(xué)、生理生態(tài)、分子生物學(xué)等內(nèi)容的同步構(gòu)建. 同時(shí),需要各個(gè)類群和不同研究方向的藻類學(xué)者發(fā)揮自身優(yōu)勢,在現(xiàn)有研究成果的基礎(chǔ)上,更加積極和系統(tǒng)性地投入,才能保障數(shù)據(jù)庫的準(zhǔn)確性、全面性和系統(tǒng)性.
目前,部分科研人員,尤其是一些藻類監(jiān)測部門對于快速藻類檢測方法具有很大的需求. 而將分子標(biāo)記與微流控、生物芯片等技術(shù)結(jié)合是一個(gè)備受期待的解決方案[119-120]. 盡管生物芯片具有快速和低成本的優(yōu)勢,但是準(zhǔn)確性和穩(wěn)定性一直是其難以逾越的瓶頸. 這些瓶頸的突破主要依賴于目標(biāo)物種特異性DNA序列的篩選,但由于過長的DNA序列會(huì)產(chǎn)生非線性效應(yīng),且位置結(jié)構(gòu)影響雜交效果,故特異性DNA序列長短一般小于200 bp,進(jìn)一步限制了生物芯片檢測技術(shù)的應(yīng)用范圍. 隨著藻類數(shù)據(jù)庫的不斷完善,尤其是分子生物學(xué)數(shù)據(jù)的不斷擴(kuò)充和優(yōu)化,以及更準(zhǔn)、更長和更快的高通量測序技術(shù)的發(fā)展[121-122],基于測序技術(shù)的藻類高通量快速檢測必將會(huì)成為一種主流藻類鑒定方法.
分子標(biāo)記法能夠在基因水平反映物種系統(tǒng)發(fā)育和進(jìn)化,用于物種鑒定. 而形態(tài)學(xué)作為一種經(jīng)典鑒定方法,往往更加容易開展和推廣. 然而,對于藻類鑒定,分子標(biāo)記法和形態(tài)學(xué)已經(jīng)不再是“非此即彼”的選擇了. 因此,結(jié)合形態(tài)學(xué)、生理生化、分子生物學(xué)特征等的多相學(xué)方法,才能全面而準(zhǔn)確地完成鑒定工作[123-124]. 目前,多相學(xué)的鑒定方法已在藍(lán)藻門[125-126]、綠藻門[127-128]、硅藻門[129-130]、甲藻門[131]和紅藻門[132]等類群開展了廣泛的應(yīng)用和實(shí)踐.
盡管分子標(biāo)記已經(jīng)成為物種鑒定的一種常用手段,但是由于藻類類群眾多且差異很大,分子標(biāo)記的選擇仍然很難. 此外,分子標(biāo)記數(shù)據(jù)庫也成為影響選擇的重要因素之一. 總體而言,核糖體DNA基因相對保守,常用于較低分類階元,例如屬的鑒定;ITS序列進(jìn)化壓力較小,進(jìn)化速度快,可以輔助應(yīng)用在更低分類階元,如種的鑒定;對于一些蛋白編碼序列,可以進(jìn)行種內(nèi)株系的區(qū)分. 此外,在陸生植物中有良好表現(xiàn)的rbcL也是藻類鑒定效果較好的分子標(biāo)記,COI對真核藻類尤其硅藻的鑒定效果顯著,tufA在綠藻門的分類中具有一定的優(yōu)越性,UPA也同樣適合于藻類的研究. 值得注意的是,盡管單一分子標(biāo)記在多樣性調(diào)查和生物學(xué)評價(jià)中具有一定優(yōu)勢,但是對于一些特殊類群往往難以鑒定. 因此,分子標(biāo)記的組合應(yīng)用以及針對特殊類群的特定分子標(biāo)記篩選將是一種必然選擇. 此外,基于分子標(biāo)記的藻類鑒定離不開基礎(chǔ)數(shù)據(jù)庫的建設(shè)和完善,藻類分離培養(yǎng)、測序、生物信息學(xué)等技術(shù)的不斷突破也必將給數(shù)據(jù)庫建設(shè)帶來新的機(jī)遇.