周正 李卿 陳萬生 張磊
(1. 海軍特色醫(yī)學中心,上海 200433;2. 海軍軍醫(yī)大學附屬長征醫(yī)院藥學部,上海 200003;3. 海軍軍醫(yī)大學藥學院,上海 200433)
天然產物根據其生源途徑,分為初生代謝產物和次生代謝產物。初生代謝產物大多由生物大分子(多糖、核酸、脂類和蛋白質)的合成和降解形成,對維持植物基本的生命活動具有不可替代的作用,貫穿生命的全程;次生代謝產物則是生物體特有的代謝途徑中所產生的各種特殊分子類型,其骨架往往比初生代謝產物更為復雜,往往發(fā)生在生命過程的某一階段。
控制天然產物生物合成的基因決定了不同種類天然產物的產生與累積,即基因的多樣性導致天然產物結構多樣性。目前,藥用植物天然產物的研究中最前沿的科學問題是:各種復雜的天然產物是如何形成的?能否通過調控,大量獲得提取困難、結構復雜、應用需求廣泛的天然產物。為了解決這些問題,需要解析天然產物生物合成途徑中關鍵酶的功能,了解這些基因的表達和調控,進而對整個代謝網絡進行調控,甚至將不同來源的生物合成相關的代謝途徑模塊化,在底盤細胞上進行組裝,利用合成生物學的手段,實現各種重要的藥用植物天然產物的高效生物合成和規(guī)模化生產。而所有問題的本源便是生物合成途徑和關鍵催化酶的解析。
本文針對藥用植物天然產物生物合成及關鍵催化酶的研究策略進行系統(tǒng)綜述,從藥用植物天然產物生物合成途徑的推測、天然產物生物合成關鍵催化酶的發(fā)現與預測、酶的表達特征研究、體內酶功能研究、酶催化特征研究、酶結構解析與優(yōu)化、合成生物學研究這6個方面進行總結和討論。
通過目標代謝產物的結構,推測目標化合物的生物合成途徑,是目標天然產物生物合成途徑催化酶研究的基礎。20世紀下半葉,隨著初生代謝途徑的解析基本完成,萜類、生物堿、苯丙素類等天然產物的組裝化學原理開始呈現。根據基本的化學反應原理,結合研究物種中所分離到的天然產物,首先提出目標化合物的生物合成途徑假說。接下來則通過同位素示蹤實驗,即通過穩(wěn)定重原子標記初生代謝產物作為底物進行飼喂,再利用核磁共振或者高分辨質譜,動態(tài)監(jiān)測并追蹤含有同位素原子代謝物的流向,進而驗證所提出的天然產物生物合成途徑假說的正確性。
同位素示蹤法廣泛應用于解析藥用植物天然產物生物合成途徑的研究中。如在紫杉醇生物合成途徑的推測中,Eisenreich等[1]對紅豆杉(Taxus chinensis)的懸浮細胞飼喂前體[U-13C6]葡萄糖、[1-13C6]葡萄糖、[1,2-13C12]醋酸,發(fā)現產物 [1,2-13C12]醋酸僅轉化到taxuyunnanine C的4個乙?;鶄孺湥瑓s未轉移到紫杉烷的環(huán)形骨架上;而兩個被標記的葡萄糖不僅轉移到了taxuyunnanine C的乙?;?,同時也轉移到了紫杉烷的環(huán)形骨架。以上結果表明,紫杉烷的環(huán)形骨架來源于DXP/MEP途 徑(deoxyxylulose phosphate or methylerythritol phosphate pathway)。在莨菪堿的生物合成途徑推測中,Robins等[2]以3-苯基-[2-13C,2-2H]乳酸、苯基- [1,3-13C2]乳酸以及[1',3'-13C,甲基-2H3]海螺堿飼喂曼陀羅毛狀根(Datura innoxia),通過2D-NMR檢測13C、1H、2H,發(fā)現托品和來自苯丙氨酸的苯乳酸通過縮合反應生成海螺堿。在丹酚酸途徑生物合成途徑推測中,Di等[3]用13C標記的苯丙氨酸飼喂丹參(Salvia miltiorrhiza)毛狀根,通過高分辨質譜對丹酚酸成分的天然產物進行分析,發(fā)現丹參中迷迭香酸的產生途徑可能與已報道的彩葉草途徑有差異,同時預測迷迭香酸可能是丹酚酸B的前體化合物;而在丹參酮生物合成途徑的研究中,Guo等[4]利用13C標記的次丹參酮二烯飼喂丹參毛狀根,通過檢測發(fā)現了隱丹參酮和鐵銹醇的生成,證明了兩種物質是丹參酮合成的中間產物。
大量的研究表明,同樣類型的化合物大多共用一套生物合成途徑,骨架合成酶和后修飾酶的種類,在特定結構天然產物的形成中基本一致[5-8]。因此,在后基因組時代,如苯丙素類、萜類、生物堿、黃酮等主要類型的藥用植物天然產物的生物合成途徑已逐步完善,基于同位素飼喂推斷代謝產物生物合成途徑的方法不像之前使用那樣頻繁。隨著生物信息學的發(fā)展,大量生信工具通過基因組、轉錄組、蛋白質組學以及代謝組學的分析及計算,便可以提供化學原理和酶學機制的高通量信息,幫助解析目標化合物的生物合成途徑。但是,對于一些基因組數據龐大、轉錄組與蛋白質組學研究較為復雜的物種,同位素標記仍然發(fā)揮著極其重要的作用,比如在2016年Anttila等[9]利用同位素標記法標記[13C-甲基]蛋氨酸研究海洋甲藻(Alexandrium ostenfeldii)中聚酮類螺亞胺的生物合成途徑。
目標天然產物的生物合成途徑明確之后,則需要對目標關鍵催化酶進行挖掘和篩選。早期科研工作者僅是通過蛋白質分離對酶的活性進行驗證,但是受制于檢測手段和測序技術,酶的挖掘和鑒定過程非常緩慢。
隨著高通量測序技術的飛速發(fā)展,對于關鍵酶的發(fā)現不再局限于傳統(tǒng)的分離純化和鑒定,而是基于各種生物信息學數據,通過酶的氨基酸序列與酶結構的相似性進行挖掘。相比于已經通過實驗驗證功能的酶,絕大多數酶的功能仍然是未知的。根據未知酶和已知酶之間的相似性,對未知酶的功能進行預測,已經成為酶學研究中非常普遍的研究手段。盡管序列相似性預測不能完全找到整個酶家族中所有進化和功能的聯系,但是對于催化酶的挖掘來說具有十分重要的意義。此外,為了縮小候選基因的范圍,常常通過多種組學數據相結合的分析方法,如轉錄組學與基因組學、代謝組學相結合的方法,并輔助以酶的表達特征分析,如亞細胞定位實驗、GUS實驗、組織器官表達水平分析等,對生物合成途徑的關鍵催化酶進行篩選。
酶的提取、分離、純化是指把酶從組織或者細胞內外提取出并使之達到相應程度的過程,一般包括5個步驟,包括細胞破碎、酶液提取、酶分離純化、酶濃縮、酶檢測與保存。其中最重要的的步驟便是分離純化,目前常用的分離純化方法包括離心分離、過濾分離、沉淀分離、層析分離、電泳分離、萃取分離和結晶分離等。以嗎啡生物合成途徑解析為例,從1967年提出嗎啡的生物合成途徑假說以來,數十年來科學家們通過蛋白分離純化鑒定出了數種關鍵催化酶。如Roswitha于1993年利用7步程序,從罌粟(Papaver somniferum)的細胞懸浮液中分離純化得到了可以將罌粟生物堿salutaridine還原成(7S)-salutaridinol的氧化NADPH-7-氧化還原酶[10]。1995年,Rainer又從罌粟細胞懸液中分離得到了Salutaridinol-7-O-?;D移酶,解析了嗎啡前體蒂巴因生成過程[11]。隨著分子生物學的發(fā)展和組學數據的應用,僅十幾年的時間,嗎啡的生物合成途徑便已經基本闡明,甚至成功在酵母中進行了前體的異源合成[12],這將在后文詳細說明。
共表達分析(Co-expression analysis)是通過大量基因表達數據庫構建基因之間的相關性,從而篩選、挖掘基因功能的一類分析方法。研究表明,在植物體內同一個代謝通路上的基因,在受到體外或體內刺激后,這些基因在表達量變化上會出現共表達的趨勢。通過這一特性,對轉錄組測序后所獲得的龐大數據進行篩選、注釋和可視化,對目標催化關鍵酶進行挖掘。
Di等[3]利用茉莉酸甲酯和脫落酸誘導丹參的毛狀根,根據酚酸基因表達水平的變化,尋找到了丹參迷迭香酸合成酶(SmRAS)、細胞色素P450單加氧酶(SmCYP98A14)和細胞色素P450還原酶(SmCPR)。Li等[13]利用茉莉酸甲酯處理菘藍毛狀根,并進行轉錄組測序,首次從菘藍(Isatis indigotica)發(fā)現了Dirigent蛋白家族19個基因,并對其進行了序列特征和表達分析,這為該類蛋白的進一步研究提供了基礎。
此外,通過共表達分析結合代謝數據的方法,Xiao等同樣使用茉莉酸甲酯處理菘藍毛狀根,研究落葉松脂素生物合成途徑的基因表達水平,并結合木脂素成分的積累水平,繪制了“基因與化合物”關聯性熱圖,篩選出27個與菘藍木脂素合成相關的基因,并對菘藍松脂醇還原酶IiPLR1基因進行研究,發(fā)現其在落葉松脂素的積累中發(fā)揮重要的作用[14-15]。Wang等[16]對不同紫草素積累量的新疆紫草(Arnebia euchroma)進行轉錄組分析,并結合新疆紫草不同器官中的基因表達水平、關鍵酶的亞細胞定位實驗,鑒定出了催化香葉基氫醌轉變?yōu)樽喜菟厍绑w的關鍵羥化酶CYP76B74。
相比于基于轉錄組數據通過基因的表達量挖掘關鍵催化酶,高質量的基因組數據提供了更為全面準確的信息,其可以在群體水平上揭示個體之間基因的變化差異,從分子水平理解基因的結構、組成、功能和進化。
Zhao等[17]通 過 黃 芩(Scutellaria baicalensis)基因組測序,揭示了漢黃芩素完整的生物合成途徑。根據基因組,共注釋了28 930個基因,并在黃芩特有的串聯重復區(qū)內找到6個氧甲基轉移酶(SbPFOMT)候選基因。通過組織器官表達分析以及茉莉酸誘導黃芩毛狀根實驗,對篩選到的PFOMT進行進一步篩選。最終結合體外酶催化和體內RNA抑制實驗,確認了PFOMT5是催化漢黃芩素生成的關鍵酶。Ma等[18]對自交6代純合的丹參株系進行基因組測序發(fā)現,形成丹參酮前體母核的二萜合酶與細胞色素P450基因以基因簇的方式存在于鼠尾草屬植物中。利用基因擴張和收縮分析,聚焦于丹參中明顯擴張的SmCYP71D亞家族,并篩選到了4個候選基因。后續(xù)研究表明,SmCYP71D373和SmCYP71D375可以催化丹參酮特征五元呋喃環(huán)的生成,SmCYP71D411與丹參酮類化合物C20位脫甲基化過程相關。Guo等[19]利用多種測序技術組裝獲得了罌粟的基因組,發(fā)現罌粟中那可丁和嗎啡類生物堿合成途徑中15個基因在11號染色體上形成超級基因簇(BIA基因簇),從而高效合成罌粟中的各種次生代謝產物,同時結合轉錄組數據分析發(fā)現BIA通路基因在根和莖中特異性表達且共表達。此外,根據序列同源性分析,發(fā)現P450和氧化還原酶基因融合形成了一個STORR基因,該基因對于罌粟中嗎啡的生物合成具有關鍵作用。該研究揭示了罌粟基因組的復制、重排及基因融合導致了罌粟有效成分合成途徑的進化。
目前,越來越多的研究結合基因組、轉錄組和代謝組,對藥用植物天然產物生物合成途徑中的關鍵催化酶進行挖掘。通過轉錄組挖掘差異基因,快速圈定核心調控網絡和關鍵候選基因;通過代謝組尋找目標化合物的差異累積,將候選基因與表型進行關聯;通過基因組對候選基因進行定位,結合序列的多態(tài)性全面對目標基因進行描述;通過酶表征數據,對酶基因的性質進行確認。通過多組學聯合的方法,達到高效、快速挖掘、鑒定天然產物生物合成途徑催化酶基因的目的。
在挖掘到一系列參與天然產物生物合成的關鍵候選酶基因后,接下來需要對酶的功能進行研究。首先對目標酶分離、純化或通過分子生物學的手段進行異源表達、純化;然后對酶的理化性質進行分析;接下來對酶進行功能表征,檢測是否在適當的條件下催化底物生成相應的產物;最后開展酶催化的動力學性質研究,多角度描述酶的催化特征。
在藥用植物關鍵酶的研究中,常見的異源表達宿主有大腸桿菌、酵母和煙草,其它不太常用的表達系統(tǒng)還包括一些真菌、昆蟲及哺乳動物細胞。
大腸桿菌作為原核生物,具有繁殖速度快、實驗操作簡單、培養(yǎng)成本較低和遺傳背景清晰等優(yōu)點,常常作為酶蛋白異源表達的首選宿主。但是原核表達系統(tǒng)也存在一些局限,如分泌表達能力弱、二硫鍵形成困難導致蛋白折疊錯誤、無翻譯后修飾等缺點,限制了其在復雜酶的表達中的應用。而真核生物表達系統(tǒng)則主要是以酵母為主體,常用酵母宿主有釀酒酵母和畢赤酵母。相比于原核表達宿主,酵母系統(tǒng)具有外源基因整合穩(wěn)定、易于調控表達、重組蛋白以胞內積累或胞外分泌的形式表達、存在翻譯后修飾、發(fā)酵密度極高等優(yōu)勢。煙草作為近些年來興起的植物表達宿主,通過農桿菌介導的瞬時表達體系,使外源基因無需整合在煙草基因組中就可以進行表達,不受基因位置效應以及沉默的影響?;跓煵莸乃矔r表達系統(tǒng),即可以作為酶體外功能快速驗證的平臺,又可以作為酶體內功能研究的輔助,具有快速、高效的特點。
Fu等[20]利用大腸桿菌為宿主,表達出了紫錐菊(Echinacea purpurea)中菊苣酸合成的BAHD家族酰基轉移酶,EpHTT、EpHQT和EpHCT;同時利用釀酒酵母表達出SCPL家族酰基轉移酶,EpCAS。根據體外酶促反應結果發(fā)現,EpHTT催化咖啡酰輔酶A和酒石酸反應生成咖啡酰酒石酸,EpHQT催化咖啡酰輔酶A及奎寧酸反應生成綠原酸,兩個產物再進一步被EpCAS催化,生成菊苣酸和奎寧酸,該研究完整解析了紫錐菊中菊苣酸的生物合成途徑,并對關鍵催化酶進行了確認。Tu等[21]通過釀酒酵母表達出雷公藤(Tripterygium wilfordii)中P450單加氧酶,TwCYP728B70并發(fā)現該單加氧酶可以催化三步氧化反應生成雷公藤甲素中間體脫氫樅酸,為雷公藤甲素生物合成途徑的解析奠定了基礎。Fei等[22]通過底物拓品和苯乳酸共注射的方式,在煙草中瞬時表達從顛茄(Atropa belladonna)中篩選到的苯乳酸UDP-糖基轉移酶AbUGT1和海螺堿合成酶AbLS,確認了AbUGT1和AbLS的功能,AbUGT1催化苯乳酸和UDP-葡萄糖生成苯乳酰葡萄糖,進一步和托品在AbLS的催化下酯化縮合生成海螺堿。
由于絕大部分的酶是蛋白質,所以酶理化性質研究本質是蛋白質理化性質研究。根據化學組成的差異分為單純蛋白質和結合蛋白質,結合蛋白質中的非蛋白部分稱為酶的輔助因子,包括有機化合物(糖類、脂質等)和金屬離子。
酶理化性質研究主要研究包括分子量、等電點以及輔助因子的確定。酶的分子量一般通過其氨基酸序列便可預測,通過SDS-PAGE電泳進行驗證,分子量大小的單位以道爾頓(Da)表示。等電點的含義是,使蛋白質解離成正、負離子的趨勢相等的兼性離子時,酶溶液的pH。該數值同樣可以根據氨基酸序列進行預測,通過等電聚焦電泳技術進行測定。輔助因子可通過化學顯色法、酶處理學或借助質譜、核磁等儀器檢測來確定。
Ma等[23]從鹽膚木(Rhus chinensis)中篩選到了苯丙氨酸解氨酶基因,通過大腸桿菌進行異源表達,獲得了PcPAL重組蛋白。通過SDS-PAGE電泳,驗證了表達出蛋白的大小約為77 kDa。接下來對PcPAL的穩(wěn)定性進行研究,發(fā)現該酶的最適反應溫度為45℃、最適反應pH為9.0,本研究首次從漆樹科植物中克隆了PAL基因并對該酶的基本理化性質進行了探究。Su等[24]從羅漢果(Siraitia grosvenorii)中克隆出了由417個氨基酸構成的鯊烯合酶SgSQS,其可以催化法尼基焦磷酸生成鯊烯。通過大腸桿菌為宿主表達出SgSQS,通過實驗發(fā)現蛋白大小為47 kD,等電點為7.3。隨后又對該酶的最適反應溫度和pH進行研究,結構表明在37℃ 以及 pH 7.5的條件下,鯊烯合酶的活性最高。
酶對底物的選擇性研究是判斷酶專一性或雜泛性的重要依據。當酶只催化一種物質或某一類特定物質發(fā)生一定反應時顯示出專一性。反之酶催化雜泛性則表現為具有底物的寬泛性與反應的多樣性。
Wang等[25]在傳統(tǒng)中藥黃芩中發(fā)現了一個黃酮3號位氧糖基化酶Sb3GT1(UGT78B4)。該酶可以接受5種不同的糖供體,包括:二磷酸尿苷葡萄糖、半乳糖、乙酰氨基葡萄糖、木糖、阿拉伯糖。同時Sb3GT1也可以催化17種黃酮醇類化合物,轉換率達到98%以上,并催化形成5個全新的黃酮苷類化合物,表明該酶具有較強的雜泛性。Gao等[26]從桑樹(Morusalba)愈傷組織中鑒定出兩個FAD依賴的單加氧酶MaMO以及MaDA。MaDA能高效、選擇性地催化分子間[4+2]環(huán)加成反應(Diels-Alder反應)生成環(huán)己烯結構單元,且對二烯體及親二烯體具有較寬的底物雜泛性;MaMO則可以催化異戊烯基氧化形成二烯體,兩者共同完成桑中活性成分chalcomoracin的生物合成。
酶催化的動力學性質研究通常在酶催化反應的最適條件下進行。通過考察不同pH、溫度和金屬離子濃度對酶反應速率的影響確定最適反應條件。
Wu等[27]從馬尿泡(Przewalskia tangutica)中分離純化了兩個托品酮還原酶基因PtTRI 和 PtTRII,并于最適pH測定了兩個托品酮還原酶的動力學參數,根據Kcat、Km、Kcat/Km的比較,發(fā)現相對于PtTRI,托品酮是PtTRII的最適底物,且根據其它物種托品酮還原酶的報道,PtTRI對托品酮表現出更高的親和力。Yu等[28]通過茉莉酸甲酯誘導紅景天(Rhodiola sachalinensis)細胞培養(yǎng)體系,挖掘了紅景天苷生物合成途徑中的兩個葡萄糖基轉移酶RsUGT72B14 和RsUGT74R1。根據Kcat/Km比較兩個酶對于底物對羥苯基乙醇催化效率,發(fā)現RsUGT72B14的催化效率是RsUGT74R1的6倍。結合不同器官中兩個葡萄糖基轉移酶的表達量,明確了RsUGT72B14在紅景天苷的生成發(fā)揮重要的作用。Xiang等[29]從川西獐牙菜(Swertia mussotii)中篩選并鑒定了兩個環(huán)烯醚萜合成酶SmIS1和SmIS2,其中SmIS1的大小約為88 kD,SmIS2的大小約為46 kD。以8-oxogeranial為底物,NADPH為輔因子,測定SmIS1和SmIS2的動力學參數,結果表明,相比于SmIS1,SmIS2對底物有著較低的親和力,卻對NADPH有著較高的親和力。并且與長春花(Catharanthus roseus)和油橄欖(Olea europaea)中的環(huán)烯醚萜合成酶相比,SmIS1的催化效率降低。
通過體外實驗明確了天然產物生物合成關鍵酶的催化功能后,需要對目標基因在生物體內的功能進行研究。常用的酶體內功能研究策略是通過基因的敲除或抑制,使目標酶基因在體內的表達量降低,以及通過基因的過表達操作增加目標酶基因在體內的表達量。通過酶表達量的變化,結合轉錄、代謝、表型等方面的數據,研究酶在藥用植物體內的功能。但是,由于遺傳轉化體系的限制,部分無法獲得目標酶基因穩(wěn)定表達的轉基因物種,則可以通過瞬時表達技術或者將基因在其它相近物種中進行表達,根據表型的變化,驗證酶的體內功能。
CRISPR/Cas9技術是指在gRNA的引導下靶向基因組特定區(qū)域,并指導Cas9蛋白切割基因雙鏈,形成移碼突變或片段敲除的方法,該技術可以使基因永久性的表達沉默。
Zhou等[30]利 用CRISPR/Cas9技 術 敲 除 了丹參中酚酸生物合成的關鍵酶—迷迭香酸合成酶SmRAS,發(fā)現迷迭香酸和丹酚酸的含量顯著降低,證明了SmRAS在丹酚酸途徑中的發(fā)揮重要的作用;而Li等[31]則利用CRISPR/Cas9技術敲除了丹參酮生物合成途徑中丹參二萜合酶—SmCPS1,發(fā)現在純合敲除株系丹參酮IIA、隱丹參酮的積累幾乎消失,證明了SmCPS1在丹參酮生源途徑中的作用。通過基因編輯技術,Dinkins等[32]敲除紅車軸草(Trifolium pratense)中的異黃酮合酶TpIFS1,獲得了單鏈突變的雜合突變植株,后利用雜交獲得TpIFS1敲除的純合突變株系。對突變的純合株系進行研究發(fā)現,其異黃酮芒柄花黃素、鷹嘴豆素A還有金雀異黃酮的積累顯著下降。對黃酮生物合成途徑基因的表達量進行分析,發(fā)現TpIFS1敲除后,其上游基因泵丙氨酸裂解酶、查爾酮合酶的表達量顯著提高,而下游基因的表達量沒有顯著變化。
基因沉默的方法主要有RNA干擾(RNA inference,RNAi)和病毒誘導的基因沉默(Virus Induced Gene Silencing,VIGS)兩種方法。RNAi指利用同源性的RNA雙鏈(dsRNA)誘導與之互補的同源目標序列mRNA降解,阻斷體內靶基因的表達,使植物出現目標基因缺失的表型,該技術一般用于轉基因體系成熟的物種研究。VIGS是指攜帶目標基因片段的病毒侵染植物后,可誘導植物內源基因沉默、引起表型變化,該方法一般用于未建立轉基因體系的物種研究。
Zhao等[33]利用RNAi技術抑制人參(Panax ginseng)中β-香樹酯醇合成酶,獲得了轉基因毛狀根,發(fā)現β-AS的表達量降低后,β-香樹脂醇以及齊墩果烷型的人參皂甙R0的含量顯著降低,而總人參皂苷類化合物的含量明顯提高,表明β-AS在人參皂苷的合成中具有重要的催化作用。同樣是在人參中,Lu等[34]也從人參和西洋參(Panax quinquefolius)中鑒定到了兩個高度同源的糖基轉移酶,Pq3-O-UGT2 and PgUGT94Q2,兩個糖基轉移酶分別可以將UDP葡萄糖上的葡萄糖部分轉移到人參皂苷Rh2和F2來產生人參皂苷Rg3和Rd。通過轉基因毛狀根轉化體系,獲得人參和西洋參中兩個糖基轉移酶抑制的RNAi轉基因毛狀根,分析發(fā)現這兩個基因分別抑制后,人參皂苷Rd、原人參二醇和總人參二醇的積累均出現了下降,此外原人參二醇合酶和元人參三醇合酶的表達量也顯著提高,表明兩個糖基轉移酶分別在人參和西洋參人參皂苷的合成中具有關鍵調控作用。Sarma等[35]利用VIGS技術沉默長春花中牻牛兒基焦磷酸合酶CrGGPP,研究其功能,發(fā)現CrGGPP的表達量降低后,單萜吲哚生物堿類相關的轉錄因子以及合成途徑相關的基因表達量明顯降低,同時單萜吲哚生物堿類的含量也隨之下降。而通過對CrGGPP-VIGS葉片進行化學互補實驗可以恢復CrGGPP抑制后的表型,證明了CrGGPP在長春花單萜吲哚生物堿類物質的合成中具有重要作用。
基因過表達研究主要有兩種,一種是將目標基因克隆到攜帶有強啟動子和抗性篩選標記等元件的載體上,然后轉入植物體內,這樣宿主細胞會獲得較高量的目標mRNA轉錄水平和蛋白表達水平。另一種則是病毒介導的過表達系統(tǒng)(virus mediated gene overexpression,VMGO)瞬時轉化技術。該技術亦可以將外源基因在植物體內大量表達。通過分析目標基因過表達后轉基因植物的表型,便可以研究該基因的功能。
Yuan等[36]對黃花蒿(Artemisia annua)中青蒿素生物合成途徑關鍵酶基因—青蒿醛△11(13)雙鍵還原酶AaDBR2進行過表達操作,發(fā)現轉基因黃花蒿植株青蒿素和其前體二氫青蒿酸的含量顯著提高,該研究為獲得高產青蒿素的黃花蒿代謝工程策略奠定了基礎。Chung等[37]從鬼針草(Bidens pilosa)挖掘到了油酸脫氫酶BpOD和脂肪酸乙炔酶BpFAA,通過病毒介導的瞬時轉化技術,在鬼針草葉片中分別過表達這兩個基因,都可以提升聚炔類化合物的含量,表明兩種酶均可以催化長鏈脂肪酸前體脫飽和,在天然活性產物聚乙炔的合成中作用顯著。為了研究銀杏(Ginkgo biloba)中黃酮類成分的生物合成途徑,Wu等[38]通過轉錄組測序,從黃酮中發(fā)現了一個類黃酮3',5'-羥化酶GbF3',5' H1。由于銀杏缺少成熟的轉基因材料的體系,為了研究該基因的功能,將GbF3',5' H1于楊樹(Populus)中進行過表達后發(fā)現,轉基因植株黃酮類成分櫻桃甙、表兒茶素、沒食子兒茶素的含量顯著高于野生型植株,表明GbF3',5' H1在銀杏黃酮類成分的生物合成中發(fā)揮作用。
確認了催化酶在藥用植物天然產物生物合成途徑中的功能后,為了探究酶發(fā)揮催化功能的機理或進一步對酶催化功能進行定向改造,首先需要對酶蛋白晶體進行結構解析,闡明底物選擇性的結構基礎,解釋酶催化底物的反應機制。而后對發(fā)現的關鍵氨基酸位點進行理性設計,獲得一系列底物特異性或催化效率發(fā)生改變的突變體,對突變體的功能進行解析,最終獲得特定功能的酶,實現酶功能的定向改造。
C-糖苷在自然界中分布局限、結構多樣性不足,同時化學法C-糖基化面臨選擇性差,因此藥用植物天然產物生物合成途徑中C-糖基轉移酶研究成為近些年來的熱點問題。第一個被解析晶體結構的C-糖基轉移酶來自于金蓮花(Trollius chinensis),He等[39]發(fā)現了催化黃酮C-8位糖基化的碳糖基轉移酶TcCGT1,研究表明該酶可以催化合成牡荊苷等36種碳苷類化合物。又初步闡明了TcCGT1催化C-、O-糖基化的分子機制,并通過定點突變實現了由C-糖基化向O-糖基化的功能轉變。Zhang等[40]從光果甘草(Glycyrrhiza glabra)鑒定出一條雙C-糖基轉移酶GgCGT(UGT708B4)。該雙C-糖基轉移酶能夠高效催化含有弗洛丙酮結構單元的化合物發(fā)生連續(xù)兩步的C-糖基化反應,生成相應的雙碳苷產物。為了闡明該酶的催化機制,解析了GgCGT分別與二磷酸尿苷葡萄糖、尿苷二磷酸半乳糖等底物結合后所形成復合物的晶體結構。結果發(fā)現相較于葡萄糖,半乳糖的結合位置的偏轉導致糖基部分與周圍氨基酸形成氫鍵作用的強弱發(fā)生變化,影響酶與糖供體的結合作用強弱,決定了糖基供體的偏好性的順序。Xie等[41]通過轉錄組學等方法從蘆薈(Aloe barbadensis)中發(fā)掘了一個C-糖基轉移酶(AbCGT),該酶可以高效催化多種不含?;姆枷丬赵牡孜镞M行C-糖基化。以GgCGT為模板,通過同源建模的方法構建AbCGT的三維立體結構,利用分子對接預測了該酶與底物2-羥基柚皮素的反應口袋,發(fā)現183位的纈氨酸為酶關鍵活性位點催化殘基。通過定點將該位點突變天冬氨酸、谷氨酸或者脯氨酸后,AbCGT催化的底物選擇性有明顯提升。
由于多數藥用植物天然產物在原植物中積累較低,且獲得受到植物生長狀態(tài)、采收時間、提取方法、遺傳操作困難等諸多因素的限制。因此,天然產物合成生物學則是基于工程化的原理,通過設計改造自然界已存在的微生物或植物,或者于這些生物體內,重新構建一套完整系統(tǒng),高效快速的生產藥用植物活性成分。實現這一策略首先需要推測目標天然產物的生物合成途徑,其次明確每一步催化反應所需要的關鍵酶及輔因子,再將生物合成途徑整合于底盤細胞內,最終對整個代謝網絡進行優(yōu)化調控。目前,藥用植物天然產物合成生物學常用的底盤有大腸桿菌、酵母及本氏煙草等,下文將針對不同底盤構建細胞工廠進行藥用天然產物的合成進行簡要綜述。
Li等[42]通過來源于7個物種的11個基因整合進大腸桿菌,構建了能夠將苯丙氨酸或酪氨酸兩種不同的前體,定向合成黃芩素或野黃芩素的菌株。后針對丙二酰輔酶A這一重要前體的供應進行了優(yōu)化,搖瓶水平黃芩素和野黃芩素的產量分別達到了23.6 mg/L 和106.5 mg/L。Yao等[43]在丹參素生物合成途徑未被解析的情況下,利用大腸桿菌內源的羥基化酶和植物乳桿菌中的D-乳酸脫氫酶,在大腸桿菌中構建了丹參素生物合成途徑。再采取模塊化策略優(yōu)化,加強底物的供給;對底盤細胞編輯,敲除競爭基因,篩選出高產丹參素的人工大腸桿菌,丹參素產量達7.14 g/L。
斯坦福大學的Christina課題組利用酵母實現了多種藥用植物活性天然產物的生物合成,其中最具代表性的工作便是2015年于釀酒酵母中合成蒂巴因和氫可酮,以及2020年在面包酵母中合成托品烷生物堿。Galanie等將來自酵母本身、植物、細菌以及嚙齒動物的21種酶,在不影響酵母正常生長的情況下,整合進釀酒酵母中,通過輔因子循環(huán)利用、嵌合蛋白的蛋白質折疊等方法,獲得了嗎啡類藥物的關鍵前體—蒂巴因。之后又整合了另外兩種催化酶,使得產生蒂巴因的酵母進一步生成了氫可酮[12]。Prashanth通過5個生物合成功能模塊的設計,從糖和氨基酸出發(fā),在面包酵母中實現了莨菪堿和東莨菪堿的合成[44]。
依托泊苷作為拓撲異構酶 II 抑制劑,廣泛應用于肺癌、睪丸癌、淋巴瘤和其它惡性腫瘤的化療。目前,依托泊苷主要從桃兒七(Sinopodophyllum hexandrum)中分離鬼臼毒素,并以此為前體合成依托泊苷。但對桃兒七過度的砍伐導致其現已瀕臨滅絕。目前常用的替代方法是通過植物組織培養(yǎng)方法合成(-)-鬼臼毒素,并以此為前體合成依托泊苷,但該方法不便于進行規(guī)?;a。2015年Elizabeth課題組的Lau. W通過轉錄組和代謝組的分析,解析了依托泊苷糖苷配基完整的生物合成途徑,并報道了其前體脫氧鬼臼毒素在煙草中的重構,達到11.4±3.8 μg/g干重的產量,為煙草作為天然產物的生物合成底盤研究奠定了基礎,表明煙草的瞬時表達可以用于獲得毫克級的植物源小分子并生物合成其類似物[45]。2019年,同課題組的Schultz. BJ等利用煙草為底盤,實現了脫氧鬼臼毒素的異源合成。通過在煙草中表達 8 個松柏醇和 8 個依托泊苷苷元的酶基因之后,脫氧鬼臼毒素在煙草中的積累量達到了 4.3 mg/g。該研究表明可以在煙草植物底盤細胞中表達難培養(yǎng)的藥用植物中較長的生物合成途徑,并達到毫克級產量[46]。
隨著藥用植物天然產物的市場需求的不斷增加,藥用植物的資源供求矛盾也越來越明顯,而通過生物技術手段是解決這一矛盾的有效方法。對藥用植物天然產物的生物合成化學原理和酶學機制進行探究的最終目的,便是為藥用植物資源的可持續(xù)利用和發(fā)展提供一條全新而高效的途徑。
在生物信息學飛速發(fā)展的今天,通過基因組學、轉錄組學、蛋白質組學、代謝組學、表型組學等組學技術聯合分析,對藥用植物天然產物的生物合成途徑及關鍵催化酶進行挖掘和解析,利用結構生物學對獲得的酶進行改造,再應用合成生物學的方法,將生物合成途徑和關鍵酶整合到底盤中,從而異源高效生產各種目標天然產物。這一系列的研究方法,已經成為藥物植物天然產物的生物合成研究的通用策略。
然而這一策略在應用時也會遇到一些問題。比如在研究一些關鍵催化酶的體內功能時,由于許多藥用植物缺乏穩(wěn)定的遺傳轉化體系,只能借助模式植物瞬時轉化等手段進行替代,所以仍需要在藥用植物的遺傳轉化體系的研究中加以突破。此外,植物的基因組中編碼了數目眾多且功能各異的催化酶,并且常以家族基因的形式存在,這些酶有的可以催化多種化合物的產生,有的只能催化單一天然產物的生成,還有的需要和其它酶或者輔因子共同作用才能發(fā)揮其催化效應。這是由于在高等植物在進化的過程中,酶的進化形成了復雜而精巧的結構,導致其催化功能多樣性,進而出現了物種的多樣性和代謝產物的多樣性。利用這一策略,不僅可以去探索未知天然產物的生物合成途徑及關鍵催化酶的功能,對于已知的途徑,仍可能會有全新的發(fā)現和認知。這一策略為更好的挖掘天然產物生物合成途徑提供了基礎,也將為合成生物學的研究提供豐富的元件,進而推動藥用植物天然產物提取、合成、臨床應用等各領域的進步。