吳玉潔,劉欣欣,劉健慧,楊開廣,隨志剛,張麗華,張玉奎
(1 中國科學(xué)院大連化學(xué)物理研究所,中國科學(xué)院分離分析化學(xué)重點(diǎn)實(shí)驗(yàn)室,遼寧 大連 116023; 2 大連理工大學(xué)化學(xué)學(xué)院,遼寧 大連 116024; 3 中國科學(xué)院大學(xué),北京 100049)
合成生物學(xué)是21世紀(jì)新興的交叉學(xué)科,是以工程化的設(shè)計(jì)理念,對生物體進(jìn)行設(shè)計(jì)、改造乃至重新合成的研究領(lǐng)域[1-2],被認(rèn)為是繼“DNA雙螺旋結(jié)構(gòu)發(fā)現(xiàn)”和“人類基因組計(jì)劃”后的第三次生物技術(shù)革命[3]。微生物細(xì)胞工廠(microbial cell factory,MCF)是合成生物學(xué)的重要研究內(nèi)容,被越來越多地應(yīng)用于生命科學(xué)、能源環(huán)境、食品農(nóng)業(yè)及先進(jìn)材料等領(lǐng)域,推動(dòng)著當(dāng)前生物技術(shù)的發(fā)展與進(jìn)步[4-6]。
近些年來,隨著基因編輯技術(shù)的進(jìn)步,MCF的構(gòu)建策略從最初的隨機(jī)誘變逐步向全基因組水平定制化改造發(fā)展[7],生物學(xué)家可以在短時(shí)間內(nèi)獲得103~107量級的菌株突變體文庫。然而,缺乏靈敏準(zhǔn)確的高通量篩選方法限制了MCF的改造進(jìn)化。合適的信號檢測策略是篩選方法建立的核心[8],當(dāng)前發(fā)展的高通量篩選方法多基于產(chǎn)物賦予菌株的顏色、細(xì)胞生長狀態(tài)或與產(chǎn)量相關(guān)的熒光信號等,應(yīng)用于瓊脂平板、微孔板及液滴培養(yǎng)等不同培養(yǎng)類型菌株的快速檢測[9-10]。但對于那些不具有顏色、熒光信號等表觀性狀的菌株,開發(fā)基于質(zhì)譜的無標(biāo)記高通量檢測方法就顯得尤其重要[11]。
此外,在菌株改造進(jìn)化及發(fā)酵監(jiān)測過程中,對代謝通路上關(guān)鍵分子(如代謝酶和代謝物)進(jìn)行精準(zhǔn)定量分析的需求日益凸顯。而且當(dāng)待測MCF的樣本數(shù)量較大時(shí),對檢測方法通量也提出了更高要求[12]。當(dāng)前對代謝通路中關(guān)鍵蛋白質(zhì)的定量主要采用蛋白質(zhì)免疫印跡法(Western blot,WB)或?qū)霟晒獾鞍讟?biāo)簽策略。WB具有特異性強(qiáng)、敏感性高的特點(diǎn),但通量低且定量準(zhǔn)確性較差[13-14];熒光蛋白標(biāo)簽無毒、成像對比度高,然而其可選顏色有限且存在光漂白問題[15-17]。核磁共振技術(shù)(nuclear magnetic resonance,NMR)可以通過整合質(zhì)子信號來識(shí)別和量化關(guān)鍵代謝物分子,NMR樣品制備快且損失小,不依賴于分離技術(shù),具有高度可重復(fù)性。然而,NMR的低靈敏度限制了其在關(guān)鍵分子定量研究中的應(yīng)用[18]。
液相色譜具有優(yōu)異的分離能力,可實(shí)現(xiàn)目標(biāo)分子的高效分離,而質(zhì)譜因其高特異性、高靈敏度的特點(diǎn),具有強(qiáng)大的檢測能力,二者均可以分析小分子及生物大分子。因此,色譜、質(zhì)譜技術(shù)在生命科學(xué)領(lǐng)域得到了廣泛的應(yīng)用,尤其在蛋白質(zhì)和代謝物定性定量分析方面發(fā)揮了重要作用[19-21]。近些年來,高通量液相色譜、質(zhì)譜技術(shù)的進(jìn)步革新,使其成為合成生物學(xué)菌株篩選及關(guān)鍵分子定量研究的有力工具。
本文總結(jié)分析了近年來高通量液相色譜、質(zhì)譜技術(shù)在菌株篩選及關(guān)鍵分子定量方面的研究進(jìn)展,從樣品制備、色譜分離、質(zhì)譜采集及數(shù)據(jù)處理層面展開介紹,并對這一領(lǐng)域未來的前景及挑戰(zhàn)進(jìn)行簡要闡述,以期為該領(lǐng)域的研究人員提供參考。
MCF構(gòu)建過程中會(huì)產(chǎn)生大量菌株突變體文庫,需要建立高通量篩選方法。質(zhì)譜具有靈敏度高且無需特異性標(biāo)記等特點(diǎn),可以為無表觀性狀MCF高通量篩選提供關(guān)鍵技術(shù)支撐。目前,菌株高通量篩選依賴的質(zhì)譜技術(shù)包括:解吸電離質(zhì)譜、電噴霧電離(electron spray ionization,ESI)質(zhì)譜和原位電離(ambient ionization,AI)質(zhì)譜?;谫|(zhì)譜的菌株篩選方法主要包括如下步驟:樣品制備、色譜分離、質(zhì)譜信號采集及數(shù)據(jù)處理和分析。
樣品制備是連接菌株培養(yǎng)與質(zhì)譜檢測的關(guān)鍵環(huán)節(jié)。菌種培養(yǎng)液中含有無機(jī)鹽、緩沖液、各種表面活性劑等質(zhì)譜無法兼容的成分,因此需要對樣品進(jìn)行預(yù)處理。對于可分泌到細(xì)胞外的待測物,菌株樣品制備相對簡單,通過萃取或者稀釋后即可進(jìn)行質(zhì)譜分析。而對于細(xì)胞內(nèi)待測物,則需要菌體破碎、待測物提取等樣品預(yù)處理過程。而且,針對不同的菌株培養(yǎng)模式,如瓊脂平板培養(yǎng)、微孔板培養(yǎng)和液滴培養(yǎng)等,其對應(yīng)的樣品制備流程也有所差異。
用于菌株高通量篩選的解吸電離質(zhì)譜技術(shù)主要包括基質(zhì)輔助激光解吸電離(matrix-assisted laser desorption ionization,MALDI)質(zhì)譜、自組裝單層解吸電離(self-assembled monolayer desorption ionization,SAMDI)質(zhì)譜和納米結(jié)構(gòu)啟動(dòng)質(zhì)譜(nanostructure initiator mass spectrometry,NIMS)。MALDI電離源具有較高的耐鹽性,通常可將菌株分析物直接加在靶板上,待風(fēng)干后再添加基質(zhì)以輔助樣品離子化。針對不同類型的樣本,可選用不同的基質(zhì),如α-氰基-4-羥基肉桂酸(α-cyano-4-hydroxycinnamic acid,CHCA)、2,5-二羥基苯甲酸(2,5-dihydroxybenzoic acid,DHB)或芥子酸(sinapinic acid,SA)等。對于微孔板及液滴培養(yǎng)的菌株,借助自動(dòng)化移液系統(tǒng)和基質(zhì)噴霧儀等設(shè)備可快速實(shí)現(xiàn)上述操作。而對于瓊脂平板培養(yǎng)的菌株,通常借助膜轉(zhuǎn)移法[22],使菌落轉(zhuǎn)移至放在瓊脂平板上的膜上生長,隨后將膜上菌落生物質(zhì)印跡在載玻片上,噴涂基質(zhì)后進(jìn)行質(zhì)譜檢測。在MALDI的基礎(chǔ)上結(jié)合自組裝單層技術(shù)產(chǎn)生的SAMDI質(zhì)譜技術(shù),通常使用自動(dòng)液體處理器將微孔板培養(yǎng)的菌株待測物轉(zhuǎn)移到經(jīng)功能基團(tuán)修飾的SAMDI靶板上,通過孵育將反應(yīng)物富集在靶板上,添加基質(zhì)后再進(jìn)行質(zhì)譜采集[23]。相對于SAMDI,NIMS技術(shù)利用含氟聚合物修飾的多孔硅芯片富集分析物,進(jìn)而采用聲學(xué)沉積裝置輔助加樣,且無需添加基質(zhì)即可進(jìn)行質(zhì)譜檢測[24-25]。
ESI質(zhì)譜也是用于菌株篩選的另一主要工具,通常適用于微孔板和液滴培養(yǎng)的菌株。對于微孔板培養(yǎng)的菌株,由于ESI源耐鹽性較差,樣品通常需要經(jīng)過萃取或色譜分離[26]后上樣。芯片多通道納噴離子源(triversa nanomate,TVNM)是在ESI電離源基礎(chǔ)上,通過整合液體萃取表面分析技術(shù)(liquid extraction surface analysis,LESA)發(fā)展起來的新一代離子源。該技術(shù)通過吸頭在樣品表面位置進(jìn)行微萃取,通過自動(dòng)電噴霧進(jìn)樣將萃取得到的納升級樣品進(jìn)入質(zhì)譜分析,因其操作便捷而大大提高了基于ESI質(zhì)譜技術(shù)的篩選通量。值得關(guān)注的是,商業(yè)化的RapidFire系統(tǒng)和聲學(xué)輔助系統(tǒng)也是兩個(gè)有前景的高通量分析平臺(tái),已經(jīng)在抗體、藥物篩選方面有所應(yīng)用[27-31]。RapidFire系統(tǒng)可以在幾秒鐘內(nèi)實(shí)現(xiàn)上樣、固相萃?。╯olid-phase extraction,SPE)及質(zhì)譜進(jìn)樣[32];以聲霧電離(acoustic mist ionization,AMI)和聲學(xué)液滴噴射(acoustic droplet ejection,ADE)為主的聲學(xué)輔助技術(shù),通過無接觸方式利用聲能從微孔板中噴出樣品薄霧或納升液滴,最快可在0.5 s內(nèi)完成質(zhì)譜進(jìn)樣[33-35]。聲學(xué)輔助技術(shù)與RapidFire相比速度有所提升,且無需基質(zhì)優(yōu)化及點(diǎn)樣,適用于基于微孔板培養(yǎng)的菌株篩選。對于液滴培養(yǎng)的菌株,可將菌株產(chǎn)物稀釋后直接進(jìn)行在線檢測[36]。此外,一些在線微萃取研究工作[37-39]也為開發(fā)復(fù)雜液滴培養(yǎng)條件下的菌株樣本制備方法提供了參考。
近些年來,AI質(zhì)譜技術(shù)因其可在敞開環(huán)境下操作并實(shí)現(xiàn)原位、實(shí)時(shí)的質(zhì)譜分析成為研究熱點(diǎn)。其中,解吸電噴霧電離(desorption electrospray ionization,DESI)質(zhì)譜常用于瓊脂平板菌株的高通量篩選,采用微孔膜支架(microporous membrane scaffolds,MMS)[40]將待測樣本轉(zhuǎn)移至載玻片上進(jìn)行后續(xù)質(zhì)譜檢測。新發(fā)展的快速蒸發(fā)電離(rapid evaporative ionization,REI)質(zhì)譜作為一種新型AI質(zhì)譜技術(shù),可直接采樣,無需樣品制備,是菌株高通量篩選技術(shù)的理想選擇之一。
雖然液相色譜質(zhì)譜聯(lián)用技術(shù)具有高分辨率、高靈敏度的優(yōu)點(diǎn),但是色譜分離往往需要較長時(shí)間,難以實(shí)現(xiàn)高通量分析。因此,當(dāng)前基于質(zhì)譜的菌株高通量篩選方法通常避免采用色譜分離,而是在樣品制備后直接進(jìn)行質(zhì)譜檢測。
1.2.1 基于解吸電離質(zhì)譜技術(shù)的菌株篩選方法
解吸電離質(zhì)譜技術(shù)的典型代表是MALDI質(zhì)譜。該技術(shù)首先將微生物樣品與基質(zhì)分別點(diǎn)加在鋼靶上,晾干后形成共結(jié)晶。而后在激光照射下,共結(jié)晶中的基質(zhì)分子吸收激光能量并幫助樣品分子電離,進(jìn)入質(zhì)量分析器進(jìn)行檢測[41]。MALDI離子源通常與飛行時(shí)間質(zhì)量分析器(time of flight analyzer,TOF)聯(lián)合使用[42],稱為基質(zhì)輔助激光解吸飛行時(shí)間質(zhì)譜(MALDI-TOF MS)。MALDITOF MS具有檢測窗口較大、掃描速率快、耐鹽性高和成本相對較低的特點(diǎn)[43-44],非常適用于菌株的高通量篩選。對于瓊脂平板菌落的篩選,Zhao等[45]開發(fā)了基于MALDI-TOF MS的?;溋字D憠A檢測方法,將中鏈脂肪酸(medium-chain fatty acid,MCFA)量化信息轉(zhuǎn)化為m/z730峰和m/z758峰的相對強(qiáng)度,并將其作為檢測指標(biāo)用于高產(chǎn)MCFA的釀酒酵母菌株篩選,實(shí)現(xiàn)了每分鐘30個(gè)樣品的分析通量。此外,視覺輔助識(shí)別技術(shù)的引入也大幅提高了菌落分析的速度。Sweedler等[22]結(jié)合機(jī)器視覺算法開發(fā)了基于MALDI-TOF MS的瓊脂平板菌落高通量篩選方法。該方法巧妙地采用膜轉(zhuǎn)移策略將平板上分散的菌落轉(zhuǎn)移至靶板上,利用菌斑自動(dòng)識(shí)別技術(shù)對隨機(jī)分布的大腸桿菌菌落取樣分析,以每個(gè)樣品小于2.5 s的速度進(jìn)行檢測,并在天然產(chǎn)物文庫篩選中驗(yàn)證了該方法的實(shí)用性。對于微孔板培養(yǎng)的菌株,Sweedler團(tuán)隊(duì)[46]開發(fā)了將樣本位置轉(zhuǎn)換為MALDI檢測坐標(biāo)的算法,在大腸桿菌及熒光假單胞菌文庫實(shí)現(xiàn)高通量檢測(每個(gè)樣品小于2 s),拓展了MALDI質(zhì)譜技術(shù)在菌株篩選中的應(yīng)用。此外,選用金納米顆粒代替DHB作為分析脂肪酸的基質(zhì),以增強(qiáng)檢測信號強(qiáng)度。為了評估無標(biāo)記質(zhì)譜技術(shù)在活性酶快速篩選方面的能力,Si等[47]報(bào)道了應(yīng)用于環(huán)二肽合酶的定向進(jìn)化改造的MALDI-TOF MS篩選平臺(tái),對重組大腸桿菌突變體文庫進(jìn)行高通量篩選(每個(gè)樣品5 s)。最近該研究團(tuán)隊(duì)將這一技術(shù)運(yùn)用到羊毛硫肽化合物突變體文庫篩選[48],且基本實(shí)現(xiàn)整個(gè)流程的自動(dòng)化。此外,Cramer等[49]進(jìn)一步將大氣壓(atmospheric pressure,AP)與MALDI結(jié)合,開發(fā)了一種液體大氣壓基質(zhì)輔助激光解吸電離(AP-MALDI)裝置,可用于肽、抗生素和脂質(zhì)三類不同物質(zhì)的高通量大規(guī)模樣品分析,每秒至少可檢測5個(gè)樣品,優(yōu)化得到的液體基質(zhì)可用于分析復(fù)雜生物液體,為培養(yǎng)環(huán)境復(fù)雜的菌株篩選提供選擇。對于微滴培養(yǎng)的菌株,也有使用MALDITOF MS直接篩選的報(bào)道[50-51]。Dittrich等[51]利用自制裝置將液滴轉(zhuǎn)移在平板上的確定位置,進(jìn)而通過基于平行玻片的液滴分離方法獲得細(xì)胞上清液樣品。該方法結(jié)合離線MALDI-TOF MS檢測,可在幾秒內(nèi)并行處理數(shù)千個(gè)液滴,并成功應(yīng)用于分泌甜蛋白酵母的篩選。由此可見,MALDI質(zhì)譜是目前適用于不同培養(yǎng)類型菌株高通量篩選的通用平臺(tái)。
在MALDI基礎(chǔ)上發(fā)展起來的SAMDI技術(shù),由美國西北大學(xué)MiIan Mrksich團(tuán)隊(duì)[52]提出并進(jìn)行了系統(tǒng)研究。SAMDI利用自組裝單層技術(shù)在靶板上修飾功能基團(tuán),可在復(fù)雜體系中特異性富集分析物并進(jìn)行質(zhì)譜檢測[23,53]。Mrksich等[23]利用SAMDI技術(shù)將靶板表面修飾馬來酰亞胺基團(tuán),通過加成反應(yīng)將未純化的反應(yīng)產(chǎn)物固定在自組裝單層上,用于篩選大腸桿菌產(chǎn)生的細(xì)胞色素P411突變體文庫,將5000個(gè)變體的篩選時(shí)間從24 d(1次重復(fù))縮短為17 h(4次重復(fù))。SAMDI技術(shù)還被廣泛應(yīng)用于酶活性篩選[54-57],展現(xiàn)了其在菌株高通量篩選方面的應(yīng)用潛力。
此外,為了解決常規(guī)解吸質(zhì)譜需要添加基質(zhì)的問題,斯克利普斯研究院的Gary Siuzdak團(tuán)隊(duì)于2007年開發(fā)了NIMS技術(shù)[58]。該技術(shù)首先通過對載體材料進(jìn)行電化學(xué)刻蝕得到納米結(jié)構(gòu)表面(如多孔硅表面),之后在納米結(jié)構(gòu)表面捕獲氟化物以形成“引發(fā)劑”層,并將待測分子吸附在“引發(fā)劑”層的表面[59]。當(dāng)受到離子束或激光擊打時(shí),“引發(fā)劑”可以釋放和離子化待測分子,隨后進(jìn)入質(zhì)譜進(jìn)行檢測(如圖1所示)。盡管利用NIMS分析不同待測物時(shí)所選用的氟化物有所差別,但與MALDI相比,減少了基質(zhì)的干擾。這使得NIMS技術(shù)可以更容易分辨出離子峰,提高檢測靈敏度,成為菌株高通量篩選的有前景平臺(tái)[24-25]。Keasling團(tuán)隊(duì)[25]提出了一種點(diǎn)擊輔助NIMS酶活性測定法(probing enzymes with click-assisted NIMS,PECAN),通過將點(diǎn)擊化學(xué)與NIMS相結(jié)合,對復(fù)雜基質(zhì)中的酶活性進(jìn)行高通量質(zhì)譜檢測,并利用該方法成功篩選了大腸桿菌細(xì)胞色素P450突變體文庫。
圖1 NIMS原理圖Fig. 1 Schematic of NIMS
1.2.2 基于電噴霧電離質(zhì)譜技術(shù)的菌株篩選方法
ESI質(zhì)譜技術(shù)通過施加高電壓將液體樣品霧化成微小液滴,在輔助氣作用下溶劑蒸發(fā),液滴表面電荷密度逐漸增加,最后形成極小的帶電離子進(jìn)入質(zhì)量分析器進(jìn)行檢測[60]。ESI屬于軟電離方式,適合于分析極性強(qiáng)、熱穩(wěn)定性差的生物大分子。然而,由于ESI電離源耐鹽性較差,菌株樣本通常需要經(jīng)過提取凈化或色譜分離后進(jìn)行質(zhì)譜采集。Ellis等[26]開發(fā)了超快速(84 s)液相色譜質(zhì)譜聯(lián)用方法和條形碼納米孔測序相結(jié)合的菌株檢測方法,解決了色譜分離通常占用大量時(shí)間的問題,在24 h內(nèi)篩選1000個(gè)菌落,得到12株三萜樺木酸產(chǎn)量提高的釀酒酵母菌株。融合LESA技術(shù)的新一代TVNM離子源是用于菌株高通量篩選的另一良好工具,LESA使用溶劑萃取提取樣品,得到的樣品直接進(jìn)入質(zhì)譜檢測,可以最大限度減少基質(zhì)效應(yīng)。Sweedler課題組[61]將LESA技術(shù)、聲學(xué)液體工作站及穩(wěn)定同位素標(biāo)記方法結(jié)合,成功用于酵母菌株衣康酸、三乙酸內(nèi)酯和棕櫚酸的高通量絕對定量篩選,每個(gè)樣品檢測過程大約需要1 min。然而,可能是由于樣品提取效率不一致和基質(zhì)干擾的原因,LESA技術(shù)尚未廣泛用于工程菌株篩選。除了上述應(yīng)用于微孔板培養(yǎng)菌株的方法,基于ESI的質(zhì)譜技術(shù)也被用于篩選液滴培養(yǎng)的菌株[36,62]。Dusny等[36]將微流控芯片技術(shù)與在線ESI質(zhì)譜檢測結(jié)合,將納升級液滴通過集成發(fā)射器直接注入ESI電離源檢測,用于篩選不同生長介質(zhì)中生產(chǎn)賴氨酸的谷氨酸棒桿菌優(yōu)勢菌株,篩選通量為每分鐘60個(gè)樣品。
1.2.3 基于原位電離質(zhì)譜技術(shù)的菌株篩選方法
自2004年美國普渡大學(xué)Cooks等[63]首次報(bào)道以來,DESI目前已成為AI質(zhì)譜的代表性技術(shù)。該技術(shù)通過向樣品噴射由ESI 產(chǎn)生的帶電霧滴實(shí)現(xiàn)樣品離子化,經(jīng)氮?dú)獯祾吒稍锖?,分析物以氣相離子形式進(jìn)入質(zhì)譜檢測(如圖2所示)。
圖2 DESI源原理圖[63]Fig. 2 Schematic of the DESI source[63]
DESI可在大氣壓條件下工作,通過調(diào)節(jié)噴霧溶劑種類提高對待測物的選擇性檢測,且無需復(fù)雜的樣品預(yù)處理,是適用于菌株高通量篩選的有效方法。DESI通常與質(zhì)譜成像技術(shù)(mass spectrometry imaging,MSI)結(jié)合,將產(chǎn)物量化信息映射到其空間位置,以區(qū)分菌落邊界并產(chǎn)生質(zhì)譜強(qiáng)度信息[64-65]。Barran等[64]利用DESI-MSI技術(shù),對大腸桿菌生物催化劑產(chǎn)物解氨酶及P450單加氧酶進(jìn)行實(shí)時(shí)篩選,通量約每分鐘60個(gè)樣品。McLean等[65]同樣使用DESI-MSI技術(shù),結(jié)合MMS取樣方法對工程大腸桿菌中的游離脂肪酸進(jìn)行快速原位分析,從樣本轉(zhuǎn)移到采集質(zhì)譜數(shù)據(jù),每個(gè)菌落樣本需要8 min。
REI質(zhì)譜是近些年來新興的AI質(zhì)譜技術(shù), 于2009年由帝國理工學(xué)院Takáts團(tuán)隊(duì)[66]提出。該技術(shù)通過電離切割樣品釋放氣溶膠,再通過導(dǎo)管將氣溶膠直接吸入到質(zhì)譜儀進(jìn)行檢測,特別適合原位快速分析。Taka?ts等[67]將激光與REI技術(shù)結(jié)合,發(fā)展了激光輔助快速蒸發(fā)電離(laser-assisted rapid evaporative ionization,LA-REI)質(zhì)譜技術(shù)(圖3),激光可實(shí)現(xiàn)菌株代謝物即時(shí)半定量分析。
圖3 LA-REI源原理圖[68]Fig. 3 Schematic of the LA-REI source[68]
將該方法用于評估酵母菌株中紫色桿菌素和白樺酸的生產(chǎn)水平,以每分鐘6個(gè)菌落的通量直接從酵母菌落采樣,通過篩選數(shù)百個(gè)菌落后成功分離出1株高產(chǎn)菌株,其白樺酸產(chǎn)量提高了2.5倍。LA-REI質(zhì)譜快速、便捷的優(yōu)勢使其在菌株高通量篩選方面具有巨大潛力[68]。
綜上所述,不同類型的質(zhì)譜技術(shù)為菌株高通量篩選提供有力工具,篩選速率可以達(dá)到秒級,相關(guān)內(nèi)容總結(jié)見表1。此外,一些其他質(zhì)譜技術(shù),如MALDI源與ESI源結(jié)合產(chǎn)生的基質(zhì)輔助激光解吸電噴霧電離(matrix-assisted laser desorption electrospray ionization,MALDESI)質(zhì)譜,也展現(xiàn)出超快的檢測速度[69-70],為菌株高通量篩選方法的開發(fā)提供了潛在可能。
表1 基于高通量質(zhì)譜技術(shù)的菌株篩選研究匯總Table 1 Summary of strain screening studies based on high-throughput mass spectrometry
自動(dòng)化的質(zhì)譜檢測會(huì)產(chǎn)生海量數(shù)據(jù),需要后續(xù)數(shù)據(jù)平臺(tái)快速同步分析以滿足高通量篩選需求。當(dāng)前的數(shù)據(jù)處理分析流程通?;谏虡I(yè)化軟件或根據(jù)實(shí)際工作流程編寫相應(yīng)代碼,以實(shí)現(xiàn)整個(gè)篩選過程的順利運(yùn)行。
針對解吸電離質(zhì)譜技術(shù)產(chǎn)生的數(shù)據(jù),常用的SpectralAnalysis[71]、Flex Analysis(Bruker)、TOF/TOF Series Explorer(AB Sciex)等軟件可滿足基本的處理分析需求。此外,有些研究基于Python、MATLAB平臺(tái),自行編寫代碼以匹配實(shí)際篩選流程。Sweedler團(tuán)隊(duì)[46]基于Python開發(fā)了macroMS程序,該程序通過對一定質(zhì)荷比范圍內(nèi)的離子總數(shù)求和對MALDI-TOF MS成像數(shù)據(jù)的處理,同時(shí)創(chuàng)建了數(shù)據(jù)可視化分析網(wǎng)頁,并生成樣本數(shù)據(jù)熱圖,成功用于產(chǎn)MCFA的釀酒酵母菌株的高通量篩選。Si等[22]開發(fā)了用于多元統(tǒng)計(jì)分析的算法,結(jié)合t分布-隨機(jī)鄰近嵌入(t-SNE)對數(shù)據(jù)進(jìn)行降維可視化分析,以快速評估和識(shí)別具有所需表型的突變體。對于ESI質(zhì)譜技術(shù)的數(shù)據(jù)處理分析,可以借助Protein Metrics Intact Mass、MassLynx(Waters)、MultiQuant(AB Sciex)等平臺(tái)處理。
基于DESI、NIMS的質(zhì)譜篩選技術(shù)通常與成像技術(shù)結(jié)合,OpenMSI平臺(tái)[72]是處理上述質(zhì)譜成像數(shù)據(jù)的有效工具。為了進(jìn)一步提高數(shù)據(jù)處理通量,Bowen等[73]開發(fā)了OpenMSI陣列分析工具包(OpenMSI Arrayed Analysis Toolkit,OMAAT)。該軟件基于Python編寫,并集成了OpenMSI平臺(tái),可用于存儲(chǔ)、共享和分析MSI數(shù)據(jù),解決了大型質(zhì)譜成像數(shù)據(jù)集快速處理問題,將基于NIMS技術(shù)檢測的384個(gè)樣品成像數(shù)據(jù)分析時(shí)間縮短為原時(shí)長的1%。
菌株代謝通路中的關(guān)鍵蛋白及小分子代謝物的高通量精準(zhǔn)定量分析,不僅是深入認(rèn)識(shí)代謝通路調(diào)控機(jī)制的重要手段,也有助于加速M(fèi)CF進(jìn)化的效率。相比于傳統(tǒng)的基于WB的蛋白檢測方法和基于NMR的代謝分子檢測方法,基于高通量液相色譜質(zhì)譜的蛋白質(zhì)組學(xué)和代謝組學(xué)技術(shù)具有定量準(zhǔn)確性高、重現(xiàn)性好等特點(diǎn),在工程菌株關(guān)鍵分子定量環(huán)節(jié)發(fā)揮著重要作用。根據(jù)分析檢測流程,分為四個(gè)關(guān)鍵步驟:樣品制備、色譜分離、質(zhì)譜檢測及數(shù)據(jù)處理。
隨著液相色譜質(zhì)譜聯(lián)用技術(shù)的進(jìn)步,大批量MCF樣品中關(guān)鍵分子的定量分析成為可能,同時(shí)也對樣品制備的通量及重現(xiàn)性提出了挑戰(zhàn)。近年來,自動(dòng)化移液工作站相繼問世[74-75],配合微孔板實(shí)現(xiàn)批量化樣品預(yù)處理。儀器代替手工操作不僅大大提升了樣品制備通量,而且也顯著提高了樣品處理的重現(xiàn)性。
傳統(tǒng)基于自下而上(bottom-up)的蛋白質(zhì)組學(xué)樣品預(yù)處理流程包括蛋白質(zhì)提取、變性、還原、烷基化、除鹽和酶解等步驟,通常在自由溶液中離線操作完成,整個(gè)流程步驟多、耗時(shí)久、損失大。為了提高預(yù)處理通量,Petzold等[76]發(fā)展了3步模塊化樣品制備方案,包括菌株裂解、蛋白提取定量及酶解,結(jié)合Biomek-NX自動(dòng)化移液工作站可在1 h內(nèi)完成96個(gè)樣品的酶解前流程,并被成功用于革蘭氏陰性細(xì)菌和真菌樣品的預(yù)處理。為了加快樣品制備流程并減少樣品損失,Krijgsveld團(tuán)隊(duì)[77-78]發(fā)展了單罐固相增強(qiáng)樣品制備(singlepot solid-phase-enhanced sample preparation,SP3)方法,利用羧基包覆的順磁珠與樣品之間的親疏水相互作用,在18 min內(nèi)完成蛋白質(zhì)捕獲,隨后進(jìn)行原位除鹽及酶解處理實(shí)現(xiàn)蛋白樣品制備?;赟P3方法與96微孔板,Armengaud等[79]開發(fā)了一個(gè)高通量樣品制備平臺(tái),省略了還原及烷基化過程,將酶解時(shí)間縮短為15 min,實(shí)現(xiàn)了細(xì)菌蛋白樣品的快速制備。Paulo課題組[80]將SP3與串聯(lián)質(zhì)量標(biāo)簽(tandem mass tag,TMT)技術(shù)結(jié)合,使用opentrons OT-2移液工作站開發(fā)了半自動(dòng)SL-SP3-TMT(streamlined-SP3-TMT)樣品制備方法(酶解操作需在額外的加熱振蕩器上進(jìn)行),可在9 h內(nèi)實(shí)現(xiàn)96個(gè)酵母樣品的半自動(dòng)化TMT標(biāo)記化制備。此外,研究者還報(bào)道了針對蛋白質(zhì)翻譯后修飾的高通量樣品制備方法。Lipton等[81]發(fā)展了一種自動(dòng)化系統(tǒng),利用大容量固定化金屬離子親和色譜(immobilized metal affinity chromatography,IMAC)柱增加肽負(fù)載量同時(shí)減少洗滌時(shí)間,實(shí)現(xiàn)細(xì)菌樣品中磷酸肽的高效富集。Leutert等[82]將SP3方法和基于Fe-IMAC磁珠的磷酸化富集技術(shù)進(jìn)行整合,發(fā)展了一種高通量的磷酸化蛋白質(zhì)組學(xué)分析流程(rapid-robotic phosphoproteomics,R2-P2),結(jié)合King Fisher Flex自動(dòng)化移液工作站可在5 h內(nèi)實(shí)現(xiàn)釀酒酵母磷酸化蛋白質(zhì)組預(yù)處理。
對于代謝物而言,樣本制備流程通常包括采樣、猝滅、細(xì)胞內(nèi)/外代謝物提取[18]。細(xì)胞外代謝物存在于培養(yǎng)基中,僅需要將培養(yǎng)基與微生物菌株分離,進(jìn)行下游檢測即可。而細(xì)胞內(nèi)代謝物所處的環(huán)境復(fù)雜,代謝物之間可以迅速轉(zhuǎn)化,因此處理流程更為復(fù)雜。尤其在進(jìn)行大量菌株的代謝物樣本制備時(shí),需要盡可能對每一步操作進(jìn)行優(yōu)化。為了提高采樣速度及猝滅效率,人們開發(fā)了自動(dòng)化采樣猝滅裝置[83-85]。最近,Blank等[86]開發(fā)了一種基于不可逆電穿孔的采樣裝置,通過脈沖電場調(diào)節(jié)微流控芯片的流量,可在數(shù)秒內(nèi)實(shí)現(xiàn)細(xì)胞內(nèi)代謝物的采樣、猝滅及提取處理,適用于細(xì)胞壁和細(xì)胞膜特性不同的多種細(xì)胞類型。此外,提取也是代謝物樣品制備的重要環(huán)節(jié),包括細(xì)胞破碎以及隨后的代謝物提取和樣品濃縮等步驟。當(dāng)前常用的細(xì)胞破碎方法可分為基于超聲、微波及研磨等過程的物理破碎方法,基于熱乙醇、乙腈等有機(jī)試劑的化學(xué)破碎方法,以及基于溶菌酶等破壁酶的酶解法。代謝物提取方法主要有蛋白質(zhì)沉淀法(protein precipitation,PPT)、液液萃取法(liquid-liquid extraction,LLE)及SPE技術(shù)等[87]。其中,SPE技術(shù)由于回收率更高,可將分析物與干擾組分有效分離,是當(dāng)前代謝物提取的主要方法。其利用在短管里填充固體吸附劑,選擇性地吸附樣品溶液中的目標(biāo)物質(zhì),隨后選用適當(dāng)強(qiáng)度的溶劑沖洗雜質(zhì),最后洗脫獲得目標(biāo)物質(zhì)。為了滿足高通量分析的需求,目前自動(dòng)化固相萃取技術(shù)也已問世。Six等[88]發(fā)展了一種基于SPE的無標(biāo)記質(zhì)譜檢測方法(簡稱:BacPK),結(jié)合RapidFire系統(tǒng),在2 h內(nèi)完成細(xì)菌裂解、提取及固相萃取等操作,用于檢測大腸桿菌細(xì)胞內(nèi)化合物的總積累量。在SPE基礎(chǔ)上發(fā)展起來的固相微萃取技術(shù)(solid-phase microextraction,SPME)集萃取、濃縮及進(jìn)樣于一體[89],也被用于菌株中微量代謝物的快速樣品制備[90-92]。SPME具有樣品用量少、選擇性高及使用便捷的優(yōu)點(diǎn),易于實(shí)現(xiàn)自動(dòng)化。Pawliszyn等[90]開發(fā)并應(yīng)用不同的SPME涂層,發(fā)展了同時(shí)提取大腸桿菌中疏水性和親水性代謝物方法,并與96孔板結(jié)合,可在4 h左右完成腸桿菌中代謝物提取、洗滌及解吸過程,隨后又將該方法應(yīng)用于肉桂醛對大腸桿菌的殺菌機(jī)制研究[93]。
高通量樣品制備方法的革新,將樣品預(yù)處理時(shí)間從原來的數(shù)天縮短至幾小時(shí),使大規(guī)模菌株樣本快速處理成為可能。但是,由于樣品制備流程步驟多,且步驟之間多需要進(jìn)行轉(zhuǎn)移,還未實(shí)現(xiàn)全流程完全自動(dòng)化。借助新興的智能自動(dòng)化平臺(tái),實(shí)現(xiàn)樣品制備全流程集成化、自動(dòng)化已成為未來的發(fā)展趨勢。
目前,液相色譜質(zhì)譜聯(lián)用技術(shù)在針對大量菌株樣本的關(guān)鍵分子定性定量分析中占據(jù)主導(dǎo)地位,可用于細(xì)胞工廠代謝通路路徑識(shí)別和優(yōu)化[94],指導(dǎo)MCF的理性設(shè)計(jì),并為基因組尺度代謝網(wǎng)絡(luò)模型(genome-scale metabolic model,GEM)構(gòu)建提供支撐。色譜分離可實(shí)現(xiàn)復(fù)雜樣品的高效分離,大幅提高后續(xù)質(zhì)譜檢測的準(zhǔn)確度和靈敏度,是液相色譜質(zhì)譜聯(lián)用技術(shù)的關(guān)鍵環(huán)節(jié)。
傳統(tǒng)液相色譜質(zhì)譜聯(lián)用技術(shù)基于納升流速,靈敏度雖高,但較長的分離時(shí)間嚴(yán)重限制了分析通量。近些年來,以毛細(xì)管流速(capillary-flow)液相色譜、微升流速(micro-flow)液相色譜及分析流速(analytical-flow)液相色譜為代表的高通量色譜技術(shù)應(yīng)運(yùn)而生[95],結(jié)合不同的分離模式,為解決大隊(duì)列樣本不同類型關(guān)鍵分子的快速檢測提供技術(shù)支撐。Petzold等[96]采用C18色譜柱(50 mm×2.1 mm),流速400 μL/min,梯度25 min,聯(lián)合Agilent 6460三重四極桿質(zhì)譜儀,對大腸桿菌中的600多條肽(367個(gè)蛋白)進(jìn)行了定量。Ralser等[97]基于HSS T3色譜柱(150 mm×300 μm),在5 μL/min及19 min有效分離梯度條件下與TripleTOF 6600聯(lián)用,定量來自796個(gè)酵母菌株的1576個(gè)蛋白質(zhì),實(shí)現(xiàn)了非整倍體的系統(tǒng)分析,揭示了其在蛋白質(zhì)組水平上的劑量補(bǔ)償。以上色譜分離主要采用經(jīng)典的反相液相色譜(reverse phase liquid chromatography,RPLC)模式。它采用非極性介質(zhì)作為固定相,極性溶液為流動(dòng)相,根據(jù)溶質(zhì)極性差別對復(fù)雜樣品進(jìn)行分離。對于MCF中的糖類、磷酸化合物等強(qiáng)極性分子,常用的檢測模式為親水相互作用色譜(hydrophilic interaction chromatography,HILIC)。HILIC采用了親水固定相和疏水流動(dòng)相,在分離過程中,親水固定相表面首先形成一個(gè)水層,親水的極性分子集中在固定相周圍的水層,而低極性的分子溶解在有機(jī)相中。Paglia等[98]報(bào)道了用于小分子極性代謝物的常規(guī)高通量檢測方法,基于HILIC分離和四極桿飛行時(shí)間質(zhì)譜檢測模式,在10 min分離梯度及400 μL/min流速下全面分析糖、磷酸化合物、嘌呤和嘧啶、核苷酸等多種小分子極性代謝物。Brouwers等[99]建立了高通量脂質(zhì)分子分析流程,使用HILIC分離柱(50 mm×4.6 mm)在1 mL/min流速及4 min梯度內(nèi)與質(zhì)譜聯(lián)用檢測223個(gè)脂質(zhì)分子。
此外,丹麥Evosep公司于2018年推出新型Evosep One液相系統(tǒng),包含了用于樣品洗脫及梯度存儲(chǔ)的低壓泵和同步快速上樣及色譜分離的高壓泵,創(chuàng)新型的高低壓管路設(shè)計(jì)消除了樣品間色譜柱平衡時(shí)間[100],可在6 min有效梯度內(nèi)實(shí)現(xiàn)每天200個(gè)樣品的檢測通量[101-102]。Evosep One系統(tǒng)通量高及穩(wěn)定性好的優(yōu)勢為大規(guī)模低樣本量的菌株關(guān)鍵分子定量分析提供選擇。
多色譜柱系統(tǒng)開辟了提升分離通量的另一路徑。雙液相色譜平臺(tái)可以充分利用上樣時(shí)質(zhì)譜采集的空閑時(shí)間,提高檢測通量[103-104]。Mann課題組[104]開發(fā)了樣品制備與雙液相色譜平臺(tái)平行的高通量工作流程,優(yōu)化樣品采集時(shí)間為15min,可在1 d內(nèi)完成96個(gè)較低或中等復(fù)雜度樣品的分析檢測。值得關(guān)注的是,商業(yè)化Transcend TLX系統(tǒng),結(jié)合在線SPE技術(shù)及多通道液相色譜分離,有效提高質(zhì)譜檢測利用率,已在病毒蛋白鑒定中有所應(yīng)用,可以達(dá)到每天超過500個(gè)樣本的分析通量[105],是高通量色譜分離方面很有前景的平臺(tái)。
質(zhì)譜擁有卓越的檢測能力,可在一次運(yùn)行中對成百上千個(gè)關(guān)鍵分子進(jìn)行分析。為滿足不同檢測規(guī)模和監(jiān)測目標(biāo)的需求,人們可以采用非靶向型技術(shù)和靶向型技術(shù)對蛋白質(zhì)或代謝物分子進(jìn)行質(zhì)譜分析,例如數(shù)據(jù)依賴型采集(data-dependent acquisition, DDA)是典型的非靶向采集技術(shù),選擇反應(yīng)監(jiān)測(selected reaction monitoring,SRM)是靶向采集技術(shù)的代表。
2.3.1 關(guān)鍵分子非靶向定量分析
非靶向分析是一種無偏向性檢測技術(shù),側(cè)重對微生物體內(nèi)某一類物質(zhì)(如蛋白質(zhì)、代謝物)進(jìn)行系統(tǒng)性檢測,全面深入分析微生物表達(dá)特征并發(fā)現(xiàn)影響菌株產(chǎn)量的關(guān)鍵差異分子。關(guān)鍵分子非靶向定量分析通常使用無標(biāo)記定量(label free quantitation,LFQ)策略,通過比較同一離子在多個(gè)樣品中的質(zhì)譜信號差異,可以對不同樣本中同一分子的含量進(jìn)行相對定量分析[106]。此外,穩(wěn)定同位素標(biāo)記定量是另一種常用的非靶向定量分析策略。該方法通過代謝標(biāo)記或體外標(biāo)記,在蛋白或肽段上引入13C、15N等穩(wěn)定同位素[107]。使不同樣品中同一肽段具有不同的質(zhì)量標(biāo)簽。在對混合樣品進(jìn)行質(zhì)譜分析時(shí),不同來源的同一肽段產(chǎn)生不同的信號離子,根據(jù)它們的峰強(qiáng)度進(jìn)行定量分析[108-109]。無標(biāo)記定量方法具有更寬的動(dòng)態(tài)范圍和更深的覆蓋度,而穩(wěn)定同位素標(biāo)記方法的定量精度和準(zhǔn)確性更高[110]。DDA是經(jīng)典的非靶向質(zhì)譜采集模式,即首先進(jìn)行一級質(zhì)譜全掃描,隨后對一級譜圖中選中的強(qiáng)度較高的母離子進(jìn)行二級掃描[111]。由于這種方式獲得的譜圖質(zhì)量較高,因此在分子定性定量檢測中應(yīng)用廣泛。然而,傳統(tǒng)DDA模式隨機(jī)性大,導(dǎo)致數(shù)據(jù)重現(xiàn)性較差,易產(chǎn)生大量缺失值。近年來發(fā)展起來的數(shù)據(jù)非依賴型采集模式(data-independent acquisition,DIA),即不依賴一級譜中的離子強(qiáng)度信息,對每個(gè)窗口區(qū)域所有母離子進(jìn)行連續(xù)碎裂檢測。該方法可以獲得所有碎片離子信息(見圖4),提高了數(shù)據(jù)利用度,具有重現(xiàn)性好、定量準(zhǔn)確性高及通量高等優(yōu)點(diǎn)[113-114],逐漸成為關(guān)鍵分子高通量定量分析的有力工具。Mann等[115]建立一種快速DIA分析方法,與RPLC聯(lián)用,在2.2 d內(nèi)定量檢測了100個(gè)酵母蛋白質(zhì)組樣品。Ralser課題組[116]發(fā)展了Scaning SWATH模式,結(jié)合800 μL/min分析流速,可在5 min內(nèi)對來自酵母的1900種蛋白進(jìn)行相對定量。值得注意的是,DIA采集模式也有其不足,即在獲得更多信息的同時(shí)增加了譜圖分析難度。此外,離子淌度(ion mobility,IM)技術(shù)[117]可以根據(jù)離子大小和形狀差異引起的漂移時(shí)間差來實(shí)現(xiàn)第四維度的分離,有效降低譜圖復(fù)雜程度及數(shù)據(jù)匹配的假陽性,可以進(jìn)一步提高鑒定準(zhǔn)確度。Burgess等[118]采用兩性離子親水相互作用色譜(ZICHILIC)與漂移管離子淌度-四極桿飛行時(shí)間(DTIM-QTOF)質(zhì)譜模式,開發(fā)了一種高覆蓋度的非靶向代謝組學(xué)快速工作流程,在800 μL/min流速及3.5 min梯度條件下檢測到細(xì)菌細(xì)胞內(nèi)2139個(gè)代謝物分子特征。
圖4 非靶向采集模式原理圖[112]Fig. 4 Schematic diagram of the untargeted acquisition mode [112]
2.3.2 關(guān)鍵分子靶向定量分析
靶向分析側(cè)重于已知關(guān)鍵分子的定量檢測,通過針對性地檢測代謝通路中的關(guān)鍵蛋白及代謝物,克服了非靶向采集過程中大量離子干擾及低豐度離子不易檢測的問題。靶向分析通常用于關(guān)鍵分子的絕對定量,使用待測組分標(biāo)準(zhǔn)品或在樣品中加入內(nèi)標(biāo)物質(zhì),通過比較標(biāo)準(zhǔn)品或內(nèi)標(biāo)物質(zhì)與待測樣品質(zhì)譜信號峰面積進(jìn)行定量。對于代謝物分子的絕對定量,通常由不同濃度的標(biāo)準(zhǔn)品得到標(biāo)準(zhǔn)曲線,使用內(nèi)標(biāo)物質(zhì)消除系統(tǒng)誤差,在標(biāo)準(zhǔn)品濃度與峰面積、目標(biāo)物質(zhì)峰面積已知的情況下,計(jì)算出樣品中目標(biāo)物質(zhì)的含量[119]。對于蛋白質(zhì)的絕對定量,已經(jīng)發(fā)展了絕對定量分析(absolute quantification,AQUA)[120]、基于定量肽段聚合物(concatemer of quantification peptides,QconCAT)[121]、蛋白標(biāo)準(zhǔn)品絕對定量(protein standard absolute quantification,PASQ)[122]等多種方法,通過合成標(biāo)準(zhǔn)肽段或構(gòu)建重組蛋白,經(jīng)過質(zhì)譜分析,達(dá)到對目標(biāo)肽段準(zhǔn)確定量的目的。以上絕對定量方法的本質(zhì)是通過已知標(biāo)準(zhǔn)物質(zhì)的量化信息來間接得到目標(biāo)蛋白質(zhì)或代謝物的絕對量。SRM[123]是最經(jīng)典的靶向采集技術(shù),該技術(shù)基于三重四極桿質(zhì)譜對目標(biāo)物進(jìn)行分析,通過第一重四極桿選擇目標(biāo)分子的母離子,隨后在第二重四極桿中發(fā)生碎裂,再由第三重四極桿進(jìn)行目標(biāo)碎片離子檢測。目標(biāo)分子母離子的碰撞碎裂效率與離子傳輸和離子聚焦相關(guān),增加多極桿數(shù)目可提升傳輸效率卻影響離子聚焦,為了平衡二者以獲得更好效果,常選用六極桿碰撞池對母離子進(jìn)行碎裂,但是在表述上依然采用三重四極桿的說法。在SRM基礎(chǔ)上發(fā)展起來的多反應(yīng)監(jiān)測(multiple reaction monitoring,MRM)技術(shù),可實(shí)現(xiàn)多個(gè)碎片離子同時(shí)監(jiān)測,由于二者根本原理一致,可不做明顯區(qū)分。SRM/MRM技術(shù)特異性強(qiáng)、靈敏度高且重現(xiàn)性好,在微生物關(guān)鍵分子定量分析研究中應(yīng)用廣泛[94]。Petzold等[124]開發(fā)了基于高流速RPLC和SRM檢測技術(shù)的高通量靶向蛋白質(zhì)組學(xué)方法,在5.5 min有效梯度內(nèi)實(shí)現(xiàn)了大腸桿菌21條主要代謝途徑的400多種蛋白質(zhì)的絕對定量分析,為大腸桿菌關(guān)鍵代謝通路蛋白質(zhì)的快速精準(zhǔn)定量分析提供了可靠的工具。Gao等[125]利用微流RPLC結(jié)合SRM采集模式,在32 min內(nèi)實(shí)現(xiàn)了惡臭假單胞菌(P. putidaKT2440)中132種蛋白質(zhì)的定量分析,揭示了惡臭假單胞菌KT2440在不同碳源及培養(yǎng)基中這些酶的表達(dá)水平的變化。Herrg?rd課題組[126]開發(fā)了一種用于高通量定量代謝組學(xué)的快速反相離子配對液相色譜三重四極桿質(zhì)譜(rapid reverse phase ion-pairing liquid chromatography triple quadrupole mass spectrometry,RapidRIP)方法,結(jié)合MRM采集模式,該方法能夠在不到5 min的時(shí)間內(nèi)定量分析氨基酸、核苷酸和輔因子等102種工程大腸桿菌的代謝物。高通量關(guān)鍵分子SRM/MRM分析方法的進(jìn)步為深入認(rèn)識(shí)并指導(dǎo)MCF代謝通路改造提供幫助。
此外,針對混合型高分辨質(zhì)譜系統(tǒng)(如四極桿離子阱質(zhì)譜、四極桿飛行時(shí)間質(zhì)譜),人們發(fā)展了平行反應(yīng)監(jiān)測(parallel reaction monitoring,PRM)技術(shù),可以對母離子產(chǎn)生的所有碎片離子進(jìn)行檢測(如圖5所示)。
相比于SRM/MRM,PRM選擇性及靈敏度更高,且由于避免了母子離子對的選擇與優(yōu)化,更便于方法開發(fā),已在菌株關(guān)鍵分子定量方面有所報(bào)道[127-130],在大規(guī)模樣本定量分析方面展現(xiàn)出了應(yīng)用潛力。
隨著高通量液相色譜和質(zhì)譜技術(shù)的發(fā)展與進(jìn)步,人們已經(jīng)可以在數(shù)分鐘內(nèi)實(shí)現(xiàn)MCF中的大量蛋白及代謝物的規(guī)?;糠治?,為大批量樣本快速檢測提供技術(shù)支撐,相關(guān)總結(jié)內(nèi)容見表2。
表2 基于液相色譜質(zhì)譜技術(shù)的菌株關(guān)鍵分子定量研究匯總Table 2 Summary of quantitative studies of key molecules of strains based on liquid chromatography mass spectrometry
高通量液相色譜質(zhì)譜聯(lián)用檢測產(chǎn)生大量的數(shù)據(jù)信息,亟需發(fā)展高通量的數(shù)據(jù)處理平臺(tái)與之匹配。質(zhì)譜采集產(chǎn)生的原始數(shù)據(jù)通常需要進(jìn)行特征提取、噪聲過濾及峰提取和對齊等前處理操作,隨后進(jìn)行多元統(tǒng)計(jì)分析和生物信息學(xué)分析[131]。這一過程可以借助軟件及商業(yè)化平臺(tái)進(jìn)行,如MaxQuant、Spectronaut、MZmine、XCMS等。此外,已經(jīng)報(bào)道了多項(xiàng)面向大型數(shù)據(jù)集處理及分析的研究工作。
2.4.1 數(shù)據(jù)處理
質(zhì)譜采集的信號中含有大量背景噪聲信號。當(dāng)樣品復(fù)雜程度高且目標(biāo)信號峰強(qiáng)較低時(shí),難以選定基線將目標(biāo)信號與噪聲信號有效區(qū)分,處理不當(dāng)會(huì)引入假陽性結(jié)果。因此準(zhǔn)確區(qū)分樣本信號與噪聲信號對于后續(xù)定量分析十分重要。此外,高通量分析過程中產(chǎn)生大規(guī)模的數(shù)據(jù)集,為了提高數(shù)據(jù)處理通量,亟需發(fā)展高通量自動(dòng)化的數(shù)據(jù)處理平臺(tái)。為了解決上述瓶頸問題,Aoshima等[132]開發(fā)了一種基于一級質(zhì)譜數(shù)據(jù)的無標(biāo)記峰檢測和定量算法(AB3D),該方法的主要特點(diǎn)為可以結(jié)合局部最小值及加權(quán)平均值算法進(jìn)行峰值提取、降序處理所有排列候選峰。AB3D采用2D降序峰檢測、較少的模型擬合方法及簡便的操作步驟有助于快速處理大規(guī)模數(shù)據(jù)。使用革蘭氏陰性菌株Bartonella quintana測試了AB3D算法的定量能力及運(yùn)行時(shí)間,發(fā)現(xiàn)其比四種現(xiàn)有軟件工具(MZmine2,MSight,SuperHirn和OpenMS)分析速度快大約1.2~15倍,但定量能力相當(dāng)。相比于AB3D算法,MZmine2、OpenMS使用多種不同類型模型擬合峰以及嵌入可視化工具,靈活性強(qiáng),但操作較為復(fù)雜[133-134];MSight從原始數(shù)據(jù)文件生成圖像以用于基于圖像的峰檢測,提供更為直觀的數(shù)據(jù)信息,但計(jì)算相對昂貴[135];SuperHirn使用多重比對策略結(jié)合聚類分析進(jìn)行數(shù)據(jù)處理,但處理文件格式有限[136]。同位素標(biāo)記提供了更準(zhǔn)確、更可靠的關(guān)鍵分子定量信息,但產(chǎn)生數(shù)據(jù)集更加復(fù)雜,數(shù)據(jù)分析的難度和用時(shí)都大幅增加。Kiefer等[137]開發(fā)了基于Python平臺(tái)的DynaMet擴(kuò)展包,用于從質(zhì)譜原始數(shù)據(jù)中自動(dòng)提取同位素標(biāo)記特征,可在10 min內(nèi)提取386個(gè)動(dòng)態(tài)標(biāo)記特征,并在芽孢桿菌及大腸桿菌動(dòng)態(tài)標(biāo)記實(shí)驗(yàn)中測試了該方法的普適性。此外,基于人工智能和機(jī)器學(xué)習(xí)的大數(shù)據(jù)發(fā)展平臺(tái)也在合成生物學(xué)及代謝工程領(lǐng)域嶄露頭角,大大提升了分析效率[138-139]。Ralser課題組[140]開發(fā)了用于處理高度復(fù)雜DIA數(shù)據(jù)的軟件(DIA-NN),利用深度神經(jīng)網(wǎng)絡(luò)分析(deep neural networks,DNNs)分辨真實(shí)信號與噪聲,發(fā)展新的量化和信號校正策略提高定性定量準(zhǔn)確度,可在3 h內(nèi)高通量完成364個(gè)酵母樣本的數(shù)據(jù)處理。
此外,研究者還開發(fā)了一系列針對靶向采集模式的數(shù)據(jù)處理工具[141-143]。針對當(dāng)前靶向檢測數(shù)據(jù)處理通量較低的問題,Aebersold等[141]開發(fā)了識(shí)別置信度轉(zhuǎn)移(transfer of identification confidence,Tric)算法填補(bǔ)了大規(guī)模靶向蛋白質(zhì)組學(xué)數(shù)據(jù)集自動(dòng)化分析的空白。該軟件利用碎片離子數(shù)據(jù)進(jìn)行交叉比對、統(tǒng)一峰提取和定量策略,可將大規(guī)模靶向蛋白質(zhì)組數(shù)據(jù)集分析誤差率降低為原來的1/3。Zhu等[142]開發(fā)了一種面向大規(guī)模靶向代謝組學(xué)數(shù)據(jù)處理的R包MRMAnalyzer,用于自動(dòng)化處理基于MRM模式的代謝組學(xué)數(shù)據(jù),可在20 min內(nèi)處理包含8000個(gè)母子離子對的大腸桿菌代謝組學(xué)數(shù)據(jù)集。
2.4.2 數(shù)據(jù)分析
高通量檢測技術(shù)造就的“大數(shù)據(jù)”時(shí)代已經(jīng)到來,對數(shù)據(jù)分析與挖掘提出了挑戰(zhàn)。為了更好地闡明預(yù)處理后的數(shù)據(jù),需要對其進(jìn)行深入的統(tǒng)計(jì)分析與生物信息學(xué)分析。Kang等[144]報(bào)道了代謝工程目標(biāo)選擇和最佳菌株識(shí)別工具(metabolic engineering target selection and best strain identification tool,MESSI),用于預(yù)測與酵母生物生產(chǎn)相適配的高效底盤和調(diào)節(jié)組件。MESSI可以分析已有的高通量代謝組學(xué)數(shù)據(jù),并將其轉(zhuǎn)換為相關(guān)代謝途徑,以獲得可實(shí)現(xiàn)目標(biāo)化合物高產(chǎn)的最有效的釀酒酵母菌株。Karp等[145]開發(fā)了一款生物信息學(xué)工具(pathway tools,PTools),可以為單細(xì)胞生物、多細(xì)胞生物以及泛基因組和生物群落(如大腸桿菌)自動(dòng)生成完整的代謝網(wǎng)絡(luò)圖,并可以進(jìn)一步搜索和分析這些網(wǎng)絡(luò)。PTools也可用于可視化基因組規(guī)模代謝網(wǎng)絡(luò),分析高通量代謝數(shù)據(jù)集,幫助研究人員更好地理解生物體內(nèi)代謝網(wǎng)絡(luò)。對代謝通路關(guān)鍵分子數(shù)據(jù)處理及分析工具總結(jié)見表3。
表3 關(guān)鍵分子定量分析中數(shù)據(jù)處理軟件及生物信息學(xué)工具匯總Table 3 Summary of data processing software and bioinformatics tools in the quantitative analysis of key molecules
近年來,高通量液相色譜、質(zhì)譜技術(shù)的發(fā)展為菌株篩選與關(guān)鍵分子定量分析提供有力支撐。在MCF高通量篩選方面,自動(dòng)化設(shè)備的出現(xiàn)加速了樣品制備速度?;诮馕婋x、ESI和AI等不同類型的質(zhì)譜技術(shù)為菌株高通量篩選提供多種選擇,可以兼容瓊脂平板培養(yǎng)、微孔板培養(yǎng)和液滴培養(yǎng)等不同模式下的菌株樣品。對于質(zhì)譜篩選產(chǎn)生的大型數(shù)據(jù)集可結(jié)合商業(yè)化軟件平臺(tái)進(jìn)行處理,或根據(jù)需求自行編寫程序以提高數(shù)據(jù)分析可靠性。在MCF代謝通路關(guān)鍵分子定量方面,自動(dòng)化移液工作站的應(yīng)用在提高分析通量的同時(shí)減少了人為誤差,其與自由溶液酶解或磁性富集材料表面酶解相結(jié)合實(shí)現(xiàn)了菌株蛋白質(zhì)的快速樣品預(yù)處理,與SPE或SPME相結(jié)合實(shí)現(xiàn)了菌株代謝物快速樣品預(yù)處理。在色譜分離方面,以毛細(xì)管流速、微升流速及分析流速色譜為代表的高通量色譜技術(shù)縮短了分離時(shí)間;不同類型的分離模式,如RPLC及HILIC,為檢測不同類型關(guān)鍵分子提供多種選擇。在質(zhì)譜檢測方面,以DIA為主的非靶向質(zhì)譜采集模式彌補(bǔ)了DDA隨機(jī)性大的缺陷,成為高通量關(guān)鍵分子鑒定的有效選擇;SRM/MRM靶向采集模式為已知關(guān)鍵分子定量提供有力工具。此外,DIA-NN、Tric等用于處理大型組學(xué)數(shù)據(jù)集的軟件及生物信息學(xué)工具也已相繼報(bào)道。
目前,基于質(zhì)譜技術(shù)的菌株高通量篩選方法仍處于起步階段,所采用的質(zhì)譜技術(shù)以解吸電離、ESI及AI為主。值得關(guān)注的是,AI質(zhì)譜通常耐鹽性較高,但對于某些MCF復(fù)雜的培養(yǎng)環(huán)境,如何對細(xì)胞外產(chǎn)物進(jìn)行快速樣品制備仍是需要解決的問題;而在分析細(xì)胞內(nèi)產(chǎn)物時(shí),針對菌株裂解、提取等環(huán)節(jié),開發(fā)出高通量、高重現(xiàn)性且自動(dòng)化的樣品制備方法對于基于質(zhì)譜的菌株高通量篩選顯得尤為重要。近年來,多個(gè)非色譜依賴的高通量質(zhì)譜篩選方法顯示出令人驚訝的潛力,但這些方法犧牲色譜分離以提高分析通量,可能導(dǎo)致離子抑制及低覆蓋率等問題。此外,當(dāng)菌株篩選通量足夠高時(shí),需要進(jìn)一步提高定量覆蓋度與準(zhǔn)確度。另一個(gè)挑戰(zhàn)是處理高通量篩選所產(chǎn)生大型數(shù)據(jù)集的通用分析平臺(tái)發(fā)展緩慢,研究工作多聚焦于開發(fā)定制的數(shù)據(jù)分析程序或支持商業(yè)平臺(tái)的自制腳本,公開通用或商業(yè)可用的數(shù)據(jù)分析工具研究較少。在MCF代謝通路關(guān)鍵分子定量分析方面,樣品制備流程步驟繁多,不易實(shí)現(xiàn)全流程自動(dòng)化。例如目前自動(dòng)化蛋白質(zhì)樣品制備流程通常不包含菌株裂解過程,而適用于細(xì)胞內(nèi)代謝物提取的通用方法也較少。發(fā)展具備集成化、自動(dòng)化和在線化特點(diǎn)的樣品制備方法可以進(jìn)一步提升分析通量,或?qū)⒊蔀槲磥硪粋€(gè)研究熱點(diǎn)。與納流液相色譜相比,高流速液相色譜在提升分析通量的同時(shí)也損失了靈敏度,如何保證快速分離過程中的檢測靈敏度與定量準(zhǔn)確度也是面臨的另一挑戰(zhàn)。此外,如何加快高通量組學(xué)分析平臺(tái)的數(shù)據(jù)處理速度,如何生成標(biāo)準(zhǔn)化的分析報(bào)告及大數(shù)據(jù)整合,便于公開訪問以更好闡釋內(nèi)在機(jī)制將是值得關(guān)注的問題。
菌株高通量篩選是加速M(fèi)CF進(jìn)化的關(guān)鍵環(huán)節(jié),代謝通路關(guān)鍵分子定量分析有助于細(xì)胞工廠的改造及生產(chǎn)監(jiān)測。隨著液相色譜和質(zhì)譜技術(shù)的不斷進(jìn)步,及其與自動(dòng)化裝置、數(shù)據(jù)處理平臺(tái)的深度融合,它們在合成生物學(xué)菌株高通量篩選及關(guān)鍵分子定量分析方面的優(yōu)勢會(huì)愈發(fā)凸顯,必將推動(dòng)基于合成生物學(xué)的生物智造領(lǐng)域的快速發(fā)展。