吳 瓊, 隋欣桐, 田瑞軍
(南方科技大學(xué)理學(xué)院化學(xué)系,廣東 深圳 518055)
蛋白質(zhì)組學(xué)是指大規(guī)模地對蛋白質(zhì)的表達水平、翻譯后修飾、蛋白質(zhì)相互作用等進行研究。蛋白質(zhì)組研究不僅可以全景式地揭示生命活動的分子本質(zhì),還能闡明生命在生理或病理條件下的變化機制[1]。近年來,色譜和質(zhì)譜技術(shù)的進步驅(qū)動了蛋白質(zhì)組學(xué)的快速增長,逐步實現(xiàn)了“深度覆蓋”,科學(xué)家們先后完成包括人類在內(nèi)的多個物種的蛋白質(zhì)組圖譜解析[2,3]。2020年,Mann等[4]系統(tǒng)性地繪制了100個跨物種的蛋白質(zhì)組圖譜,獲得了200萬條肽段和34萬個蛋白質(zhì)的鑒定信息,為整個進化范圍內(nèi)生物的功能組織研究提供重要依據(jù)。隨著生物醫(yī)學(xué)研究日益增長的大隊列蛋白質(zhì)組學(xué)分析需求,如何實現(xiàn)“高通量”的蛋白質(zhì)組學(xué)分析已成為當(dāng)前亟需解決的關(guān)鍵問題之一。常規(guī)的蛋白質(zhì)組學(xué)分析流程通常包括樣品前處理、色譜分離、質(zhì)譜檢測和數(shù)據(jù)分析。該文將從以上4個方面介紹近10年以來高通量蛋白質(zhì)組學(xué)分析技術(shù)取得的相關(guān)研究進展。
樣品前處理是整個蛋白質(zhì)組學(xué)分析流程的關(guān)鍵步驟,傳統(tǒng)樣品前處理流程依賴于多步的手工操作,不僅耗時且不可避免地存在人為誤差,成為限制蛋白質(zhì)組學(xué)發(fā)展的瓶頸之一。集成化的樣品前處理技術(shù)有利于提升蛋白質(zhì)組學(xué)分析的整體性能和靈敏度,如大連化物所張麗華課題組[5]結(jié)合在線蛋白質(zhì)酶解,同位素二甲基化標(biāo)記和多維肽段分離發(fā)展了蛋白質(zhì)組定量集成化平臺,具有靈敏度高、定量重現(xiàn)好等優(yōu)點。本課題組前期開發(fā)了一種基于離心力的集成化蛋白質(zhì)組學(xué)樣品前處理技術(shù)(simple and integrated spintip-based proteomics technology,SISPROT)[6],通過將強陽離子交換填料和C18膜填充在槍頭中以集成化方式完成樣品前處理和多肽分級的全過程,顯著提升了蛋白質(zhì)組學(xué)分析的整體性能和靈敏度,并得到進一步推廣[7-11]。高通量蛋白質(zhì)組學(xué)則對樣品前處理提出了更高要求,發(fā)展分析通量高、快速而穩(wěn)定的樣品前處理方法成為這一領(lǐng)域亟需解決的首要問題。2014年,Yu等[12]在超濾膜輔助的樣品前處理方法(filter-aided sample preparation,FASP)基礎(chǔ)上發(fā)展了96通道的FASP(96FASP),該方法借助于96孔濾膜板進行離心操作,從10 μg臨床尿液中可鑒定700~900個蛋白質(zhì)。Mann課題組[13]則發(fā)展了in-StageTip(iST)技術(shù),在內(nèi)置C18膜的封閉Tip頭內(nèi)可完成樣品前處理,并開發(fā)了PreOmics試劑盒(https://preomics. com/products)。通過進一步定制96通道的iST設(shè)備(96-well iST)并借助于多通道移液器可完成96個樣品前處理操作。然而,以上的樣本前處理方法雖然提高了分析通量,但仍然依賴于手工移液和轉(zhuǎn)移操作。
近十幾年來,自動化移液工作站相繼問世,如賽默飛的自動化磁珠提取系統(tǒng)King FisherTMFlex、安捷倫高精度的Bravo和精確流速控制的AssayMAPBravo、貝爾曼庫爾特的Biomek?NXP自動化工作站等,使樣品前處理逐漸實現(xiàn)自動化。自動化移液工作站借助于機械臂完成96甚至384通道的移液操作,解放手工操作,大大促進了高通量的樣品前處理技術(shù)發(fā)展。Mann等[14]將iST技術(shù)與Bravo自動化平臺聯(lián)用,2 h內(nèi)可完成96個血漿樣品的前處理。最近,他們還將這項前處理工作流程應(yīng)用于100個不同類別生物體的蛋白質(zhì)圖譜解析[4]。Krijgsveld等開發(fā)了基于磁珠的樣品前處理技術(shù)(single-pot solid-phase-enhanced sample preparation,SP3)[15,16],進一步將SP3技術(shù)與Bravo平臺相結(jié)合開發(fā)了autoSP3技術(shù),3.5 h可完成96個樣品的前處理,并具有優(yōu)異的穩(wěn)定性[17]。Leutert等[18]發(fā)展了快速,自動化的磷酸化蛋白質(zhì)組學(xué)分析流程(rapid-robotic phosphoproteomics,R2-P2),在King FisherTMFlex自動化工作站上整合了SP3技術(shù)和基于Fe-IMAC磁珠的磷酸化富集技術(shù),實現(xiàn)5 h的磷酸化蛋白質(zhì)組前處理。自動化移液工作站保證高通量分析的同時,還能極大縮短前處理時間,以及減少大隊列樣品處理造成的人為誤差。然而,以上的這些樣品前處理工作流程還未能實現(xiàn)“零人工”操作的全自動化。隨著高通量樣品前處理的不斷智能化,開發(fā)“零人工”操作的全自動化樣品前處理方法成為必然的發(fā)展趨勢。
色譜分離是液相色譜-質(zhì)譜聯(lián)用蛋白質(zhì)組學(xué)分析中的關(guān)鍵環(huán)節(jié)[19-21],但目前的液相色譜-質(zhì)譜聯(lián)用技術(shù)存在液相分離速度難以匹配質(zhì)譜采集速度、穩(wěn)定性不夠好等問題[22],限制了高通量蛋白質(zhì)組學(xué)的進一步發(fā)展。因此,在保證較為理想的蛋白質(zhì)組覆蓋度前提下,縮短液相色譜分離時間并提高分離穩(wěn)定性以滿足高通量數(shù)據(jù)采集的需求顯得尤為重要。傳統(tǒng)的“鳥槍法”蛋白質(zhì)組學(xué)研究一般選擇納升級液相來獲得更高的檢測靈敏度,與此同時卻犧牲了分析通量與液相色譜分離的穩(wěn)定性。近年來,微升流速液相色譜(micro-flow LC)或高流速液相色譜(high-flow LC)因其色譜穩(wěn)定性好、周轉(zhuǎn)時間短等優(yōu)點廣泛應(yīng)用在高通量蛋白質(zhì)組學(xué)。通過配合使用先進的高靈敏度質(zhì)譜儀,可以有效解決由于稀釋效應(yīng)導(dǎo)致的靈敏度下降問題。本課題組在前期開發(fā)的Photo-pTyr-scaffold[23]與基于96孔板的Photo-pTyr-scaffold正向蛋白陣列平臺[24]的基礎(chǔ)上,開發(fā)了高通量、快速的酪氨酸磷酸化(pTyr)信號復(fù)合物的蛋白質(zhì)組學(xué)分析工作流程[25]。利用150 mm×150 μm分離柱在分離流速800 nL/min和20 min有效色譜梯度條件下完成高通量蛋白質(zhì)組學(xué)分析;通過與Q Exactive HF-X質(zhì)譜儀聯(lián)用,在不增加樣品上樣量和不影響鑒定覆蓋度前提下,能夠快速、可重復(fù)地分析動態(tài)pTyr信號蛋白質(zhì)復(fù)合物[25]。Bruderer等[26]利用150 mm×300 μm分離柱(流速5 μL/min,梯度40 min)完成了1 508例血漿樣本的分析,并且超過2 000次的進樣沒有發(fā)現(xiàn)堵塞(背壓只增加14%),表明micro-flow LC具有良好的穩(wěn)定性。Bian等[27]利用商品化150 mm×1 mm的C18色譜分離柱,以50 μL/min微升級流速聯(lián)合Q Exactive HF-X質(zhì)譜儀進行分析。在2 000個蛋白質(zhì)組的分析中具有色譜保留時間(相對標(biāo)準(zhǔn)偏差<0.3%)和蛋白質(zhì)定量(相對標(biāo)準(zhǔn)偏差<7.5%)的優(yōu)異重現(xiàn)性,并在16 h內(nèi)完成9 000多種蛋白質(zhì)的深度覆蓋分析;當(dāng)分析超過7 500個樣品時,micro-flow LC-MS/MS的性能并沒有明顯下降。在COVID-19新冠病毒的臨床蛋白質(zhì)組學(xué)研究中,Messner等[28]將Agilent 1290 Infinity II與TripleTOF 6600聯(lián)用,利用5 min的有效色譜梯度分離(50 mm×2.1 mm分離柱,流速800 μL/min)可實現(xiàn)每天180個樣品的分離分析。以上研究結(jié)果表明,micro-flow LC和high-flow LC具有分析通量高、穩(wěn)定性好等優(yōu)點,在高通量蛋白質(zhì)組學(xué)分析中將具有廣闊的應(yīng)用前景。
另外一方面,蛋白質(zhì)組檢測效率受限于傳統(tǒng)液相色譜系統(tǒng)的設(shè)計和分離能力,難以突破真正意義上的高通量分析。為了克服這一不足,新的液相系統(tǒng)應(yīng)運而生。2018年,丹麥Evosep公司推出的新型液相系統(tǒng)-Evosep One同時具備創(chuàng)新型高低壓管路系統(tǒng)設(shè)計以及樣品洗脫和梯度預(yù)存儲技術(shù),可實現(xiàn)同步的快速上樣和色譜梯度分離,大幅度減少液相色譜分析時間。此外,Evotip技術(shù)通過減少色譜柱堵塞和殘留,提高了系統(tǒng)的穩(wěn)定性[29]。Mann等[30]利用Evosep One與timsTOF Pro質(zhì)譜儀聯(lián)用,實現(xiàn)每天200個樣本分析(5.6 min有效梯度),在16次重復(fù)中鑒定到1 231種蛋白質(zhì)(進樣量為50 ng)。因此,Evosep One能夠極大地提高樣本分析通量且具有優(yōu)異的穩(wěn)定性,從而助力蛋白質(zhì)組學(xué)分析真正跨入高通量時代。此外,Evosep one搭載Q Exactive HF-X/HF[31]、Orbitrap Fusion Lumos[32,33]、Orbitrap Exploris 480[34]等質(zhì)譜在不同大隊列蛋白質(zhì)組樣品中也得到了逐步推廣。
質(zhì)譜儀是蛋白質(zhì)組學(xué)的檢測利器,質(zhì)譜儀硬件和技術(shù)上的革新一直引領(lǐng)著蛋白質(zhì)組學(xué)技術(shù)的高速發(fā)展。為了應(yīng)對高通量蛋白質(zhì)組學(xué)挑戰(zhàn),開發(fā)掃描速度快,靈敏度高的質(zhì)譜儀是近年來質(zhì)譜硬件發(fā)展的趨勢。近年來,質(zhì)譜儀硬件方面的重大突破在于離子淌度功能(ion mobility)的引入,為蛋白質(zhì)組學(xué)分析增加了全新的分離維度,從而獲得更加全面的鑒定信息[35,36]。布魯克公司開發(fā)的timsTOF Pro質(zhì)譜采用了捕集型離子淌度(trapped ion mobility spectrometry,TIMS)和平行累積連續(xù)碎裂(parallel accumulation serial fragmentation,PASEF[30])采集技術(shù),將離子累積、母離子選擇和碎裂同步進行,從而實現(xiàn)了近100%的離子利用率、接近120 Hz二級譜掃描速度和超過20倍靈敏度的提高[30]。Mann等[29]通過將timsTOF Pro與Evosep One聯(lián)用,在11.5 min有效梯度下(每天100個樣本),從重癥感染患者的血漿中(上樣量為100 ng)定量到500個蛋白質(zhì),表明timsTOF Pro擁有極高的采集速度與靈敏度。另外,離子淌度的引入可以實現(xiàn)保留時間、質(zhì)荷比、離子強度和離子淌度的四維數(shù)據(jù)采集,使得蛋白質(zhì)組學(xué)進入了4D新時代?;贠rbitrap平臺的質(zhì)譜儀一直是蛋白質(zhì)組學(xué)分析的主流技術(shù)。自2011年推出Q Exactive系列,2013年推出Orbitrap Tribrid系列和2019年推出Orbitrap Exploris系列質(zhì)譜以來,其掃描速度、靈敏度和分辨率在不斷提高。例如,Q Exactive的掃描速度和分辨率只有12 Hz和14萬(@m/z200)[37]。而Exploris 480擁有40 Hz的掃描速度和48萬的超高分辨率(@m/z200),并搭載了新一代離子遷移分離裝置FAIMS(high-field asymmetric waveform ion mobility spectrometer)。此外,全新四極桿質(zhì)量分析器使儀器的抗污染能力大幅度提升,并提高了離子選取效率。Olsen等[34]對Exploris 480聯(lián)合FAIMS的性能進行了全面的評價,在每天200個樣品的分析通量下(5 min有效色譜梯度)能鑒定到1 261個蛋白質(zhì)。因此,Exploris 480在保證蛋白質(zhì)鑒定覆蓋度的同時具備卓越的穩(wěn)定性和耐用性。timsTOF Pro與Exploris 480等離子淌度質(zhì)譜所帶來的采集速度和靈敏度的大幅提升使得短色譜梯度分離下也能實現(xiàn)蛋白質(zhì)的深度覆蓋分析,為高通量蛋白質(zhì)鑒定提供強大的技術(shù)支撐。
在過去的10年間,質(zhì)譜采集技術(shù)的發(fā)展和革新也推動著蛋白質(zhì)組學(xué)研究邁向高通量。傳統(tǒng)的數(shù)據(jù)依賴型(data-dependent acquisition,DDA)采集模式因隨機性、數(shù)據(jù)重現(xiàn)性差等固有缺陷,限制了其在高通量蛋白質(zhì)組學(xué)中的應(yīng)用。作為當(dāng)前最熱門的質(zhì)譜技術(shù)之一,數(shù)據(jù)非依賴型(data-independent acquisition,DIA)的質(zhì)譜采集模式利用全掃描對每個窗口區(qū)域中的所有母離子進行碎裂檢測,以獲得所有碎片離子信息,具有通量高、重現(xiàn)性好、定量準(zhǔn)等優(yōu)點[38-40]。上述這些數(shù)據(jù)采集特征對于高通量蛋白質(zhì)組的定量分析具有顯著優(yōu)勢。近年來,利用DIA進行高通量定量蛋白質(zhì)組學(xué)分析的研究呈現(xiàn)快速增長。Ruedi等[41]利用DIA蛋白質(zhì)組學(xué)檢測手段研究了232例異卵雙生和同卵雙生個體的血漿樣本,闡述了血漿蛋白質(zhì)組在遺傳和非遺傳狀態(tài)下的變化情況。Mann等[42]對來自3個隊列的197例人群(非阿爾茲海默病組與阿爾茲海默病組)的腦脊液樣本進行DIA數(shù)據(jù)采集,發(fā)現(xiàn)40種蛋白質(zhì)特征分子可以有效預(yù)測阿爾茲海默癥。隨著4D蛋白質(zhì)組學(xué)(4D-Proteomics)的興起,timsTOF Pro上最新的DIA技術(shù)(DIA-PASEF)賦予其4D數(shù)據(jù)的采集和匹配能力,增加的離子淌度信息相比傳統(tǒng)DIA技術(shù)更有效降低了數(shù)據(jù)匹配的假陽性和缺失值,定量準(zhǔn)確度更高,更適合高通量的樣本采集。
隨著樣本制備、色譜分離和質(zhì)譜技術(shù)的共同進步,所要面臨的是如何對已獲得的海量蛋白質(zhì)組數(shù)據(jù)進行高效的數(shù)據(jù)分析。在計算機技術(shù)迅猛發(fā)展的今天,基于人工智能、深度神經(jīng)網(wǎng)絡(luò)、機器學(xué)習(xí)等大數(shù)據(jù)分析方法提高了蛋白質(zhì)組學(xué)數(shù)據(jù)的分析效率。
以DIA采集為例,共碎裂母離子的干擾導(dǎo)致譜圖極其復(fù)雜,在短色譜梯度分離的復(fù)雜樣品中干擾進一步放大。Ralser課題組[43]開發(fā)了利用深度神經(jīng)網(wǎng)絡(luò)分析(用于分辨真實信號與噪聲)以及新的量化和信號校正策略來處理DIA數(shù)據(jù)的軟件(DIA-NN),提高了傳統(tǒng)DIA蛋白質(zhì)組學(xué)的定性定量分析能力,在3 h內(nèi)可完成364個酵母樣本的高通量數(shù)據(jù)處理。經(jīng)典的DIA定量分析流程是預(yù)先進行DDA譜圖庫的構(gòu)建,再利用DDA譜圖庫從DIA數(shù)據(jù)中提取目標(biāo)肽段的信號進行定量分析。為了進一步推動DIA技術(shù)的實用化,復(fù)旦大學(xué)喬亮課題組[44]利用深度學(xué)習(xí)算法開發(fā)了從肽段或蛋白質(zhì)序列構(gòu)建譜圖庫的工具DeepDIA,實現(xiàn)了不依賴于DDA的DIA數(shù)據(jù)直接分析。Spectronaut是DIA數(shù)據(jù)檢索的主流軟件[45],隨著Spectronaut 14的發(fā)布,其包括的directDIA 2.0新算法可直接利用DIA數(shù)據(jù)構(gòu)建虛擬譜圖庫并進行數(shù)據(jù)庫檢索。其算法的定性和定量靈敏度接近DDA分級建庫的結(jié)果,可以省去耗時的DDA建庫過程。此外,Spectronaut 14還可以實現(xiàn)結(jié)果文件的自由組合,從而支持上萬個DIA樣品的檢索和合并分析,極大地縮短了高通量的DIA數(shù)據(jù)解析時間。另外,蛋白質(zhì)組學(xué)搜索引擎的更新,加快了數(shù)據(jù)分析的進程。軍事科學(xué)院徐平課題組[46]利用pFind的開放式搜索對3種不同酶切的大規(guī)模數(shù)據(jù)進行檢索分析,從人睪丸組織中鑒定到了124個潛在的缺失蛋白質(zhì)。另一方面,Cox團隊在今年更新的MaxQuant版本中開發(fā)了專為4D-Proteomics使用的4D-MBR算法,即增用CCS值(collision cross section,碰撞截面積)這一新維度進行數(shù)據(jù)對齊,可顯著減少缺失值并提高匹配的可信性[47]。他們利用208個血漿樣本進行分析,結(jié)果顯示4D-Proteomics技術(shù)可大大提高樣本LFQ(label free quantification)的數(shù)據(jù)完整性,且蛋白質(zhì)定量數(shù)目能提高90%。
高通量蛋白質(zhì)組學(xué)技術(shù)發(fā)展至今,從樣品自動化的高效制備、快速的蛋白質(zhì)組全景數(shù)據(jù)采集、到前沿的數(shù)據(jù)分析都取得了突飛猛進的進步?!叭詣踊瘶悠非疤幚怼薄拔⑸魉僖合嗌V分離”“高靈敏離子淌度質(zhì)譜分析”或?qū)⒊蔀楦咄康鞍踪|(zhì)組學(xué)未來幾年的研究熱點。面對復(fù)雜的大隊列臨床樣本,高通量蛋白質(zhì)組學(xué)仍面臨如下挑戰(zhàn):(1)如何實現(xiàn)高通量、全自動化的樣本前處理和液相色譜-質(zhì)譜聯(lián)用分析的無縫對接,從而完成樣品制備到數(shù)據(jù)采集的全流程自動化操作;(2)由于臨床樣本的寬動態(tài)范圍和高異質(zhì)性,短梯度下蛋白質(zhì)組深度覆蓋分析仍需要提高,以期發(fā)現(xiàn)更多低豐度的功能生物標(biāo)志物;(3)蛋白質(zhì)檢測靈敏度和定量準(zhǔn)確度需要進一步改善以顯著區(qū)分噪聲與低豐度蛋白質(zhì)。此外,利用離子淌度氣相色譜分離代替?zhèn)鹘y(tǒng)的液相色譜分離以實現(xiàn)超快速的復(fù)雜樣品分離可能成為該領(lǐng)域未來潛在的發(fā)展方向。總而言之,預(yù)期在不久的將來高通量蛋白質(zhì)組學(xué)技術(shù)將會逐步“落地轉(zhuǎn)化”,成為大隊列蛋白質(zhì)組學(xué)分析的利器。