■文/郭天南
郭天南,西湖大學(xué)生命科學(xué)學(xué)院特聘研究員。
在生命體內(nèi),各個蛋白質(zhì)就像機(jī)械鐘表的齒輪般協(xié)同合作、互相調(diào)控,從而實現(xiàn)一系列精密且復(fù)雜的生命活動。因此,檢測生物體中蛋白質(zhì)的種類和含量,對探究生命活動的奧秘有著不可替代的重要意義。在科研人員的不斷探索下,一個新興的學(xué)科——蛋白質(zhì)組學(xué)(proteomics)在1997年誕生了。蛋白質(zhì)組學(xué)的誕生和發(fā)展,離不開多學(xué)科和技術(shù)的逐漸交叉融合。這些學(xué)科技術(shù)包括(但不限于)基因組學(xué)、生物化學(xué)、分析化學(xué)、自動化、基于電磁場的精密質(zhì)譜儀、信號處理、數(shù)理統(tǒng)計和計算機(jī)科學(xué)。近年來,分子醫(yī)學(xué)、大數(shù)據(jù)技術(shù)和人工智能的發(fā)展,進(jìn)一步加速推動了蛋白質(zhì)組學(xué)的成長,使之在精準(zhǔn)醫(yī)療領(lǐng)域展示出越來越大的應(yīng)用潛力。
1994年,當(dāng)27歲的博士研究生馬克·威爾金斯(Marc Wilkins)在地廣人稀的澳大利亞嘗試把蛋白質(zhì)(protein)和基因組(genome)拼成一個新的英語單詞蛋白質(zhì)組(proteome),用以描述基因組編碼的所有蛋白質(zhì),并將這一單詞放在他的博士畢業(yè)論文中時,他不會想到,3年后,瑞士蘇黎世聯(lián)邦理工大學(xué)的皮特·詹姆斯(Peter James)在他發(fā)表于劍橋大學(xué)《生物物理學(xué)》季刊的一篇53頁的長文中借用了這個概念,并首次提出蛋白質(zhì)組學(xué)(proteomics)一詞,系統(tǒng)總結(jié)了當(dāng)時已發(fā)表的對生物體內(nèi)所有蛋白質(zhì)種類的研究以及該類研究的進(jìn)展。蛋白質(zhì)組學(xué)不是憑空誕生的一個新學(xué)科,而是基于一系列蛋白質(zhì)的生物化學(xué)研究和多肽質(zhì)譜的研究衍生發(fā)展而來的,所有這些相關(guān)學(xué)科的研究都被串起來,成為這一新學(xué)科的基石。
威爾金斯更不會想到蛋白質(zhì)組學(xué)會受到如此廣泛的關(guān)注。1997年,人類基因組計劃進(jìn)行得如火如荼,2001年,《科學(xué)》(Science)雜志和《自然》(Nature)雜志分別出版??瑘蟮懒巳祟惢蚪M計劃草圖的完成,興奮地宣告解讀了人類生命的編碼。生命科學(xué)的中心法則清楚地表明,基因只是遺傳編碼,在生命活動中真正發(fā)揮作用的主要是蛋白質(zhì)。因此,在《科學(xué)》雜志報道人類基因組計劃完成的專刊上,華盛頓大學(xué)的斯坦利·菲爾茨(Stanley Fields)預(yù)言蛋白質(zhì)組學(xué)將很快取代基因組學(xué)成為生命科學(xué)研究的焦點;《自然》雜志的專刊則在顯著版面報道了人類蛋白質(zhì)組學(xué)組織(HUPO)的成立,并宣告生命科學(xué)正式進(jìn)入蛋白質(zhì)組學(xué)時代。因為人類基因組計劃的巨大成功,蛋白質(zhì)組學(xué)在誕生之初,光環(huán)熠熠,世界各國對蛋白質(zhì)組學(xué)予以大量投入,工業(yè)界也熱情洋溢,不可謂不華麗。
現(xiàn)在,回顧蛋白質(zhì)組學(xué)的華麗誕生,我們感情復(fù)雜。一方面,基因組學(xué)的巨大成功讓全世界認(rèn)識到蛋白質(zhì)組學(xué)毋庸置疑的重要性;另一方面,蛋白質(zhì)組學(xué)直到今天也還沒有完全擺脫基因組學(xué)的巨大成功映射出的陰影帶來的困擾。例如,在相當(dāng)長一段時間內(nèi)(直到今天仍然存在),蛋白質(zhì)組學(xué)的別名是“功能基因組學(xué)”,因而其常常被列為基因組學(xué)的一部分而存在。
人類基因組計劃是將基因按照染色體的分布承包給各個研究團(tuán)隊,協(xié)同開發(fā)技術(shù),分別測序,然后拼裝成全基因組。這個化整為零、逐個擊破的簡單思路取得的成功,是迄今為止全世界不同國家的科學(xué)家互相協(xié)作、進(jìn)行超大項目研究的成功典范。早期參與人類蛋白質(zhì)組計劃的研究人員蕭規(guī)曹隨,選擇了同樣的思路,將蛋白質(zhì)組按照染色體分組,然后分配給世界各國的參與團(tuán)隊。后來的數(shù)據(jù)表明,這個復(fù)制和迎合基因組學(xué)的思路在蛋白質(zhì)組學(xué)領(lǐng)域并未獲得同行的一致認(rèn)可,也沒有取得其他生命科學(xué)領(lǐng)域的認(rèn)可?;谌旧w的蛋白質(zhì)組研究確實取得了不少成果,但與巨大的資金和熱情投入而急速鼓吹起來的期望值相比,這些成果微小得幾乎不能被人們看到。這一段至今尚未完全結(jié)束的歷程,極大地消費了人們對蛋白質(zhì)組學(xué)的期望和熱情。
蛋白質(zhì)組學(xué)的華麗誕生在其第一個10年感受到了全球各界的熱情,出現(xiàn)了一段時間繁榮的景象:學(xué)術(shù)界和工業(yè)界的大量投入,專業(yè)雜志接二連三地涌現(xiàn),影響因子逐年升高。今天,當(dāng)我們擁有了高精度質(zhì)譜儀和比較完善的算法后,回顧歷史,我們不得不汗顏地承認(rèn):當(dāng)時很多蛋白質(zhì)組學(xué)研究所產(chǎn)生的數(shù)據(jù)信息量是非常低的,有些甚至是經(jīng)不起時間考驗的。
2014年,《自然》雜志倉促地發(fā)表了兩篇號稱是完成了人類蛋白質(zhì)組草圖的論文,認(rèn)為其代表了當(dāng)時蛋白質(zhì)組學(xué)的最好研究。這兩項研究在若干種不同人緣樣本中對超過17000個蛋白質(zhì)進(jìn)行了鑒定,給觀望蛋白質(zhì)組學(xué)的大眾打了兩針興奮劑。但是后來,蛋白質(zhì)組研究領(lǐng)域的多位同行對這兩篇論文中所使用的數(shù)據(jù)分析方法提出了質(zhì)疑,并證明其中有些數(shù)據(jù)是錯誤的,從而引發(fā)了大量的后續(xù)討論。事實上,僅僅在多種樣本中鑒定到這些蛋白質(zhì)的表達(dá),而不對它們進(jìn)行精確的定量,并不會產(chǎn)生太大的生物學(xué)價值。換言之,僅僅讓大家看到蛋白質(zhì)組學(xué)在經(jīng)過17年的努力后終于在蛋白質(zhì)鑒定水平達(dá)到了基因組測序覆蓋率的70%(暫不考慮多肽水平的覆蓋率),勉強(qiáng)及格,只是進(jìn)一步加深了大家對“蛋白質(zhì)組學(xué)從屬于基因組學(xué)”這一誤區(qū)的認(rèn)同而已。
鑒于蛋白質(zhì)的復(fù)雜性和多變性,完全意義上的蛋白質(zhì)組學(xué)至今仍是一個科學(xué)目標(biāo)或者科學(xué)理想,因為至今無人知道一個生物體內(nèi)到底有多少蛋白質(zhì)。比蛋白質(zhì)組學(xué)本身更加繁榮的,并令所有人毫無爭議的、振奮的乃是色譜-質(zhì)譜方法學(xué)的巨大進(jìn)展。色譜-質(zhì)譜技術(shù)在過去的20年高速發(fā)展,越來越多的生物醫(yī)學(xué)科學(xué)家的研究受益于色譜-質(zhì)譜技術(shù)的發(fā)展,比如未知蛋白質(zhì)的鑒定、蛋白質(zhì)相互作用的鑒定、翻譯后修飾的鑒定、蛋白質(zhì)結(jié)構(gòu)的解析、靶向蛋白質(zhì)定量、蛋白質(zhì)降解的研究等。有些方法比如靶向蛋白質(zhì)組學(xué),正在走向臨床試驗。但是嚴(yán)格意義上講,這些都不是蛋白質(zhì)組學(xué)的主要內(nèi)涵。令人尷尬的是,雖然色譜-質(zhì)譜技術(shù)取得了長足的進(jìn)步,但蛋白質(zhì)組學(xué)這一學(xué)科卻逐漸淡出主流研究的視野。
蛋白質(zhì)組學(xué)不是沒有獲得過大眾認(rèn)可的成功。比如,基于同位素標(biāo)記的定量蛋白質(zhì)組學(xué)可以對2~4個樣本的蛋白質(zhì)組進(jìn)行準(zhǔn)確定量,在進(jìn)行良好的實驗設(shè)計和實施后,8 000個以上的蛋白質(zhì)(基因產(chǎn)物)可以被鑒定到,并且含有準(zhǔn)確的定量信息,進(jìn)而引導(dǎo)新的生物學(xué)發(fā)現(xiàn)。雖然這些成功往往只出現(xiàn)在一部分擁有高超實驗技巧的蛋白質(zhì)組學(xué)實驗室,但這已經(jīng)可以讓大眾慢慢意識到蛋白質(zhì)組學(xué)在生物研究中實實在在的強(qiáng)大力量,從而獲得了一部分支持。實際上,跟蛋白質(zhì)組學(xué)博大的內(nèi)涵相比,這些成功只能算是牛刀小試。
人類的幾乎所有生命活動都是由人體內(nèi)的蛋白質(zhì)執(zhí)行的。人類的健康和疾病同蛋白質(zhì)息息相關(guān),而疾病治療的效果也取決于蛋白質(zhì)機(jī)器的調(diào)控。所有熟悉生物學(xué)中心法則的大眾應(yīng)該沒有人會質(zhì)疑蛋白質(zhì)在精準(zhǔn)醫(yī)療中不可替代的作用。蛋白質(zhì)組學(xué)作為研究所有蛋白質(zhì)的科學(xué),毫無疑問將在精準(zhǔn)醫(yī)療領(lǐng)域發(fā)揮最關(guān)鍵的作用。然而,直到最近,這些作用還只能被稱為“潛力”。蛋白質(zhì)組學(xué)發(fā)展到今天,才剛剛走過21個年頭。被撇在基因組巨大的身形背后,21歲的蛋白質(zhì)組學(xué)常常有意無意被人遺忘,或者被認(rèn)為是可有可無的“跟班”或“錦上之花”。生物學(xué)的中心法則在基因組的燦爛光環(huán)下黯然失色?;蚪M學(xué)在種類眾多但數(shù)量有限的遺傳性單基因疾病和產(chǎn)前診斷中展示了毫無爭議的作用后,一般被大眾誤解為精準(zhǔn)醫(yī)療的主要甚至是唯一的方式。筆者認(rèn)為,對基因組學(xué)與其實際生物學(xué)功能不相稱的期望,為今后基因組學(xué)在數(shù)量更多的人類復(fù)雜疾病(比如絕大部分腫瘤、代謝性疾病、心腦系統(tǒng)疾病等)中的臨床應(yīng)用的跌宕,埋下了伏筆。近年來,越來越多的科學(xué)家開始重新思考蛋白質(zhì)組學(xué)在精準(zhǔn)醫(yī)療中的應(yīng)用,并且一系列切實的蛋白質(zhì)組項目正在開展。
雖然年輕的蛋白質(zhì)組學(xué)已經(jīng)經(jīng)歷了一系列盛衰榮辱,但其成長在跌宕起伏中一刻也未停止過,尤其是近5年來,已在各個技術(shù)環(huán)節(jié)取得了突破性的進(jìn)展?,F(xiàn)在,我們已經(jīng)有新技術(shù)可以對極小量的臨床樣本進(jìn)行高通量的、快速、準(zhǔn)確的蛋白質(zhì)組學(xué)水平的定量,并且在越來越多的臨床應(yīng)用中展示出獨特的、有效的作用,主流生命科學(xué)界和醫(yī)學(xué)界的關(guān)注與日俱增,其他領(lǐng)域比如醫(yī)療大數(shù)據(jù)和人工智能的研究人員也展示出了極大的興趣。我們關(guān)注到越來越多的蛋白質(zhì)組學(xué)家勇敢地走出基因組學(xué)的陰影,根據(jù)蛋白質(zhì)獨特的生物化學(xué)特征和生物學(xué)功能,從蛋白質(zhì)組學(xué)獨特的視角出發(fā),重新審視生物學(xué)現(xiàn)象和臨床問題,開發(fā)出切實可行的技術(shù),解決了基因組學(xué)因自身固有局限而無能為力的臨床應(yīng)用問題。我們可以樂觀地預(yù)測,蛋白質(zhì)組學(xué)在精準(zhǔn)醫(yī)療中廣泛應(yīng)用的黃金時代正在來臨。