文/本刊記者 羅朝淑
“我是誰(shuí)?我從哪里來(lái)?要到哪里去?”面對(duì)這個(gè)終極哲學(xué)難題,人們或許能從科學(xué)家的發(fā)現(xiàn)中找到遺傳規(guī)律與基因信息層面的解答。
4月1日,美國(guó)科學(xué)家領(lǐng)銜的國(guó)際合作團(tuán)隊(duì)在《科學(xué)》雜志發(fā)表6篇論文,宣告有史以來(lái)最完整的一個(gè)人類單倍體基因組圖譜繪制完成。
“假如把人類基因組比作一輛結(jié)構(gòu)復(fù)雜的汽車,那么,20多年前完成的人類基因組草圖就已經(jīng)具備了汽車的基本配件和功能,新發(fā)現(xiàn)的序列只是讓這輛汽車的配備更完善,功能更強(qiáng)大。沒(méi)有它,汽車也能跑;有了它,汽車的性能更好,也更完美了?!敝袊?guó)科學(xué)院北京基因組研究所研究員于軍接受科普時(shí)報(bào)記者專訪時(shí)表示,人類第一次完成每個(gè)核苷酸水平堪稱完整的人類基因組測(cè)序,為了解人類基因組的全部基因和組織元件提供了完整的參照,為科學(xué)、全面、徹底認(rèn)知人類的個(gè)體和群體演變的遺傳學(xué)本質(zhì)和規(guī)律鋪平了道路。
作為“人類基因組計(jì)劃”的親歷者和參與者,于軍表示,人類基因組圖譜的完整呈現(xiàn),離不開該計(jì)劃的支持。“在過(guò)去的20多年里,科學(xué)家們一直在努力追求完美,幾乎每年都在更新‘人類基因組參照序列’?!?/p>
“人類基因組計(jì)劃”是繼“曼哈頓計(jì)劃”和“阿波羅登月計(jì)劃”之后,又一項(xiàng)規(guī)模宏大、跨越國(guó)界及學(xué)科的科學(xué)探索工程。其宗旨在于測(cè)定組成人類單倍染色體DNA中所包含的30億個(gè)由A、T、C、G堿基組成的核苷酸序列,從而繪制人類基因組圖譜,并且辨識(shí)其載有的基因及其序列,達(dá)到破譯人類遺傳信息的最終目的。
1990年,“人類基因組計(jì)劃”正式啟動(dòng);1999年,我國(guó)科學(xué)家參與到“人類基因組計(jì)劃”,并承擔(dān)了1%的測(cè)序任務(wù)。促成我國(guó)科學(xué)家參與到該計(jì)劃的人正是于軍。
為了完成“人類基因組計(jì)劃”的任務(wù),科學(xué)家首先需要將人類23對(duì)完整DNA切割成數(shù)百萬(wàn)甚至數(shù)千萬(wàn)個(gè)核苷酸序列碎片,并對(duì)碎片進(jìn)行單獨(dú)測(cè)序,之后再根據(jù)碎片之間的重疊部分重新拼接,形成逐漸完整的“重疊群”。但大量重復(fù)序列的存在令拼接和解讀變得困難重重,導(dǎo)致少部分間隙區(qū)域被遺漏;核酸序列重復(fù)度高的地方也很難確定唯一的路徑,有可能造成誤拼,從而留下了8%的“不完整部分”。
2001年,科學(xué)家首次發(fā)表人類基因組草圖,宣布破譯人類的“生命天書”。不過(guò),由于彼時(shí)所測(cè)的序列中仍有8%的“不完整部分”,因此這部“天書”尚有遺漏之處。這些遺漏的部分主要存在于染色體結(jié)構(gòu)中間部分的中心粒和末端部分的著絲粒。由于這些地方含有高度重復(fù)的DNA序列,成了科學(xué)家當(dāng)時(shí)難以完成的“瓷器活”。
隨著測(cè)序技術(shù)的發(fā)展,第三代DNA測(cè)序“長(zhǎng)讀長(zhǎng)”技術(shù)的出現(xiàn),成為科學(xué)家修補(bǔ)和完成人類基因組序列這個(gè)“瓷器活”的好幫手,讓這8%的遺憾,得以成功彌補(bǔ)。
于軍介紹,第三代測(cè)序技術(shù)的出現(xiàn),將一代和二代測(cè)序技術(shù)測(cè)量的核苷酸長(zhǎng)度(讀長(zhǎng))從百位和千位數(shù)一下提升到了萬(wàn)位數(shù),甚至達(dá)到了十萬(wàn)、百萬(wàn)個(gè)核苷酸序列數(shù)的級(jí)別,大大突破了重復(fù)序列所帶來(lái)的技術(shù)瓶頸。
此次完成首個(gè)最完整人類單倍體基因組圖譜的機(jī)構(gòu)——端粒到端粒聯(lián)盟(以下簡(jiǎn)稱T2T聯(lián)盟)就是采用了二代和三代測(cè)序技術(shù)的“協(xié)同作戰(zhàn)”。三代測(cè)序技術(shù)屬于單分子技術(shù),其中測(cè)定序列長(zhǎng)度最高的是牛津納米孔的DNA測(cè)序方法,它的最長(zhǎng)讀長(zhǎng)可以達(dá)到100萬(wàn)個(gè)核苷酸。
另一家是太平洋生物科學(xué)公司,使用的是二代測(cè)序技術(shù),其測(cè)序儀的測(cè)序長(zhǎng)度也達(dá)到了數(shù)萬(wàn)水平。這兩種測(cè)序方法的優(yōu)勢(shì)在于不僅可以提供連續(xù)性測(cè)序,而且還能提供更完美的數(shù)據(jù)精準(zhǔn)度。二者的結(jié)合,讓完整的人類基因組序列第一次實(shí)現(xiàn)了完美地呈現(xiàn)。
“這種技術(shù)的進(jìn)步是劃時(shí)代的,就像從蒸汽機(jī)發(fā)展到內(nèi)燃機(jī)再到信息化、智能化地大踏步前進(jìn)?!庇谲娬f(shuō),這是獲得人類基因組完整序列的技術(shù)“后盾”。
近年來(lái)“長(zhǎng)讀長(zhǎng)”測(cè)序技術(shù)的發(fā)展,極大地加速了解碼生命的進(jìn)程,不僅測(cè)序時(shí)間大為縮短,測(cè)序成本也呈數(shù)量級(jí)降低。
于軍介紹,我國(guó)近20年來(lái)基本上依賴國(guó)外的基因測(cè)序設(shè)備,但從2015年開始擁有了第一款真正的國(guó)產(chǎn)基因測(cè)序儀,目前我國(guó)自主研發(fā)的二代和三代測(cè)序儀也在不斷地進(jìn)入市場(chǎng)。在應(yīng)用方面,我國(guó)也已經(jīng)做到了與全球領(lǐng)先企業(yè)并駕齊驅(qū)。
于軍認(rèn)為,完成某一個(gè)人類個(gè)體的基因組并不是“人類基因組計(jì)劃”的最終目標(biāo)和結(jié)果。目前,T2T聯(lián)盟已與人類泛基因組參考聯(lián)盟合作,計(jì)劃對(duì)幾百個(gè)個(gè)體進(jìn)行T2T的全基因組測(cè)序,以建立來(lái)自世界各地,代表不同人群的數(shù)百乃至上千個(gè)完整的群體參照基因組,建立盡可能完整的代表人類群體多樣性的系列參照基因組。
于軍表示,遺傳保證了生命的延續(xù),而突變產(chǎn)生了不同的物種以及人與人之間的差異。不同族群有著各自獨(dú)特的遺傳背景,對(duì)不同疾病的易感性也可能不一樣。只有真正了解基因與疾病的關(guān)系,才能根據(jù)每個(gè)個(gè)體的基因進(jìn)行疾病預(yù)測(cè)和檢測(cè),及早做出預(yù)防方案或進(jìn)行針對(duì)性治療。
“中國(guó)人的基因組與現(xiàn)有的完整白人基因組序列仍然存在較大差異,希望我國(guó)盡快運(yùn)用和發(fā)展三代、四代測(cè)序技術(shù),早日測(cè)出完整的‘中華民族代表基因組序列’?!庇谲娬f(shuō),“國(guó)人的基因組系列完成后,科學(xué)家們可以通過(guò)比對(duì)分析個(gè)體DNA的堿基序列差異,開展更深入的基因組學(xué)和遺傳學(xué)研究,為預(yù)防疾病、研制新藥以及精準(zhǔn)醫(yī)療提供個(gè)性化、智能化的數(shù)據(jù)?!?/p>