2016年9月22日,位于深圳大鵬新區(qū),占地面積超過5萬平方米,總建筑面積11.6萬平方米的國家基因庫正式運營。國家基因庫的核心是基因保存,截至目前,國家基因庫的基因信息數(shù)據(jù)總量達(dá)60PB,生物樣本存儲能力達(dá)1000萬份,其可訪問數(shù)據(jù)量和數(shù)據(jù)存儲能力,以及可訪問樣本量和樣本存儲能力均居世界前列。
Tips:1PB到底有多大
以一部電影500MB計算,1PB=1024TB=10242GB=10243MB,相當(dāng)于200多萬部電影。假設(shè)一個人一天看一部電影,需要5000多年才能看完。
基因——控制生命活動的“密碼”
基因又稱遺傳因子,不同的基因包含著不同的遺傳信息,從而使生物具有不同的性狀。例如有的基因決定你是什么血型,有的基因決定你是藍(lán)眼睛還是黑眼睛。植物、動物、真菌以及細(xì)菌的細(xì)胞中都有很多基因,而人類的頭發(fā)、牙齒以及血樣、臍帶血、干細(xì)胞也包含著人的基因序列。
基因到底是如何控制生物體性狀的呢?基因是具有遺傳效應(yīng)的DNA片段。構(gòu)成DNA的四種脫氧核苷酸呈線性排列,它們各含有一種堿基,四種堿基各不相同,由此基因上堿基序列便含有特定的遺傳信息。遺傳信息的表達(dá)是這樣進(jìn)行的:DNA上的堿基序列轉(zhuǎn)錄形成信使RNA的堿基序列,信使RNA上相鄰的三個堿基對應(yīng)一個密碼子,編碼形成一個氨基酸,DNA的堿基序列由此便確定了構(gòu)成蛋白質(zhì)的氨基酸序列。正是通過這一信息傳遞過程,基因上抽象的遺傳信息被翻譯成特定的蛋白質(zhì)。蛋白質(zhì)是生命活動的體現(xiàn)者,基因正是通過控制蛋白質(zhì)的合成,從而控制生物體性狀的。
揭開國家基因庫的神秘面紗
國家基因庫是寶貴的生物資源平臺,它猶如人類博物館、植物園、動物園、微生物館的一個集合。這里不單搜集了生物的基因數(shù)據(jù),還包含植物、昆蟲、鳥類等生物樣本。農(nóng)耕時代的核心資源是耕地,工業(yè)時代是能源,而生命科學(xué)時代則是基因。國家基因庫儲存了來自全球的生物樣本、生物信息數(shù)據(jù),不僅能有效保護(hù)、開發(fā)和利用我國珍貴的遺傳資源,提高我國生命科學(xué)研究水平,還有利于促進(jìn)我國生命科學(xué)和生物產(chǎn)業(yè)的發(fā)展,維護(hù)國家生物信息安全。
21世紀(jì)是生命科學(xué)的時代,目前,美國、歐洲、日本都分別建立了大型基因數(shù)據(jù)庫,而中國國家基因庫則為我國生物技術(shù)產(chǎn)業(yè)的創(chuàng)新發(fā)展提供了一個強(qiáng)大的平臺。
別出心裁的選址和造型
國家基因庫位于深圳最后的“桃花源”——大鵬半島,面朝大海,三面環(huán)山。選址于這個相對封閉的環(huán)境中并不是決策者一時的心血來潮,而是有緣由的。國家基因庫中儲存的基因資源非常珍貴,為了確保這些生物信息的安全,因此選址相對封閉。此外,大鵬半島毗鄰深圳大鵬的液化天然氣碼頭,能夠便捷地利用液化天然氣生產(chǎn)過程中產(chǎn)生的大量冷能來冷卻樣品。國家基因庫的主體建筑依照選址地山體的自然坡度建設(shè),每一層都有山體結(jié)構(gòu)的支撐,穩(wěn)固性非常好。
除了獨特的選址,國家基因庫的造型也讓人眼前一亮。國家基因庫仿照美麗的云南哈尼梯田進(jìn)行外形設(shè)計,一層一層的建筑順著山勢蜿蜒而上,造型十分別致。走進(jìn)大廳,你會發(fā)現(xiàn),從大廳通往二樓的樓梯呈螺旋狀上升的狀態(tài),這正是仿照DNA的雙螺旋結(jié)構(gòu)設(shè)計的,整體造型宛如一個特大號的DNA片段,契合基因庫儲存基因的功用。
功能全面的三庫兩平臺
不單擁有別出心裁的選址和造型,國家基因庫的結(jié)構(gòu)功能也十分完善,它由“三庫兩平臺”組成?!叭龓臁笔巧镔Y源樣本庫、生物信息數(shù)據(jù)中心和生物活體庫,“兩平臺”為數(shù)字化平臺和合成與編輯平臺。
生物資源樣本庫
—存儲和管理本國特有的遺傳資源
生物資源樣本庫用于保存動植物、微生物和人類組織細(xì)胞等樣本,存儲和管理本國特有的遺傳資源,確保我國生物資源,尤其是我國的特有物種、瀕危物種、具有重要經(jīng)濟(jì)價值和科學(xué)研究價值的物種以及生態(tài)系統(tǒng)物種種群的安全性,從而有效保護(hù)我國生物資源的多樣性。
生物信息數(shù)據(jù)中心
—建成生物大數(shù)據(jù)時代的搜索引擎
生物信息數(shù)據(jù)中心匯集著基因、蛋白質(zhì)、分子、影像等多種生物信息。目前,國家基因庫與國家超級計算機(jī)中心合作建立了大型數(shù)據(jù)庫,統(tǒng)一檢索系統(tǒng)已經(jīng)囊括了國際千種植物轉(zhuǎn)錄組項目、萬種動物線粒體基因組項目、千種昆蟲轉(zhuǎn)錄組進(jìn)化項目、國際萬種鳥類項目、國際癌癥基因組聯(lián)盟等非人方向和人方向項目,整合了7000個以上的物種/品種、27個人種、幾萬個樣本、百萬個基因、千萬條突變信息,總可檢索條目數(shù)超過一個億。
生物活體庫
—打造中國的“諾亞方舟”
生物活體庫猶如中國的“諾亞方舟”,保護(hù)和保存著世界上約30萬種植物、百萬種動物、近千萬種微生物的活體資源。隨著人口的快速增長,野生生物的棲息地急劇減少,很多物種瀕臨滅絕。一個物種的滅絕意味著這個物種所帶的特有基因從此消失。如果當(dāng)年野生稻的雄性不育株稀少甚至滅絕了,雄性不育基因隨之消失,雜交水稻之父袁隆平就不可能選育出畝產(chǎn)超1000千克的雜交稻。建立了基因庫,我們不僅可以保護(hù)瀕危生物,還可以長期保存瀕危滅絕生物的活體標(biāo)本和遺傳信息數(shù)據(jù),使滅絕生物將來有可能重現(xiàn)世間,為子孫后代留下寶貴的遺產(chǎn)。
數(shù)字化平臺
—讀取樣本的遺傳信息數(shù)據(jù)
數(shù)字化平臺是進(jìn)行基因測序的平臺,簡稱讀平臺,用于“讀取”基因的核苷酸序列,并把遺傳信息的數(shù)據(jù)保存下來,從而獲取樣本的遺傳信息數(shù)據(jù)?;驕y序是進(jìn)一步研究和改造目的基因的基礎(chǔ),因此具有重要的意義。20世紀(jì)末開始實施的人類基因組計劃,歷時數(shù)十年,耗資數(shù)十億美元,對人類DNA進(jìn)行測序。而2007年,第一個完整的人類基因組序列圖譜誕生,只花費了150萬美元,耗時僅3個月。隨著基因測序技術(shù)的發(fā)展,也許在不久的將來,人們僅僅需要上千元就能測定自己的基因信息,進(jìn)而掌握自己的健康狀況。
合成與編輯平臺又稱寫平臺,可以根據(jù)生物的遺傳信息合成基因,或?qū)σ延械倪z傳信息進(jìn)行有目的的編輯和修改,以合成人類需要的基因,使生物具有新的性狀,甚至創(chuàng)造新的生命。
目前,國家基因庫已與國際生物和環(huán)境樣本庫協(xié)會、挪威世界末日種子庫、中國科學(xué)院海洋研究所等國內(nèi)外一百多家科研機(jī)構(gòu)、行業(yè)組織開展合作。隨著國家基因庫存儲容量的增加,中國的這座承載著人類及其他生物遺傳密碼的“生命銀行”也將為人類健康及科學(xué)研究提供更多的生物數(shù)據(jù)。未來,國家基因庫還將成為一個面向大眾的科普教育平臺,為更多的人提供與科學(xué)對話的機(jī)會!
Tips:全球四大國家級基因庫
國家級基因庫是儲存本國特有的遺傳資源、生物信息和基因數(shù)據(jù)的樣本庫。在中國國家基因庫建立之前,世界上最權(quán)威、最廣泛的基因庫主要有歐洲生物信息學(xué)研究所(EBI)的EMBL數(shù)據(jù)庫、美國國家生物技術(shù)信息中心(NCBI)的GenBank數(shù)據(jù)庫和日本國立遺傳學(xué)研究所(NIG)的DDBJ數(shù)據(jù)庫。隨著互聯(lián)網(wǎng)的發(fā)展,三大數(shù)據(jù)庫所儲存的遺傳信息能夠互相交換,以保證數(shù)據(jù)的全面性。
在中國國家基因庫正式運營后,它也將與國際上現(xiàn)有的三大基因庫開展數(shù)據(jù)交換與共享,推動我國的國家基因庫向國際基因庫轉(zhuǎn)變。中國國家基因庫不僅注重數(shù)據(jù)的存儲,同時也嘗試在基因密碼破譯、精準(zhǔn)醫(yī)療和精準(zhǔn)農(nóng)業(yè)等生物科學(xué)領(lǐng)域?qū)?shù)據(jù)進(jìn)行研發(fā)利用。