伍克煜,劉峰江,許 浩,張浩天,王貝貝,2*
(1.電子科技大學(xué) 生命科學(xué)與技術(shù)學(xué)院,成都 611731;2. 電子科技大學(xué) 信息生物學(xué)研究中心,成都 611731)
合成生物學(xué)最初在1980年提出來(lái)的,用來(lái)表述基因重組技術(shù),之后2000年在美國(guó)化學(xué)年會(huì)上重新提出來(lái),涉及生物、化學(xué)、物理、工程,計(jì)算機(jī)和信息技術(shù)多個(gè)領(lǐng)域。隨著計(jì)算機(jī)、生物信息,基因合成與基因測(cè)序等技術(shù)的快速發(fā)展,合成生物學(xué)結(jié)合各領(lǐng)域成果得到了突飛猛進(jìn)地發(fā)展[1-3, 6-7]。全基因乃至染色體人工合成等原來(lái)只能停留人腦中的想法一個(gè)一個(gè)被實(shí)現(xiàn)[4-5, 8-10]。目前合成生物學(xué)已成為科學(xué)界大力研究發(fā)展的學(xué)科,被廣泛應(yīng)用于各個(gè)領(lǐng)域,比如癌癥治療、環(huán)境治理等,其思路也被廣泛借鑒與應(yīng)用在各種完全不同的領(lǐng)域中(例如系統(tǒng)科學(xué)與自動(dòng)通訊技術(shù)),有望成為21世紀(jì)引領(lǐng)生命科學(xué)領(lǐng)域乃至整個(gè)科學(xué)領(lǐng)域的重要學(xué)科[11-12]。
合成生物學(xué)的實(shí)驗(yàn)流程包含設(shè)計(jì)、構(gòu)建和測(cè)試三個(gè)步驟。目前,基因回路的設(shè)計(jì)還是主要以手動(dòng)設(shè)計(jì)為主,但隨著合成生物學(xué)的發(fā)展,其應(yīng)用范圍也飛速的拓展,對(duì)基因回路的需求規(guī)模不斷地?cái)U(kuò)大,這種“訂制”式的設(shè)計(jì)方式不再能滿(mǎn)足合成生物學(xué)研究人員的需求,亟需一款類(lèi)似于機(jī)械工程師或電工程師使用的自動(dòng)計(jì)算機(jī)輔助設(shè)計(jì)系統(tǒng)(CAD或者EAD)的基因線(xiàn)路設(shè)計(jì)軟件工具。但是機(jī)械或者電子的研究對(duì)象為非生命體,嚴(yán)格按照力學(xué)和電學(xué)原理,而生命體的復(fù)雜性遠(yuǎn)遠(yuǎn)高于非生命體,目前對(duì)于生命體的認(rèn)識(shí)還遠(yuǎn)遠(yuǎn)不如非生命體那么清晰。比如基因回路的設(shè)計(jì)到底應(yīng)該遵循什么原理?可以用那些合適的數(shù)學(xué)形式描述生物呢?這些問(wèn)題使得自動(dòng)計(jì)算機(jī)輔助基因設(shè)計(jì)系統(tǒng)發(fā)展緩慢[13]。
基因回路的設(shè)計(jì)目前常用的線(xiàn)路設(shè)計(jì)工具有:Cello[14]、j5[15],GenoCAD[16]和iBioSim[17]等。Cello是一個(gè)基于Verilog語(yǔ)言的基因線(xiàn)路設(shè)計(jì)環(huán)境,根據(jù)用戶(hù)指定的功能提供所需的核酸序列,并預(yù)測(cè)性能的好壞,目前主要用于大腸桿菌。其他幾種工具:j5、GenoCAD和iBioSim,都需要用戶(hù)提供回路相關(guān)信息,也不能預(yù)測(cè)其性能。可見(jiàn)目前的基因回路設(shè)計(jì)工具的功能還非常有限,遠(yuǎn)遠(yuǎn)不及CAD或者EAD。其主要原因之一就是目前的標(biāo)準(zhǔn)生物部件(Biobricks)還非常有限。在這種背景下,iGEM誕生了。
國(guó)際遺傳工程機(jī)器競(jìng)賽(International Genetically Engineered Machine Competition,iGEM)由麻省理工學(xué)院于2003年創(chuàng)辦,2005年發(fā)展成為國(guó)際性學(xué)術(shù)競(jìng)賽,是合成生物學(xué)領(lǐng)域的最高國(guó)際性學(xué)術(shù)競(jìng)賽。iGEM的目的,就是希望通過(guò)學(xué)術(shù)競(jìng)賽的模式,實(shí)現(xiàn)生物學(xué)的系統(tǒng)化、工程化,促進(jìn)生物工具的開(kāi)源化、透明化發(fā)展,幫助構(gòu)建一個(gè)可以安全、有效地應(yīng)用生物技術(shù)的工程體系,推動(dòng)合成生物學(xué)及相關(guān)領(lǐng)域的科學(xué)發(fā)展。設(shè)計(jì)、建模和模擬是合成生物學(xué)必不可少的環(huán)節(jié), iGEM針對(duì)此問(wèn)題開(kāi)設(shè)軟件設(shè)計(jì)比賽項(xiàng)目,希望結(jié)合計(jì)算機(jī)技術(shù),簡(jiǎn)化或優(yōu)化合成生物學(xué)方面的活動(dòng)或?qū)嶒?yàn),使得合成生物學(xué)研究者達(dá)到更高的效率。
iGEM舉辦至今,每年會(huì)誕生不少優(yōu)秀的合成生物學(xué)基因回路設(shè)計(jì)軟件,雖然由于種種原因,比如iGEM的參賽隊(duì)伍大部分是本科生,沒(méi)有很好的延續(xù)性,很多項(xiàng)目并沒(méi)有被很好的維護(hù),這些軟件實(shí)際應(yīng)用到科學(xué)研究中的案例并不多,但是這些項(xiàng)目設(shè)計(jì)中好的思路和想法可以被運(yùn)用到更系統(tǒng)的基因設(shè)計(jì)軟件中。所以在這里,詳細(xì)總結(jié)了往屆優(yōu)秀的軟件設(shè)計(jì)參賽項(xiàng)目,試圖從中學(xué)習(xí)他人的獨(dú)特思路,總結(jié)現(xiàn)今科研過(guò)程中亟待解決的問(wèn)題,找出其發(fā)展趨勢(shì)。發(fā)現(xiàn)近幾年的iGEM軟件設(shè)計(jì)參賽項(xiàng)目主要有以下四個(gè)設(shè)計(jì)思路。
輔助設(shè)計(jì)類(lèi)型的項(xiàng)目著眼于改進(jìn)基因回路的設(shè)計(jì)與測(cè)試,使生物工程更具預(yù)測(cè)性(見(jiàn)表1)。合成生物學(xué)家常采用重建的方法,即通過(guò)構(gòu)建具有相似功能的遺傳回路,來(lái)深入了解自然回路的潛在機(jī)制。例如Gardner等[18]在2000年報(bào)道了一種撥動(dòng)開(kāi)關(guān)的設(shè)計(jì)。這種設(shè)計(jì)可以用作“框架”,或用作用戶(hù)使用不同生物部件設(shè)計(jì)撥動(dòng)開(kāi)關(guān)的指南(見(jiàn)圖1)。2014年SYSU-Software(http://2014.igem.org/Team:SYSU-Software)開(kāi)發(fā)了一款基于框架的遺傳回路設(shè)計(jì)軟件FLAME。當(dāng)選擇理想的框架時(shí),F(xiàn)LAME會(huì)提供幾種解決方案,每種解決方案的機(jī)制和效率都不相同。根據(jù)每個(gè)解決方案的性能,用戶(hù)可以選擇其中一個(gè)微調(diào)電路的細(xì)節(jié),并通過(guò)軟件仿真功能模擬其性能。
表1 輔助設(shè)計(jì)類(lèi)軟件對(duì)比Table 1 Comparison of softwares for auxiliary design
圖1 撥動(dòng)開(kāi)關(guān)圖示[6]Fig.1 A scheme for genetic toggle switch[6]
SYSU-Software通過(guò)軟件構(gòu)建了一個(gè)IPTG控制GFP的表達(dá)的基因電路,從而控制熒光強(qiáng)度的簡(jiǎn)單電路,并且通過(guò)濕實(shí)驗(yàn)驗(yàn)證了其模擬的結(jié)果。這一設(shè)計(jì)是令人興奮的,尤其是對(duì)于合成生物學(xué)家來(lái)說(shuō),軟件可以在短時(shí)間內(nèi)設(shè)計(jì)出想要的遺傳回路。對(duì)于初學(xué)者來(lái)說(shuō)他們不需要自己構(gòu)建框架只需向框架中添加生物磚即可。這極大提高了合成生物學(xué)家的工作效率。但對(duì)于有較深造詣的合成生物學(xué)家來(lái)說(shuō),他們想要的可能更多是新的未發(fā)掘的框架,不同的遺傳回路組成方式,這一點(diǎn)是這個(gè)軟件可以加以改進(jìn)的地方。
到目前為止,相當(dāng)數(shù)量的合成生物磚(Biobricks)和裝置已被表征和標(biāo)準(zhǔn)化。于是,一種基于標(biāo)準(zhǔn)化生物磚數(shù)據(jù)庫(kù)的輔助設(shè)計(jì)方法出現(xiàn)了。2014-SJTU-Software(http://2014.igem.org/Team:SJTU-Software)創(chuàng)造了以生物磚為核心的軟件Easy BBK,他們?cè)趇GEM官方提供的數(shù)據(jù)源的基礎(chǔ)上搭建了新的生物磚數(shù)據(jù)庫(kù),還加入了生物磚更多信息以衡量每一個(gè)生物磚在實(shí)驗(yàn)中的可靠程度,并通過(guò)打分評(píng)估生物磚的優(yōu)良程度。用戶(hù)可通過(guò)搜索引擎獲得所需并且已按優(yōu)良排序的生物磚,并組成所需遺傳回路。通過(guò)軟件讓用戶(hù)了解每一塊生物磚的性能,快速選擇遺傳回路所需的每一部分,不必通過(guò)查閱大量文獻(xiàn)或是實(shí)驗(yàn)了解每一個(gè)生物磚,極大的提高了用戶(hù)設(shè)計(jì)的效率。但是該軟件缺乏模擬仿真功能,對(duì)于設(shè)計(jì)出來(lái)的遺傳回路,用戶(hù)不知道其性能究竟如何,不得不采用實(shí)驗(yàn)驗(yàn)證。而且由該軟件推薦的若干優(yōu)質(zhì)的生物磚組成的遺傳回路也未必能在實(shí)驗(yàn)中有好的表現(xiàn),低分的生物磚在特定的遺傳回路中可能發(fā)揮著重要的作用。
SYSU-Software同樣注意到了遺傳回路中生物磚的重要性。他們?cè)?017年開(kāi)發(fā)了一款名為S-Din的軟件(http://2017.igem.org/Team:SYSU-Software, 見(jiàn)圖2),在S-Din的數(shù)據(jù)庫(kù)中建立并存儲(chǔ)關(guān)鍵字,項(xiàng)目和零件數(shù)據(jù)之間的網(wǎng)絡(luò)分析關(guān)系。用戶(hù)搜索關(guān)鍵字時(shí)S-Din將提供有關(guān)生物磚、零件數(shù)據(jù)及項(xiàng)目。當(dāng)用戶(hù)在搜索產(chǎn)生靈感時(shí)可立即在平臺(tái)中設(shè)計(jì),通過(guò)自由組合不同的生物磚來(lái)形成全新的遺傳回路,并在數(shù)學(xué)上模擬遺傳回路的動(dòng)態(tài)表現(xiàn)。設(shè)計(jì)完成后可將其轉(zhuǎn)化為質(zhì)粒以便合成。
為了驗(yàn)證該軟件,他們?cè)赟-Din中搜索“UV detection”,找到了之前相關(guān)項(xiàng)目——2012年ETH_Zurich的參賽項(xiàng)目(http://2012.igem.org/Team:ETH_Zurich),并提供了項(xiàng)目相關(guān)信息。根據(jù)S-Din的結(jié)果,刪除了ETH_Zurich設(shè)備的一些額外部件后在軟件中運(yùn)行數(shù)學(xué)模型并通過(guò)濕實(shí)驗(yàn)驗(yàn)證了其設(shè)計(jì)結(jié)果(見(jiàn)圖3)。這表示軟件的仿真性能很好。相較于SJTU-Software來(lái)說(shuō)SYSU-Software給出了更多生物磚的信息并且能為設(shè)計(jì)模擬仿真,用戶(hù)能很快了解所設(shè)計(jì)的遺傳回路的大致性能。對(duì)于合成生物學(xué)家來(lái)說(shuō)這是一個(gè)不錯(cuò)的喜訊。
受到自然進(jìn)化規(guī)律的啟發(fā),2016-SYSU-Software開(kāi)發(fā)了一款名為CRAFT的軟件(http://2016.igem.org/Team:SYSU-Software)。用戶(hù)可以輸入多個(gè)目標(biāo)并設(shè)計(jì)限制條件來(lái)模擬自然選擇條件。CRAFT可以枚舉所有可能的解決方案,模擬生物變化,制造某種在自然環(huán)境下最適合保存的合成生物學(xué)系統(tǒng)。CRAFT將在后端自動(dòng)生成調(diào)節(jié)元件。基于這些限制,每一個(gè)解決方案系統(tǒng)都包含一系列由CRAFT推薦的表達(dá)元件,用戶(hù)可以通過(guò)操作拖動(dòng)條來(lái)改變?cè)膹?qiáng)度,并且軟件將估算用適當(dāng)?shù)脑鎿Q以前的元件的效果。
圖2 S-Din搜索結(jié)果頁(yè)面 Fig.2 S-Din webpage of search engine results (http://2017.igem.org/wiki/images/3/33/T--SYSU-Software--project-wetlab.png)
圖3 模型驗(yàn)證結(jié)果Fig.3 Results of model verification(http://2017.igem.org/wiki/images/e/ed/T--SYSU-Software--project_simulation-result.png)
這一設(shè)計(jì)為其他iGEM軟件設(shè)計(jì)者提供了一個(gè)全新的想法,模擬自然選擇,生成的解決方案更可靠,更容易讓人接受。這種方法不僅新穎而且成為軟件輔助設(shè)計(jì)的另一突破口,也能給其他iGEMers不少啟發(fā)。但通過(guò)人為模擬自然環(huán)境得到的遺傳設(shè)計(jì)是否能適應(yīng)善變的環(huán)境發(fā)生有效的變異仍是未知的,值得探索。
輔助設(shè)計(jì)類(lèi)軟件因其對(duì)實(shí)驗(yàn)效率及方向指導(dǎo)的高貢獻(xiàn)性受到科學(xué)家的青睞,在科研中也常被參考使用,各種軟件側(cè)重方向的不同也提高了對(duì)不同研究的問(wèn)題的適應(yīng)性。但由于目前數(shù)據(jù)仍不夠豐富,且軟件仿真并沒(méi)有足夠的可靠性和適應(yīng)各類(lèi)問(wèn)題的能力,這類(lèi)軟件的表現(xiàn)與預(yù)期效果相去甚遠(yuǎn),在科研中無(wú)法滿(mǎn)足科研人員的要求,因此使用率及關(guān)注度提高困難。
目前輔助合成生物學(xué)家設(shè)計(jì)遺傳回路的軟件越來(lái)越多,方式各不相同,但在復(fù)雜、易變的生物環(huán)境中仍顯得不夠成熟。創(chuàng)造一款更加智能的軟件,可以在用戶(hù)搜索相關(guān)設(shè)計(jì)的同時(shí)不斷自主學(xué)習(xí),智能的產(chǎn)生一種新的人們未發(fā)掘的遺傳回路也許是下一階段要努力去實(shí)現(xiàn)的。
整合共享類(lèi)型項(xiàng)目旨在通過(guò)構(gòu)建或整合相關(guān)數(shù)據(jù)庫(kù)和搜索引擎,以期提高iGEM和合成生物學(xué)現(xiàn)有成果的透明度和可重復(fù)性(見(jiàn)表2)。有相當(dāng)一部分iGEM軟件隊(duì)在他們?cè)O(shè)計(jì)的軟件功能中包含了對(duì)已有成果的整合以及共享功能。通過(guò)構(gòu)建相關(guān)數(shù)據(jù)庫(kù)和搜索引擎,以提高iGEM和合成生物學(xué)現(xiàn)有成果的透明度和可重復(fù)性。合成生物學(xué)實(shí)驗(yàn)可重復(fù)性低是一個(gè)當(dāng)下合成生物學(xué)領(lǐng)域遇到的令人頭痛的問(wèn)題。為了解決因?qū)嶒?yàn)方案表述不清,步驟缺失等因素而造成的實(shí)驗(yàn)不可重復(fù)等問(wèn)題, 2014年密歇根大學(xué)iGEM軟件隊(duì)Michigan_Software構(gòu)建了一個(gè)用于清晰地記錄并儲(chǔ)存實(shí)驗(yàn)方案的數(shù)據(jù)庫(kù)(http://2014.igem.org/Team:Michigan_Software,見(jiàn)圖4),供科研人員下載并查看,使用此數(shù)據(jù)庫(kù)的科研人員都可以上傳數(shù)據(jù)并維護(hù)自己的實(shí)驗(yàn)方案,其他人可以復(fù)制并生成自己的實(shí)驗(yàn)方案版本。2017年,Michigan_Software進(jìn)一步開(kāi)發(fā)了一個(gè)工具,可以調(diào)用現(xiàn)有的保存實(shí)驗(yàn)方案的數(shù)據(jù)庫(kù)protocal.io的API,來(lái)導(dǎo)入protocal.io的實(shí)驗(yàn)方案,進(jìn)一步加強(qiáng)了在這方面的資源整合程度。這一項(xiàng)工作也使得他們?cè)?017年iGEM比賽中拿到了金牌。
表2 資料整合共享類(lèi)軟件對(duì)比Table 2 Comparison of softwares for data sharing
圖4 軟件設(shè)計(jì)架構(gòu)Fig.4 Software design architecture(http://2014.igem.org/wiki/images/2/2d/Concept_map.png)
與之類(lèi)似的還有很多項(xiàng)目,如USTC-Software 2014年的項(xiàng)目(http://2014.igem.org/Team:USTC-Software)。在他們的項(xiàng)目的數(shù)據(jù)共享部分,允許使用者把自己設(shè)計(jì)的生物部件上傳到主數(shù)據(jù)庫(kù),供他人使用。這一類(lèi)的設(shè)計(jì)大同小異,主要功能是允許用戶(hù)上傳自己的數(shù)據(jù)到數(shù)據(jù)庫(kù)中,經(jīng)由數(shù)據(jù)庫(kù)整合后供所有人使用。但是這一類(lèi)設(shè)計(jì)最大的問(wèn)題在于初期數(shù)據(jù)量小的時(shí)候,并不能很好地發(fā)揮它的作用。
除此以外,還有另一類(lèi)的設(shè)計(jì)不需要用戶(hù)上傳數(shù)據(jù),而是整合網(wǎng)絡(luò)上已有的數(shù)據(jù),來(lái)提高現(xiàn)有項(xiàng)目的透明度和利用率。如SJTU-Software 2014年的項(xiàng)目(http://2014.igem.org/Team:SJTU-Software)就建立了一個(gè)整合現(xiàn)有生物磚的數(shù)據(jù)庫(kù),其數(shù)據(jù)主要來(lái)源于iGEM官網(wǎng)上保存的每年注冊(cè)的部件的Registry?;谶@個(gè)數(shù)據(jù)庫(kù),用戶(hù)可以搜索高質(zhì)量的生物磚,或比較生物磚的質(zhì)量。同時(shí),用戶(hù)也可根據(jù)一定的標(biāo)準(zhǔn)去上傳自己的生物磚。類(lèi)似的,還有SJTU-Software 2016年的項(xiàng)目IMAP,整合并優(yōu)化了iGEM官網(wǎng)上的信息,并放在他們的軟件中,供iGEMer瀏覽。通過(guò)整合這些資料,使得iGEMer可以更好地了解iGEM和使用iGEM網(wǎng)站上的信息。
合作交流類(lèi)項(xiàng)目則旨在加強(qiáng)iGEM團(tuán)隊(duì)和合成生物學(xué)家間的交流合作,以提高工作效率和項(xiàng)目效果(見(jiàn)表3)。有一點(diǎn)不能忽略的是,越來(lái)越多的隊(duì)伍注意到,用戶(hù)之間的交流與合作可以顯著的提高工作效率和產(chǎn)品效果,所以很多隊(duì)伍在他們?cè)O(shè)計(jì)的軟件中添加了社區(qū)功能,用戶(hù)可以在社區(qū)中發(fā)布自己的設(shè)計(jì),以尋求他人的改進(jìn)意見(jiàn);或者是在社區(qū)中尋求幫助或合作,以求解決當(dāng)下研究中遇到的障礙。
表3 合作交流類(lèi)軟件對(duì)比Table 3 Comparison of softwares for cooperation and communication
SJTU-Software 2016年的項(xiàng)目就實(shí)現(xiàn)了交流的功能。每個(gè)團(tuán)隊(duì)都有自己的小組,每個(gè)成員都有自己的主頁(yè)。在團(tuán)隊(duì)頁(yè)面中,每個(gè)團(tuán)隊(duì)成員的聯(lián)系信息將被顯示以方便溝通,而且可以在軟件中直接發(fā)送消息(見(jiàn)圖5)。Michigan軟件隊(duì)在2017年(http://2017.igem.org/Team:Michigan_Software)推出的protocat4.0中提出的群組賬號(hào)、收藏夾以及聊天功能,這些提供了一個(gè)可供合作團(tuán)隊(duì)進(jìn)行交流分享的平臺(tái)。但其功能還是局限于普通聊天軟件所能提供的功能,沒(méi)能在輔助iGEM設(shè)計(jì)上更進(jìn)一步。這一點(diǎn)上,其他隊(duì)伍提供了更好的思路和設(shè)計(jì)。USTC在2017年推出的Biohub2.0中(http://2017.igem.org/Team:USTC-Software)給出的功能插件系統(tǒng),除了平臺(tái)自身提供的一些功能插件以外,用戶(hù)可以上傳自己設(shè)計(jì)的功能插件在社區(qū)中共享。這樣,用戶(hù)不僅可以享受到更多的功能,還可以在共享中發(fā)現(xiàn)問(wèn)題和改善插件。還有SYSU在2015推出的CORE(http://2015.igem.org/Team:SYSU-Software)中提出的CORE bank和CORE design功能。用戶(hù)可以將自己的設(shè)計(jì)上傳到CORE bank當(dāng)中,還可以通過(guò)CORE design功能對(duì)CORE bank中已有的設(shè)計(jì)提出意見(jiàn),或者進(jìn)行改進(jìn)升級(jí),然后再次上傳到CORE bank中覆蓋原有的舊版本。與此同時(shí),CORE還提供了用戶(hù)評(píng)分系統(tǒng)(見(jiàn)圖6),來(lái)甄別相同功能的不同設(shè)計(jì)的優(yōu)劣。但用戶(hù)評(píng)分系統(tǒng)如今還并不完善,存在諸多問(wèn)題。如果用戶(hù)數(shù)目不夠多,用戶(hù)評(píng)分的可信度就會(huì)大大降低;而且沒(méi)有一個(gè)統(tǒng)一的評(píng)價(jià)標(biāo)準(zhǔn),僅僅憑借用戶(hù)的經(jīng)驗(yàn)進(jìn)行評(píng)分也會(huì)對(duì)評(píng)價(jià)產(chǎn)生偏差。這點(diǎn)上,USTC在2015的BioBLESS(http://2015.igem.org/Team:USTC-Software)中提出了另一種思路。就是在用戶(hù)評(píng)分的同時(shí),系統(tǒng)輔助評(píng)分。在評(píng)價(jià)基因電路的功能時(shí),系統(tǒng)會(huì)根據(jù)多個(gè)標(biāo)準(zhǔn)對(duì)電路進(jìn)行綜合評(píng)價(jià),最后根據(jù)基因電路在各個(gè)標(biāo)準(zhǔn)上的表現(xiàn)情況進(jìn)行最后評(píng)分。雖然這個(gè)評(píng)分系統(tǒng)目前只能針對(duì)軟件自身生成的基因電路,但它提供了一種系統(tǒng)提供統(tǒng)一標(biāo)準(zhǔn)進(jìn)行評(píng)分的思路?;蛟S未來(lái)可以將這種思路和用戶(hù)評(píng)分系統(tǒng)相結(jié)合,在注重客戶(hù)的個(gè)人體驗(yàn)的同時(shí),也增加統(tǒng)一的標(biāo)準(zhǔn),這樣的評(píng)分就變得更加科學(xué)也不失人性化。
圖5 社區(qū)交流頁(yè)面Fig.5 Webpage for communication(http://2016.igem.org/wiki/images/6/62/SJTUsoftware-tutorial12.jpg)
圖6 Biohub的用戶(hù)評(píng)價(jià)系統(tǒng)Fig.6 User rating system of Biohub(http://2017.igem.org/wiki/images/a/a6/Forum-pop.png)
數(shù)據(jù)分析類(lèi)的項(xiàng)目主要是通過(guò)設(shè)計(jì)算法來(lái)解析和格式化生物數(shù)據(jù),以便更好地使用。從歷年的項(xiàng)目中我們看到,基因序列分析、挖掘,也是合成生物學(xué)中相當(dāng)重要的且極具分析價(jià)值的研究方向。對(duì)基因序列這類(lèi)生物數(shù)據(jù)的巧妙處理,可以讓它服務(wù)于記錄、追蹤整個(gè)合成生物學(xué)領(lǐng)域的數(shù)據(jù)變化;同時(shí),這樣的工作也有可能對(duì)其他領(lǐng)域的發(fā)展提供新的思考方向。2014年Vanderbilt_Software制作了軟件Darwin(http://2014.igem.org/Team:Vanderbilt_Sof-ware),可以系統(tǒng)的追蹤基因序列細(xì)微變化,并記錄到數(shù)據(jù)庫(kù)。每次追蹤到的新改變又通過(guò)算法更新數(shù)據(jù)庫(kù),從而生成更高效和安全的跟蹤系統(tǒng)。這種設(shè)計(jì)將在未來(lái)避免合成生物學(xué)家陷入令人困擾的邏輯復(fù)雜性中。2016年,UESTC-Software(http://2016.igem.org/Team:UESTC-software)提出基于DNA的文件編輯技術(shù),首次將生物信息轉(zhuǎn)化成計(jì)算機(jī)信息。他們以0、1兩個(gè)數(shù)字的不同組合定義DNA的四種堿基,使一段DNA序列成為一長(zhǎng)串計(jì)算機(jī)二進(jìn)制代碼來(lái)儲(chǔ)存信息。DNA作為信息存儲(chǔ)介質(zhì),具有高容量(每克DNA相當(dāng)于重量超過(guò)151公斤的14千張50 GB藍(lán)光光盤(pán)或233 x 3 TB硬盤(pán)),低維護(hù),自我復(fù)制,在數(shù)千年后仍然可讀等優(yōu)點(diǎn)。這個(gè)項(xiàng)目的提出是合成生物學(xué)在其他領(lǐng)域的開(kāi)創(chuàng)性嘗試,也是其他領(lǐng)域發(fā)展的新方向。
分析了近幾年的iGEM軟件隊(duì)項(xiàng)目,總結(jié)出iGEM的軟件設(shè)計(jì)項(xiàng)目主要以輔助設(shè)計(jì)、資料整合、合作交流、數(shù)據(jù)分析為設(shè)計(jì)方向,幫助合成生物學(xué)家更合理的設(shè)計(jì)回路、更高效的尋找資源、更便捷的交流探討。也有一些隊(duì)伍著眼于合成生物學(xué)某一方面的問(wèn)題,提出優(yōu)化的方案并設(shè)計(jì)出工具。無(wú)論角度如何,他們的工作都踐行著iGEM的目標(biāo),促進(jìn)了生物工具的開(kāi)源化、透明化發(fā)展,推動(dòng)著合成生物學(xué)及相關(guān)領(lǐng)域的發(fā)展和普及。我們希望本篇綜述通過(guò)總結(jié)以往項(xiàng)目的設(shè)計(jì)思路和發(fā)展趨勢(shì),能為今后參加軟件隊(duì)的iGEMer提供參考的構(gòu)思想法及立題方向;或者在此基礎(chǔ)上延伸思考,激發(fā)出更好的創(chuàng)新與靈感,為合成生物學(xué)的發(fā)展做出貢獻(xiàn)。