王欣,趙鵬,李清揚,田平芳
(1北京化工大學(xué)生命科學(xué)與技術(shù)學(xué)院,北京100029;2華南理工大學(xué)食品科學(xué)與工程學(xué)院,廣東廣州510641)
合成生物學(xué)(synthetic biology)是從最基本要素開始設(shè)計和構(gòu)建新生物體系,或修改現(xiàn)有生物體系的一門交叉學(xué)科[1-2]。近年來,人工基因電路已取得顯著進(jìn)展,在此基礎(chǔ)上耦合半導(dǎo)體材料形成了生物-非生物混合體系(living-nonliving hybrid system)。在該雜合體系中,人工細(xì)胞可與半導(dǎo)體材料建立聯(lián)系,由此形成一個新的研究方向——半導(dǎo)體合成生物學(xué)(semiconductor synthetic biology/SemiSynBio,SSB)。半導(dǎo)體合成生物學(xué)探索工程細(xì)胞與半導(dǎo)體材料之間的協(xié)同作用。無論是半導(dǎo)體材料還是細(xì)胞,二者都涉及電子的受控流動,區(qū)別在于半導(dǎo)體材料涉及物理現(xiàn)象中電子在線路中的長程運動,而細(xì)胞則涉及化學(xué)反應(yīng)中電子在分子間的短程運動。當(dāng)半導(dǎo)體縮小到物理極限時,就能幾乎匹配活細(xì)胞以化學(xué)方式處理的電子傳遞。因此在半導(dǎo)體合成生物學(xué)領(lǐng)域,物理信號將超越以往簡單的傳遞方式,轉(zhuǎn)變?yōu)榧?xì)胞-半導(dǎo)體間的雙向通信,即一方面細(xì)胞能接收來自半導(dǎo)體的電、熱、機械等物理信號,從而調(diào)控其代謝行為;另一方面半導(dǎo)體材料也能感知來自細(xì)胞的電子、代謝物及生物大分子等信號,從而實現(xiàn)物質(zhì)或信號的輸出[3]。由此可見,半導(dǎo)體合成生物體系包括:(1)以活細(xì)胞為感應(yīng)基礎(chǔ)的“生物前端”層;(2)以非生物材料為信息計算模塊的“半導(dǎo)體后端”層。因此,該研究方向?qū)儆诮徊鎸W(xué)科,具有理論和應(yīng)用雙重意義。本文綜述了近年來半導(dǎo)體合成生物學(xué)具有代表性且發(fā)展迅速的領(lǐng)域。
為滿足日益增長的能源需求并克服化石燃料的局限性,人們正在尋求可持續(xù)的新能源生產(chǎn)方法。光合作用對碳元素的利用率接近100%,但整個過程的能量轉(zhuǎn)換效率非常低(一般在5%以下)[4]。固態(tài)半導(dǎo)體光吸收器比生物體更能有效地捕獲光,能量轉(zhuǎn)換效率接近20%(Shockley-Queisser極限為33.7%)[5-6]。因此,將高選擇性生物催化體系和高效光收集器進(jìn)行集成,建立混合系統(tǒng),其碳利用效率將超過天然光合作用[7-9]。該半導(dǎo)體-細(xì)胞混合體系包括三部分:細(xì)胞、半導(dǎo)體材料及界面接口。
細(xì)胞通過復(fù)雜的表面結(jié)構(gòu)與外環(huán)境進(jìn)行物質(zhì)與能量交換。非光合微生物例如大腸桿菌(Escherichiacoli)[10]、酵 母 菌(Saccharomyces cerevisiae)[11]、卵形鼠孢菌(Sporomusa ovata)[12]、熱醋穆爾氏菌(Moorella thermoacetica)[13]和羅爾斯通氏菌(Ralstonia eutropha)[14-15]等已被開發(fā)為半導(dǎo)體-細(xì)胞雜交體系進(jìn)行人工光合作用。在這種混合雜交系統(tǒng)中,厭氧菌能在有氧條件下接收外界非生物組件傳遞的信號或還原當(dāng)量,之后利用細(xì)胞內(nèi)特有途徑進(jìn)行氧化-還原反應(yīng),從而合成化學(xué)品或能源燃料。非生物部分應(yīng)具有親微生物表面,可促進(jìn)材料和微生物的穩(wěn)定整合。與聚合物和金屬相比,半導(dǎo)體材料因其在生物界面處的多種信號傳導(dǎo)機制而更適用于電子和光子生物界面。同時,高性能無機半導(dǎo)體可被精確制造成各種納米級結(jié)構(gòu),以匹配亞細(xì)胞和分子成分的大小。例如,硅納米線(SiNWs)的直徑(d=1~100 nm)比哺乳動物細(xì)胞(dcell≈10μm)小幾個數(shù)量級,且具有較大的長徑比(約103),這有助于在分子水平上研究復(fù)雜的信號調(diào)控模式[16]。除硅(Si)[17]之外,常見的非生物體部分還包括磷化銦(InP)[11]、硫化鎘(CdS)[13,18]、磷酸鈷(CoP)[19]、金納米團簇(AuNCs)[20]、石墨相碳氮化物(g-C3N4)[14-15]等半導(dǎo)體材料。生物體和非生物體之間的耦合需要穩(wěn)定且高效的界面接口,如此才能構(gòu)建與自然系統(tǒng)相同的信號傳導(dǎo)機制,從而準(zhǔn)確地調(diào)控細(xì)胞-半導(dǎo)體混合系統(tǒng)。界面接口的形成則需要細(xì)胞和半導(dǎo)體材料間極為緊密和高表面積的接觸,以便維持細(xì)胞活力和半導(dǎo)體性能[21]。在細(xì)胞-半導(dǎo)體雜交體中實現(xiàn)這種界面需要做到三個方面:(1)選擇并設(shè)計適當(dāng)?shù)纳锖头巧锍煞忠源_保二者的相容性;(2)通過親和結(jié)合或自組裝進(jìn)行化學(xué)耦合;(3)建立人工材料與細(xì)胞之間的能量轉(zhuǎn)導(dǎo)及耦合。
細(xì)胞與半導(dǎo)體的連接一般為直接物理接觸(圖1)。Kim等[16]將哺乳動物細(xì)胞培養(yǎng)在含垂直排列的SiNW陣列的基底上,數(shù)天后,SiNW陣列與正在生長的細(xì)胞緊密結(jié)合,該研究表明無外力作用下半導(dǎo)體材料與細(xì)胞的自然結(jié)合。Sakimoto等[13]則采用生物沉淀的方法使M.thermoacetica表面附著CdS納米顆粒,建立了良好的生物界面。再如,Wei等[10]在大腸桿菌中融合表達(dá)外膜蛋白OmpA和金屬結(jié)合蛋白PbrR,可特異性吸附Pb和Cd離子,從而在菌表面形成PbS和CdS界面層,促使菌體在有氧條件下持續(xù)產(chǎn)氫。Tremblay等[14-15]則將g-C3N4顆粒與R.eutrophaH16共培養(yǎng)構(gòu)建雜交光合系統(tǒng),轉(zhuǎn)化光能后得到部分還原當(dāng)量,然后通過乙酰乙酰輔酶A還原酶PhbB直接供給聚羥基丁酸酯的合成。在人工光合雜交系統(tǒng)中,半導(dǎo)體光吸收器具有較高的載流子遷移率,比生物體更高效地吸收光,但卻不能有效地將光激發(fā)電子的能量轉(zhuǎn)移至碳鍵合成中。因此,利用非光合細(xì)菌的優(yōu)異胞內(nèi)固碳能力將半導(dǎo)體吸收的光能轉(zhuǎn)換成化學(xué)能,從而最大限度地利用太陽能。此前研究中,自養(yǎng)細(xì)菌已廣泛用于生產(chǎn)簡單有機分子,而將異養(yǎng)生物與半導(dǎo)體光收集器融合,則在復(fù)雜代謝物的合成方面更具優(yōu)勢。
圖1 半導(dǎo)體-細(xì)胞雜合體系介導(dǎo)的生物催化示意圖Fig.1 Schematic diagram of biocatalysis mediated by semiconductor-cell hybrid system
人工光合雜交系統(tǒng)的電子轉(zhuǎn)移機制可根據(jù)細(xì)胞膜上是否存在氫化酶而分為兩種:(1)非氫化酶介導(dǎo)的直接電子轉(zhuǎn)移,該過程發(fā)生在光合作用的前3 h,其特點符合慢電荷轉(zhuǎn)移動力學(xué),當(dāng)細(xì)胞與半導(dǎo)體直接接觸后,通過自身的還原蛋白[例如,細(xì)胞色素(Cyt)、鐵氧還蛋白(Fd)、黃素蛋白(Fp)]或?qū)щ姳廾珜怆娮觽鬟f到自身細(xì)胞的化學(xué)反應(yīng)中,并不依賴H2或NAD(P)H作為還原當(dāng)量的來源[22];(2)氫化酶介導(dǎo)的間接電子轉(zhuǎn)移,該過程遵循驅(qū)動電子到膜結(jié)合氫化酶的電荷轉(zhuǎn)移動力學(xué),在24 h內(nèi)積累足量的H2、甲酸等代謝物,并通過HydABC絡(luò)合物氧化進(jìn)入Wood-Ljungdahl途徑,為細(xì)胞提供還原當(dāng)量(圖1)[23-25]??傊?,以細(xì)胞色素和氫化酶為代表的膜結(jié)合蛋白在電子-空穴對分離過程中發(fā)揮重要的電子傳遞作用[22,26]。Jensen等[27]在大腸桿菌中異源表達(dá)希瓦氏菌(Shewanella oneidensis)的胞外電子傳遞色素蛋白(CymA、MtrA、MtrB、MtrC),重構(gòu)了胞外電子傳遞路徑(CymA-MtrCAB),使外膜上的固體金屬氧化物被還原。該研究表明,合成生物學(xué)可改變細(xì)胞特性,使其成為與無機納米材料相容的界面細(xì)胞。因此,研究重點將著眼于提高材料的電子-空穴對分離效率以及電子從半導(dǎo)體到細(xì)胞的轉(zhuǎn)移能力[28-29]。深入了解電子在細(xì)胞內(nèi)的分子響應(yīng)機制有助于改進(jìn)半導(dǎo)體材料對信號的集成和傳導(dǎo)性能。
當(dāng)電子或還原當(dāng)量通過細(xì)胞膜進(jìn)入胞內(nèi),細(xì)胞內(nèi)分子響應(yīng)機制可分為人為調(diào)控和胞內(nèi)自主調(diào)控(圖1)。人為調(diào)控是根據(jù)需求對胞內(nèi)代謝途徑進(jìn)行改造,使細(xì)胞從半導(dǎo)體材料中獲得的能量集中用于某特定代謝途徑或途徑中某一步驟,對細(xì)胞獲得的還原力進(jìn)行有目的地分配。該方面Guo等[11]構(gòu)建的基因工程酵母-InP雜化平臺是一成功案例。NADPH是生物合成中的關(guān)鍵氧化還原輔因子。酵母中的NADPH主要來自磷酸戊糖途徑(PPP)。當(dāng)缺失葡萄糖-6-磷酸脫氫酶基因zwf1時,PPP的氧化部分被破壞,極大降低胞漿NADPH的再生能力,直接影響莽草酸的合成,最終導(dǎo)致其前體3-脫氫莽草酸(DHS)的積累[30]。研究者在此基礎(chǔ)上利用附著在酵母細(xì)胞表面的光收集半導(dǎo)體顆粒InP提供缺失的還原當(dāng)量,促使DHS高效合成莽草酸[11]。此外,在釀酒酵母表面覆蓋氮化鎵(GaN)納米薄膜,使其能夠吸收紫外線提供的能量,在細(xì)胞表面積累電荷,激活細(xì)胞壁中的幾丁質(zhì)合成途徑[31]。另一種胞內(nèi)自主調(diào)控機制則是遵循細(xì)胞正常代謝途徑所需,利用半導(dǎo)體材料的電子或還原當(dāng)量生產(chǎn)簡單有機小分子。如Sakimoto等[13]建立了M.thermoacetica-CdS雜交體系,CdS經(jīng)光照激發(fā)的光生電子產(chǎn)生還原當(dāng)量[H]直接進(jìn)入Wood-Ljungdahl途徑,驅(qū)動CO2經(jīng)乙酰-CoA合成乙酸。Wood-Ljungdahl途徑是已知厭氧生物固碳途徑中能耗最低、路徑最短的途徑,符合細(xì)胞自主調(diào)節(jié)的能量分配原則。
半導(dǎo)體-細(xì)胞雜交體系介導(dǎo)的生物催化發(fā)展極為迅速,已開發(fā)出若干細(xì)胞和半導(dǎo)體材料的組合。除光合雜交體系外,Kladko等[32]開發(fā)了一種海膽狀磁性納米顆粒。附著在酵母細(xì)胞表面的磁性顆粒可經(jīng)低頻磁場(100 Hz)驅(qū)動而改變空間排布,在不影響細(xì)胞生存的范圍內(nèi)改變細(xì)胞膜通透性,使釀酒酵母利用葡萄糖生產(chǎn)乙醇的轉(zhuǎn)化率提高了150%。隨著對雜交系統(tǒng)的電子轉(zhuǎn)移機制及細(xì)胞能量代謝方式的深入研究,半導(dǎo)體合成生物學(xué)將為清潔能源開發(fā)、大宗化學(xué)品生產(chǎn)及高值藥物合成等提供重要技術(shù)支撐。
生物傳感器(biosensor)是一種可識別生物分子并將代謝物濃度轉(zhuǎn)化為光、電等信號的檢測儀器。它以生物敏感材料為識別元件,以可響應(yīng)光、電、壓力、場效應(yīng)等信號的材料為理化換能器,實現(xiàn)生物信號的轉(zhuǎn)換與輸出。自1967年第一個生物傳感器——葡萄糖傳感器[33]問世以來,科學(xué)家們以酶、抗體、細(xì)胞器、動植物組織等為特異性響應(yīng)元件,開發(fā)出多種生物傳感器。傳統(tǒng)生物傳感器靈敏度高、特異性好,但功能有限?;罴?xì)胞-半導(dǎo)體材料雜交體系可通過胞內(nèi)生化反應(yīng)實現(xiàn)對外環(huán)境的實時監(jiān)測,且可對外界信號做出反應(yīng),從而執(zhí)行普通生物活性材料無法完成的功能。這種新型智能生物傳感器在個性化診斷、疾病治療、微觀生物致動機器人開發(fā)等方面發(fā)揮重要作用。
生物標(biāo)志物是指器官、組織或細(xì)胞結(jié)構(gòu)功能發(fā)生改變的一類生化指標(biāo),為疾病診斷提供確切依據(jù)。生物標(biāo)志物的檢測通常是將樣本(包括血液、體液、組織液等)取出后在體外進(jìn)行,樣本穩(wěn)定性及檢測時效性對結(jié)果有一定影響。為此,Mimee等[34]制備了一種可攝入的微型生物電子器件(IMBED),用于診斷胃腸道疾病。在該設(shè)備中,工程益生菌與半導(dǎo)體微電子系統(tǒng)形成的雜交系統(tǒng)共同集成于一種可吸收的微型膠囊中[圖2(a)]。當(dāng)患者攝入該膠囊后,血紅素可透過半透膜與細(xì)胞接觸,并借助細(xì)胞外膜轉(zhuǎn)運蛋白ChuA進(jìn)入胞內(nèi)與轉(zhuǎn)錄阻遏物HrtR互作,表達(dá)細(xì)菌熒光素酶操縱子luxCDAB。工程菌將血液信號轉(zhuǎn)換為生物光信號,隨后由光電探測器轉(zhuǎn)換為電信號,并從設(shè)備無線傳輸?shù)酵獠繜o線電或蜂窩電話,用于讀取和分析。裝載不同工程菌的設(shè)備可對血紅素、?;呓z氨酸內(nèi)酯(AHL)以及硫代硫酸鹽等腸道炎癥的相關(guān)生物標(biāo)記物產(chǎn)生響應(yīng),為胃腸道疾病檢測提供一種快速、微創(chuàng)且經(jīng)濟有效的檢測手段。除了用于個性化診斷,智能化生物傳感器的信號接收器和轉(zhuǎn)換器的定位并非一成不變。當(dāng)半導(dǎo)體材料成為信號接收載體,活細(xì)胞就能以此調(diào)節(jié)自身功能從而實現(xiàn)疾病精準(zhǔn)治療。葉海峰團隊[35]將電子設(shè)備生成和讀取數(shù)字信號的能力與光遺傳工程細(xì)胞相結(jié)合,通過智能手機無線調(diào)控工程菌在小鼠體內(nèi)生產(chǎn)胰島素或胰高血糖素樣肽1(shGLP-1),推動糖尿病細(xì)胞療法的臨床應(yīng)用。他們以一個32位的嵌入式微處理器芯片作為系統(tǒng)的智能控制器,在接收電子指令后觸發(fā)生物相容性的遠(yuǎn)紅光源(FRL),并激活細(xì)菌的環(huán)二鳥苷酸(c-di-GMP)合酶BphS和c-di-GMP特異性磷酸二酯酶YhjH,從而實現(xiàn)基因表達(dá)調(diào)控[圖2(b)]。通過該半自動生物傳感平臺,采用手機App即可實現(xiàn)遠(yuǎn)程控制糖尿病患者血糖,顛覆了傳統(tǒng)口服和藥物注射治療糖尿病的方法。
DNA是一種天然生物高分子,可通過堿基互補配對完成精準(zhǔn)高效自組裝,也可響應(yīng)不同刺激改變自身結(jié)構(gòu)。因此,DNA作為結(jié)構(gòu)基元可合成多種功能材料。DNA水凝膠不僅包含水凝膠的骨架結(jié)構(gòu),而且具有DNA的生物功能?;贒NA構(gòu)象變化的可逆性,可實現(xiàn)水凝膠溶液狀態(tài)和凝固狀態(tài)的可逆調(diào)控,體現(xiàn)了材料結(jié)構(gòu)與功能的完美融合[36]。仰大勇課題組[37]提出了構(gòu)建超軟動態(tài)DNA水凝膠的新策略,制備了一種能對不同極性溶劑快速而靈敏響應(yīng)的DNA/多巴胺接枝葡聚糖軟體水凝膠,并成功利用這種DNA水凝膠導(dǎo)線電路控制釀酒酵母發(fā)酵過程[圖3(a)]。此外,該課題組還基于滾環(huán)擴增(RCA)方式合成了具有形狀適應(yīng)性的DNA水凝膠機器人。在遠(yuǎn)距離磁力驅(qū)動下,該機器人可通過快速變形和恢復(fù)形狀來實現(xiàn)狹窄和結(jié)構(gòu)復(fù)雜環(huán)境中的導(dǎo)航。具有良好生物相容性的DNA機器人成為智能運輸活細(xì)胞的工具,可在體內(nèi)診斷治療、植入式醫(yī)療和微創(chuàng)手術(shù)等方面執(zhí)行復(fù)雜任務(wù)[圖3(a)][38]。Hamada等[39]受新陳代謝的啟發(fā),提出DASH機制——基于DNA的層次材料組裝與合成。該理論認(rèn)為,DNA分子可被合成并組裝為一種層級結(jié)構(gòu),它在液體環(huán)境中可攝取外界能量,并按指令自動進(jìn)行生長與降解,從而得到一種由人工代謝提供動力的動態(tài)材料[圖3(a)]。這種材料有望用于開發(fā)新一代生物芯片或傳感機器人。
圖2 可吸收的微電子設(shè)備(IMBED)示意圖(a);智能手機調(diào)控工程細(xì)胞的表達(dá),實現(xiàn)半自動血糖穩(wěn)態(tài)(b)Fig.2 Schematic diagram of absorbable microelectronic equipment(IMBED)(a);Smart phones regulate engineered cells to achieve semi-automatic blood glucose homeostasis(b)
圖3 DNA水凝膠的應(yīng)用(a);工程細(xì)胞-柔性材料軟機器人示意圖(b)Fig.3 Applications of DNA hydrogel(a);Schematic diagram of engineered cell-flexible materials-based soft robot(b)
當(dāng)半導(dǎo)體-智能細(xì)胞與生物基材料耦合時,信號轉(zhuǎn)換與傳遞得到進(jìn)一步擴展,一種新型生物混合機器也隨之誕生[40-42]。Justus等[43]用聚醚砜膜(PES膜)、聚碳酸酯軌跡蝕刻膜(PCTE膜)和多孔PDMSNaHCO3膜將重組大腸桿菌與嵌入式電子元件集成到密封的彈性體材料中[圖3(b)]。PES膜和PCTE膜孔徑分布均勻,可在截留大腸桿菌的同時允許化學(xué)刺激從外部環(huán)境傳輸?shù)皆O(shè)備;多孔PDMS-NaHCO3膜具有彈性和光學(xué)透明性,可使工程菌在流體通道的液體介質(zhì)中運動并輸送光遺傳信號。當(dāng)生物傳感模塊中的菌株接受刺激并合成熒光蛋白后,嵌入式電子元件被激活,將生物信號轉(zhuǎn)換成電子信號并通過調(diào)整下一級層中水凝膠的狀態(tài),來控制微型軟夾持器的抓取行為。這項工作真正賦予機器人的自主功能,為軟材料和集成界面機器人的研發(fā)開辟了新方向。
半導(dǎo)體器件的特點是響應(yīng)速度快、可放大信號并具有一定容錯性,這些優(yōu)點很適于調(diào)控生物系統(tǒng)的復(fù)雜動力學(xué)[44-45];而活細(xì)胞具有復(fù)雜的基因表達(dá)及代謝能力,能夠執(zhí)行無機材料無法完成的工作。因此,二者結(jié)合將同時打破材料及生物系統(tǒng)等領(lǐng)域的技術(shù)瓶頸,具有廣闊應(yīng)用前景。
目前,數(shù)據(jù)存儲介質(zhì)大多是性能良好的半導(dǎo)體材料。數(shù)據(jù)存儲密度與材料的物理尺寸以及電路集成能力密切相關(guān)。然而,半導(dǎo)體材料構(gòu)成的電路已接近其性能極限;此外,亞納米水平的集成也因元件間距過小而面臨量子干擾、庫侖阻塞等物理效應(yīng)的限制。因此,開發(fā)新的數(shù)據(jù)存儲方法才能解決當(dāng)今信息太多而存儲能力弱的矛盾。分子數(shù)據(jù)存儲是一種密集且持久的信息存儲方式,但半導(dǎo)體材料需在極低溫度下(約-210℃)才能保持單分子級的數(shù)據(jù)存儲性能,昂貴的冷卻系統(tǒng)限制了該方法大規(guī)模應(yīng)用。DNA作為生物遺傳信息的載體,其獨特的生物學(xué)特性使其在存儲時間、存儲密度和數(shù)據(jù)讀取等方面具有優(yōu)勢。
首先,DNA具有雙螺旋結(jié)構(gòu),脫氧核苷酸外側(cè)通過共價的3,5-磷酸二酯鍵結(jié)合,內(nèi)部則通過堿基互補配對形成大量氫鍵。DNA的穩(wěn)定結(jié)構(gòu)確保其較長的半衰期,因而可長期甚至永久存儲數(shù)據(jù)[46-48]。第二,DNA具有極高的數(shù)據(jù)存儲密度。DNA分子中的堿基分為腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)四種(以A-T,C-G方式配對,形成堿基對,bp),它們類似于計算機二進(jìn)制代碼中的“0”和“1”[49-50]。與二進(jìn)制代碼相比,DNA序列由于堿基種類的倍增而可容納更多信息。例如,對于一段長度為X的字符串,二進(jìn)制系統(tǒng)只能包含2X倍信息,而含四種堿基的DNA則可容納4X倍信息,即單個脫氧核苷酸可表示兩個比特的信息[51]。此外,單個脫氧核苷酸分子的質(zhì)量極小(約為4.982×10-22g),理論上每克單鏈DNA能夠存儲高達(dá)455艾字節(jié)的數(shù)據(jù)(1艾字節(jié)=260字節(jié)≈1.15×1018字節(jié))[52]。當(dāng)這些龐大數(shù)據(jù)信息存儲在大腸桿菌基因組DNA(5.44×106bp)時,卻只占用不到1 cm3的空間。電子顯微觀察發(fā)現(xiàn),約200 bp的DNA分子被壓縮在直徑為10 nm的核小體結(jié)構(gòu)中。一個核小體的尺寸及其包含的遺傳信息量已經(jīng)優(yōu)于一個晶體管電路所具有的信息存儲能力。DNA在細(xì)胞內(nèi)還可進(jìn)一步纏繞形成染色體,最終完成近8400倍的壓縮。這意味著如果能成功利用DNA來存儲數(shù)據(jù),那么當(dāng)前的海量信息可包裝在一個0.00352 m3盒子里,約1 kg DNA即可滿足2040年世界的存儲需求(3×1024位)[51]。第三,DNA可通過聚合酶鏈?zhǔn)椒磻?yīng)(PCR)方便快速且高保真地復(fù)制,這使得大規(guī)模數(shù)據(jù)備份變得簡單[53]。同時,日益成熟的全基因合成及測序技術(shù)為大片段DNA的數(shù)據(jù)寫入和讀取提供了保障[52,54]。
DNA數(shù)據(jù)存儲的基本過程包括:(1)編碼——將數(shù)字信息編碼為DNA序列;(2)合成——將序列寫入實際的DNA分子;(3)存儲——將合成的DNA片段保存在載體或細(xì)胞中;(4)訪問——檢索和選擇性讀取序列信息;(5)解碼——將測定的序列信息轉(zhuǎn)換回數(shù)字信息(圖4)[55]。
信息寫入需通過計算機算法將二進(jìn)制代碼映射為DNA序列。由于保真度的要求及合成技術(shù)的限制,DNA序列不能無限延長,因此信息常被存儲于多個DNA片段。即每段DNA序列都被加入一些冗余信息,用于檢索和排序以確保信息的正確讀取。盡管額外的冗余有助于提高信息讀取的準(zhǔn)確性,但同時也占用了空間,采用適當(dāng)?shù)木幋a方案和糾錯策略可以平衡讀取準(zhǔn)確性和數(shù)據(jù)冗余度之間的沖突[56]。在設(shè)計編碼方案時要充分考慮堿基比率的均一性,從而避免特殊序列(如GC%過高或包含大量重復(fù)片段)對擴增效率及測序準(zhǔn)確率的干擾[57-58]。此外,目前的DNA合成和測序技術(shù)仍難以保證100%的準(zhǔn)確率,所以糾錯策略必不可少[59]。最直接的糾錯方法就是添加冗余信息,用于提高在數(shù)據(jù)丟失或錯誤情況下仍能檢索到原始信息的概率。冗余越多,存儲結(jié)果對錯誤的容忍度越高。例如,Blawat等[60]使用前向糾錯方案實現(xiàn)對DNA中22 MB數(shù)字?jǐn)?shù)據(jù)的存儲和無錯誤檢索。Erlich等[58]報道了一種魯棒性很強的“DNA噴泉碼”的存儲策略,該策略在DNA寡核苷酸中存儲了2.14×106字節(jié)的內(nèi)容,并能夠從相當(dāng)于Illumina測序儀的一個測序覆蓋率中完美地檢索到信息。迄今為止,若干課題組建立了多種糾錯方法以適應(yīng)不同存儲情況[52,61-62]。除了編碼過程有嚴(yán)格要求,隨機訪問能力也是DNA數(shù)據(jù)存儲面臨的一項重大挑戰(zhàn)。從計算機科學(xué)的角度來看,預(yù)計存儲的數(shù)據(jù)將具有隨機訪問權(quán)限。缺乏隨機訪問會阻礙數(shù)據(jù)容量的擴大,當(dāng)檢索少量數(shù)據(jù)時,對整個數(shù)據(jù)集進(jìn)行排序和解碼是不切實際的[56]。目前比較流行的訪問DNA數(shù)據(jù)的方法是磁珠提取和PCR擴增。Baum[63]基于分子探針原理,展示了如何利用磁珠調(diào)取已做好標(biāo)識符的數(shù)據(jù)項?;赑CR的隨機訪問由于使用數(shù)據(jù)片段對應(yīng)的唯一引物,因而具有較高特異性[64]。Organick等[65]研究發(fā)現(xiàn),當(dāng)樣本池的規(guī)模達(dá)到TB級(1012字節(jié)),PCR方法仍可準(zhǔn)確調(diào)取所需數(shù)據(jù),但該規(guī)模不足以滿足未來分子數(shù)據(jù)存儲的要求。由于被調(diào)取的DNA片段需經(jīng)測序解碼來得到原始信息,所以測序能力直接影響該存儲方式的發(fā)展。目前使用最廣泛的是Illumina公司開發(fā)的DNA測序平臺。該平臺基于合成測序和圖像分析的概念,以熒光斑點顏色指示序列中的各個堿基,精確的光學(xué)捕獲裝置和圖像處理技術(shù)有助于提高測序通量[66-67]。另一是牛津納米孔技術(shù)公司(ONT)商業(yè)化的納米孔測序技術(shù),可在捕獲DNA后使其通過一個電壓箝位的納米級孔隙,不同堿基將導(dǎo)致孔隙電流出現(xiàn)相對應(yīng)的微小波動,從而實時讀取序列數(shù)據(jù)[68]。
圖4 DNA數(shù)據(jù)存儲流程圖Fig.4 Flowsheet of digital information storage in DNA
DNA數(shù)據(jù)存儲方興未艾,未來面臨諸多挑戰(zhàn)。首先,當(dāng)前DNA存儲的寫入吞吐量約為每秒千字節(jié)級別,與主流云存檔存儲系統(tǒng)的每秒億字節(jié)讀寫能力仍有數(shù)量級差距。其次,DNA分子的物理保存方式也需斟酌[69-70]。體內(nèi)和體外存儲各有其優(yōu)勢:在備份成本方面,雖然體內(nèi)存儲比體外寡核苷酸文庫的合成更復(fù)雜,但細(xì)胞自主的DNA合成和糾錯更具成本優(yōu)勢;在長期儲存方面,體內(nèi)條件下的DNA降解度慢于體外,因此更適合長期保存數(shù)據(jù)[71]。隨著DNA合成技術(shù)精度的不斷提高,體外合成比體內(nèi)復(fù)制過程中由突變造成的誤差更低。目前仍缺乏時間讀取短且空間占用小的存儲方法,DNA數(shù)據(jù)的讀取過程仍耗時長。未來新一代合成、測序及檢索技術(shù)將為DNA數(shù)據(jù)存儲帶來質(zhì)的飛躍。
半導(dǎo)體合成生物學(xué)利用材料科學(xué)的工具和方法去發(fā)展和調(diào)控生物系統(tǒng),同時基于合成生物學(xué)思路開發(fā)新材料。生物學(xué)、材料學(xué)、電子學(xué)和計算機科學(xué)等多學(xué)科交叉可促進(jìn)生物學(xué)與半導(dǎo)體技術(shù)的日益融合,衍生出具有重要價值的研究課題。
(1)半導(dǎo)體材料能高效吸收轉(zhuǎn)化光能、磁能、化學(xué)能,活細(xì)胞則將能量用于自身代謝并合成高附加值產(chǎn)品。用于生物催化的半導(dǎo)體-細(xì)胞雜合體系是目前研究熱點[72]。本課題組致力于工業(yè)微生物的遺傳改造和調(diào)控,其中包括將還原性三羧酸循環(huán)及C4模塊導(dǎo)入大腸桿菌,使其固定CO2而生產(chǎn)化學(xué)品。對于大腸桿菌等非光合細(xì)菌,該途徑提供的還原力及能量不足,而細(xì)胞與半導(dǎo)體材料耦合可彌補該缺陷,從而提高CO2利用率。材料與細(xì)胞表面的接觸對細(xì)胞間原有信號傳遞、生物被膜等造成干擾。如何減輕或平衡能量傳輸對細(xì)胞的負(fù)荷和不良刺激,加速能量傳遞,是發(fā)展半導(dǎo)體生物催化的關(guān)鍵。此外,經(jīng)半導(dǎo)體材料傳輸?shù)哪芰吭谶M(jìn)入細(xì)胞后會遵循胞內(nèi)能量代謝方式,缺乏可控性。未來,利用合成生物學(xué)手段開發(fā)胞內(nèi)多模塊間正交能量分配或許是新突破。
(2)半導(dǎo)體器件可放大信號、具有一定容錯性且響應(yīng)速度快,適于調(diào)控復(fù)雜生物系統(tǒng)[44-45];而活細(xì)胞具有精密的基因表達(dá)及代謝能力,能夠執(zhí)行無機材料無法完成的工作。二者結(jié)合將同時打破材料及生物系統(tǒng)等領(lǐng)域的技術(shù)瓶頸。例如,通過課題組之間的協(xié)作,以極端微生物為底盤細(xì)胞,將其與多重納米材料相結(jié)合,以便監(jiān)測與修復(fù)環(huán)境。其中的工程細(xì)胞可感知環(huán)境中污染物的濃度,而半導(dǎo)體材料傳感器則負(fù)責(zé)信息的反饋;之后,信息集成模塊根據(jù)污染物的種類,通過不同信號輸入激活工程菌中相應(yīng)的污染物降解途徑,從而實現(xiàn)“自感知-自反饋-多樣化處理”的目標(biāo)。目前,生物傳感器的應(yīng)用已經(jīng)從基礎(chǔ)的物質(zhì)檢測擴展到了復(fù)雜的生物醫(yī)療。然而,相對于半導(dǎo)體響應(yīng)元件,人們對活細(xì)胞功能的開發(fā)程度還較低。今后,將外部傳感信號與胞內(nèi)如群體感應(yīng)(quorum sensing)等自主交流方式相耦合,同時結(jié)合人工智能手段賦予細(xì)胞“感應(yīng)-分析-指令-行動”等能力,有望使生物傳感技術(shù)邁向新臺階。
(3)DNA數(shù)據(jù)存儲是未來信息存儲的發(fā)展趨勢,其優(yōu)點在于存儲密度大、易保存且受外界條件影響小。然而,DNA合成成本高以及讀取速度慢等缺點仍是挑戰(zhàn)。盡管如此,現(xiàn)有物種DNA圖譜復(fù)雜多樣,包含信息量巨大,若將DNA存儲的編碼算法與之耦合即可將生物基因組作為天然存儲單元,節(jié)約合成成本。此外,新一代測序技術(shù)助力DNA的精確和快速讀取。
未來半導(dǎo)體合成生物學(xué)仍將遵循“設(shè)計-構(gòu)建-測試-學(xué)習(xí)”(design-build-test-learn)的閉環(huán)思路,在細(xì)胞、組織和系統(tǒng)各個水平不斷發(fā)展和優(yōu)化生物-非生物雜合體系并拓展其應(yīng)用。