編譯 莫莊非
過去20年間,基因組學(xué)在生物醫(yī)學(xué)研究和醫(yī)療保健方面發(fā)揮了越發(fā)重要的作用。基因組數(shù)據(jù)已被用于高級診斷,也能幫助決策者制定關(guān)于患者分層及篩查的新策略,還可作為確定新靶點(diǎn)和開發(fā)個性化療法的依據(jù)。共享基因組數(shù)據(jù)的意愿,以及維護(hù)這一共享原則的地方和全球倡議,在迄今取得的成功中發(fā)揮了至關(guān)重要的作用。在COVID-19大流行早期階段,我們快速共享基因組數(shù)據(jù),進(jìn)而在創(chuàng)紀(jì)錄的最短用時(shí)內(nèi)開發(fā)出疫苗和療法——這就是一個成功范例。
基因組數(shù)據(jù)不僅日益凸顯重要性,其體量也以驚人速度增長。在21世紀(jì)之初,僅有兩個人的基因組被測序。到2020年,據(jù)估計(jì)全球?qū)⒂谐^3 000萬人可訪問自己的基因組數(shù)據(jù),每年產(chǎn)生的新數(shù)據(jù)量達(dá)到20億~400億字節(jié)。不過即便如此,要真正將基因組研究成果轉(zhuǎn)化為可廣泛應(yīng)用的療法,還需克服一些困難,因?yàn)榭捎玫幕蚪M數(shù)據(jù)大多來自歐洲血統(tǒng)人群,尚未覆蓋全球大多數(shù)人口。鑒于可用數(shù)據(jù)量巨大,研究界和監(jiān)管機(jī)構(gòu)面臨著平衡雙重需求的難題,即允許研究人員訪問數(shù)據(jù),同時(shí)保護(hù)研究參與者和患者的隱私——這絕非尋常挑戰(zhàn)。
調(diào)查數(shù)據(jù)確實(shí)表明,對個人隱私的重視和對潛在數(shù)據(jù)濫用的擔(dān)憂,是影響公眾參與基因組研究的主要障礙之一。這些擔(dān)憂嚴(yán)重阻礙社區(qū)參與研究,進(jìn)而影響了所收集數(shù)據(jù)的多樣性,也傷害了全球基因組研究的利益。對數(shù)據(jù)安全的擔(dān)憂并非沒有根據(jù),泄露基因組隱私數(shù)據(jù)可能會暴露敏感信息,并可能引起醫(yī)療保險(xiǎn)損失、歧視和污名化等一系列問題,或損害家庭關(guān)系。另一個擔(dān)憂是,數(shù)據(jù)如果未受到恰當(dāng)保護(hù),最終可能會被用于違背參與者最初意愿的應(yīng)用程序。
已有一些技術(shù)手段可用于規(guī)避重新識別問題,包括數(shù)據(jù)匿名化、去識別化和數(shù)據(jù)聚合??杉幢闳绱?,仍很難實(shí)現(xiàn)真正的數(shù)據(jù)匿名。在一項(xiàng)概念驗(yàn)證研究中,工作人員分析個體層面的數(shù)據(jù),根據(jù)來自參與者Y染色體上的短串聯(lián)重復(fù)序列推斷其姓氏,重識別其身份。他們還發(fā)現(xiàn)來自全基因組關(guān)聯(lián)研究的匯總統(tǒng)計(jì)數(shù)據(jù)并非完全不受隱私泄露問題的影響。如果某人參與了全基因組關(guān)聯(lián)研究,分入潛在敏感的特定組別,此事件是有可能被技術(shù)人員分析推斷出來的。
盡管以上案例比較罕見,但有理由相信基因數(shù)據(jù)隱私問題只會變得更復(fù)雜。我們都與親屬共享我們的一部分基因,越多人進(jìn)行DNA測序——無論是作為研究的一部分還是直接面向消費(fèi)者的商業(yè)服務(wù)——重新識別的風(fēng)險(xiǎn)就越高。更大規(guī)模的可用基因組數(shù)據(jù),再加上越發(fā)強(qiáng)大的人工智能應(yīng)用,可能令現(xiàn)有的隱私保護(hù)愈加脆弱,引發(fā)新的社會問題。眼下被認(rèn)為“安全”的東西未來可能就不安全了。
另一方面,隨著計(jì)算方法變得更加復(fù)雜,我們有望利用新興技術(shù)提出更周全的基因組數(shù)據(jù)保護(hù)的方法。最近提出的解決方案來自信息學(xué)和經(jīng)濟(jì)學(xué)領(lǐng)域,包括諸如同態(tài)加密的加密方法,同態(tài)加密技術(shù)支持在無需解密基因組數(shù)據(jù)的情況下對統(tǒng)計(jì)數(shù)據(jù)做計(jì)算。其他解決方案包括數(shù)據(jù)訪問控制——例如,英國國家醫(yī)療服務(wù)體系(NHS)不久前宣布,他們正在過渡到“可信賴研究環(huán)境”模式,全世界的可信賴研究人員能在臨時(shí)虛擬環(huán)境中訪問和處理數(shù)據(jù),而無需下載數(shù)據(jù)。類似的概念已被全球基因組學(xué)與健康聯(lián)盟(GA4GH)采用。
基因組研究的不斷發(fā)展,也對監(jiān)管和審查機(jī)構(gòu)的工作——審批與監(jiān)督那些收集并使用遺傳信息的研究——提出了新的挑戰(zhàn)。在大多數(shù)國家,有權(quán)批準(zhǔn)此類研究的審查機(jī)構(gòu),例如機(jī)構(gòu)審查委員會或研究倫理委員會,往往是多學(xué)科交叉的綜合性團(tuán)體,負(fù)責(zé)對科研項(xiàng)目做倫理監(jiān)督。不過這些團(tuán)體通常不會強(qiáng)制要求納入數(shù)據(jù)安全等方面的特定專業(yè)意見。
在大型基因組聯(lián)盟中,負(fù)責(zé)數(shù)據(jù)保護(hù)的團(tuán)隊(duì)越來越多,專職數(shù)據(jù)訪問工作的獨(dú)立委員會也越發(fā)完善。不過最近的報(bào)告顯示,機(jī)構(gòu)審查委員會仍欠缺大數(shù)據(jù)處理方面的專業(yè)知識,這些專業(yè)包括計(jì)算科學(xué)、人工智能、數(shù)據(jù)倫理和隱私等。缺乏專業(yè)知識會帶來兩方面問題:一方面,它可能導(dǎo)致忽視數(shù)據(jù)保護(hù)方面的潛在威脅和漏洞;另一方面,缺少專家建議可能意味著不合理的整改要求,甚至導(dǎo)致項(xiàng)目無法獲批。這兩種情況都將阻礙科學(xué)進(jìn)步。
基因組數(shù)據(jù)在促進(jìn)人類健康方面的潛力巨大,但只有每個人都感覺安全,它才可發(fā)揮作用。因此,現(xiàn)在正是這個領(lǐng)域的從業(yè)者開始思考數(shù)據(jù)共享和保護(hù)問題的時(shí)候——如何以最佳方式處理基因組研究的大數(shù)據(jù),保證數(shù)據(jù)的安全和隱私。解決問題的關(guān)鍵在于吸納不同領(lǐng)域?qū)<业膶I(yè)意見及建議,這些專家可能來自信息、倫理和法律等專業(yè)。此外,讓患者和公眾參與其中討論也非常重要。
資料來源 Nature