何高奇, 龔博杰, 陳 誠, 郁明強(qiáng), 盧興見,3, 李洪林
(1.華東理工大學(xué) 計(jì)算機(jī)科學(xué)與工程系,上海 200237; 2.上海市新藥設(shè)計(jì)重點(diǎn)實(shí)驗(yàn)室,上海 200237; 3.上海交通大學(xué) 智慧城市協(xié)同創(chuàng)新中心,上海 200240)
計(jì)算機(jī)輔助藥物設(shè)計(jì)(computer-aided drug design,CADD)利用計(jì)算機(jī)快速存取能力和對海量數(shù)據(jù)的快速分析能力來提高藥物設(shè)計(jì)的效率[1].
藥效團(tuán)虛擬篩選是藥物虛擬篩選最流行的方法之一[2].其中基于受體的藥效團(tuán)虛擬篩選方法存在打分函數(shù)粗略、忽略蛋白質(zhì)柔性等缺點(diǎn)[3],而基于配體的虛擬篩選則優(yōu)化了打分函數(shù)[4].同時,虛擬篩選過程中分子的微觀性和復(fù)雜性給用戶觀察分子結(jié)構(gòu)和數(shù)據(jù)分析帶來了很大的挑戰(zhàn).很多CADD軟件更多的關(guān)注于科學(xué)細(xì)節(jié)而忽略了實(shí)用性[5],所以在軟件交互性和信息傳達(dá)直觀性方面存在不足.
因此,筆者將可穿戴式VR技術(shù)與微觀藥物虛擬篩選技術(shù)有機(jī)結(jié)合,基于Unity3D引擎和HTC Vive設(shè)備,設(shè)計(jì)實(shí)現(xiàn)了“VR+藥效團(tuán)”的虛擬篩選系統(tǒng).該系統(tǒng)主要功能包括:虛擬環(huán)境中分子和藥效團(tuán)的數(shù)據(jù)解析與建模;藥效團(tuán)的可視計(jì)算過程;虛擬環(huán)境下分子和藥效團(tuán)的交互設(shè)計(jì).通過構(gòu)建“VR+藥效團(tuán)”的虛擬篩選系統(tǒng)為藥效團(tuán)的設(shè)計(jì)分析帶來新的視角,增強(qiáng)藥物設(shè)計(jì)者的交互體驗(yàn)[6].
VR技術(shù)與基于配體的藥效團(tuán)虛擬篩選技術(shù)[7]的結(jié)合涉及3個主要方面的工作:基于配體藥效團(tuán)的虛擬篩選、VR技術(shù)應(yīng)用和交互設(shè)備.
基于配體的藥效團(tuán)虛擬篩選技術(shù)通過對活性分子的結(jié)構(gòu)和活性數(shù)據(jù)進(jìn)行發(fā)掘和分析,提取出重要的藥效特征[8],并利用藥效特征發(fā)現(xiàn)新化合物的線索[9].
VR技術(shù)是一種可以創(chuàng)建和體驗(yàn)虛擬世界的計(jì)算機(jī)仿真系統(tǒng).它具有沉浸感、交互性、構(gòu)想性等特點(diǎn),在軍事、教育等宏觀領(lǐng)域得到了廣泛的應(yīng)用[10-11].VR也逐漸應(yīng)用于藥物、生物等微觀領(lǐng)域.通過對分子進(jìn)行三維建模,用戶可以清晰地觀察分子的特性并進(jìn)行實(shí)時交互.
目前流行的VR交互性設(shè)備主要有Oculus Rift、PS VR、HTC Vive等.Oculus Rift、PSVR設(shè)備存在一定延遲、追蹤距離短等問題.HTC Vive設(shè)備的定位器能同時追蹤顯示器和手柄的位置,并且頭戴顯示器使用一塊2 K分辨率屏幕降低了畫面的顆粒感,不會產(chǎn)生延遲和眩暈[11].
根據(jù)上節(jié)的綜合闡述,提出了“VR+藥效團(tuán)”虛擬篩選系統(tǒng),使用基于配體的藥效團(tuán)虛擬篩選技術(shù)路線,并選用HTC Vive作為交互設(shè)備,在VR環(huán)境中解決藥效團(tuán)虛擬篩選過程交互性和可視性不足的問題.系統(tǒng)框架如圖1所示,主要實(shí)現(xiàn)了分子解析與模型構(gòu)建、藥效團(tuán)計(jì)算和VR交互等功能.
圖1 VR+藥效團(tuán)虛擬篩選系統(tǒng)框架Fig.1 VR + pharmacophore virtual screening system framework
模型構(gòu)建功能主要包括:①載入數(shù)據(jù),系統(tǒng)將用戶載入的分子文件作為提問分子;②格式判斷,系統(tǒng)通過文件后綴區(qū)分分子文件和藥效團(tuán)文件;③數(shù)據(jù)解析,系統(tǒng)根據(jù)不同的文件類型,采用不同的數(shù)據(jù)提取方式,并將數(shù)據(jù)記錄在文件中;④模型構(gòu)建,系統(tǒng)根據(jù)數(shù)據(jù)自動構(gòu)建原子模型和化學(xué)鍵模型并初始化模型屬性.
藥效團(tuán)計(jì)算功能主要包括:①載入分子,系統(tǒng)將用戶選定的分子文件讀取到系統(tǒng)中;②生成三維結(jié)構(gòu),系統(tǒng)使用OpenBabel對分子進(jìn)行三維構(gòu)建;③生成構(gòu)象,系統(tǒng)使用多目標(biāo)優(yōu)化算法給三維結(jié)構(gòu)的分子生成構(gòu)象[12];④生成藥效團(tuán),系統(tǒng)對配體分子提取藥效特征及其三維空間結(jié)構(gòu)形成藥效團(tuán);⑤虛擬篩選,系統(tǒng)將藥效團(tuán)模型在數(shù)據(jù)庫中進(jìn)行藥效特征匹配得到篩選結(jié)果.
交互控制功能主要包括:①定位器利用激光和光敏傳感器確定運(yùn)動物體的位置;②控制器通過兩個單手操作手柄來進(jìn)行系統(tǒng)功能的操作;③觸發(fā)手柄,用戶可以通過不同的按鈕進(jìn)行不同的系統(tǒng)操作;④顯示頭盔可以讓用戶觀察虛擬環(huán)境中的分子結(jié)構(gòu)和特性.
配體分子能夠通過自身的化學(xué)特征識別生物大分子的活性位點(diǎn)并進(jìn)行反應(yīng).由于結(jié)構(gòu)和化學(xué)屬性相似的分子具有相似的生物活性.所以系統(tǒng)通過配體的藥效特征來找出數(shù)據(jù)庫中功能相似的化合物或預(yù)測新化合物屬性.主要功能模塊和操作流程如圖2所示.
圖2 基于配體的藥效團(tuán)虛擬篩選流程圖Fig.2 Ligand-based pharmacophorevirtual screening flowchart
用戶新建一個作業(yè)并載入配體分子后,系統(tǒng)使用OpenBabel將分子轉(zhuǎn)化成三維結(jié)構(gòu).然后系統(tǒng)將范德華力、二面角扭轉(zhuǎn)力、幾何結(jié)構(gòu)差異、回轉(zhuǎn)半徑作為4個目標(biāo)函數(shù)對分子生成構(gòu)象.生成構(gòu)象之后,系統(tǒng)使用華東理工大學(xué)劉曉峰老師的構(gòu)象優(yōu)化模型來剔除冗余構(gòu)象[12],具體算法如下.
采用可變能量閾值窗口剔除高能構(gòu)象[12],
Ecutoff=Ew+k×Nrot,
(1)
式中:Ew為能量閾值;Nrot為可旋轉(zhuǎn)鍵數(shù)目;k為尺寸因子.
為了剔除幾何結(jié)構(gòu)相似的冗余構(gòu)象,系統(tǒng)將去除所有均方根偏差(RMSD)小于式(2)閾值的構(gòu)象[12],
(2)
式中:c為用戶定義的尺度因子;Nrot為分子中可旋轉(zhuǎn)鍵的數(shù)目.
完成構(gòu)象優(yōu)化后,系統(tǒng)將對分子構(gòu)象提取藥效特征和空間排列結(jié)構(gòu)形成藥效團(tuán).最后,系統(tǒng)使用球殼匹配、向量特征匹配篩選出具有藥物活性的化合物.
Mol2格式分子文件以塊為存儲單位,兩個@
表1 分子文件數(shù)據(jù)
系統(tǒng)的Atom類對mol2文件中原子信息初始化并存儲.Bond類對解析獲得的化學(xué)鍵信息按照源坐標(biāo)和目標(biāo)坐標(biāo)進(jìn)行存儲.
藥效團(tuán)格式文件和分子格式文件類似,雖然,藥效團(tuán)中的原子都為非標(biāo)準(zhǔn)殘基序列的原子,但藥效團(tuán)文件比分子文件僅多了元素符號一個屬性.因此,藥效團(tuán)格式文件與mol2格式分子文件歸為一類,在初始化時稍作區(qū)分,即可滿足系統(tǒng)需求.
系統(tǒng)通過判別文件格式,采用不同的方法對文件信息進(jìn)行讀取和存儲,數(shù)據(jù)解析流程如圖3所示.
圖3 數(shù)據(jù)解析流程Fig.3 Data analysis process
判斷類別:在mol2格式中,文件信息以塊為單位劃分,每一塊記錄的是一個原子的結(jié)構(gòu)信息.為了便于解析,將藥效團(tuán)轉(zhuǎn)化為pdb格式,該格式以行為單位劃分,每一行都有信息類別標(biāo)記.
正則劃分:系統(tǒng)進(jìn)行數(shù)據(jù)解析時,通過空格正則劃分將分隔的信息一一獲取.
按類存儲:系統(tǒng)將提取的數(shù)據(jù)添加到對應(yīng)類別的列表中存儲.
判斷是否為文件末尾:系統(tǒng)若判斷數(shù)據(jù)是最后一行,則停止數(shù)據(jù)讀取.否則,繼續(xù)讀取數(shù)據(jù).
數(shù)據(jù)解析完成后,系統(tǒng)通過數(shù)據(jù)列表中的數(shù)據(jù)完成原子和鍵模型的繪制工作,模型繪制主要包括以下幾步.
獲取數(shù)據(jù)和模型構(gòu)建:系統(tǒng)根據(jù)數(shù)據(jù)列表里的數(shù)據(jù)繪制原子和鍵模型.
命名規(guī)則:模板采用原子元素種類命名的方法,保證存儲到模板列表中的模板都是唯一的.
查找模板:系統(tǒng)在繪制模型之前先在模板庫中查找是否已存在模板.如果存在,執(zhí)行下一步,否則,新建模板.
設(shè)置信息:根據(jù)表1設(shè)置模型的大小、顏色、形狀等基本信息.
存儲模板:完成原子和鍵模型繪制之后,系統(tǒng)將模型作為模板存入模板列表.
完成模型繪制后,系統(tǒng)得到的是以單個原子和單個化學(xué)鍵為對象的結(jié)構(gòu).為了讓用戶對整個分子操控,系統(tǒng)將模型對象進(jìn)行分組管理.然后,借助Stream VR設(shè)備的控制手柄使用戶能夠?qū)nity3D構(gòu)建的分子進(jìn)行旋轉(zhuǎn)、放縮、控制虛擬篩選的流程[13].
在交互過程中,系統(tǒng)對模型進(jìn)行分組管理和動態(tài)更新,以避免虛擬場景中視圖的延遲,保證手柄控制分子的移動是在模型分組的基礎(chǔ)上對整個分組的坐標(biāo)進(jìn)行變換.
VR+藥效團(tuán)虛擬篩選系統(tǒng)載入分子acheligand.mol2,系統(tǒng)構(gòu)建的三維分子模型如圖4所示.用戶可以通過頭顯觀察到分子的特性并進(jìn)行交互式操作.
圖4 配體分子模型Fig.4 Ligand molecular model
用戶通過HTC Vive的控制手柄觸發(fā)藥效團(tuán)生成操作.轉(zhuǎn)換成pdb格式的藥效團(tuán)自動構(gòu)建的模型如圖5所示.
圖5 轉(zhuǎn)化成pdb格式后的藥效團(tuán)模型Fig.5 Pharmacophore model after conversion to pdb
系統(tǒng)將藥效團(tuán)與包含acheligand.mol2分子的數(shù)據(jù)庫進(jìn)行匹配.篩選的結(jié)果是acheligand.mol2分子本身,如圖6所示.
圖6 篩選結(jié)果分子模型Fig.6 Screening results molecular model
為了測試藥效團(tuán)計(jì)算的可靠性,筆者使用e4ey7.hypoedit作為輸入藥效團(tuán),actives_final.mol2作為篩選數(shù)據(jù)庫.actives_final.mol2分子集文件中共有464個分子.設(shè)置輸出6個匹配結(jié)果,最后輸出打分最高的6個分子,虛擬篩選結(jié)果如表2所示.
表2 虛擬篩選結(jié)果
通過對篩選結(jié)果6個分子中的化學(xué)特征和提問分子中的化學(xué)特征進(jìn)行對比,發(fā)現(xiàn)它們化學(xué)特征相似性符合試驗(yàn)分值.說明筆者基于配體進(jìn)行藥效團(tuán)虛擬篩選的可靠性.
為了驗(yàn)證VR+藥效團(tuán)虛擬篩選系統(tǒng)的可靠性,進(jìn)行了系統(tǒng)體驗(yàn)評測.試驗(yàn)設(shè)計(jì)如下:8位受試同學(xué)分為3組,戴上頭盔設(shè)備,分別進(jìn)行時間長度為1 h、2 h和3 h的操作測試.在測試前和測試后,試驗(yàn)員對參加測試的同學(xué)進(jìn)行了心跳、血壓(舒張血壓)測量,如圖7所示.同時,通過識圖游戲和詢問來查驗(yàn)使用系統(tǒng)后的眩暈情況.通過測試數(shù)據(jù)發(fā)現(xiàn),經(jīng)過長時間操作后,用戶各項(xiàng)生理指標(biāo)均在正常范圍內(nèi),且均未產(chǎn)生眩暈等癥狀.實(shí)踐證明了系統(tǒng)在用戶體驗(yàn)上有著不錯的表現(xiàn).
圖7 測試前后體驗(yàn)者的心跳、血壓數(shù)據(jù)Fig.7 Heartbeat and blood pressure before and after test
將VR技術(shù)和基于配體的藥效團(tuán)虛擬篩選技術(shù)相結(jié)合,設(shè)計(jì)實(shí)現(xiàn)了面向藥物設(shè)計(jì)的虛擬交互體驗(yàn)系統(tǒng).通過對分子文件進(jìn)行解析和建模,解決了虛擬現(xiàn)實(shí)環(huán)境中分子的實(shí)時和真實(shí)感繪制問題;通過集成多目標(biāo)優(yōu)化構(gòu)象生成算法和基于三角哈希查找匹配算法,在VR計(jì)算環(huán)境中實(shí)現(xiàn)并驗(yàn)證了基于配體藥效團(tuán)虛擬篩選技術(shù);利用HTC Vive設(shè)備設(shè)計(jì)了交互控制方法,使得用戶能夠便捷使用“VR+藥效團(tuán)”虛擬篩選系統(tǒng).試驗(yàn)表明所提系統(tǒng)能夠增強(qiáng)用戶在微觀世界探索知識和分析解決問題的體驗(yàn).未來將繼續(xù)對微觀分子領(lǐng)域中虛擬環(huán)境交互手段和人機(jī)交互界面進(jìn)行改進(jìn),進(jìn)一步提升用戶的沉浸感和較長工作時間的用戶體驗(yàn),并在現(xiàn)有可穿戴設(shè)備基礎(chǔ)上,應(yīng)用手勢識別的研究成果進(jìn)行功能完善和優(yōu)化.