趙仲麟,劉小花,白海鑫,頓文濤,袁 超
(河南農(nóng)業(yè)大學,河南 鄭州 450002)
化學生物學是化學與生物科學融合產(chǎn)生的新興學科,其發(fā)展可以更好地解決人類疾病和健康等熱點問題。當前,國家將生命科技的發(fā)展列為重點研究計劃,這不僅是基礎科學發(fā)展的需要,也是我國占領世界科研陣地所必須加強的方向。面對科技飛速發(fā)展的今天,廣大高校教師在本科和研究生教學中面對著新的挑戰(zhàn),需要使用新的技術方法,特別是利用信息技術、大數(shù)據(jù)資源整合等方式將課堂內(nèi)容更好地展現(xiàn)給學生,而不是一味重復書本上老舊的知識內(nèi)容。
化學生物學教學內(nèi)容中涉及大量的化合物及其對蛋白質(zhì)結(jié)構(gòu)和功能的影響[1],ChemBank[2]和DrugBank[3]等數(shù)據(jù)庫都是很好的小分子數(shù)據(jù)庫資源,但是對應的,教師還要向?qū)W生介紹這些小分子對蛋白質(zhì)的作用,就需要對蛋白質(zhì)的3D結(jié)構(gòu)進行分析。河南農(nóng)業(yè)大學探索在化學生物學課程中引入蛋白質(zhì)數(shù)據(jù)庫PDBsum,對蛋白質(zhì)3D結(jié)構(gòu)進行分析,將這部分信息化數(shù)據(jù)資源在教學中展示給學生,增強其動手能力。
PDBsum(http://www.ebi.ac.uk/pdbsum)是一個提供蛋白質(zhì)三維結(jié)構(gòu)的圖形數(shù)據(jù)庫,其中包括大量蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)[4]。該網(wǎng)站主要描繪的是蛋白質(zhì)、DNA和配體的結(jié)構(gòu)特征,以及它們之間的相互作用。在教學中向?qū)W生介紹該網(wǎng)站的最新功能,包括對人類蛋白質(zhì)序列及其天然氨基酸變體的注釋、顯示相關蛋白質(zhì)結(jié)構(gòu)域結(jié)構(gòu)之間關系的動態(tài)圖、不同實驗測定同一蛋白質(zhì)的配體結(jié)合分析、蛋白質(zhì)隧道分析和新的搜索選項等內(nèi)容。如新冠病毒的一些蛋白質(zhì)結(jié)構(gòu)在網(wǎng)站中都可以查詢到(如圖1所示)。
首先,學生需要定義目標蛋白質(zhì),然后從PDBsum中輸入目標蛋白質(zhì)的信息,這些信息可以是蛋白質(zhì)的PDB code,也可以是蛋白質(zhì)的名稱、功能、序列等相關信息,如圖1A所示。點擊search后出現(xiàn)蛋白質(zhì)信息列表,從中學生可以選擇自己所檢索的蛋白質(zhì)。選擇對應的ID后,網(wǎng)頁會展現(xiàn)出目標蛋白的具體信息,如圖1B所示,包括蛋白質(zhì)的ID、名稱、來源、發(fā)現(xiàn)者、日期、參考文獻以及蛋白質(zhì)結(jié)構(gòu)的詳細參數(shù)。其中,還包括蛋白結(jié)構(gòu)域的相關信息,如圖1C所示,同時PDBsum還提供其他蛋白分析網(wǎng)站的鏈接,如圖1D所示。
圖1 PDBsum檢索流程Fig.1 PDBsum retrieval process
網(wǎng)站還可以顯示目標蛋白質(zhì)的3D結(jié)構(gòu),可以進行旋轉(zhuǎn),觀察蛋白質(zhì)各個角度的結(jié)構(gòu),如側(cè)面圖和俯視圖,如圖2 A、2 B所示,以及顯示蛋白質(zhì)結(jié)構(gòu)的立體化學性質(zhì)PROCHECK檢查結(jié)果,如圖2C所示。此外,PDBsum主頁還增加了三個新的搜索類型,包括UniProt登錄號、Pfam域名和Ensembl基因或轉(zhuǎn)錄識別器的搜索。在每種情況下,結(jié)果提供了與搜索項相匹配的結(jié)構(gòu)列表,以及與UniProt序列相比每個結(jié)構(gòu)具有的結(jié)構(gòu)覆蓋率。
圖2 蛋白結(jié)構(gòu)相關信息Fig.2 Protein structure related information
蛋白質(zhì)可以用序列或結(jié)構(gòu)域來描述,相同的結(jié)構(gòu)域在不同的蛋白質(zhì)中以不同的組合出現(xiàn)。PDBsum使用Pfam的序列域定義和結(jié)構(gòu)CATH定義的域。每個PDBsum條目顯示了一個小示意圖,描述了每個蛋白質(zhì)的Pfam和CATH域,還顯示了PDB條目提供的“結(jié)構(gòu)覆蓋率”,即多少蛋白質(zhì)在三維結(jié)構(gòu)中存在。因此,一眼就能看出一個給定的條目是整個蛋白質(zhì)還僅僅是其中一個域。每個Pfam域都能超鏈接到包含該域的所有其他PDB條目的列表。
PDBsum中另一項新的分析功能是,可以顯示給定蛋白質(zhì)結(jié)構(gòu)中所有的“隧道”,它們是穿透蛋白質(zhì)內(nèi)部的開口??梢苑治稣麄€結(jié)構(gòu),并通過每個PDBsum條目頂部的Tunnels選項卡進行訪問。以病毒蛋白6vyo為例,如圖2D所示,首先計算蛋白質(zhì)原子中心的Voronoi圖,然后識別所有空腔,并將其起點和終點鏈接起來。動畫GIF可以旋轉(zhuǎn)表示隧道位置,并提供了MOLEonline 2.0網(wǎng)站的鏈接,以獲得用戶給定隧道更詳細的搜索內(nèi)容。
PDB包含許多對基于結(jié)構(gòu)的藥物設計,這些結(jié)構(gòu)是可能作為藥物靶點的蛋白質(zhì),它們中可能含有與蛋白質(zhì)結(jié)合的已知藥物分子DNA。在最好的情況下,它們顯示出一種藥物與目標相聯(lián)系。PDBsum中的一個分支被稱為drugport,主要用于分析蛋白質(zhì)數(shù)據(jù)庫PDB中的藥物分子和靶點(http://www.ebi.ac.uk/thornton-srv/databases/drugport/)。有關藥物和藥物靶點的信息來自DrugBank數(shù)據(jù)庫。PDB中的藥物分子是通過將DrugBank中的SMILES字符串與wwPDB的化學成分詞典綜合中來識別,藥物靶點通過其UniProt識別器進行識別。
PDBsum是一個提供蛋白質(zhì)數(shù)據(jù)庫條目結(jié)構(gòu)信息的網(wǎng)絡服務器。提供的分析主要基于圖像,包括蛋白質(zhì)二級結(jié)構(gòu)、蛋白質(zhì)配體以及蛋白質(zhì)DNA相互作用和結(jié)構(gòu)質(zhì)量的PROCHECK分析等。三維結(jié)構(gòu)可以在RasMol、PyMOL和一個名為3dmol.js的JavaScript查看器中進行交互查看。教師在化學生物學課程中引入PDBsum操作實例,學生可以上傳自己的PDB文件,并為每個文件獲得一組密碼保護的PDBsum分析。通過引入PDBsum數(shù)據(jù)庫內(nèi)容到化學生物學教學中,通過實例讓學生直觀地進行了蛋白質(zhì)3D結(jié)構(gòu)的檢索和分析過程,親自動手對感興趣的蛋白質(zhì)進行分析,這對開拓學生眼界、擴展知識面非常有益,取得了良好的教學效果。