石嘉懌 梁富強(qiáng) 張 太 張 冉
(南京財(cái)經(jīng)大學(xué)食品科學(xué)與工程學(xué)院,南京 210023)
植物蛋白酶抑制劑(protease inhibitor, PI)是一類廣泛存在于植物貯藏器官中具有蛋白酶抑制活性的小分子多肽或蛋白質(zhì),通過與蛋白酶的活性部位和變構(gòu)部位結(jié)合,從而抑制其催化活性或阻止其轉(zhuǎn)化為有活性的酶[1]。PI能夠抑制侵染植物的病原菌、微生物及昆蟲中的蛋白酶,是其自然脅迫防御體系的組成部分[2]。稻米半胱氨酸蛋白酶抑制劑(Oryzacystatin, OC)是一類重要的植物PI,目前已鑒定出的編碼水稻OC的基因有12種[3]。
植物蛋白是人們膳食中蛋白質(zhì)的重要來源之一。蛋白質(zhì)經(jīng)酶解后能夠釋放出具有抗氧化、抗炎、抗血栓等生物功能的多種小分子肽,對(duì)人體健康具有重要的促進(jìn)作用被稱為生物活性肽。作為自然界中廣泛存在的蛋白質(zhì),植物PI含量可高達(dá)總蛋白的10%,是除貯藏蛋白外一類重要的蛋白質(zhì)。近年來很多研究發(fā)現(xiàn)PI及其酶解產(chǎn)物具有抗癌[4]、降糖[5]、抗氧化[6]和增強(qiáng)免疫[7]等多種生物活性,提示植物PI也是生物活性肽的重要來源。早在1995年日本學(xué)者就發(fā)現(xiàn)稻米OC蛋白(OC 1和OC 2)在體內(nèi)體外均具抑制人類皰疹病毒的作用,認(rèn)為OC是稻米中一類重要的功能活性物質(zhì)[8]。
傳統(tǒng)的對(duì)于蛋白來源生物活性肽的研究主要基于蛋白質(zhì)酶解產(chǎn)物的分離純化鑒定和活性評(píng)價(jià),不僅耗時(shí)費(fèi)力,還很可能導(dǎo)致活性高但含量少的生物活性肽的丟失。近年來生物信息學(xué)的發(fā)展打破了傳統(tǒng)研究的局限,正逐漸被廣泛用于生物活性肽的研究[9]。運(yùn)用計(jì)算機(jī)輔助酶解技術(shù)結(jié)合生物信息學(xué)分析方法能夠模擬給定條件下蛋白質(zhì)酶解過程,預(yù)測(cè)產(chǎn)生的大量肽段,從而快速和高效的從中發(fā)現(xiàn)和預(yù)測(cè)結(jié)構(gòu)新穎的具有較高生物活性的功能肽段;并且能夠避免傳統(tǒng)分離純化過程中潛在的高生物活性肽段的損失和丟失。Udenigwe[10]的研究提示稻米OC 1和OC 2蛋白經(jīng)胃蛋白酶或嗜熱菌蛋白酶虛擬水解后是生物活性肽的潛在來源。然而,對(duì)于稻米OC蛋白經(jīng)模擬胃腸道消化后的生物活性肽缺乏相關(guān)研究。因此,本研究采用一系列生物信息學(xué)方法,從稻米OC虛擬模擬胃腸道消化產(chǎn)物中篩選生物活性肽,為稻米OC作為膳食生物活性肽的來源提供參考。
從UniProtKB蛋白質(zhì)數(shù)據(jù)庫中下載稻米OC蛋白的氨基酸序列(包括OC 1~12,共12條)、牛乳β-酪蛋白、大豆球蛋白和稻米谷蛋白的蛋白質(zhì)序列,見表1。利用Biopep數(shù)據(jù)庫中“Profiles of potential biological activity”模塊對(duì)稻米OC蛋白序列進(jìn)行分析,以β-酪蛋白、大豆球蛋白和稻米谷蛋白序列為對(duì)照序列,根據(jù)公式(1)統(tǒng)計(jì)分析蛋白質(zhì)序列中生物活性肽的發(fā)生頻率A,評(píng)估稻米OC 1~12蛋白作為生物活性肽來源的潛力。在Biopep數(shù)據(jù)庫“enzyme action”模塊,聯(lián)合使用胃蛋白酶(pH 1.3)(EC 3.4.23.1)、胰蛋白酶(EC 3.4.21.4)和糜蛋白酶(EC 3.4.21.2)3種消化酶進(jìn)行計(jì)算機(jī)輔助模擬胃腸道消化酶解。依據(jù)公式2計(jì)算生物活性肽的釋放頻率AE。
A=a/N
(1)
式中:a為蛋白質(zhì)序列中具有給定活性的片段數(shù);N為蛋白質(zhì)中氨基酸數(shù)量。
AE=d/N
(2)
式中:d為選定的酶的作用下從蛋白質(zhì)序列中釋放出具有給定活性的肽的數(shù)量;N為蛋白質(zhì)中氨基酸數(shù)量。
表1 用于生物信息學(xué)分析的稻米OC 1-12蛋白、β-酪蛋白和稻米谷蛋白序列
PeptideRanker(http://bioware.ucd.ie/~compass/biowareweb/Serverpages/Peptideranker.php)程序評(píng)價(jià)篩選的肽段具有生物活性的潛力。在網(wǎng)站中輸入肽段的氨基酸序列可以得到一個(gè)介于0~1的評(píng)分,得分越高表示成為生物活性肽的可能性越大。將虛擬酶解產(chǎn)生的活性肽片段進(jìn)行生物活性預(yù)測(cè),選擇得分高于0.5的生物活性肽[11]。
對(duì)于篩選得到的具有較高可能性的生物活性肽序列,通過與數(shù)據(jù)庫BIOPEP和AHTPDB(http://crdd.osdd.net/raghava/ahtpdb/)中已經(jīng)被收錄的ACE和DPP-IV抑制肽進(jìn)行對(duì)比確定其新穎性,選擇很少被報(bào)道的活性肽進(jìn)行一步研究。
使用在線工具Innovagen(http://www.innovagen.com/proteomics-tools)預(yù)測(cè)篩選到的潛在生物活性肽的水溶性。利用admetSAR(http://lmmd.ecust.edu.cn/admetsar1/predict/)和ToxinPred(http://crdd.osdd.net/raghava//toxinpred/)預(yù)測(cè)活性肽的吸收(adsorptin)、分布(distribution)、代謝(metabolism)、排泄(excretion)和毒性(toxicity)(ADMET)性質(zhì)。結(jié)果主要以人體胃腸道吸收(Human Intestinal Absorption, HIA)、血腦屏障穿透(Blood-Brain Barrier Penetration, BBB)和毒性為指標(biāo)。
利用sybyl-X2.0軟件構(gòu)建篩選的生物活性肽的3D結(jié)構(gòu),并進(jìn)行能量最小化。從蛋白質(zhì)數(shù)據(jù)庫Protein Data Bank(PDB)(http://www.rcsb.org/)下載目的蛋白ACE(PDB ID:1O8A)和DPP-IV(1NU6)的3D結(jié)構(gòu)。在sybyl中對(duì)小分子配體和蛋白受體進(jìn)行準(zhǔn)備,利用分子對(duì)接模塊在Surflex-Dock模式下分別進(jìn)行生物活性肽與ACE和DPP-IV的半柔性對(duì)接,每個(gè)分子生成的構(gòu)像數(shù)目設(shè)置為10。根據(jù)分子對(duì)接得到的數(shù)據(jù),獲得生物活性肽與目的蛋白相互作用的打分函數(shù),以Total_Score為標(biāo)準(zhǔn)對(duì)潛在生物活性肽進(jìn)行篩選,并分析活性肽分子與目的蛋白的結(jié)合位點(diǎn)[12]。
目前為止,BIOPEP數(shù)據(jù)庫中共收錄了51種功能活性肽,對(duì)稻米OC蛋白序列的分析表明,蛋白質(zhì)序列中的活性肽序列共能夠表現(xiàn)出17種,與牛乳β-酪蛋白、大豆球蛋白和稻米谷蛋白中具有的生物活性肽種類接近(如圖1所示)。其中,血管緊張素轉(zhuǎn)換酶(angiotensin Ⅰ-converting enzyme, ACE, EC 3.4.15.1)抑制活性(1)、抗氧化活性(5)、二肽基肽酶-3(dipeptidyl peptidase-Ⅲ)(9)和二肽基肽酶-4(dipeptidyl peptidase-IV, DPP-IV, EC 3.14.21.5)抑制活性(10)、腎素抑制活性(14)及促進(jìn)葡萄糖攝取活性(15)等是稻米OC蛋白中所有的活性肽序列均具有的生物活性。生物活性肽發(fā)生頻率(A)是指蛋白質(zhì)序列中具有生物活性的肽段序列的片段數(shù)與蛋白質(zhì)序列中氨基酸總數(shù)目的比值,是評(píng)估蛋白質(zhì)作為生物活性肽來源的重要指標(biāo)。比較12條稻米OC蛋白生物活性肽發(fā)生的總頻率A可知,OC 10(∑A=1.573 6)具有最高值,其次是OC 1(∑A=1.570 2)和OC 4(∑A=1.544 8),OC 6的最低(∑A=1.105 3)(表1)。約占牛乳總蛋白的80%的酪蛋白及植物貯藏蛋白大豆球蛋白和稻米谷蛋白均是日常膳食中動(dòng)物和植物蛋白的主要來源,也是生物活性肽的重要來源,它們的蛋白質(zhì)序列常被用來作為對(duì)照序列[13]。結(jié)果顯示雖然12條稻米OC蛋白序列的A值均小于牛奶β-酪蛋白(∑A=2.028 7),但是,除OC 6和OC 7外均高于大豆球蛋白(∑A=1.262 2);且除OC6、OC7和OC11外,稻米OC蛋白序列的生物活性肽發(fā)生頻率均高于大米貯藏蛋白谷蛋白(∑A=1.357 5)(表2)。這些結(jié)果表明稻米OC蛋白中能夠產(chǎn)生的生物活性肽不僅種類接近,且發(fā)生頻率高于大豆和稻米貯藏蛋白,提示稻米蛋白酶抑制劑OC蛋白是生物活性肽的優(yōu)良來源。
在不同種類生物活性肽發(fā)生頻率中,具有ACE和DPP-4抑制活性的生物活性肽的發(fā)生頻率均較高,A1和A2值分別介于0.364 6~0.582 1和0.505 3~0.750 0范圍內(nèi)(表2)。其中ACE抑制活性生物活性肽發(fā)生頻率最高的為OC 4,而DPP-IV抑制活性肽發(fā)生頻率最高的為OC 8。ACE是機(jī)體內(nèi)調(diào)節(jié)血壓的關(guān)鍵酶,是開發(fā)高血壓防治藥物的靶標(biāo),因此,具有ACE抑制作用的活性肽在高血壓的控制中具有重要作用[14]。DPP-IV能夠降解促進(jìn)胰島素分泌的胰高血糖素樣肽,因此,生物活性肽抑制DPP-IV可以促進(jìn)胰島素分泌,從而降低和控制餐后血糖水平,對(duì)糖尿病的防治具有重要意義[15]。與化學(xué)合成藥物相比,近年來食物來源的生物活性肽由于具有更好的生物相容性、毒副作用小及易透過血腦屏障等特點(diǎn)受到了廣泛關(guān)注,食源肽的分離純化和生物活性研究已成為了近年來研究的熱點(diǎn)。目前,從牛乳[9,16]、大豆[17]、稻米[18]及其副產(chǎn)物米糠[19]中已經(jīng)篩選鑒定出了多種具有ACE和DPP-IV抑制作用的生物活性肽,并且其降血壓和降血糖作用在體外和體內(nèi)實(shí)驗(yàn)中已經(jīng)得到了證實(shí)。研究分析表明多種稻米OC蛋白的ACE抑制肽(OC 4、10、5、8、1、2和12)和DPP-IV抑制肽(OC 8、9、10、11和5)的發(fā)生頻率A1和A2高于大豆球蛋白和稻米谷蛋白。因此,可以推測(cè)稻米OC蛋白可能也是稻米中ACE和DPP-IV抑制肽的優(yōu)質(zhì)來源,其酶解產(chǎn)生的生物活性肽對(duì)于高血壓和糖尿病的預(yù)防和治療具有重要作用。
注:1~17依次表示ACE抑制肽(1)、泛素介導(dǎo)性蛋白酶解激活肽(2)、α-葡萄糖苷酶抑制肽(3)、抗遺忘肽(4)、抗氧化肽(5)、抗血栓肽(6)、細(xì)菌滲透性配體肽(7)、鈣調(diào)素依賴性磷酸二酯酶抑制肽(8)、二肽基肽酶-III抑制肽(9)、二肽基肽酶-IV抑制肽(10)、羥甲基戊二酰輔酶A還原酶抑制肽(11)、降血脂活性肽(12)、調(diào)節(jié)肽(13)、腎素抑制肽(14)、葡萄糖攝取促進(jìn)肽(15)、免疫刺激肽(16)和抑制肽(17)。圖1 蛋白質(zhì)序列中各種類生物活性肽的發(fā)生頻率
表2 稻米OC蛋白序列中總的生物活性肽和ACE及DPP-IV生物活性肽發(fā)生頻率
作為人體重要的宏量營養(yǎng)物質(zhì),蛋白質(zhì)主要是以小肽的形式被吸收利用,且生物活性肽在其母體蛋白質(zhì)序列中并不能發(fā)揮生物活性,經(jīng)酶解釋放出來后才能產(chǎn)生相應(yīng)的效應(yīng)[20]。因此,酶解是制備生物活性肽的主要方法之一。而與其他酶相比,利用人體消化酶直接進(jìn)行體外模擬消化制備的生物活性肽在體內(nèi)具有更好的耐受性,近年來被更為廣泛的采用[21]。因此,研究選擇胃蛋白酶、胰蛋白酶和糜蛋白酶作為共同消化酶對(duì)稻米OC蛋白進(jìn)行計(jì)算機(jī)輔助模擬胃腸道消化,以產(chǎn)生并篩選能夠耐受胃腸道消化的肽段[22]。釋放頻率(AE)是指酶解后蛋白質(zhì)序列中水解出的生物活性肽數(shù)目與蛋白質(zhì)中特定活性的生物活性肽數(shù)目的比值,與上述蛋白質(zhì)的生物活性肽發(fā)生頻率A一致,酶解產(chǎn)生的活性肽主要是ACE和DPP-IV抑制肽。通過虛擬胃腸道消化酶解并與數(shù)據(jù)庫對(duì)比發(fā)現(xiàn),酶解產(chǎn)生的已知生物活性的肽大多數(shù)是二肽,其中OC 10的ACE和DPP-IV抑制肽釋放頻率均較高,提示其是稻米OC蛋白中生物活性肽的較好來源。而對(duì)比每條OC蛋白的DPP-IV和ACE抑制肽釋放頻率可以推測(cè)稻米OC可能是DPP-IV抑制肽的更好來源。一般認(rèn)為由2~6個(gè)氨基酸組成的肽段可能具有更合理的分子量、吸收代謝性質(zhì)及體內(nèi)發(fā)揮生物活性的可能性[23]。因此,選擇未知生物活性的2~6肽進(jìn)行下一步的虛擬篩選。
表3 稻米OC蛋白經(jīng)虛擬模擬胃腸道消化酶解后ACE和DPP-IV抑制肽的釋放頻率和肽序列
除了已知生物活性的肽段,酶解時(shí)也會(huì)產(chǎn)生很多具有未知生物活性的肽段。PeptideRanker得出活性評(píng)分表征的是給定的肽序列具有生物活性的可能性,得分越接近于1表示其成為生物活性肽的可能性越高,是篩選新穎生物活性肽的一種有效方法[24]。分子對(duì)接是研究多肽作為配體與靶蛋白受體相互作用的有力手段,目前已被廣泛用于生物活性肽的發(fā)現(xiàn)和篩選,結(jié)果中總的打分Total_Score函數(shù)是以負(fù)對(duì)數(shù)為單位模擬結(jié)合能力,得分越高表示配體與受體的結(jié)合更穩(wěn)定[25]。因此,研究根據(jù)PeptideRanker的活性評(píng)分>0.5,結(jié)合打分函數(shù)Total_Score,共篩選得到19種由2~6個(gè)氨基酸組成的肽段(表4)。
表4 潛在生物活性肽活性分?jǐn)?shù)和性質(zhì)
只有通過胃腸道吸收并透過生理屏障后活性肽才能在機(jī)體內(nèi)發(fā)揮功能活性從而促進(jìn)人體健康,因此,水溶性和ADMET性質(zhì)是影響其生物活性肽活性發(fā)揮的重要因素[26]。Yu等[22]基于水溶性和ADMET性質(zhì)并結(jié)合分子對(duì)接的方法從虹鱒中最終篩選出了3種新的ACE抑制肽(EGF、HGR和VDF)。admetSAR程序被用來預(yù)測(cè)活性肽的ADMET性質(zhì),其中HIA和BBB分別代表活性肽小分子通過胃腸道吸收和透過血腦屏障的難易程度[27]。樊玥[28]通過admetSAR預(yù)測(cè)活性肽的ADEMT性質(zhì)虛擬篩選得到高活性的ACE抑制三肽序列。因此,研究根據(jù)活性評(píng)分和分子對(duì)接得分,并結(jié)合水溶性、HIA和BBB結(jié)果,最終選擇水溶性良好、吸收好、無毒且具有潛在高活性的TDW和AGR作為ACE和DPP-IV抑制肽進(jìn)行深入研究。并與BioPEP和AHTPDB數(shù)據(jù)中已收錄的活性肽序列進(jìn)行比對(duì),確定活性肽序列的新穎性。
與蛋白酶活性部位的關(guān)鍵氨基酸結(jié)合并產(chǎn)生相互作用是生物活性肽發(fā)揮蛋白酶抑制活性的前提[29],因此研究采用分子對(duì)接深入探究具有較高Total_Score得分的2種潛在生物活性肽TDW和AGR與ACE和DPP-IV的作用模式和結(jié)合機(jī)理。ACE是一種含鋅離子的二肽羧基酶,其活性中心由3個(gè)疏水腔組成,腔中有鋅離子,目前的研究表明三肽對(duì)ACE的抑制作用主要是由氫鍵相互作用及配體與活性部位Zn離子的相互作用主導(dǎo)的[30,31]。TDW和AGR與ACE的分子對(duì)接結(jié)果如圖2a和圖2b所示,結(jié)果表明二者均能嵌入ACE的活性口袋中,與ACE活性中心的Ala356、Glu384、Glu411、His383、His387、Tyr523和Glu162等關(guān)鍵氨基酸作用發(fā)生多個(gè)氫鍵作用,并均能與Zn(701)活性中心發(fā)生配位作用。此外,AGR還能與ACE的His353形成3個(gè)arene-cation相互作用,使其在ACE的活性部位空腔中更為穩(wěn)定的結(jié)合(圖2b)。
圖2 TDW和AGR與ACE的結(jié)合位點(diǎn)及相互作用
DPP-IV是一個(gè)由2個(gè)同源亞單位組成的以二聚體形式存在的高特異性絲氨酸蛋白酶,大量研究證實(shí)與其活性中心的關(guān)鍵氨基酸位點(diǎn)形成相互作用的小分子化合物能夠抑制其催化活性,是潛在的DPP-IV抑制劑,對(duì)于糖尿病的預(yù)防和治療具有重要意義[32]。TDW與DPP-IV的相互作用如圖3a所示,TDW與DPP-IV活性部位的Glu205、His126、Ser209和Tyr547關(guān)鍵氨基酸形成4個(gè)氫鍵作用。此外,TDW還能與Tyr662形成π-π堆積作用而受到芳香性π環(huán)之間的相互吸引,從而使其在DPP-IV的活性部位更穩(wěn)定的結(jié)合。而AGR主要與Glu205、Glu206、Tyr662、Ser209和Val207等關(guān)鍵氨基酸殘基發(fā)生多個(gè)氫鍵相互作用,還能與Tyr666形成cation-arene鍵(圖3b)。因此,二者均具有潛在的DPP-IV抑制活性。
圖3 TDW和AGR與DPP-IV的結(jié)合位點(diǎn)及相互作用
本研究建立了一種從稻米OC蛋白中高效的虛擬篩選生物活性肽的方法。研究表明與儲(chǔ)藏蛋白大豆球蛋白和稻米谷蛋白相似,稻米OC蛋白也是生物活性肽的潛在來源,其中以ACE和DPP-IV抑制作用的生物活性肽為主,是稻米中除貯藏蛋白外一類重要的生物活性肽來源。分子對(duì)接研究表明虛擬篩選得到了2種三肽TDW和AGR具有較高的Total_Score打分值,且均能與靶蛋白活性部位的關(guān)鍵氨基酸殘基形成氫鍵、π-π堆積、配位鍵等多種分子間相互作用,是潛在的具有ACE和DPP-IV抑制活性的生物活性肽,對(duì)糖尿和高血壓的預(yù)防和治療具有重要意義。