俞志超,姜舟婷
(中國計(jì)量大學(xué) 理學(xué)院,浙江 杭州 310018)
蛋白質(zhì)作為一種聚電解質(zhì),由多種不同的氨基酸構(gòu)成,表現(xiàn)出不同的結(jié)構(gòu)多樣性。由于蛋白質(zhì)的生物學(xué)功能在很大程度上取決于其獨(dú)特的結(jié)構(gòu),該結(jié)構(gòu)由殘基之間復(fù)雜的相互作用決定。相互作用包括靜電相互作用、親疏水相互作用、范德華相互作用、吸附-電中和作用與吸附-架橋機(jī)理等[1-5],因此蛋白質(zhì)鏈結(jié)構(gòu)導(dǎo)致的多種機(jī)械和熱力學(xué)性質(zhì),甚至生物功能,引起了科學(xué)家的廣泛興趣。聚合物鏈結(jié)構(gòu)的形成,如聚合物結(jié)晶、蛋白質(zhì)折疊、嵌段共聚物的自組裝,最近已成為化學(xué)、物理、生物學(xué)和材料科學(xué)領(lǐng)域關(guān)注的焦點(diǎn)[6-9]。
根據(jù)安芬森的變性和復(fù)性實(shí)驗(yàn)已知,蛋白質(zhì)的三維構(gòu)象直接由其一級(jí)結(jié)構(gòu)(氨基酸序列)決定[10]。帶電氨基酸殘基-殘基接觸過程中產(chǎn)生的靜電相互作用在蛋白質(zhì)結(jié)構(gòu)轉(zhuǎn)變過程中起著至關(guān)重要的作用,對(duì)蛋白質(zhì)及其復(fù)合物的形成至關(guān)重要。2020年Dahal等[11]采用粗?;肿觿?dòng)力學(xué)方法研究過氧化氫酶吸附帶電表面的行為,實(shí)驗(yàn)發(fā)現(xiàn)蛋白質(zhì)的吸附行為由表面和非均勻分布的蛋白質(zhì)殘基之間的局部靜電相互作用決定,且隨著表面吸附蛋白質(zhì)的增加,其結(jié)構(gòu)會(huì)因?yàn)榈鞍踪|(zhì)殘基之間的靜電排斥作用而改變。2020年Adesina等[12]通過使用腈探針(T46C-CN)插入大腸桿菌DHFR(EcDHFR)、其構(gòu)象受損變體(EcDHFR-S148P)和嗜熱脂肪土桿菌DHFR(BsDHFR)的二氫葉酸還原酶(DHFRs)反應(yīng)中心附近,實(shí)驗(yàn)發(fā)現(xiàn)當(dāng)輔因子與酶結(jié)合時(shí),底物向探針投射的電場抵消了輔因子施加的電場,這表明控制具有靜電性質(zhì)的配體-配體相互作用可能是創(chuàng)造高效酶的關(guān)鍵因素。2016年Tsai等[13]在基于AWSEM模型模擬靜電作用對(duì)13個(gè)單體蛋白質(zhì)和4個(gè)二聚體結(jié)構(gòu)的影響并對(duì)其進(jìn)行結(jié)構(gòu)預(yù)測。模擬結(jié)果表明,對(duì)于單體蛋白質(zhì),除非蛋白質(zhì)具有特殊的帶電氨基酸分布,如核糖體蛋白S6,否則靜電相互作用的添加不會(huì)顯著提高結(jié)構(gòu)預(yù)測的質(zhì)量。靜電作用在二聚體的結(jié)合過程中發(fā)揮著更重要的作用,提供了電荷與電荷之間的穩(wěn)定性,如蛋白質(zhì)復(fù)合物KIX-pKID的結(jié)合在很大程度上由靜電作用輔助。
基于原子水平的計(jì)算機(jī)模擬方法對(duì)蛋白質(zhì)相互作用方式進(jìn)行研究,已被越來越多的科學(xué)家所采納。但是隨著研究體系的不斷增大,常規(guī)的全原子模型遇到了瓶頸,比如計(jì)算一個(gè)原子數(shù)為N的體系,其計(jì)算量為NlogN,隨著體系原子數(shù)的增加,其動(dòng)力學(xué)行為會(huì)更復(fù)雜,構(gòu)象空間也會(huì)大大增加,這就要求分子動(dòng)力學(xué)模擬要持續(xù)足夠多的時(shí)間來保證體系構(gòu)象空間的采樣。為了解決上述問題,近些年來人們提出了粗?;P?即將較多的自由度整合到較少的自由度從而簡化對(duì)體系的描述[14-15]。雖然粗?;P筒荒芙o出蛋白質(zhì)折疊過程中所有的原子細(xì)節(jié),但能在更長的時(shí)間尺度執(zhí)行計(jì)算,這是了解整個(gè)相互作用過程的動(dòng)力學(xué)行為和熱力學(xué)特征并挖掘潛在物理機(jī)制的關(guān)鍵。
LAMMPS作為一款開源性軟件,隨著近些年各領(lǐng)域的研究者對(duì)其算法進(jìn)行更新迭代,使其功能不斷完善,如2018年Edorh等[16]基于多重網(wǎng)格算法對(duì)P3M模型進(jìn)行更新,能夠高效計(jì)算自適應(yīng)約束系統(tǒng)中粒子的靜電勢。由于LAMMPS極易擴(kuò)展的特點(diǎn),研究者可根據(jù)自身需求構(gòu)建模型,設(shè)置外界條件,對(duì)于粗粒化模型的分析十分方便,如2021年Ford等[17]對(duì)粘蛋白(MUC5B)進(jìn)行粗?;M,通過LAMMPS探索在1.5~5 mg/mL質(zhì)量濃度下MUC5B結(jié)構(gòu)域之間疏水和靜電相互作用強(qiáng)度。實(shí)驗(yàn)發(fā)現(xiàn),隨著粘蛋白濃度的升高,其相互作用強(qiáng)度越大;粘蛋白濃度和化學(xué)相互作用強(qiáng)度都在粘液中發(fā)現(xiàn)的結(jié)構(gòu)形態(tài)和流變性方面發(fā)揮作用。
利用計(jì)算機(jī)模擬各種勢能場中的蛋白質(zhì)結(jié)構(gòu)和性質(zhì),可以在一些領(lǐng)域獲得與實(shí)驗(yàn)相同的結(jié)果從而驗(yàn)證實(shí)驗(yàn)的準(zhǔn)確性[18-19],也可以根據(jù)物理化學(xué)性質(zhì)構(gòu)造蛋白質(zhì)鏈,研究其結(jié)構(gòu)轉(zhuǎn)變的影響因素,為蛋白質(zhì)結(jié)構(gòu)預(yù)測、蛋白質(zhì)功能改造等方面提供理論支持。本文利用LAMMPS軟件對(duì)蛋白質(zhì)鏈進(jìn)行粗粒化建模,利用分子動(dòng)力學(xué)模擬由不同帶電量及連續(xù)帶電氨基酸的數(shù)目組成的蛋白質(zhì)鏈的結(jié)構(gòu)特征,分析二者對(duì)蛋白質(zhì)體系的能量和結(jié)構(gòu)并找出內(nèi)在聯(lián)系。
對(duì)于聚合物科學(xué)中的許多問題,詳細(xì)描述聚合物的化學(xué)結(jié)構(gòu)和參數(shù)會(huì)使模擬的主要特征淹沒在無窮的細(xì)節(jié)之中,浪費(fèi)有限的計(jì)算資源,但是模型過于簡化又會(huì)使模擬結(jié)果無法反映體系的主要特征。我們采用非格點(diǎn)(珠鏈)模型,保留基本大分子的特征,如鏈分子的連接性、非鍵合相互作用,同時(shí)考慮氨基酸殘基的屬性,對(duì)蛋白質(zhì)鏈進(jìn)行構(gòu)建[20-21],用簡化的氨基酸殘基組合來表示蛋白質(zhì)的序列,從而簡化蛋白質(zhì)能量的計(jì)算。
本文所有的分子動(dòng)力學(xué)模擬均采用全原子Dreiding力場[22]進(jìn)行,構(gòu)造的模型鏈由200個(gè)氨基酸構(gòu)成,模擬盒子大小為20 nm×20 nm×20 nm,并采用周期性邊界條件。模擬期間非鍵相互作用的截?cái)喟霃綖? nm,模擬溫度為300 K,模擬時(shí)間步長為2.5 fs,每隔5 ps輸出一次坐標(biāo)。
蛋白質(zhì)體系能量由鍵能和非鍵能構(gòu)成,其中鍵能包括鍵伸縮能、鍵角彎曲能、鍵扭轉(zhuǎn)能,非鍵能包括靜電能、范德華能。
本文通過改變蛋白質(zhì)鏈上單個(gè)氨基酸的帶電量q(0~1C)和帶相同極性電荷氨基酸的連續(xù)數(shù)目M(5、10、20、25、50),來研究單鏈的行為。為了使模擬體系整體呈電中性,蛋白質(zhì)單鏈上帶有相反電荷的氨基酸數(shù)目相同,且正負(fù)極性的帶電量之和相等。M為10的蛋白質(zhì)鏈初始構(gòu)型如圖1,10個(gè)連續(xù)的紅色珠子表示10個(gè)連續(xù)帶正電的氨基酸,10個(gè)連續(xù)的藍(lán)色珠子表示10個(gè)連續(xù)帶負(fù)電的氨基酸。在總長為200的蛋白質(zhì)鏈上,紅色珠子與藍(lán)色珠子數(shù)目相同,說明蛋白質(zhì)鏈上氨基酸帶電量之和為0,體系呈電中性。
圖1 帶相同極性電荷氨基酸的連續(xù)數(shù)目M=10的蛋白質(zhì)鏈初始構(gòu)型圖Figure 1 Initial configuration diagram of protein chains with continuous number M=10 of amino acids with the same polar charge
我們用一個(gè)珠子代表一個(gè)氨基酸,使用5個(gè)勢函數(shù)來構(gòu)建模型蛋白質(zhì)鏈[23-24],其中鍵能包括鍵伸縮能、鍵彎曲能和鍵扭轉(zhuǎn)能,非鍵能包括范德華能和靜電能。它們的表達(dá)式如下。
1)相鄰珠子的鍵伸縮能:
(1)
其中,l0為平衡鍵長,大小為0.153 nm,li為相鄰珠子i-1和i之間的鍵長。鍵伸縮能常數(shù)kd=2.929×105kJ/(nm2·mol)。
2)每三個(gè)相鄰珠子的鍵彎曲能:
(2)
其中,平衡鍵角θ0=1.231 rad和θi是3個(gè)相鄰珠子i-2、i-1和i之間的鍵角。鍵彎曲勢能常數(shù)kθ=418.4 kJ/(rad2·mol)。
3)每4個(gè)相鄰珠子的鍵扭轉(zhuǎn)能:
(3)
其中,φi是由4個(gè)連續(xù)的珠子i-3、i-2、i-1和i沿著主線組成的兩個(gè)平面的二面角。鍵扭轉(zhuǎn)能常數(shù)kφ=8.368 kJ/mol。
4)范德華能通過截?cái)嗟?2-6LJ勢作用于所有兩個(gè)以上鍵的珠子組合:
(4)
其中rij是珠子i和珠子j間的距離。范德華相互作用參數(shù)值分別為ε=0.830 1 kJ/mol,σ=0.362 4 nm。
5)兩個(gè)帶電珠子的靜電能:
(5)
其中rij是珠子i和珠子j之間的距離。C是一個(gè)能量轉(zhuǎn)換常數(shù),ε是介電常數(shù),qi和qj是這兩個(gè)珠子上的電荷,在本文中作為模擬體系的變量。
蛋白質(zhì)的結(jié)構(gòu)特征是我們討論的重點(diǎn),主要根據(jù)體系的回轉(zhuǎn)半徑(Rg)和其可視化結(jié)構(gòu)圖分析蛋白質(zhì)鏈隨氨基酸帶電荷情況的變化趨勢。
結(jié)構(gòu)參量回轉(zhuǎn)半徑(radius of gyration,Rg)描述蛋白質(zhì)分子的整體尺寸,標(biāo)志著蛋白質(zhì)分子的疏松程度?;剞D(zhuǎn)半徑值越大說明體系越松散。回轉(zhuǎn)半徑Rg的定義為
(6)
其中N是體系中蛋白質(zhì)原子的數(shù)量,r(i)和rcenter分別是第i原子的坐標(biāo)和質(zhì)心的坐標(biāo)。
圖2給出了蛋白質(zhì)鏈的范德華能(a)、靜電能(b)、鍵能(c)和總勢能(d)隨連續(xù)帶同極性電荷的氨基酸數(shù)目M的變化趨勢,其中鍵能是鍵伸縮能、鍵彎曲能和鍵扭轉(zhuǎn)能之和。在圖2(a)中,當(dāng)單個(gè)氨基酸帶電量q小于等于0.2C時(shí),體系的范德華能處于負(fù)值,其隨M的增加變化并不明顯,范德華能隨著氨基酸帶電量的影響也較小;當(dāng)q大于0.2C時(shí),范德華能為正,并隨M的增加而
圖2 由帶電量為q的氨基酸組成的蛋白質(zhì)鏈的不同能量隨連續(xù)相同電荷氨基酸數(shù)目M的變化趨勢圖Figure 2 Different energy of the protein constructed by the residues with charge q and the number of sequentially changed residues M
上升的趨勢變得顯著,尤其當(dāng)M值小于25時(shí)更為明顯,同時(shí),范德華能隨單個(gè)氨基酸帶電量的增加而增加,即上升趨勢與單個(gè)氨基酸帶電量q的大小呈正相關(guān)。當(dāng)?shù)鞍踪|(zhì)鏈上帶相同極性電荷氨基酸的連續(xù)數(shù)目M大于25時(shí),體系范德華能變化趨勢逐漸緩慢。圖2(b)中,靜電能隨單個(gè)氨基酸的帶電量q及連續(xù)相同電荷氨基酸數(shù)目M的變化情況,與范德華能的趨勢都相反,即體系的靜電勢能隨M的增加而呈下降趨勢,并且這種趨勢在相同極性電荷氨基酸的連續(xù)數(shù)目M小于25時(shí),變化明顯。但當(dāng)?shù)鞍踪|(zhì)鏈上M值大于25時(shí),體系靜電勢能變化趨勢逐漸緩慢,同時(shí),靜電能隨單個(gè)氨基酸帶電量的增加而減少,帶電量越大,變化越顯著。在圖2(c)給出了蛋白質(zhì)鏈體系的總的鍵能,其變化趨勢和圖2(a)相同,但是從能量變化范圍來看,圖2(a)在1 600 kJ/mol,而圖2(c)的鍵能變化范圍僅為圖2(a)的1/4左右。說明體系鍵能與一級(jí)結(jié)構(gòu)的氨基酸總數(shù)密切相關(guān),但是受氨基酸的種類和分布的影響較小,而范德華能與氨基酸空間分布有關(guān)。當(dāng)然,受參數(shù)影響最大的是靜電能,體系靜電勢能的絕對(duì)值要遠(yuǎn)遠(yuǎn)大于鍵能和范德華能,因此,蛋白質(zhì)體系的總能量的變化趨勢圖2(d)與圖2(b)即靜電能隨M和q值的變化趨勢一致,即體系主要受靜電相互作用的影響。
本文研究了在單個(gè)氨基酸帶電荷相同的情況下連續(xù)帶電荷的氨基酸數(shù)目對(duì)蛋白質(zhì)鏈結(jié)構(gòu)的影響,通過研究蛋白質(zhì)鏈的回轉(zhuǎn)半徑判斷蛋白質(zhì)鏈結(jié)構(gòu)的松散程度,如圖3。圖3(a)中可以看出,在單個(gè)氨基酸帶電量q為0.05C的情況下,鏈的回轉(zhuǎn)半徑大小在0.792~0.945 nm范圍內(nèi),且無論M值為多大,其回轉(zhuǎn)半徑波動(dòng)范圍均在0.05 nm左右。圖中M為50的情況下,回轉(zhuǎn)半徑曲線穩(wěn)定在0.8 nm左右,其余情況下的回轉(zhuǎn)半徑曲線穩(wěn)定在0.85 nm左右。這說明當(dāng)鏈上連續(xù)帶同極性電荷氨基酸數(shù)目越多時(shí),蛋白質(zhì)鏈結(jié)構(gòu)越緊密。圖3(b)中可以看出,在單個(gè)氨基酸帶電量q為0.4C的情況下,M為5、10的回轉(zhuǎn)半徑相較于q為0.05C的情況均有不同幅度的上升,而M為20、25和50的回轉(zhuǎn)半徑卻有下降,且曲線的波動(dòng)幅度從0.05 nm降至0.02 nm,這說明單個(gè)氨基酸帶電量增大時(shí),蛋白質(zhì)鏈上受靜電作用影響的片段越長,更容易使整條鏈結(jié)構(gòu)變得穩(wěn)定而緊密。圖3(c)為單個(gè)氨基酸帶電量q為0.8C時(shí)回轉(zhuǎn)半徑隨時(shí)間的變化,Rg的大小與M值呈負(fù)相關(guān)。和圖3(a)和3(b)相比,M為5時(shí)回轉(zhuǎn)半徑隨氨基酸帶電量q的增大,其上升趨勢更為明顯,M為10、20、25時(shí)回轉(zhuǎn)半徑隨氨基酸帶電量q的增大略有上升,M為50時(shí)回轉(zhuǎn)半徑隨氨基酸帶電量q的增大有下降趨勢,證實(shí)了圖3(b)所總結(jié)出來的結(jié)論。圖3(d)中可以看出,在單個(gè)氨基酸帶電量q為1C的情況下,M為5的回轉(zhuǎn)半徑相較于q為0.8C的情況有小幅度上升,回轉(zhuǎn)半徑曲線的波動(dòng)幅度從0.1 nm降至0.05 nm,M為10、20、25和50的回轉(zhuǎn)半徑變化較小。這表明,當(dāng)?shù)鞍踪|(zhì)鏈上單個(gè)氨基酸帶電量過大時(shí),靜電相互作用會(huì)使整條蛋白質(zhì)鏈上帶異種電荷的氨基酸牢牢吸附在一起,形成固定結(jié)構(gòu)。
圖3 蛋白質(zhì)鏈在不同單個(gè)氨基酸帶電量下回轉(zhuǎn)半徑隨模擬時(shí)間的演化圖Figure 3 Time evolution of radius of gyration on the protein constructed by residues with different charge
圖4為氨基酸帶4種電量情況下,蛋白質(zhì)回轉(zhuǎn)半徑平均值與連續(xù)帶電荷的氨基酸數(shù)目M的關(guān)系圖。當(dāng)M為5時(shí),回轉(zhuǎn)半徑值與帶電荷量q呈正相關(guān),即,蛋白質(zhì)的回轉(zhuǎn)半徑隨著氨基酸帶電荷的增加而增加。隨著M增大,不同q值下的回轉(zhuǎn)半徑均值逐漸趨同,當(dāng)M不低于25時(shí),q值對(duì)回轉(zhuǎn)半徑影響較小。結(jié)合圖3和圖4得出結(jié)論:第一,在氨基酸帶電量較小的情況下,蛋白質(zhì)鏈的回轉(zhuǎn)半徑隨連續(xù)帶電荷的氨基酸數(shù)目變化的區(qū)分度不明顯,隨著氨基酸帶電量的增大,在連續(xù)帶電荷的氨基酸數(shù)目不同的情況下,蛋白質(zhì)鏈的回轉(zhuǎn)半徑區(qū)分度增強(qiáng);第二,隨著連續(xù)帶電荷的氨基酸數(shù)目的增大,不同蛋白質(zhì)鏈回轉(zhuǎn)半徑差距越小。
圖4 蛋白質(zhì)鏈的回轉(zhuǎn)半徑與相同電荷氨基酸數(shù)目M的變化趨勢圖Figure 4 Radius of gyration of the protein constructed by the residues with charge q versus the number of sequentially changed residues M
圖5給出在不同條件下構(gòu)造的蛋白質(zhì)鏈的典型構(gòu)型圖。其中,圖5(a)(b)(c)分別給出了連續(xù)帶電荷氨基酸數(shù)目M為5的情況下,單個(gè)氨基酸帶電荷量q為0.05C、0.4C、1C三個(gè)條件下的蛋白質(zhì)鏈的可視化結(jié)構(gòu)圖。在此條件下圖5(a)(b)(c)的回轉(zhuǎn)半徑均值分別為0.86、1.07、1.74 nm,從數(shù)據(jù)上來看,回轉(zhuǎn)半徑均值隨著q值增大而增大,說明蛋白質(zhì)鏈的體系結(jié)構(gòu)隨著單個(gè)氨基酸帶電荷量的增大變得越來越松散。我們從結(jié)構(gòu)圖中看出,圖5(a)組成單個(gè)螺旋的珠子(氨基酸)數(shù)目在15~20之間,圖5(b)中組成單個(gè)螺旋的珠子數(shù)目在10~15之間,圖5(c)無螺旋結(jié)構(gòu),說明M為5的情況下蛋白質(zhì)鏈隨著帶電荷量的增大逐漸從團(tuán)簇狀逐漸向長城狀轉(zhuǎn)變。圖5(d)(e)(f)分別給出了連續(xù)帶電氨基酸數(shù)目M為25的情況下,單個(gè)氨基酸帶電荷量q為0.05C、0.4C、1C三個(gè)條件下的蛋白質(zhì)鏈可視化結(jié)構(gòu)圖。在此條件下圖5(d)(e)(f)的回轉(zhuǎn)半徑均值分別為0.84、0.79、0.76 nm,從數(shù)據(jù)上來看,回轉(zhuǎn)半徑均值隨著氨基酸帶電荷量q增大20倍的情況下仍然變化不大,說明M為25的情況下蛋白質(zhì)鏈的體系結(jié)構(gòu)受電荷量影響較小。從可視化結(jié)構(gòu)圖來看,圖5(d)組成單個(gè)螺旋的珠子數(shù)目在50左右,圖5(e)組成單個(gè)螺旋的珠子數(shù)目在15~20之間,圖5(f)組成單個(gè)螺旋的珠子數(shù)目在10~15之間,說明M為25的情況下電荷量對(duì)蛋白質(zhì)鏈的松散程度影響較小,但是組成蛋白質(zhì)單個(gè)螺旋的氨基酸數(shù)目在減少。
圖5 蛋白質(zhì)鏈在不同M和q情況下的典型結(jié)構(gòu)圖Figure 5 Typical structural diagrams of protein chains under different M and q conditions
本文對(duì)一個(gè)含有200個(gè)氨基酸的蛋白質(zhì)鏈進(jìn)行粗粒化分子動(dòng)力學(xué)模擬,通過研究體系能量和回轉(zhuǎn)半徑,對(duì)模擬結(jié)果得出以下結(jié)論:1)無論是改變鏈上連續(xù)帶同極性電荷的氨基酸數(shù)還是改變單個(gè)氨基酸帶電量,體系的范德華能與靜電勢能總是呈相反的變化趨勢??倓菽艿淖兓厔莺挽o電勢能的變化趨勢相同,且靜電勢能絕對(duì)值遠(yuǎn)遠(yuǎn)大于鍵能和范德華能,所以體系非鍵相互作用的主導(dǎo)作用為靜電相互作用;2)當(dāng)體系中單個(gè)帶電氨基酸帶電量大于0.2C時(shí),蛋白質(zhì)鏈的回轉(zhuǎn)半徑隨著同極性氨基酸的連續(xù)數(shù)目的減小而增大;3)蛋白質(zhì)鏈的回轉(zhuǎn)半徑隨著氨基酸帶電荷量的增大而增大,且同極性氨基酸連續(xù)數(shù)量越小,回轉(zhuǎn)半徑隨帶電荷量的變化關(guān)系越明顯。這些結(jié)論說明,蛋白質(zhì)的三維結(jié)構(gòu)主要是由沿蛋白質(zhì)鏈相距較遠(yuǎn)但在空間上相互閉合的非鍵相互作用引起的,其中靜電相互作用發(fā)揮了極大優(yōu)勢,這為理解蛋白質(zhì)在不同靜電相互作用下的結(jié)構(gòu)特征及轉(zhuǎn)變行為提供了理論依據(jù),并為蛋白質(zhì)結(jié)構(gòu)預(yù)測提供了思路。