林授鍇,傅曉菲,黃 健,陶 歡,徐超群,劉 偉,張麗娜,艾育芳,何華勤*
(1.福建農(nóng)林大學(xué)生命科學(xué)學(xué)院,福建 福州 350002;2.莆田學(xué)院環(huán)境與生物工程學(xué)院/福建省新型污染物生態(tài)毒理效應(yīng)與控制重點(diǎn)實(shí)驗(yàn)室,福建 莆田 351100)
?
植物線粒體和質(zhì)體雙定位蛋白質(zhì)的帶電特性分析
林授鍇1,2,傅曉菲1,黃健1,陶歡1,徐超群1,劉偉1,張麗娜1,艾育芳1,何華勤1*
(1.福建農(nóng)林大學(xué)生命科學(xué)學(xué)院,福建福州350002;2.莆田學(xué)院環(huán)境與生物工程學(xué)院/福建省新型污染物生態(tài)毒理效應(yīng)與控制重點(diǎn)實(shí)驗(yàn)室,福建莆田351100)
蛋白質(zhì)亞細(xì)胞定位分析是揭示蛋白質(zhì)功能的關(guān)鍵步驟。1個(gè)蛋白質(zhì)分子能被定位到2個(gè)亞細(xì)胞位置,這一現(xiàn)象被稱為蛋白質(zhì)的“雙定位”。本研究首先從Uniprot、MitoP2、MGI、TAIR、DBMLoc等蛋白質(zhì)數(shù)據(jù)庫及已發(fā)表文獻(xiàn)中收集雙定位于線粒體與質(zhì)體的植物蛋白質(zhì)數(shù)據(jù),共獲得703個(gè)雙定位蛋白質(zhì),組成測試數(shù)據(jù)集。再從Uniprot數(shù)據(jù)庫中選取唯一定位于線粒體的829個(gè)和唯一定位于質(zhì)體的6 376個(gè)植物蛋白質(zhì),組成參照數(shù)據(jù)集,分析雙定位于線粒體與質(zhì)體的植物蛋白質(zhì)的帶電特征。結(jié)果表明,與單定位于線粒體或質(zhì)體的植物蛋白質(zhì)相比,雙定位線粒體與質(zhì)體的植物蛋白質(zhì)具有更低的凈電荷量;此外,雙定位蛋白質(zhì)電荷分布較為集中對稱,線粒體蛋白質(zhì)次之,質(zhì)體蛋白質(zhì)最為分散。本文研究結(jié)果將為揭示植物蛋白質(zhì)雙定位的分子機(jī)制奠定理論基礎(chǔ)。
植物;雙定位蛋白質(zhì);線粒體;質(zhì)體;帶電特性
細(xì)胞內(nèi)蛋白質(zhì)的定位多種多樣,最常見的是1個(gè)蛋白質(zhì)1個(gè)特定的細(xì)胞器位置,也可能是1個(gè)蛋白質(zhì)有多個(gè)細(xì)胞器位置,或是1個(gè)基因的多個(gè)蛋白質(zhì)產(chǎn)物分別定位到不同的細(xì)胞器位置。換句話說,1個(gè)蛋白質(zhì)分子能定位到多個(gè)亞細(xì)胞位置,這一現(xiàn)象被稱為“雙定位 (Dual target)”[1],能夠雙定位的蛋白質(zhì)稱為雙定位蛋白質(zhì) (Dual targeted proteins)。雙定位減少了蛋白質(zhì)的冗余,而非冗余蛋白質(zhì)的雙定位使細(xì)胞器獲得新的功能。研究人員先后在植物中發(fā)現(xiàn)了許多雙定位蛋白質(zhì)[2-3]。在過去的幾年里不斷發(fā)現(xiàn)單個(gè)基因產(chǎn)物定位到多個(gè)亞細(xì)胞中,但單個(gè)蛋白質(zhì)不同定位的分子機(jī)制還未被完全闡明,蛋白質(zhì)易位機(jī)制的研究尚未深入??傮w而言,植物有4種不同的蛋白質(zhì)易位系統(tǒng),其中大多數(shù)雙定位蛋白質(zhì)是定位到線粒體和葉綠體,主要是通過翻譯后由特異的信號肽轉(zhuǎn)運(yùn)到不同的細(xì)胞器中[4]。這些信號肽是由具有特殊拓?fù)湫畔⒌陌被嵝蛄薪M成的,1個(gè)蛋白質(zhì)是單定位、雙定位還是多定位,與這個(gè)蛋白質(zhì)所結(jié)合的信號肽有關(guān)。蛋白質(zhì)的雙定位機(jī)制是由各種分子事件相互交錯(cuò)而成,蛋白質(zhì)折疊、翻譯后修飾和蛋白質(zhì)互作是雙定位現(xiàn)象的后續(xù)事件[5]。
目前,UniProt[6]、MitoP2[7]、MGI[8]、TAIR[9]、DBMLoc[10]等許多數(shù)據(jù)庫可以提供蛋白質(zhì)雙定位甚至是多定位的信息。而基于這些數(shù)據(jù)庫信息,研究人員也開發(fā)出用于預(yù)測蛋白質(zhì)雙定位的工具,例如ATP[2]、TargetP 1.1[11]、WoLF PSORT[12]、MultiLoc2[13]、Predotar[14]、CELLO[15]、Plant-mPLoc 2.0[16]等,但是只有ATP是專門預(yù)測雙定位蛋白質(zhì)亞細(xì)胞定位的工具,其余工具都是主要針對單個(gè)亞細(xì)胞位置的蛋白質(zhì),因此所得出的預(yù)測性能也是包括單個(gè)亞細(xì)胞定位和雙定位的情況。
當(dāng)前對蛋白質(zhì)雙定位的研究存在3個(gè)方面問題。其一,蛋白質(zhì)雙定位或多定位的信息十分有限,數(shù)據(jù)大多集中在哺乳動物主要細(xì)胞器的雙定位信息,如細(xì)胞核與細(xì)胞質(zhì)、細(xì)胞核與細(xì)胞膜、線粒體與細(xì)胞質(zhì)等,對植物蛋白質(zhì)的雙定位或多定位信息仍較分散;其二,蛋白質(zhì)分選機(jī)制的研究尚待深入,對蛋白質(zhì)雙定位或多定位發(fā)生的機(jī)制仍存在盲區(qū);其三,蛋白質(zhì)雙定位的預(yù)測工具屈指可數(shù),更未見關(guān)于植物蛋白質(zhì)多定位預(yù)測工具的研究報(bào)道。
因此,本研究首先從各種蛋白質(zhì)定位信息數(shù)據(jù)庫中,收集并整理雙定位在線粒體和質(zhì)體的植物蛋白質(zhì)的信息數(shù)據(jù);然后以單定位到線粒體或質(zhì)體的植物蛋白質(zhì)為參照,分析雙定位在線粒體和質(zhì)體的植物蛋白質(zhì)序列的基本特性,為揭示植物蛋白質(zhì)雙定位的分選機(jī)制奠定基礎(chǔ)。
1.1植物雙定位蛋白質(zhì)數(shù)據(jù)庫的構(gòu)建
1.1.1雙定位蛋白質(zhì)數(shù)據(jù)的收集收集整理植物中雙定位蛋白質(zhì)的編碼基因名、序列數(shù)據(jù)、來源的物種名稱、蛋白質(zhì)功能描述等相關(guān)信息。數(shù)據(jù)來源主要包括:(1)從Uniprot、MitoP2、MGI、TAIR、DBMLoc等多個(gè)數(shù)據(jù)庫中查找植物雙定位于線粒體和質(zhì)體的蛋白質(zhì),并根據(jù)蛋白質(zhì)注釋信息,確認(rèn)定位信息經(jīng)試驗(yàn)驗(yàn)證而非預(yù)測。(2)從新近發(fā)表的文獻(xiàn)[17-19]中收集經(jīng)試驗(yàn)方法鑒定到的植物雙定位于線粒體和質(zhì)體的蛋白質(zhì),并在Uniprot中找到相對應(yīng)的蛋白質(zhì)序列記錄。
1.1.2基于GO的亞細(xì)胞注釋蛋白質(zhì)數(shù)據(jù)的GO信息來自文獻(xiàn)數(shù)據(jù)或由GOA[20]中查詢獲得。為了提高GO注釋的準(zhǔn)確性,僅選擇數(shù)據(jù)庫中非歧義蛋白質(zhì)的亞細(xì)胞定位信息。同時(shí),參考特異物種數(shù)據(jù)庫MGI數(shù)據(jù)庫和TAIR數(shù)據(jù)庫,并收集數(shù)據(jù)庫自帶的關(guān)于蛋白質(zhì)定位的GO注釋。
1.2測試數(shù)據(jù)集的收集
上述研究獲得雙定位于質(zhì)體和線粒體的植物蛋白質(zhì),再從Uniprot數(shù)據(jù)庫中收集經(jīng)試驗(yàn)驗(yàn)證的且唯一定位到線粒體或質(zhì)體的植物蛋白質(zhì)數(shù)據(jù),作為對照數(shù)據(jù)集。
1.3雙定位線粒體與質(zhì)體植物蛋白質(zhì)的帶電特性分析
1.3.1蛋白質(zhì)凈電荷信息的獲取利用EMBL-EBI在線工具Pepstats(http://www.ebi.ac.uk/Tools/seqstats/emboss_pepstats/ help/index.html),獲取上述3種定位蛋白質(zhì)數(shù)據(jù)集中蛋白質(zhì)的凈電荷信息,統(tǒng)計(jì)各蛋白質(zhì)的凈電荷。
1.3.2蛋白質(zhì)凈電荷的分布形式蛋白質(zhì)凈電荷的分位數(shù)-分位數(shù)圖(Quantile-Quantile Plot, QQ Plot)可以很直觀地表現(xiàn)數(shù)據(jù)整體的分布情況,幫助鑒別樣本的分布類型。若雙定位蛋白質(zhì)的電荷分布近似于正態(tài)分布,在QQ圖上將近似為一條直線,其中,直線的斜率是標(biāo)準(zhǔn)差σ,截距是均值μ。若QQ圖上的點(diǎn)近似地在一條直線附近,可以認(rèn)為雙定位蛋白質(zhì)的電荷數(shù)據(jù)總體符合正態(tài)分布。
隨后,應(yīng)用Pearson系數(shù)擬合優(yōu)度檢驗(yàn)了雙定位蛋白質(zhì)凈電荷是否服從正態(tài)分布。檢驗(yàn)雙定位蛋白質(zhì)凈電荷正態(tài)分布,當(dāng)某隨機(jī)變量應(yīng)當(dāng)有分布F,現(xiàn)對X進(jìn)行n次觀察,得到一個(gè)樣本X1,X2,…,Xn。對蛋白質(zhì)電荷值進(jìn)行分組測試,計(jì)算原假設(shè)(正態(tài)分布)在各小區(qū)間的理論概率值,先計(jì)算雙定位蛋白質(zhì)的均值(mean)、標(biāo)準(zhǔn)差(sd)與理論概率。根據(jù)不同區(qū)間的劃分,據(jù)此判斷觀測值是否符合理論假設(shè)。
1.3.3蛋白質(zhì)凈電荷的總體分布比較觀察雙定位于質(zhì)體和線粒體的植物蛋白質(zhì)凈電荷的樣本分布是否滿足Mann-Whitney秩和檢驗(yàn)的假定,即總體分布是否連續(xù)。采用Mann-Whitney秩和檢驗(yàn),分析雙定位于質(zhì)體和線粒體的蛋白質(zhì)、單定于質(zhì)體、單定位于線粒體植物蛋白質(zhì)凈電荷總體間的差異。并利用R語言繪制箱線圖,以展示數(shù)據(jù)分布的主要特征。
2.1植物中定位在線粒體和質(zhì)體的雙定位蛋白質(zhì)
從蛋白質(zhì)定位信息數(shù)據(jù)庫和已發(fā)表文獻(xiàn)中提取出植物中雙定位于線粒體和質(zhì)體的蛋白質(zhì)(以下簡稱雙定位蛋白質(zhì))信息(表1)。由表1可見,植物雙定位蛋白質(zhì)共有703條。收集到單定位于質(zhì)體或線粒體的植物蛋白質(zhì),其中單定位于質(zhì)體的植物蛋白質(zhì)有6 376個(gè),單定位于線粒體的829個(gè)。本研究也查找以上3種類型蛋白質(zhì)的轉(zhuǎn)運(yùn)肽信息,其中在雙定位蛋白質(zhì)只查找到17個(gè)轉(zhuǎn)運(yùn)肽,在單定位于線粒體或質(zhì)體的植物蛋白質(zhì)中分別查找到376和686個(gè)轉(zhuǎn)運(yùn)肽。
表1雙定位于質(zhì)體和線粒體、單定位于質(zhì)體或線粒體的植物蛋白質(zhì)及其轉(zhuǎn)運(yùn)肽數(shù)量
Table 1Quantities of dual targeted, mitochondrion, and plastid proteins in plants
由表2可見,在703條植物雙定位于線粒體和質(zhì)體的蛋白質(zhì)中,來自擬南芥的蛋白質(zhì)數(shù)量最多,為669個(gè),占比95.16%;來自水稻的雙定位蛋白質(zhì)共有11個(gè),占比1.56%。其余的來自8個(gè)植物物種,包括擬南芥、水稻、玉米、煙草(3個(gè)種)、橡膠樹、小立碗蘚、陸地棉、草莓。
2.2雙定位蛋白質(zhì)的凈電荷分布
2.2.1雙定位蛋白質(zhì)凈電荷的分布類型為了分析植物雙定位蛋白質(zhì)凈電荷分布的特性。本研究比較雙定位蛋白質(zhì)與線粒體或質(zhì)體蛋白質(zhì)的凈電荷分布情況。先應(yīng)用QQ圖描述蛋白質(zhì)凈電荷的分布,雙定位蛋白質(zhì)、線粒體和質(zhì)體蛋白質(zhì)凈電荷QQ圖(圖1)。
表2不同物種中鑒定的植物雙定位蛋白質(zhì)
Table 2Numbers of identified dual targeted proteins in mitochondrion and plastid in differentplant species
若蛋白質(zhì)凈電荷均勻分布在直線兩側(cè),那么蛋白質(zhì)凈電荷符合正態(tài)分布。由圖1可見,植物雙定位蛋白質(zhì)凈電荷數(shù)據(jù)在電荷為0附近比較接近正態(tài)分布,但頭尾很大一部分偏離直線的(圖1-A)。整體而言,偏離正態(tài)分布的概率分布。而植物線粒體和質(zhì)體蛋白質(zhì)的凈電荷分布基本相似,凈電荷量低的部分符合正態(tài)分布,但凈電荷高的部分偏離較大(圖1-B、C)。表明僅從蛋白質(zhì)的凈電荷數(shù)據(jù)分布的總體情況,難于做出是否符合正態(tài)分布。
下面再用Pearson系數(shù)擬合優(yōu)度檢驗(yàn)雙定位蛋白質(zhì)的凈電荷是否服從正態(tài)分布,在植物雙定位蛋白質(zhì)凈電荷范圍為[-62.0,59.5],取多個(gè)區(qū)間范圍,檢驗(yàn)其分布與標(biāo)準(zhǔn)正態(tài)分布之間的擬合程度。由表3可見,在給定的顯著性水平0.05條件下,P值均小于2.2e-16,表明植物雙定位蛋白質(zhì)凈電荷不服從正態(tài)分布。
2.2.2雙定位蛋白質(zhì)與線粒體和質(zhì)體蛋白質(zhì)凈電荷的總體差異先對植物雙定位蛋白質(zhì)、線粒體蛋白質(zhì)和質(zhì)體蛋白質(zhì)的凈電荷做統(tǒng)計(jì)分析,結(jié)果見表3。由表3可見,植物雙定位蛋白質(zhì)凈電荷、線粒體蛋白質(zhì)凈電荷和質(zhì)體蛋白質(zhì)凈電荷的分布基本滿足Mann-Whitney秩和檢驗(yàn)的假定,即總體分布是連續(xù)的,總體對其中位數(shù)也是對稱的。
表33個(gè)蛋白質(zhì)數(shù)據(jù)集凈電荷的基本統(tǒng)計(jì)數(shù)值
Table 3Basic statistics of electric charges of 3 protein datasets
注:*N代表數(shù)據(jù)集包含的總數(shù),Median代表數(shù)據(jù)集的中位數(shù),Mean代表數(shù)據(jù)集的平均值,Sd代表數(shù)據(jù)集的標(biāo)準(zhǔn)差。
采用Mann-Whitney秩和檢驗(yàn),分析植物雙定位蛋白質(zhì)與植物線粒體和質(zhì)體蛋白質(zhì)凈電荷總體間的差異。根據(jù)蛋白質(zhì)電荷的中位數(shù)是否相等,來判斷2個(gè)樣本分布是否相同。無論采用連續(xù)修正或不采用連續(xù)修正,其P值均小于0.05,表明雙定位蛋白質(zhì)的凈電荷樣本分布不同于植物線粒體蛋白質(zhì)或質(zhì)體蛋白質(zhì)凈電荷的分布。而且植物線粒體和質(zhì)體蛋白質(zhì)凈電荷樣本的差異P值1.98e-05,顯著大于雙定位蛋白質(zhì)與植物線粒體蛋白質(zhì)凈電荷樣本的差異(P<2.2e-16),也大于雙定位蛋白質(zhì)與植物質(zhì)體蛋白質(zhì)凈電荷樣本的差異(P<2.2e-16)。進(jìn)一步證明了植物雙定位蛋白質(zhì)與植物線粒體或質(zhì)體蛋白質(zhì)凈電荷間均存在顯著差異性。
為了進(jìn)一步比較雙定位蛋白質(zhì)與線粒體蛋白質(zhì)、質(zhì)體蛋白質(zhì)凈電荷分布的差異,對3個(gè)數(shù)據(jù)集作連續(xù)修正的左邊Mann-Whitney秩和檢驗(yàn),結(jié)果見表4。由表4可見,雙定位蛋白質(zhì)與線粒體蛋白質(zhì)凈電荷樣本的差異P值<2.2e-16,遠(yuǎn)小于0.05,表明植物線粒體蛋白質(zhì)的凈電荷和質(zhì)體蛋白質(zhì)的凈電荷均高于雙定位蛋白質(zhì)。
利用箱線圖能直觀展示數(shù)據(jù)的分布特征,做3個(gè)數(shù)據(jù)集蛋白質(zhì)凈電荷分布的箱線圖,結(jié)果見圖2。由圖2中可以看出,3個(gè)數(shù)據(jù)集的電荷分布,主要集中在0~20,質(zhì)體蛋白質(zhì)和線粒體蛋白質(zhì)的電荷明顯高于雙定位蛋白質(zhì)。雙定位蛋白質(zhì)電荷分布較為集中對稱,線粒體蛋白質(zhì)次之,質(zhì)體蛋白質(zhì)最為分散。另外,質(zhì)體蛋白質(zhì)還含有較多超出上下四分位數(shù)的異常值,質(zhì)體蛋白質(zhì)和線粒體蛋白質(zhì)電荷的異常值大多是高于上四分位數(shù)。
表4連續(xù)修正的左邊Mann-Whitney秩和檢驗(yàn)
Table 4Left sided Mann-Whitney rank sum test with continuity correction
注:W是Wilcoxon-MannWhitne統(tǒng)計(jì)量。
本研究查找發(fā)現(xiàn),經(jīng)試驗(yàn)驗(yàn)證的植物線粒體和質(zhì)體雙定位蛋白質(zhì)有703個(gè),其中擬南芥的線粒體和質(zhì)體雙定位蛋白質(zhì)就達(dá)到669個(gè)。Carrie等[3]也收集了100多個(gè)經(jīng)試驗(yàn)驗(yàn)證的植物線粒體和質(zhì)體雙定位蛋白質(zhì),發(fā)現(xiàn)大多數(shù)已知的雙定位蛋白質(zhì)為可溶的基質(zhì)蛋白。而僅小部分為膜結(jié)合蛋白質(zhì),且多為外膜蛋白。這些蛋白質(zhì)大多與核苷酸代謝、DNA復(fù)制、重組與修復(fù)、蛋白質(zhì)翻譯等功能相關(guān)。此外,在本研究發(fā)現(xiàn)的703個(gè)雙定位蛋白質(zhì)中僅找到17條轉(zhuǎn)運(yùn)肽信息。轉(zhuǎn)運(yùn)肽是一種12~60個(gè)氨基酸殘基的前導(dǎo)序列,它引導(dǎo)在細(xì)胞溶質(zhì)中合成的蛋白質(zhì)輸入線粒體和質(zhì)體。植物雙定位蛋白質(zhì)的轉(zhuǎn)運(yùn)肽同時(shí)具有線粒體轉(zhuǎn)運(yùn)肽和質(zhì)體轉(zhuǎn)運(yùn)肽的特征,并且常常介于二者之間[21-22]。Mitschke等[2]應(yīng)用這一特性開發(fā)了首個(gè)針對植物雙定位蛋白質(zhì)的預(yù)測工具ATP。當(dāng)然,僅依據(jù)蛋白質(zhì)N端前導(dǎo)序列特征預(yù)測植物線粒體和質(zhì)體雙定位蛋白質(zhì)還存在嚴(yán)重的假陽性,其預(yù)測靈敏度有待提高。因此,研究人員要不斷探究植物蛋白質(zhì)雙定位的分子機(jī)制。
對植物線粒體和質(zhì)體雙定位蛋白質(zhì)的特征分析發(fā)現(xiàn),植物雙定位蛋白質(zhì)的凈電荷顯著性低于線粒體和質(zhì)體蛋白質(zhì)。Dinurmills 等[23]根據(jù)亞細(xì)胞定位篩選和預(yù)測結(jié)果,將線粒體蛋白質(zhì)分為2個(gè)子集,一類是預(yù)測為具有雙定位能力的線粒體蛋白質(zhì)126個(gè),另一類是預(yù)測為只定位在線粒體的蛋白質(zhì)409個(gè)。他們的研究也發(fā)現(xiàn)與只定位在線粒體的蛋白質(zhì)相比,雙定位蛋白質(zhì)的總凈電荷更低。由此可見,凈電荷更低是雙定位蛋白質(zhì)相對于單定位蛋白質(zhì)的顯著特征之一。雙定位蛋白質(zhì)電荷分布較為集中對稱,線粒體蛋白質(zhì)次之,質(zhì)體蛋白質(zhì)最為分散。這似乎暗示,雙定位蛋白質(zhì)與線粒體蛋白質(zhì)差異較小,而與質(zhì)體蛋白質(zhì)差異較大。說明雙定位蛋白質(zhì)可能是由線粒體蛋白質(zhì)獲得再定位到質(zhì)體的功能而產(chǎn)生的;也可能是在雙定位機(jī)制受到阻礙時(shí),雙定位蛋白質(zhì)會優(yōu)先選擇定位到線粒體。這為下一步開展植物蛋白質(zhì)定位研究提供了線索。
本研究結(jié)果表明,與單定位于線粒體或質(zhì)體的植物蛋白質(zhì)相比,雙定位線粒體與質(zhì)體的植物蛋白質(zhì)具有更低的凈電荷量,這是雙定位蛋白質(zhì)相對于單定位蛋白質(zhì)的顯著特征之一。此外,雙定位蛋白質(zhì)電荷分布較為集中對稱,線粒體蛋白質(zhì)次之,質(zhì)體蛋白質(zhì)最為分散。本研究結(jié)果將為揭示植物蛋白質(zhì)雙定位的分子機(jī)制奠定理論基礎(chǔ)。
[1]YOGEV O,PINES O.Dual targeting of mitochondrial proteins:mechanism,regulation and function [J].Biochim Biophys Acta,2011,1808(3):1012-1020.
[2]MITSCHKE J,F(xiàn)USS J,BLUM T,et al.Prediction of dual protein targeting to plant organelles[J].New Phytol,2009,183(1):224-235.
[3]CARRIE C,SMALL I.A reevaluation of dual-targeting of proteins to mitochondria and chloroplasts [J].Biochim Biophys Acta,2013,1833(2):253-259.
[4]SILVAFILHO M C.One ticket for multiple destinations:dual targeting of proteins to distinct subcellular locations [J].Curr Opin Plant Biol,2003,6(6):589-595.
[5]KARNIELY S,PINES O.Single translation—dual destination:mechanisms of dual protein targeting in eukaryotes [J].EMBO reports,2005,6(5):420-425.
[6]CONSORTIUM U P.The Universal Protein Resource (UniProt) in 2010 [J].Nucleic Acids Res,2010,38(Database issue):D142-148.
[7]ELSTNER M,ANDREOLI C,KLOPSTOCK T,et al.The mitochondrial proteome database:MitoP2 [J].Methods Enzymol,2009,457:3-20.
[8]DRABKIN H J, BLAKE J A.Manual Gene Ontology annotation workflow at the Mouse Genome Informatics Database [J].Database,2012,2012:bas045.
[9]LAMESCH P,BERARDINI T Z,LI D.The Arabidopsis Information Resource (TAIR): improved gene annotation and new tools [J].Nucleic Acids Res,2012,40(Database issue):D1202-D1210.
[10]ZHANG S,XIA X,SHEN J,et al.DBMLoc:a Database of proteins with multiple subcellular localizations [J].BMC Bioinformatics,2008,9:127.
[11]EMANUELSSON O,NIELSEN H,BRUNAK S,et al.Predicting subcellular localization of proteins based on their N-terminal amino acid sequence [J].J Mol Biol,2000,300(4):1005-1016.
[12]HORTON P,PARK K J,OBAYASHI T,et al.WoLF PSORT: protein localization predictor [J].Nucleic Acids Res,2007,35(Web Server issue):W585-587.
[13]BLUM T,BRIESEMEISTER S,KOHLBACHER O.MultiLoc2:integrating phylogeny and Gene Ontology terms improves subcellular protein localization prediction [J].BMC Bioinformatics,2009,(10):274.
[14]SMALL I,PEETERS N,LEGEAI F,et al.Predotar: A tool for rapidly screening proteomes for N-terminal targeting sequences [J].Proteomics,2004,4(6):1581-1590.
[15]YU C,CHEN Y,LU C,et al.Prediction of protein subcellular localization [J].Proteins,2006,64(3):643-651.
[16]CHOU K,SHEN H.Plant-mPLoc:a top-down strategy to augment the power for predicting plant protein subcellular localization [J].PLoS One,2010,5(6):e11335.
[17]MORGANTE C V,RODRIGUES R A,MARBACH P A,et al.Conservation of dual-targeted proteins in Arabidopsis and rice points to a similar pattern of gene-family evolution [J].Mol Genet Genomics,2009,281(5):525-538.
[18]SCHWACKE R,F(xiàn)ISCHER K,KETELSEN B,et al.Comparative survey of plastid and mitochondrial targeting properties of transcription factors in Arabidopsis and rice [J].Mol Genet Genomics,2007,277(6):631-646.
[19]CARRIE C,GIRAUD E,WHELAN J.Protein transport in organelles: Dual targeting of proteins to mitochondria and chloroplasts [J].FEBS J,2009,276(5):1187-1195.
[20]CAMON E,MAGRANE M,BARRELL D,et al.The Gene Ontology Annotation (GOA) Database: sharing knowledge in Uniprot with Gene Ontology [J].Nucleic Acids Res,2004,32(Database issue):D262-D266.
[21]BERGLUND A K,SPANNING E,BIVERSTAHL H,et al.Dual targeting to mitochondria and chloroplasts: characterization of Thr-tRNA synthetase targeting peptide [J].Mol Plant,2009,2(6):1298-1309.
[22]PUJOL C,MARECHAL-DROUARD L,DUCHENE A M.How can organellar protein N-terminal sequences be dual targeting signals in silico analysis and mutagenesis approach [J].J Mol Biol,2007,369 (2) 356-367.
[23]DINURMILLS M,TAL M,PINES O.Dual targeted mitochondrial proteins are characterized by lower MTS parameters and total net charge [J].PLoS One,2008,3(5):e2161.
(責(zé)任編輯:柯文輝)
Net Electric Charges of Dual Targeted Proteins in Mitochondria and Plastid of Plants
LIN Shou-kai1,2,F(xiàn)U Xiao-fei1,HUANG Jian1,TAO Huan1,XU Chao-qun1,Liu Wei1,Zhang Li-na1,Ai Yu-fang1,He Hua-qin1*
(1.CollegeofLifeSciences,F(xiàn)ujianAgricultureandForestryUniversity,F(xiàn)uzhou,F(xiàn)ujian350002,China;2.CollegeofEnvironmentalandBiologicalEngineering/FujianProvincialKeyLaboratoryofEcology-toxicologicalEffects&ControlforEmergingContaminants,PutianUniversity,Putian,F(xiàn)ujian351100,China)
Protein targeting is an important tool to determine the functionality of a protein. Adual targeted protein isa protein that located in two subcellular locations. It was estimated that more than 400 proteins were putatively targeted to mitochondria as well as plastid based on the ambiguous N-terminal pre-sequences in land plant genomes. In this study, the dual targeted proteins were searched against the protein databases of Uniprot, Mito P2, MGI, TAIR, and DBMLoc as well as the existing publications. A total of 703 proteins localized in both mitochondria and plastid in plants were collected. Whilst, 829 exclusive mitochondrial and 6 376 exclusive plastid proteins were downloaded from Uniprotfor comparison. The net electric charges of the dual targeted proteins were analyzed based on these 3 data sets. The results indicated the net charge of the plant dual targeted proteins was significantly lower than that of the proteins exclusively existed in mitochondrial or plastid. The charge differentiation provideda critical clue for the study of the molecular mechanism of dual targeted proteins in plants.
dual targeted protein; plant; mitochondria; plastid; net electric charge
2016-05-28初稿;2016-06-18修改稿
林授鍇(1984-),男,博士生,助理研究員,研究方向:植物分子生物學(xué)與生物信息學(xué)(E-mail:shoukai.lin@foxmail.com)
何華勤(1968-),男,博士,教授,博士生導(dǎo)師,研究方向:植物分子生態(tài)學(xué)與生物信息學(xué)(E-mail:hehq3@fafu.edu.cn)
國家自然科學(xué)基金(31270454、81502091);福建省自然科學(xué)基金(2016J01101);閩臺作物特色種質(zhì)創(chuàng)制與綠色栽培協(xié)同創(chuàng)新中心項(xiàng)目(2015-75)
Q 51
A
1008-0384(2016)07-671-06
林授鍇,傅曉菲,黃健,等.植物線粒體和質(zhì)體雙定位蛋白質(zhì)的帶電特性分析[J].福建農(nóng)業(yè)學(xué)報(bào),2016,31(7):671-676.
LIN S-K,F(xiàn)U X-F,HUANG J,et al.Net Electric Charges of Dual Targeted Proteins in Mitochondria and Plastid of Plants[J].FujianJournalofAgriculturalSciences,2016,31(7):671-676.