柯 野,彭陽選,李昊然,劉曜榮,梅穎詩,郭 陽
(韶關(guān)學(xué)院 英東生物與農(nóng)業(yè)學(xué)院,廣東 韶關(guān) 512005)
隨著國家政策對(duì)畜牧養(yǎng)殖業(yè)扶持與推廣,使得我國畜牧養(yǎng)殖業(yè)飛速發(fā)展,我國家禽生產(chǎn)量已躍居全球第2位,據(jù)估算,此行業(yè)每年產(chǎn)生的干羽毛量約130萬t[1].羽毛中的粗蛋白含量高達(dá)80%,氨基酸含量則達(dá)到70%,由此可見,羽毛具有十分可觀的開發(fā)利用價(jià)值[2].羽毛的主要成分是角蛋白,角蛋白亦被稱為硬性角蛋白,不容易被一般的蛋白酶所降解.然而,廢棄的羽毛不僅對(duì)環(huán)境有極大的危害作用,而且羽毛中的蛋白質(zhì)資源也不能得到充分有效的利用[3].因此,越來越多的研究者關(guān)注于對(duì)羽毛的有效降解.一方面,以期實(shí)現(xiàn)羽毛中蛋白質(zhì)的高值化利用.另一方面,則希望通過經(jīng)濟(jì)環(huán)保的方式,解決廢棄羽毛對(duì)生態(tài)環(huán)境帶來的危害.據(jù)報(bào)道,在自然界中已離獲得具有降解廢棄羽毛的微生物30多種,并且在細(xì)菌、放線菌和真菌[4-6]中均有分布,如細(xì)菌中的枯草芽孢桿菌屬和放線菌中鏈霉菌屬,它們主要產(chǎn)生堿性蛋白酶,可應(yīng)用于高蛋白動(dòng)物飼料、原料皮的脫毛和植物含氮肥料添加劑等領(lǐng)域的開發(fā)[7].
本文前期研究中已分離篩選獲得一株Dactinosclerus actinosclerusRM(下文簡稱RM菌株)野生型菌株,它是一株具有高效降解羽毛的細(xì)菌菌株(初測對(duì)4.0%的羽毛粉有高達(dá)64.0%的降解率).目前未見對(duì)該菌株所屬的屬和種的分泌蛋白系統(tǒng)研究.因此,本文采用生物信息學(xué)知識(shí)和在線網(wǎng)站對(duì)RM菌株全基因組序列編碼的分泌蛋白進(jìn)行預(yù)測和分析,以此可知該菌株對(duì)羽毛高效降解作用的相關(guān)酶,進(jìn)一步對(duì)該酶的基因、結(jié)構(gòu)與功能進(jìn)行深入的研究,更全面地為探究RM菌株降解羽毛的機(jī)制提供參考.
1.1.1 菌株來源
RM菌株是本實(shí)驗(yàn)室分離篩選獲得的一株具有高效降解羽毛的優(yōu)勢菌株,由本實(shí)驗(yàn)室保藏提供.
1.1.2 培養(yǎng)基
牛肉膏蛋白胨培養(yǎng)基:牛肉膏3.0 g,氯化鈉5.0 g,蛋白胨10.0 g,水1 000 mL,pH自然.
1.1.3 試劑
牛肉膏、蛋白胨、瓊脂糖等試劑購自生工生物工程(上海)股份有限公司,化學(xué)試劑均為國產(chǎn)分析純?cè)噭?
1.2.1 RM菌株的培養(yǎng)
將RM菌株接種在牛肉膏蛋白胨液體培養(yǎng)基中,180 rpm震蕩培養(yǎng)4 d后,12 000 rpm離心3 min,收集菌體備用.
1.2.2 RM菌株基因組DNA的提取
按照酵母DNA快速提取法[8],提取RM菌株的基因組DNA,進(jìn)行瓊脂糖凝膠電泳,對(duì)其質(zhì)量進(jìn)行分析.
1.2.3 RM菌株的基因組測序
將電泳鑒定合格的RM菌株基因組DNA,送至生工生物工程(上海)股份有限公司的廣州測序部進(jìn)行全基因組測序.采用Illumina Hiseq 2500平臺(tái)對(duì)RM菌株基因組進(jìn)行高通量測序,采用高通量序列數(shù)據(jù)的質(zhì)量控制工具FastQC(軟件版本 0.11.2)對(duì)測序的原始數(shù)據(jù)質(zhì)量可視化評(píng)估;為獲得相對(duì)準(zhǔn)確的有效數(shù)據(jù),再利用Trimmomatic(軟件版本0.36)數(shù)據(jù)過濾工具對(duì)數(shù)據(jù)進(jìn)行質(zhì)量剪切;通過基因組測序數(shù)據(jù)的拼接軟件SPAdes(軟件版本3.5.0)對(duì)測序數(shù)據(jù)進(jìn)行拼裝,之后采用Kmer值進(jìn)行組裝,最終根據(jù)各Kmer值組裝獲得最佳的序列結(jié)果.將獲得的RM菌株基因組序列提交至GenBank數(shù)據(jù)庫,根據(jù)NCBI網(wǎng)站提供的Prokaryotic Genome Annotation Pipeline注釋系統(tǒng)對(duì)基因功能進(jìn)行預(yù)測和注釋,同時(shí)也利用NCBI Blast+將基因蛋白序列與KEGG、COG、Swissprot和NR等多個(gè)數(shù)據(jù)庫進(jìn)行比對(duì),進(jìn)一步確定注釋基因的結(jié)構(gòu)與功能.
1.2.4 RM菌株分泌蛋白的確定方法
運(yùn)用Bio-Edit 7.0軟件對(duì)基因和蛋白質(zhì)的序列組成、比對(duì)等進(jìn)行分析;蛋白質(zhì)編碼序列的N端信號(hào)肽預(yù)測分析、篩選,通過在線程序:SignalP-4.1完成;蛋白質(zhì)的亞細(xì)胞定位預(yù)測分析通過網(wǎng)站:http://www.cbs.dtu.dk/services/TargetP-1.1/index.php完成.蛋白質(zhì)的跨膜結(jié)構(gòu)域預(yù)測分析通過網(wǎng)站:http://www.cbs.dtu.dk/services/TMHMM/完成.
通過SPAdes對(duì)二代測序數(shù)據(jù)進(jìn)行拼裝后,獲得RM菌株測序全長為4 013 522 bp,最長測序片段長度為79 609 bp,平均長度為12 088.92 bp,N50的長度為21 827 bp,GC含量為0.70,連續(xù)交疊群共有332個(gè).將RM菌株基因組序列提交至GenBank數(shù)據(jù)庫,獲得登錄號(hào)為QYCQ00000000.1.根據(jù)GenBank數(shù)據(jù)庫的基因注釋系統(tǒng)分析,RM菌株基因組全長為341 632 bp,共計(jì)有3 869個(gè)蛋白質(zhì)編碼基因,再將每個(gè)CDS編碼的氨基酸序列與KEGG、COG、Swissprot和NR等數(shù)據(jù)進(jìn)行比對(duì),其中有3 820個(gè)基因序列能被同源基因注釋分類.
對(duì)RM菌株全基因組預(yù)測編碼的3 869條蛋白進(jìn)行信號(hào)肽預(yù)測,結(jié)果表明:所有的編碼蛋白質(zhì)中僅439條蛋白具備典型信號(hào)肽序列,占比11.35%.而3 430條蛋白均為胞內(nèi)蛋白,占比88.65%.這表明RM菌株的分泌蛋白占少數(shù),大多數(shù)為胞內(nèi)蛋白.
439條具有信號(hào)肽的蛋白質(zhì)中,氨基酸殘基總數(shù)為144 145個(gè),各種氨基酸的含量如圖1.由圖1可知,在20種氨基酸中,數(shù)量多的分別是丙氨酸、亮氨酸、甘氨酸、蘇氨酸和纈氨酸,摩爾比分別為13.25%、9.95%、9.50%、9.19%和7.83%,總計(jì)達(dá)到49.72%.這些氨基酸殘基都具有側(cè)鏈基團(tuán)簡單、不含環(huán)狀結(jié)構(gòu)、分子量相對(duì)較小、占據(jù)空間結(jié)構(gòu)少等特點(diǎn).其含量較高的原因,可能是由于占據(jù)空間結(jié)構(gòu)小,柔性相對(duì)較大,利于蛋白局部的構(gòu)象改變,便于形成成熟蛋白質(zhì)的構(gòu)象.
圖1 20種氨基酸在RM菌株信號(hào)肽蛋白中所含數(shù)量情況
含量較少的酪氨酸、色氨酸和組氨酸殘基,摩爾比分別為2.77%、1.28%和1.01%,總計(jì)5.06%.酪氨酸、色氨酸和組氨酸側(cè)鏈基團(tuán)具有環(huán)狀結(jié)構(gòu),含有較大的疏水性側(cè)鏈基團(tuán),剛性較強(qiáng)、占據(jù)空間大,對(duì)蛋白質(zhì)局部構(gòu)象的柔性貢獻(xiàn)小,這可能是含量較少的原因之一.
半胱氨酸是構(gòu)成蛋白質(zhì)的一種特殊氨基酸,能形成穩(wěn)定的二硫鍵,對(duì)蛋白質(zhì)結(jié)構(gòu)局部構(gòu)象的穩(wěn)定性和剛性具有重要作用,由圖1和圖2可知,RM菌株產(chǎn)生的含信號(hào)肽的蛋白質(zhì)中,不含或只含有1個(gè)半胱氨酸的蛋白共有196個(gè),所占比例高達(dá)44.65%,即約一半含信號(hào)肽的蛋白不能形成二硫鍵.但也有6個(gè)蛋白質(zhì)中含有10個(gè)以上的半胱氨酸,這些蛋白質(zhì)可能形成多個(gè)二硫鍵.
圖2 含有信號(hào)肽的蛋白質(zhì)中的半胱氨酸數(shù)量
對(duì)439條含有信號(hào)肽的蛋白進(jìn)行跨膜結(jié)構(gòu)域及亞細(xì)胞定位預(yù)測可知,有321個(gè)胞外分泌蛋白質(zhì),34個(gè)亞細(xì)胞定位不明確的蛋白質(zhì),84個(gè)分泌型膜蛋白,在這些分泌性膜蛋白中65個(gè)蛋白有1個(gè)跨膜結(jié)構(gòu)域,有7個(gè)蛋白有2個(gè)跨膜結(jié)構(gòu)域,有3個(gè)蛋白具有3個(gè)跨膜結(jié)構(gòu)域,有2個(gè)蛋白有4個(gè)跨膜結(jié)構(gòu)域,有1個(gè)蛋白有5個(gè)跨膜結(jié)構(gòu)域,有2個(gè)蛋白有9個(gè)跨膜結(jié)構(gòu)域,有4個(gè)蛋白有12個(gè)跨膜結(jié)構(gòu)域.結(jié)果表明含有信號(hào)肽的蛋白大多數(shù)為胞外分泌蛋白,占總數(shù)的摩爾比73.12%.
2.5.1 分泌蛋白的信號(hào)肽氨基酸殘基組成
所有分泌蛋白質(zhì)的信號(hào)肽共有氨基酸殘基7 472個(gè),平均每條信號(hào)肽含23個(gè)殘基,最長的信號(hào)肽有38個(gè)氨基酸殘基,而最短信號(hào)肽序列只含10個(gè)氨基酸殘基.信號(hào)肽的氨基酸殘基組成見圖3.由圖3可知:含量較高的氨基酸殘基為亮氨酸和丙氨酸,占摩爾比分別為21.39%和21.08%,因?yàn)樾盘?hào)肽主要為線性結(jié)構(gòu),這兩種氨基酸殘基的側(cè)鏈基團(tuán)簡單,可能更利于線性的信號(hào)肽形成.
圖3 分泌蛋白的信號(hào)肽序列中20種氨基酸數(shù)量的分布情況
信號(hào)肽序列中疏水性氨基酸殘基(如亮氨酸、丙氨酸、脯氨酸、纈氨酸、甲硫氨酸、異亮氨酸、苯丙氨酸和色氨酸)占摩爾比為63.65%;帶正電荷的殘基(如賴氨酸、精氨酸和組氨酸)占摩爾比為9.15%;帶負(fù)電荷的殘基(如天冬氨酸和谷氨酸)共有86個(gè),所占摩爾比分?jǐn)?shù)為1.15%.由此可見,RM菌株的信號(hào)肽殘基組成情況符合信號(hào)肽構(gòu)成的一般規(guī)律,疏水性氨基酸殘基為主,構(gòu)成主要的疏水核心區(qū),而少量的正電荷殘基和負(fù)電荷殘基組成信號(hào)肽的N端和C端[9-11].
2.5.2 分泌蛋白的信號(hào)肽切割位點(diǎn)分析
對(duì)分泌蛋白信號(hào)肽末端4個(gè)氨基酸殘基進(jìn)行分析,結(jié)果見圖4.以“1”為切割位點(diǎn),依次向信號(hào)肽序列的N端排序,在4位點(diǎn)上數(shù)量最多的氨基酸殘基是丙氨酸,共62個(gè).在3點(diǎn)上含量最多的是丙氨酸,共212個(gè).在2位點(diǎn)含量最多的氨基酸殘基是谷氨酰胺,共52個(gè).在1位點(diǎn)上含量最多的氨基酸是丙氨酸,共266個(gè).由此推出RM菌株的信號(hào)肽切割位點(diǎn)序列主要屬于X-A-X-A型,為SPI型信號(hào)肽識(shí)別位點(diǎn).
圖4 分泌型蛋白的信號(hào)肽切割位點(diǎn)分析
RM菌株對(duì)羽毛的降解主要是由于分泌蛋白酶對(duì)羽毛的降解作用,在胞外分泌型蛋白中,共10個(gè)蛋白酶(6種類型),1個(gè)M36金屬肽酶類,1個(gè)C39肽酶類,1個(gè)木瓜蛋白酶家族半胱氨酸蛋白酶類,1個(gè)胰蛋白酶類,3個(gè)MepM肽鏈內(nèi)切酶,3個(gè)枯草桿菌蛋白酶.6類蛋白酶信號(hào)肽序列的氨基酸殘基數(shù)如圖5.由圖5可知,6類蛋白酶的信號(hào)肽中的各種氨基酸殘基的含量基本一致,如丙氨酸和亮氨酸的含量最高,天冬氨酸和色氨酸含量最低;并且其信號(hào)肽切割位點(diǎn)也屬于X-A-X-A型.這表明RM菌株的蛋白酶中各種氨基酸含量不因蛋白酶的種類而具有差異.
圖5 6類蛋白酶信號(hào)肽中各氨基酸殘基的含量情況
本文對(duì)具有降解羽毛的優(yōu)勢菌株RM菌株進(jìn)行了全基因組的測序,通過對(duì)該基因組編碼的蛋白分析其信號(hào)肽和跨膜結(jié)構(gòu)域等相關(guān)信息,得知該菌株共有439個(gè)蛋白具有信號(hào)肽序列,321個(gè)為胞外分泌蛋白,34個(gè)亞細(xì)胞定位不明確的蛋白,84個(gè)為膜蛋白.RM菌株分泌蛋白的信號(hào)肽切割位點(diǎn)的氨基酸殘基主要序列為于X-A-X-A型,并且以疏水性的氨基酸殘基為主,不同類型分泌蛋白酶的信號(hào)肽之間的序列差異較小.因此,通過本文的研究,了解了RM菌株分泌蛋白的情況,信號(hào)肽的氨基酸殘基組成規(guī)律,這為對(duì)RM野生型菌株的改造,人工合成能在RM菌株中分泌表達(dá)蛋白的信號(hào)肽構(gòu)建奠定了一定的基礎(chǔ),同時(shí)為進(jìn)一步分析RM菌株對(duì)羽毛高效降解的分泌蛋白(如角蛋白酶、脂肪酶、二硫鍵還原酶等)的確定、功能作用奠定了基礎(chǔ).