許 凈 劉慧敏 林筱鈞 鄭 江,,3① 江興龍,鄢慶枇 范云庭 湯學(xué)敏
(1. 集美大學(xué)水產(chǎn)學(xué)院 廈門 361021; 2. 鰻鱺現(xiàn)代產(chǎn)業(yè)技術(shù)教育部工程研究中心 廈門 361021; 3. 福建省水產(chǎn)生物育種與健康養(yǎng)殖工程研究中心 廈門 361021; 4. 福建省特種水產(chǎn)配合飼料重點(diǎn)實(shí)驗(yàn)室 福清 350308)
核酸適配體是通過(guò)指數(shù)富集配體的系統(tǒng)進(jìn)化技術(shù)(Systematic Evolution of Ligands by Exponential Enrichment), 即SELEX 篩選技術(shù), 獲得的對(duì)靶目標(biāo)有較好親和特異性的寡核苷酸分子(Ellingtonet al,1990)。核酸適配體具有靶目標(biāo)范圍廣、體積小、易合成、親和力高、特異性強(qiáng)等優(yōu)點(diǎn), 在癌癥治療、微生物檢測(cè)、食品安全等領(lǐng)域中呈現(xiàn)出廣闊的應(yīng)用前景(Hamulaet al, 2011; 于寒松等, 2015; Yazdian-Robatiet al, 2017; Liuet al, 2020)。SELEX 篩選中, 需要對(duì)獲得的篩選產(chǎn)物進(jìn)行測(cè)序, 然后從測(cè)序結(jié)果中選擇部分序列進(jìn)行親和特異性的驗(yàn)證, 親和特異性較好的序列則被確認(rèn)為核酸適配體序列。然而, 通過(guò)傳統(tǒng)克隆測(cè)序獲得的序列有成百上千條, 通過(guò)高通量測(cè)序獲得的序列更是高達(dá)數(shù)萬(wàn)條, 因此, 如何從如此眾多的序列中精準(zhǔn)、高效的選擇出相應(yīng)的候選序列進(jìn)行核酸適配體的驗(yàn)證, 是一個(gè)亟待解決的問題。
高頻序列是測(cè)序結(jié)果中出現(xiàn)的頻率大于等于2次的序列, 研究表明, 相當(dāng)多的高頻序列都是在篩選進(jìn)化中具有競(jìng)爭(zhēng)優(yōu)勢(shì)的序列, 且大概率是對(duì)靶目標(biāo)有較好親和力的核酸適配體序列(鄭江等, 2014), 而高頻序列的數(shù)量在總序列中的占比常常很低, 因此,對(duì)高頻序列進(jìn)行分析研究, 研究其在篩選進(jìn)化過(guò)程中的優(yōu)勢(shì)序列及其多樣性變化, 將能有針對(duì)性地尋找到相應(yīng)的核酸適配體序列, 從而能夠降低篩選的盲目性, 提高篩選的效率。
鰻弧菌(Vibrio anguillarum)是多種淡海水養(yǎng)殖品種的致病菌(饒穎竹等, 2016; 王鳳青等, 2018;Mohamadet al, 2019), 由其導(dǎo)致的疾病給水產(chǎn)養(yǎng)殖業(yè)造成巨大的經(jīng)濟(jì)損失, 而對(duì)鰻弧菌進(jìn)行快速的分析檢測(cè)則是其病害防治的前提和基礎(chǔ)。核酸適配體因其具有親和力高、特異性強(qiáng)等優(yōu)點(diǎn), 已廣泛應(yīng)用于微生物檢測(cè)(Tanget al, 2013; Zhenget al, 2015; Yuet al,2019; Sadsriet al, 2020), 因此篩選鰻弧菌的核酸適配體, 對(duì)于鰻弧菌的快速檢測(cè)及其病害防治都具有積極意義。而研究其篩選過(guò)程中高頻序列的進(jìn)化特點(diǎn)及其多樣性變化, 不僅能快速準(zhǔn)確地獲得鰻弧菌核酸適配體的候選序列, 對(duì)于理解掌握篩選文庫(kù)的進(jìn)化特點(diǎn), 提高相關(guān)水產(chǎn)病原菌核酸適配體的篩選效率都具有積極意義。
本文選擇了13 輪鰻弧菌核酸適配體的篩選產(chǎn)物進(jìn)行高通量測(cè)序, 采用生態(tài)學(xué)中常用的豐富度指數(shù)、均勻度指數(shù)、多樣性指數(shù)和優(yōu)勢(shì)度指數(shù)對(duì)其中的高頻序列進(jìn)行了多樣性分析, 并采用相對(duì)重要性指數(shù)(IRI)對(duì)高頻序列進(jìn)行了歸納分類, 最后利用在線網(wǎng)站對(duì)IRI 較高的7 種核酸適配體的二級(jí)結(jié)構(gòu)進(jìn)行了預(yù)測(cè)模擬, 相關(guān)研究對(duì)于核酸適配體的篩選以及鰻弧菌的檢測(cè)防治都具有重要意義。
本文中的高頻序列來(lái)自于以鰻弧菌為靶目標(biāo)的SELEX 篩選, 具體流程如下: (1) 構(gòu)建并合成初始隨機(jī)寡核苷酸文庫(kù): 5′-TCAGTCGCTTCGCCGTCTCC TTC(N35)GCACAAGAG GGAGACCCCAGAGGG-3′,N35 為含35 個(gè)隨機(jī)堿基的寡核苷酸序列。(2) 孵育:將上述寡核苷酸文庫(kù)與鰻弧菌共同孵育30 min—2 h,使寡核苷酸分子與鰻弧菌結(jié)合; (3) 分離: 利用離心、洗滌、熱變性等分離技術(shù), 將未結(jié)合的或結(jié)合較弱的寡核苷酸分子與鰻弧菌分離, 獲得能與鰻弧菌較好結(jié)合的寡核苷酸分子; (4) 擴(kuò)增: 將能與鰻弧菌結(jié)合的寡核苷酸分子進(jìn)行不對(duì)稱PCR 擴(kuò)增, 此為完成一輪篩選, 該P(yáng)CR 產(chǎn)物即為該輪的篩選產(chǎn)物, 也是下一輪篩選的次級(jí)文庫(kù); (5) 重復(fù): 重復(fù)步驟(1)到(4), 即次級(jí)文庫(kù)再次與鰻弧菌進(jìn)行孵育、分離、擴(kuò)增, 獲得相應(yīng)的篩選產(chǎn)物; (6) 測(cè)序: 對(duì)篩選產(chǎn)物進(jìn)行高通量測(cè)序, 從中選擇核酸適配體的候選序列進(jìn)行后續(xù)的驗(yàn)證和鑒定。我們共進(jìn)行了15 輪的篩選, 選擇了其中的13 輪篩選產(chǎn)物, 即第1、2、3、4、5、6、7、9、11、12、13、14、15 輪的PCR 產(chǎn)物, 進(jìn)行高通量測(cè)序, 選擇測(cè)序結(jié)果中的高頻序列進(jìn)行分析研究。高通量測(cè)序由生工生物工程有限公司(上海)完成。
為了方便理解, 我們對(duì)本文中核酸序列的種類和個(gè)體數(shù)作如下定義或表述: 不同種類的序列是指堿基的組成、數(shù)量或排列順序不同的序列, 通常被簡(jiǎn)稱為不同序列; 同一種序列在測(cè)序結(jié)果中如果出現(xiàn)多次, 它的出現(xiàn)頻率可以看作是這種序列的個(gè)體數(shù),而每輪測(cè)序結(jié)果中的總序列數(shù)則可看作該輪測(cè)序獲得的總個(gè)體數(shù)。
統(tǒng)計(jì)每輪測(cè)序結(jié)果中高頻序列的個(gè)體數(shù)和每種高頻序列出現(xiàn)的頻率(即該高頻序列的個(gè)體數(shù)), 則該輪高頻序列個(gè)體數(shù)的占比(%)=(該輪高頻序列個(gè)體數(shù)/該輪測(cè)序序列總個(gè)體數(shù))×100=(該輪所有高頻序列的頻率之和/該輪測(cè)序序列總個(gè)體數(shù))×100, 分別計(jì)算出13 個(gè)測(cè)序輪中高頻序列的占比, 比較分析其變化規(guī)律。
參考王旭娜等(2018)和黃雅琴等(2020)的方法,分別選用豐富度指數(shù)、均勻度指數(shù)、多樣性指數(shù)和優(yōu)勢(shì)度指數(shù), 來(lái)研究高頻序列的多樣性, 這些指數(shù)的原計(jì)算公式如下:
原公式中,S為所有物種的種類數(shù),N為每輪物種的個(gè)體數(shù)量的總和,Ni為第i個(gè)物種的個(gè)體數(shù),Pi=Ni/N,Nmax為優(yōu)勢(shì)種的總個(gè)體數(shù),Nt為各物種的總個(gè)體數(shù)。將上述公式應(yīng)用于本文的高頻序列, 則公式中的S就是某測(cè)序輪中高頻序列的種類數(shù),N為該輪中高頻序列的總個(gè)體數(shù),Ni是該輪第i個(gè)高頻序列的個(gè)體數(shù), 即第i個(gè)高頻序列的出現(xiàn)次數(shù)或頻率,Pi=Ni/N,Nmax為該輪中優(yōu)勢(shì)高頻序列的個(gè)體數(shù),Nt是該輪中高頻序列的總出現(xiàn)次數(shù)。因此, 根據(jù)上述公式, 采用Primer 6.0 軟件可計(jì)算出每一個(gè)測(cè)序輪中的上述四種指數(shù)。
優(yōu)勢(shì)種的研究通常是先選擇一系列的站點(diǎn), 然后計(jì)算每個(gè)站點(diǎn)中的各個(gè)物種的相對(duì)重要性指數(shù)(Index of relative importance, IRI), 再根據(jù)該指數(shù)對(duì)相應(yīng)的物種進(jìn)行判定分類(王雪輝等, 2010; 劉曉霞等,2016; 張鵬弛等, 2017; 粟麗等, 2018)。IRI 的原始計(jì)算公式為: IRI = (N+W)×F×10 000 (沃佳等, 2017; 丁朋朋等, 2019), 式中,N為某一種類的個(gè)體數(shù)占總個(gè)體數(shù)的百分率;W為某一種類的重量占總重量的百分率;F為某一種類出現(xiàn)的站數(shù)占調(diào)查總站數(shù)的百分率。在本文高頻序列的研究中, 我們將各個(gè)篩選輪或測(cè)序輪看作是原公式中的各個(gè)站點(diǎn), 則總共13 個(gè)測(cè)序輪就對(duì)應(yīng)著13 個(gè)站點(diǎn), 某種高頻序列出現(xiàn)的次數(shù)或頻率就相當(dāng)于該高頻序列的個(gè)體數(shù), 則公式中N就是某種高頻序列在13 個(gè)測(cè)序輪中出現(xiàn)的總次數(shù)占13輪中全部高頻序列的出現(xiàn)總次數(shù)的百分比,F則為該高頻序列出現(xiàn)的輪數(shù)占全部輪數(shù)(即13 輪)的百分比。另外, 由于核酸序列重量與其序列長(zhǎng)度成正比, 本文中的高頻序列的長(zhǎng)度大多在82 nt 左右, 差別不大,因此公式中的重量百分比W就近似等于其數(shù)量百分比N, 因此IRI 公式就無(wú)需加和, 可只取數(shù)量百分比N, 由此相對(duì)重要性指數(shù)IRI 的公式可修正為IRI =N×F×10 000。然后參考相關(guān)文獻(xiàn)的判定方法(陳國(guó)寶等, 2007; 李顯森等, 2013; 粟麗等, 2018), 依據(jù)IRI的值對(duì)不同序列進(jìn)行判斷分類, 具體如下: 當(dāng)該序列的IRI≥500時(shí), 該序列為優(yōu)勢(shì)序列; 100≤IRI<500時(shí),該序列為重要序列; 10≤IRI<100 時(shí), 該序列為常見序列, 1≤IRI<10 時(shí), 該序列為一般序列; IRI<1 時(shí), 該序列為少見序列。
利用RNA structure 網(wǎng)站(http://rna.urmc.rochester.edu/RNAstructureWeb/)進(jìn)行在線預(yù)測(cè), 核酸類型選擇為DNA, 其他參數(shù)為默認(rèn)值, 最后選擇最大可能性的二級(jí)結(jié)構(gòu), 即MaxExpect 二級(jí)結(jié)構(gòu)作為各序列的二級(jí)結(jié)構(gòu)。
高頻序列種類數(shù)的變化(圖1)與其占比的變化(圖2)相類似, 都是在第4、5 輪出現(xiàn)突然性的大幅上升,在第4 輪達(dá)到最大值, 之后快速回落后出現(xiàn)穩(wěn)步增加,在最后一輪達(dá)到次高點(diǎn)。從總趨勢(shì)上看, 高頻序列的種類數(shù)在前6 輪出現(xiàn)較劇烈的波動(dòng), 之后隨著篩選的進(jìn)行呈穩(wěn)步增加的趨勢(shì), 高頻序列的占比也呈現(xiàn)類似變化, 不過(guò)高頻序列占比的波動(dòng)要更劇烈些, 后續(xù)的增加趨勢(shì)也要更明顯。
圖1 篩選過(guò)程中高頻序列的種類數(shù)變化Fig.1 Changes of high frequency sequences in the species during the selection
圖2 篩選過(guò)程中高頻序列在總序列中的占比變化Fig.2 The proportion changes of high frequency sequence in the total sequence during the selection
反映多樣性的Shannon-Wiener 指數(shù)和豐富度指數(shù)與高頻序列的種類數(shù)和占比變化(如圖1 和圖2)也類似, 也是在篩選的第4 輪達(dá)到最高, 之后快速回落,然后再逐步上升, 說(shuō)明隨著篩選進(jìn)行, 高頻序列也在進(jìn)化, 其豐富度和多樣性在經(jīng)歷了前6 輪的劇烈波動(dòng)后, 都隨著篩選進(jìn)化過(guò)程而逐步提高。
Pielou 均勻度指數(shù)反映的是各物種個(gè)體數(shù)目分配的均勻程度, 指數(shù)越高, 說(shuō)明個(gè)體間數(shù)目越均勻。圖3 顯示, 該指數(shù)在前6 輪在一定區(qū)間內(nèi)呈現(xiàn)較大波動(dòng), 之后則趨于穩(wěn)定, 并呈現(xiàn)逐漸降低趨勢(shì), 說(shuō)明隨著篩選進(jìn)行, 均勻度在經(jīng)歷了前6 輪的劇烈波動(dòng)后,呈現(xiàn)越來(lái)越低的趨勢(shì), 這也進(jìn)一步說(shuō)明篩選進(jìn)化是向著某一方向進(jìn)行的, 適應(yīng)這一進(jìn)化方向的高頻序列, 其個(gè)體數(shù)就會(huì)越來(lái)越多, 不適應(yīng)這一方向的高頻序列, 其個(gè)體數(shù)就會(huì)越來(lái)越少, 從而呈現(xiàn)出越來(lái)越大的差異和不均勻性。
優(yōu)勢(shì)度指數(shù)反映的是優(yōu)勢(shì)種的優(yōu)勢(shì)程度, 優(yōu)勢(shì)度指數(shù)越高, 說(shuō)明該輪優(yōu)勢(shì)種的優(yōu)勢(shì)越突出。圖3 顯示, 該指數(shù)在前6 輪波動(dòng)較為劇烈, 說(shuō)明優(yōu)勢(shì)種的優(yōu)勢(shì)度并不穩(wěn)定, 其他種的高頻序列可能對(duì)優(yōu)勢(shì)種呈現(xiàn)較大的競(jìng)爭(zhēng)壓力, 之后隨著篩選進(jìn)行, 優(yōu)勢(shì)度指數(shù)也逐漸走高, 說(shuō)明優(yōu)勢(shì)種在篩選進(jìn)化中的競(jìng)爭(zhēng)力越來(lái)越強(qiáng), 其在進(jìn)化競(jìng)爭(zhēng)中的優(yōu)勢(shì)越來(lái)越明顯, 這也反映了篩選效果越來(lái)越好。
圖3 篩選過(guò)程中Margalef 豐富度指數(shù)、Shannon-Wiener 多樣性指數(shù)、Pielou 均勻度指數(shù)、Berger-Parker 優(yōu)勢(shì)度指數(shù)的變化Fig.3 Changes of the Margalef richness index, Shannon-Wiener diversity index, Pielou evenness index, and Berger-Parker dominance index during the selection
對(duì)13 輪中的79 個(gè)高頻序列進(jìn)行了相對(duì)重要性指數(shù)(IRI)的計(jì)算, 結(jié)果如表1。依據(jù)IRI 的大小可將這些高頻序列分為以下五種類型, 即優(yōu)勢(shì)序列(IRI≥500)、重要序列(100 ≤IRI<500)、常見序列(10 ≤IRI<100)、一般序列(1≤IRI<10)和少見序列(IRI<1)。從表中可以看出, 優(yōu)勢(shì)序列和重要序列分別只有1 種,約占全部高頻序列的1.27%, 常見序列、一般序列和少見序列, 則分別約占全部高頻序列的 8.86%、18.99%和69.62%。另外, 優(yōu)勢(shì)序列的IRI 值高達(dá)8 707.25, 是重要序列的19 倍多, 這表明優(yōu)勢(shì)序列在篩選進(jìn)化中的競(jìng)爭(zhēng)優(yōu)勢(shì)是較為突出的。
通過(guò)表1 的分類可看出, 優(yōu)勢(shì)序列、重要序列和常見序列應(yīng)該是篩選進(jìn)化中的相對(duì)優(yōu)勢(shì)種群, 它們對(duì)靶目標(biāo)鰻弧菌的競(jìng)爭(zhēng)力大概率要高于一般序列和少見序列, 因此, 按照IRI 指數(shù)從高到低, 優(yōu)先從優(yōu)勢(shì)序列、重要序列中挑選相應(yīng)的序列進(jìn)行核酸適配體的驗(yàn)證, 將能大大降低驗(yàn)證的盲目性和隨機(jī)性, 提高篩選效率。后續(xù)選擇了IRI 最高的7 個(gè)高頻序列(H5、H1、H6、H12、H17、H28、H21)進(jìn)行了親和特異性驗(yàn)證, 發(fā)現(xiàn)這7 個(gè)高頻序列均是親和特異性較好的核酸適配體(相關(guān)數(shù)據(jù)另文發(fā)表)。
表1 高頻序列的相對(duì)重要性指數(shù)及其分類Tab.1 Index of relative importance of high frequency sequences and their classification
選擇已驗(yàn)證確認(rèn)的7 個(gè)核酸適配體(H5、H1、H6、H12、H17、H28、H21)進(jìn)行了二級(jí)結(jié)構(gòu)的模擬(圖4), 從圖中可看出, 這些序列均形成了多個(gè)大小不一的閉合環(huán)狀結(jié)構(gòu), 表2 對(duì)這些核酸適配體序列中的閉合環(huán)進(jìn)行總結(jié), 可以發(fā)現(xiàn), 每個(gè)序列都含有2—6 個(gè)閉合環(huán), 每個(gè)環(huán)由5—25 核苷酸組成, 根據(jù)每個(gè)環(huán)中的核苷酸數(shù)量可以把這些環(huán)大致分為三種:小型環(huán)(由5—8 個(gè)核苷酸構(gòu)成)、中型環(huán)(由9—13 個(gè)核苷酸構(gòu)成)、大型環(huán)(由17 個(gè)以上的核苷酸構(gòu)成)。這些環(huán)的大小和數(shù)量很可能與核酸適配體的結(jié)合位點(diǎn)相匹配。
表2 核酸適配體序列的IRI 值及其二級(jí)結(jié)構(gòu)中環(huán)的數(shù)量和大小Tab.2 Values of index of relative importance of aptamers and the numbers and sizes of their rings in their secondary structures
圖4 核酸適配體二級(jí)結(jié)構(gòu)Fig.4 Secondary structures of the aptamers
研究鰻弧菌核酸適配體篩選中高頻序列的進(jìn)化多樣性對(duì)于揭示核酸適配體的篩選進(jìn)化規(guī)律、提高核酸適配體的篩選效率都具有重要意義。本文分別從高頻序列的種類數(shù)、多樣性、相對(duì)重要性指數(shù)(IRI)和二級(jí)結(jié)構(gòu)等四個(gè)方面對(duì)高頻序列的篩選進(jìn)化特點(diǎn)進(jìn)行了研究, 下面也從這四個(gè)方面對(duì)其進(jìn)行分析討論。
理論上, 高頻序列是在篩選競(jìng)爭(zhēng)中占優(yōu)勢(shì)的序列, 其種類數(shù)量和在總序列中的占比應(yīng)該隨著篩選輪數(shù)的增加而逐步增加。但我們的研究卻發(fā)現(xiàn), 在篩選的中間階段出現(xiàn)了高頻序列大量爆增、劇烈波動(dòng)的現(xiàn)象, 其種類和占比都超過(guò)了最后一輪。出現(xiàn)這種劇烈波動(dòng)現(xiàn)象的原因很可能和篩選條件有關(guān)。前6 輪的篩選是在較為寬松的條件下進(jìn)行的(結(jié)合1—2 h, 洗滌1—2 次), 所以, 雖然第4、5 輪出現(xiàn)了高頻序列的大爆發(fā), 但大部分高頻序列的親和力可能并不高, 第7 輪后為了去除親和力較弱的序列, 篩選條件逐漸嚴(yán)苛, 結(jié)合時(shí)間縮短為0.5 h, 洗滌次數(shù)增加為3 次, 從而導(dǎo)致相當(dāng)多親和力不高的高頻序列被淘汰, 最后雖然高頻序列的數(shù)量和占比沒有達(dá)到最高, 但其中高親和力序列的數(shù)量大大增加, 文庫(kù)中高頻序列的質(zhì)量得到了較大的改善。
Margalef 豐富度指數(shù)、Shannon-Wiener 多樣性指數(shù)、Pielou 均勻度指數(shù)和Berger-Parker 優(yōu)勢(shì)度指數(shù),經(jīng)常被用于動(dòng)植物的多樣性研究。作為一種有效的分析和描述方法, 這些指數(shù)還被用于手足口病的流行性特征分析(Yanget al, 2020)、口腔微生物菌群的組成分析(Wolffet al, 2019)、以及土壤微生物多樣性的研究(夏圍圍等, 2014)。本文則采用這四個(gè)指數(shù)研究了核酸適配體篩選過(guò)程中高頻寡核苷酸序列的進(jìn)化多樣性, 結(jié)果表明, 隨著篩選進(jìn)行, 高頻序列的豐富度、多樣性和優(yōu)勢(shì)度都呈現(xiàn)逐步增加趨勢(shì), 而均勻度出現(xiàn)降低。這一結(jié)果很可能是因?yàn)樵诤Y選競(jìng)爭(zhēng)中, 在總序列中占比90%以上的、大量親和力較弱的非高頻序列逐漸被淘汰, 而親和力較強(qiáng)的非高頻序列則逐漸進(jìn)化為高頻序列, 從而導(dǎo)致含有大量核酸適配體的、有較高親和力的高頻序列在篩選競(jìng)爭(zhēng)中逐漸占據(jù)優(yōu)勢(shì), 其種類數(shù)量不斷增加, 競(jìng)爭(zhēng)優(yōu)勢(shì)也越來(lái)越強(qiáng),并呈現(xiàn)出強(qiáng)者越強(qiáng)的定向進(jìn)化趨勢(shì)。這些變化趨勢(shì)與核酸適配體的篩選進(jìn)化特點(diǎn)也是一致的。
核酸適配體的篩選中, 需要對(duì)篩選產(chǎn)物進(jìn)行測(cè)序, 然后再?gòu)谋姸嗟臏y(cè)序序列中挑選出可能的候選序列, 進(jìn)行親和特異性的驗(yàn)證, 只有親和特異性較好的序列才被認(rèn)定為核酸適配體。如何挑選候選序列,目前尚沒有統(tǒng)一的方法。早期是采用隨機(jī)的方法從測(cè)序結(jié)果中隨機(jī)挑選數(shù)個(gè)序列去進(jìn)行親和特異性驗(yàn)證(李衛(wèi)濱等, 2007), 或者利用同源性將測(cè)序的序列分為數(shù)個(gè)家族, 然后從數(shù)個(gè)家族中隨機(jī)挑選序列進(jìn)行驗(yàn)證(Liuet al, 2014), 這種隨機(jī)方法要進(jìn)行大量的驗(yàn)證實(shí)驗(yàn), 工作量較大。另外, 也有學(xué)者是按照序列的頻率和占比來(lái)挑選候選序列的(Zhuet al, 2021)。而我們則綜合考慮了頻率和出現(xiàn)輪數(shù), 采用相對(duì)重要性指數(shù)(IRI)這個(gè)指標(biāo), 按照IRI 從大到小來(lái)挑選相應(yīng)的候選序列, 挑選出的7 個(gè)高頻序列后續(xù)均被確認(rèn)是親和特異性較好的核酸適配體, 說(shuō)明采用IRI 指數(shù)來(lái)挑選候選核酸適配體序列也是可行的。
核酸適配體通常借助其結(jié)構(gòu)中的堆積作用、形狀互補(bǔ)、靜電作用和氫鍵等相互作用, 通過(guò)頸環(huán)等結(jié)構(gòu),與靶目標(biāo)或嵌合或包被, 從而形成穩(wěn)定的復(fù)合物(Ellingtonet al, 1992; Hermannet al, 2000)。有研究發(fā)現(xiàn), 適配體二級(jí)結(jié)構(gòu)中的不同環(huán)區(qū)可以聯(lián)合參與靶標(biāo)的識(shí)別與結(jié)合(孫羽菡, 2019), 還有研究表明, 兩個(gè)頸環(huán)的適配體要比一個(gè)頸環(huán)的適配體有更好的穩(wěn)定性和親和特異性(Bhardwajet al, 2019), 我們的研究也表明二級(jí)結(jié)構(gòu)中環(huán)的數(shù)量和大小很可能是與其結(jié)合位點(diǎn)相匹配的, 進(jìn)而影響其與靶目標(biāo)的結(jié)合和穩(wěn)定性。
利用Margalef 豐富度指數(shù)、Shannon-Wiener 多樣性指數(shù)、Pielou 均勻度指數(shù)和Berger-Parker 優(yōu)勢(shì)度指數(shù), 研究了鰻弧菌核酸適配體的篩選中高頻序列的進(jìn)化多樣性, 結(jié)果發(fā)現(xiàn), 在篩選進(jìn)化過(guò)程中, 高頻序列的豐富度、多樣性、優(yōu)勢(shì)度和均勻度都在前6 輪出現(xiàn)劇烈的波動(dòng), 之后隨著篩選的進(jìn)行, 豐富度、多樣性和優(yōu)勢(shì)度都呈逐步增加趨勢(shì), 而均勻度則呈現(xiàn)逐步降低的趨勢(shì), 說(shuō)明含有大量核酸適配體的高頻序列在篩選競(jìng)爭(zhēng)中逐漸占據(jù)優(yōu)勢(shì), 其種類數(shù)量不斷增加, 競(jìng)爭(zhēng)優(yōu)勢(shì)越來(lái)越強(qiáng); 利用相對(duì)重要性指數(shù)(IRI)可將高頻序列分成優(yōu)勢(shì)序列、重要序列、常見序列、一般序列和少見序列, IRI 越高的序列在篩選進(jìn)化中的競(jìng)爭(zhēng)優(yōu)勢(shì)也越大, 也越有可能成為高親和力適配體;最后, 對(duì)IRI 較高的7 個(gè)核酸適配體的二級(jí)結(jié)構(gòu)進(jìn)行了模擬分析, 發(fā)現(xiàn)它們的二級(jí)結(jié)構(gòu)中都存在有大、中、小三種不同尺寸的環(huán)狀結(jié)構(gòu), 推測(cè)這些環(huán)的大小和數(shù)量是與靶目標(biāo)上的結(jié)合位點(diǎn)相對(duì)應(yīng)的。