岳鵬鵬,黎成欽,農(nóng)月娟,陳 玲,付 燦,于鴻浩
(桂林醫(yī)學(xué)院 生物技術(shù)學(xué)院,廣西 桂林 541199)
成簇規(guī)律間隔短回文重復(fù)序列/Cas蛋白9(clustered regularly interspaced short palindromic repeats-CRISPR-associated 9,CRISPR/Cas9)系統(tǒng)是目前廣為使用的基因組編輯系統(tǒng)[1-3],具有設(shè)計簡單靈活、打靶高效以及低成本的特點(diǎn)[4],極大地推動了農(nóng)業(yè)和生物醫(yī)學(xué)等領(lǐng)域的發(fā)展[5-6],同時也為人類遺傳病的深入研究提供了可靠的研究手段[7]。
單純性大皰性表皮松懈癥(epidermolysis bullos simplex,EBS)是一種常染色體顯性遺傳病[8],也是一種嚴(yán)重的皮膚病?;颊咂つw的真皮膠原纖維結(jié)構(gòu)發(fā)生改變,皮膚、黏膜的脆性增加,輕微的機(jī)械摩擦或外傷可導(dǎo)致皮膚出現(xiàn)大皰性糜爛為特點(diǎn)的皮膚和黏膜機(jī)械應(yīng)激反應(yīng)[9]。目前該病的分子機(jī)制仍不清楚,治愈該病的方法也有待進(jìn)一步探索[10]。研究表明人KRT14突變是該病主要病因之一。正常人的皮膚內(nèi)KRT14編碼蛋白在表皮基底層和毛囊中表達(dá),是一種重要的結(jié)構(gòu)蛋白——角蛋白(keratins)。KRT14的突變具有高度的遺傳異質(zhì)性,不同突變類型引起的臨床癥狀、臨床表現(xiàn)亦不相同。因此,有必要篩查明確的、典型的KRT14強(qiáng)致病突變位點(diǎn),并將突變位點(diǎn)定位于小鼠基因組上,然后通過CRISPR/Cas9系統(tǒng)對該位點(diǎn)進(jìn)行打靶,方可建立Krt14突變細(xì)胞模型或小鼠動物模型,從而精準(zhǔn)的模擬單純性大皰性表皮松懈癥,對深入理解KRT14的致病機(jī)制以及探索可行的治療策略具有重要意義。
CRISPR/Cas9系統(tǒng)包括兩種質(zhì)粒,分別為單導(dǎo)RNA(single-guide RNA,sgRNA)表達(dá)質(zhì)粒pGL3-sgRNA-PGK-puromycin(addgene #51133)和Cas9表達(dá)質(zhì)粒pST1374-NLS-flag-linker-Cas9(addgene#44758);小鼠胚胎成纖維細(xì)胞系NIH 3T3(廣州大學(xué)周建奎博士惠贈),實驗所需的其他試劑參考已發(fā)表的文章[11]。
1.2.1 人KRT14致病位點(diǎn)的篩查:單純性大皰性表皮松懈癥是由KRT14突變引起的,首先利用OMIM數(shù)據(jù)庫篩查人KRT14的致病突變;再利用ExAC在線數(shù)據(jù)庫檢索KRT14功能失活突變;同時利用ClinVar數(shù)據(jù)庫檢索KRT14致病突變情況。綜合分析3個數(shù)據(jù)的結(jié)果,確定人KRT14典型的、明確的強(qiáng)致病變異位點(diǎn)。
1.2.2 sgRNA的設(shè)計與合成:本研究利用Clustal Omega在線軟件比對人KRT14和小鼠KRT14蛋白序列,在蛋白水平將人典型的、明確的強(qiáng)致病變異位點(diǎn)定位于小鼠KRT14蛋白上,找到小鼠的KRT14擬突變位點(diǎn)。然后從Ensembl數(shù)據(jù)庫中導(dǎo)出小鼠Krt14基因序列,利用Vector NTI軟件定位擬突變位點(diǎn)的DNA編碼序列,圍繞小鼠的擬突變位點(diǎn)設(shè)計基因靶點(diǎn)。利用Vector NTI軟件找到擬突變位點(diǎn)附近的特征序列作為本研究的靶點(diǎn),Blast分析確定靶點(diǎn)在基因組內(nèi)的唯一性。根據(jù)確定的打靶位點(diǎn)DNA序列合成sgRNA的互補(bǔ)寡核苷酸序列,合成時在互補(bǔ)雙鏈的5′加上黏性末端序列,便于后續(xù)的sgRNA表達(dá)載體構(gòu)建。
1.2.3 sgRNA表達(dá)載體的構(gòu)建:sgRNA表達(dá)載體的構(gòu)建步驟主要包括寡核苷酸的退火、pGL3-U6-sgRNA表達(dá)載體的酶切和回收、退火產(chǎn)物和酶切產(chǎn)物的連接等,詳細(xì)參考已發(fā)表文章[11]最終成功構(gòu)建了pGL3-U6-Krt14-sgRNA1、pGL3-U6-Krt14-sgRNA2、pGL3-U6-Krt14-sgRNA3和pGL3-U6-Krt14-sgRNA4等4個表達(dá)質(zhì)粒。
1.2.4 細(xì)胞的培養(yǎng)、轉(zhuǎn)染及藥物篩選:將小鼠NIH3T3細(xì)胞培養(yǎng)于含5%胎牛血清的DMEM完全培養(yǎng)基中,37 ℃、5% CO2培養(yǎng)箱中增殖,每2 ~ 3 d更換新鮮培養(yǎng)基,待細(xì)胞匯合度達(dá)到80%~90%,以0.25%胰蛋白酶消化并傳代接種至6孔板中,16~18 h后待細(xì)胞匯合度達(dá)到80%~90%時進(jìn)行轉(zhuǎn)染。
采用LipofectamineTM3000 Transfection Reagent(InvitrogenTM)試劑盒分別將pGL3-U6-KRT14-sgRNA1質(zhì)粒、pGL3-U6-KRT14-sgRNA2質(zhì)粒、pGL3-U6-KRT14-sgRNA3質(zhì)粒、pGL3-U6-KRT14-sgRNA4質(zhì)粒和pST1374-NLS-flag-linker-Cas9質(zhì)粒共轉(zhuǎn)染小鼠NIH 3T3細(xì)胞。轉(zhuǎn)染時,sgRNA表達(dá)質(zhì)粒2.5 μg,Cas9表達(dá)質(zhì)粒2.5 μg。
轉(zhuǎn)染24 h后,用10 μg/mL的嘌呤霉素和20μg/mL的殺稻瘟菌素進(jìn)行藥物篩選48~72 h,分別得到陽性的sgRNA1-Cas9、sgRNA2-Cas9、sgRNA3-Cas9和sgRNA4-Cas9共轉(zhuǎn)染細(xì)胞。然后,將上述4組共轉(zhuǎn)染細(xì)胞用磷酸鹽緩沖液洗滌3次,然后用0.25%的胰蛋白酶消化,并離心收集,待用。
1.2.5 打靶效率和基因型分析:打靶效率分析時,收集共轉(zhuǎn)染的藥篩陽性細(xì)胞,并采用PCR的方法擴(kuò)增打靶位點(diǎn)區(qū)域的DNA,Sanger測序判斷是否發(fā)生了基因編輯,詳細(xì)參考發(fā)表的文章[11]。
基因型分析時,將PCR產(chǎn)物進(jìn)行TA克隆,隨機(jī)挑選菌落進(jìn)行測序,然后使用Snapgene進(jìn)行序列對比,找到靶點(diǎn)位置的變異序列,具體參考已發(fā)表文章[11]。
OMIM數(shù)據(jù)庫篩查結(jié)果表明單純性大皰性表皮松懈癥(EBS)是由KRT14突變所引起,共篩查到17個突變位點(diǎn)(表1);ExAC在線數(shù)據(jù)庫檢索到KRT14功能失活突變9種(表2);ClinVar數(shù)據(jù)庫共檢索到36種突變(表3)。OMIM與ExAC數(shù)據(jù)庫的結(jié)果吻合度不高,鑒于ExAC數(shù)據(jù)庫僅提供了變異情況并未給出表型和致病性的數(shù)據(jù),本文以O(shè)MIM檢索結(jié)果為主要判定依據(jù)。KRT14p.Arg125致病位點(diǎn)同時在OMIM和ClinVar數(shù)據(jù)庫中收錄,說明該位點(diǎn)為較為明確的致病位點(diǎn)。
表1 OMIM數(shù)據(jù)庫中人KRT14致病突變情況Table 1 Pathogenic mutations of human KRT14 in OMIM database
表2 ExAC數(shù)據(jù)庫中人KRT14功能失活突變情況Table 2 Mutation of human KRT14 function inactivation in ExAC database
表3 ClinVar數(shù)據(jù)庫中人KRT14缺失突變情況Table 3 Human KRT14 deletion mutation in ClinVar database
由于人和小鼠的物種差異,同一功能基因的基因結(jié)構(gòu)可能并不相同。本文比對了人KRT14和小鼠KRT14蛋白序列,發(fā)現(xiàn)人KRT14 p.Arg125位點(diǎn)與小鼠KRT14 p.Arg131位點(diǎn)相對應(yīng)(圖1)。然后從Ensembl數(shù)據(jù)庫中導(dǎo)出小鼠Krt14基因序列,利用Vector NTI軟件定位p.Arg125位點(diǎn)的DNA編碼序列,然后在其附近設(shè)計了4個打靶位點(diǎn),分別為Krt-M-sgRNA1、Krt-M-sgRNA2、Krt-M-sgRNA3和Krt-M-sgRNA4(圖2)。
The black line indicated that the human KRT14 p.Arg125 site corresponds to the mouse KRT14 p.Arg131 site圖1 人KRT14蛋白與小鼠KRT14蛋白序列比對結(jié)果Fig 1 Alignment results of human KRT14 protein and mouse KRT14 protein sequence
圖2 小鼠Krt14靶點(diǎn)及sgRNA序列Fig 2 Mouse Krt14 targets and sgRNA sequences
上述4個sgRNA單導(dǎo)向序列的5′端加上“accg”合成得到正向寡核苷酸序列(表4);在DNA互補(bǔ)鏈的5′端加上“aaac”合成得到反向寡核苷酸序列(表4)經(jīng)退火、連接轉(zhuǎn)化、質(zhì)粒提取以及測序鑒定等成功構(gòu)建了4種sgRNA表達(dá)質(zhì)粒(圖3)。測序引物為U6通用引物。
表4 化學(xué)合成的正向寡核苷酸和反向寡核苷酸Table 4 Chemically synthesized forward and reverse oligonucleotides
The blue background represented the inserted sgRNA sequence;A.pGL3-U6-KRT14-sgRNA1 plasmid sequencing diagram;B.pGL3-U6-KRT14-sgRNA2 plasmid sequencing diagram;C.pGL3-U6-KRT14-sgRNA3 plasmid sequencing diagram;D.pGL3-U6-KRT14-sgRNA4 plasmid sequencing diagram圖3 sgRNA表達(dá)質(zhì)粒測序峰圖Fig 3 sgRNA expression plasmid sequencing peak map
以藥篩陽性細(xì)胞裂解液為模板進(jìn)行PCR擴(kuò)增,擴(kuò)增產(chǎn)物包含打靶位點(diǎn)區(qū)域,引物序列見(表5)。Sanger測序發(fā)現(xiàn)4個靶點(diǎn)位置均有套峰出現(xiàn),說明靶點(diǎn)位置呈現(xiàn)不同的DNA序列,表明打靶成功(圖4),其中KRT14-M-sgRNA4的打靶位點(diǎn)序列在測序結(jié)果中已完全檢索不到,表明突變效率很高。
圖4 打靶位點(diǎn)PCR產(chǎn)物測序峰圖Fig 4 Peaking sequence of PCR products including the target site
表5 打靶位點(diǎn)PCR擴(kuò)增引物Table 5 PCR primers for amplification of the target site
將上述打靶成功的PCR產(chǎn)物進(jìn)行膠回收,并克隆至pMD19載體中,利用通用測序引物M13F進(jìn)行測序,根據(jù)測序結(jié)果進(jìn)行基因分型分析。每個位點(diǎn)隨機(jī)送測20個菌落克隆(圖5),測序結(jié)果與原序列比對分析表明,在Krt-M-sgRNA1、Krt-M-sgRNA2、Krt-M-sgRNA3和Krt-M-sgRNA4靶點(diǎn)位置發(fā)生了堿基的隨機(jī)插入和缺失,編輯效率分別為70%、90%、65%和100%(圖6)。
通?;蚯贸难芯恐性谠O(shè)計打靶位點(diǎn)時主要遵循的原則包括選擇前1/2外顯子作為設(shè)計區(qū)域[12]、涉及多個轉(zhuǎn)錄本的基因時選擇保守的外顯子區(qū)域來設(shè)計靶點(diǎn)、選擇低脫靶效應(yīng)的位點(diǎn)作為靶點(diǎn)等。其目的是基于CRISPR/Cas9系統(tǒng)在靶點(diǎn)位置形成移碼突變,使基因功能失活,進(jìn)一步研究基因功能等[13]。本研究的主要目的是通過編輯小鼠Krt14模擬人類KRT14基因的致病變異,為后續(xù)建立Krt14基因工程小鼠奠定基礎(chǔ),可見本文的研究目的與一般的基因敲除研究基因功能略有不同。因此本文通過多個數(shù)據(jù)庫的檢索篩查人KRT14基因的變異及致病情況,試圖找到明確的、典型的強(qiáng)致病位點(diǎn)。3個數(shù)據(jù)庫KRT14基因變異情況的比對結(jié)果顯示KRT14 p.Arg125位點(diǎn)被OMIM和ClinVar兩個數(shù)據(jù)庫同時收錄,并明確為致病位點(diǎn)。此外,該位點(diǎn)也位于整個蛋白序列的前1/2,符合基因打靶的一般規(guī)則。明確擬突變位點(diǎn)后,本研究進(jìn)一步通過蛋白序列比對,將該位點(diǎn)定位于小鼠KRT14蛋白中,再根據(jù)其編碼DNA序列和CRISPR/Cas9系統(tǒng)對序列結(jié)構(gòu)的要求設(shè)計了4個sgRNA序列。
為了驗證設(shè)計的sgRNA打靶效率,本文構(gòu)建了sgRNA表達(dá)載體,并與Cas9表達(dá)載體共轉(zhuǎn)染小鼠3T3細(xì)胞。轉(zhuǎn)染效率以及sgRNA和Cas9在細(xì)胞中的表達(dá)量是影響最終編輯效力的關(guān)鍵因素。為提高轉(zhuǎn)染效率,本研究選擇LipofectamineTM3000 Transfection Reagent進(jìn)行轉(zhuǎn)染,效果良好。此外,也使用高劑量的藥物進(jìn)行篩選,以殺傷陰性轉(zhuǎn)染細(xì)胞以及sgRNA和Cas9低表達(dá)的陽性細(xì)胞,從而提高打靶效率。4個位點(diǎn)的打靶效率分別為70%、90%、65%和100%,均超過50%,表明打靶效率較高。
M.DL2000 plus DNA marker;the number represented the colony number圖5 菌液PCR驗證陽性克隆電泳圖Fig 5 Electrophoresis of positive clones verified by bacterial PCR
Bold fonts were target sequences and italics were PAM structures;lowercase letters represented insertion sequences;“-” represented deletion bases;“+N” and “-N” represented insertion and deletion base numbers;“N/N”represented the number of genotypes and the total number of clones sent for testing圖6 4個靶點(diǎn)的基因型Fig 6 Genotypes of the 4 targets
小鼠NIH 3T3細(xì)胞是普遍使用的細(xì)胞系,培養(yǎng)條件簡單、易操作,且目標(biāo)打靶序列與C57/B6J遺傳背景小鼠的序列一致,因此本文選擇在NIH 3T3細(xì)胞上評估建立的靶向Krt14基因CRISPR/Cas9系統(tǒng)的打靶效率,為后續(xù)通過受精卵注射構(gòu)建Krt14基因敲除小鼠模型提供理論支撐。雖然NIH 3T3細(xì)胞具有其優(yōu)點(diǎn),但是耐藥性不穩(wěn)定,與其細(xì)胞狀態(tài)和培養(yǎng)條件密切相關(guān),造成藥物篩選濃度的不確定性。本研究采用的高劑量藥物篩選的策略以得到陽性轉(zhuǎn)染細(xì)胞,并使用TransDirect?Animal Tissue PCR kit試劑盒裂解細(xì)胞,釋放基因組DNA,用于打靶效率檢測,效果良好。