趙海東,陳平博,韋燕佩,鄔明麗,易曉華,杜敏杰,魏澤輝*,孫秀柱*
(1.西北農林科技大學 動物科技學院,陜西 楊凌 712100;2.成都中科奧格生物科技有限公司,四川 成都 610000)
基因編輯技術因其能夠定向改造動物基因組相關信息的強大功能受到研究者的追捧,其在建立疾病模型、培育新型轉基因動物品種和治療人類疾病等尖端科研領域具有劃時代的作用。隨著相關研究的不斷推進,基因編輯動物上存在的某些問題也逐漸引起了社會的關心與擔憂,其中對基因編輯動物“早衰”和“抵抗力低”等問題尤為重視。隨著基因編輯動物技術的日漸成熟和群體規(guī)模的不斷擴大,對基因編輯動物環(huán)境適應能力的研究顯得尤為重要,同時這也是基因編輯動物是否具有市場推廣價值的重要評價環(huán)節(jié)。
鋅指蛋白6(zinc finger BED-type containing 6,)基因是近年來新發(fā)現(xiàn)的一個重要的轉錄因子,該基因位于豬基因第一內含子區(qū)段,其調控模式傾向于與宿主基因共用調控區(qū),本身僅含有一個外顯子,在哺乳動物當中較為保守。同時,基因在哺乳動物中具有能夠保守性調控IGF2(Insulin-like growth factor 2)的功能,通過結合內含子區(qū)段的GCTCG序列調節(jié)表達的效率,提升豬產肉量,以期能夠創(chuàng)制一個高產肉豬新品種。潘登科通過CRISPER/Cas9技術獲得了基因敲除豬群體,并對其在肌肉發(fā)育、血液生化和心臟發(fā)育等方面進行了相應的研究。但其環(huán)境適應能力和免疫機能是否健康、健全均未從分子層面加以明確。脾臟是哺乳動物集體重要的免疫器官,能夠作為免疫球蛋白的成熟器官參與機體免疫功能。因此,本研究擬通過對-SKO和WT組基因編輯豬脾臟組織進行轉錄組測序,通過生物信息學方法對其分子層面的差異表達基因進行分析,獲得基因編輯豬免疫功能是否正常的相關分子層面數據資料,以期為基因編輯動物安全性評價和環(huán)境適應能力評價提供科學依據。
Trizol購自Takara公司。主要儀器有PCR儀(伯樂),凝膠成像系統(tǒng)(伯樂),微量分光光度計(賽默飛)。
試驗用基因單等位基因敲除巴馬小型豬()4份脾臟組織樣本和半同胞野生型巴馬小型豬()3份脾臟組織樣本由成都中科奧格生物科技有限公司潘登科團隊饋贈?;蚯贸i采用CRISPR/Cas9技術制備,在其外顯子區(qū)產生1 bp 缺失使得基因發(fā)生移碼突變達到對該基因的敲除,通過PCR擴增結合sanger測序驗證敲除位點,使用正向引物為: 5'-GCTTTGTTAGCGTCTGATGCC-3',反向引物為:5'-AGGTTACAAATTGCCCGCCA-3'。
組織樣品收集并保存于液氮中,采用Trizol法對7個脾臟樣本進行RNA提取,使用NanoDrop 1000和凝膠電泳對RNA的質量進行檢驗,RNA樣本檢驗合格后,送上海生工生物科技有限公司進行文庫構建及測序。文庫構建完成后對建成文庫的質量進行檢測,文庫質量合格后,利用Illumina 1.9測序平臺對7個樣本進行雙端150 bp高通量測序。
1.4.1 質控與比對 對測序的原始數據通過FastQC進行質量評估,通過Trimmomatic進行質量剪切,得到相對準確的有效數據。使用HISAT2將樣本有效數據比對到參考基因組上,統(tǒng)計Mapping信息。采用Qualimap根據比對結果進行均一性分布檢查、基因組結構分布等分析。利用BEDTools進行基因覆蓋率統(tǒng)計分析和染色體上測序序列分布等分析。
1.4.2 表達差異分析 使用StringTie和已知的基因模型對測序所得數據進行基因表達量的計算,對測序數據獲得的表達數量,考慮到基因長度、測序深度和樣本的不同,采用TPM (Transcripts Per Million)對基因表達量進行估算。針對-SKO 組和對照組脾臟測序數據,使用DESeq2進行基因表達差異分析獲得表達具有顯著差異的基因集(<0.05),采用Z-score對差異表達數據進行歸一化,采用hclust對差異表達數據進行層級聚類,對獲得的結果使用pheatmap進行可視化。獲取組間基因表達FDR值小于0.05的基因集,通過模塊表達分析對基因的表達模式進行鑒定。
1.4.3 差異表達基因的KOG分類、GO分類和 KEGG富集分析 基于對-SKO型和WT型豬脾臟組織以FDR<0.05位條件獲得差異表達基因,利用topGO軟件對獲得的差異表達基因進行GO注釋并進行可視化,對獲得的差異表達基因使用clusterProfiler進行KEGG通路和KOG分類富集分析與可視化。
通過Sanger測序驗證敲除位點正確,存在1 bp缺失造成基因移碼(圖1)。針對-SKO 組和對照組脾臟進行測序,每個樣本測序獲得6 Gb以上數據,并使用FastQC對樣本的測序數據質量進行可視化評估,包括原始序列、過濾后序列、質控率和Q30等數據(表1)。測序數據的過濾后數據比率和Q30數據比率均超過90%,滿足后續(xù)生物信息學分析需求。
圖1 ZBED6基因敲除位點sanger測序驗證
表1 測序數據質量控制
以TPM為對象篩選-SKO組和WT組,以<0.05為條件獲取顯著差異表達基因集,共獲得下調基因85個,上調基因62個,對獲得的結果使用pheatmap進行可視化(圖2)。通過FDR值小于0.05對差異表達基因進行校正,獲得上調基因5個,下調基因4個,分別是Interleukin 4 receptor()、Dephospho-CoA kinase domain containing()、Family with sequence similarity 91 member A1()、Zinc finger protein 140()、ATPase H+ transporting V1 subunit D()、Endonuclease V()、Zinc finger protein333 ()、Procollagen-lysine,2-oxoglutarate 5-dioxygenase 2()、--211859(novel gene)(表2)。對差異表達基因進行模塊表達分析分為4個模塊,其中2個上調模塊和2個下調模塊(圖3)。上調模塊為Subcluster 2(和)和Subcluster 3(和),下調模塊為Subcluster 1(和)和Subcluster 2(和)(表3)。
表2 Q檢驗差異表達基因
表3 差異表達基因模塊信息
圖2 差異基因表達量聚類熱圖
圖3 差異基因各模塊表達趨勢折線圖
對獲得的9個差異表達基因進行比對和功能注釋。在GO分析體系中,對前20條GO富集進行可視化,發(fā)現(xiàn)3個基因注釋于GO:0034641 : cellular nitrogen compou,2個基因注釋于GO:0051186 : cofactor metabolic process,2個基因注釋于GO:0006575 : cellular modified amino,但均未發(fā)現(xiàn)顯著富集GO功能(圖4)。在KEGG分析中,富集到20條通路,其中ssc00280:Valine, leucine and isoleucine degradation通路顯著性為0.09,ssc04530:Tight junction通路顯著性為0.16,未富集到顯著差異代謝通路信息(圖5)。通過對KOG富集分析發(fā)現(xiàn)Coenzyme transport and metabolism、General function prediction only、Function unknown和Posttranslational modification, protein turnover, chaperones被富集,但并未富集到顯著KOG信息(圖6)。
圖4 差異表達基因 GO 功能分類圖
圖5 差異表達基因 KEGG功能分類圖
圖6 差異表達基因 KOG 功能分類圖
隨著基因編輯動物育種群體和基因編輯動物實驗模型群體的不斷擴展,關于基因編輯動物安全評價的相關研究逐漸被重視。一方面,在基因編輯動物生產的長期實踐當中,成功率極低,且基因編輯動物個體可能存在一定程度的異常風險;另一方面,基因編輯動物群體在長期飼養(yǎng)過程中,其繁殖能力、體況外貌和健康指標等均與野生型動物不存在明顯差異。一定程度上,基因編輯動物在經過重編程的過程中有可能出現(xiàn)相當大比例的“重啟失敗”現(xiàn)象,但在成功獲得健康基因編輯動物后,研究者對于其免疫機能和機體健康方面的研究則極少涉及。基因編輯操作對動物是否會產生潛在的免疫影響尚不得而知。
6基因作為一個近年來新發(fā)現(xiàn)的轉錄因子,是一個重要的瘦肉型家畜新品種創(chuàng)制靶標,眾多研究者通過基因編輯手段對其功能機制進行闡明與驗證。6基因的作用機制主要依賴于靶向結合2基因內含子區(qū)GCTCG序列產生對IGF2及其下游通路的調控作用,進而影響豬肌肉發(fā)育相關功能。一方面唐雨婷通過敲除6基因豬的模型研究發(fā)現(xiàn),敲除6基因能夠上調血液中IGF2的水平;另一方面Liu等通過編輯豬2基因上的6結合位點后發(fā)現(xiàn)其能夠直接促進豬的肌肉發(fā)育水平。
脾臟是動物體重要的免疫器官,針對脾臟基因表達模式的研究將為基因編輯動物免疫功能是否較預期存在問題獲得相對具有說服力的數據支持。據此,本研究收集6基因敲除豬脾臟樣本,通過轉錄組測序手段,對其差異表達基因進行相關生物信息學分析,共發(fā)現(xiàn)9個差異表達基因(FDR<0.05),其中上調基因5個,下調基因4個,分別是4、、911、140、61、、333、2、--211859,在同等飼養(yǎng)條件下,6-SKO組較其半同胞或全同胞WT型對照組差異表達基因數量極為有限,并未發(fā)現(xiàn)能夠顯著影響脾臟免疫機能的差異表達基因。
針對差異表達基因進行分析。IL4R是一個重要的炎癥因子受體,其表達量上調表明基因編輯豬在可能處于一定程度上的應激狀態(tài),但其并未產生其他相關因子的變化,這種變化仍需在后續(xù)大群體樣本中進行檢測和持續(xù)關注。同時IL4具有肌肉發(fā)生相關功能,其受體的上調可能與脾臟組織因IGF2上調導致的生長發(fā)育變化應答有關?;蚴谴竽X相關過程的調節(jié)因子,與帕金森病的發(fā)生具有一定的相關性,并未有研究發(fā)現(xiàn)其與動物免疫機能之間的關系。911作為一個超甲基化基因,其表達量的異??赡芘c克隆豬在重編程過程中表觀遺傳產生的某種特殊變化有關,同時該基因功能與細胞增殖存在一定的相關性。140基因是鋅指蛋白家族的轉錄因子,其功能與骨髓增生異常存在一定的相關關系,但其在本研究中6基因敲除豬脾臟中表達下調的機制尚不明確。61基因與細胞自噬存在一定的相關性,是真核細胞廣泛存在的液泡型ATP酶的一個亞單位,對其抑制能夠起到抑制腫瘤細胞生長、侵襲和轉移的作用。Nakadera等發(fā)現(xiàn)61參與抑制mTOR可改善肝脂肪變性引起的自噬小泡酸化損傷。Wang等研究發(fā)現(xiàn)61參與TFEB介導的胰腺炎發(fā)生過程中的溶酶體自噬相關生物學功能。ENDOV是一種細胞內DNA損傷保護因子,它能夠識別和切割含有次黃嘌呤的DNA,其切割位點為損傷堿基次黃嘌呤下游3′端的第二個磷酸二酯鍵,在嗜熱細菌基因組穩(wěn)定性中具有重要的作用,其在動物中可能具有較為相似的功能,該基因的下調可能與基因編輯動物DNA的穩(wěn)定性具有一定的關系,也可能參與部分細胞癌變的過程,但僅僅這一個基因的表達變化并不足以導致基因編輯豬遺傳穩(wěn)定性上的障礙。333基因也是鋅指蛋白家族的轉錄因子,具有ZFN家族保守性結構,尚未有文獻報道其相關功能,因此異常表達在6基因敲除豬脾臟中的意義尚不得而知。2基因與纖維化疾病之間存在顯著關系,其作為賴氨酸羥化酶2的編碼基因,直接參與器官纖維化的形成。該基因廣泛參與多種生物學功能,一定程度上該基因高表達組織具有一定的纖維化風險,但在本研究中6基因敲除豬脾臟中2基因低表達的意義尚不明確。--211859基因作為一個新基因,其功能未見報道。在對差異表達基因的GO聚類、KEGG聚類和KOG聚類分析中均未發(fā)現(xiàn)顯著富集的生物學信息與功能,一定程度上表明在6基因敲除后,其脾臟代謝并未發(fā)生較大的變化,其免疫功能并未產生所擔心的基因編輯動物“免疫力差”等問題,但不可否認,本研究僅對6這一個基因編輯豬群體進行檢測,其功能在基因編輯動物的大概念上是否適用尚需長期和擴展觀測。
通過轉錄組測序技術對6-SKO和WT豬脾臟進行鑒定,共發(fā)現(xiàn)9個差異表達基因(FDR<0.05),在GO分析、KEGG分析和KOG分析中均為發(fā)現(xiàn)明顯的能夠支持基因編輯豬免疫缺陷問題的相關證據。因此,6基因敲除豬在免疫功能上一定程度未發(fā)現(xiàn)明顯的因基因編輯相關操作所造成的“免疫功能障礙”相關問題,為開展基因編輯動物育種提供相應的理論依據。