區(qū)錦濤,吳 東,黃 丹,李 文* (.廣東醫(yī)科大學,廣東湛江 5403;.廣東醫(yī)科大學附屬醫(yī)院,廣東湛江 5400)
吸煙是全世界最主要的公共衛(wèi)生問題之一。在中國約有3.2億吸煙者[1]。煙草煙霧中包含了超過7 000種化合物,主動或被動煙霧暴露可導致多種呼吸系統(tǒng)疾病[2-3]。如慢性阻塞性肺疾病(COPD)最常見的環(huán)境危險因素是吸煙,與不吸煙者相比,吸煙者更容易出現(xiàn)呼吸系統(tǒng)癥狀和肺功能異常[4]。金屬硫蛋白(MT)是一類低分子量的蛋白家族,以重金屬和半胱氨酸含量高為主要特征。MT有重金屬解毒的功能,同時還具有抗氧化和抑制炎癥反應(yīng)的作用[5-6]。miRNA是長度約20個核苷酸的單鏈非編碼RNA,其在轉(zhuǎn)錄后調(diào)節(jié)基因表達的作用已引起廣泛關(guān)注[7]。hsa-miR-4722-5p于2011年 被Persson等[8]測序和鑒定,但目前仍未有其與COPD相關(guān)的研究。本文利用公共基因表達綜合數(shù)據(jù)庫(GEO),運用大樣本量的整合分析和生物信息學方法,探討吸煙對MT表達的影響及其潛在機制。
在GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/) 中獲取GSE97010和GSE14383矩陣數(shù)據(jù)。GSE-97010用于探索急性煙霧暴露對氣道基因表達的影響;GSE14383用于研究人支氣管上皮細胞長期暴露于低劑量香煙煙霧冷凝物(CSC)的影響。使用R語言GEOquery、Biobase、Bioc Generics和AnnotationDbi包,按以下標準進行探針過濾和基因映射:(1)排除無效和多基因注釋探針;(2)如果一個基因有多個探針,則選擇表達平均值最大的探針。對MT基因表達值進行l(wèi)og2轉(zhuǎn)換后,使用GraphPad Prism 8軟件繪制GSE97010矩陣急性煙霧暴露后MT表達差異、GSE14383矩陣CSC組與對照組MT表達差異。矩陣GSE97010急性煙霧暴露后與自身基礎(chǔ)狀態(tài)的比較進行配對t檢驗,P<0.05表示差異有統(tǒng)計學意義。
1.2.1 獲取和篩選微陣列數(shù)據(jù) 查詢GEO公共功能基因組數(shù)據(jù)庫(www.ncbi.nlm.nih.gov/geo/)進行篩選,關(guān)鍵字為“smoker”或“smoke”,選擇物種為“Homo sapiens”。 篩選標準依次為:(1)納入初始矩陣的獨占樣本,確保后續(xù)矩陣中被重新分析的樣本不會被重新納入;(2)檢測樣本取自氣道;(3)包含吸煙組與不吸煙組;(4)每組受試者人數(shù)3人及以上;(5)矩陣的基因表達值不能為零或 “不可用(NA)” 。19個基因矩陣(GSE10006、GSE10135、GSE11784、GSE11906、 GSE14633、 GSE19027、 GSE19722、GSE22047、 GSE3320、 GSE4302、 GSE43079、GSE43939、 GSE4498、 GSE5056、 GSE5057、GSE5059、GSE7895、GSE8545、GSE994)的753個獨占樣本被選出并用于整合分析。19個矩陣及其753個獨占樣本見表1。
1.2.2 探針過濾和基因映射 使用R語言GEOquery、Biobase、BiocGenerics和AnnotationDbi包,按以下標準進行探針過濾和基因映射:(1)排除無效和多基因注釋探針;(2)如果一個基因有多個探針,則選擇表達平均值最大的探針。對MT基因表達值進行l(wèi)og2轉(zhuǎn)換。
1.2.3 組內(nèi)相關(guān)系數(shù)(ICC) 選擇矩陣GSE22047中7位受試者的大、小氣道MT表達值,使用R語言irr包計算雙向隨機/混合模型、絕對一致性計算類型、單一度量的組內(nèi)相關(guān)系數(shù)[ICC(A,1)]作為衡量大、小氣道MT表達值一致性和可靠性的指標,并進行F檢驗。ICC取值在0~1,ICC<0.2說明一致性程度較差,0.2~0.4說明一致性程度一般,0.5~0.6說明一致性程度中等,0.7~0.8說明一致性程度較強,0.9~1.0說明一致性程度很強;P<0.05表示拒絕大、小氣道MT表達不一致的虛無假設(shè)。
表1 19個矩陣的基本特征
1.2.4 統(tǒng)計分析 使用篩選得到的19個微陣列矩陣、753個獨占樣本的基因表達值,對各矩陣吸煙與不吸煙組的表達差異進行整合分析,使用R語言meta、metafor包進行異質(zhì)性檢驗統(tǒng)計量法的Q檢驗、I2檢驗、H檢驗以評估各矩陣的異質(zhì)性,計算逆方差(IV)加權(quán)的標準化均數(shù)差(SMD);根據(jù)Cochrane干預措施系統(tǒng)評價手冊(version 5.0.1)及組內(nèi)相關(guān)系數(shù)分析結(jié)果,采用固定效應(yīng)模型(FEM)進行敏感性分析;采用漏斗圖不對稱的加權(quán)線性回歸檢驗評估發(fā)表偏倚。pval.Q<0.05表示矩陣間可能有顯著異質(zhì)性;0% 進一步篩選表1的19個矩陣,設(shè)定自變量x為吸煙者的packyear指數(shù)(吸煙指數(shù)=packyear×20),因變量y為吸煙者氣道MT表達值與不吸煙者平均值的log2變化倍數(shù),建立過原點(0,0)的線性回歸模型,斜率(即回歸系數(shù))為自變量x對因變量y干預效應(yīng)的大小,斜率非零的P值用于評估干預效應(yīng)的顯著性。建立吸煙者與不吸煙者氣道MT基因的表達差異與吸煙指數(shù)的線性回歸模型,并假設(shè)誤差服從均值為0的正態(tài)分布,自變量x、因變量y的注釋如下: 其中ai為不吸煙者的氣道MT表達值,bj、dj為吸煙者的氣道MT表達值、packyear指數(shù)。248個吸煙者、14個MT家族基因共2 473個點,使用GraphPad Prism 8軟件將2 473個點繪制散點圖,建立線性回歸模型,假設(shè)0 packyear指數(shù)的吸煙者氣道MT表達值與不吸煙者相等并強制線性回歸方程經(jīng)過原點(0,0),采用GraphPad Prism 8軟件分析線性回歸方程結(jié)果。 使用miRDB的自定義預測功能預測靶向16個MT的miRNA,CLUSTAL W軟件對16個MT的信使RNA進行多序列比對。 基因表達矩陣數(shù)據(jù)集GSE97010對63名吸煙者在急性吸煙暴露后與自身基礎(chǔ)狀態(tài)的氣道MT表達進行比較,發(fā)現(xiàn)除MT3外所有MT亞型表達均增高,其中MT1B、MT1H、MT1IP、MT1L、MT1M、MT1X和MT4的mRNA顯著上調(diào)(P<0.05或0.01)。見圖1。 圖1 急性煙霧暴露后MT的表達 基因表達矩陣數(shù)據(jù)集GSE14383顯示,CSC能夠誘導BEAS-2B細胞MT1和MT2的表達,而MT3和MT4的變化則不顯著。見圖2。 圖2 CSC對MT的影響 矩陣GSE22047的7位受試者大、小氣道MTICC(A,1)的中位數(shù)為0.8558。F檢驗P<0.05,拒絕虛無假設(shè),大、小氣道MT表達高度一致且可信度高。見表2。 整合分析結(jié)果顯示:MT1G和MT3可能有顯著異質(zhì)性但其效應(yīng)較低,只有MT1F可能存在中度異質(zhì)性或?qū)嵸|(zhì)性異質(zhì)性。吸煙組氣道MT1、MT2和MT3被顯著抑制,而長期煙霧暴露對MT4無顯著的干預效應(yīng)。敏感性分析在每次刪除1個矩陣數(shù)據(jù)后將重新計算的SMD與原SMD比較,沒有發(fā)現(xiàn)有任何一個矩陣在本次整合分析中起關(guān)鍵作用,發(fā)表偏倚不顯著。見表3。 由表4可知:樣本量>200的MT1、MT2、MT3線性回歸方程斜率<0且顯著非零,提示吸煙者氣道MT1、MT2、MT3的表達與吸煙指數(shù)呈顯著負相關(guān)(P<0.05),吸煙指數(shù)對氣道MT4表達的干預效應(yīng)不顯著(P>0.05)。 所有MT1、MT2、MT3亞型的miRNA預測結(jié)果的交集為hsa-miR-4722-5p,MT1、MT2、MT3亞型的信使RNA序列包含3~5個“CTCCTGC”片段,可與hsa-miR-4722-5p種子區(qū)域匹配,MT4的信使RNA序列未發(fā)現(xiàn)hsa-miR-4722-5p種子區(qū)域結(jié)合位點。hsa-miR-4722-5p可能參與MT1、MT2、MT3基因轉(zhuǎn)錄后調(diào)控。 盡管已有研究證明吸煙者氣道MT的表達被抑制,但很少有文獻詳細報道急、慢性煙霧暴露的氣道MT有相反的表達趨勢:矩陣GSE97010和GSE 14383分析所示,急性煙霧暴露和低劑量煙霧冷凝物能夠上調(diào)所有的MT1和MT2。我們根據(jù)公開的GEO矩陣數(shù)據(jù)集,通過對大量樣本的吸煙者與不吸煙者氣道MT表達譜進行整合分析,更加準確地評估了慢性煙霧暴露對氣道MT的抑制效應(yīng)。 表2 矩陣GSE22047的7名受試者大、小氣道MT表達的一致性 表3 MT表達差異的整合分析結(jié)果 圖3 吸煙者氣道MT變化倍數(shù)與packyear指數(shù)的關(guān)系 表4 吸煙者氣道MT變化倍數(shù)與packyear指數(shù)線性回歸模型的特征 圖4 hsa-miR-4722-5p靶向MT1、MT2、MT3的結(jié)合位點 研究發(fā)現(xiàn),與不吸煙者相比,吸煙者血液、腎臟、肝臟組織的MT mRNA和蛋白水平均升高,而上升的肺MT在持續(xù)煙霧暴露后又將降至正常[12]。尸體解剖亦發(fā)現(xiàn)重度吸煙者的肺MT表達下降,表明慢性煙霧暴露能夠特異性降低肺/氣道MT的表達,導致氣道對氧化應(yīng)激的敏感性增高,造成活性氧積累,破壞呼吸系統(tǒng)正常的修復和防御機制[13]。本研究首次證明了慢性吸煙者氣道MT1、MT2、MT3亞型的表達與吸煙指數(shù)顯著負相關(guān)。亦有研究證實吸煙者被抑制的MT即使在戒煙后仍難以回升,提示MT可能是COPD等吸煙相關(guān)肺疾病發(fā)生、發(fā)展的關(guān)鍵,可作為監(jiān)測吸煙強度的標志物[14-15]。 本研究使用生物信息學方法探索了慢性煙霧暴露抑制氣道MT1、MT2、MT3表達的潛在機制。根據(jù)miRDB預測結(jié)果和CLUSTAL W多序列比對,MT1、MT2、MT3的信使RNA高度同源,且包含“CTCCTGC”序列可與hsa-miR-4722-5p種子區(qū)域相匹配,較好地解釋了MT1、MT2、MT3同步下降及MT4無顯著變化的原因。但迄今為止,尚未有研究報道MT蛋白家族與hsa-miR-4722-5p的關(guān)系。 總之,本研究證實了慢性煙霧暴露能夠顯著抑制吸煙者氣道MT1、MT2、MT3亞型表達,且與吸煙指數(shù)呈顯著負相關(guān)。慢性煙霧暴露可能通過hsamiR-4722-5p抑制氣道MT1、MT2、MT3。MT和hsamiR-4722-5p或可為減少吸煙損傷和預防COPD等吸煙相關(guān)肺疾病的發(fā)展提供新的治療靶點。1.3 建立線性回歸模型
1.4 miRNA預測[10-11]
2 結(jié)果
2.1 急性煙霧暴露和CSC對MT的影響
2.2 長期煙霧暴露對氣道MT1、 MT2和MT3表達的影響
2.3 吸煙指數(shù)對氣道MT1、MT2和MT3的影響
2.4 hsa-miR-4722-5p對長期煙霧暴露氣道MT1、MT2、MT3的影響
3 討論