康萬(wàn)里 端木宏謹(jǐn) 鄭素華
疾病的流行特征通過疾病在人群、時(shí)間、空間的三間分布得以實(shí)現(xiàn),是流行過程的可見形式。研究疾病的人群分布是流行病學(xué)研究中一個(gè)非常重要的部分,疾病的發(fā)病隨人群中的一些固有特征或社會(huì)特征的不同而有差異,這些特征有年齡、性別等因素,研究這些相關(guān)因素特征,有助于探索疾病的危險(xiǎn)因素和流行特征。疾病與年齡的關(guān)聯(lián)性較強(qiáng),隨年齡的不同,幾乎大部分疾病的發(fā)病率或死亡率顯著不一。將同一時(shí)期出生的人劃歸一組稱為出生隊(duì)列(birth cohort),可對(duì)其隨訪若干年,以觀察疾病患病和死亡情況。利用出生隊(duì)列資料將疾病年齡分布和時(shí)間分布結(jié)合起來(lái)描述的一種方法稱出生隊(duì)列分析方法,該方法在評(píng)價(jià)疾病的年齡分布長(zhǎng)期變化趨勢(shì)及提供病因線索等方面具有很大意義[1]。
結(jié)核病(tuberculosis)是由結(jié)核分枝桿菌(Mycobacterium tuberculosis,簡(jiǎn)稱“結(jié)核桿菌”)主要經(jīng)呼吸道傳播引起的全身慢性傳染病。結(jié)核病是危害人類健康的主要傳染病之一,據(jù)世界衛(wèi)生組織(WHO)估計(jì),全球大約有1/3的人感染了結(jié)核桿菌,每年新發(fā)結(jié)核病患者超過800萬(wàn),并有200萬(wàn)人死于結(jié)核?。蝗虺^90%的結(jié)核病患者及90%的結(jié)核病死亡發(fā)生在發(fā)展中國(guó)家,75%的結(jié)核病患者年齡在15~54歲之間,由于結(jié)核病導(dǎo)致的經(jīng)濟(jì)損失,約占家庭收入的20%~30%[2]。結(jié)核病的流行已成為一個(gè)社會(huì)關(guān)注的公共衛(wèi)生問題,為了更好地了解我國(guó)結(jié)核病的流行狀況,我國(guó)已經(jīng)進(jìn)行了4次全國(guó)結(jié)核病流行病學(xué)抽樣調(diào)查(簡(jiǎn)稱“流調(diào)”)(2010年開展第5次流調(diào),詳細(xì)結(jié)果有待公布)。本研究利用我國(guó)第3次和第4次全國(guó)結(jié)核病流調(diào)資料,利用出生隊(duì)列研究我國(guó)菌陽(yáng)肺結(jié)核的分布特征,以確定高危人群和提出重點(diǎn)保護(hù)對(duì)象,并為制定預(yù)防措施及評(píng)價(jià)預(yù)防效果提供依據(jù),為我國(guó)今后的結(jié)核病控制提供依據(jù)。
收集1990年第3次和2000年第4次全國(guó)結(jié)核病流調(diào)結(jié)果[3-4],建立相關(guān)數(shù)據(jù)庫(kù),并進(jìn)行變量賦值,見表1。第3次全國(guó)結(jié)核病流行病學(xué)抽樣調(diào)查共調(diào)查1461190例,其中男性738075例,女性723 115例;第3次全國(guó)流調(diào)發(fā)現(xiàn)菌陽(yáng)肺結(jié)核患者2389例,其中男性1537例,女性852例。第4次全國(guó)結(jié)核病流行病學(xué)抽樣調(diào)查共調(diào)查365 097例,其中男性182183例,女性182 914例;第4次全國(guó)流調(diào)發(fā)現(xiàn)菌陽(yáng)肺結(jié)核患者584例,其中男性411例,女性173例。
表1 變量賦值
檢查、核對(duì)原始數(shù)據(jù),分析變量賦值,統(tǒng)計(jì)分析采用SPSS 13.0和Stata 10.0軟件。
1.負(fù)二項(xiàng)回歸(negative binomial regression,NBREG)[5-6]:負(fù)二項(xiàng)分布(negative binomial distribution)常用來(lái)描述計(jì)數(shù)資料的分布特征。擬合計(jì)數(shù)資料的廣義線性模型,實(shí)質(zhì)上就是探討λ與自變量線性組合Xβ之間的關(guān)系。事件數(shù)的多少除了取決于總體參數(shù)λ的大小外,還取決于暴露單位、暴露事件等的多少。因此,模型中應(yīng)當(dāng)既體現(xiàn)自變量的線性組合作用,也要考慮到暴露單位的多少。設(shè)因變量y服從參數(shù)為λ的負(fù)二項(xiàng)分布,影響λ的因素為x1,x2,x3……xm(m 為影響λ 因素的個(gè)數(shù)),負(fù)二項(xiàng)回歸模型是對(duì)事件發(fā)生強(qiáng)度λ進(jìn)行建模:
βi為偏回歸系數(shù),解釋為當(dāng)其他自變量保持不變時(shí),自變量xi每改變1個(gè)單位時(shí),ln()的改變量。κ表示超離散的程度,可以進(jìn)行似然比卡方檢驗(yàn),如果P<0.05,有統(tǒng)計(jì)學(xué)意義,說(shuō)明資料符合負(fù)二項(xiàng)分布。
2.對(duì)應(yīng)分析(correspondence analysis)[7]:主要用于分析二維列聯(lián)表中行變量和列變量間的對(duì)應(yīng)關(guān)系,將行變量和列變量的信息用散點(diǎn)的空間位置關(guān)系的形式表示。
各年齡組菌陽(yáng)肺結(jié)核患病率基本上男性多于女性,各年齡組菌陽(yáng)肺結(jié)核患病率隨年齡變化趨勢(shì)基本相同(圖1)。
圖1 1990年和2000年菌陽(yáng)肺結(jié)核患病率的年齡、性別分布
根據(jù)1990年第3次和2000年第4次流調(diào)結(jié)果,繪制1910~、1920~、1930~、1940~、1950~、1960~、1970~、1980~共8個(gè)年代出生隊(duì)列的菌陽(yáng)肺結(jié)核患病率分布圖,基本上出生時(shí)期越早,菌陽(yáng)肺結(jié)核患病率越高(圖2)。
圖2 菌陽(yáng)肺結(jié)核患病率的出生隊(duì)列分布
將1910~、1920~、1930~、1940~、1950~、1960~、1970~、1980~共8個(gè)年代的出生隊(duì)列與菌陽(yáng)肺結(jié)核進(jìn)行負(fù)二項(xiàng)回歸分析,設(shè)出生隊(duì)列為有序分類變量。對(duì)超離散度檢驗(yàn),P<0.001,說(shuō)明資料符合負(fù)二項(xiàng)回歸模型。按照出生隊(duì)列賦值,相鄰的出生隊(duì)列,出生較早的隊(duì)列患菌陽(yáng)肺結(jié)核風(fēng)險(xiǎn)高于出生較晚的隊(duì)列,RR=1.582 (95%CI:1.432~1.747),即“1970~年代出生隊(duì)列”患菌陽(yáng)肺結(jié)核的風(fēng)險(xiǎn)是“1980~年代出生隊(duì)列”的1.582倍,“1960~年代出生隊(duì)列”是“1970~年代出生隊(duì)列”的1.582倍……,見表2。
由表2可知,1910~年代出生隊(duì)列患菌陽(yáng)肺結(jié)核的風(fēng)險(xiǎn)是1980~年代出生隊(duì)列的24.800倍(95%CI:12.348~49.665);1920~年代出生隊(duì)列患菌陽(yáng)肺結(jié)核的風(fēng)險(xiǎn)是1980~年代出生隊(duì)列的15.676倍(95%CI:8.623~28.429)。
依據(jù)菌陽(yáng)肺結(jié)核患病率是否高于全國(guó)的平均值,將菌陽(yáng)肺結(jié)核患病率分為菌陽(yáng)患病率高于、低于全國(guó)平均水平兩部分,繪制對(duì)應(yīng)分析圖(圖3)。圖3中用散點(diǎn)坐標(biāo)形式顯示出了各變量在兩個(gè)維度上的區(qū)分程度。閱讀對(duì)應(yīng)分析圖的原則是,從圖形中心(0,0)點(diǎn)出發(fā),如代表行變量某個(gè)類別或等級(jí)的散點(diǎn),與代表列變量某個(gè)類別或等級(jí)的散點(diǎn)在同一方位上距離較近,則表明二者有較強(qiáng)的相關(guān)性;若距離較遠(yuǎn)或不在同一方位,則表明二者關(guān)聯(lián)性較弱或無(wú)關(guān)聯(lián)。由圖3可知,菌陽(yáng)患病率高于全國(guó)平均水平組與出生早的出生隊(duì)列和男性距離較近,說(shuō)明這些指標(biāo)的關(guān)聯(lián)較為緊密;菌陽(yáng)患病率低于全國(guó)平均水平組與出生較晚隊(duì)列和女性距離較近,說(shuō)明這些指標(biāo)關(guān)聯(lián)較為緊密。
圖3 菌陽(yáng)肺結(jié)核患病率對(duì)應(yīng)分析圖
將性別和出生隊(duì)列同時(shí)引入負(fù)二項(xiàng)回歸方程,對(duì)超離散度檢驗(yàn)P<0.001,說(shuō)明資料符合負(fù)二項(xiàng)回歸模型。得出回歸方程:ln()=0.443×出生隊(duì)列+0.689×性別-9.347,見表3。
該模型顯示:(1)出生隊(duì)列與菌陽(yáng)肺結(jié)核患病率有關(guān)。按出生隊(duì)列賦值,相鄰的出生隊(duì)列,出生較早的隊(duì)列患菌陽(yáng)肺結(jié)核風(fēng)險(xiǎn)高于出生較晚的隊(duì)列,RR=1.557(95%CI:1.443~1.692),即1970~年代出生隊(duì)列患菌陽(yáng)肺結(jié)核的風(fēng)險(xiǎn)是1980~年代出生隊(duì)列的1.557倍,1960~年代出生隊(duì)列是1970~年代出生隊(duì)列的1.557倍……;1910~年代出生隊(duì)列患菌陽(yáng)肺結(jié)核的風(fēng)險(xiǎn)是1980~年代出生隊(duì)列的22.183倍(95%CI:13.028~39.701);1920~年代出生隊(duì)列患菌陽(yáng)肺結(jié)核的風(fēng)險(xiǎn)是1980~年代出生隊(duì)列的14.247倍(95%CI:9.028~23.463)。(2)菌陽(yáng)肺結(jié)核與性別有關(guān),依據(jù)變量賦值表1,女=1,男=2,結(jié)果解釋為自變量每上升1個(gè)單位,發(fā)病風(fēng)險(xiǎn)是原來(lái)的倍數(shù)。因此,本研究男性菌陽(yáng)肺結(jié)核患病率高于女性,男性患菌陽(yáng)肺結(jié)核的風(fēng)險(xiǎn)是女性的1.992倍(95%CI:1.415~2.807)。
表2 出生隊(duì)列研究負(fù)二項(xiàng)回歸參數(shù)估計(jì)
表3 負(fù)二項(xiàng)回歸參數(shù)估計(jì)
我國(guó)是全世界22個(gè)結(jié)核病高負(fù)擔(dān)國(guó)家之一,從1990年第3次全國(guó)結(jié)核病流行病學(xué)抽樣調(diào)查開始調(diào)查菌陽(yáng)患病率。對(duì)1個(gè)數(shù)據(jù)集的建模過程遠(yuǎn)比擬合和檢驗(yàn)復(fù)雜的多,成功的建模是根據(jù)科學(xué)原理,將專業(yè)知識(shí)、經(jīng)驗(yàn)積累與統(tǒng)計(jì)方法相結(jié)合。在1個(gè)模型中是否納入1個(gè)變量,隨不同學(xué)科,不同問題而不同,統(tǒng)計(jì)學(xué)建模的傳統(tǒng)方法是尋找能解釋資料的最簡(jiǎn)捷的模型[5]。負(fù)二項(xiàng)回歸分析是在對(duì)資料進(jìn)行檢驗(yàn)符合負(fù)二項(xiàng)回歸模型后(超離散度檢驗(yàn)),對(duì)影響該分布因素的參數(shù)大小進(jìn)行估計(jì),在疾病的病因研究和影響因素方面得到了廣泛應(yīng)用[9]。
為了解我國(guó)結(jié)核病的流行狀況和危害程度,我國(guó)在1990和2000年進(jìn)行了第3和第4次全國(guó)結(jié)核病流行病學(xué)抽樣調(diào)查,應(yīng)用全國(guó)流行病學(xué)調(diào)查資料可以更好研究我國(guó)結(jié)核病的人群分布特征和確定高危人群。對(duì)應(yīng)分析通過對(duì)應(yīng)分析圖可以直觀的顯示研究變量之間的關(guān)系,落在由原點(diǎn)出發(fā)接近相同方位及圖形相同區(qū)域的不同變量的類別可能有聯(lián)系。研究顯示菌陽(yáng)患病率高于全國(guó)平均水平與較早出生隊(duì)列和男性可能有聯(lián)系。通過負(fù)二項(xiàng)回歸進(jìn)一步研究了菌陽(yáng)肺結(jié)核與出生隊(duì)列和性別的關(guān)系。(1)出生隊(duì)列與菌陽(yáng)肺結(jié)核患病率有關(guān)。本次研究和歷年流調(diào)結(jié)果相似,出生較早的隊(duì)列患菌陽(yáng)肺結(jié)核的風(fēng)險(xiǎn)高,出生較晚隊(duì)列患菌陽(yáng)肺結(jié)核風(fēng)險(xiǎn)低[3]。按出生隊(duì)列賦值,相鄰的出生隊(duì)列,出生較早的隊(duì)列患菌陽(yáng)肺結(jié)核的風(fēng)險(xiǎn)是出生較晚隊(duì)列的1.557倍(95%CI:1.443~1.692),因此應(yīng)該加強(qiáng)出生隊(duì)列較早人群結(jié)核病的治療和管理,改善較早出生隊(duì)列結(jié)核病患者的生活質(zhì)量。出生較晚隊(duì)列的人群菌陽(yáng)患病率低也可能是由于近些年我國(guó)加強(qiáng)了結(jié)核病的預(yù)防治療措施。(2)菌陽(yáng)肺結(jié)核與性別有關(guān),男性菌陽(yáng)肺結(jié)核患病率高于女性,男性患菌陽(yáng)肺結(jié)核的風(fēng)險(xiǎn)是女性的1.992倍(95%CI:1.415~2.807)。原因可能是男女兩性接觸感染機(jī)會(huì)不同所致,男性在兒童時(shí)期活躍易動(dòng),成年后社會(huì)活動(dòng)、應(yīng)酬較多,因此與傳染源接觸的就會(huì)較多。因此,應(yīng)該加強(qiáng)男性結(jié)核病的防治工作。
[1] 王素萍.流行病學(xué).北京:中國(guó)協(xié)和醫(yī)科大學(xué)出版社,2003:20-24.
[2] World Health Organization.Treatment of tuberculosis:Guidelines for national programs.3rd ed.Geneva:WHO,2003:11-15.
[3] 中華人民共和國(guó)衛(wèi)生部.2000年全國(guó)結(jié)核病流行病學(xué)抽樣調(diào)查資料匯編.北京:人民衛(wèi)生出版社,2003:154.
[4] 中華人民共和國(guó)衛(wèi)生部.1990年全國(guó)結(jié)核病流行病學(xué)抽樣調(diào)查資料匯編.北京:中華人民共和國(guó)衛(wèi)生部,1992:484.
[5] 陳峰.醫(yī)用多元統(tǒng)計(jì)分析方法.北京:中國(guó)統(tǒng)計(jì)出版社,2000:115-131.
[6] Byers AL,Allore H,Gill TM,et al.Application of negative binomial modeling for discrete outcomes:A case study in aging research.J Clin Epidemiol,2003,56(6):559-564.
[7] 康萬(wàn)里,李佩珍,鄭素華.中國(guó)結(jié)核病的空間積聚性研究.中國(guó)衛(wèi)生統(tǒng)計(jì),2008,25(3):273-275.
[8] 陳建國(guó),朱健,張永輝,等.江蘇省啟東地區(qū)1973至2002年肝癌發(fā)病率長(zhǎng)期趨勢(shì)的評(píng)價(jià).中華醫(yī)學(xué)雜志,2005,85(43):3052-3056.
[9] Cameron CM,Purdie DM,Kliewer EV,et al.Mental health:a cause or consequence of injury?A population based matched cohort study.BMC Public Health,2006,6(5):114-122.