李文琦,黃水平,李海朋
徐州醫(yī)學(xué)院公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 徐州 221002
BP神經(jīng)網(wǎng)絡(luò)和Cox比例風(fēng)險(xiǎn)模型在生存分析應(yīng)用中的比較*
李文琦,黃水平#,李海朋
徐州醫(yī)學(xué)院公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 徐州 221002
#通訊作者,女,1963年10月生,碩士,教授,研究方向:統(tǒng)計(jì)方法在流行病學(xué)研究中的應(yīng)用,E-mail:hsp@xzmc.edu.cn
BP神經(jīng)網(wǎng)絡(luò);Monte Carlo 模擬;生存分析;預(yù)測(cè)模型;Cox比例風(fēng)險(xiǎn)模型
目的:比較BP神經(jīng)網(wǎng)絡(luò)模型和Cox比例風(fēng)險(xiǎn)模型在生存分析中的預(yù)測(cè)性能,進(jìn)一步探討B(tài)P神經(jīng)網(wǎng)絡(luò)模型在生存分析中的應(yīng)用。方法采用Monte Carlo模擬數(shù)據(jù)集,如不同樣本量、不同刪失比例、不同協(xié)變量間關(guān)系及是否滿足等比例風(fēng)險(xiǎn)假定的理論研究和胃癌根治術(shù)患者預(yù)后預(yù)測(cè)的實(shí)例分析,分別建立BP神經(jīng)網(wǎng)絡(luò)模型和Cox比例風(fēng)險(xiǎn)模型,最終使用一致性指數(shù)C對(duì)其預(yù)測(cè)性能進(jìn)行比較。結(jié)果當(dāng)樣本量為100、刪失比例為60%、80%及樣本量為300、刪失比例為80%時(shí),BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)性能高于Cox比例風(fēng)險(xiǎn)模型(P<0.05)。協(xié)變量不滿足等比例風(fēng)險(xiǎn)假定、協(xié)變量間存在三維交互作用和非線性關(guān)系時(shí),BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)性能較Cox比例風(fēng)險(xiǎn)模型好(P<0.05)。實(shí)例研究中發(fā)現(xiàn),BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)的一致性指數(shù)C(0.835)高于Cox比例風(fēng)險(xiǎn)模型(t配對(duì)=4.311,P<0.001)。結(jié)論BP神經(jīng)網(wǎng)絡(luò)模型在生存分析的應(yīng)用中對(duì)樣本刪失比例、是否滿足PH假定、協(xié)變量間復(fù)雜交互作用和非線性關(guān)系具有非特異性,對(duì)資料限制較少,且預(yù)測(cè)一致性高,值得在生存分析中進(jìn)一步推廣應(yīng)用。
目前生存分析最常用的即Cox比例風(fēng)險(xiǎn)模型,但該模型要求資料事先滿足2個(gè)假定[1]:①比例風(fēng)險(xiǎn)假定(proportional hazard, PH假定)。②對(duì)數(shù)線性假定。然而當(dāng)實(shí)際資料不能滿足或只能近似滿足這一假定時(shí),往往會(huì)造成模型擬合效果不佳或者根本沒(méi)有意義,最終還會(huì)誤導(dǎo)人們對(duì)分析結(jié)果的判斷,而人工神經(jīng)網(wǎng)絡(luò)模型恰恰彌補(bǔ)了這方面的不足。近年來(lái),人工神經(jīng)網(wǎng)絡(luò)作為一種新興的信息處理系統(tǒng),具有自組織、自適應(yīng)、自學(xué)習(xí)的能力及高度的非線性和良好的容錯(cuò)性等特點(diǎn),被廣泛地應(yīng)用于多個(gè)領(lǐng)域,特別在流行病學(xué)領(lǐng)域也逐漸受到重視[2]。但國(guó)內(nèi)人工神經(jīng)網(wǎng)絡(luò)模型的應(yīng)用尚不成熟,特別是在生存分析領(lǐng)域的應(yīng)用還比較分散,多用于解決某個(gè)具體問(wèn)題。目前尚缺乏對(duì)人工神經(jīng)網(wǎng)絡(luò)模型與傳統(tǒng)的生存分析方法比較的系統(tǒng)研究,故作者采用Monte Carlo模擬的理論研究和實(shí)際資料的應(yīng)用研究相結(jié)合的方法,比較BP神經(jīng)網(wǎng)絡(luò)模型和Cox比例風(fēng)險(xiǎn)模型在生存分析中的預(yù)測(cè)性能,以探討人工神經(jīng)網(wǎng)絡(luò)模型在生存分析領(lǐng)域中的應(yīng)用,為生存分析領(lǐng)域提供一種不考慮模型具體函數(shù)形式的非線性預(yù)測(cè)手段,以達(dá)到較好地解決實(shí)際問(wèn)題的目的。
1.1模擬實(shí)驗(yàn)設(shè)計(jì)模擬數(shù)據(jù)包括:不同樣本量、不同刪失比例和不同協(xié)變量間的關(guān)系及協(xié)變量是否滿足等比例風(fēng)險(xiǎn)假定等條件。
根據(jù)上式可模擬不同分布的生存時(shí)間,最終可實(shí)現(xiàn)生存數(shù)據(jù)的產(chǎn)生。
模擬非比例風(fēng)險(xiǎn)假定的數(shù)據(jù)則采用對(duì)數(shù)正態(tài)回歸模型產(chǎn)生生存時(shí)間,T=exp(1+βx+ε)。
1.1.2 模擬刪失數(shù)據(jù) 該研究模擬產(chǎn)生右刪失數(shù)據(jù),刪失分布的類型為均勻分布U(0,C)。模擬時(shí)首先產(chǎn)生n(n為樣本量)個(gè)生存時(shí)間Ti,根據(jù)刪失分布U(0,C)及刪失比例,通過(guò)迭代模擬,計(jì)算出C值,再通過(guò)SAS的隨機(jī)數(shù)產(chǎn)生程序,產(chǎn)生n個(gè)刪失時(shí)間Li。最后根據(jù)右刪失的定義,ti=min(Ti,Li),得到n個(gè)觀測(cè)時(shí)間。若Ti≤Li,δi=1,否則,即產(chǎn)生含刪失的生存數(shù)據(jù)(ti,δi)[3]。
1.1.3 模擬協(xié)變量 用SAS隨機(jī)數(shù)發(fā)生器RANNOR(seed)函數(shù)產(chǎn)生服從N(0,1)標(biāo)準(zhǔn)正態(tài)分布隨機(jī)變量,用RANBIN(seed,n,p)函數(shù)產(chǎn)生服從B(n,p)的伯努利分布隨機(jī)變量。
1.2模擬評(píng)價(jià)指標(biāo)由于該研究2種方法的預(yù)測(cè)變量不同,且存在刪失數(shù)據(jù),故采用一致性指數(shù)C作為預(yù)測(cè)準(zhǔn)確性評(píng)價(jià)的指標(biāo)。一致性指數(shù)C是指預(yù)測(cè)結(jié)果和實(shí)際結(jié)果一致的觀察單位對(duì)子數(shù)占總有用對(duì)子數(shù)的比例。有用對(duì)子數(shù)是指可區(qū)分危險(xiǎn)度大小的2個(gè)個(gè)體,若兩者都達(dá)到觀察終點(diǎn),或一個(gè)達(dá)到終點(diǎn),而另一個(gè)為刪失個(gè)體,并刪失個(gè)體的觀察時(shí)間大于非刪失個(gè)體的觀察時(shí)間,以上2種可度量危險(xiǎn)度大小關(guān)系的情況被認(rèn)為是有用的觀察對(duì)子。并用SAS對(duì)2種方法的一致性指數(shù)C進(jìn)行配對(duì)t檢驗(yàn),檢驗(yàn)水準(zhǔn)α=0.05。
1.3實(shí)例資料
1.3.1 研究對(duì)象 選取2004年1月1日至2009年12月30日于徐州醫(yī)學(xué)院附屬醫(yī)院行胃癌根治性切除術(shù)且經(jīng)病理學(xué)確診并有詳細(xì)聯(lián)系方式的胃癌患者156例。
1.3.2 隨訪調(diào)查 自2009年12月至2010年5月,采用電話訪問(wèn)及信訪的方式追蹤研究對(duì)象。以患者手術(shù)之日為研究起點(diǎn),因胃癌死亡為研究終點(diǎn),隨訪截止時(shí)間為2010年5月14日。
1.3.3 調(diào)查內(nèi)容 臨床資料包括:研究對(duì)象的腫瘤部位、大小、浸潤(rùn)深度、分化程度、組織學(xué)分型、是否伴有淋巴結(jié)轉(zhuǎn)移、pTNM分期等。生活資料包括:研究對(duì)象的飲食、生活行為方式及心理因素等。主要有每天蔬菜水果和肉蛋類的攝入量、是否服用營(yíng)養(yǎng)補(bǔ)充劑和中草藥、體育鍛煉頻度、睡眠狀況、吸煙飲酒習(xí)慣等生活行為方式,患者性格、恢復(fù)的信心及煩躁、焦慮、恐慌等心理狀況和其社會(huì)支持等。
2.1不同樣本量和刪失比例下模型的預(yù)測(cè)性能比較模擬符合如下條件的生存數(shù)據(jù):生存時(shí)間服從λ=1的指數(shù)分布,協(xié)變量x1服從N(0,1)的正態(tài)分布、x2服從B(1,0.8)的伯努利分布,樣本量為100和300、刪失比例分別為20%、40%、60%和80%的數(shù)據(jù)集。
Cox比例風(fēng)險(xiǎn)模型:設(shè)x1、x2回歸系數(shù)分別為β1=1、β2=1.5,并計(jì)算線性預(yù)測(cè)之和xβ′進(jìn)行預(yù)測(cè);BP神經(jīng)網(wǎng)絡(luò)模型:由2個(gè)協(xié)變量作為BP神經(jīng)網(wǎng)絡(luò)模型輸入神經(jīng)元(即n=2),以CSR作為BP神經(jīng)網(wǎng)絡(luò)輸出神經(jīng)元(即l=1),選擇LM優(yōu)化算法和適當(dāng)?shù)碾[含層結(jié)點(diǎn)數(shù),其余參數(shù)均為Matlab軟件默認(rèn)值,最終使網(wǎng)絡(luò)達(dá)到收斂。每種模擬樣本重復(fù)模擬100次,得一致性指數(shù)C的均數(shù)和標(biāo)準(zhǔn)差,見(jiàn)表1。
表1 不同樣本量和刪失比例下兩模型一致性指數(shù)C的比較
2.2等比例、非等比例風(fēng)險(xiǎn)及不同協(xié)變量關(guān)系下模型的預(yù)測(cè)性能比較模擬符合如下條件的生存數(shù)據(jù):樣本量固定為300,刪失比例為40%。生存時(shí)間服從l=1的指數(shù)分布(滿足PH假定)和對(duì)數(shù)正態(tài)分布(不滿足PH假定)。分別設(shè)計(jì)以下幾種不同協(xié)變量間關(guān)系的數(shù)據(jù)集:
①滿足PH假定,協(xié)變量間獨(dú)立:協(xié)變量x1服從N(0,1)的正態(tài)分布、x2服從B(1,0.8)的伯努利分布,Cox比例風(fēng)險(xiǎn)模型x1、x2的回歸系數(shù)分別為β1=1和β2=1.5。
②滿足PH假定,協(xié)變量間存在二維交互:設(shè)x1和x2間存在r12=0.2二維交互作用,其余同①。
③滿足PH假定,協(xié)變量間存在多維交互:模擬4個(gè)協(xié)變量,協(xié)變量x1和x2分別服從B(1,0.25)和B(1,0.5)的伯努利分布,x3和x4均服從N(0,1)的正態(tài)分布,設(shè)Cox比例風(fēng)險(xiǎn)模型x1、x2、x3、x4的回歸系數(shù)分別為b1=b2=2、b3=0.5、b4=1.0,二維交互作用,x1和x2及x3和x4的相關(guān)系數(shù)分別為r12=r34=1.0,其他三維交互r′=0.5。
④滿足PH假定,協(xié)變量間存在非線性關(guān)系:模擬協(xié)變量x1服從N(0,1)的正態(tài)分布,對(duì)x1進(jìn)行非線性轉(zhuǎn)換得到x2=sigmoid(x1),設(shè)Cox模型x1、x2的回歸系數(shù)分別為b1=1和b2=1.5。
⑤不滿足PH假定,協(xié)變量間相互獨(dú)立:協(xié)變量設(shè)計(jì)同①。
每次模擬重復(fù)100次,得一致性指數(shù)C的均數(shù)和標(biāo)準(zhǔn)差,見(jiàn)表2。
表2 不同PH假定及協(xié)變量關(guān)系下模型一致性指數(shù)C的比較
*:h(t/x)=h0(t)exp(1.0x1+1.5x2);#:h(t/x)=h0(t)exp(1.0x1+1.5x2+0.2x1x2);
2.3實(shí)例分析結(jié)果隨機(jī)選取100例胃癌根治術(shù)患者作為模型的訓(xùn)練樣本,建立Cox比例風(fēng)險(xiǎn)模型,首先進(jìn)行單變量log-rank時(shí)序檢驗(yàn),其次將有統(tǒng)計(jì)學(xué)意義的因素進(jìn)一步做多因素Cox回歸分析,建立胃癌根治術(shù)患者預(yù)后預(yù)測(cè)的Cox比例風(fēng)險(xiǎn)模型,其表達(dá)式為:h(t,x)=h0(t)exp(0.814 3x1+1.004x2+0.579x3-0.932x4-0.585x5-1.199x6),式中x1、x2、x3、x4、x5、x6分別代表pTNM分期、分化程度、腫瘤大小、是否接受輔助化療、睡眠狀況和術(shù)前吸煙術(shù)后不吸煙6個(gè)因素。最終將其余56例作為預(yù)測(cè)樣本,代入已建立的模型進(jìn)行預(yù)測(cè)性能的評(píng)價(jià)。
選擇3層網(wǎng)絡(luò)結(jié)構(gòu),將6個(gè)對(duì)生存時(shí)間有影響的因素作為網(wǎng)絡(luò)輸入神經(jīng)元,以Cox-snell殘差為輸出神經(jīng)元,根據(jù)試湊法最終確定隱含層結(jié)點(diǎn)數(shù)為8,隱含層傳輸函數(shù)為tansig,輸出層傳輸函數(shù)為purelin。學(xué)習(xí)率為0.01,網(wǎng)絡(luò)訓(xùn)練采用LM優(yōu)化算法,為防止過(guò)度擬合,采用早停止策略。2種模型建模重復(fù)20次,得一致性指數(shù)C的均值、標(biāo)準(zhǔn)差,見(jiàn)表3。配對(duì)t檢驗(yàn)結(jié)果顯示,BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)一致性指數(shù)C高于Cox比例風(fēng)險(xiǎn)模型(t配對(duì)=4.311,P<0.001)。
表3 Cox模型和BP模型的預(yù)測(cè)一致性指數(shù)C
有研究[4]表明Cox模型結(jié)果的偏倚程度隨刪失比例的增大而增大,且增大速度和樣本量有關(guān)。Cox模型準(zhǔn)確性也會(huì)隨著刪失比例的增大而減小,且當(dāng)刪失超過(guò)70%時(shí),結(jié)果變異加速增大。該研究模擬了樣本量為100的小樣本和樣本量為300的大樣本2個(gè)數(shù)據(jù)集。選擇小樣本數(shù)據(jù)時(shí),當(dāng)刪失比例超過(guò)60%時(shí),Cox模型的一致性指數(shù)C減小,與BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)一致性指數(shù)C比較差異均有統(tǒng)計(jì)學(xué)意義;在大樣本情況下,當(dāng)刪失比例超過(guò)80%時(shí),Cox模型一致性指數(shù)C急劇下降,與BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)一致性指數(shù)C比較差異均有統(tǒng)計(jì)學(xué)意義,進(jìn)一步說(shuō)明BP神經(jīng)網(wǎng)絡(luò)模型在同等數(shù)據(jù)的刪失比例下預(yù)測(cè)一致性指數(shù)C高于Cox模型。
理論已證明神經(jīng)網(wǎng)絡(luò)對(duì)變量間關(guān)系信息的提取具有非特異性,該模擬試驗(yàn)中對(duì)線性和非線性及多維的復(fù)雜交互作用進(jìn)行的模擬研究也說(shuō)明了這一點(diǎn),在變量間存在非線性關(guān)系時(shí)BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)的一致性指數(shù)C高于Cox模型。在Cox模型中對(duì)變量有一嚴(yán)格的限制,要求協(xié)變量的效應(yīng)不隨時(shí)間而改變,即滿足等比例風(fēng)險(xiǎn)假定。在不滿足假定的條件下使用Cox模型建模得出的結(jié)果將讓人產(chǎn)生質(zhì)疑。故作者對(duì)是否滿足PH假定條件的協(xié)變量進(jìn)行了模擬,分別用BP神經(jīng)網(wǎng)絡(luò)模型和Cox模型建模,發(fā)現(xiàn)在不滿足PH假定時(shí)BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)的一致性指數(shù)C要好于Cox模型。由此可以看出,BP神經(jīng)網(wǎng)絡(luò)模型克服了傳統(tǒng)統(tǒng)計(jì)分析方法對(duì)數(shù)據(jù)的嚴(yán)格限制,可以不考慮數(shù)據(jù)間關(guān)系的具體函數(shù)形式,任意連續(xù)的S型函數(shù)理論上都能得到較好的擬合效果。因此,BP神經(jīng)網(wǎng)絡(luò)模型與傳統(tǒng)的統(tǒng)計(jì)方法相比,它不需要精確的數(shù)學(xué)模型,沒(méi)有任何對(duì)變量的假定要求,能通過(guò)模擬人的智能行為處理一些復(fù)雜的、不確定的、非線性的問(wèn)題,且具有一定的容錯(cuò)性。其處理非線性問(wèn)題的能力一般高于傳統(tǒng)的分析方法,并且可以學(xué)習(xí)目前無(wú)法用數(shù)學(xué)方法描述的模糊評(píng)定。它為處理模糊的、數(shù)據(jù)不完全的、模擬的、不精確的模式的識(shí)別提供了一個(gè)全新的途徑,在醫(yī)學(xué)領(lǐng)域有進(jìn)一步推廣的價(jià)值。
[1]王娟.截尾分位數(shù)回歸模型及其在生存分析中的應(yīng)用[D].太原:山西醫(yī)科大學(xué),2009.
[2]高蔚,施侶元.人工神經(jīng)網(wǎng)絡(luò)流行病學(xué)應(yīng)用進(jìn)展[J].中華預(yù)防醫(yī)學(xué)雜志,2000,34(6):373
[3]Cox DR,Oakes D. Analysis of survival data[M]. London:Chapman and Hall,1984:201
[4]錢俊.生存分析中刪失數(shù)據(jù)比例對(duì)Cox回歸模型影響的研究[D].廣州:南方醫(yī)科大學(xué),2009:95
(2014-01-17收稿 責(zé)任編輯姜春霞)
Comparison between BP neural network and Cox proportional hazard model in survival analysis
LIWenqi,HUANGShuiping,LIHaipeng
DepartmentofEpidemiologyandMedicalStatistics,SchoolofPublicHealth,XuzhouMedicalCollege,Xuzhou221002
BP neural network; Monte Carlo simulation; survival analysis; forecast model; Cox proportional hazard model
Aim: To compare their prediction performance of BP neural network model and Cox proportion hazard model in survival analysis and to explore the superiority of BP neural network model in survival analysis. Methods: Monte Carlo was used to generate the data sets under the condition of different sample size, different degree of censoring, number of variable and interactions, non-linear effect, distinct distribution of covariate and proportional vs non-proportional hazard. Then BP neural network model and Cox model were built, and their prediction performance was compared using concord ance index C. Results: In the research on simulation data sets, when the sample size of 100, proportion of censoring of 60%, 80%, and sample size of 300, proportion of censoring of 80%, BP neural network model performed superior to Cox model(P<0.05). And when the covariates don′t meet PH assumption and had three-way interaction, non-linear effect, BP neural network performed superior to Cox model(P<0.05). In the real data, BP neural network model′s concordance index was 0.835, which performed superior to Cox model(tpaired=4.311,P<0.001). Conclusion: For the small sample size, high and the covariates don′t meet PH assumption and has three-way interaction, non-linear effect data sets, BP neural network has better advantage than Cox model. It is worth to popularize further in survival analysis.
10.13705/j.issn.1671-6825.2014.06.015
*江蘇省科技廳資助項(xiàng)目 BE2011647
R195.1
鄭州大學(xué)學(xué)報(bào)(醫(yī)學(xué)版)2014年6期