国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

用SAS軟件實現(xiàn)因變量為多值有序變量的多重logistic回歸分析

2014-12-05 09:45:32胡良平孫日揚軍事醫(yī)學科學院研究生部生物醫(yī)學統(tǒng)計學咨詢中心北京100850
藥學服務與研究 2014年4期
關鍵詞:因變量賦值回歸系數(shù)

胡良平,孫日揚(軍事醫(yī)學科學院研究生部生物醫(yī)學統(tǒng)計學咨詢中心,北京100850)

[本文編輯]蘭 芬

在醫(yī)藥學研究中,經(jīng)常涉及到一個多值有序的因變量與一組自變量之間依賴關系的研究,這時線性回歸分析方法就無能為力,而多值有序變量的多重logistic回歸分析是處理該問題的有效方法之一。該方法對自變量的性質(zhì)幾乎沒有限制,可以是連續(xù)性的、二值的、多值有序的、多值名義的變量,但要求有較大的樣本量,并且樣本對于總體的代表性很好?;貧w系數(shù)具有明確的實際意義,可以根據(jù)回歸系數(shù)得到優(yōu)勢比(odds ratio,OR)的估計值。欲使所求得的多重回歸方程具有理想的實用價值,關鍵是必須找全、找準對因變量有重要影響的自變量,并獲得它們在各受試對象身上的準確取值,而這需要靠嚴格的質(zhì)量控制措施來保證。一般來講,只要因變量為一個多值有序變量,樣本量又比較大,并且目的是研究因變量與自變量之間的依賴關系時,均可考慮使用因變量為多值有序變量的多重logistic回歸分析。本文將結(jié)合實例介紹該方法及其SAS實現(xiàn)過程。

1 實 例

觀察不同劑量右美托咪定用于困難氣道患者清醒氣管插管中的鎮(zhèn)靜效果及其對血流動力學的影響,并與咪達唑侖復合芬太尼比較,探討右美托咪定用于清醒氣管插管中鎮(zhèn)靜的可行性。選擇Mallampati分級≥Ⅲ級的困難氣道患者60例,以簡單隨機法分成D1、D2、D3和 MF四組(n=15)。所有患者均經(jīng)光導纖維支氣管鏡進行清醒氣管插管。D1、D2、D3組分別在插管前15min靜脈推注右美托咪定0.5、1.0、1.5μg/kg,推注時間為10min。MF組在插管前5min靜脈推注咪達唑侖0.02mg/kg和芬太尼2.0μg/kg。所有患者于插管前2min行環(huán)甲膜穿刺,注入2%利多卡因1mg/kg。評價組別、年齡、性別、環(huán)甲膜穿刺前即刻的Ramsay評分、插管評分、心率、是否患高血壓、是否患糖尿病、血氧飽和度、動脈血二氧化碳分壓對插管滿意度評級的影響。表1的數(shù)據(jù)在原文數(shù)據(jù)的基礎上做了修改,不代表真實數(shù)據(jù)[1]。

2 分析思路

本研究涉及的自變量包括上述年齡等10項,因變量為插管滿意度評級。研究目的為評價全部自變量對因變量的影響,也就是要研究因變量如何隨各自變量變化而變化的依賴關系。由于插管滿意度評級為普通(1)、良好(2)、優(yōu)秀(3),顯然它是一個多值有序的因變量,因此這是涉及一個多值有序因變量與多個自變量依賴關系的研究,適合采用多值有序變量的多重logistic回歸分析。

表1 各組患者的年齡、性別、Ramsay評分、插管評分、心率、是否患高血壓和糖尿病、血氧飽和度、動脈血二氧化碳分壓及插管滿意度評級Table 1 Age,sex,Ramsay scores,intubation scores,heart rate,illness of hypertension or diabetes,blood oxygen saturation,arterial carbon dioxide tension and intubation satisfaction grade of patients in each group

2.1 將原始數(shù)據(jù)轉(zhuǎn)換為回歸分析所要求的數(shù)據(jù)表 將原始數(shù)據(jù)轉(zhuǎn)換為回歸分析所要求的數(shù)據(jù)表,見表2。

表2 用于多重logistic回歸分析的數(shù)據(jù)表Table 2 The data for multiple logistic regression analysis

2.2 SAS分析 程序編寫:程序編寫由數(shù)據(jù)步與過程步組成。在數(shù)據(jù)步中對部分自變量進行賦值,sex=0表示性別為女,sex=1表示性別為男;gaoxueya=0表示未患高血壓,gaoxueya=1表示患高血壓;tangniaobing=0表示未患糖尿病,tangniaobing=1表示患糖尿??;manyi=1表示滿意度普通,manyi=2表示滿意度良好,manyi=3表示滿意度優(yōu)秀,見表3。由于每個logistic過程步內(nèi)只允許存在一個model語句,故SAS程序中寫了三個過程步。

2.3 結(jié)果解釋 結(jié)果的第一部分輸出模型基本信息,最后一行文字說明該模型是以較小的順序值為對比的基礎,也就是以插管滿意度評級是普通的那一檔為基礎(即對照組)建模,見圖1。在logistic模型中,默認狀態(tài)下是以因變量取值較小的水平為基礎建模,計算當自變量取一組特定值時該事件發(fā)生的概率。若想要以取值較大的水平為基礎建模,則應在proc logistic語句之后使用降序(descending)選項來改變因變量的取值順序,見圖2。

第二部分為自變量效應分析,篩選自變量的方法為逐步法,首先將分類變量組別(group)轉(zhuǎn)變成三個啞變量并賦值,以最后一組為基準,爾后進行逐步篩選變量的環(huán)節(jié)。步驟0:截距項篩選進入模型;步驟1:影響因素xinlv進入模型;步驟2:影響因素dongmai進入模型。之后為逐步法過程小結(jié)。

第三部分是對各個自變量所產(chǎn)生的效應進行分析的結(jié)果,顯示了各個自變量對結(jié)果變量的整體作用。該檢驗的原假設為全部自變量對logitP{即log[P/(1-P)]}都沒有作用。由表4可以看出,xinlv和dongmai這兩個自變量對于結(jié)果變量的影響P值均<0.05,有統(tǒng)計學意義。逐步回歸法的最大似然估計結(jié)果見表5。xinlv的OR估計值為0.917,95%置信區(qū)間為(0.855,0.983);dongmai的OR估計值為1.171,95%置信區(qū)間為(1.007,1.363)。

表3 SAS軟件程序編寫及說明Table 3 SAS software programing and explanations

圖1 模型基本信息Figure 1 Basic information of the model

圖2 逐步回歸法計算過程Figure 2 Procedures of stepwise regression

表4 自變量效應分析Table 4 Effect analysis of independent variables

表5 逐步回歸法的最大似然估計Table 5 Analysis of maximum likelihood estimates by stepwise regression

第四部分為參數(shù)估計結(jié)果,本資料中自變量xinlv和dongmai對應的P值均<0.05,表明兩個自變量的回歸系數(shù)的估計值與0之間的差別均有統(tǒng)計學意義。在累積logistic回歸模型中,截距項有多個,其個數(shù)為因變量的水平數(shù)減1。本例中因變量水平數(shù)為3,因此包含2個截距項。如果用P1表示“普通”的概率,用P2表示“普通及良好”的累積概率,則可擬合出兩個logistic回歸方程,分別用于計算“普通”與“良好及優(yōu)秀”的概率[P1與(1-P1)],“普通及良好”與“優(yōu)秀”的概率[P2與(1-P2)]。其回歸方程如下。式中x1為變量xinlv,x2為變量dongmai。

第五部分輸出的為預測概率與觀察響應關聯(lián)性分析結(jié)果(見表6)。需要注意的是,c值即為診斷性試驗中需要用到的ROC曲線下的面積。以上為逐步回歸法篩選變量結(jié)果,前進法與其結(jié)果相同,故在此不給出前進法篩選的結(jié)果。后退法與其結(jié)果有差別,后退法的最大似然估計結(jié)果見表7。由表7可見,采用后退法進行變量篩選時,只有xinlv這一變量P值<0.05,具有統(tǒng)計學意義,其OR估計值為0.919,95%置信區(qū)間為(0.859,0.984)。本例選擇前進法和逐步回歸法篩選變量的結(jié)果作為最終的結(jié)果,理由參見3.3項。

表6 預測概率與觀察響應關聯(lián)性分析Table 6 Association of predicted probabilities and observed responses

表7 后退法的最大似然估計Table 7 Analysis of maximum likelihood estimates by backward regression

2.4 結(jié)果報告 logistic回歸分析應主要報告以下內(nèi)容。(1)分析目的:評價組別、年齡、性別、環(huán)甲膜穿刺前即刻的Ramsay評分、插管評分、心率、是否患高血壓、是否患糖尿病、血氧飽和度、動脈血二氧化碳分壓對插管滿意度評級的影響。(2)自變量的基本統(tǒng)計描述:如表1所示。(3)自變量篩選方法:本例采用逐步回歸法的篩選結(jié)果作為最終結(jié)果(見表5)。實際處理資料時,建議同時采用前進法、后退法和逐步回歸法篩選自變量,結(jié)合統(tǒng)計學和專業(yè)知識選擇其中最為合理的篩選結(jié)果做出專業(yè)結(jié)論。

3 討 論

3.1 logistic回歸分析需要注意的問題[2](1)個體間的獨立性:建立logistic回歸方程時,要求研究個體之間彼此獨立,該方法不適用于研究個體間具有聚集性特征的資料。(2)足夠的樣本量:logistic回歸分析對樣本量具有一定的要求,當樣本量過少時,參數(shù)估計值不穩(wěn)定,甚至可能出現(xiàn)專業(yè)上無法解釋的現(xiàn)象。(3)變量的賦值:在logistic回歸分析中,自變量可以有多種形式。變量賦值方式不同,參數(shù)估計值及正負符號將有所不同,從而對結(jié)果的解釋方式亦不同[3]。連續(xù)型變量可以按原數(shù)據(jù)形式參與分析,也可以離散化成有序分類變量,或離散化后用幾個啞變量來描述。采用原數(shù)據(jù)形式簡單且保持信息完整性,但有時參數(shù)的實際意義不突出。二分類變量一般用0和1賦值,如暴露賦值1,非暴露賦值0;男性賦值1,女性賦值0。賦值較小的水平常被作為參照水平,這類變量的OR就是水平1和水平0的優(yōu)勢之比。無序多分類變量應轉(zhuǎn)化為啞變量形式,某個有k個類別的名義變量需要(k-1)個啞變量來表示。例如血型是一個有4個類別的四值名義變量,有A、B、AB、O四種具體類型,若以O型血為基準,需引入3個啞變量來代替原先的一個血型變量。令X1={0為非A型;1為A型},X2={0為非B型;1為B型},X3={0為非 AB型;1為 AB型},則可得到 A、B、AB、O 型分別用啞變量(1,0,0)、(0,1,0)、(0,0,1)和(0,0,0)來表示。很多情況下,所謂的參照水平往往都是研究者隨意設置的,并非都具有基線的性質(zhì),隨著參照水平的改變,結(jié)果將會不同。此外,啞變量賦值增加了自變量的個數(shù),如樣本量太少,則會出現(xiàn)參數(shù)估計值不穩(wěn)定現(xiàn)象,有時甚至無法計算。當樣本量足夠大,且對變量作用情況把握不準時,引入啞變量不失為最佳選擇。值得注意的是,在采用前進法、后退法或逐步回歸法篩選自變量過程中,(k-1)個啞變量應視為一個整體,做到“同進同出”。在SAS logistic過程中,class語句會對無序多分類變量自動生成對應的啞變量并自動對其賦值,在之后的分析過程中會在三型方差分析中對該無序多分類變量整體計算Wald卡方值并進行參數(shù)檢驗。若三型方差分析中顯示該變量整體具有統(tǒng)計學意義,則在接下來的參數(shù)估計以及假設檢驗中會包含所有的(k-1)個啞變量,此時即為“同進”;若該變量整體不具有統(tǒng)計學意義,則在接下來的參數(shù)估計以及假設檢驗中不會包含所有的(k-1)個啞變量,此時即為“同出”。

有序多分類變量可以按等級的秩次賦值,這類變量的OR就是秩次(k+1)與秩次k的優(yōu)勢之比。但這樣做有時并不科學,因為此有序變量每上升或下降一個等級,對結(jié)果變量的影響并非總是線性的,若遇到有序因變量按連續(xù)變量回歸所得效果不理想時,建議采用引入啞變量的方式來處理。(1)模型評價:建立模型并進行假設檢驗只驗證了模型和回歸系數(shù)是否具有統(tǒng)計學意義,但并不表明模型擬合的效果如何。評價模型擬合效果,即評價模型的預測值與觀測值的一致性,這就是擬合優(yōu)度檢驗。擬合優(yōu)度檢驗是logistic回歸分析過程中不可缺少的環(huán)節(jié),擬合效果好,所得出的結(jié)論才更符合實際情況。(2)標準化回歸系數(shù):多重logistic回歸分析將會得到多個回歸系數(shù),若各自變量的單位不同,則各回歸系數(shù)絕對值大小并不直接表明其對因變量的相對重要性,只有用標準化回歸系數(shù)才能很好地比較。對所有自變量標準化后進行l(wèi)ogistic回歸分析,可以同時獲得非標準化回歸系數(shù)和標準化回歸系數(shù)。要得到標準化回歸系數(shù),用SAS軟件擬合多重logistic回歸方程時,只需要在model語句的選擇項中增加一項“STB”即可。

3.2 應采用多種篩選自變量的方法 篩選自變量時,從統(tǒng)計學角度看,沒有任何一種篩選方法是絕對完美無缺的,因為每種篩選方法的每一步操作都是在全部自變量的一個子集中完成的。可考慮采取3種常用的篩選自變量的方法:前進法、后退法和逐步回歸法。(1)前進法:模型中變量從無到有依次選一變量進入模型,并根據(jù)該變量在模型中的Ⅱ型離差平方和(SS2)計算F值和P值。當P值<SLENTRY(程序中規(guī)定的選變量進入方程的顯著性水平sle),則該變量入選,否則不能入選。當模型中變量數(shù)少時,某變量不符合入選標準,但隨著變量逐次增多,該變量就可能符合入選標準,直到?jīng)]有變量可入選為止。SLENTRY缺省值定為0.5,亦可定為0.2~0.4,如果自變量很多,此值還應取得更小一些,例如0.05。前進法的局限性是當SLENTRY取值小時,可能所有變量都不能入選;SLENTRY取值大時,開始選入的變量在新條件下不再進行檢驗,因而不能剔除后來變得無統(tǒng)計學意義的變量。(2)后退法:從模型語句中所包含的全部變量開始,計算留在模型中的各個自變量所產(chǎn)生的F值和P值。當P值<SLSTAY(程序中規(guī)定的從方程中剔除變量的顯著性水平sls),則將此變量保留在方程中,否則從最大的P值所對應的自變量開始逐一剔除,直到模型中沒有變量可以剔除為止。SLSTAY缺省值為0.10,欲使保留在回歸方程中的自變量都在α=0.05水平上有統(tǒng)計學意義,應讓SLSTAY=0.05。程序能運行時,因要求所選自變量的子集矩陣滿秩,所以當觀測點少且變量過多時,程序會自動從中選擇出觀測點數(shù)減1個變量建模,然后逐一進行篩選。后退法的局限性是當SLSTAY取值大時,任何一個變量都不能被剔除;反之,則開始剔除的變量后來在新條件下即使變得具有統(tǒng)計學意義,也不能再次入選回歸方程并參入檢驗。(3)逐步回歸法:此法是前進法和后退法的結(jié)合,模型中的變量從無到有像前進法那樣,根據(jù)F值按SLENTRY水平?jīng)Q定該變量是否入選。當模型選入變量后,又像后退法那樣,根據(jù)F值按SLSTAY水平剔除不具有統(tǒng)計學意義的變量,依此類推,直到?jīng)]有變量可入選,也沒有變量可剔除或入選變量就是剛剔除的變量,才停止逐步篩選過程。逐步篩選法比前進法和后退法都能更好地在模型中選出變量,但也有其局限性。其一,當有m個變量入選時,對于將要入選的第(m+1)個變量來說,前m個變量不一定是最佳組合;其二,選入或剔除變量僅以F值作為標準,完全沒考慮其他標準。由于每種篩選方法都有其優(yōu)勢和局限性,因此在選擇篩選方法時若不能十分確定,則應使用3種方法各篩選一次,將擬合結(jié)果最優(yōu)的方法作為篩選方法。其實,在構(gòu)建多重logistic回歸方程時,還有一種篩選變量的方法,稱為最優(yōu)回歸子集法;而在構(gòu)建多重線性回歸方程時,有8種篩選自變量的方法。因篇幅所限,這些內(nèi)容就不在本文詳細介紹了。

3.3 如何評價相對最優(yōu)的回歸方程 如何從多種篩選自變量的方法產(chǎn)生的眾多回歸方程中選擇一個最優(yōu)的回歸方程呢?判別標準可以有以下幾條:第一,整個回歸方程以及各個篩選出的自變量具有統(tǒng)計學意義;第二,具有統(tǒng)計學意義的各個自變量的系數(shù)在專業(yè)上具有合理的解釋;第三,由回歸方程得到的估計值必須在專業(yè)上有意義且殘差的標準誤最?。坏谒?,若幾個回歸方程中所含自變量的個數(shù)相同,取赤池信息標準值(Akaike information criteria,AIC)較小者;第五,若較優(yōu)的回歸方程所含自變量個數(shù)相差較多,在其他方面基本相同的前提下,取自變量個數(shù)最少的回歸方程。

本文實例中,前進法和逐步回歸法的AIC均為126.774,而后退法的 AIC為129.177,因此考慮選擇AIC更小的前進法或逐步回歸法的篩選結(jié)果作為最終結(jié)果。當然,本例中3種篩選方法的AIC相差不大,若從回歸方程精簡的角度來考慮,本例按回歸方程中自變量個數(shù)少作為取舍準則,選擇后退法篩選自變量的結(jié)果作為最終結(jié)果也有一定的道理。值得一提的是,絕對最優(yōu)的回歸方程是很難找到的。因為任何人都無法保證對結(jié)果變量有影響的因素是否找全、找準了,樣本對于總體的代表性究竟怎樣,數(shù)據(jù)檢測是否都準確可靠,是否僅考慮自變量的一次方對因變量的影響就足夠了,是否存在對因變量有統(tǒng)計學意義的交互作用項,上述每一個問題都對最優(yōu)回歸方程有著不可估量的影響。

[1]仇 琳,張 凌,紀 均.右美托咪定用于困難氣道患者清醒氣管插管中的鎮(zhèn)靜作用[J].藥學服務與研究,2013,13(3):208-212.Qiu Lin,Zhang Ling,Ji Jun.Sedation effect of dexmedetomidine on awake intubation in patients with difficult airway[J].Pharm Care Res,2013,13(3):208-212.In Chinese with English abstract.

[2]方積乾.衛(wèi)生統(tǒng)計學[M].7版.北京:人民衛(wèi)生出版社,2010:391-393.Fang JiQian.Health statistics[M].7th ed.Beijing:People’s Health Press,2010:391-393.In Chinese.

[3]胡良平.醫(yī)學統(tǒng)計學——運用三型理論分析定量與定性資料[M].北京:人民軍醫(yī)出版社,2009:365-366.Hu LiangPing.Medical statistics:analysis of qualitative and quantitative data with triple-type theory[M].Beijing:People’s Military Medical Press,2009:365-366.In Chinese.

猜你喜歡
因變量賦值回歸系數(shù)
關于1 1/2 … 1/n的一類初等對稱函數(shù)的2-adic賦值
L-代數(shù)上的賦值
調(diào)整有限因變量混合模型在藥物經(jīng)濟學健康效用量表映射中的運用
中國藥房(2022年7期)2022-04-14 00:34:30
適應性回歸分析(Ⅳ)
——與非適應性回歸分析的比較
多元線性回歸的估值漂移及其判定方法
強賦值幺半群上的加權Mealy機與加權Moore機的關系*
電導法協(xié)同Logistic方程進行6種蘋果砧木抗寒性的比較
偏最小二乘回歸方法
文理導航(2017年20期)2017-07-10 23:21:03
多元線性模型中回歸系數(shù)矩陣的可估函數(shù)和協(xié)方差陣的同時Bayes估計及優(yōu)良性
利用賦值法解決抽象函數(shù)相關問題オ
喜德县| 抚宁县| 鹰潭市| 库伦旗| 前郭尔| 屏东县| 湘潭县| 台南市| 临汾市| 威远县| 和静县| 张家口市| 巴东县| 台南市| 西和县| 太保市| 西乌珠穆沁旗| 随州市| 潮州市| 海门市| 睢宁县| 呼和浩特市| 银川市| 田东县| 龙岩市| 九龙城区| 雷州市| 太原市| 吉安市| 双桥区| 林甸县| 宜丰县| 建始县| 砚山县| 尚志市| 龙门县| 营山县| 罗山县| 西丰县| 苗栗县| 宾阳县|