★ 趙敏 李軍山(1.南昌航空大學(xué) 南昌 330063;2.江西中醫(yī)藥大學(xué) 南昌 330004)
中醫(yī)藥是中華文明的瑰寶,為中華民族繁衍生息做出了巨大貢獻(xiàn)。繼2013年《中醫(yī)藥法》頒布實(shí)施后,2019年全國(guó)中醫(yī)藥大會(huì)在北京勝利召開(kāi),中醫(yī)藥迎來(lái)了大好發(fā)展機(jī)遇。2020年初,中醫(yī)藥在新冠疫情防治中的卓越表現(xiàn),再次彰顯了中醫(yī)藥在健康維護(hù)和促進(jìn)方面的特色優(yōu)勢(shì)。習(xí)近平總書(shū)記多次作出重要批示,提出要大力發(fā)展好、保護(hù)好、挖掘好中醫(yī)藥。當(dāng)前,相對(duì)于中醫(yī)藥人才、設(shè)備、技術(shù)等服務(wù)能力條件建設(shè)明顯改善的狀況,中醫(yī)藥服務(wù)能力評(píng)價(jià)理論研究顯得有些滯后。多數(shù)文獻(xiàn)為定性分析或描述性統(tǒng)計(jì)分析[1-2]。少數(shù)學(xué)者采用了主成分分析或因子分析等現(xiàn)代統(tǒng)計(jì)分析方法[3-4],但對(duì)這兩種方法沒(méi)有進(jìn)行區(qū)分[5-8],研究結(jié)果科學(xué)性有待于進(jìn)一步提升。為此,本文采用Python語(yǔ)言編程[9-10],分別運(yùn)用主成分分析和因子分析兩種方法,對(duì)我國(guó)中醫(yī)藥服務(wù)能力評(píng)價(jià)進(jìn)行比較研究,為我國(guó)中醫(yī)藥服務(wù)能力評(píng)價(jià)和提升提供方法參考和智力支持。
1.1 資料來(lái)源 本文在全面梳理中醫(yī)藥服務(wù)能力相關(guān)文獻(xiàn)的基礎(chǔ)上,結(jié)合數(shù)據(jù)可得性,選取15個(gè)指標(biāo)用來(lái)評(píng)價(jià)中醫(yī)藥服務(wù)能力,詳見(jiàn)表1。
表1 中醫(yī)藥服務(wù)能力指標(biāo)體系一覽表
全部指標(biāo)的數(shù)據(jù)均來(lái)源于2018年全國(guó)中醫(yī)藥統(tǒng)計(jì)摘編數(shù)據(jù)。除臺(tái)灣和西藏?cái)?shù)據(jù)缺失外,本文分析評(píng)價(jià)對(duì)象共計(jì)北京、上海等其余30?。ㄗ灾螀^(qū)、直轄市),以下簡(jiǎn)稱(chēng)30省。
為消除不同變量不同單位帶來(lái)的影響,所有變量數(shù)據(jù)分析之前均進(jìn)行標(biāo)準(zhǔn)化處理。
1.2 研究方法與思路 本文主要分別采用主成分分析和因子分析法,對(duì)30省的中醫(yī)藥服務(wù)能力進(jìn)行分析排名和聚類(lèi),旨在通過(guò)比較研究?jī)煞N方法的對(duì)應(yīng)排名結(jié)果和聚類(lèi)分析結(jié)果,進(jìn)一步闡釋兩種定量分析方法的異同點(diǎn),從而為科學(xué)客觀評(píng)價(jià)我國(guó)中醫(yī)藥服務(wù)能力提供方法參考。
主成分分析和因子分析都是利用降維思想,嘗試用幾個(gè)主成分(或公因子)來(lái)代表所有原始變量的信息。不同的是,主成分分析法是在損失很少信息的前提下把多個(gè)指標(biāo)轉(zhuǎn)化為幾個(gè)不相關(guān)的綜合指標(biāo)(主成分),即每個(gè)主成分都是原始變量的線性組合,且各個(gè)主成分之間一定互不相關(guān)。而因子分析中一般假定各公因子互不相關(guān),但實(shí)際上各公因子并不一定滿足互不相關(guān)要求。因子分析也是利用降維的思想,由研究原始變量相關(guān)矩陣內(nèi)部的依賴關(guān)系出發(fā),把一些具有錯(cuò)綜復(fù)雜關(guān)系的變量表示成少數(shù)的公共因子和僅對(duì)某一個(gè)變量有作用的特殊因子線性組合而成。相對(duì)于主成分分析,因子分析更傾向于描述原始變量之間的相關(guān)關(guān)系。因子分析的前提是各公因子假定為互不相關(guān),其重點(diǎn)在于解釋各變量之間的協(xié)方差。
本文主要運(yùn)用Python語(yǔ)言,通過(guò)編程,調(diào)用有關(guān)函數(shù),完成原始數(shù)據(jù)輸入、計(jì)算和結(jié)果輸出。
2.1 各省市中醫(yī)藥服務(wù)能力排名結(jié)果
2.1.1 主成分分析法對(duì)應(yīng)排名結(jié)果 主成分分析法是通過(guò)方差值和方差比來(lái)評(píng)價(jià)降維效果是否合理。方差值代表降維后的各主成分的方差值,方差值越大,說(shuō)明越是重要的成分;方差比代表降維后的各主成分的方差值占總方差值的比例,此比例越大,越是重要的主成分。15個(gè)指標(biāo)(變量)會(huì)產(chǎn)生15個(gè)互相正交的主成分,各主成分的方差值和方差比見(jiàn)表2。
表2 全部成分的方差比和方差值
由表2可知,主成分(1)、(2)、(3)的方差比和方差值均遠(yuǎn)遠(yuǎn)大于其余成分的方差比和方差值。這3個(gè)主成分所占的方差值是總方差的98.0%,也遠(yuǎn)遠(yuǎn)大于其余成分的方差百分比,所以只選擇前3個(gè)成分為主要成分,其余成分丟失信息可以忽略不計(jì)。
運(yùn)用Python語(yǔ)言,調(diào)用主成分分析(PCA)函數(shù),最終得到30省中醫(yī)藥服務(wù)能力綜合得分排名,詳見(jiàn)表3。
表3 基于主成分分析和因子分析的30省市中醫(yī)藥服務(wù)能力綜合得分
從表3可以看出,兩種分析方法排名結(jié)果完全的一致省市有8個(gè),排名僅相差1位的有13個(gè)省市,相差2位的有7個(gè)省市,三者加起來(lái)共計(jì)28個(gè)省市。其余兩個(gè)省市排名相差分別為3位和5位。
2.1.2 因子分析法對(duì)應(yīng)排名結(jié)果
第一,因子分析適用性檢驗(yàn)。運(yùn)用Python語(yǔ)言,調(diào)用自定義函數(shù)及庫(kù)函數(shù),適用性檢驗(yàn)結(jié)果如表4。由表4可以看出,KMO> 0.7,效果比較理想,同時(shí),巴特利特球形度檢驗(yàn)P<<0.05,說(shuō)明因子分析可以應(yīng)用于本文原始數(shù)據(jù)。
表4 KMO 和巴特利特檢驗(yàn)
第二,公因子的選取。由表5可知,前3個(gè)因子(factor 0,factor 1,factor 2)對(duì)應(yīng)的特征根大于1,因此本文選取此3個(gè)因子。此3個(gè)因子累計(jì)方差貢獻(xiàn)率90.1%,也遠(yuǎn)遠(yuǎn)大于其余因子的累計(jì)方差貢獻(xiàn)率。
表5 公共因子的方差累計(jì)貢獻(xiàn)率、方差貢獻(xiàn)率、特征值
第三,計(jì)算中醫(yī)藥服務(wù)能力綜合得分。假定此3個(gè)因子互不相關(guān)。根據(jù)選取的3個(gè)因子,調(diào)用Factor Analyzer等相關(guān)函數(shù),可得中醫(yī)藥服務(wù)能力綜合得分公式,具體如下:
C=A.B;K=D.C;E=(K.F)/ 0.900 778
其中:A:相關(guān)系數(shù)矩陣的逆矩陣(15*15);B:旋轉(zhuǎn)因子載荷矩陣(15*3);C:因子得分系數(shù)矩陣(15*3);D:原始數(shù)據(jù)(30*15);K:30省的3個(gè)因子得分(30*3);F:3個(gè)因子的方差貢獻(xiàn)率(3*1);E:綜合得分(30*1)。
根據(jù)以上公式,可得到基于因子分析的30省中醫(yī)藥服務(wù)能力綜合得分及排名,詳見(jiàn)表3。
2.2 30省中醫(yī)藥服務(wù)能力聚類(lèi)分析結(jié)果 基于無(wú)監(jiān)督學(xué)習(xí)聚類(lèi)分析中的K-Means法,運(yùn)用輪廓系數(shù)法選取K值,以確定30省中醫(yī)藥服務(wù)能力聚類(lèi)分析的類(lèi)別數(shù)量。若K值過(guò)大或過(guò)小,則失去聚類(lèi)的意義,一般規(guī)定K值的選擇范圍為4~9。調(diào)整K值并對(duì)比輪廓系數(shù)的大小,輪廓系數(shù)越接近1,表示K值越合理。
在運(yùn)行程序過(guò)程中,測(cè)試發(fā)現(xiàn)直接聚類(lèi)和降維后再聚類(lèi)的輪廓系數(shù)的大小會(huì)稍有差異。通過(guò)表6看出,降維前、后K=4時(shí),輪廓系數(shù)值都最接近1,因此在K-Means法聚類(lèi)分析中,K值選擇4,即30省中醫(yī)藥服務(wù)能力分為四個(gè)類(lèi)別比較合理。
表6 降維前后輪廓系數(shù)大小的比較
2.2.1 基于所有原始變量的對(duì)應(yīng)聚類(lèi)分析結(jié)果 首先,不對(duì)原始變量做任何降維操作,而是直接基于所有原始變量進(jìn)行聚類(lèi)分析。此聚類(lèi)分析結(jié)果可作為比較主成分分析和因子分析相應(yīng)結(jié)果的標(biāo)準(zhǔn)。具體結(jié)果如表7所示。
2.2.2 主成分分析法對(duì)應(yīng)聚類(lèi)分結(jié)果 運(yùn)用主成分分析法,進(jìn)行降維后聚類(lèi)分析結(jié)果和沒(méi)有進(jìn)行降維并直接進(jìn)行聚類(lèi)分析的結(jié)果完全一致。說(shuō)明基于主成分分析的聚類(lèi)結(jié)果與直接基于所有原始變量的聚類(lèi)分析結(jié)果無(wú)差別如表7(左側(cè))所示。
2.2.3 因子分析法對(duì)應(yīng)聚類(lèi)分析結(jié)果 運(yùn)用因子分析降維后并進(jìn)行聚類(lèi)分析的結(jié)果如表7(右側(cè))所示。也分為四類(lèi),各類(lèi)差別一目了然。
表7 基于原始變量的直接聚類(lèi)分析結(jié)果
(1)兩種方法都能夠較好分析說(shuō)明中醫(yī)藥服務(wù)能力排名。從表3可以看出,兩種方法對(duì)應(yīng)的中醫(yī)藥服務(wù)能力排名結(jié)果基本一致:30省中,排名相差3位以上的只有2個(gè)省市。比較表7和表8,兩種方法聚類(lèi)分析結(jié)果也比較相似。這充分說(shuō)明,針對(duì)本文30省中醫(yī)藥服務(wù)能力數(shù)據(jù)信息資料,兩種方法都能較好地分析中醫(yī)藥服務(wù)能力排名和分類(lèi)。
(2)兩種分析方法對(duì)應(yīng)結(jié)果存在一些差異。主成分分析中,三個(gè)主成分互不相關(guān),且代表了近98 %原始變量信息。而因子分析中,提取的三個(gè)公因子并不一定不相關(guān),且其代表的原始變量信息也只有90 %。這導(dǎo)致二者分析結(jié)果存在一定差異。尤其是聚類(lèi)分析中,四個(gè)類(lèi)別中僅有一個(gè)類(lèi)別完全一致(即海南省自成1類(lèi)),但其他三類(lèi)的組成存在差別,個(gè)別類(lèi)別差別較大。
(3)從聚類(lèi)分析結(jié)果看,主成分分析方法相對(duì)更為準(zhǔn)確。主成分分析對(duì)應(yīng)結(jié)果和沒(méi)有進(jìn)行降維,直接基于原始變量數(shù)據(jù)進(jìn)行聚類(lèi)分析的結(jié)果完全一致,而因子分析對(duì)應(yīng)結(jié)果還存在一定差別,可能原因在于,因子分析必須假設(shè)各公因子互不相關(guān),但實(shí)際上,往往并不一定符合此假設(shè)。
(4)相對(duì)SPSS,采用Python語(yǔ)言編程更具靈活性。Python語(yǔ)言可靈活調(diào)用相關(guān)函數(shù),而基于SPSS的因子分析包含了主成分分析,容易導(dǎo)致混淆,初學(xué)者應(yīng)優(yōu)先使用Python。
(5)本文沒(méi)有基于原始變量的相關(guān)關(guān)系來(lái)闡釋兩種分析方法的適用性,這是本文不足之處,也是未來(lái)研究方向所在。因子分析的優(yōu)勢(shì)在于能夠更好地說(shuō)明各變量之間的相關(guān)性。顯然,用以表示中醫(yī)藥服務(wù)能力的15個(gè)變量之間有一定相關(guān)關(guān)系。未來(lái)需要基于原始變量之間相關(guān)性來(lái)分析兩種方法的適用性。