国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

主成分分析法研究大流行病范圍界定

2020-07-23 10:51:05武佳琪張慧慧李夢潔
大經貿 2020年5期
關鍵詞:主成分分析法

武佳琪 張慧慧 李夢潔

【摘 要】 世界衛(wèi)生組織將新冠狀病毒定義為“大流行病”,這充分證明了該流行病毒的巨大破壞性,對于大流行病的定義標準,世界衛(wèi)生組織還未給出具體的定義。基于此,本文使用主成分分析法建立綜合評價模型,參考現代學者對流行病和大流行病的研究成果,并結合樣本數據集中的變量選取死亡人數、感染人數和康復人數等作為模型指標,通過SPSS軟件對樣本數據集進行計算,提取指標主成分,在世界衛(wèi)生組織對大流行病的定義基礎上,根據疾病得分劃分大流行病的閾值范圍。

【關鍵詞】 大流行病 主成分分析法 SPSS

1 引言

新型冠狀病毒的出現立即引起了全球各個國家和世界衛(wèi)生組織等國際社會組織的高度關注,此次冠狀病毒不同于普通的流行病,它在短時間內傳播到全球主要國家地區(qū),對全球經濟造成嚴重影響,對全人類造成極大的恐慌。對于新型冠狀病毒傳播規(guī)模的巨大和造成的影響,世界衛(wèi)生組織現已將其定義為“大流行病”。

2 數據預處理

本文通過整理世界衛(wèi)生組織以及各地政府公示疫情數據等作為原始數據集經過分析發(fā)現,部分數據含有噪聲,而考慮到數據的質量會對模型結果產生重要的影響,所以本文原始數據集進行清洗和統(tǒng)一的集成變換,也就是數據預處理。通常數據預處理的方法是通過填補遺漏數據、消除異常數據、平滑噪聲數據,以及糾正不一致數據,去掉數據中的噪音、填充空值、缺失值和處理不一致數據。[1]

3主成分分析法評價

由于大流行病的界定標準并沒有明確,因此本文通過結合上述現有學者的研究成果和數據預處理后的樣本數據集變量,選取各個國家在此次新冠肺炎疫情中的死亡人數、感染人數、康復人數、持續(xù)時間以及人口密度和經濟狀況建立多指標體系。對于多指標體系,本文選取主成分分析法對問題進行分析,該方法降低了主觀因素的影響,有較好的客觀性,現被廣泛引用于多個領域的指標計算。[2]

Step1:對樣本數據集進行標準化處理,定義死亡人數、感染人數、康復人數、持續(xù)時間以及人口密度和經濟狀況為。由于樣本數據的量綱不完全相同,為了使得各個指標之間有可比性,需要消除數據的量綱,一般使用的方法是最大最小法。

Step2:計算樣本矩陣的相關系數,得到相關矩陣,并計算特征根及特征向量。特征矩陣R可以得到多個非負特征根,由此得到對應的特征向量,構成正交矩陣。[3]

Step3:從多指標體系中選擇主成分。運用SPSS軟件對所建立的多指標體系進行分析,列出個主成分對應的特征值、相應的方差貢獻率和累計方差貢獻率。由于前2個指標累計已達87.98%,因此提取主成分1,主成分2構成模型的新指標。

Step4:計算主成分指標的因子載荷狀況,從下表中可以分析出,感染人數X1,康復人數X2,死亡人數X3和經濟狀況X6對于主成分1的作用較為明顯,而持續(xù)時間X4和人口密度X5對于主成分2的作用較為明顯。第一主成分集中反映了大流行病時期對人類社會產生的影響,也可概括為大流行病的危害。第二主成分則反映了大流行時期世界的基本狀況,可概括為當局現狀。

為了更清楚地解釋各變量在各主成分上的載荷意義[4],對各主成分載荷做方差最大化正交旋轉,分別得到主成分F1與主成分F2的表達式,并根據主成分表格中的貢獻率可以得到流行病的綜合評價函數如下:

Step5:帶入流行病數據, 劃分流行病與大流行病的定量條件。查詢相關資料可知,黑死病、甲型H1N1是已經被世界衛(wèi)生組織認定的“大流行病”,它們的綜合得分分別為0.857,0.663,而非典和肺結核雖然也對全球的社會發(fā)展造成影響,但是卻因為其能夠被有效控制,且擴散規(guī)模并沒有超出預期范圍,因此只是被定義為“流行病”,它們的綜合得分分別為0.568,0.231。

根據目前學者研究成果和世界衛(wèi)生組織現階段流行病標準定義,對于“大流行病”考量的指標有疾病的致死性高、疾病的擴散規(guī)模大、疾病的傳播速度快[9]。在此基礎上,本文結合上述主成分分析法得到的綜合得分,給出劃分“大流行病”的得分范圍是{0.6~1.0},不在這個范圍內的可視為“流行病”。

4 總結

新冠狀病毒肺炎于3月12日被世界衛(wèi)生組織認定為大流行病,其得分為0.714,在本文模型劃分的閾值范圍內,符合模型結果。本文所建立的PCA模型為解決大流行病劃分問題提供了較好的思路,且現代學者對此類模型已經有了很多方面的研究,也就是說有著堅實的理論基礎,合理性較強。

【參考文獻】

[1] 陳楠. 基于數據預處理的鐵路貨運量SVM預測[D].石家莊鐵道大學,2019.

[2] 蔣之犇.基于GIS的2009年甲型H1N1流感大流行影響因素研究[D].陜西師范大學,2013.

[3] 李化成. 論14世紀英國的聚落環(huán)境與黑死病傳播[J]. 世界歷史,2011(04):79-88+160.

[4] 簡天天. 英屬北美殖民地天花傳播及其防治研究[D].重慶師范大學,2019.

[5] 苗新利,郎英,楊俊.主成分分析在農村居民消費性支出研究中的應用[J].中國商論,2018(35):69-71.

作者簡介:武佳琪(出生年份1999年),性別:女,民族:漢族,籍貫:河北邯鄲,學歷:大學本科,單位:華北理工大學,研究方向:智能科學與技術。

張慧慧(出生年份2002年),性別:女,民族:漢族,籍貫:河南新鄉(xiāng),學歷:大學本科,單位:華北理工大學,研究方向:智能科學與技術。

李夢潔(出生年份2000年),性別:女,民族:漢族,籍貫:河北保定,學歷:大學本科,單位:華北理工大學,研究方向:智能科學與技術。

猜你喜歡
主成分分析法
山東省旅游產業(yè)競爭力評價研究
中國裝備制造業(yè)階段競爭力研究
陜西省各地區(qū)人力資本水平綜合評價與分析
基于主成分分析的煤層氣賦存影響因素分析
科技視界(2016年23期)2016-11-04 23:08:10
基于企業(yè)核心競爭能力的家電行業(yè)上市公司績效評價指標體系研究
基于主成分分析法的高校財務風險評價指標體系構建
商(2016年27期)2016-10-17 04:41:37
博罗县| 清徐县| 龙井市| 道孚县| 梅河口市| 灯塔市| 临夏县| 崇信县| 广汉市| 平遥县| 丰镇市| 南岸区| 昌吉市| 丽水市| 平湖市| 牙克石市| 白山市| 五原县| 木里| 宁明县| 信阳市| 乐安县| 兴和县| 大理市| 成都市| 晋江市| 河津市| 宜章县| 临海市| 塔城市| 灵石县| 芜湖市| 嘉禾县| 两当县| 开鲁县| 石城县| 红原县| 台中县| 科技| 奉贤区| 玉屏|