国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于python的Z檢驗(yàn)法和T檢驗(yàn)法研究

2022-08-31 08:19:20歐,何
大眾標(biāo)準(zhǔn)化 2022年15期
關(guān)鍵詞:假設(shè)檢驗(yàn)檢驗(yàn)法面向?qū)ο?/a>

袁 歐,何 山

(成都錦城學(xué)院,四川 成都 611731)

1 選題的背景及意義

1.1 研究的背景

統(tǒng)計(jì)學(xué)中假設(shè)檢驗(yàn)分析成為了數(shù)據(jù)分析、概率統(tǒng)計(jì)、預(yù)測(cè)結(jié)果等不可或缺的方法,它在社會(huì)科學(xué)分析,百姓的健康統(tǒng)計(jì),空氣質(zhì)量預(yù)測(cè)運(yùn)用中越來(lái)越廣泛,發(fā)揮著重要作用。最早的數(shù)據(jù)分析是通過(guò)人們?cè)诩埳线M(jìn)行演算,之后采用計(jì)算器,電腦等進(jìn)行計(jì)算,這些方法能解決計(jì)算步驟,但無(wú)法解決公式記錯(cuò)、邏輯順序等問(wèn)題。那么,如果我們采用python語(yǔ)言進(jìn)行假設(shè)檢驗(yàn)的程序編寫恰巧能解決計(jì)算錯(cuò)誤,公式用錯(cuò),邏輯思維混亂等問(wèn)題。Python語(yǔ)言是解釋性、編譯性、互動(dòng)性和面向?qū)ο蟮哪_本語(yǔ)言,它不僅能調(diào)用第三方庫(kù)對(duì)數(shù)據(jù)進(jìn)行分析,完成假設(shè)檢驗(yàn),也能利用標(biāo)準(zhǔn)庫(kù)結(jié)合Z檢驗(yàn)與T檢驗(yàn)分析方法的概念與思路進(jìn)行程序編寫來(lái)完成假設(shè)檢驗(yàn)。近年來(lái),隨著科學(xué)技術(shù)的發(fā)展,空氣質(zhì)量逐年下降。由此,文章將對(duì)成都市2021年1月的空氣質(zhì)量指數(shù)進(jìn)行估計(jì),采用面向?qū)ο蟮姆椒ㄍ瓿杉僭O(shè)檢驗(yàn),并且與調(diào)用python語(yǔ)言第三方庫(kù)的分析方法進(jìn)行比較。

1.2 研究的意義

通過(guò)統(tǒng)計(jì)學(xué)假設(shè)檢驗(yàn)對(duì)成都市某月整體空氣指數(shù)進(jìn)行估計(jì),有利于了解當(dāng)月整體空氣指數(shù)狀況,也有利于對(duì)下個(gè)月空氣質(zhì)量預(yù)測(cè)分析提供數(shù)據(jù)支持。此外,相關(guān)部門能及時(shí)采取措施,控制和減少工廠對(duì)污染物的排放量,防止污染物在大氣中傳播,避免污染物對(duì)空氣質(zhì)量的影響。而采用python語(yǔ)言的標(biāo)準(zhǔn)庫(kù)以面向?qū)ο蟮姆椒▽?duì)假設(shè)檢驗(yàn)進(jìn)行分析有利于減少?gòu)?fù)雜的計(jì)算,不僅使邏輯順序條理清晰,也能使Z檢驗(yàn)與T檢驗(yàn)的計(jì)算公式運(yùn)用恰當(dāng)。采用面向?qū)ο蟮姆椒ㄟM(jìn)行分析更能體現(xiàn)假設(shè)檢驗(yàn)方法的邏輯與思路,也能比較出此方法與調(diào)用第三方庫(kù)方法的異同,并且利用python語(yǔ)言更能熟練掌握與運(yùn)用Z檢驗(yàn)法與T檢驗(yàn)法。

2 基于Z檢驗(yàn)法與T檢驗(yàn)法的分析流程

2.1 相關(guān)概念界定

2.1.1 概念

Z檢驗(yàn)(U檢驗(yàn)):由于在實(shí)際問(wèn)題中絕大多數(shù)是隨機(jī)變量,若總體為正態(tài)分布,則樣本統(tǒng)計(jì)量服從正態(tài)分布;若總體為非正態(tài)分布,則樣本統(tǒng)計(jì)量近似服從正太分布;由于計(jì)算U的分位數(shù)或查相應(yīng)的分布表比較方便。通過(guò)比較由樣本觀測(cè)值得到的Z的觀測(cè)值來(lái)判斷數(shù)學(xué)期望的顯著性,把這種利用服從正態(tài)分布統(tǒng)計(jì)量的檢驗(yàn)方法叫做Z檢驗(yàn)法。正如,總體標(biāo)準(zhǔn)差已知或者總體標(biāo)準(zhǔn)差未知且樣本容量n>30,這兩種情況分別為服從正態(tài)分布或者近似服從正態(tài)分布,都將采用Z檢驗(yàn)法。其公式為:

T檢驗(yàn):主要用于樣本量較小(0<n<30)且總體標(biāo)準(zhǔn)差未知的分布,是用t分布理論來(lái)推論差異發(fā)生的概率。樣本統(tǒng)計(jì)量服從t分布,從而比較兩個(gè)平均數(shù)的差異是否顯著。其公式為:

注意:z,t為符號(hào)代表,沒(méi)有特殊意義。

Python語(yǔ)言中的面向?qū)ο螅好嫦驅(qū)ο笾凶钪匾膬煞N是類和實(shí)例。類是具有相同屬性和行為的一類的實(shí)體,它是封裝對(duì)象的屬性和行為的載體。而對(duì)象是世間萬(wàn)物中人們隨處可見(jiàn)的、存在的。此方法需注意:定義類時(shí)采用的保留字是Class,其次應(yīng)定義(def)一個(gè)構(gòu)造函數(shù)__inite__,初始化時(shí)self不能省略,其次在定義實(shí)例屬性,實(shí)例屬性必須在構(gòu)造函數(shù)中初始化。

2.1.2 流程

Z檢驗(yàn)與T檢驗(yàn)法的假設(shè)檢驗(yàn)步驟分為4步,分別是:(1)假設(shè)原假設(shè)(H0)與備擇假設(shè)(H1);(2)計(jì)算樞軸量;(3)找臨界值并觀察數(shù)據(jù);(4)判斷是否拒絕原假設(shè)并得出結(jié)論。Z檢驗(yàn)法與T檢驗(yàn)法的區(qū)別在于:當(dāng)總體標(biāo)準(zhǔn)差已知或者當(dāng)總體標(biāo)準(zhǔn)差未知且是大樣本(n>30)時(shí)采用Z檢驗(yàn);當(dāng)總體標(biāo)準(zhǔn)差未知且是小樣本(0<n<30)時(shí)采用T檢驗(yàn)法;文章將根據(jù)此步驟著重研究采用python語(yǔ)言中的類的方法分析成都市2021年1月的空氣質(zhì)量指數(shù)。

2.2 基于python語(yǔ)言的假設(shè)檢驗(yàn)分析

2.2.1 假設(shè)檢驗(yàn)中公式的函數(shù)

文章研究的是基于python 語(yǔ)言的假設(shè)檢驗(yàn)分析,首先定義一個(gè)項(xiàng)目類(Class index ),其次定義構(gòu)造函數(shù)(__inite__),寫出實(shí)例屬性(self.data=data,self.u=u,self.σ=σ)。根 據(jù)Z檢 驗(yàn)法與T檢驗(yàn)法的不同將定義5個(gè)函數(shù),分別是計(jì)算平均值(average);計(jì)算方差(val);z檢驗(yàn)總體標(biāo)準(zhǔn)差已知(z_fun);Z檢驗(yàn)總體標(biāo)準(zhǔn)差未知且為大樣本(n>30)(z_unknow_fun);T檢驗(yàn)總體標(biāo)準(zhǔn)差未知且為小樣本(0<n<30)(t_fun)。運(yùn)用python語(yǔ)言中類與實(shí)例方法編寫每一步算式。其核心代碼如下:

圖1 計(jì)算平均值與方差

圖2 Z檢驗(yàn)與T檢驗(yàn)

2.2.2 調(diào)用函數(shù)進(jìn)行驗(yàn)證分析

這段研究是建立在假設(shè)檢驗(yàn)中Z檢驗(yàn)與T檢驗(yàn)的的函數(shù)之上的,采用from Indext import indext與項(xiàng)目類緊密相連,是對(duì)項(xiàng)目類(Class indext)的測(cè)試。其次,是對(duì)Z檢驗(yàn)與T檢驗(yàn)邏輯思想的體現(xiàn),Z檢驗(yàn)和T檢驗(yàn)法的分析步驟將分為5步:(1)用戶假設(shè)原假設(shè)(H0)和備擇假設(shè)(H1);(2)輸入數(shù)據(jù)并確認(rèn)數(shù)據(jù)是否正確;(3)用戶輸入總體均值,判斷總體標(biāo)準(zhǔn)差是否已知;(4)判斷Z檢驗(yàn)還是T檢驗(yàn)并找出臨界值;(5)最后得出結(jié)論。測(cè)試的核心代碼如下所示:

圖3 平均值與方差

圖4 計(jì)算樞軸量

圖5 分析并得出結(jié)論

3 實(shí)驗(yàn)及結(jié)論

3.1 實(shí)驗(yàn)

隨著時(shí)代的進(jìn)步,人們對(duì)健康狀況的關(guān)注程度不斷提高,空氣成為了影響身體健康的因素之一??諝赓|(zhì)量指數(shù)(AQI)是定量描述空氣質(zhì)量狀況的無(wú)量綱指數(shù)。根據(jù)空氣質(zhì)量指數(shù),它能判斷當(dāng)天環(huán)境的污染程度。即假設(shè)空氣質(zhì)量沒(méi)有被污染的標(biāo)準(zhǔn)空氣質(zhì)量指數(shù)為100,成都市2021年1月每天的空氣質(zhì)量指數(shù)(AQI)為:

已知成都市2021年1月每天的空氣質(zhì)量指數(shù)服從正態(tài)分布,在顯著水平?為0.05的情況下,檢驗(yàn)成都市2021年1月空氣質(zhì)量整體指數(shù)是否處于污染階段。

3.2 實(shí)驗(yàn)分析

由上述實(shí)驗(yàn)所示:本實(shí)驗(yàn)將檢驗(yàn)成都市2021年1月空氣質(zhì)量整體指數(shù)是否處于污染階段,則原假設(shè)H0為成都市2021年1月空氣質(zhì)量整體指數(shù)處于污染階段,備澤假設(shè)H1為成都市2021年1月空氣質(zhì)量整體指數(shù)不處于污染階段。此外,1月空氣指數(shù)的總體均值為100,總體標(biāo)準(zhǔn)差未知,且樣本n為31,由于31>30,故為大樣本,近似服從正態(tài)分布,故此實(shí)驗(yàn)將是顯著水平?=0.05的Z檢驗(yàn)。

3.3 結(jié)論

通過(guò)面向?qū)ο蠓椒ǚ治龀啥际?021年1月空氣質(zhì)量指數(shù)得出以下相應(yīng)結(jié)果:

表1 空氣質(zhì)量指數(shù)分析表

由此可得出:z1<a,H0成立,不拒絕原假設(shè),成都市2021年1月空氣質(zhì)量整體指數(shù)處于污染階段。

4 比較面向?qū)ο蠓椒ㄅc調(diào)用第三方庫(kù)方法

調(diào)用第三方庫(kù)對(duì)成都市2021年1月空氣指數(shù)分析的核心代碼為:

圖6 調(diào)用第三方庫(kù)代碼

經(jīng)過(guò)對(duì)比,第三方庫(kù)所得結(jié)果與類的方法是所得結(jié)果一致。由此可得:第三方庫(kù)的方法所得到的結(jié)果與本研究的類的方法所得結(jié)果一致,且類的方法與調(diào)用第三方庫(kù)的方法(如numpy庫(kù),matplotlib庫(kù),scipy庫(kù) statsmodels庫(kù))雖然都能解決Z檢驗(yàn)與T檢驗(yàn),并得出結(jié)論。但是兩者的區(qū)別在于:直接導(dǎo)入統(tǒng)計(jì)學(xué)需要的第三方庫(kù)可以避免一些復(fù)雜的數(shù)學(xué)公式及計(jì)算,它可以提高檢驗(yàn)效率,代碼簡(jiǎn)潔明了。但是它不能體現(xiàn)假設(shè)檢驗(yàn)的思想方法,不能直觀反映數(shù)學(xué)公式。而類的方法恰巧與它相反,它的代碼復(fù)雜并且長(zhǎng),但它能夠清楚表現(xiàn)統(tǒng)計(jì)學(xué)中假設(shè)檢驗(yàn)的三個(gè)步驟和方法,也能表明數(shù)學(xué)思維。

5 結(jié)語(yǔ)

文章對(duì)統(tǒng)計(jì)學(xué)中假設(shè)檢驗(yàn)進(jìn)行了分析,研究了基于python語(yǔ)言的Z檢驗(yàn)和T檢驗(yàn),并分析了成都市2021年1月空氣質(zhì)量指數(shù)是否處于污染階段進(jìn)行了檢驗(yàn)與結(jié)果分析。此外,比較了python語(yǔ)言中類的方法與導(dǎo)入第三方庫(kù)的方法的區(qū)別。文中的代碼主要體現(xiàn)在類的方法上,它從數(shù)學(xué)公式反映假設(shè)檢驗(yàn)的思路,使其能熟練掌握假設(shè)檢驗(yàn)方法與原理。其實(shí),筆者認(rèn)為文章所研究的面向?qū)ο蟮姆椒ㄅc調(diào)用第三方庫(kù)的方法存在一些劣勢(shì),正如在數(shù)據(jù)處理上,兩種方法都需要一個(gè)一個(gè)輸入數(shù)據(jù),當(dāng)數(shù)據(jù)龐大時(shí)容易出現(xiàn)兩個(gè)問(wèn)題:(1)容易輸入錯(cuò)誤數(shù)據(jù);(2)花費(fèi)時(shí)間較長(zhǎng)。在未來(lái),筆者將采用pandas庫(kù)處理這方面的問(wèn)題。其次,對(duì)于采用面向?qū)ο蟮姆椒ㄋ芯康腪檢驗(yàn)與T檢驗(yàn),其代碼部分筆者認(rèn)為并不精簡(jiǎn),筆者將會(huì)保持假設(shè)檢驗(yàn)的方法與步驟對(duì)代碼進(jìn)行優(yōu)化,讓它達(dá)到最精致。

猜你喜歡
假設(shè)檢驗(yàn)檢驗(yàn)法面向?qū)ο?/a>
面向?qū)ο蟮挠?jì)算機(jī)網(wǎng)絡(luò)設(shè)計(jì)軟件系統(tǒng)的開(kāi)發(fā)
面向?qū)ο蟮臄?shù)據(jù)交換協(xié)議研究與應(yīng)用
PCR 檢驗(yàn)法和細(xì)菌培養(yǎng)法用于陰道細(xì)菌檢驗(yàn)的效果
統(tǒng)計(jì)推斷的研究
雙冪變換下正態(tài)線性回歸模型參數(shù)的假設(shè)檢驗(yàn)
Primary Question and Hypothesis Testing in Randomized Controlled Clinical Trials
統(tǒng)計(jì)學(xué)教學(xué)中關(guān)于假設(shè)檢驗(yàn)問(wèn)題探討
面向?qū)ο骔eb開(kāi)發(fā)編程語(yǔ)言的的評(píng)估方法
面向?qū)ο笮畔⑻崛≈杏跋穹指顓?shù)的選擇
河南科技(2014年10期)2014-02-27 14:09:03
關(guān)于協(xié)方差的U統(tǒng)計(jì)量檢驗(yàn)法
长丰县| 莱西市| 邹平县| 青田县| 九寨沟县| 贞丰县| 扎兰屯市| 衡阳县| 板桥市| 涞水县| 兴化市| 临湘市| 上林县| 开平市| 六盘水市| 萨迦县| 东源县| 章丘市| 海伦市| 曲周县| 玛多县| 屯昌县| 普兰店市| 佛坪县| 汝城县| 朔州市| 孝感市| 民乐县| 龙州县| 虹口区| 临清市| 石阡县| 葵青区| 玉门市| 辉南县| 贵溪市| 嘉禾县| 揭西县| 夏津县| 江阴市| 巴里|