□陳超 田芫 宗序平
統(tǒng)計(jì)分布的性質(zhì)是學(xué)者們研究的熱點(diǎn),國內(nèi)外有許多學(xué)者研究過偏正態(tài)分布,并應(yīng)用于統(tǒng)計(jì)實(shí)踐。在此基礎(chǔ)上,定義了偏對稱正態(tài)分布,并研究了其性質(zhì)。此類分布包括偏均勻正態(tài)分布,偏t 正態(tài)分布,偏拉普拉斯正態(tài)分布,偏Logistics 正態(tài)分布和偏三角正態(tài)分布等,并探討了它們的一些性質(zhì)。
國內(nèi)外有許多學(xué)者研究了偏正態(tài)分布,如Azzalini[1](1985)定義了偏正態(tài)分布的概念;Henze[2](1986)研究了偏正態(tài)分布的一些性質(zhì);Xie[3](2010)等研究了偏正態(tài)非線性回歸模型方差參數(shù)的齊性檢驗(yàn)。這類分布已經(jīng)得到了廣泛的應(yīng)用,為工程領(lǐng)域中一些分布不對稱的數(shù)據(jù),提供了更加合理的擬合模型。除此之外,它們還有助于研究模型的魯棒性,以及作為貝葉斯分布的先驗(yàn)分布。這種模型的構(gòu)建可參見Azzalini(1985)。對偏正態(tài)分布的擴(kuò)展也已經(jīng)有了很多研究,如Gupta[4](2002)等構(gòu)造了偏對稱模型;Ferreira[5](2010)等研究了偏尺度混合正態(tài)分布的一些性質(zhì),以及Labra[6](2012)等研究了混合尺度偏正態(tài)分布的參數(shù)估計(jì)和模型診斷,都得到一些很好的應(yīng)用。在此基礎(chǔ)上,定義了偏對稱正態(tài)分布,并舉出了一些例子,探討了它們的一些性質(zhì)。
定義1.1 設(shè)隨機(jī)變量Y 的概率密度函數(shù)為f (y),f (y)為偶函數(shù),Φ(x)是標(biāo)準(zhǔn)正態(tài)分布函數(shù),隨機(jī)變量X 的概率密度函數(shù)為
其中λ 為偏度系數(shù)(可取任意實(shí)數(shù)),μ 是位置參 數(shù),σ 是 尺 度參數(shù),則稱X 服從偏對稱正態(tài)分布。
(i)μ=0,σ=1 時,g(x;λ)=2f (x)Φ(λx),稱X 服從標(biāo)準(zhǔn)偏對稱正態(tài)分布;
(ii) μ=0,σ=1,λ →+∞ 時 ,g(x;λ)=2f (x)Φ(λx)趨向于 ||Y 的概率密度函數(shù);
(iii)μ=0,σ=1,λ →-∞ 時 ,g(x;λ)=2f (x)Φ(λx) 趨 向 于-|Y|的概率密度函數(shù);
(iv) μ=0,σ=1,λ=0 時 ,g(x;λ)=f (x) 是Y 的 概 率 密 度函數(shù)。
性質(zhì)1.1 設(shè)X,Y 是上述定義中的隨機(jī)變量,則
(i)X 的偶階距和Y 的偶階距相同,且于λ 無關(guān)。
(ii)X2與Y2有 相 同 的 分 布函數(shù)。
證明: 令φX(t)是X 的特征函數(shù),φY(t)是Y 的特征函數(shù),則
令x=-x,則
因此,就得到了
設(shè)n 為任意的正整數(shù),(2)式兩邊對t 求2n 階導(dǎo)數(shù),有
所以,
因?yàn)椋?/p>
所以,上式與λ 無關(guān)所以,第(i)條結(jié)論得證。
由(3)式可知,X2與Y2的n 階距是相同的,所以X2與Y2有相同的分布函數(shù),即性質(zhì)(ii)成立。
本文將討論f 取不同的對稱概率分布函數(shù)的情況。首先取f 為標(biāo)準(zhǔn)正態(tài)分布函數(shù),得到了偏正態(tài)分布的密度函數(shù),并總結(jié)了偏正態(tài)分布的若干性質(zhì),然后分別取f 為均勻分布,t 分布,Laplace 分布,Logistics 分布,推導(dǎo)出了偏均勻正態(tài)分布,偏t 正態(tài)分布,偏Laplace 正態(tài)分布,偏Logistics 正態(tài)分布,并研究了它們的一些性質(zhì),最后列舉了若干類似的分布,有待進(jìn)一步的討論。
(1) 偏正態(tài)分布
定義2.1 設(shè)φ(x)和Φ(x)是標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)和分布函數(shù),隨機(jī)變量X 的概率密度函數(shù)為
其中λ 是偏度系數(shù)(可取任意實(shí)數(shù)),μ 是位 置參數(shù),σ 是尺 度參數(shù),則稱X 服從偏正態(tài)分布。特別的 , μ=0,σ=1 時 , g(x;λ)=2φ(x)Φ(λx),則稱X 服從標(biāo)準(zhǔn)偏正態(tài)對稱分布。圖1 給出了λ 取不同值的標(biāo)準(zhǔn)偏正態(tài)對稱分布的概率密度函數(shù)圖像。
性質(zhì)2.1 如果隨機(jī)變量X 服從標(biāo)準(zhǔn)偏正態(tài)對稱分布,則X2服從自由度為1 的卡方分布。
性質(zhì)2.2 如果隨機(jī)變量X 服從標(biāo)準(zhǔn)偏正態(tài)分布,M(t)是X 的距母函數(shù)[4],則
由上述性質(zhì),可以求出
進(jìn)一步,可以求出
其中,γ1和γ2分別是X 的偏度系數(shù)和峰度系數(shù)。
圖1 λ 取不同值的標(biāo)準(zhǔn)偏正態(tài)對稱分布的概率密度函數(shù)圖
(2)偏均勻正態(tài)分布
定義2.2 設(shè)均勻分布的密度函數(shù)
Φ(x)是標(biāo)準(zhǔn)正態(tài)分布函數(shù),隨機(jī)變量X 的概率密度函數(shù)為
其中λ 是偏度系數(shù)(可取任意實(shí)數(shù)),μ 是 位置參數(shù),σ 是 尺度參數(shù),則稱X 服從偏均勻正態(tài)分布。特 別 的,μ=0,σ=1 時,g(x;λ)=Φ(λx)I(-1≤x ≤1),則稱X 服從標(biāo)準(zhǔn)偏均勻正態(tài)分布。圖2 給出了λ取不同值的標(biāo)準(zhǔn)偏均勻正態(tài)分布的概率密度函數(shù)圖像。
性質(zhì)2.3 如果隨機(jī)變量X 服從標(biāo)準(zhǔn)偏均勻正態(tài)分布,M(t)是X 的距母函數(shù),則
圖2 λ 取不同值的標(biāo)準(zhǔn)偏均勻正態(tài)分布的概率密度函數(shù)圖
證明:
由上述性質(zhì),可以求出
(3)偏t 正態(tài)分布
定義2.3 設(shè)t 分布的密度函數(shù)
Φ(x)是標(biāo)準(zhǔn)正態(tài)分布函數(shù),隨機(jī)變量X 的概率密度函數(shù)為
其中λ 是偏度系數(shù)(可取任意實(shí)數(shù)),n 是自由度,μ 是位置參數(shù),σ 是尺度參數(shù),則稱X 服從偏t 正態(tài)分 布。 特 別 的,μ=0,σ=1 時,g(x;λ,n)=2f (x;n)Φ(λx),則稱X服從標(biāo)準(zhǔn)偏t 正態(tài)分布。圖3 給出了n=1 時,λ 取不同值的標(biāo)準(zhǔn)偏t正態(tài)分布的概率密度函數(shù)圖像。
性質(zhì)2.4 如果隨機(jī)變量X 服從標(biāo)準(zhǔn)偏t 正態(tài)分布,M(t)是X 的距母函數(shù),則
由(11)式可以求出
(4)偏Laplace 正態(tài)分布
定義2.4 設(shè)Laplace 分布的密度函數(shù)
圖3 λ 取不同值的標(biāo)準(zhǔn)偏t 正態(tài)分布的概率密度函數(shù)圖
Φ(x)是標(biāo)準(zhǔn)正態(tài)分布函數(shù),隨機(jī)變量X 的概率密度函數(shù)為
其中λ 是偏度系數(shù)(可取任意實(shí)數(shù)),μ 是 位置參數(shù),σ 是尺度 參數(shù),則稱X 服從偏Laplace 正態(tài)分布。 特 別 的,μ=0,σ=1 時,g ( x;λ)=e-|x|Φ(λx)時,稱X 服從標(biāo)準(zhǔn)偏Laplace 正態(tài)分布。圖4 給出了λ 取不同值的標(biāo)準(zhǔn)偏Laplace 正態(tài)分布的概率密度函數(shù)圖像。
性質(zhì)2.5 若隨機(jī)變量X 服從標(biāo)準(zhǔn)偏Laplace 正態(tài)分布,且偏度系數(shù)λ >0,M(t)是X 的距母函數(shù),則當(dāng)-1<t <1 時,
圖4 λ 取不同值的標(biāo)準(zhǔn)偏Laplace正態(tài)分布的概率密度函數(shù)圖
由上述性質(zhì),可以求出
(5)偏Logistic 正態(tài)分布
定義2.5 設(shè)Logistic 分布的密度函數(shù)
Φ(x)是標(biāo)準(zhǔn)正態(tài)分布函數(shù),隨機(jī)變量X 的概率密度函數(shù)為
其中λ 是偏度系數(shù)(可取任意實(shí)數(shù)),μ 是位置參數(shù),σ 是尺度 參數(shù),則稱X 服從偏Logistic 正態(tài)分布。 特 別 的,μ=0,σ=1 時,g(x;λ)=2f (x)Φ(λx),則稱X 服從標(biāo)準(zhǔn)偏Logistic 正態(tài)分布。圖5 給出了λ 取不同值的標(biāo)準(zhǔn)偏Logistic正態(tài)分布的概率密度函數(shù)圖像。
性質(zhì)2.6 如果隨機(jī)變量X 服從標(biāo)準(zhǔn)偏Logistic 正態(tài)分布,X2概率密度函數(shù)為fX2(t) 則
由(19)式可以求出
圖5 λ 取不同值的標(biāo)準(zhǔn)偏Logistic正態(tài)分布的概率密度函數(shù)圖
(6)偏三角正態(tài)分布
定義2.6 設(shè)三角(Triangular)分布的密度函數(shù)
Φ(x)是標(biāo)準(zhǔn)正態(tài)分布函數(shù),隨機(jī)變量X 的概率密度函數(shù)為
其中λ 是偏度系數(shù)(可取任意實(shí)數(shù)),μ 是位置參 數(shù),σ 是 尺 度參數(shù),則稱X 服從偏三角正態(tài)分布。特 別 的,μ=0,σ=1 時,g(x;λ)=2f (x)Φ(λx),則稱X 服從標(biāo)準(zhǔn)偏三角正態(tài)分布。圖6 給出了λ 取不同值的標(biāo)準(zhǔn)偏三角正態(tài)分布的概率密度函數(shù)圖像。
圖6 λ 取不同值的標(biāo)準(zhǔn)偏三角正態(tài)分布的概率密度函數(shù)圖
性質(zhì)2.7 如果隨機(jī)變量X 服從標(biāo)準(zhǔn)偏三角正態(tài)分布,E(X) 和Var(X)是X 的數(shù)學(xué)期望和方差,則
Φ(x)是標(biāo)準(zhǔn)正態(tài)分布函數(shù),隨機(jī)變量X 的概率密度函數(shù)為
其中λ 是偏度系數(shù)(可取任意實(shí)數(shù)),μ 是位置參 數(shù),σ 是 尺 度參數(shù),則稱X 服從偏Cauchy 正態(tài)分布。 特 別 的,μ=0,σ=1 時,g(x;λ)=2f (x)Φ(λx),則稱X 服從標(biāo)準(zhǔn)偏Cauchy 正態(tài)分布。
定義3.2 設(shè)Slash分布的密度函數(shù)
φ(x)和Φ(x)是標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)和分布函數(shù),隨機(jī)變量X 的概率密度函數(shù)為
其中λ 是偏度系數(shù)(可取任意實(shí)數(shù)),μ 是位置參 數(shù),σ 是 尺 度參數(shù),則稱X 服從偏Slash 正態(tài)分布。特 別 的,μ=0,σ=1 時,g(x;λ)=2f (x)Φ(λx),則 稱X 服 從 標(biāo) 準(zhǔn) 偏Slash 正態(tài)分布。
本文在偏正態(tài)分布的基礎(chǔ)上進(jìn)行了擴(kuò)展,研究了一類帶有偏度系數(shù)的概率密度函數(shù),定義了偏對稱正態(tài)分布,并舉出了一些例子,為分布不對稱的數(shù)據(jù)提供了一種新型的擬合模型。這對于回歸分析方面的應(yīng)用是有意義的。進(jìn)一步,可以通過EM,ECM[7],ECME[8]等算法研究偏對稱正態(tài)分布模型參數(shù)估計(jì)方面的問題,也可以通過Score 檢驗(yàn)、Ward 檢驗(yàn)對模型參數(shù)的齊性進(jìn)行診斷,也可以對模型參數(shù)的顯著性進(jìn)行研究,這方面的工作會在以后的研究中繼續(xù)進(jìn)行。
統(tǒng)計(jì)科學(xué)與實(shí)踐2019年1期