国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于偏Laplace正態(tài)數(shù)據(jù)下位置、均值回歸模型的參數(shù)估計

2020-07-28 01:13:56鄭桂芬吳劉倉聶興鋒
應用數(shù)學 2020年3期
關鍵詞:偏度電影票房參數(shù)估計

鄭桂芬,吳劉倉,聶興鋒

(昆明理工大學理學院,云南 昆明650093)

1.引言

在金融、醫(yī)學和社會經(jīng)濟領域中,存在大量偏斜且厚尾的數(shù)據(jù).如果用正態(tài)分布、偏正態(tài)和偏t分布去擬合,得到的信息不精確,利用偏Laplace正態(tài)分布對數(shù)據(jù)進行擬合獲得的信息更具有準確性和可靠性,因此研究偏Laplace正態(tài)分布具有重要意義.

在過去幾十年里,學者們提出很多方法分析處理偏態(tài)數(shù)據(jù).Azzalini[1]提出了偏態(tài)指數(shù)冪分布同時處理偏態(tài)和重尾兩種情況;Monti[2]對偏態(tài)指數(shù)冪分布性質和推斷進行了研究;WU等[3]利用聯(lián)合懲罰似然方法對偏正態(tài)分布下聯(lián)合位置與尺度模型提出了一種可行有效的變量選擇方法;吳劉倉等[4]研究了偏正態(tài)數(shù)據(jù)下聯(lián)合位置與尺度混合專家回歸模型的參數(shù)估計;馬婷等[5],吳劉倉等[6]分別基于SN,StN分布下研究了聯(lián)合位置、尺度與偏度模型的極大似然估計.偏正態(tài)分布的概率密度由差的平方進行刻畫,為了能使估計的結果更加具有穩(wěn)健性,把偏正態(tài)分布進行擴展,從而引入偏Laplace正態(tài)分布,其概率密度用差的絕對值來表示.因此,分布的尾部比正態(tài)分布更加平坦.由于偏Laplace正態(tài)分布受異常點數(shù)據(jù)的影響不大、得到的結果比較穩(wěn)健,吸引了很多學者的研究興趣.Dogru和Arslan[7]在偏Laplace正態(tài)分布下研究了混合回歸模型的參數(shù)估計.Garay等[8]研究了偏正態(tài)分布混合尺度的非線性回歸模型的統(tǒng)計診斷.張舒宇等[9]研究了基于Laplace分布下混合聯(lián)合位置與尺度模型的參數(shù)估計.

綜上所述,雖然偏Laplace正態(tài)分布的回歸模型已經(jīng)有很多研究成果,但在偏Laplace正態(tài)分布下對位置和均值回歸模型建模的涉及較少,考慮到位置和均值建模的重要性,本文詳細介紹了利用EM算法對這兩個模型的參數(shù)進行極大似然估計,并通過實例結果表明本文所提出來的模型和方法的實用性和可行性.

本文結構安排如下: 第二部分給出了偏Laplace正態(tài)分布的一些性質;第三部分給出了偏Laplace正態(tài)分布下位置和均值回歸模型;第四部分利用EM算法對位置和均值回歸模型的參數(shù)進行極大似然估計;第五部分通過Monte Carlo隨機模擬實驗證實了本文提出方法的有效性;最后,實例研究結果表明,本文所提出的模型和方法是科學合理的.

2.偏Laplace正態(tài)分布

對于服從偏Laplace正態(tài)分布的隨機變量Y可以表示為Y ~SLN(μ,σ2,λ),其中μ為位置參數(shù),σ2為尺度參數(shù),λ為偏度參數(shù).則其概率密度函數(shù)可表示為

其中Φ為標準正態(tài)分布的分布函數(shù),fL(y;μ,σ)為Laplace分布的概率密度函數(shù),且

Ⅰ偏Laplace正態(tài)分布下的隨機表示

設Z ~SN(0,1,λ),V的概率密度函數(shù)為fV(v) =v?3exp(?(2v2)?1),v >0是兩個獨立隨機變量,隨機變量Y ~SLN(μ,σ2,λ)表達式為

然后,利用文[1]中的201頁和文[10]中的定理1,分布隨機變量Z的隨機表示得隨機變量Y的以下隨機表示

其中Z1~N(0,1),Z2~N(0,1)是獨立隨機變量,從而得到偏Laplace正態(tài)分布的層次表示

3.位置和均值回歸模型

Ⅰ位置回歸模型

由概率密度函數(shù)式(2.1)及位置參數(shù)回歸模型(3.1)可以得到

Ⅱ均值回歸模型

這里yi為第i個響應變量,服從位置參數(shù)為μi,尺度參數(shù)為σ2,偏度參數(shù)為λ的偏Laplace正態(tài)分布,xi=(xi1,··· ,xip)T是解釋變量,β=(β1,··· ,βp)T是維數(shù)為p×1的位置回歸模型的未知參數(shù),α=(α1,··· ,αp)T是維數(shù)為p×1的均值回歸模型的未知參數(shù).

本文采用極大似然估計的方法對參數(shù)進行估計,但因有潛變量存在,所以直接估計參數(shù)比較困難.EM算法作為解決潛變量問題參數(shù)估計的有效方法,因此接下來本文介紹所提出模型參數(shù)的極大似然估計的EM算法.

4.極大似然估計的EM算法

Ⅰ位置回歸模型下極大似然估計的EM算法

由式(3.2)可得似然函數(shù)為:

EM算法(Expectation Maximization Algorithm)是一種迭代算法,其具體流程分為兩個步驟進行: E-step是根據(jù)參數(shù)初始值或上一次迭代所得結果來計算對數(shù)似然函數(shù)的期望值;M-step是將對數(shù)似然函數(shù)最大化以獲得新的參數(shù)值,用新得到的參數(shù)值代替初始值或上一次迭代所得結果使得對數(shù)似然函數(shù)最大化.重復執(zhí)行以上兩步驟,直至收斂.下面給出EM算法在偏Laplace正態(tài)數(shù)據(jù)下位置回歸模型的參數(shù)估計中的計算步驟:

E-step: 給定觀測數(shù)和當前參數(shù)值,求出(4.3)式中給出的完全數(shù)據(jù)似然函數(shù)的條件期望,即計算(4.5)-(4.7)式中的條件期望.

Ⅱ均值回歸模型下極大似然估計的EM算法

由式(3.4)可得似然函數(shù)為

設u=(u1,··· ,un),v=(v1,··· ,vn)為缺失數(shù)據(jù),(y,u,v)為完全數(shù)據(jù).然后用層次表示法得完全數(shù)據(jù)下對數(shù)似然函數(shù)為

下面給出EM算法在偏Laplace正態(tài)數(shù)據(jù)下均值回歸模型的參數(shù)估計中的計算步驟:

E-step: 給定觀測數(shù)據(jù)和當前參數(shù)值,求出式(4.11)中給出的完全數(shù)據(jù)似然函數(shù)的條件期望,即計算(4.13)-(4.15)中的條件期望.

5.Monte Carlo模擬

Ⅰ位置回歸模型參數(shù)估計的Monte Carlo模擬

為評價位置回歸模型參數(shù)估計方法的有效性,本文對有限樣本進行模擬研究,參數(shù)估計的精確度使用均方誤差(MSE)來評價和衡量,其定義如下:

根據(jù)模型(5.1)產(chǎn)生模擬數(shù)據(jù),其中xi ~U(?1,1).yi(i=1,2,··· ,n)是根據(jù)偏Laplace正態(tài)分布產(chǎn)生的響應變量,且yi服從偏Laplace正態(tài)分布,yi的產(chǎn)生過程如下:

1) 樣本U來自均勻分布(0,1)并設;

2) 樣本Z1和Z2獨立于標準正態(tài)分布N(0,1);

3) 用適當?shù)膮?shù)值給出偏Laplace正態(tài)分布樣本.

Ⅱ均值回歸模型參數(shù)估計的Monte Carlo模擬

為評價均值回歸模型參數(shù)估計方法的有效性,參數(shù)估計的精確度使用均方誤差(MSE)來評價和衡量,其定義如下:

均取樣本量n=50,100,150,200,重復模擬1000次.模擬結果見表1、表2.

表1 位置回歸模型的參數(shù)估計模擬結果

表2 均值回歸模型的參數(shù)估計模擬結果(由于λ在分母上,故λ≠0)

從表1和表2可以得到,隨著樣本量n的增大,所有數(shù)的估計值越來越接近真值,而且估計的均方誤差(MSE)也越來越小.以上結論表明,本文提出的偏Laplace正態(tài)數(shù)據(jù)下位置和均值回歸模型及所使用的EM算法對參數(shù)的極大似然估計取得了較理想的效果.

6.實例分析

近年來,隨著人們收入的增長和生活水平的提高,觀看電影逐漸成為人們消遣娛樂的一種方式,故電影行業(yè)發(fā)展迅速,下面利用本文提出的偏Laplace正態(tài)分布的位置和均值回歸模型及其方法,對電影票房數(shù)據(jù)進行參數(shù)估計.本文對收集到的各類電影總票房和首映票房進行統(tǒng)計分析,該數(shù)據(jù)中包含一個響應變量Y-總票房和一個解釋變量X-首映票房,計算可得電影總票房的偏度系數(shù)結果表明是右偏的,直方圖如圖1所示.

圖1 電影票房數(shù)據(jù)分布直方圖

圖1和偏度系數(shù)說明電影票房數(shù)據(jù)近似的服從偏Laplace正態(tài)分布,所以可以利用該數(shù)據(jù)對偏Laplace正態(tài)分布的位置和均值回歸模型做參數(shù)估計,考慮Y與X之間的模型如下:

利用第四部分提出的參數(shù)估計方法,得到下表3.

表3 電影票房數(shù)據(jù)的位置、均值回歸模型參數(shù)估計結果

由于在同一組電影票房數(shù)據(jù)中,尺度和偏度參數(shù)是一樣的.從表中可以看出在兩個模型中的σ2和λ大體相同,但β和α在模型中代表了不同的位置,所以存在較大差異,與實際相符合,表明我們提出的模型和方法是科學合理的.

7.結論

本文利用EM算法研究了偏Laplace正態(tài)數(shù)據(jù)下位置和均值回歸模型的參數(shù)估計.從Monte Carlo模擬結果來看,本文提出的EM算法對位置和均值回歸模型的參數(shù)估計取得了較好的效果,并且在實例分析中,對電影票房實際數(shù)據(jù)的應用研究也表明了本文提出的模型和方法是科學合理的.

猜你喜歡
偏度電影票房參數(shù)估計
基于新型DFrFT的LFM信號參數(shù)估計算法
對稱分布的矩刻畫
新年新氣象,元旦來帶頭 2021年1月電影票房排行榜
打鐵還需自身硬 2020年10月電影票房排行榜
意料之中,整體表現(xiàn)平淡 2020年9月電影票房排行榜
暑期檔繼續(xù)“遇冷”2019年7月電影票房排行榜
Logistic回歸模型的幾乎無偏兩參數(shù)估計
基于偏度的滾動軸承聲信號故障分析方法
基于向前方程的平穩(wěn)分布參數(shù)估計
基于競爭失效數(shù)據(jù)的Lindley分布參數(shù)估計
孝义市| 平昌县| 容城县| 陇西县| 定安县| 栖霞市| 湖南省| 涿州市| 鹤山市| 玉门市| 峡江县| 康定县| 图木舒克市| 鹤庆县| 大兴区| 洮南市| 赣州市| 长乐市| 涟水县| 拜泉县| 平泉县| 张家口市| 林口县| 福海县| 仁寿县| 揭西县| 乌拉特前旗| 白沙| 许昌县| 准格尔旗| 甘泉县| 莆田市| 金塔县| 明光市| 丹寨县| 中西区| 沈阳市| 海城市| 寻甸| 渝北区| 西乌|