摘要:線性回歸模型主要適用于因變量為連續(xù)型(特別是服從正態(tài)分布)的隨機(jī)變量的情況。Nelder和Wedderburn(1972)推廣了線性回歸模型,提出了廣義線性模型(GLM),該模型通過(guò)一個(gè)已知的連接函數(shù)將因變量的數(shù)學(xué)期望與自變量的線性函數(shù)聯(lián)系起來(lái),并將因變量的分布推廣到了指數(shù)族分布,可以處理因變量為常見(jiàn)的一些離散型和連續(xù)型隨機(jī)變量的回歸分析問(wèn)題,有著更為寬廣的應(yīng)用領(lǐng)域。近年來(lái),GLM在理論和應(yīng)用方而都得到了快速的發(fā)展,其在車(chē)險(xiǎn)中的應(yīng)用也趨向于成熟和廣泛,本文通過(guò)一個(gè)實(shí)例,結(jié)合SAS軟件來(lái)介紹了其在分類(lèi)費(fèi)率厘定中的應(yīng)用,為車(chē)險(xiǎn)費(fèi)率厘定提供參考。
關(guān)鍵詞:廣義線性模型費(fèi)率厘定
一、引言
2016年我國(guó)汽車(chē)產(chǎn)銷(xiāo)量是1826萬(wàn)輛,從單車(chē)2000元左右到幾千元不等的保費(fèi)來(lái)看,車(chē)險(xiǎn)市場(chǎng)容量很可能穩(wěn)定在2000億以上,在我國(guó)各財(cái)產(chǎn)保險(xiǎn)公司中,汽車(chē)保險(xiǎn)業(yè)務(wù)保費(fèi)收入占其總保費(fèi)收入的50%以上,部分公司60~70%以上。汽車(chē)保險(xiǎn)業(yè)務(wù)已經(jīng)成為財(cái)產(chǎn)保險(xiǎn)公司的“吃飯險(xiǎn)種”。汽車(chē)保險(xiǎn)業(yè)務(wù)的效益已成為財(cái)產(chǎn)保險(xiǎn)公司效益的“晴雨表”,所以說(shuō),如何合理的進(jìn)行車(chē)險(xiǎn)費(fèi)率厘定,不管是對(duì)財(cái)產(chǎn)保險(xiǎn)公司來(lái)說(shuō),還是對(duì)投保人來(lái)說(shuō)都有極為重要的現(xiàn)實(shí)意義。對(duì)于廣義線性模型的應(yīng)用,早在1919年就曾被Fisher使用過(guò),二十世紀(jì)四五十年代,Berkson,Dyke和Patterson等人使用過(guò)最著名的Logistic模型,1972年Nelder和Wedderburn在一篇論文中率先使用廣義線性模型一詞,此后相關(guān)研究工作逐漸增加。
二、 基本原理
2.1指數(shù)族分布
若隨機(jī)變量ζ的概率分布(離散型)或概率密度(連續(xù)型)具有如下形式:
其中 為已知連續(xù)函數(shù), 二階可微,φ為未知參數(shù),則稱(chēng)服從指數(shù)族分布。
2.2連接函數(shù)
設(shè)因變量y和自變量X1,…,Xp的n組獨(dú)立觀測(cè)值為(yi;xi1,…xip),i=1,
…,n,y,服從指數(shù)族分布 。
連接函數(shù): 。
2.3廣義線性模型
設(shè)因變量和自變量xi,…,xp的n組獨(dú)立觀測(cè)值為(yi; xi1,…,xip),t=1,…n,如果滿(mǎn)足:
(1)對(duì)每個(gè) ;
(2)有單調(diào)、可微函數(shù)g,使得 。。
那么,稱(chēng)y和x1,…,xp服從廣義線性模型。
三、實(shí)證研究
3.1數(shù)據(jù)說(shuō)明
我們運(yùn)用SAS的Genmod程序?qū)ι鲜鰯?shù)據(jù)構(gòu)建廣義線性模型,采用對(duì)數(shù)連接函數(shù)各種不同分布下擬合優(yōu)度如下表所示:
表一:不同分布的擬合優(yōu)度比較
3.2模型選擇
我們運(yùn)用SAS的Genmod程序?qū)ι鲜鰯?shù)據(jù)構(gòu)建廣義線性模型,采用對(duì)數(shù)連接函數(shù)得到各種不同分布下擬合優(yōu)度,離差從小到大分別為逆高斯分布、伽碼分布、正態(tài)分布。因此,僅僅從總離差的角度就可以拒絕正態(tài)分布。對(duì)于各個(gè)參數(shù)的顯著性檢驗(yàn),我們則通過(guò)SAS軟件的Genmod程序的type1檢驗(yàn)得出。伽碼分布、正態(tài)分布和逆高斯分布的tpye1分析結(jié)果顯示,伽碼分布和正態(tài)分布中,所有的參數(shù)均能通過(guò)顯著性檢驗(yàn),但是在逆高斯分布中參數(shù)車(chē)型未能通過(guò)顯著性檢驗(yàn)(統(tǒng)計(jì)量為7.79,P值為0.0507),因而,逆高斯分布也被拒絕。綜合上述的總離差分析,選擇伽碼分布作為最終的擬合分布。
3.3參數(shù)估計(jì)
通過(guò)前文建立了廣義線性模型,可以看到參數(shù)P值都小于1%,說(shuō)明模型的擬合效果較好,但需要注意到,由于選擇了對(duì)數(shù)連接函數(shù),所以需要將實(shí)際參數(shù)值通過(guò)對(duì)數(shù)函數(shù)反函數(shù)來(lái)得到實(shí)際參數(shù)估計(jì)值。
表六伽馬分布對(duì)數(shù)連接函數(shù)參數(shù)估計(jì)值
四、總結(jié)
廣義線性模型(GLM)是傳統(tǒng)線性模型以及許多最常見(jiàn)的最小偏差法的延伸,從技術(shù)角度看,比標(biāo)準(zhǔn)的迭代模型更有效率,它提供的統(tǒng)計(jì)診斷功能,有助于挑選重要的變量并且確認(rèn)模型的假設(shè)條件。其相對(duì)于傳統(tǒng)線性回歸模型來(lái)說(shuō),可應(yīng)用于不符合正態(tài)分布的數(shù)據(jù)中,應(yīng)用更加廣泛和靈活,并可以同時(shí)考慮所有影響因素,但目前廣泛應(yīng)用的模型局限于指數(shù)分布族,有待進(jìn)一步擴(kuò)展。
參考文獻(xiàn):
(1)工新軍.基于廣義線性模型的車(chē)險(xiǎn)費(fèi)率厘定研究[J}保險(xiǎn)研究,2013 (9) : 43-56.
(2)孟生旺.廣義線性模型在汽車(chē)保險(xiǎn)定價(jià)的應(yīng)用[J}數(shù)理統(tǒng)計(jì)與管理,2007 ,26 (1).
(3)張連增.廣義線性模型在非壽險(xiǎn)費(fèi)率分析中的應(yīng)用[J].數(shù)理統(tǒng)計(jì)與管理,2013 , 32 (5).
作者簡(jiǎn)介:
李桂偉(1993.12-),男,漢族,山東省青島市,碩士,研究方向:保險(xiǎn)精算.endprint