張連增 申晴
摘 要:為分析我國(guó)交強(qiáng)險(xiǎn)各因素對(duì)索賠頻率的影響,以2016年廣東、河南、湖北、山東四省的保單數(shù)據(jù)為樣本,采用廣義可加模型(GAM)對(duì)其保單中的駕駛員年齡、汽車車齡和汽車重量進(jìn)行非參數(shù)分析,并對(duì)公路里程數(shù)等變量進(jìn)行參數(shù)分析。結(jié)果表明:索賠頻率有明顯的地區(qū)差異,公路里程數(shù)對(duì)索賠頻率有正向的影響,其中除汽車車型對(duì)索賠頻率沒有影響外,其余變量均有顯著影響。
關(guān)鍵詞: 交強(qiáng)險(xiǎn);索賠頻率;廣義可加模型
一、引 言
交強(qiáng)險(xiǎn)是“機(jī)動(dòng)車交通事故責(zé)任強(qiáng)制保險(xiǎn)”的簡(jiǎn)稱,是我國(guó)第一個(gè)由法律規(guī)定實(shí)行的強(qiáng)制性保險(xiǎn)。在“不盈利、不虧損”的原則下由國(guó)家根據(jù)被保險(xiǎn)車輛的種類和座位數(shù)的不同,統(tǒng)一規(guī)定相應(yīng)的基礎(chǔ)費(fèi)率,由各家經(jīng)營(yíng)交強(qiáng)險(xiǎn)業(yè)務(wù)的保險(xiǎn)公司統(tǒng)一征收。交強(qiáng)險(xiǎn)自2006年7月1日實(shí)行以來(lái),一直備受關(guān)注與爭(zhēng)議。一方面,交強(qiáng)險(xiǎn)作為一種福利性保險(xiǎn),在發(fā)生交通事故時(shí)使事故受害人能夠獲得及時(shí)的經(jīng)濟(jì)賠付和醫(yī)療救助,并且通過建立一套“獎(jiǎng)懲系統(tǒng)”(即BMS)增強(qiáng)了駕駛?cè)说慕煌ò踩庾R(shí),充分發(fā)揮了保險(xiǎn)的社會(huì)保障功能,實(shí)現(xiàn)了社會(huì)的穩(wěn)定和諧;另一方面,根據(jù)中國(guó)銀行保險(xiǎn)監(jiān)督管理委員會(huì)(原中國(guó)保險(xiǎn)監(jiān)督管理委員會(huì))于2017年11月公布的數(shù)據(jù),截止2016年12月3日中國(guó)交強(qiáng)險(xiǎn)總體私保虧損22億元,而且不同地區(qū)的交強(qiáng)險(xiǎn)賠付率有明顯的差異。整體上看,經(jīng)濟(jì)欠發(fā)達(dá)地區(qū)的賠付率低于較發(fā)達(dá)地區(qū)的賠付率。因此,如何在現(xiàn)有監(jiān)管政策下,進(jìn)一步改善交強(qiáng)險(xiǎn)承保虧損情況,以及經(jīng)濟(jì)欠發(fā)達(dá)地區(qū)隱形交強(qiáng)險(xiǎn)補(bǔ)貼經(jīng)濟(jì)發(fā)達(dá)地區(qū)情況成為了學(xué)界、業(yè)界爭(zhēng)相探討的議題。
解決上述問題的關(guān)鍵在于科學(xué)合理地進(jìn)行交強(qiáng)險(xiǎn)費(fèi)率厘定。索賠頻率是車險(xiǎn)費(fèi)率厘定以及非壽險(xiǎn)精算的重要組成部分,自從20世紀(jì)90年代英國(guó)精算師把廣義線性模型(Generalized Linear Models,GLM)應(yīng)用于非壽險(xiǎn)定價(jià)中,非壽險(xiǎn)產(chǎn)品得以科學(xué)定價(jià)的同時(shí),GLM在精算中的應(yīng)用也得到不斷完善與發(fā)展。另外,Jong等(2008)、Ohlsson等(2010)詳細(xì)介紹了車險(xiǎn)費(fèi)率厘定中廣義線性模型的相關(guān)理論,并結(jié)合案例介紹了廣義線性模型的相關(guān)擴(kuò)展模型,進(jìn)一步豐富了車險(xiǎn)費(fèi)率厘定的相關(guān)理論[1,2]。雖然我國(guó)保險(xiǎn)精算業(yè)起步較晚,但近幾年得到了迅速的發(fā)展,保險(xiǎn)產(chǎn)品的定價(jià)也更加科學(xué)、合理。在理論方面,盧志義等(2007)、張連增等(2013)主要分析了GLM在非壽險(xiǎn)費(fèi)率厘定中的應(yīng)用[3,4],為未來(lái)的相關(guān)研究提供了方向。GLM在車險(xiǎn)費(fèi)率厘定中作為經(jīng)典模型得到廣泛應(yīng)用的同時(shí),GLM的局限性也不斷凸顯出來(lái),其中,孟生旺等(2017)指出,GLM的缺點(diǎn)是需要建立在各種分布假設(shè)上,而實(shí)際的損失數(shù)據(jù)有時(shí)可能難以滿足這些分布假設(shè),這就需要對(duì)GLM進(jìn)行推廣[5]。張連增等(2018)指出,在大數(shù)據(jù)時(shí)代背景下廣義線性模型在數(shù)據(jù)維度非常大的時(shí)候,就顯得不是特別有效了,回歸樹方法在車險(xiǎn)定價(jià)領(lǐng)域是廣義線性模型很好的輔助與參考[6]。
為了更加科學(xué)、合理地進(jìn)行車險(xiǎn)費(fèi)率厘定,許多GLM的擴(kuò)展模型應(yīng)運(yùn)而生,廣義可加模型(Generalized Additive Models,GAM)就是在這個(gè)背景下產(chǎn)生的。在GAM中,可以通過樣條函數(shù)等形式來(lái)描述連續(xù)型解釋變量的影響,在數(shù)據(jù)擬合中更具有靈活性。例如,Hastie等(1986)[7]較早地介紹了GAM,Hastie等(1990,1993)[8,9]將非參數(shù)光滑技術(shù)應(yīng)用于指數(shù)散布族(EDF)分布,保留了GLM的基本結(jié)構(gòu),并使用非參數(shù)函數(shù)代替GLM中的線性預(yù)測(cè)部分來(lái)擴(kuò)展GLM[10]。Wood等(2017)重點(diǎn)介紹了廣義可加模型在車險(xiǎn)費(fèi)率厘定中應(yīng)用的相關(guān)理論以及在R中的實(shí)現(xiàn),為GAM在車險(xiǎn)中的運(yùn)用提供了借鑒[11]。國(guó)外關(guān)于GAM在車險(xiǎn)中應(yīng)用的相關(guān)研究成果較少。一方面,現(xiàn)有研究成果主要介紹GAM的擴(kuò)展模型,如Klein等(2014)介紹GAMLSS與貝葉斯方法在車險(xiǎn)中的應(yīng)用[12],Chouldechova等(2015)引入一種被稱為GAMSEL用于擬合高維稀疏廣義可加模型的懲罰似然方法[13];另一方面,介紹GAM在其他領(lǐng)域的應(yīng)用,如Segurado等(2006)[14]。最近幾年,國(guó)內(nèi)開始將GAM應(yīng)用到車險(xiǎn)費(fèi)率厘定中,如張連增等(2012)通過構(gòu)建GLMlogistic回歸模型和GAMlogistic回歸模型對(duì)影響汽車保險(xiǎn)索賠頻率的相關(guān)因素進(jìn)行實(shí)證分析,結(jié)果表明后者比前者更具有優(yōu)勢(shì),預(yù)測(cè)效果更好[10]。孫維偉(2014)基于Tweedie類分布的數(shù)據(jù)集,用GAM對(duì)汽車保險(xiǎn)索賠額的影響因素進(jìn)行分析與擬合,通過實(shí)證分析說(shuō)明了廣義可加模型是對(duì)廣義線性模型的有效拓展應(yīng)用[15]。高光遠(yuǎn)等(2018)通過建立索賠頻率的廣義可加模型為汽車保險(xiǎn)費(fèi)率厘定提供了駕駛者行為這一新的費(fèi)率因子[16]。除此之外,國(guó)內(nèi)關(guān)于GAM的研究像國(guó)外一樣大部分集中在GAM的擴(kuò)展模型以及GAM在其他領(lǐng)域的應(yīng)用方面;在車險(xiǎn)方面的研究主要集中于車險(xiǎn)定價(jià)方面的研究[3,17],還有對(duì)交強(qiáng)險(xiǎn)成本因素進(jìn)行分析[18]以及車險(xiǎn)出險(xiǎn)概率等方面[19],而關(guān)于車險(xiǎn)索賠頻率影響因素的研究較少。
總結(jié)國(guó)內(nèi)外研究成果,我們發(fā)現(xiàn):第一,GLM作為非壽險(xiǎn)定價(jià)的經(jīng)典模型,在非壽險(xiǎn)定價(jià)中得到了充足的發(fā)展,但是在非壽險(xiǎn)定價(jià)中存在自身的局限性。第二,相對(duì)于GLM模型,GAM模型雖然在模型設(shè)定方面具有很大的靈活性,但在非壽險(xiǎn)中的相關(guān)研究成果較少,尤其是國(guó)內(nèi)。第三,不論是GLM、GAM模型還是其他沒有相關(guān)模型在非壽險(xiǎn)中的應(yīng)用大部分都是著眼于非壽險(xiǎn)的定價(jià),而索賠頻率作為車險(xiǎn)費(fèi)率厘定的重要組成部分,單獨(dú)對(duì)索賠頻率的影響因素相關(guān)研究較少。另外,中國(guó)精算研究院課題組根據(jù)全國(guó)各地風(fēng)險(xiǎn)水平的不同將國(guó)內(nèi)交強(qiáng)險(xiǎn)市場(chǎng)分為三類,即湖北省、山東省和河南省、廣東省,所以,基于此分類標(biāo)準(zhǔn)以及考慮到各省交強(qiáng)險(xiǎn)數(shù)據(jù)的可獲得性,本文以這四個(gè)省份的保單經(jīng)驗(yàn)數(shù)據(jù)為樣本,對(duì)我國(guó)不同區(qū)域交強(qiáng)險(xiǎn)索賠頻率的影響因素進(jìn)行分析研究。采用GAM不僅對(duì)四個(gè)省份交強(qiáng)險(xiǎn)的保單信息進(jìn)行參數(shù)與非參數(shù)的建模分析,而且嘗試在GAM模型中加入省份公路里程數(shù)這一變量進(jìn)行參數(shù)建模分析。估計(jì)和檢驗(yàn)各個(gè)參數(shù)與非參數(shù)系數(shù),旨在得到各指標(biāo)對(duì)交強(qiáng)險(xiǎn)索賠頻率的影響形式和影響程度,以期為相關(guān)研究和交強(qiáng)險(xiǎn)定價(jià)工作提供理論借鑒和參考。
二、方法介紹
(一)廣義可加模型(GAM)
廣義可加模型是在廣義線性模型(GLM)基礎(chǔ)上發(fā)展起來(lái)的,GLM模型事先確定被解釋變量的均值經(jīng)變換后是解釋變量的線性函數(shù)。在現(xiàn)實(shí)生活中變量之間存在著復(fù)雜的關(guān)系,因此,GLM模型在實(shí)際的應(yīng)用中存在著很大的局限性。于是,Hastie和Tibshirani(1986)提出了廣義可加模型(GAM),該模型中解釋變量和被解釋變量之間是一種不確定的非參數(shù)平滑函數(shù)形式,這樣不僅降低了廣義線性模型中的線性假定的設(shè)定誤差,而且使模型具有更大靈活性。
GAM模型保留了GLM模型的基本框架。GLM模型由隨機(jī)部分、系統(tǒng)部分和聯(lián)結(jié)函數(shù)三部分組成,其中聯(lián)結(jié)函數(shù)聯(lián)結(jié)著其他兩個(gè)部分。
三、實(shí)證分析
(一)數(shù)據(jù)來(lái)源及說(shuō)明
本文以某保險(xiǎn)公司2016年交強(qiáng)險(xiǎn)171768個(gè)保單數(shù)據(jù)為樣本,其中廣東省29803個(gè)、河南省54454個(gè)、湖北省17468個(gè)、山東省70043個(gè)。為了方便進(jìn)行比較,本文統(tǒng)一選用A6座以下的保單數(shù)據(jù)為樣本。每條樣本共包括11個(gè)變量:索賠次數(shù)(Clm.count)、索賠金額(Clm.incurred)、承保區(qū)域(Region,共分為4個(gè)地區(qū))、風(fēng)險(xiǎn)暴露(Exposure)、駕駛員年齡(Drv.age)、駕駛員性別(Drv.gender)、無(wú)賠款優(yōu)待水平(Ncd.level,共分為九類)、汽車車型(Body.code,共分為五類)、汽車年齡(Veh.age)、汽車重量(Weight)、保單類型(Nb.Rb)。另外,張連增等(2012)對(duì)全國(guó)各省交通事故和公路里程數(shù)相關(guān)關(guān)系的研究表明:公路里程數(shù)每增加1%,交通事故損失額將增加5.41%,交通事故和公路里程數(shù)具有明顯的正相關(guān)關(guān)系[20]。故本文將2016年四省的公路里程數(shù)作為一個(gè)變量,各省公路里程數(shù)據(jù)來(lái)源于《2017年中國(guó)統(tǒng)計(jì)年鑒》。
(二)變量符號(hào)及相關(guān)變量匯總
各變量符號(hào)及其含義見表1,相關(guān)變量的數(shù)據(jù)匯總見表2。由表2可知,四個(gè)省份的索賠頻率水平各不相同,其中河南省索賠頻率為0.036,低于四省的平均水平(0.047),另外三個(gè)省份的索賠頻率均高于平均水平,而且廣東省和湖北省都高出平均水平較多。
注:①1~4分別代表廣東、河南、湖北、山東四省;②A表示連續(xù)三個(gè)及以上年度未發(fā)生有責(zé)任事故,B表示連續(xù)兩年未發(fā)生有責(zé)任事故,C表示上年度未發(fā)生有責(zé)任事故,E類(D過戶、E1新保、E2新車),F(xiàn)表示上年度發(fā)生一次有責(zé)任不涉及死亡的交通事故,G表示上年度發(fā)生兩次及兩次以上有責(zé)任交通事故,H表示上年度發(fā)生有責(zé)任道路交通死亡事故。根據(jù)2016年最新交強(qiáng)險(xiǎn)費(fèi)率表及浮動(dòng)標(biāo)準(zhǔn)規(guī)定:首次投保交強(qiáng)險(xiǎn)的機(jī)動(dòng)車費(fèi)率不浮動(dòng);在保險(xiǎn)期限內(nèi),被保險(xiǎn)機(jī)動(dòng)車所有權(quán)轉(zhuǎn)移應(yīng)當(dāng)辦理交強(qiáng)險(xiǎn)合同變更手續(xù),且交強(qiáng)險(xiǎn)費(fèi)率不浮動(dòng)。所以,無(wú)賠款優(yōu)待水平(Ncd.level)中的D過戶、E1新保、E2新車三種類型的保險(xiǎn)可以合并為一類。③高速公路里程數(shù)與一級(jí)、二級(jí)公路里程數(shù)之和,單位:萬(wàn)公里。
(三)模型的建立及其參數(shù)估計(jì)結(jié)果
結(jié)合樣本中的變量屬性建立GAM模型。在該模型中,索賠次數(shù)為被解釋變量,解釋變量中的承保區(qū)域(Region)、駕駛員性別(Drv.gender)、無(wú)賠款優(yōu)待水平(Ncd.level)、汽車類型(Body.code)、保單類型(Nb.Rb)等都是分類變量,因此,在建模過程中把這幾個(gè)變量進(jìn)行參數(shù)分析。另外,公路里程數(shù)(Road.level)是連續(xù)型變量,但這個(gè)變量比較特殊,同一個(gè)省份的不同個(gè)體對(duì)應(yīng)著相同的公路里程數(shù),由于該變量取值個(gè)數(shù)較少,不適合對(duì)該變量構(gòu)造平滑函數(shù)進(jìn)行非參數(shù)分析,因此,在建模過程中直接對(duì)該變量進(jìn)行參數(shù)分析。其余三個(gè)變量:駕駛員年齡(Drv.age)、汽車車齡(Veh.age)、汽車重量(Weight)是連續(xù)型變量,它們與被解釋變量之間是否存在線性或非線性關(guān)系有待確定,為此,需要進(jìn)行非參數(shù)分析。
運(yùn)用R軟件的mgcv包中的gam函數(shù),得到該模型的參數(shù)估計(jì)結(jié)果如表3所示。通過分析表3發(fā)現(xiàn),汽車車型(Body.code)中各個(gè)水平的參數(shù)估計(jì)結(jié)果都不顯著,也就是說(shuō)汽車車型對(duì)交強(qiáng)險(xiǎn)索賠頻率沒有影響。另外,無(wú)賠款優(yōu)待分類中的H類(上年度發(fā)生有責(zé)任道路交通死亡事故)參數(shù)估計(jì)不顯著。通過查看原始數(shù)據(jù)初步認(rèn)為H類的參數(shù)估計(jì)之所以不顯著,很有可能是由于H類樣本數(shù)據(jù)較少造成的。除上述變量以外,其它變量的參數(shù)估計(jì)以及非參數(shù)估計(jì)結(jié)果都比較顯著。因此,刪除不顯著的變量汽車車型(Body.code),并把變量無(wú)賠款優(yōu)待水平(Ncd.level)中的H類(上年度發(fā)生有責(zé)任道路交通死亡事故)合并到G類(上年度發(fā)生兩次及兩次以上有責(zé)任交通事故),重新進(jìn)行GAM回歸分析。
通過分析表4可以發(fā)現(xiàn),GAM模型中除變量Nb.RbNb的P值為0.07外,其余所有的參數(shù)變量和非參數(shù)變量的估計(jì)結(jié)果都在95%的置信水平內(nèi)顯著。同時(shí)還發(fā)現(xiàn):(1)無(wú)賠款優(yōu)待水平中的各個(gè)分類水平對(duì)索賠頻率呈現(xiàn)出正向的影響作用,說(shuō)明Ncd.level等級(jí)越高,保單持有人的索賠頻率越高,即保單持有人之前有記錄的索賠次數(shù)越多,則可以預(yù)測(cè)該保單持有人未來(lái)出事故的概率越大、索賠的次數(shù)越多。(2)就省份而言,四個(gè)省份對(duì)交強(qiáng)險(xiǎn)索賠頻率的影響程度各不相同。僅就樣本參數(shù)估計(jì)的結(jié)果來(lái)看,地區(qū)對(duì)索賠頻率的影響系數(shù)按高低順序分別為:湖北省、廣東省、山東省和河南省,其中,湖北省最高。由于各個(gè)省份的社會(huì)結(jié)構(gòu)、經(jīng)濟(jì)發(fā)展、文化習(xí)慣以及自然地理狀況不同,因此,造成各地區(qū)索賠頻率的差異是不可避免的。(3)保單類型中新保(Nb)對(duì)索賠頻率的影響系數(shù)高于非新保(Rb),這種情況主要是由于新保單持有人大部分是新司機(jī),駕駛經(jīng)驗(yàn)缺乏,出事故的概率較大,索賠次數(shù)較多。相反,非新保對(duì)索賠頻率的影響較小,是因?yàn)檫@類保險(xiǎn)的保單持有人駕駛經(jīng)驗(yàn)豐富,出事故的概率較小,因此,發(fā)生索賠的次數(shù)相對(duì)較少。(4)駕駛員性別方面,通過分析四省份的樣本數(shù)據(jù)得到女性對(duì)索賠頻率的影響程度高于男性,即女性的索賠頻率高于男性。有研究表明,女性駕駛員的輕微交通事故概率明顯高于男性駕駛員,在致命交通事故中男性駕駛員的事故率明顯高于女性駕駛員。本文樣本數(shù)據(jù)中共有53個(gè)上年度發(fā)生有責(zé)任道路交通死亡事故即H類的索賠記錄,但是女性只有8個(gè),遠(yuǎn)遠(yuǎn)低于男性。(5)公路里程數(shù)對(duì)交強(qiáng)險(xiǎn)索賠頻率的影響系數(shù)為0.17573,即在其它變量保持不變的條件下,公路里程數(shù)每增加1萬(wàn)公里,相應(yīng)的索賠頻率增加19.2%(e0.1757-1),有正向影響作用。
圖1中縱軸表示平滑函數(shù)值,括號(hào)中數(shù)字表示有效自由度(edf),虛線表示置信區(qū)間上下限,實(shí)線表示索賠頻率的平滑擬合曲線,橫坐標(biāo)表示解釋變量的實(shí)測(cè)值。通過圖1發(fā)現(xiàn),三個(gè)非參數(shù)變量Veh.age、Weight、Drv.age與索賠頻率的關(guān)系表現(xiàn)為非線性關(guān)系。具體如下:(1)汽車車齡(Veh.age)對(duì)索賠頻率的影響呈現(xiàn)出先緩慢上升,再迅速下降的趨勢(shì)。即汽車車齡在0~10的范圍內(nèi),對(duì)索賠頻率的影響是緩慢上升的,在車齡為10時(shí)的索賠頻率最大。當(dāng)車齡大于10時(shí)對(duì)索賠頻率的影響是不斷下降的。(2)汽車重量(Weight)對(duì)交強(qiáng)險(xiǎn)索賠頻率的影響程度具有明顯的波動(dòng)。首先,在0~0.5的范圍內(nèi)其影響程度具有緩慢下降的趨勢(shì),在0.5~1.8的范圍內(nèi),其影響程度呈現(xiàn)出上升的趨勢(shì);當(dāng)汽車重量為1.8時(shí)索賠頻率達(dá)到最大;當(dāng)汽車重量大于1.8時(shí)的其影響程度是不斷下降的。(3)駕駛員年齡(Drv.age)對(duì)交強(qiáng)險(xiǎn)索賠頻率的影響程度在20~40的區(qū)間內(nèi)呈現(xiàn)出不斷下降的趨勢(shì),當(dāng)駕駛員年齡為20時(shí)的索賠頻率最大,在40時(shí)影響最小;在40~50的區(qū)間有了較小幅度的上升,之后逐漸趨于平穩(wěn)。
四、結(jié)論與啟示
本文利用某公司四省交強(qiáng)險(xiǎn)2016年的保單數(shù)據(jù),通過建立廣義可加模型,其相應(yīng)的參數(shù)與非參數(shù)估計(jì)結(jié)果表明:無(wú)賠款優(yōu)待水平、駕駛員性別、保單類型、承保區(qū)域以及公路里程數(shù)等對(duì)交強(qiáng)險(xiǎn)索賠頻率具有線性影響;而汽車年齡、汽車重量和駕駛員年齡等變量對(duì)我國(guó)交強(qiáng)險(xiǎn)索賠頻率具有非線性影響。在參數(shù)方面:我國(guó)交強(qiáng)險(xiǎn)的索賠頻率是有地區(qū)差異的,其中,索賠頻率最高為湖北省,其他依次為廣東省、山東省、河南省;無(wú)賠款優(yōu)待水平等級(jí)與索賠頻率成正相關(guān)的關(guān)系,即歷史索賠記錄越多,則預(yù)測(cè)個(gè)體未來(lái)出險(xiǎn)的概率越大,索賠頻率則越大;保單類型中新車對(duì)索賠頻率的影響高于非新保;女性索賠頻率高于男性,公路里程數(shù)與索賠頻率成正相關(guān)關(guān)系。非參數(shù)方面:通過對(duì)汽車車齡、汽車重量和駕駛員年齡進(jìn)行GAM非參數(shù)建模分析。結(jié)果表明三個(gè)變量均比較顯著,即三個(gè)變量對(duì)索賠頻率具有非線性的影響。汽車車齡在0~10的范圍內(nèi),對(duì)索賠頻率的影響是緩慢上升的,當(dāng)車齡大于10時(shí)對(duì)索賠頻率的影響是不斷下降的。汽車重量(Weight)在0.5~1.8的范圍內(nèi)汽車的索賠頻率較大,在其他范圍內(nèi)則相對(duì)較小。駕駛員年齡(Drv.age)對(duì)交強(qiáng)險(xiǎn)索賠頻率的影響在20~40的區(qū)間內(nèi)達(dá)到最大,即汽車駕駛員年齡較小時(shí)的出事故的概率較大,則索賠頻率較大。
本文研究結(jié)論為我國(guó)交強(qiáng)險(xiǎn)定價(jià)提供了一些新的思路:(1)目前國(guó)內(nèi)車險(xiǎn)行業(yè)通常是應(yīng)用GLM模型對(duì)索賠頻率與索賠強(qiáng)度分別建模得到純保費(fèi),而GLM默認(rèn)被解釋變量的均值經(jīng)變換后是解釋變量的線性函數(shù),現(xiàn)實(shí)應(yīng)用中特別是在大數(shù)據(jù)時(shí)代背景下變量之間存在著復(fù)雜的關(guān)系,因此,GLM模型有很大的局限性。為了實(shí)現(xiàn)更為精準(zhǔn)的定價(jià),建議財(cái)險(xiǎn)公司在進(jìn)行車險(xiǎn)費(fèi)率厘定時(shí)嘗試使用GAM等靈活性較好的模型。(2)目前,全國(guó)實(shí)行統(tǒng)一交強(qiáng)險(xiǎn)費(fèi)率,不能反映各地實(shí)際風(fēng)險(xiǎn)差異,費(fèi)率與風(fēng)險(xiǎn)不匹配,為此,建議在交強(qiáng)險(xiǎn)費(fèi)率厘定時(shí)引入“區(qū)域因子”,實(shí)行地區(qū)差異化費(fèi)率。(3)目前我國(guó)交強(qiáng)險(xiǎn)定價(jià)仍是根據(jù)被保險(xiǎn)車輛的種類和座位數(shù)實(shí)行統(tǒng)一費(fèi)率,并根據(jù)無(wú)賠款優(yōu)待水平按照相應(yīng)的比例獎(jiǎng)懲交強(qiáng)險(xiǎn)投保人。本文研究發(fā)現(xiàn),除此之外,公路里程數(shù)、保單類型、駕駛員性別、駕駛員年齡、汽車車齡、汽車重量等變量對(duì)汽車索賠頻率均有顯著影響,因此,建議財(cái)險(xiǎn)公司將這些變量納入新的費(fèi)率因子進(jìn)行交強(qiáng)險(xiǎn)定價(jià),從而一定程度上提高交強(qiáng)險(xiǎn)費(fèi)率的公平性和合理性。
參考文獻(xiàn):
[1] Jong P, Heller G. Generalized linear models for insurance data [M]. New York: Cambridge University Press, 2008.
[2] Ohlsson E, Johansson B. Nonlife insurance pricing with generalized linear models [M]. Berlin Heidelberg: Springer, 2010.
[3] 盧志義,劉樂平.廣義線性模型在非壽險(xiǎn)精算中的應(yīng)用及其研究進(jìn)展[J].統(tǒng)計(jì)與信息論壇,2007(4):26-31.
[4] 張連增,呂定海. 廣義線性模型在非壽險(xiǎn)費(fèi)率分析中的應(yīng)用[J].數(shù)理統(tǒng)計(jì)與管理,2013(5):903-909.
[5] 孟生旺,李天博,高光遠(yuǎn).基于機(jī)器學(xué)習(xí)算法的車險(xiǎn)索賠概率與累積賠款預(yù)測(cè)[J].保險(xiǎn)研究,2017(10):42-53.
[6] 張連增,謝厚誼. 回歸樹方法在車險(xiǎn)索賠頻率預(yù)測(cè)建模中的應(yīng)用[J].保險(xiǎn)研究, 2018(1):101-111.
[7] Hastie T, Tibshirani R. Generalized additive models [J]. Statistical Science, 1986, 1(3): 297-310.
[8] Hastie T, Tibshirani R. Generalized additive models [M]. Chapman and Hall, 1990.
[9] Hastie T, Tibshirani R. Varying coefficient models (with discussion) [J]. Journal of the Royal Statistical Society, 1993, 55(1): 757-796.
[10] 張連增,孫維偉,段白鴿.GLM與GAM在車險(xiǎn)索賠頻率建模中的應(yīng)用及其比較[J].天津財(cái)經(jīng)大學(xué)學(xué)報(bào),2012(12):7-56.
[11] Wood S N. Generalized additive models: an introduction with R. Second Edition [M]. Chapman & Hall /CRC, Boca Raton, Florida, 2017.
[12] Klein N, Denuit M, Lang S, et al. Nonlife ratemaking and risk management with Bayesian generalized additive models for location, scale, and shape [J]. Insurance: Mathematics and Economics, 2014, 55(1): 225-249.
[13] Chouldechova A, Hastie T. Generalized additive model selection[J]. arXiv: 1506.03850, 2015.
[14] Segurado P, Araujo M B, Kunin W E. Consequences of spatial autocorrelation for nichebased models [J]. Journal of Applied Ecology, 2006, 13: 433-444.
[15] 孫維偉.基于Tweedie類分布的廣義可加模型在車險(xiǎn)費(fèi)率厘定中的應(yīng)用[J].天津商業(yè)大學(xué)學(xué)報(bào),2014(1):60-67.
[16] 高光遠(yuǎn),孟生旺.基于車聯(lián)網(wǎng)大數(shù)據(jù)的車險(xiǎn)費(fèi)率因子分析[J].保險(xiǎn)研究,2018(1):90-100.
[17] 王新軍,王亞娟.基于廣義線性模型的車險(xiǎn)分類費(fèi)率厘定研究[J].保險(xiǎn)研究,2013(9):43-56.
[18] 孟生旺,李 皞,商 月.交強(qiáng)險(xiǎn)的成本因素分析[J].統(tǒng)計(jì)研究,2011 (6):47-52.
[19] 周縣華.我國(guó)交通事故責(zé)任強(qiáng)制保險(xiǎn)定價(jià)研究——來(lái)自北京、吉林、內(nèi)蒙古和山東的經(jīng)驗(yàn)證據(jù)[J].統(tǒng)計(jì)研究,2010(5):81-86.
[20] 張連增,段白鴿.行駛里程數(shù)對(duì)車險(xiǎn)凈保費(fèi)的影響研究——基于公路里程對(duì)交通事故損失的影響視角[J].保險(xiǎn)研究,2012(6):29-38.
(責(zé)任編輯:寧曉青)