国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

變點(diǎn)問題統(tǒng)計(jì)分析框架及應(yīng)用
——以我國(guó)財(cái)險(xiǎn)賠付支出數(shù)據(jù)為例

2018-12-17 11:13:50
統(tǒng)計(jì)與信息論壇 2018年12期
關(guān)鍵詞:變點(diǎn)賠款財(cái)險(xiǎn)

(天津財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)學(xué)院,天津 300222)

一、引言

變點(diǎn)問題(Change Point Problem)自20世紀(jì)70年代以來一直是國(guó)際統(tǒng)計(jì)研究的熱點(diǎn),始于Page于1954年在Biometrika上發(fā)表的一篇關(guān)于連續(xù)抽樣檢驗(yàn)的文章,其主要研究時(shí)間序列過程中,在某個(gè)或幾個(gè)未知時(shí)刻序列過程的統(tǒng)計(jì)特性產(chǎn)生變化,使得其不再依循于原有規(guī)律,所對(duì)應(yīng)t時(shí)刻的點(diǎn)即為變點(diǎn),通過對(duì)于變點(diǎn)的識(shí)別、估計(jì),分析估計(jì)量在t時(shí)刻前后的差異及性質(zhì),對(duì)變量進(jìn)行更合理的推斷[1]。變點(diǎn)問題在風(fēng)險(xiǎn)識(shí)別和異常點(diǎn)監(jiān)控中具有重要作用,其理論已有了一系列較為成熟的成果并有著較為廣泛的應(yīng)用,早期用于質(zhì)量控制,后來擴(kuò)展到醫(yī)學(xué)、氣象學(xué)、生物學(xué)、金融保險(xiǎn)等諸多領(lǐng)域。

經(jīng)濟(jì)金融中的數(shù)據(jù)通常呈結(jié)構(gòu)性或周期性變化,顯然不能將之等量其觀,其特定時(shí)期內(nèi)的變化差異往往是研究問題的關(guān)鍵所在。隨著金融業(yè)的蓬勃發(fā)展,變點(diǎn)問題在金融領(lǐng)域的研究受到了學(xué)者的廣泛關(guān)注。在股票證券市場(chǎng),變點(diǎn)分析側(cè)重于時(shí)間序列建模:Kokoszka和Leipus構(gòu)建了變點(diǎn)ARCH模型,Na等則建立了Copula-ARMA-GARCH模型測(cè)度了風(fēng)險(xiǎn)變點(diǎn)間的相依關(guān)系[2-3]。保險(xiǎn)市場(chǎng)中,更關(guān)注于生存分析與損失模型的構(gòu)建:Gandy等通過一組精算變點(diǎn)數(shù)據(jù)構(gòu)建了Cox風(fēng)險(xiǎn)模型[4],Jensen和Lütkebohmert則推廣了Cox變點(diǎn)模型的應(yīng)用范圍,將其應(yīng)用在不同協(xié)變量的變點(diǎn)以及單個(gè)變點(diǎn)的多個(gè)協(xié)變量中[5]。近幾年來,金融變點(diǎn)研究側(cè)重于累加和(Cumulative Sum,CUSUM)算法等傳統(tǒng)識(shí)別方法的拓展以及貝葉斯統(tǒng)計(jì)方法的綜合應(yīng)用,數(shù)據(jù)由低維數(shù)據(jù)轉(zhuǎn)向高維,關(guān)注方向也由變點(diǎn)定量識(shí)別轉(zhuǎn)向變點(diǎn)的穩(wěn)健性識(shí)別。Jirak基于高維時(shí)序數(shù)據(jù)間的弱相關(guān)性,結(jié)合CUSUM與自助法(Bootstrap)構(gòu)建了一種大樣本條件下的高維數(shù)據(jù)變點(diǎn)檢驗(yàn)法,并據(jù)此識(shí)別了近一年內(nèi)美國(guó)500家上市公司標(biāo)準(zhǔn)普爾指數(shù)(S&P500)的序列變點(diǎn)[6]。Cho和Fryzlewicz則根據(jù)CUSUM提出了一個(gè)稀疏化二值分割(Sparsified Binary Segmentation,SBS)算法用于減少高維空間中的無關(guān)噪聲影響,利用該算法識(shí)別了2007—2011年中S&P500的變點(diǎn),指出2008年美國(guó)金融危機(jī)前后該指數(shù)的結(jié)構(gòu)性變化[7]。隨后,Cho又將CUSUM應(yīng)用于面板數(shù)據(jù)中多變點(diǎn)情形下的檢測(cè),分析了2015—2016年S&P100收益率的變化情況[8]。Nascimento和Silva提出一種多變點(diǎn)情況下的貝葉斯模型,運(yùn)用MCMC算法對(duì)每個(gè)點(diǎn)的突變概率進(jìn)行穩(wěn)健估計(jì),以美國(guó)納斯達(dá)克(Nasdaq)數(shù)據(jù)為例識(shí)別了1996—2014年中的證券交易變點(diǎn)[9]。隨著金融數(shù)據(jù)結(jié)構(gòu)的日趨復(fù)雜,變點(diǎn)問題在國(guó)外的金融領(lǐng)域研究中無論是從對(duì)象上還是方法上都有了大幅擴(kuò)展,具有非常廣闊的發(fā)展空間和應(yīng)用價(jià)值。

我國(guó)于上世紀(jì)90年代展開對(duì)變點(diǎn)問題的研究,陳希孺首次從國(guó)外引入提出變點(diǎn)問題[10],此后國(guó)內(nèi)學(xué)者展開了一系列理論研究。2000年后對(duì)于變點(diǎn)問題的應(yīng)用研究增多,金融領(lǐng)域中變點(diǎn)問題在證券市場(chǎng)應(yīng)用較為廣泛。雷鳴等將生存分析與變點(diǎn)理論相結(jié)合,對(duì)我國(guó)上證指數(shù)進(jìn)行研究,分析股市的政策效應(yīng)變化[11]。譚常春等對(duì)至多一個(gè)變點(diǎn)的伽馬分布進(jìn)行了統(tǒng)計(jì)推斷并在金融序列中進(jìn)行了應(yīng)用[12]。葉五一和繆柏其利用Copula的變點(diǎn)檢測(cè)方法來檢驗(yàn)美國(guó)次級(jí)債金融危機(jī)傳染效應(yīng)的存在性,分析了收益率間的相依關(guān)系[13]。李強(qiáng)和王黎明將變點(diǎn)估計(jì)問題轉(zhuǎn)化成變量選擇問題來處理,提出了一種基于LAD-LASSO的逐段常數(shù)時(shí)間序列變點(diǎn)估計(jì)方法[14]。在保險(xiǎn)研究中,李云霞和周杏杏考慮保險(xiǎn)精算中復(fù)發(fā)事件數(shù)據(jù)的重要作用,建立了含有協(xié)變量的復(fù)發(fā)事件變點(diǎn)模型[15]。劉琮敏等根據(jù)Poisson分布單變點(diǎn)的思想,運(yùn)用鞅方法研究了具有變點(diǎn)理賠過程的風(fēng)險(xiǎn)模型,將變點(diǎn)模型應(yīng)用于破產(chǎn)概率分析[16]。張志強(qiáng)和楊帆利用變點(diǎn)檢測(cè)法識(shí)別了我國(guó)人口死亡率的突變點(diǎn),用主成分分析構(gòu)建模型提高了死亡率預(yù)測(cè)模型的精度[17]。整體上看,變點(diǎn)理論在金融領(lǐng)域的實(shí)證應(yīng)用仍較為匱乏,涉及的重要風(fēng)險(xiǎn)變點(diǎn)尚未進(jìn)行系統(tǒng)性的討論,亟待學(xué)者展開相關(guān)研究來完善各類金融指標(biāo)中重大風(fēng)險(xiǎn)點(diǎn)的識(shí)別工作,健全我國(guó)的金融風(fēng)險(xiǎn)管理體系。

本文嘗試在前人研究的基礎(chǔ)上構(gòu)建一種變點(diǎn)問題的統(tǒng)計(jì)研究分析框架,從定量和定性兩個(gè)視角確定金融問題中的關(guān)鍵風(fēng)險(xiǎn)點(diǎn),通過變點(diǎn)前后差異構(gòu)建不同的數(shù)據(jù)模型,以期揭示變點(diǎn)數(shù)據(jù)的內(nèi)在規(guī)律性特征。以我國(guó)近7年來的賠付支出數(shù)據(jù)為例闡述變點(diǎn)問題的研究過程,著手從技術(shù)層面識(shí)別我國(guó)財(cái)險(xiǎn)公司一年經(jīng)營(yíng)中賠付支出突變的關(guān)鍵月度風(fēng)險(xiǎn)點(diǎn),對(duì)理賠數(shù)據(jù)選取合適的損失分布,從而更加客觀地反映真實(shí)的給付情況,為監(jiān)管機(jī)構(gòu)與公司的風(fēng)險(xiǎn)管理者提供參考依據(jù)。

二、變點(diǎn)問題研究框架

基于已有研究,本文從變點(diǎn)識(shí)別、檢驗(yàn)、建模三個(gè)步驟建立研究框架體系。在變點(diǎn)識(shí)別中,從經(jīng)典統(tǒng)計(jì)學(xué)和貝葉斯統(tǒng)計(jì)學(xué)兩個(gè)視角識(shí)別突變點(diǎn)并衡量其穩(wěn)健性,進(jìn)而對(duì)初步監(jiān)測(cè)的變點(diǎn)進(jìn)行檢驗(yàn),分析變點(diǎn)前后的差異,通過信息準(zhǔn)則及核密度圖等參考依據(jù)構(gòu)建選擇模型,具體框架如表1所示。

表1 變點(diǎn)問題研究框架

(一)變點(diǎn)識(shí)別

比較系統(tǒng)中基本統(tǒng)計(jì)量的變化是簡(jiǎn)而有效的變點(diǎn)識(shí)別方法,若系統(tǒng)內(nèi)存在突變點(diǎn),則突變后的統(tǒng)計(jì)特征量應(yīng)與之前存在顯著差異。本文應(yīng)用Page提出的CUSUM算法對(duì)變點(diǎn)進(jìn)行識(shí)別,這也是近幾十年來識(shí)別變點(diǎn)的經(jīng)典算法[18]。CUSUM算法主要通過研究序列均值和方差的信息判斷過程是否發(fā)生了變化,其基本思想是:給定平均水平條件θ,將每個(gè)監(jiān)測(cè)量與平均水平差的累加和(Cumulative Sum)作為觀察對(duì)象,當(dāng)監(jiān)測(cè)量的CUSUM明顯比正常平穩(wěn)運(yùn)行條件下的平均水平高或者低時(shí),意味著系統(tǒng)內(nèi)發(fā)生了變化。一般通過監(jiān)測(cè)樣本的均值、方差等統(tǒng)計(jì)量作為平均水平條件,這里采用均值進(jìn)行系統(tǒng)變點(diǎn)識(shí)別,具體的CUSUM算法為:已知觀測(cè)序列x1,x2,…,xn,給定監(jiān)測(cè)均值θ,累計(jì)加總值Sr為:

(1)

逐個(gè)計(jì)算從0到n期Sr的值,定義m為檢驗(yàn)統(tǒng)計(jì)量:

(2)

m為當(dāng)期Sr與此時(shí)段內(nèi)最小Sr值之差,h為閾值,給定h后,在r時(shí)刻m≥h即檢驗(yàn)統(tǒng)計(jì)量超過閾值時(shí),r所對(duì)應(yīng)時(shí)刻的點(diǎn)即為變點(diǎn)。

基于CUSUM算法找尋突變點(diǎn),很大程度取決于監(jiān)測(cè)均值θ及閾值h的選取,且對(duì)于所確定變點(diǎn)沒有進(jìn)行概率測(cè)度以檢驗(yàn)選取值的可信程度,針對(duì)上述情況,統(tǒng)計(jì)學(xué)者引入貝葉斯統(tǒng)計(jì)方法來解決變點(diǎn)估計(jì)不穩(wěn)健的問題,將所研究的變點(diǎn)問題視為隨機(jī)變量而非單一點(diǎn)來推斷變點(diǎn)在各個(gè)時(shí)刻的發(fā)生概率。關(guān)于貝葉斯變點(diǎn)問題已有許多學(xué)者展開相應(yīng)研究,討論不同數(shù)據(jù)結(jié)構(gòu)特征下識(shí)別突變點(diǎn)的解決方法。Chernoff和Zacks提出的貝葉斯單一變點(diǎn)(At Most One Change,AMOC)識(shí)別法[19]。算法基于數(shù)據(jù)服從正態(tài)假設(shè)的特征,預(yù)先給出每一時(shí)刻發(fā)生突變的先驗(yàn)概率,根據(jù)序列的均值和方差關(guān)系,利用貝葉斯模型推斷出每一期變點(diǎn)發(fā)生的后驗(yàn)概率。該方法考慮了序列每一時(shí)期發(fā)生變化的特征且估計(jì)具有穩(wěn)健性,對(duì)單一變點(diǎn)的識(shí)別具有非常良好的效果。

Chernoff和Zacks對(duì)服從正態(tài)分布單一變點(diǎn)序列的均值進(jìn)行了貝葉斯估計(jì),指出若序列前期存在有較大變化的非突變點(diǎn),其可能掩蓋后期存在的真實(shí)變點(diǎn)使估計(jì)非有效。由此二人提出了點(diǎn)對(duì)點(diǎn)(AD-HOC)過程改進(jìn)估計(jì)量的不足,該算法不僅能識(shí)別單一變點(diǎn),對(duì)多變點(diǎn)也能進(jìn)行有效識(shí)別且同樣具有穩(wěn)健性。AD-HOC過程從最后一期數(shù)據(jù)出發(fā),倒序觀測(cè)到第一期對(duì)每個(gè)點(diǎn)進(jìn)行后驗(yàn)概率估計(jì),避免了早期過高的非突變點(diǎn)造成的誤判問題。設(shè)n期序列x1,x2,…,xn,每期發(fā)生突變的先驗(yàn)概率為p,初始p0=0,由最后的第n期開始觀測(cè),觀測(cè)序列數(shù)據(jù)個(gè)數(shù)由2到m(2≤m≤n)期逐期遞增,則從最后一期數(shù)據(jù)出發(fā)的后m期個(gè)觀測(cè)樣本在第k(0≤k≤m-1)時(shí)刻發(fā)生突變的后驗(yàn)概率為B(m,k)為:

(3)

k=0,1,…,m-1

X(m)=(Xn-m+1,…,Xn)

(4)

(5)

(6)

式(3)給出了每一時(shí)期發(fā)生突變的后驗(yàn)概率,其中式(4)為從最后一期到n-m+1時(shí)的序列,式(5)為通過先驗(yàn)概率計(jì)算得到的在第k期發(fā)生突變的概率,式(6)中的ψk(X(m))為貝葉斯后驗(yàn)估計(jì)算子,其中:

(7)

(8)

(9)

式(8)與式(9)為m期觀測(cè)樣本在k時(shí)刻突變前后序列的均值,σ2為序列整體的方差,通過式(4)~式(9)可計(jì)算得到式(3)的后驗(yàn)突變概率B(m,k)。

(二)變點(diǎn)檢驗(yàn)及建模

變點(diǎn)的識(shí)別需通過統(tǒng)計(jì)檢驗(yàn)驗(yàn)證其合理性和科學(xué)性。當(dāng)數(shù)據(jù)分布已知時(shí),可由參數(shù)檢驗(yàn)方法來進(jìn)行變點(diǎn)的檢驗(yàn),現(xiàn)實(shí)中的數(shù)據(jù)往往其分布是未知的,因此經(jīng)常采用經(jīng)典的非參數(shù)統(tǒng)計(jì)檢驗(yàn)方法對(duì)變點(diǎn)前后樣本進(jìn)行檢驗(yàn)。分為兩部分進(jìn)行:一是檢驗(yàn)變點(diǎn)時(shí)刻前后是否有顯著差異,二是檢驗(yàn)其統(tǒng)計(jì)分布是否相同。關(guān)于分析變點(diǎn)的差異性,非參數(shù)檢驗(yàn)的思想是,若變點(diǎn)在經(jīng)濟(jì)系統(tǒng)內(nèi)呈現(xiàn)相同的周期性規(guī)律,則其數(shù)值大小順序即秩統(tǒng)計(jì)量應(yīng)該相同。此外進(jìn)行建模時(shí)還需對(duì)數(shù)據(jù)的分布進(jìn)行驗(yàn)證,檢驗(yàn)變點(diǎn)前后是否服從于同一分布。通常選用Mann-Whitney-Wilcoxon檢驗(yàn)數(shù)據(jù)的結(jié)構(gòu)差異[20],選用Kolmogorov-Smirnov檢驗(yàn)數(shù)據(jù)的分布差異[21]。

存在變點(diǎn)的數(shù)據(jù)分布通常呈多峰特征,其分布具有明顯差異,混合分布模型是建模的首選,其基本形式為:

f(x)=p1f1(x)+p2f2(x)+…+pnfn(x)

(10)

f(x)為概率密度函數(shù),n為分布峰的個(gè)數(shù),通常為變點(diǎn)個(gè)數(shù)值,p為權(quán)重,p1+p2+…+pn=1,關(guān)于概率密度函數(shù)的選取,通常以信息準(zhǔn)則為依據(jù),利用赤池信息量準(zhǔn)則AIC對(duì)模型進(jìn)行選擇:

AIC=2k-2ln(L)

(11)

k為參數(shù)個(gè)數(shù),n為樣本量,ln(L)為似然函數(shù)對(duì)數(shù)值,選取較小AIC值的模型確定分布。當(dāng)樣本量較小時(shí),Hurvich和Tsai將式(11)進(jìn)行修正[22],給出了小樣本情形下的信息準(zhǔn)則值A(chǔ)ICc:

(12)

三、實(shí)證分析

(一)數(shù)據(jù)選取、處理與描述性統(tǒng)計(jì)

自改革開放以來,我國(guó)財(cái)產(chǎn)保險(xiǎn)業(yè)發(fā)展迅猛,“十一五”發(fā)展期間,整體實(shí)力與經(jīng)營(yíng)效益顯著提升,保費(fèi)規(guī)模不斷擴(kuò)大,2016年財(cái)險(xiǎn)業(yè)務(wù)原保費(fèi)收入達(dá)8 724.5億元,同比增長(zhǎng)9.1%,賠付支出4 726.18億元,增長(zhǎng)12.7%,與保費(fèi)收入增長(zhǎng)趨同,然而在賠款支出方面卻高于保費(fèi)增長(zhǎng),保費(fèi)收入與賠付支出的不匹配為財(cái)險(xiǎn)公司帶來隱憂,這需要實(shí)時(shí)把握保險(xiǎn)公司的運(yùn)營(yíng)情況,對(duì)損失賠付進(jìn)行動(dòng)態(tài)監(jiān)測(cè)以便及時(shí)分散經(jīng)營(yíng)過程中的理賠風(fēng)險(xiǎn)。保監(jiān)會(huì)發(fā)布的經(jīng)營(yíng)情況表基于《關(guān)于印發(fā)〈保險(xiǎn)合同相關(guān)會(huì)計(jì)處理規(guī)定〉的通知》(財(cái)會(huì)[2009]15號(hào))的有關(guān)內(nèi)容,根據(jù)《企業(yè)會(huì)計(jì)準(zhǔn)則(2006)》設(shè)置的統(tǒng)計(jì)指標(biāo),確認(rèn)本期(年初到當(dāng)月的累計(jì)數(shù)據(jù))保險(xiǎn)企業(yè)的原保險(xiǎn)合同保費(fèi)收入及支付的原保險(xiǎn)合同賠付款項(xiàng)。按照該準(zhǔn)則及《保險(xiǎn)合同相關(guān)會(huì)計(jì)處理規(guī)定》的相關(guān)規(guī)定,保險(xiǎn)公司在確定保費(fèi)收入與賠款支出時(shí)應(yīng)考慮通貨膨脹因素,在確定通貨膨脹率假設(shè)時(shí)與采用的折現(xiàn)率假設(shè)保持一致。按該口徑,各保險(xiǎn)公司基于一定的通脹費(fèi)用假設(shè)對(duì)原保險(xiǎn)賠付支出數(shù)據(jù)加以報(bào)送[注]在通貨膨脹時(shí)期,保險(xiǎn)公司的費(fèi)用率會(huì)因?yàn)楣べY等成本的上升而提高,不及時(shí)進(jìn)行調(diào)整和控制通貨膨脹帶來的影響將使公司的利潤(rùn)下降。因此在保險(xiǎn)產(chǎn)品定價(jià)過程中,精算師應(yīng)建立通貨膨脹與損失率、利率、費(fèi)用率之間的量化關(guān)系,間接的將通脹因素作為定價(jià)要素,提高定價(jià)及賠付支出對(duì)通貨膨脹的適應(yīng)性。。

使用本年累計(jì)數(shù)據(jù)有利于對(duì)經(jīng)營(yíng)狀況的整體把握,但無法反映月度之間的變化情況和規(guī)律,不能識(shí)別個(gè)別月度賠付存在的支出較大的異常風(fēng)險(xiǎn)點(diǎn)和揭示賠款支付之間的異質(zhì)性特征,使得潛在的經(jīng)營(yíng)風(fēng)險(xiǎn)被忽略。一年中個(gè)別月度的重大賠付導(dǎo)致月度保費(fèi)收入與賠付支出的資產(chǎn)負(fù)債不匹配,這不利于保險(xiǎn)公司的健康運(yùn)行,因此要將經(jīng)營(yíng)數(shù)據(jù)按月劃分進(jìn)行更細(xì)致的分析。根據(jù)月度賠付情況的監(jiān)測(cè)結(jié)果識(shí)別重大賠付風(fēng)險(xiǎn)點(diǎn)對(duì)分散控制理賠風(fēng)險(xiǎn)具有重要作用,可以更客觀地認(rèn)識(shí)財(cái)險(xiǎn)公司一年期的經(jīng)營(yíng)狀況,為監(jiān)管者提供更有針對(duì)性的經(jīng)驗(yàn)證據(jù),以加強(qiáng)對(duì)重點(diǎn)月份的監(jiān)督管理,給公司內(nèi)部控制和風(fēng)險(xiǎn)管理提供更詳盡的參考依據(jù),對(duì)商業(yè)車險(xiǎn)的市場(chǎng)化改革、科學(xué)厘定費(fèi)率和財(cái)險(xiǎn)責(zé)任準(zhǔn)備金的評(píng)估也具有一定的指導(dǎo)作用。

本文采用保監(jiān)會(huì)2010—2016年度每月發(fā)布的保險(xiǎn)業(yè)經(jīng)營(yíng)情況表中財(cái)產(chǎn)險(xiǎn)原保險(xiǎn)賠付支出數(shù)據(jù),每月的原數(shù)據(jù)是本年累計(jì)存量數(shù)據(jù),為更客觀反映每月的賠付情況和便于突變點(diǎn)的識(shí)別,本文整理加工拆分為逐月度的流量數(shù)據(jù),整理后月度的時(shí)間序列如圖1所示。

圖1 2010—2016年我國(guó)財(cái)險(xiǎn)賠付支出金額圖(億元)

隨著我國(guó)財(cái)險(xiǎn)業(yè)務(wù)規(guī)模的擴(kuò)大,賠付支出近7年來也在有條不紊的增加,年累計(jì)值也由2010年的1 756.03億元提高到2016年4 726.18億元,增長(zhǎng)達(dá)270%,月度賠付也由100多億增至400余億元,個(gè)別月份已高達(dá)500余億元。從圖1直觀來看,財(cái)險(xiǎn)賠付呈有規(guī)律的周期波動(dòng)增長(zhǎng),每年一至三季度平穩(wěn)變化,四季度初呈顯著突變急劇增長(zhǎng),大體有“年初降”“年末漲”的給付現(xiàn)象:在每年度2月份給付金額下降,10月后明顯有大幅上升,出現(xiàn)“翹尾巴”的折點(diǎn),其余各月變化較為穩(wěn)定。對(duì)于財(cái)險(xiǎn)公司需對(duì)賠付金額增加的關(guān)鍵風(fēng)險(xiǎn)點(diǎn)加以重視。圖1的變化規(guī)律引發(fā)了對(duì)賠付支出變化的關(guān)注,即11月是否為賠付突變?cè)鲩L(zhǎng)點(diǎn),1~10月的賠款支出是否與11~12月存在顯著差異,其變化的趨勢(shì)是偶然還是階段的周期性規(guī)律,假設(shè)突變點(diǎn)存在,構(gòu)建何種損失模型更能恰當(dāng)?shù)財(cái)M合賠付數(shù)據(jù)。首先需要對(duì)假設(shè)的變點(diǎn)進(jìn)行初步的識(shí)別,根據(jù)圖1中的數(shù)據(jù)初步看出近7年來賠付的月度序列呈現(xiàn)相同的變化規(guī)律,僅從賠付金額上看,逐年上升平穩(wěn)上移。因篇幅所限,以最近2016年月度數(shù)據(jù)為例進(jìn)行分析說明。

2016年度我國(guó)財(cái)險(xiǎn)公司原保險(xiǎn)賠款給付金額共計(jì)4 726.18億元,創(chuàng)歷史最高水平,將當(dāng)期數(shù)據(jù)按月度進(jìn)行拆分,2016年12個(gè)月我國(guó)財(cái)險(xiǎn)賠款給付描述性統(tǒng)計(jì)如表2所示。

表2 2016年度財(cái)險(xiǎn)月度賠付支出描述性統(tǒng)計(jì)表 單位:億元

由表2看出,2016年1~10月與11~12月我國(guó)財(cái)險(xiǎn)賠款給付均值與標(biāo)準(zhǔn)差存在明顯不同,1~10月?lián)p失均值與11~12月均值相差161.02億元,方差波動(dòng)較大,全年極差相差達(dá)309.38億元,初步推斷11月前后賠付具有差別。

(二)賠付支出的變點(diǎn)識(shí)別

運(yùn)用CUSUM算法對(duì)賠付支出進(jìn)行定量識(shí)別,該算法的一個(gè)重要問題是監(jiān)測(cè)均值θ的選取,θ必須恰當(dāng)反映觀測(cè)對(duì)象平均水平,過低或過高都會(huì)使得算法估計(jì)失效,為了保證算法估計(jì)的準(zhǔn)確性,選取2016年全年、1~10月(排除四季度上升的時(shí)間段)、4~10月(排除一季度下降與四季度上升的時(shí)間段)的三組平均值作為監(jiān)測(cè)均值,分析其變化的敏感性,其數(shù)值分別為393.85、367.01、370.60億元,由3組均值可以看出,全年平均水平較之后兩組有顯著不同,一季度下降對(duì)整體影響不大,四季度變化對(duì)整體有很大影響。以h=80作為閾值,計(jì)算后得到3組m值的序列,用折線圖直觀表示如圖2所示。

圖2 不同監(jiān)測(cè)均值下CUSUM檢驗(yàn)統(tǒng)計(jì)量序列圖

由圖2可以看出,不同均值監(jiān)測(cè)下的檢驗(yàn)統(tǒng)計(jì)量值均在11月份呈現(xiàn)明顯的突變趨勢(shì),斜率驟然增加。1~10月份變化大體一致,在三季度后m值出現(xiàn)分層,以1~10月、4~10月均值度量下的m值在11月超過閾值h,兩者監(jiān)測(cè)均值僅相差3.584,但在7月后m值卻產(chǎn)生顯著不同。以全年均值度量的m折線圖變化趨勢(shì)在1~10月較為平緩,m值較小有8個(gè)月為0,11月并未超過h,但與前三季度相比差異明顯,平緩原因是由于監(jiān)測(cè)均值選取過大致使Sr過小影響了m的計(jì)算,但不影響從序列圖中判別其變化趨勢(shì)。從3組檢驗(yàn)統(tǒng)計(jì)量序列折線圖的比較來看,剔除一、四季度賠付波動(dòng)較大變化月度的監(jiān)測(cè)均值來計(jì)算檢驗(yàn)統(tǒng)計(jì)量較為適宜,能很好反映年度的平均水平,更有利于變點(diǎn)的識(shí)別。此外,不同h值的選取也會(huì)影響結(jié)果的判斷,當(dāng)h過小時(shí)很可能造成對(duì)變點(diǎn)的誤判,在圖2中若h小于80,按CUSUM判別方法在1~10月、4~10月可能出現(xiàn)多個(gè)突變點(diǎn),僅從數(shù)字而不從圖形來推斷,很可能造成對(duì)變點(diǎn)的錯(cuò)誤推斷,這需要對(duì)變點(diǎn)算法進(jìn)行改進(jìn)使之更加穩(wěn)健。

利用貝葉斯AD-HOC算法檢測(cè)變點(diǎn)識(shí)別的穩(wěn)健性,為簡(jiǎn)化計(jì)算過程,不致使得式(7)方差過大,對(duì)賠付數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,將其方差調(diào)整為1,假設(shè)每期發(fā)生突變的先驗(yàn)概率p為0.5,后驗(yàn)概率B(m,k)如表3所示。

表3表示了從12月出發(fā),選取m個(gè)賠付數(shù)據(jù)在12-k月發(fā)生突變的后驗(yàn)概率,每一行加總后的后驗(yàn)概率之和為1。B(m,0)表示沒有突變發(fā)生,B(4,3)表示選取后四月賠付數(shù)據(jù)作為觀測(cè)對(duì)象,在第9月中發(fā)生突變的概率為0.14。由此得到了一年12個(gè)月所有賠付數(shù)據(jù)的B(m,k)。由表3看出,k=1、2時(shí)刻即10~11月之間選取任意m個(gè)觀測(cè)樣本的突變概率顯著高于其他月份,在20%~52%之間,其中最小值20%已遠(yuǎn)遠(yuǎn)大于其它時(shí)刻的最大值,由此可以推斷序列突變時(shí)刻在此之間。為了檢測(cè)先驗(yàn)概率p的選擇對(duì)后驗(yàn)概率結(jié)果的影響,對(duì)過程進(jìn)行敏感性分析,考慮系統(tǒng)內(nèi)突變發(fā)生較小的概率假設(shè),設(shè)先驗(yàn)概率p=0.05,其后驗(yàn)概率B(m,k)如表4所示。

表3 突變點(diǎn)后驗(yàn)概率表(p=0.5)

表4 突變點(diǎn)后驗(yàn)概率表(p=0.05)

由表4可以看出,除k=0突變未發(fā)生外,p=0.05時(shí)k=1、2,突變點(diǎn)后驗(yàn)概率表(p=0.05)時(shí)刻后驗(yàn)概率較之其他時(shí)間依然最高,在5%~16%之間,與p=0.5得到的變化結(jié)果一致,通過表3與表4的對(duì)比可以看出B(m,k)對(duì)p取值不敏感,AD-HOC算法識(shí)別的變點(diǎn)結(jié)果與先驗(yàn)概率的選取無關(guān),結(jié)合貝葉斯模型使得估計(jì)量具有很強(qiáng)的穩(wěn)健性,對(duì)于序列后期的單一突變以及多變點(diǎn)情況下的識(shí)別問題有著非常好的估計(jì)效果,較之CUSUM算法更加有效,是后者的改進(jìn)和進(jìn)一步補(bǔ)充。通過數(shù)據(jù)的描述性統(tǒng)計(jì),結(jié)合兩種算法的結(jié)果,進(jìn)一步推斷11月份為賠款給付的突變點(diǎn)。

(三)賠付支出變點(diǎn)的非參數(shù)檢驗(yàn)

識(shí)別變點(diǎn)后,分別對(duì)2010—2016年7年的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)檢驗(yàn),每年中1—10月份賠付數(shù)據(jù)分為一組,11—12月兩個(gè)數(shù)據(jù)分為一組,選用Wilcoxon-Mann-Whitney非成對(duì)樣本組的秩次和檢驗(yàn)來檢驗(yàn)兩組間是否有顯著差異,檢驗(yàn)非成對(duì)樣本容量為n1的觀察值X1,X2,…,Xn1和樣本容量為n2觀察值Y1,Y2,…,Yn2的中位數(shù)是否相等,若相等則無差異,設(shè)原假設(shè)H0∶M1~10=M11~12(10月前后賠付無差異),備擇假設(shè)H1∶M1~10

假設(shè)X1,X2,…,Xn1來自分布為F(x)總體的樣本,Y1,Y2,…,Yn2來自分布為G(x)總體的樣本,F(xiàn)(x)、G(x)均未知且均為連續(xù)分布函數(shù),檢驗(yàn)兩者分布是否相同,即原假設(shè)為H0:F(x1,x2,…,x10)=G(x11,x12),備擇假設(shè)為H1:F(x1,x2,…,x10)≠G(x11,x12),采用Kolmogorov-Smirnov(K-S)雙樣本檢驗(yàn)來觀察兩組觀測(cè)值,K-S檢驗(yàn)基于累計(jì)分布函數(shù),用以檢驗(yàn)一個(gè)經(jīng)驗(yàn)分布是否符合某種理論分布,或比較兩個(gè)經(jīng)驗(yàn)分布是否有顯著差異。相比于其它檢驗(yàn),K-S檢驗(yàn)適用范圍不僅能用于正態(tài)分布,還能應(yīng)用于分布有偏的損失賠付數(shù)據(jù),用R軟件中的ks.test函數(shù)對(duì)各年的兩組數(shù)據(jù)進(jìn)行K-S檢驗(yàn),p值均為0.030 3,對(duì)7年整體的兩組數(shù)據(jù)檢驗(yàn)p值為0.005 57,在5%的顯著性水平下接受備擇假設(shè),即10月前后賠付數(shù)據(jù)的損失分布不同。通過W-M-W與K-S檢驗(yàn),確定識(shí)別的每年11月份為賠款給付突變點(diǎn),各年度月度損失大小不同,但趨勢(shì)及變化規(guī)律相同,損失分布在變點(diǎn)前后發(fā)生改變。

(四)賠付支出的變點(diǎn)模型

檢驗(yàn)確定變點(diǎn)后,需選擇合適的損失模型擬合賠付數(shù)據(jù),給出其統(tǒng)計(jì)分布。變點(diǎn)前后數(shù)據(jù)的差異決定了需要通過不同的模型加以研究,由于保險(xiǎn)公司風(fēng)險(xiǎn)特點(diǎn),賠付的損失分布往往不同于傳統(tǒng)大樣本情況下服從大數(shù)定律和中心極限定理的正態(tài)分布“鐘型”曲線,而是呈現(xiàn)“尖峰厚尾”特征,故選取正態(tài)分布、指數(shù)分布、對(duì)數(shù)正態(tài)分布、伽馬分布及帕累托分布等典型損失模型,對(duì)2010—2016年7年的變點(diǎn)前后的賠付數(shù)據(jù)分別進(jìn)行擬合,利用極大似然法(MLE)估計(jì)模型中的參數(shù),R軟件nloptr程序包中的nloptr函數(shù)可進(jìn)行非線性模型參數(shù)的極大似然估計(jì)求解,由變點(diǎn)檢驗(yàn)可知1—10月與11—12月服從不同分布,假設(shè)1—10月服從分布F(x,θ),11—12月服從另一分布G(x',λ),則整體的極大似然函數(shù)為:

L(θ,λ)=L(xi1,xi2…xi12,θ,λ)

(13)

五種損失模型的結(jié)果如表5所示。

表5 賠款給付分布及參數(shù)的極大似然估計(jì)

表5給出了變點(diǎn)前后兩個(gè)局部與整體三者模型參數(shù)的似然估計(jì)。1~12月份表示了假設(shè)無變點(diǎn)情況下,賠款給付服從同一損失分布F(x)=G(x')的值,利用赤池信息量準(zhǔn)則AIC對(duì)模型進(jìn)行選擇,本文中損失樣本數(shù)據(jù)僅為84個(gè),因此選用小樣本情形下的信息準(zhǔn)則值A(chǔ)ICc選擇損失分布。

除指數(shù)分布外,本文擬合的損失分布模型參數(shù)個(gè)數(shù)均為2,樣本量也相同,因此影響AICc大小的決定因素為模型的似然函數(shù)值L,它反映了數(shù)據(jù)信息量的使用程度,AICc的數(shù)值結(jié)果如表6所示。

表6 5種損失模型的AICc

由表6中的AICc值可以看出,除帕累托分布外,變點(diǎn)假設(shè)下1~10月、11~12月分段擬合的同一模型不同參數(shù)下?lián)p失分布的AICc之和(3)小于無變點(diǎn)假設(shè)(4)下模型的AICc,分段模型優(yōu)于整體服從單一參數(shù)的模型,再次證明了突變點(diǎn)的存在性及變點(diǎn)前后采用不同損失分布“分而治之”擬合賠付數(shù)據(jù)的合理性。根據(jù)最小信息原則,AICc最小值組合min(1)+min(2)即為最佳的損失模型。在1~10月,應(yīng)選擇AICc數(shù)值最小的正態(tài)分布模型;而在11~12月中,正態(tài)分布、對(duì)數(shù)正態(tài)分布、伽馬分布的AICc數(shù)值近似,因此三類損失分布均可作為變點(diǎn)時(shí)期的數(shù)據(jù)建模??紤]模型構(gòu)建的連續(xù)性與簡(jiǎn)約性,最終選擇變點(diǎn)前后均為正態(tài)分布的損失模型。

圖3給出了用R軟件繪出的給付分布核密度概率圖,從7年賠付數(shù)據(jù)整體來看,可見賠款給付分布呈雙峰特征,使用單個(gè)連續(xù)模型擬合的結(jié)果往往不盡人意,在這里混合分布(Mixed Distribution)有效地解決了數(shù)據(jù)多峰問題,在常用的模型之間可以起到“取長(zhǎng)補(bǔ)短”的作用[23]。

圖3 整體賠款給付直方圖及核密度曲線圖

根據(jù)表6中AICc(3)的結(jié)果,選擇前后均為正態(tài)分布的混合模型,圖3核密度曲線呈雙峰特性,選取n=2,構(gòu)建的混合模型即為二元混合高斯模型:

p1+p2=1

(14)

在混合模型的各種參數(shù)估計(jì)法中,常用矩方法和極大似然估計(jì)法,極大似然估計(jì)法在計(jì)算上復(fù)雜但在參數(shù)估計(jì)中具有一致性和有效性,這里采用混合高斯分布中極大似然估計(jì)的EM算法來確定模型中的待估參數(shù),R軟件中mixdist程序包專門用來進(jìn)行混合模型的擬合和參數(shù)估計(jì),對(duì)數(shù)據(jù)按區(qū)間進(jìn)行劃分,使用mix函數(shù),運(yùn)用EM算法計(jì)算參數(shù)的估計(jì)值為p1=0.147,p2=0.853,μ1=152.13,μ2=293.56,σ1=37.523,σ2=88.316。p1、p2的估計(jì)值較為接近變點(diǎn)前后期間的月度權(quán)重2/12與10/12,估計(jì)出混合模型的概率密度分布與核密度曲線對(duì)比及概率分布函數(shù)如圖4、圖5所示,混合模型的擬合效果非常良好,較好地解釋了賠款給付的差異性特征,揭示了整體賠付數(shù)據(jù)的分布規(guī)律及變點(diǎn)前后損失分布的異質(zhì)性。

圖4 混合高斯模型概率密度圖

圖5 混合高斯模型概率分布圖

一年之中10月后財(cái)險(xiǎn)公司賠款給付額的增加,從投保人來看,年末是交通事故的高發(fā)期,冬季車輛安全性能降低,私家車使用頻率在歲末顯著上升,除了對(duì)道路造成擁擠外,事故發(fā)生的概率也會(huì)提高,導(dǎo)致了賠案的集中賠付。從保險(xiǎn)公司角度來看,年末賠付的增加一方面帶來了經(jīng)營(yíng)壓力,不利于企業(yè)的正常運(yùn)行,同時(shí)從內(nèi)部角度分析,賠付的增加可能是財(cái)險(xiǎn)公司人為調(diào)控的結(jié)果,通過對(duì)賠案賠款給付時(shí)間的操作可以控制一年內(nèi)的經(jīng)營(yíng)情況,使得一年中的大部分月度呈現(xiàn)出良好的運(yùn)營(yíng)狀態(tài),較低的經(jīng)營(yíng)賠付率有利于改善渠道部門的考核指標(biāo)。公司決策者應(yīng)制定合理的內(nèi)控制度來優(yōu)化賠付系統(tǒng),確保及時(shí)對(duì)保險(xiǎn)人的賠案進(jìn)行處理。從外部角度分析,將已報(bào)案已決賠款集中到年末給付可以增加保險(xiǎn)公司支出的費(fèi)用和營(yíng)業(yè)成本,降低利潤(rùn),起到合理避稅的作用。監(jiān)管機(jī)構(gòu)對(duì)此類現(xiàn)象應(yīng)進(jìn)行嚴(yán)格監(jiān)控,確保財(cái)險(xiǎn)市場(chǎng)良好的競(jìng)爭(zhēng)環(huán)境。財(cái)險(xiǎn)公司管理者在年末應(yīng)制定合理措施分散風(fēng)險(xiǎn),加強(qiáng)核賠程序,客觀真實(shí)地反映經(jīng)營(yíng)狀況,精算人員應(yīng)適當(dāng)增加未決賠款準(zhǔn)備金份額以確保集中賠付,對(duì)賠付率進(jìn)行更合理科學(xué)化的計(jì)算。

四、結(jié)論

本文構(gòu)建了一種變點(diǎn)統(tǒng)計(jì)的研究框架,運(yùn)用經(jīng)典統(tǒng)計(jì)學(xué)的研究方法,從變點(diǎn)識(shí)別、檢驗(yàn)、估計(jì)三方面展開討論,通過對(duì)近7年來我國(guó)財(cái)險(xiǎn)賠付月度數(shù)據(jù)的擬合,得到如下發(fā)現(xiàn):一年中的11月為賠款給付的突變點(diǎn);突變前后服從不同參數(shù)的正態(tài)分布,整體賠款給付為雙峰特征的混合高斯分布;由于結(jié)構(gòu)性突變點(diǎn)的存在,數(shù)據(jù)分布通常呈現(xiàn)多峰特征,由單分布變?yōu)榛旌戏植?,通過信息準(zhǔn)則可以對(duì)混合分布模型進(jìn)行選擇,所有數(shù)值結(jié)論都可以使用R軟件相應(yīng)的程序包計(jì)算得到。本文所用變點(diǎn)分析方法也可應(yīng)用于其它問題,由單一變點(diǎn)拓展到多變點(diǎn),由低維數(shù)據(jù)延伸到高維數(shù)據(jù),檢驗(yàn)其它關(guān)鍵性的金融風(fēng)險(xiǎn)指標(biāo),在數(shù)據(jù)分布的選擇上,可以根據(jù)數(shù)據(jù)自身結(jié)構(gòu)推廣到更一般的模型。

猜你喜歡
變點(diǎn)賠款財(cái)險(xiǎn)
四川推出農(nóng)業(yè)保險(xiǎn)賠款支付“一卡通”機(jī)制
回歸模型參數(shù)的變點(diǎn)檢測(cè)方法研究
銀保監(jiān)通報(bào):平安人壽投訴4072件增長(zhǎng)28%,居壽險(xiǎn)公司首位!
田地被淹蔬菜減產(chǎn) 排水不當(dāng)賠款六千
正態(tài)分布序列均值變點(diǎn)檢測(cè)的貝葉斯方法
基于二元分割的多變點(diǎn)估計(jì)
獨(dú)立二項(xiàng)分布序列變點(diǎn)的識(shí)別方法
人保財(cái)險(xiǎn):助力“平安河南”建設(shè)
互聯(lián)網(wǎng)財(cái)險(xiǎn)投保者
基于GPSJ1過程下的未決賠款準(zhǔn)備金
江源县| 三亚市| 米泉市| 夏河县| 龙陵县| 鄱阳县| 洛浦县| 三亚市| 武安市| 固始县| 富民县| 广灵县| 郑州市| 兰考县| 怀集县| 江北区| 广平县| 友谊县| 玉环县| 上饶市| 许昌县| 华安县| 诏安县| 江源县| 临猗县| 渭南市| 阳西县| 宁津县| 荥阳市| 依安县| 咸阳市| 河南省| 彰化县| 西畴县| 哈尔滨市| 宕昌县| 泰州市| 尤溪县| 丹阳市| 葫芦岛市| 兰溪市|