国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

機(jī)器學(xué)習(xí)技術(shù)在保單失復(fù)效管理工作中的應(yīng)用

2020-05-18 12:02林鵬程唐輝鞠芳
現(xiàn)代信息科技 2020年20期
關(guān)鍵詞:隨機(jī)森林

林鵬程 唐輝 鞠芳

摘? 要:為了保障保險(xiǎn)公司長(zhǎng)期穩(wěn)健發(fā)展,保單管理工作須采取現(xiàn)代科技手段加以完善。文章通過(guò)對(duì)保險(xiǎn)公司歷史上大量不同時(shí)期失效保單特征進(jìn)行分析,研究構(gòu)建了基于Stacking多模型融合技術(shù)保單失復(fù)效模型。該模型能預(yù)測(cè)失效保單客戶(hù)在短期內(nèi)復(fù)效概率,并制定相關(guān)復(fù)效督導(dǎo)管理策略和差異化服務(wù)策略。通過(guò)基于帕累托法則的實(shí)證分析,采用Stacking多模型融合技術(shù)構(gòu)建的失復(fù)效模型較其他集成算法構(gòu)建優(yōu)勢(shì)明顯,特別是將模型融入PDCA管理實(shí)踐中,能夠?yàn)楸尉?xì)化管理提供有效的數(shù)據(jù)支撐,具備良好業(yè)務(wù)價(jià)值。

關(guān)鍵詞:Stacking;隨機(jī)森林;XGBoost;LightGBM;保單復(fù)效;帕累托法則;PDCA

中圖分類(lèi)號(hào):TP181? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2020)20-0088-06

Application of Machine Learning Technology in the Management

of Lapse and Reinstatement of Policy

LIN Pengcheng,TANG Hui,JU Fang

(Research and Development Center of China Life Insurance (Group) Company,Beijing? 100033,China)

Abstract:In order to ensure the long-term and stable development of insurance companies,the management of policies must be improved by modern technology. The article analyzes the characteristics of a large number of lapsed policies in different periods in the history of insurance companies,and researches and builds a policy lapse and reinstatement model based on Stacking multi-model fusion technology. The model can predict the recovery probability of lapsed policy customers in the short term,and formulate related recovery supervision and management strategy and differentiated service strategy. Through empirical analysis based on the Pareto principle,the lapse and reinstatement model constructed by using Stacking multi-model fusion technology has obvious advantages over other integrated algorithm construction. In particular,the model is integrated into PDCA management practice,which can provide effective data support for the refined management of insurance policies and has good business value.

Keywords:Stacking;random forest;XGBoost;LightGBM;policy reinstatement;Pareto principle;PDCA

0? 引? 言

失效保單是指投保人與保險(xiǎn)公司的保險(xiǎn)合同以約定分期支付保險(xiǎn)費(fèi);在投保支付首期保險(xiǎn)費(fèi)后(除合同另有規(guī)定外),投保人超過(guò)規(guī)定的期限六十日未支付當(dāng)期保險(xiǎn)費(fèi),從而進(jìn)入合同效力中止?fàn)顟B(tài)。失效保單在保險(xiǎn)合同效力中止期間發(fā)生的保險(xiǎn)事故,保險(xiǎn)公司不承擔(dān)保險(xiǎn)責(zé)任[1]。因此,如果保險(xiǎn)公司(特別是壽險(xiǎn)公司)中存在大量失效保單,潛在構(gòu)成損害保險(xiǎn)消費(fèi)者利益的風(fēng)險(xiǎn),極易引發(fā)投訴糾紛,影響公司及行業(yè)形象,同時(shí)可能滋生營(yíng)銷(xiāo)員個(gè)人違法犯罪行為[2]。

銀保監(jiān)會(huì)早在2015年明確做了關(guān)于《中國(guó)保監(jiān)會(huì)關(guān)于人身保險(xiǎn)失效保單專(zhuān)項(xiàng)清理工作情況的通報(bào)》,要求各大保險(xiǎn)公司應(yīng)建立失效保單定期清理工作機(jī)制,對(duì)人身保險(xiǎn)失效保單進(jìn)行實(shí)時(shí)監(jiān)控和管理各保險(xiǎn)公司采取失效保單管理的措施。在具體執(zhí)行層面,往往采取兩大方式:首先,防范失效保單產(chǎn)生,主要是通過(guò)加強(qiáng)保單續(xù)期率的管理,并且通過(guò)公司基本法來(lái)考核個(gè)人續(xù)收服務(wù)情況;其次,重點(diǎn)要嚴(yán)格控制失效保單數(shù)量管理,主要是定期對(duì)失效保單進(jìn)行清查,進(jìn)行復(fù)效督導(dǎo)管理(復(fù)效即指依照前條規(guī)定合同效力中止的,經(jīng)保險(xiǎn)人與投保人協(xié)商并達(dá)成協(xié)議,在投保人補(bǔ)交保險(xiǎn)費(fèi)后,合同效力恢復(fù)[3])。

然而,開(kāi)展持續(xù)的失效保單復(fù)效督導(dǎo)管理工作難度較大,這里有三方面的原因:第一,有的壽險(xiǎn)公司特別是在成立之初,由于急于擴(kuò)大業(yè)務(wù)規(guī)模,容易形成了重售前、輕售后的管理氛圍;第二,由于長(zhǎng)期壽險(xiǎn)保單,營(yíng)銷(xiāo)員一般只拿到客戶(hù)投保前幾期傭金,后期傭金過(guò)低或無(wú)傭金,造成營(yíng)銷(xiāo)員無(wú)動(dòng)力去管理失效保單;第三,失效保單客戶(hù)是否因遺忘或者資金周轉(zhuǎn)不靈等非主動(dòng)因素導(dǎo)致失效,復(fù)效需要營(yíng)銷(xiāo)員與客戶(hù)逐一拜訪聯(lián)系,這對(duì)于從業(yè)多年的老業(yè)務(wù)員來(lái)說(shuō),由于客戶(hù)數(shù)量較多,容易產(chǎn)生因新單壓力怠慢老客戶(hù)的情況。

綜上所述,復(fù)效督導(dǎo)管理問(wèn)題核心是平衡投入和產(chǎn)出效益的關(guān)系,即在不影響團(tuán)隊(duì)新單展業(yè)的同時(shí),如何劃分合理有限的團(tuán)隊(duì)資源,實(shí)現(xiàn)復(fù)效管控利益最大化。從管理學(xué)角度來(lái)看,存在對(duì)帕累托法則[4]的迫切需求:團(tuán)隊(duì)只需花20%的精力就能實(shí)現(xiàn)80%的復(fù)效管理目標(biāo)。

因此,基于上述潛在需求,中國(guó)人壽保險(xiǎn)股份有限公司研發(fā)中心AI小組在技術(shù)上希望根據(jù)歷史經(jīng)驗(yàn)結(jié)合大數(shù)據(jù)分析,及時(shí)尋找最佳的復(fù)效意愿客戶(hù)群體;建立一套相關(guān)保單失復(fù)效預(yù)測(cè)模型,對(duì)客戶(hù)復(fù)效意愿能夠精準(zhǔn)預(yù)測(cè),在滿(mǎn)足帕累托管理法則基礎(chǔ)上,同時(shí)實(shí)現(xiàn)對(duì)失效保單客戶(hù)的差異化服務(wù)管理。

保單復(fù)效業(yè)務(wù)屬于個(gè)人協(xié)議支付場(chǎng)景;在金融領(lǐng)域智能化模型中應(yīng)用,該類(lèi)場(chǎng)景主要集中在銀行信用卡還款、信貸催收等領(lǐng)域。例如:文獻(xiàn)[5]通過(guò)SPSS軟件對(duì)某銀行原始用戶(hù)數(shù)據(jù)進(jìn)行處理,通過(guò)PCA對(duì)數(shù)據(jù)集中變量進(jìn)行篩選,將用戶(hù)分為違約和非違約兩類(lèi),并通過(guò)實(shí)例說(shuō)明邏輯回歸方法在信用卡風(fēng)險(xiǎn)評(píng)估模型構(gòu)建中的應(yīng)用,并驗(yàn)證其可行性和有效性。文獻(xiàn)[6]針對(duì)單一BP神經(jīng)網(wǎng)絡(luò)算法的不足,利用遺傳算法對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,并通過(guò)信用卡消費(fèi)行為數(shù)據(jù)集驗(yàn)證,可以有效提高信用卡消費(fèi)行為風(fēng)險(xiǎn)評(píng)估中的檢測(cè)率和準(zhǔn)確率。文獻(xiàn)[7]利用貝葉斯網(wǎng)絡(luò)模型,采用交叉驗(yàn)證法,對(duì)美國(guó)最大的P2P公司進(jìn)行借款人信用體系預(yù)測(cè)。

在保險(xiǎn)領(lǐng)域中,研究個(gè)人協(xié)議支付預(yù)測(cè)行為,特別是復(fù)效預(yù)測(cè)研究的相關(guān)文獻(xiàn)較少,目前主要有保單續(xù)期繳費(fèi)預(yù)測(cè)研究,比如文獻(xiàn)[8]利用Logistic回歸算法、KMO因子分析構(gòu)建保單續(xù)期預(yù)測(cè)模型,驗(yàn)證模型的可行性。文獻(xiàn)[9-11]分別從壽險(xiǎn)公司基層管理視角,分析失效保單的成因、防范策略和應(yīng)對(duì)建議。

上述方法在一定程度上為保單失復(fù)效預(yù)測(cè)模型提供了技術(shù)參考,但是考慮到大型保險(xiǎn)公司的客戶(hù)數(shù)據(jù)存儲(chǔ)主要是以結(jié)構(gòu)化為主,客戶(hù)特征還存在稀疏性強(qiáng)的特點(diǎn),往往更適合采用樹(shù)形算法進(jìn)行分類(lèi)預(yù)測(cè)[12],為了提升單個(gè)決策樹(shù)算法的穩(wěn)定性,往往采用諸如Bagging、Boosting和Stacking等集成學(xué)習(xí)進(jìn)行模型構(gòu)建。

本文分別利用目前主流的RandomForest、XGBoost、LightGBM以及Stacking融合集成學(xué)習(xí)算法進(jìn)行失效保單復(fù)效預(yù)測(cè)模型研究,進(jìn)一步探討模型在滿(mǎn)足保單失復(fù)效帕累托管理法則的可行性,經(jīng)對(duì)比分析,選擇了Stacking多融合算法進(jìn)行本文的機(jī)器學(xué)習(xí)算法;由于失效保單復(fù)效督導(dǎo)工作具有持續(xù)性要求,將保單失復(fù)效模型納入PDCA管理模式[13],效果顯著,可供后續(xù)類(lèi)似場(chǎng)景參考使用。

1? 相關(guān)集成學(xué)習(xí)技術(shù)簡(jiǎn)介

當(dāng)前運(yùn)用人工智能機(jī)器學(xué)習(xí)技術(shù)解決實(shí)際問(wèn)題,大多數(shù)采取集成技術(shù)。機(jī)器學(xué)習(xí)中的集成技術(shù),是指將多個(gè)單一功能的分類(lèi)器,采取一定的策略進(jìn)行組裝結(jié)合,用以增強(qiáng)整體預(yù)測(cè)性能。單一功能的分類(lèi)器也稱(chēng)基礎(chǔ)分類(lèi)器,例如決策樹(shù)、邏輯回歸等這種算法。通常來(lái)說(shuō),集成方式又分同質(zhì)集成和異質(zhì)集成。同種類(lèi)型基礎(chǔ)分類(lèi)器組合在一起的叫同質(zhì)集成,目前比較典型的有Bagging和Boosting這兩種方式;不同類(lèi)型基礎(chǔ)分類(lèi)器組合在一起的叫異質(zhì)集成,目前比較典型的方式有Stacking方法[14]。

1.1? Bagging方式

如圖1所示,主要是將同一集合的訓(xùn)練樣本通過(guò)T次隨機(jī)采樣的方式形成T組大小與初始樣本相同的采樣集,分別對(duì)應(yīng)T個(gè)弱學(xué)習(xí)器進(jìn)行訓(xùn)練,采取一定的結(jié)合策略(分類(lèi)場(chǎng)景使用投票策略,回歸場(chǎng)景使用均值策略),最后形成一個(gè)強(qiáng)學(xué)習(xí)器。

如果學(xué)習(xí)器采用決策樹(shù)作為基礎(chǔ)分類(lèi)器,該集成環(huán)境下比較典型的算法是隨機(jī)森林(Random Forest),除了具有上述功能外,隨機(jī)森林還有其他優(yōu)點(diǎn):自有的袋外估計(jì)(out of bagging,OOB)方法能夠準(zhǔn)確估計(jì)泛化誤差,且更不易出現(xiàn)過(guò)擬合問(wèn)題;算法抗噪聲能力強(qiáng),便于并行處理機(jī)制。

1.2? Boosting方式

如圖2所示,主要是通過(guò)每個(gè)弱學(xué)習(xí)器預(yù)測(cè)結(jié)果相加,根據(jù)給定的損失函數(shù)計(jì)算集成模型中下一個(gè)弱學(xué)習(xí)器的預(yù)測(cè)內(nèi)容和自身弱學(xué)習(xí)器的權(quán)重,通過(guò)反復(fù)迭代,最終形成一套強(qiáng)大的學(xué)習(xí)器的過(guò)程。

XGBoost[15]是Gradient Boosting的實(shí)現(xiàn),每個(gè)學(xué)習(xí)器采用CART決策樹(shù)的方式進(jìn)行訓(xùn)練,同時(shí)在計(jì)算損失函數(shù)的時(shí)候引入二階泰勒公式展開(kāi)進(jìn)行擬合,把新一輪對(duì)樣本權(quán)重大小的要求轉(zhuǎn)換為對(duì)新CART樹(shù)結(jié)構(gòu)的要求,通過(guò)采用近似精確貪心策略,遍歷樣本所有特征求解,計(jì)算最佳分裂點(diǎn),從而形成強(qiáng)大分類(lèi)器。

其優(yōu)化過(guò)程如下:

(1)

其中,gi和hi為泰勒公式的一階導(dǎo)數(shù)和二階導(dǎo)數(shù),L為總損失函數(shù),l為每個(gè)樣本的損失函數(shù),yi為樣本真實(shí)標(biāo)注值,xi為樣本特征,r為葉子參數(shù),T為葉子結(jié)點(diǎn)個(gè)數(shù),wj為樣本正則。通過(guò)定義Ij={i|q(xi)=j}將上述公式中對(duì)所有樣本進(jìn)行最小損失計(jì)算,轉(zhuǎn)換為對(duì)CART樹(shù)的葉子節(jié)點(diǎn)要求。

(2)

當(dāng)? 時(shí),具有最小的損失函數(shù)。

LightGBM[16],在原理上和XGBoost類(lèi)似,但是在功能實(shí)現(xiàn)上主要采用基于直方圖的方法將連續(xù)特征離散化,在選取特征分裂點(diǎn)的時(shí)候,只需遍歷直方圖;相對(duì)于XGBoost的預(yù)排序方法計(jì)算分裂增益,存儲(chǔ)上降低了內(nèi)存的消耗;另外在決策樹(shù)的生長(zhǎng)策略方面LightGBM采用的是leaf-wise的策略,即只選擇最大增益的葉節(jié)點(diǎn)來(lái)生長(zhǎng);XGBoost是采取level-wise的策略,即對(duì)同級(jí)節(jié)點(diǎn)統(tǒng)一進(jìn)行生長(zhǎng),最后留下增益最大的節(jié)點(diǎn),策略上LightGBM的效率要高很多。

1.3? Stacking方式

如圖3所示,該方式可對(duì)大型數(shù)據(jù)集(通常百萬(wàn)級(jí)別以上)使用的一種強(qiáng)化組合學(xué)習(xí)方式,該方式下的分類(lèi)器分為兩類(lèi)。一類(lèi)是初級(jí)學(xué)習(xí)器,通??刹捎卯愘|(zhì)分類(lèi)器,比如Bagging、Boosting方式下各種強(qiáng)分類(lèi)器。經(jīng)各自分類(lèi)器訓(xùn)練后,采用交叉驗(yàn)證的方式獲得每個(gè)樣本的預(yù)測(cè)結(jié)果數(shù)據(jù)。另外一類(lèi)是元學(xué)習(xí)器,通常采用非線性分類(lèi)器(例如邏輯回歸或者決策樹(shù)等),將異質(zhì)分類(lèi)器的訓(xùn)練結(jié)果進(jìn)一步訓(xùn)練,最終獲得強(qiáng)大的分類(lèi)效果。

根據(jù)研究表明,訓(xùn)練異質(zhì)分類(lèi)器需采用K折交叉驗(yàn)證的方式,避免讓元分類(lèi)器出現(xiàn)過(guò)擬合現(xiàn)象,同時(shí)將原始特征結(jié)合異質(zhì)分類(lèi)器獲得的分類(lèi)效果,可進(jìn)一步豐富和完善原始樣本的表征能力,這樣結(jié)合元分類(lèi)器效果更加顯著,例如周志華教授的Deep Forest級(jí)聯(lián)結(jié)構(gòu)采用了此類(lèi)方法[17]。

無(wú)論采用哪種集成方式,在性能方面較之前非集成的傳統(tǒng)機(jī)器學(xué)習(xí),都具有顯著的提升。三種集成方式具有各自特點(diǎn),本文將針對(duì)保單失復(fù)效訓(xùn)練數(shù)據(jù)逐一進(jìn)行效果驗(yàn)證,通過(guò)對(duì)比挑選合適的集成算法。

2? 實(shí)證分析-構(gòu)建保單失復(fù)效模型

隨著我司近些年來(lái)業(yè)務(wù)量不斷攀升,在業(yè)務(wù)數(shù)據(jù)方面,特別是在保單續(xù)期管理過(guò)程中積累大量的歷史數(shù)據(jù)。這些數(shù)據(jù)主要來(lái)源于兩大業(yè)務(wù)領(lǐng)域,一方面來(lái)自客戶(hù)續(xù)期繳費(fèi)服務(wù)跟蹤管理,這里包含客戶(hù)繳費(fèi)行為等特征數(shù)據(jù);另外一方面來(lái)源于失效保單的復(fù)效跟蹤管理,包含激勵(lì)復(fù)效措施等分布特征數(shù)據(jù)。本文模型即基于這些數(shù)據(jù)進(jìn)行實(shí)證構(gòu)建。

2.1? 樣本情況

為了獲取合理的樣本分布,本文對(duì)我司過(guò)去20年內(nèi)不同時(shí)點(diǎn)的處于兩年內(nèi)失效狀態(tài)的保單進(jìn)行抽樣,將短期內(nèi)(例如1個(gè)月)發(fā)生復(fù)效的保單定義為正樣本,其余定義為負(fù)樣本,其中剔除抽樣重復(fù)的失效保單,數(shù)據(jù)情況如表1所示。

2.2? 特征預(yù)處理

為了提升模型運(yùn)算效率和降低特征的冗余度,需對(duì)特征做一系列處理。首先須通過(guò)統(tǒng)計(jì)缺失率、IV值以及相關(guān)系數(shù)等方法進(jìn)行初步篩選;其次,針對(duì)將收入、保費(fèi)等連續(xù)值特征進(jìn)行對(duì)數(shù)化處理,用來(lái)消除因時(shí)間變化,相關(guān)統(tǒng)計(jì)量發(fā)生明顯偏移的情況;同時(shí),針對(duì)類(lèi)型特征進(jìn)行編碼化處理,將整體數(shù)據(jù)集變成數(shù)值型變量;最后,采取LR模型、GBDT訓(xùn)練對(duì)特征進(jìn)行二次篩選,篩選可能關(guān)聯(lián)度較高的重要特征。

同時(shí),根據(jù)現(xiàn)有客戶(hù)保單繳費(fèi)行為,基于RFM方式,進(jìn)一步衍生計(jì)算客戶(hù)交費(fèi)習(xí)慣等特征。

最后,保單失復(fù)效建模特征將聚焦于保單屬性、客戶(hù)畫(huà)像以及客戶(hù)交費(fèi)習(xí)慣三大類(lèi)主題。

2.3? 模型構(gòu)建過(guò)程

如圖4所示,整個(gè)模型構(gòu)建過(guò)程,將失效保單訓(xùn)練樣本總量進(jìn)行合理拆分,分別為模型樣本和驗(yàn)證樣本。模型樣本用于構(gòu)建模型使用,訓(xùn)練模型的參數(shù);其中取模型樣本的一小部分(約10%左右)作為測(cè)試樣本,用于調(diào)整模型參數(shù),增強(qiáng)模型可用性。驗(yàn)證樣本主要集中測(cè)試模型的泛化能力,評(píng)估模型的相關(guān)泛化水平是否達(dá)到預(yù)期的業(yè)務(wù)水平。

其中預(yù)測(cè)模型將分別使用RandomForest、XGBoost、LightGBM和Stacking融合算法進(jìn)行構(gòu)建。

為了使評(píng)估模型能力更加針對(duì)業(yè)務(wù)實(shí)際情況,在評(píng)估時(shí)不僅采用AUC、KS等技術(shù)指標(biāo)進(jìn)行評(píng)價(jià),同時(shí)還須考慮模型的運(yùn)行時(shí)效以及滿(mǎn)足帕累托法則情況。

2.4? 效果對(duì)比分析

為了得到充分合理的對(duì)比效果,需要對(duì)每一種算法進(jìn)行參數(shù)調(diào)優(yōu),方法是采用網(wǎng)格搜索和貝葉斯調(diào)參優(yōu)化結(jié)合,經(jīng)過(guò)1 000次系統(tǒng)自動(dòng)迭代,最優(yōu)參數(shù)如表2所示。

其中RandomForest、XGBoost和LightGBM采用的是Sklearn庫(kù),Stacking融合算法采用的是mlxtend庫(kù)。

經(jīng)過(guò)模型多輪學(xué)習(xí)構(gòu)建,得到相關(guān)性能指標(biāo)如表3所示。

根據(jù)對(duì)比分析可以看出,Stacking融合算法效果最優(yōu);從算法執(zhí)行效率來(lái)看LightGBM執(zhí)行最快;但是同時(shí)可以看出XGBoost從預(yù)測(cè)效果角度略低于Stacking融合算法,但是從執(zhí)行效率角度遠(yuǎn)快于Stacking融合算法,幾乎與LightGBM相當(dāng)。

進(jìn)一步地,結(jié)合我們保單失復(fù)效預(yù)測(cè)使用場(chǎng)景,使用帕累托法則進(jìn)行分析,方框內(nèi)容是為了便于四種算法對(duì)比效果分析,可以看出通過(guò)四種算法同樣抽取模型得分在0.7以上的保單進(jìn)行效果統(tǒng)計(jì)對(duì)應(yīng)的數(shù)值來(lái)看,基于Stacking算法的效果最好,結(jié)果如圖5所示。

從圖5可以看出,Stacking融合算法相對(duì)具備較強(qiáng)的帕累托特性,即只需集中精力管理30.00%的全量失效保單,即可實(shí)現(xiàn)覆蓋81.82%當(dāng)月復(fù)效保單,而XGBoost算法,也基本上達(dá)到了80.00%的水平,從原理上來(lái)說(shuō),這兩種算法都滿(mǎn)足當(dāng)初所設(shè)定的使用精簡(jiǎn)人力成本高效管理復(fù)效工作的目標(biāo)。

由于保單失復(fù)效管理屬于定期清查工作,本身對(duì)模型實(shí)時(shí)性響應(yīng)要求并不那么嚴(yán)格,為了獲得更好的泛化能力,本文的模型最終選取基于Stacking融合計(jì)算作為我們的建模算法。

3? 實(shí)際應(yīng)用效果

為了持續(xù)加強(qiáng)保單失復(fù)效模型所起的作用,在場(chǎng)景設(shè)計(jì)上,我們借鑒PDCA循環(huán)理論。如圖6所示,通過(guò)模型計(jì)算復(fù)效概率得分,科學(xué)制定高復(fù)效意愿跟蹤管理計(jì)劃,以目標(biāo)為導(dǎo)向具體指導(dǎo)銷(xiāo)售人員進(jìn)行差異化復(fù)效督導(dǎo)措施,通過(guò)分析實(shí)際復(fù)效效果與模型預(yù)期的偏離程度,找出當(dāng)前復(fù)效以及模型存在的問(wèn)題,制定相關(guān)的整改措施,并進(jìn)一步優(yōu)化模型效果,持續(xù)改進(jìn)和加強(qiáng)保單失復(fù)效模型在管理工作中的作用。

模型使用除了便于使管理人員進(jìn)行帕累托法則督導(dǎo)外,銷(xiāo)售人員在執(zhí)行復(fù)效服務(wù)工作時(shí),可根據(jù)保單失復(fù)效模型得分采取差異化溝通計(jì)劃,提高復(fù)效服務(wù)的工作效率;針對(duì)不同的復(fù)效意愿,采用不同的復(fù)效溝通方式。

如圖7所示,以下為模型在分公司試點(diǎn)的效果,與業(yè)務(wù)自然情況的對(duì)比分析,以及根據(jù)模型預(yù)測(cè)結(jié)果建議采取溝通措施計(jì)劃。

如表4所示,在差異化復(fù)效溝通方面,針對(duì)高復(fù)效意愿的客戶(hù),可借助微信/短信提醒方式,節(jié)省溝通時(shí)間成本;對(duì)于復(fù)效意愿較為普通的客戶(hù),采取合適的激勵(lì)措施引導(dǎo)客戶(hù)復(fù)效;而針對(duì)復(fù)效概率低的客戶(hù),可采取直接推薦優(yōu)選其他更加合適的保險(xiǎn)產(chǎn)品進(jìn)行溝通。

值得一提的是,在分公司試點(diǎn)期間,由于對(duì)復(fù)效考核要求要進(jìn)一步細(xì)化為期初(失效日期在本年度前的保單)和期內(nèi)(失效日期在本年度的保單)兩項(xiàng)指標(biāo)。根據(jù)生產(chǎn)運(yùn)營(yíng)經(jīng)驗(yàn)來(lái)看,失效時(shí)間越長(zhǎng)的保單,其本身復(fù)效難度也是越大,如圖8所示,這個(gè)正好同保單失復(fù)效模型的SHAP特征可解釋性完全一致。

4? 結(jié)? 論

本文在對(duì)比多種集成算法模型的基礎(chǔ)上,建立起了基于機(jī)器學(xué)習(xí)算法的保單失復(fù)效模型,并且基于公司歷史積累的海量數(shù)據(jù),對(duì)比評(píng)估RandomForest、XGBoost和LightGBM和Stacking融合算法在滿(mǎn)足帕累托法則的對(duì)比分析研究。實(shí)證結(jié)論表明,采用Stacking多融合算法,在非及時(shí)響應(yīng)的批處理環(huán)境下,具備較強(qiáng)的泛化能力。

保單失復(fù)效管理影響著保險(xiǎn)公司長(zhǎng)期健康穩(wěn)定的發(fā)展,通過(guò)將模型引入PDCA持續(xù)優(yōu)化場(chǎng)景設(shè)計(jì),能夠?yàn)楸kU(xiǎn)機(jī)構(gòu)提供科學(xué)可靠的管理決策支持,同時(shí)將營(yíng)銷(xiāo)員從繁重的催收工作解放出來(lái),提升自身工作效率,改善客戶(hù)服務(wù)水平,具備較強(qiáng)的實(shí)踐參考價(jià)值。

參考文獻(xiàn):

[1] 邢秀芹.保險(xiǎn)學(xué) [M].北京:北京郵電大學(xué)出版社,2008.

[2] 朱小平,吳婷.期交失效保單風(fēng)險(xiǎn)點(diǎn)探析及應(yīng)對(duì) [N].中國(guó)郵政報(bào),2016-06-30(4).

[3] 全國(guó)人民代表大會(huì)常務(wù)委員會(huì).中華人民共和國(guó)保險(xiǎn)法 [R/OL].[2020-09-20].http://www.npc.gov.cn/wxzl/gongbao/ 2015-07/06/content_1942828.htm.

[4] 百度百科.二八效應(yīng) [EB/OL].[2020-09-20].https://baike.baidu.com/item/%E4%BA%8C%E5%85%AB%E6%95%88%E5%BA%94/5155000?fromtitle=%E5%B8%95%E7%B4%AF%E6%89%98%E6%B3%95%E5%88%99&fromid=7224763#2.

[5] 阿明翰,張達(dá)敏,李偉.邏輯回歸在信用卡風(fēng)險(xiǎn)評(píng)估模型構(gòu)建中的應(yīng)用 [J].內(nèi)江科技,2016,37(9):41-42.

[6] 劉嵐,王霞,林紅旭,等.基于混合BP神經(jīng)網(wǎng)絡(luò)算法的信用卡消費(fèi)行為風(fēng)險(xiǎn)預(yù)測(cè) [J].科技管理研究,2011,31(17):206-210.

[7] 黎月.基于貝葉斯網(wǎng)分類(lèi)器的互聯(lián)網(wǎng)借貸風(fēng)險(xiǎn)評(píng)估 [J].北方經(jīng)貿(mào),2018(6):106-107.

[8] 盧文祥.基于logistic回歸模型的保險(xiǎn)單續(xù)款預(yù)測(cè)研究 [D].哈爾濱:哈爾濱工程大學(xué),2017.

[9] 羅忠敏.失效保單的負(fù)面效應(yīng)與應(yīng)對(duì)策略 [J].華南金融研究,2002(6):53-55.

[10] 韓焱.失效保單的成因及防范對(duì)策 [J].保險(xiǎn)研究,2002(4):41-42.

[11] 賈佳麗.河北壽險(xiǎn)業(yè)“失效保單”存在問(wèn)題及改善建議 [N].中國(guó)保險(xiǎn)報(bào),2018-04-03(12).

[12] MURTHY S K. Automatic Construction of Decision Trees from Data:A Multi-Disciplinary Survey [J]. Data Mining and Knowledge Discovery,1998,2(4):345-389.

[13] 萬(wàn)融.商品學(xué)概論:第5版 [M].北京:中國(guó)人民大學(xué)出版社,2013.

[14] 周志華.機(jī)器學(xué)習(xí) [M].北京:清華大學(xué)出版社,2016:171-185.

[15] CHEN T Q,GUESTRIN C.XGBoost:A Scalable Tree Boosting System [C]//KDD16:Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data MiningAugust,2016:785-794.

[16] KE G L,MENG Q,F(xiàn)INLEY T,et al. LightGBM:a highly efficient gradient boosting decision tree [C]//NIPS'17:Proceedings of the 31st International Conference on Neural Information Processing Systems. Curran Associates Inc.,57 Morehouse Lane,Red Hook,NY,United States,2017:3149-3157.

[17] ZHOU Z H,F(xiàn)ENG J. Deep Forest:Towards An Alternative to Deep Neural Networks [J].National Science Review,2019,6(1):74-86.

作者簡(jiǎn)介:林鵬程(1980—),男,漢族,福建龍巖人,中級(jí)工程師(一級(jí)),碩士研究生,研究方向:AI算法在金融企業(yè)的應(yīng)用;唐輝(1981—),男,漢族,湖北天門(mén)人,高級(jí)工程師(一級(jí)),碩士研究生,研究方向:企業(yè)信息管理。

猜你喜歡
隨機(jī)森林
隨機(jī)森林在棉蚜蟲(chóng)害等級(jí)預(yù)測(cè)中的應(yīng)用
基于二次隨機(jī)森林的不平衡數(shù)據(jù)分類(lèi)算法
拱壩變形監(jiān)測(cè)預(yù)報(bào)的隨機(jī)森林模型及應(yīng)用
基于隨機(jī)森林算法的飛機(jī)發(fā)動(dòng)機(jī)故障診斷方法的研究
基于隨機(jī)森林算法的B2B客戶(hù)分級(jí)系統(tǒng)的設(shè)計(jì)
基于多視角特征融合與隨機(jī)森林的蛋白質(zhì)結(jié)晶預(yù)測(cè)
电白县| 陆川县| 霍城县| 额尔古纳市| 菏泽市| 伊春市| 通渭县| 洪湖市| 石屏县| 抚顺市| 临清市| 景宁| 湖口县| 盐亭县| 正宁县| 马公市| 双城市| 涡阳县| 古田县| 嵊泗县| 霍山县| 民和| 囊谦县| 威远县| 灌云县| 黔南| 铜陵市| 海淀区| 封丘县| 财经| 梓潼县| 景东| 京山县| 富平县| 杭锦旗| 日照市| 双流县| 平利县| 深水埗区| 阿拉尔市| 集安市|