国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Prophet框架的銀行網(wǎng)點(diǎn)備付金預(yù)測(cè)方法

2019-02-21 03:47
關(guān)鍵詞:網(wǎng)點(diǎn)現(xiàn)金預(yù)測(cè)

(中南大學(xué) 信息科學(xué)與工程學(xué)院,湖南 長(zhǎng)沙,410083)

備付金是保障客戶提取現(xiàn)金和款項(xiàng)結(jié)算的準(zhǔn)備金,也是維護(hù)銀行信譽(yù)、防范金融風(fēng)險(xiǎn)的準(zhǔn)備金[1]。從銀行角度出發(fā),如果能夠?qū)Ω骶W(wǎng)點(diǎn)每日的現(xiàn)金需求額進(jìn)行合理預(yù)測(cè),使得現(xiàn)金備付由以往的經(jīng)驗(yàn)管理向模型自動(dòng)化管理轉(zhuǎn)變,將現(xiàn)有工作處理流程科學(xué)化、精細(xì)化、合理化,將有利于減少無效資產(chǎn)占用,在管理上減輕前臺(tái)網(wǎng)點(diǎn)的工作量,使得銀行利潤(rùn)最大化,達(dá)到穩(wěn)健經(jīng)營(yíng)、節(jié)省資金和增加效益的目的,是一項(xiàng)有價(jià)值的研究課題[2-3]。銀行網(wǎng)點(diǎn)的現(xiàn)金交易流水是一種沿時(shí)間發(fā)展變化的隨機(jī)過程,1 d的現(xiàn)金需求是當(dāng)天的需求峰值[4]。現(xiàn)金需求量是不確定的,受到地理位置、季節(jié)周期、特殊事件、存取款的先后順序等多復(fù)雜因素影響,很難對(duì)各影響因子的貢獻(xiàn)度進(jìn)行綜合量化分析[5]。但是,無論有多少作用因子,以及它們是如何作用的,最終導(dǎo)致的現(xiàn)金需求量總是依時(shí)間表現(xiàn)出一定的周期性和穩(wěn)定性。可以利用有效的時(shí)間序列模型建模分析該隨機(jī)過程的特性。目前,關(guān)于備付金序列預(yù)測(cè)的研究主要分為 4類:1) 時(shí)間序列法,如ARMA 等方法[5-6];2) 基于統(tǒng)計(jì)的方法[7],如湖南某建設(shè)銀行采取存款備付金比率 MEAN-GROWTH方法,計(jì)算往年同期現(xiàn)金日凈額的平均增長(zhǎng)率并限制增長(zhǎng)率在一定范圍內(nèi),將往年同期現(xiàn)金日凈額的平均值與對(duì)應(yīng)的增長(zhǎng)率的乘積作為預(yù)測(cè)結(jié)果,其采用的限額比例管理方法缺乏一定的靈活性,不能應(yīng)對(duì)實(shí)際的多變情況。3) 基于庫存理論,現(xiàn)金備付問題與已有大量研究的庫存問題[8-9]有些類似的地方。4) 人工智能法,如BP神經(jīng)網(wǎng)絡(luò)算法[10-11]、SVM[12-13]和RNN LSTM[14]等方法。1個(gè)有效的預(yù)測(cè)模型將同時(shí)考慮目標(biāo)序列過去的行為數(shù)據(jù)和近期某些特殊事件的影響,這些特殊值在備付金管理預(yù)測(cè)問題上具有重要意義,但是一般的時(shí)間序列算法將這些特殊點(diǎn)視為離群點(diǎn)被剔除掉,忽略了其對(duì)目標(biāo)序列估值的作用。另外,經(jīng)濟(jì)時(shí)間序列預(yù)測(cè)中的“拐點(diǎn)”預(yù)測(cè)也是一個(gè)重要的研究?jī)?nèi)容和難點(diǎn)問題[15]。為了解決以上問題,本文作者提出一種基于Facebook開源的Prophet[16]框架的銀行網(wǎng)點(diǎn)備付金預(yù)測(cè)的HC方法(holiday changepoints method)。將時(shí)間屬性作為HC方法的主要自變量,構(gòu)建對(duì)銀行網(wǎng)點(diǎn)現(xiàn)金交易具有較大影響的節(jié)假日列表和趨勢(shì)轉(zhuǎn)折點(diǎn)列表,運(yùn)用 Prophet框架完成矩陣特征計(jì)算,從而實(shí)現(xiàn)“異常點(diǎn)”和“拐點(diǎn)”的預(yù)測(cè),同時(shí)基于 Prophet框架分析并組合備付金序列的各重要組成成分,利用馬爾可夫鏈蒙特卡洛(MCMC)[11,17]抽樣算法實(shí)現(xiàn)快速有效的參數(shù)估計(jì)?;阢y行網(wǎng)點(diǎn)的實(shí)際現(xiàn)金交易數(shù)據(jù)并部署在測(cè)試環(huán)境中,同經(jīng)典的時(shí)間序列ARMA和神經(jīng)網(wǎng)絡(luò)RNN LSTM算法在一致的4個(gè)性能度量指標(biāo)下比較現(xiàn)金備付預(yù)測(cè)的有效性。

1 基于Prophet框架的HC方法

銀行網(wǎng)點(diǎn)的現(xiàn)金需求量預(yù)測(cè)是根據(jù)歷史交易數(shù)據(jù)記錄,對(duì)未來1 d或一段時(shí)間的現(xiàn)金需求量進(jìn)行預(yù)測(cè)。銀行網(wǎng)點(diǎn)備付金是一種較復(fù)雜的時(shí)間序列,不僅存在周期效應(yīng)(周效應(yīng)、月效應(yīng)),還會(huì)受到天氣、地理位置、突發(fā)事件、節(jié)假日等因素的影響[5]。因此,要實(shí)現(xiàn)對(duì)備付金的科學(xué)預(yù)測(cè),不僅需要運(yùn)用合適的預(yù)測(cè)技術(shù),還需要全面考慮原始數(shù)據(jù)的獲取、處理等方面。銀行網(wǎng)點(diǎn)備付金預(yù)測(cè)工作流如圖1所示。借助Prophet框架多次迭代優(yōu)化從而挖掘目標(biāo)序列的發(fā)展變化規(guī)律,考慮到不同類型網(wǎng)點(diǎn)的現(xiàn)金交易流具有不同的變化趨勢(shì),針對(duì)各類型網(wǎng)點(diǎn)分別建模預(yù)測(cè)。首先,選擇目標(biāo)網(wǎng)點(diǎn),篩選有利于備付金預(yù)測(cè)的相關(guān)指標(biāo);然后,將每日的現(xiàn)金交易數(shù)據(jù)梳理清洗后逐筆軋差且進(jìn)行Z-SCORE標(biāo)準(zhǔn)化從而構(gòu)建每日備付金序列,其中備付金序列以一定比例劃分為訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集;將訓(xùn)練集作為 Prophet的輸入,以平均絕對(duì)誤差、均方根誤差、平均絕對(duì)百分比誤差和絕對(duì)誤差這4個(gè)性能度量指標(biāo)進(jìn)行模型評(píng)估,同時(shí)結(jié)合可視化技術(shù)進(jìn)行實(shí)時(shí)交互式檢查調(diào)整算法參數(shù),包括構(gòu)建非周期性的節(jié)假日列表和趨勢(shì)轉(zhuǎn)折點(diǎn)列表,識(shí)別增長(zhǎng)趨勢(shì)等。最后,通過多次迭代調(diào)參進(jìn)行優(yōu)化,得到一個(gè)較好的預(yù)測(cè)模型,將測(cè)試序列輸入預(yù)測(cè)模型獲得預(yù)測(cè)結(jié)果以及計(jì)算模型的性能度量指標(biāo)如均方根誤差(eRMSE)來確定最終模型的預(yù)測(cè)能力。

圖1 銀行網(wǎng)點(diǎn)備付金預(yù)測(cè)工作流Fig.1 Forecasting workflow of bank outlets reserve

1.1 數(shù)據(jù)預(yù)處理

1.1.1 構(gòu)建備付金序列

銀行實(shí)際記錄的數(shù)據(jù)一般是不規(guī)則和含有噪聲干擾的,因此,在建模前需規(guī)范原始數(shù)據(jù),進(jìn)行必要的數(shù)據(jù)梳理清洗工作。因現(xiàn)金需求模式與網(wǎng)點(diǎn)的地理位置有關(guān),如大型商業(yè)區(qū)附近的現(xiàn)金需求量較穩(wěn)定,高校區(qū)附近的現(xiàn)金交易量在寒暑假期間有明顯的波動(dòng)[18],因此,需要針對(duì)不同的網(wǎng)點(diǎn)類型分別建模才有意義。確定某個(gè)網(wǎng)點(diǎn)的現(xiàn)金交易數(shù)據(jù),首先進(jìn)行數(shù)據(jù)梳理,匯總合并數(shù)據(jù)集,選擇涉及現(xiàn)金交易,對(duì)現(xiàn)金備付預(yù)測(cè)有用的指標(biāo),如交易日期、交易時(shí)段、交易存取款額等信息;然后對(duì)交易存取款額按照“存款為正值,取款為負(fù)值”的原則,根據(jù)當(dāng)日交易記錄時(shí)間先后順序逐筆軋差計(jì)算,取軋差值中的最小值,即負(fù)值絕對(duì)值最大值為該網(wǎng)點(diǎn)當(dāng)日的最大現(xiàn)金需鈔量。以某銀行網(wǎng)點(diǎn)的現(xiàn)金交易數(shù)據(jù)為例,匯總合并后在2013-09-12這1 d的現(xiàn)金交易數(shù)據(jù)處理結(jié)果如表1所示。由表1 可知:該網(wǎng)點(diǎn)在2013-09-12的備付金額應(yīng)為127 400.00元。

1.1.2 缺失值和異常數(shù)據(jù)的處理

若網(wǎng)點(diǎn)因某些原因如未營(yíng)業(yè)導(dǎo)致當(dāng)天的交易記錄缺失,一般是將當(dāng)天現(xiàn)金需求量記為前、后2 d現(xiàn)金需求量的平均值,即

本文作者處理方法是填補(bǔ)缺失的日期,并將對(duì)應(yīng)的數(shù)值設(shè)置為空。

一些特殊事件如節(jié)假日、商場(chǎng)大型促銷活動(dòng)(店慶日)會(huì)使某天的需求量急速增加或減少,這些時(shí)間對(duì)應(yīng)的交易值明顯區(qū)別于平常日,與近期平常日的數(shù)據(jù)的關(guān)聯(lián)性很弱,一般將其作為“異常點(diǎn)”剔除,方法與缺失值的處理相同,以免影響其他絕大部分?jǐn)?shù)據(jù)原有的規(guī)律。但是,這類因特殊事件造成的“異常點(diǎn)”不是缺失值,也不一定是錯(cuò)誤值,對(duì)于具有明顯周期性的“異常點(diǎn)”,同樣是真實(shí)情況的表現(xiàn),在備付金管理預(yù)測(cè)問題上具有實(shí)際意義。因此,將這些點(diǎn)做特殊標(biāo)記,提供1個(gè)特殊事件的日期列表,并保留其原先的備付金數(shù)額。

1.1.3 標(biāo)準(zhǔn)化處理

為了消除變量自身的影響,提高數(shù)據(jù)的可用性,使得訓(xùn)練模型更加有效,最常用的處理就是對(duì)數(shù)據(jù)集進(jìn)行Z-SCORE標(biāo)準(zhǔn)化:

其中:u為訓(xùn)練數(shù)據(jù)集變量的平均值;v為訓(xùn)練集變量值對(duì)應(yīng)的標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)化后的數(shù)據(jù)滿足正態(tài)分布,文獻(xiàn)[19]中證實(shí)這有助于提高模型訓(xùn)練效率。將該標(biāo)準(zhǔn)化參數(shù)值直接運(yùn)用在驗(yàn)證集和測(cè)試集中。

1.2 基于Prophet框架的需求預(yù)測(cè)

Prophet框架主要是由4個(gè)組件而構(gòu)成1個(gè)加法模型,如下式所示[16]:

其中:y(t)為時(shí)間序列在時(shí)間t的觀測(cè)值;g(t)為增長(zhǎng)函數(shù),它模擬目標(biāo)序列的一種變化趨勢(shì);s(t)為以加法形式實(shí)現(xiàn)靈活組合各種季節(jié)性變化趨勢(shì),其還可以通過對(duì)數(shù)變換適應(yīng)乘法季節(jié)性;h(t)為一個(gè)比較特殊的組件,有效納入了不規(guī)則假期或特殊事件對(duì)備付金序列的影響貢獻(xiàn)值,使得將可預(yù)計(jì)發(fā)生的特殊影響事件作為先驗(yàn)知識(shí)融合;e(t)為假設(shè)其服從正態(tài)分布的噪聲因子。Prophet僅使用時(shí)間作為自變量,將時(shí)間作為組件的幾個(gè)線性和非線性函數(shù),明確解釋了目標(biāo)序列的時(shí)間依賴結(jié)構(gòu)。

1.2.1 增長(zhǎng)趨勢(shì)

數(shù)據(jù)生成過程的核心是增長(zhǎng)模式以及預(yù)期如何繼續(xù)生長(zhǎng),類似于人口生長(zhǎng)的增長(zhǎng)趨勢(shì)預(yù)測(cè),如下式所示[16]:

表1 某日交易數(shù)據(jù)的中間計(jì)算結(jié)果Table 1 Intermediate calculation results of trading data one day 元

其中:g(t)為增長(zhǎng)趨勢(shì)值;c為趨勢(shì)值的1個(gè)上限值;k為增長(zhǎng)率,k越大,增長(zhǎng)速度也就越快;b為偏移量。顯然,隨著時(shí)間t的發(fā)展,g(t)將越趨于c,非線性增長(zhǎng)趨勢(shì)將會(huì)達(dá)到自然極限或飽和。

對(duì)于允許增長(zhǎng)率k被改變的模式中,通過明確所有的拐點(diǎn)sj(j=1,…,m)來表示對(duì)增長(zhǎng)率k變化的影響,其中m代表樣本中定義的時(shí)間點(diǎn)數(shù)量,即由m個(gè)時(shí)間拐點(diǎn)構(gòu)成拐點(diǎn)向量S;sj代表第j個(gè)元素。若不自定義設(shè)置,將自動(dòng)從歷史樣本的前 80%數(shù)據(jù)量中確定 25個(gè)均勻分布的點(diǎn)為拐點(diǎn)。定義增長(zhǎng)率變化向量δ∈Rs,其中δj代表在時(shí)間點(diǎn)sj的速率變化,同時(shí),δ服從拉普拉斯分布δ~Laplace(0,τ),從而進(jìn)行平滑,參數(shù)τ負(fù)責(zé)控制增長(zhǎng)率的調(diào)節(jié)強(qiáng)度,類似于L1正則化的作用,較大的值允許模型以適應(yīng)更大的增長(zhǎng)趨勢(shì)波動(dòng),默認(rèn)值設(shè)置為0.05,該值一般能滿足大多數(shù)應(yīng)用場(chǎng)景的增長(zhǎng)趨勢(shì)波動(dòng)。于是,在任意時(shí)間點(diǎn)t,增長(zhǎng)率可以表示為,進(jìn)而定義向量α(t):

則在任意時(shí)間點(diǎn)t,增長(zhǎng)率k可以表示為。

考慮到拐點(diǎn)造成的函數(shù)非連續(xù)性,對(duì)于偏置項(xiàng)需要做出調(diào)整從而實(shí)現(xiàn)函數(shù)連續(xù)性,則在拐點(diǎn)sj(j=1,…,m)處,通過下式自適應(yīng)調(diào)整偏移量項(xiàng)[16]:

此時(shí)偏移項(xiàng)為b+α(t)Tγ,最終得到如式(6)所示的目標(biāo)序列的生長(zhǎng)趨勢(shì)組件[16],實(shí)現(xiàn)目標(biāo)序列非線性增長(zhǎng)趨勢(shì)的擬合。

對(duì)于線性增長(zhǎng)趨勢(shì),通常以1個(gè)更簡(jiǎn)約的模型來定義線性的增長(zhǎng)函數(shù),如下式所示:

其中:γj=-sjδj;sj(j=1,…,m)代表在j時(shí)刻的拐點(diǎn);δj代表在時(shí)間點(diǎn)sj的速率變化;δ為增長(zhǎng)率變化向量,δ∈Rs,δ服從拉普拉斯分布δ~Laplace(0,τ);參數(shù)τ負(fù)責(zé)控制增長(zhǎng)率的調(diào)節(jié)強(qiáng)度。

1.2.2 季節(jié)周期性

金融時(shí)間序列往往具有因“人類行為”季節(jié)性而產(chǎn)生的各種季節(jié)性,比如每年的季節(jié)性、每周的季節(jié)性、每日的季節(jié)性以及節(jié)假日這樣的不規(guī)則周期,靈活地組合這些趨勢(shì)成分才可能更精確地建模季節(jié)性,從而更準(zhǔn)確地預(yù)測(cè)結(jié)果。通過使用周期序列的離散傅里葉級(jí)數(shù)建模季節(jié)分量。

其中:P為目標(biāo)序列的周期;cn為要估計(jì)的系數(shù)參數(shù),服從cn~Normal(0,σ)分布;2N為設(shè)定的近似項(xiàng)個(gè)數(shù),N越大,越能擬合復(fù)雜的季節(jié)性,但可能起不到很好的濾波效果。N的設(shè)定需要結(jié)合P進(jìn)行考慮,對(duì)于年的周期性,設(shè)定P為365.25,N為10;對(duì)于每周的季節(jié)性,P設(shè)置為7,N則設(shè)置為3。令:

讓s(t)表示為x(t)與一個(gè)參數(shù)向量β的點(diǎn)乘形式,如下式所示:

其中:β是對(duì)模型季節(jié)性進(jìn)行平滑的參數(shù),服從β~Normal(0,σ)分布,起到正則化的效果,σ越大則允許模型以適應(yīng)更大的季節(jié)性波動(dòng),較小的值則抑制季節(jié)性,默認(rèn)值設(shè)定為10。

1.2.3 假日和特殊事件影響

網(wǎng)點(diǎn)每天的現(xiàn)金交易會(huì)受到一些隨機(jī)的客戶行為和一些其他的因素(如節(jié)假日、某些地區(qū)的季節(jié)性需求、付薪日、養(yǎng)老金發(fā)放日)的影響,從大體趨勢(shì)上來看,具有某種歷史的相關(guān)性(年、月和周)[5,18]。比如,工作日較周末具有較大的交易量;商場(chǎng)的大型促銷活動(dòng)(如店慶日等舉行的周期性活動(dòng)、“雙十一”等)會(huì)增加現(xiàn)金需求量;“春節(jié)”“五一”“國(guó)慶”“中秋節(jié)”等假日前和假日后會(huì)影響現(xiàn)金交易量;對(duì)于高校周圍的網(wǎng)點(diǎn),因寒暑假以及開學(xué)等事件也會(huì)影響這些網(wǎng)點(diǎn)的現(xiàn)金交易量。根據(jù)中國(guó)人們的交易習(xí)慣和工作習(xí)慣,將這些影響因素作為先驗(yàn)知識(shí)納入模型,對(duì)模型準(zhǔn)確率的提升具有重大意義。

將上述可預(yù)計(jì)因素包括特殊事件和節(jié)假日以日期形式定義,通過事件和假日的唯一名稱提供對(duì)應(yīng)的在過去和未來這些可預(yù)計(jì)因素的自定義日期列表,以下統(tǒng)稱為節(jié)假日。同時(shí),認(rèn)為假日的影響力是獨(dú)立的,假日i相對(duì)應(yīng)的日期列表為Di。添加1個(gè)指示函數(shù)表示時(shí)間t是否在假期i期間,該指示函數(shù)主要由參數(shù)ki決定,ki取值為{0,1},L則代表假日和定義的特殊事件的總個(gè)數(shù),如下式所示:

對(duì)于假日節(jié)前和節(jié)后效應(yīng)的引入,設(shè)定1個(gè)時(shí)間窗將其納入模型,對(duì)屬于時(shí)間窗內(nèi)的時(shí)間點(diǎn)都看作特殊假日。于是引入1個(gè)矩陣Z(t),是關(guān)于節(jié)假日及自定義的時(shí)間窗和特殊事件的特征矩陣,從而將該模型的數(shù)學(xué)表達(dá)形式與式(9)達(dá)成一致處理。由式(11)能夠解釋節(jié)日前后的變化以及特殊事件的影響,并將受影響的發(fā)展軌跡調(diào)整到觀測(cè)數(shù)據(jù)。

參數(shù)k仍服從正態(tài)分布k~Normal(0,υ),υ默認(rèn)值設(shè)定為10,υ越大,則允許模型以適應(yīng)更大的波動(dòng),較小的值則抑制影響力。最后,使用馬爾可夫鏈蒙特卡洛MCMC或最大后驗(yàn)概率MAP來模擬模型的后驗(yàn)分布實(shí)現(xiàn)參數(shù)估計(jì)。

2 實(shí)驗(yàn)過程與結(jié)果分析

2.1 參數(shù)初始化

本實(shí)驗(yàn)所用數(shù)據(jù)由湖南長(zhǎng)沙建行某分行提供,從2013—2015年這3 a某網(wǎng)點(diǎn)的現(xiàn)金交易數(shù)據(jù)記錄,分別以 2:1的比例設(shè)置為訓(xùn)練集和測(cè)試數(shù)據(jù)集,即2013-01—2014-12的記錄作為訓(xùn)練集,2015-01—2015-12這1 a的數(shù)據(jù)作為測(cè)試集,從而更全面準(zhǔn)確地評(píng)估模型準(zhǔn)確率。將原數(shù)據(jù)清洗整理構(gòu)建時(shí)間序列,數(shù)據(jù)間隔設(shè)置為按“天”的粒度,作為 Prophet的輸入。模型參數(shù)初始化設(shè)置如表2所示,選定模型增長(zhǎng)趨勢(shì)為“l(fā)inear”線性趨勢(shì)分量,使用馬爾可夫鏈蒙特卡洛(MCMC)采樣算法迭代5 000次進(jìn)行參數(shù)估計(jì)。

表2 參數(shù)初始化設(shè)置Table 2 Initialization setting of parameters

2.2 HC預(yù)測(cè)模型構(gòu)建

依據(jù)表2所示初始參數(shù)值設(shè)定的HC預(yù)測(cè)模型,得到如圖2所示的備付金序列成分分析結(jié)果。結(jié)合訓(xùn)練數(shù)據(jù)集進(jìn)一步分析備付金序列的數(shù)據(jù)特征,如波峰與波谷的時(shí)間區(qū),從上(下)升趨勢(shì)突然變?yōu)橄?上)降趨勢(shì)的時(shí)間點(diǎn)為拐點(diǎn),以及一些極大區(qū)別于平常日的時(shí)間點(diǎn)為“異常點(diǎn)”;波谷及其鄰域基本是跨越在一些節(jié)假日前后,如春節(jié)前后期、國(guó)慶前期、圣誕節(jié)等假日,相應(yīng)的拐點(diǎn)也多為假日時(shí)間點(diǎn),將備付金數(shù)據(jù)集中的這些時(shí)間點(diǎn)整合為列表作為知識(shí)融入 Prophet框架,節(jié)假日列表如表3所示。

圖2 備付金序列分解圖Fig.2 Decomposition diagram of reserve fund sequence

表3 節(jié)假日列表設(shè)置Table 3 Setting of Holiday list

圖2所示為備付金序列的4個(gè)組成成分,構(gòu)成1個(gè)加法模型,按照“存款為正值,取款為負(fù)值”的原則。由圖2(a)可知:需備付的啟動(dòng)資金在 2013年至2014年增長(zhǎng)幅度較大,2014年至2015年增長(zhǎng)趨勢(shì)較為平穩(wěn);圖2(b)中,在節(jié)假日前后期如春節(jié)前期,備付資金有較大波動(dòng),表明節(jié)假期間,銀行網(wǎng)點(diǎn)部分業(yè)務(wù)不受理,解釋了節(jié)假日前后的現(xiàn)金交易額較節(jié)日期間更大的原因;圖2(c)中工作日比休息日有更大的資金需求量,即銀行網(wǎng)點(diǎn)在工作日的現(xiàn)金交易反而更為頻繁,主要是公司對(duì)公業(yè)務(wù)辦理造成較大影響。同時(shí),周五又相較于其他工作日的值更低,即現(xiàn)金需求量更大,這是符合中國(guó)人民的生活習(xí)慣的。圖2(d)進(jìn)一步表明春節(jié)期間和其他節(jié)假日有1個(gè)較大的備付金需求量,這并非偶然現(xiàn)象。根據(jù)圖1所示的銀行網(wǎng)點(diǎn)備付金預(yù)測(cè)工作流程,借助可視化工具,繼續(xù)調(diào)節(jié)模型參數(shù),通過模型建模到評(píng)估這樣多次循環(huán)過程,最終以較優(yōu)的備付金預(yù)測(cè)模型得到如圖3所示的某網(wǎng)點(diǎn)備付金跨年預(yù)測(cè)結(jié)果。圖3有效地解釋了備付金的節(jié)前和節(jié)后效應(yīng)以及解決了一些特殊點(diǎn)的預(yù)測(cè)問題,如每年的春節(jié)前期,有1個(gè)巨峰,每年的某些節(jié)日如清明節(jié)以及開學(xué)前期,現(xiàn)金交易需求量較大,同時(shí)提供了置信度為95%的預(yù)測(cè)區(qū)間值,較好地囊括了平常日以及特殊日所需的最低資金啟動(dòng)額度。通過迭代的可視化實(shí)時(shí)調(diào)參過程,使得預(yù)測(cè)模型更準(zhǔn)確地表征此類數(shù)據(jù)的分布。

圖3 HC模型跨年預(yù)測(cè)結(jié)果Fig.3 Cross year prediction resultsof HC model

2.3 衡量指標(biāo)

在有關(guān)時(shí)間序列預(yù)測(cè)的文獻(xiàn)[14,20]中,大部分模型評(píng)估均采用如下指標(biāo)。

1) 均方根誤差(eRMSE)。預(yù)測(cè)值與實(shí)際值兩者的誤差的平方和與序列長(zhǎng)度比值的平方根,反映實(shí)際輸出值與預(yù)測(cè)值之間的差距。其中:n為預(yù)測(cè)記錄數(shù);a為資金實(shí)際值;c為資金預(yù)測(cè)值。雖然均方根誤差可以用來在訓(xùn)練過程中作為預(yù)測(cè)目標(biāo),但它不能被視為比較不同模型的決定性條件,應(yīng)該考慮其他性能指標(biāo),以實(shí)現(xiàn)更健壯的性能。

2) 平均絕對(duì)誤差(eMAE)。表示實(shí)際輸出值與預(yù)測(cè)值絕對(duì)差值的平均值,反映預(yù)測(cè)值與實(shí)際值之間的誤差。

3) 平均絕對(duì)百分比誤差(eMAPE):表示實(shí)際輸出值與絕對(duì)誤差之比,即

4) 絕對(duì)誤差(eAE)。表示實(shí)際輸出值與預(yù)測(cè)值之差的總和與實(shí)際輸出值于其均值差值的總和的比值,即

2.4 實(shí)驗(yàn)結(jié)果分析

為了評(píng)估HC模型在銀行網(wǎng)點(diǎn)備付金預(yù)測(cè)場(chǎng)景中的效果,將其與文獻(xiàn)[14]中的 ARMA模型和 RNN LSTM模型進(jìn)行預(yù)測(cè)效果對(duì)比,以2.3節(jié)中介紹的有關(guān)時(shí)間序列預(yù)測(cè)文獻(xiàn)中常用的性能評(píng)估指標(biāo)進(jìn)行量化分析。因MEAN-GROWTH統(tǒng)計(jì)方法比文獻(xiàn)[14]中的ARMA模型和RNN LSTM模型都稍差,故不進(jìn)行對(duì)比。根據(jù) BIC最小準(zhǔn)則以及序列的平穩(wěn)性,確定ARMA模型參數(shù)為ARMA(9,7),RNN LSTM模型采用文獻(xiàn)[14]中的默認(rèn)設(shè)置。

3種算法的準(zhǔn)確度對(duì)比如表4所示。從4個(gè)性能度量指標(biāo)來看,HC模型和ARMA算法模型的效果較好,RNN LSTM神經(jīng)網(wǎng)絡(luò)模型的效果相對(duì)較差。雖然神經(jīng)網(wǎng)絡(luò)是一個(gè)很靈活的計(jì)算框架和通用的逼近器,可以應(yīng)用于廣泛的預(yù)測(cè)問題,然而,盲目應(yīng)用于任何應(yīng)用場(chǎng)景類型的數(shù)據(jù)是不明智的,尤其是對(duì)于線性序列預(yù)測(cè)。圖4所示為 3種模型在 2015-01-01—2015-03-31的預(yù)測(cè)對(duì)比結(jié)果。從圖4可知:該場(chǎng)景下的RNN LSTM預(yù)測(cè)效果較差。通常需要進(jìn)行復(fù)雜的特征選擇工程時(shí)會(huì)選擇使用深度學(xué)習(xí)算法進(jìn)行特征自動(dòng)篩選,而當(dāng)通過人工就可以很好確定模型特征時(shí),一般會(huì)選擇較簡(jiǎn)單的機(jī)器學(xué)習(xí)算法就可以達(dá)到比較滿意的效果,并且RNN LSTM算法訓(xùn)練周期比其他算法較長(zhǎng),難度較大,不太適用于銀行的業(yè)務(wù)處理。

從表4可知:ARMA(9,7)模型和HC模型的4類性能指標(biāo)準(zhǔn)確度較高。從圖4可知:HC模型很好地預(yù)測(cè)了近期該銀行網(wǎng)點(diǎn)備付金的生長(zhǎng)情況,能夠解釋因節(jié)假期間,銀行網(wǎng)點(diǎn)部分業(yè)務(wù)不受理, 節(jié)假日前后的現(xiàn)金交易額較節(jié)日期間更大的現(xiàn)象,以及公司主要在工作日進(jìn)行業(yè)務(wù)辦理造成的金額波動(dòng),較好地解釋了這一系列“拐點(diǎn)”和“孤立點(diǎn)”值的預(yù)測(cè)問題,而ARMA(9,7)模型的預(yù)測(cè)值類似于均值,實(shí)際應(yīng)用意義不大。

表4 3種算法的準(zhǔn)確度對(duì)比Table 4 Accuracy comparison of three methods

圖4 模型預(yù)測(cè)結(jié)果對(duì)比曲線Fig.4 Comparison curves of prediction results

3 結(jié)論

1) 提出了基于Prophet框架的銀行網(wǎng)點(diǎn)備付金預(yù)測(cè)的HC方法,有效解決了“異常值”和“拐點(diǎn)”的預(yù)測(cè)問題,預(yù)測(cè)結(jié)果表明該算法比經(jīng)典的時(shí)間序列算法ARMA和RNN LSTM更適用于銀行網(wǎng)點(diǎn)備付金的預(yù)測(cè)場(chǎng)景。同時(shí),該算法具有較強(qiáng)的可伸縮性,通過建?!u(píng)估這樣1個(gè)循環(huán)過程,利用可視化工具根據(jù)預(yù)測(cè)結(jié)果實(shí)時(shí)靈活調(diào)整參數(shù),以達(dá)到更好的預(yù)測(cè)效果。

2) 在銀行網(wǎng)點(diǎn)備付金預(yù)測(cè)場(chǎng)景下,HC方法顯示了它的優(yōu)勢(shì),但HC方法是一個(gè)時(shí)間單變量函數(shù),這也意味著對(duì)于其他非時(shí)間相關(guān)的影響因素,該方法并不能將其考慮進(jìn)去。下一步計(jì)劃是加入第三方非時(shí)間變量因子,從而結(jié)合如天氣等因素建立更一般的銀行網(wǎng)點(diǎn)備付金預(yù)測(cè)模型。

猜你喜歡
網(wǎng)點(diǎn)現(xiàn)金預(yù)測(cè)
無可預(yù)測(cè)
快遞網(wǎng)點(diǎn)進(jìn)村 村民有活兒干有錢賺
基于“互聯(lián)網(wǎng)+”的汽車養(yǎng)護(hù)網(wǎng)點(diǎn)服務(wù)體系
選修2-2期中考試預(yù)測(cè)卷(A卷)
選修2-2期中考試預(yù)測(cè)卷(B卷)
選修2—2期中考試預(yù)測(cè)卷(A卷)
淺析金融業(yè)物理網(wǎng)點(diǎn)數(shù)字力運(yùn)用
——以建設(shè)銀行重慶市分行為例
強(qiáng)化現(xiàn)金預(yù)算 提高資金效益
被現(xiàn)金券套牢
只“普”不“惠”的現(xiàn)金貸
名山县| 秀山| 抚松县| 元谋县| 盐亭县| 新泰市| 广平县| 凭祥市| 民丰县| 枣阳市| 勐海县| 布尔津县| 漳浦县| 松潘县| 吴桥县| 敖汉旗| 德清县| 青田县| 福鼎市| 凤台县| 伊春市| 朔州市| 潍坊市| 朝阳市| 民勤县| 贵南县| 大冶市| 双辽市| 全州县| 五大连池市| 兰坪| 淮滨县| 忻州市| 钟山县| 肃北| 德清县| 华安县| 界首市| 松原市| 山西省| 高碑店市|