嚴(yán)宇平,吳廣財(cái),江疆
(廣東電網(wǎng)有限責(zé)任公司信息中心廣東廣州510620)
單變量回歸確定移動(dòng)平均權(quán)重算法在話務(wù)量預(yù)測(cè)中的應(yīng)用研究
嚴(yán)宇平,吳廣財(cái),江疆
(廣東電網(wǎng)有限責(zé)任公司信息中心廣東廣州510620)
話務(wù)量是客服中心運(yùn)營(yíng)管理的重要方面,呼叫中心的高效率運(yùn)作是電網(wǎng)系統(tǒng)客戶滿意度以及大規(guī)模停電預(yù)警及突發(fā)狀況處理的重要保證,而坐席人員排班又是呼叫中心運(yùn)作的重要問題。科學(xué)合理的坐席安排能更好地提高呼叫中心的運(yùn)作效率,不僅降低了呼叫中心的運(yùn)營(yíng)成本,從而提升電力呼叫中心的服務(wù)水平。本文提出在移動(dòng)平均法中引入加權(quán),利用預(yù)測(cè)期與歷史各期的單變量回歸,將系數(shù)作歸一化處理作為權(quán)重,進(jìn)行話務(wù)量的預(yù)測(cè)。文章以真實(shí)場(chǎng)景中的實(shí)驗(yàn)結(jié)果證明了本文所提方法的有效性。
話務(wù)量預(yù)測(cè);單變量回歸;加權(quán)移動(dòng)平均;權(quán)重計(jì)算法
客服中心作為客戶與企業(yè)直接聯(lián)系的樞紐,其利用通信手段和計(jì)算機(jī)技術(shù),為客戶得到企業(yè)更完善服務(wù),為企業(yè)獲得更廣泛的客戶接觸,宣傳企業(yè)形象提供了高效直接的服務(wù)手段。為了客服中心以最有效地運(yùn)營(yíng)成本提供最優(yōu)質(zhì)的服務(wù)水平,高效、科學(xué)地控制座席排班作為常見的客服中心運(yùn)營(yíng)管理手段,已經(jīng)成為客服中心行業(yè)的一個(gè)共識(shí)。而座席排班管理是基于話務(wù)量預(yù)測(cè)的。合理準(zhǔn)確的話務(wù)量預(yù)測(cè)不僅為排班管理提供量化基礎(chǔ),還能及時(shí)了解業(yè)務(wù)發(fā)展趨勢(shì),降低因呼損帶來(lái)的企業(yè)形象的損失。
因此,根據(jù)話務(wù)量歷史及相關(guān)業(yè)務(wù)場(chǎng)景對(duì)客服中心話務(wù)量的變化趨勢(shì)進(jìn)行預(yù)測(cè),對(duì)企業(yè)運(yùn)營(yíng)管理來(lái)說顯得尤為重要。
預(yù)測(cè)方法一般可分為定性預(yù)測(cè)與定量預(yù)測(cè)。定性預(yù)測(cè)是利用經(jīng)驗(yàn)、直覺做出的猜測(cè),帶有較大的主觀性。定量預(yù)測(cè)是指運(yùn)用統(tǒng)計(jì)方法建立統(tǒng)計(jì)模型,對(duì)歷史統(tǒng)計(jì)數(shù)據(jù)進(jìn)行分析,從而對(duì)未來(lái)做出預(yù)測(cè)。過往對(duì)話務(wù)量的研究主要采取神經(jīng)網(wǎng)絡(luò)時(shí)間序列[1-3],本次研究提出在加權(quán)移動(dòng)平均預(yù)測(cè)法中,引入一種以單變量回歸計(jì)算權(quán)重的方法,以此作為加權(quán)的權(quán)重。
在客服中心管理體系中,一般采用時(shí)間序列或占比測(cè)算等方法預(yù)測(cè)話務(wù)量,兩者的首要考慮因素是用戶量及其發(fā)展趨勢(shì)。
占比測(cè)算方法的基本原理是預(yù)測(cè)年末用戶數(shù),以當(dāng)前用戶發(fā)展趨勢(shì)逆向推測(cè)各月的用戶數(shù),結(jié)合歷史用戶撥打率作為參考,據(jù)此估算各月話務(wù)總量。而預(yù)測(cè)“天”-“時(shí)段”等不同時(shí)間粒度時(shí),則是以歷史各天、各時(shí)段占全月話務(wù)總量的比例,并結(jié)合用戶撥打率的變化趨勢(shì)加以微調(diào),最終得出不同時(shí)間粒度下的話務(wù)量預(yù)測(cè)。
時(shí)間序列方法,一般僅考慮往前N期的話務(wù)量,并結(jié)合歷史同期等因素作為建立話務(wù)量預(yù)測(cè)模型的基礎(chǔ)。時(shí)間序列預(yù)測(cè)模型是預(yù)測(cè)話務(wù)量常用的方法,主要有時(shí)間序列回歸預(yù)測(cè)法、移動(dòng)平均預(yù)測(cè)法等?;貧w預(yù)測(cè)是將話務(wù)量的歷史數(shù)據(jù)看作時(shí)間序列,利用數(shù)理統(tǒng)計(jì)方法進(jìn)行回歸處理,擬合統(tǒng)計(jì)模型,預(yù)測(cè)未來(lái)發(fā)展趨勢(shì);移動(dòng)平均預(yù)測(cè)是利用加權(quán)平均數(shù)對(duì)話務(wù)量的時(shí)間序列進(jìn)行平滑修勻,增強(qiáng)近期作用,并適當(dāng)考慮遠(yuǎn)期影響。
基本思路:以歷史前7期的話務(wù)量作為移動(dòng)平均預(yù)測(cè)法的輸入,利用預(yù)測(cè)期與歷史各期的單變量回歸模型,輸出其回歸系數(shù),最終將7期的回歸系數(shù)歸一化作為加權(quán)移動(dòng)平均預(yù)測(cè)法的權(quán)重,加以考慮實(shí)際話務(wù)量變化中周末與工作日的周期性,最終作為話務(wù)量預(yù)測(cè)值。
2.1歷史前7期的選擇
歷史話務(wù)中明顯地表現(xiàn)出按星期為周期的話務(wù)量變化(見圖1):周六、日兩天的話務(wù)量明顯比一般工作日(周一~周五)的低,從中位數(shù)看僅約一半。
圖1 一周各天的話務(wù)量變化趨勢(shì)圖Fig.1Each day of a week traffic trend chart
因此在考慮歷史前7期的選擇時(shí),有意識(shí)地將前7期按照星期值從小到大排序(周日~周六分別用1~7表示)。得到的前7期對(duì)應(yīng)星期值的權(quán)重,最終作為加權(quán)移動(dòng)平均預(yù)測(cè)的權(quán)重,公式為:
其中:xi表示對(duì)應(yīng)星期值的話務(wù)量,i=1,2,…,7,分別表示周日~周六;ωi表示對(duì)應(yīng)星期值的權(quán)重,i=1,2,…,7,分別表示周日~周六。
2.2單變量回歸方法計(jì)算初始權(quán)重
確定加權(quán)移動(dòng)平均的輸入變量后,利用歷史話務(wù)量數(shù)據(jù)及單變量回歸方法計(jì)算回歸系數(shù)。
單變量回歸公式為:
其中:xi表示對(duì)應(yīng)星期值的話務(wù)量,i=1,2,…,7,分別表示周日~周六;表示對(duì)應(yīng)星期值歸一化后的權(quán)重,i=1,2,…,7,分別表示周日~周六。
利用普通最小二乘估計(jì)(Ordinary Least Square Estimation,OLSE),得到的參數(shù)估計(jì):
2.3初始權(quán)重歸一化并計(jì)算話務(wù)量預(yù)測(cè)值
為使初始的回歸系數(shù)作為權(quán)重輸入加權(quán)移動(dòng)平均方法,需要對(duì)權(quán)重進(jìn)行歸一化處理。
歸一化公式:
其中:ωi表示最終的權(quán)重值計(jì)算得到權(quán)重后,應(yīng)用公式(1)計(jì)算話務(wù)量預(yù)測(cè)值。
2.4周期調(diào)整
由于話務(wù)量存在明顯的星期性周期,因此在周末、工作日分別乘以調(diào)整因子,得到最終的話務(wù)量預(yù)測(cè)。
其中:mweekdauy表示歷史所有工作日的話務(wù)量中位數(shù);
mweekend表示歷史所有周末的話務(wù)量中位數(shù);
mall表示歷史所有話務(wù)量記錄的中位數(shù)。
以某電力企業(yè)的歷史話務(wù)量數(shù)據(jù)對(duì)上述方法進(jìn)行模型建設(shè),并以后續(xù)一個(gè)月的話務(wù)量進(jìn)行驗(yàn)證。其實(shí)驗(yàn)步驟如下:
1)選取2013年1~10月份,共10個(gè)月的每日話務(wù)量數(shù)據(jù)作為建模樣本數(shù)據(jù),選取2013年11月的數(shù)據(jù)作為驗(yàn)證數(shù)據(jù);
2)經(jīng)數(shù)據(jù)處理,形成以每日話務(wù)量數(shù)據(jù)為因變量,往前7天的數(shù)據(jù)作為自變量的數(shù)據(jù)寬表;去除1月1日-1月7日的數(shù)據(jù)(不足“前7天”數(shù)據(jù));
3)應(yīng)用單變量回歸模型,獲取回歸系數(shù);重復(fù)多次,獲取多次回歸系數(shù),取多次平均值作為輸出;
4)應(yīng)用歸一化算法,計(jì)算前7天的權(quán)重;
5)計(jì)算所有數(shù)據(jù)的中位數(shù)、周末的中位數(shù)、工作日的中位數(shù),計(jì)算星期調(diào)整因子;
6)應(yīng)用預(yù)測(cè)算法,計(jì)算2013年11月的話務(wù)量預(yù)測(cè)值。
結(jié)果如圖2、3所示。
圖2 2013年11月的話務(wù)量趨勢(shì)圖Fig.2In November 2013 traffic trend chart
圖3 2013年11月話務(wù)量預(yù)測(cè)誤差百分比示意圖誤差平均值:-3.5%Fig.3In November 2013,traffic prediction error percentage schematic diagram Error:the average-3.5%
從結(jié)果來(lái)看,算法較好地?cái)M合了星期周期的規(guī)律。然而在部分日期出現(xiàn)突降或突增時(shí)候,算法不能及時(shí)預(yù)測(cè)到變化,存在一定的局限性。
經(jīng)研究分析認(rèn)為,這是由于種種不可預(yù)見的原因,包括但不限于政策變化導(dǎo)致的話務(wù)量激增、突發(fā)天氣事件導(dǎo)致的故障停電等造成的數(shù)據(jù)急劇波動(dòng),這類數(shù)據(jù)對(duì)于模型的預(yù)測(cè)精度造成較大影響。在模型驗(yàn)證過程中,對(duì)數(shù)據(jù)的處理包括:
1)平滑因政策原因?qū)е碌脑拕?wù)量激增,使其在政策開始2)剔除因突發(fā)天氣事件等引起的故障停電事件的話務(wù)記錄。
實(shí)施階段造成的話務(wù)量激增平滑到實(shí)施一段時(shí)間后較穩(wěn)定的趨勢(shì);
本次研究提出單變量回歸權(quán)重計(jì)算法,并利用歸一化的思想計(jì)算出加權(quán)移動(dòng)平均預(yù)測(cè)法的權(quán)重,較好地處理了話務(wù)量在不同時(shí)間段(工作日與周末)的變化關(guān)系,計(jì)算速度快,易于理解。但研究中發(fā)現(xiàn),算法尚未考慮用戶行為習(xí)慣的變化、停電事件的發(fā)生、天氣和突發(fā)天氣事件、未辦結(jié)業(yè)務(wù)等對(duì)話務(wù)量造成的影響,導(dǎo)致算法對(duì)于話務(wù)量發(fā)生劇烈波動(dòng)時(shí)的靈敏度不足。后續(xù)的工作與研究中,將采用回歸預(yù)測(cè)、模糊預(yù)測(cè)、神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)等算法研究突變事件等對(duì)話務(wù)量的影響。
[1]杜守國(guó),姜鋒.大型電話咨詢中心來(lái)電量預(yù)測(cè)模型和分析[J].計(jì)算機(jī)應(yīng)用與軟件,2012(9):126-128.
[2]鄧波,李健,孫濤,等.基于神經(jīng)網(wǎng)絡(luò)的話務(wù)量預(yù)測(cè)[J].成都信息工程學(xué)院學(xué)報(bào),2008(9):518-521.
[3]董云耀,楊望書.基于時(shí)間序列趨勢(shì)模型的研究與應(yīng)用[J].杭州電子科技大學(xué)學(xué)報(bào),2008(1):64-68.
[4]劉童,孫吉貴,張永剛,等.用周期模型和近鄰算法預(yù)測(cè)話務(wù)量時(shí)間序列[J].吉林大學(xué)學(xué)報(bào):信息科技版,2007(3):239-245.
[5]楊帆,王志堅(jiān),婁淵勝.時(shí)間序列趨勢(shì)分析方法的一種改進(jìn)[J].計(jì)算機(jī)技術(shù)與發(fā)展,2006(5):82-84.
[6]彭宇,雷苗,郭嘉,等.基于先驗(yàn)知識(shí)的移動(dòng)通信話務(wù)量預(yù)測(cè)[J].電子學(xué)報(bào),2011(1):190-194.
The research of the application in teletraffic prediction using weighted moving average method based on univariate regression
YAN Yu-ping,WU Guang-cai,JIANG Jiang
(Guangdong Power Grid Limited Liability Company,Guangzhou 510620,China)
Teletraffic is an important part in operation management of the call center.Forecasting of the teletraffic is an effective way to improve service levels of the call center.In this paper,we propose to use weighted moving average for teletraffic forecasting.The coefficients are calculated by univariate regression on data from predictive and historical period,and then these coefficients are normalized for teletracffic forecasting as weights of weighted moving average method.Experiments on real world data show the effectiveness of our method.
teletraffic forecasting;univariate regression;weighted moving average;weighting method
TN99
A
1674-6236(2015)22-0044-03
2015-01-16稿件編號(hào):201501125
嚴(yán)宇平(1985—),男,廣東韶關(guān)人,碩士,工程師。研究方向:電力信息系統(tǒng)建設(shè)與管理、電力數(shù)據(jù)分析及應(yīng)用。