張靜+廖逸文
摘 要
隨著經(jīng)濟的不斷發(fā)展,人們與銀行打交道越來越頻繁,ATM機在其中起著重要的作用,但時常有故障的產(chǎn)生,給人們生活帶來不便。針對此問題,設計一套交易狀態(tài)異常檢驗方案,從而實現(xiàn)對ATM機系統(tǒng)的監(jiān)測和異常檢測。針對任務和客戶位置比較密集的區(qū)域,建立基于定位系統(tǒng)ATM機的預警通用程序,使得出現(xiàn)故障的ATM機能夠及時的維修,同時使維修費用價格盡可能地合理化。
【關鍵詞】ATM機 多元回歸模型 聚類算法 打包 預警模型
1 引言
隨著金融電子化的發(fā)展,ATM機數(shù)量在生活中不斷增多且得到廣泛使用。但同時也出現(xiàn)了許多利用ATM機盜取合法持卡人錢款的犯罪活動等其他交易異常的惡性事件。而通過對ATM 機的特征分析和異常檢測成為增強ATM機在生活中安全使用的可靠性和保護合法持卡人利益與銀行利益的重要依據(jù)。因此,如何在監(jiān)測中及時發(fā)現(xiàn)異常并準確報警而避免犯罪發(fā)生,保護合法持卡人利益與銀行利益防范各種針對ATM機異常行為是一個急需解決的問題。
經(jīng)查找文獻資料,李戰(zhàn)明等人[1]提出一種基于隱馬爾可夫模型(hidden markov model,HMM)的ATM機異常行為識別方法。采用Baum-Welch算法對正常行為訓練并建立隱馬爾可夫模型,通過模型輸出測試樣本序列的概率來識別異常行為。陳敏智等人[2]提出一種基于支持向量機(Supportvector machine,SVM)的針對ATM機的異常行為檢測方法,用SVM算法對有效跟蹤軌跡信息進行異常行為識別。在異常檢測在報警關聯(lián)分析部分,王娟等人[3]利用經(jīng)典統(tǒng)計模型即均值方差模型檢測報警流量強度的異常,進而把異常的時間段提供給報警關聯(lián),僅對異常時間段內(nèi)的報警進行關聯(lián)分析。
經(jīng)過資料分析,之前的研究主要放在了對ATM機使用者的異常行為信息的識別及報警方面。但對交易數(shù)據(jù)的信息異常此處做的研究少之甚少,太過片面,存在著漏洞。而本文利用Excel和SPSS輔助通過對某商業(yè)銀行 ATM 應用系統(tǒng)某分行的交易統(tǒng)計數(shù)據(jù)分析,基于對數(shù)據(jù)的統(tǒng)計信息構建ATM機系統(tǒng)的行為特征,實現(xiàn)對ATM機系統(tǒng)的監(jiān)測和發(fā)現(xiàn)異常,對基于異常情況和特征值等因素做了研究, 把ATM機系統(tǒng)的異常特征與異常檢測技術結合, 以提高ATM機交易系統(tǒng)的應用可用性,達到及時報警并減少虛警誤報的目的。
2 建立交易狀態(tài)異常檢驗線性回歸模型
2.1 模型的建立
首先,我們對某商業(yè)銀行在長春市六大城區(qū)和四個開發(fā)區(qū)的ATM機交易反饋情況作為實踐對象,展開調(diào)查采集數(shù)據(jù)。ATM機失敗率指單位時間內(nèi),交易失敗量占總交易量的比重,即機器處理故障發(fā)生的概率。為設計一套交易狀態(tài)異常檢驗方案,以平均失敗率為因變量,以傳輸信號強度,中心后臺處理異常率,ATM機交易時間,平均交易量和平均響應時間作為自變量,建立交易狀態(tài)異常檢驗線性回歸模型。
因為數(shù)據(jù)較為龐大,為此我們把每天的時刻分為三個組成部分,step1:時間為8:00---20:00,通過EXCEL均值處理,得到高峰時期交易狀態(tài)數(shù)據(jù);step2:時間為0:00--8:00和20:00---24:00,通過EXCEL均值處理,得到低谷時期交易狀態(tài)數(shù)據(jù);step3:抽樣交易狀態(tài)數(shù)據(jù)。在這三個階段中,以半個小時為單位,對抽樣數(shù)據(jù)中平均失敗率進行預測,影響因素有傳輸信號強度,中心后臺處理異常率,平均陡峭率(即這一時間點與上一時間點的差值),平均交易量,平均響應時間和響應時間方差。
應用多元線性回歸模型,利用軟件SPSS 22.0,對ATM機失敗率及其上述六個影響因子進行回歸分析,建立多元線性回歸方程:
Y=k1x1+k2x2+k3x3+k4x4+k5x5+k6x6+C
其中,Y表示平均時刻失敗率,x1表示平均時刻交易量,x2表示平均時刻響應時間,x3表示平均陡峭率,x4表示高峰響應時間方差,x5表示傳輸信號強度,x6表示中心后臺處理異常率。
2.2 模型求解與結果分析
建立警示器雛形:判斷當Y值>0.05即失敗率>0.05進行警報。為了完善此警報器,我們對整個數(shù)據(jù)進行了篩選,篩選出失敗率>0.2的數(shù)據(jù)進行線性回歸。利用SPSS軟件對高峰時期ATM機失敗率及其上述六個影響因子進行回歸分析,得到回歸方程:
Y=0.355x1-0.065x2-0.326x3-0.031x4-0.43x5-0.516x6+0.046
利用SPSS軟件對低谷時期ATM機失敗率及其上述六個影響因子進行回歸分析,得到回歸方程:
Y=0.141x1+0.481x2-0.001x3+0.220x4-0.37x5-0.433x6+0.037
給出五組交易狀態(tài)模擬值,將五組數(shù)據(jù)代入上述方程獲得如表1。通過表可以看出,該模型的模擬值與實際值的相對誤差在5%以內(nèi),通過圖表分析,基本符合實際數(shù)值,殘差較小,說明該模型可靠性好。
3 建立基于定位ATM機系統(tǒng)的預警通用程序
為使警報器能切身實際的便利人們的生活,提高ATM機的業(yè)務效率,我們擬做一個通用程序。該通用程序的功能如下:定位附近1KM內(nèi)所有ATM機位置,業(yè)務成功率較好的以紅色顯示,業(yè)務成功率較差的進行隱藏,并把相關數(shù)據(jù)發(fā)送給該銀行,銀行接收到數(shù)據(jù)進行檢查處理。若是銀行內(nèi)部通信問題,便等待通信恢復;若是ATM機的故障時,便派去維修人員進行維修處理,恢復后依然顯示在通用程序的定位上。
抽樣獲取每個ATM機數(shù)據(jù):交易成功率,經(jīng)度坐標,緯度坐標,響應時間,與之相對應的維修人員經(jīng)度,緯度,維修人員的業(yè)務能力,信用度。當ATM機出現(xiàn)故障時,及時維修的效率也影響著銀行業(yè)的業(yè)務質(zhì)量,所以維修人員相關問題也起著至關重要的。但維修人員維修ATM機產(chǎn)生的費用,也可能存在問題。對此我們對該問題研究。為使維修費用價格盡可能的合理,提出了如下幾個問題:endprint
(1)在已結束項目任務數(shù)據(jù)基礎上,建立合理的指標,并分析ATM機和維修員定價“供求匹配”程度。
(2)針對多任務多維修員爭相選擇的問題,單獨選取任務和用戶位置比較密集的區(qū)域,修訂問題一的定價模型,并評價該方案的實施效果。
Step 1:通過智能交互地圖和聚類算法,得到綠園區(qū)、朝陽區(qū)、寬城區(qū)、二道區(qū)、南關區(qū)和開發(fā)區(qū)六個區(qū)域的ATM機中心位置。
Step 2:在某個區(qū)域內(nèi),進行合理的打包過程,使得出現(xiàn)故障的ATM機能夠及時的維修,同時使維修費用價格盡可能的合理,找到距離故障的ATM機最近的且報價合理的維修人員。此模型的算法思想如下:
(1)輸入:A數(shù)組存放的故障ATM機位置坐標(Aio,Ai1);
(2)對A數(shù)組存放的位置坐標進行遍歷,for循環(huán)如下:
{int i=0;i {int j=i+1;j (3)為避免數(shù)據(jù)重復性,用數(shù)組B對A數(shù)組同步。若B(i)=i,代表該數(shù)據(jù)使用過,break; (4)循環(huán)條件:(Ai0-Aj0)2+(Ai1-Aj1)2≤閾值,閾值設定為0.003; (5)每個任務包中的任務量決定維修定價的權重,權重值=(11-n)/10; (6)輸出:數(shù)組接受打包的三個任務編號,并將編號存到數(shù)組中; 實驗部分JAVA代碼及結果(如圖1所示)。 Step 3:通過MATLAB編程得到距離與任務定價的規(guī)律,其中,x表示需要維修的ATM機任務位置與維修員的距離,Y表示維修定價。我們對所有任務數(shù)據(jù)進行3次擬合,得到六個區(qū)域的擬合方程為: 綠園區(qū):Y=0.0044x^3-0.0209x^2-0.6148x -0.0335 朝陽區(qū):Y=0.0513x^3-0.3520x^2+0.3991x +0.2474 寬城區(qū):Y=0.1250x^3-0.0364x^2-0.1397x -0.0967 二道區(qū):Y=-0.0652x^3-0.2281x^2+0.2991x +0.1598 南關區(qū):Y=0.2412x^3-0.0506x^2-0.7349x +0.3015 開發(fā)區(qū):Y=0.0428x^3-0.0674 x^2+0.5 953x -0.0841 4 預警通用模型檢驗 我們應用JAVA軟件,分別計算六區(qū)域定價與所求得的定價容錯閾值內(nèi)的正確率,當每個區(qū)域的閾值正確率高于70%后,則認為任務定價方案較合理,算法思想: (1)輸入:期望值、最小距離、維修定價、擬合維修定價; (2)循環(huán)條件:abs(擬合維修定價-維修定價)≤ 3; (3)輸出:若滿足循環(huán)條件,輸出結果為1;若不滿足循環(huán)條件,輸出結果為0; 本文設置維修定價的容錯率(閾值)為3。檢驗容錯率的部分Java代碼如圖2所示。 統(tǒng)計結果為:綠園區(qū)、朝陽區(qū)、寬城區(qū)、二道區(qū)、南關區(qū)和開發(fā)區(qū)六個區(qū)域的維修定價容錯率的結果比對模型正確的概率值分別為79.31%、85.67%、90.03%、86.45%、75.48%和89.27%。 5 總結和評價 本文首先建立了交易狀態(tài)異常檢驗線性回歸模型,設計一套交易狀態(tài)異常檢驗方案,通過SPSS編程研究ATM機失敗率和ATM機交易時間,平均交易量,響應時間等因素的規(guī)律。針對任務和客戶位置比較密集的區(qū)域,建立基于定位系統(tǒng)ATM機的預警通用程序,使得出現(xiàn)故障的ATM機能夠及時的維修,同時使維修費用價格盡可能地合理化。對區(qū)域進行合理的打包過程,找到距離故障的ATM機最近的且報價合理的維修人員,通過MATLAB編程分析發(fā)布位置與維修定價的關系。 參考文獻 [1]李戰(zhàn)明,宋丙菊.基于隱馬爾可夫模型的ATM機用戶異常行為識別[J].蘭州理工大學學報,2012(05):76-81. [2]陳敏智,湯一平.基于支持向量機的針對ATM機的異常行為識別[J].浙江工業(yè)大學學報,2010(05):546-551. [3]王娟,秦志光,葉李,靳京.異常檢測在報警關聯(lián)分析中的應用[J].解放軍理工大學學報(自然科學版),2009(03):278-280. [4]張超群,孟海東.數(shù)據(jù)挖掘中聚類分析算法及應用研究[J].山東工業(yè)技術,2017(11):159. 作者簡介 張靜(1990-),女,山東省濱州市人。碩士學位。吉林建筑大學城建學院助教。主要研究方向為計算數(shù)學。 廖逸文(1997-),男,浙江省南京市人。吉林建筑大學城建學院2015級本科學生。主要研究方向為應用軟件開發(fā)。 作者單位 吉林建筑大學城建學院 吉林省長春市 130111