李 超, 郭進利
(上海理工大學管理學院,上海 200093)
人每天要做很多事情,包括收發(fā)電子郵件、前往銀行處理金融事務等.除了明顯的每日或季節(jié)性周期以外,找到人類動力學的規(guī)律似乎是困難的.在過去的100年中,對人類行為的研究一直是社會學、心理學、經(jīng)濟學等學科共同關(guān)注的問題[1],但人類自身的復雜性和多樣性,對一切科學的嘗試來說都是巨大的挑戰(zhàn).事實上,過去學科的絕大多數(shù)命題和結(jié)論都是定性描述[2].早前的研究中,由于數(shù)據(jù)量比較小,且人類行為具有很多隨機性,因此均假設(shè)人類行為的發(fā)生是隨機和穩(wěn)態(tài)的,即可以看作一個泊松過程.此模型中,對于某給定的個體,連續(xù)兩次行為之間的間隔時間分布是一個指數(shù)分布[3].Barabási等從記錄人類活動歷史的數(shù)據(jù)庫中挖掘出人類行為的統(tǒng)計規(guī)律,發(fā)現(xiàn)人類行為所呈現(xiàn)出的規(guī)律并不與泊松過程一致:很長時間內(nèi)可能了無一事,而這些長長的空白與空白之間則被陣發(fā)的密集活動所填充[4],呈現(xiàn)胖尾分布,且冪指數(shù)大多分布在1~3之間.文獻[5]給出評論時間間隔分布的實證研究,發(fā)現(xiàn)人們對于某個話題的興趣逐漸消失,評論的時間間隔服從冪律分布,提出了一個興趣逐漸消失的人類行為動力學模型.文獻[6]對錢學森的郵件通訊記錄進行了統(tǒng)計,統(tǒng)計結(jié)果表明其郵件回復時間間隔分布和寫信時間間隔分布均具有冪律的胖尾規(guī)律,但已經(jīng)超出了普適類的范圍.文獻[7]從群體和個人兩個角度,分析借閱過程中圖書的借閱時間和用戶連續(xù)兩次借閱或還回圖書的時間間隔等統(tǒng)計特征,探尋群體行為與個體行為的關(guān)系.
訪問銀行辦理業(yè)務,是人的行為之一.近來,銀行客戶排隊問題越來越受到各方的關(guān)注,國家監(jiān)管部門和各家銀行紛紛出臺各種措施來緩解排隊等候現(xiàn)象.然而,國內(nèi)市場研究公司CTR于2007年進行的調(diào)查表明,排隊問題在大多數(shù)銀行仍普遍存在,國有四大行平均等候41min,而在5家股份制銀行平均等候14min.為分析銀行排隊問題,文獻[8]用蒙特卡洛模擬對銀行柜臺多服務器單隊列(M/M/C)的服務狀況進行了動態(tài)模擬,提出在不同的服務強度水平下,當?shù)竭_速率不同時的服務對策,為改進商業(yè)銀行客戶服務水平提供參考.文獻[9]利用銀行叫號機實測隊長系列排隊數(shù)據(jù),運用排隊論所給出的改善銀行排隊狀況的窗口設(shè)置設(shè)想與例證,可以作為銀行排隊管理改善的依據(jù)和一種簡易可行的方法.目前大部分研究都用到了一個重要假設(shè):銀行客戶到訪是一個泊松過程.現(xiàn)有的研究還沒有對銀行客戶到訪間隔時間分布進行分析,本文根據(jù)某銀行網(wǎng)點客戶到達時間的真實記錄,深入挖掘銀行客戶到訪的時間間隔分布、細分客戶到訪的時間間隔分布、單日所有客戶到訪的時間間隔分布的統(tǒng)計特征,發(fā)現(xiàn)銀行客戶到訪的時間間隔分布并非指數(shù)分布,而是滿足陣發(fā)性的冪律分布.
本文的發(fā)現(xiàn)有助于理解社會中人群到訪的行為特征,為建立針對冪律事件間隔分布的排隊理論奠定實證基礎(chǔ),具有重要的理論意義,同時為解決銀行排隊擁擠問題作出理論探索,具有一定的商業(yè)化潛力.由于社會中廣泛存在類似于銀行客戶到訪的顧客到達行為,結(jié)合原有針對社會系統(tǒng)的實證研究,這些統(tǒng)計結(jié)果暗示從復雜的人類行為中可以揭示普遍的規(guī)律,發(fā)現(xiàn)支配人類活動時間選擇的機制,并獲得控制和預測人類行為的能力.這必將具有重大的實用化潛力.
通過人工統(tǒng)計某月國內(nèi)某銀行網(wǎng)點大廳(營業(yè)時間為8:30~16:30,中午保留少量窗口,周末照常營業(yè))叫號機吐出的每張小票的數(shù)據(jù),以每個客戶的真實到達時間為研究對象.該數(shù)據(jù)庫中客戶到訪共10 403人次,客戶所辦業(yè)務可分成7類,分別用A(個人業(yè)務)、B(理財業(yè)務)、G(公司業(yè)務)、J(公司解現(xiàn))、W(外幣業(yè)務)、V(VIP客戶)、T(領(lǐng)取吞卡)作為代表.記錄每個客戶所得小票的打印時間,精確到秒,以此作為到達時間,跨度為某月1日到19日.各個客戶所辦業(yè)務的詳細資料如表1所示,比較大的數(shù)據(jù)量足夠反映真實的統(tǒng)計規(guī)律.為簡便起見,對冪律分布的判斷分析用一元線性回歸和最小二乘法得到擬合直線的斜率即冪指數(shù).
表1 19天中客戶到達時間記錄數(shù)據(jù)概況Tab.1 Records of customer arrival time in 19days
圖1顯示的是在19天的時間范圍內(nèi)每天各個時刻所有客戶的訪問量.由于一部分客戶會在銀行剛開門和馬上要關(guān)門時進入大廳,因此統(tǒng)計8:00~17:00每小時的客戶訪問量.所有客戶訪問銀行具有明顯的規(guī)律性,每天的訪問量曲線形狀大致相同呈“M”形狀,波峰和波谷出現(xiàn)在大致相同的時刻.其中,休息日的訪問量要明顯少于工作日.另外,銀行訪問還表現(xiàn)出明顯的波動性.統(tǒng)計發(fā)現(xiàn)客戶訪問量的幾個峰值出現(xiàn)在10:00~11:00、13:00~14:00兩個時間段.顯然,兩個時間段是個人及公司前往銀行辦理事務的高峰期,也是人類一天中活動的活躍期.訪問量的低谷出現(xiàn)在12:00~13:00的中午休息時間和16:00~17:00銀行即將停止營業(yè)這一個時間段.這樣的統(tǒng)計規(guī)律與客戶工作生活的時間規(guī)律很好吻合.
圖1 19天內(nèi)各個時刻的客戶訪問量Fig.1 Customer visits per hour in 19days
為消除銀行晚上不營業(yè)這一明顯事實對客戶到訪間隔時間的影響,對數(shù)據(jù)作如下處理:第二天第一個客戶的到訪間隔時間將減去16h(銀行從16:30到第二天8:30不營業(yè)).由于一部分客戶會在8:30之前進入大廳,若作差后的間隔時間小于0,則認為該客戶的到達間隔時間為1s,這樣多天的客戶到訪可以看成是一個連續(xù)的過程.經(jīng)過對比,后文出現(xiàn)的概率分布圖的趨勢在數(shù)據(jù)處理前后都無明顯改變.圖2顯示的是數(shù)據(jù)處理后,19天內(nèi)所有客戶到訪間隔時間圖,圖中τ表示間隔時間.注意那些最長的像長釘一樣扎在水平軸上的豎線,它們對應于那些很長的到訪間隔時間(可以長達近2h).這些最長的豎線是以周為周期出現(xiàn)的,并且都是出現(xiàn)在休息日的中午時間段,表明休息日中午幾乎沒有客戶前往銀行辦理業(yè)務.而對比工作日中午銀行仍有客戶連續(xù)到訪,但到訪量相比每天的高峰時段要明顯減少.進一步觀察發(fā)現(xiàn),在這些長釘一般豎線之間,都有幾段很小的區(qū)域幾乎貼著橫軸,且以天為周期出現(xiàn),這是每天早晨銀行開門時客戶集中點擊叫號機打印小票的結(jié)果,并且只維持較短的時間.由此可以判斷,銀行客戶到訪會在很長時間都沒有發(fā)生,也會有在短時間內(nèi)陣發(fā).
圖2 19天內(nèi)所有客戶到訪間隔時間Fig.2 Inter-arrival time of total customers in 19days
銀行業(yè)務是現(xiàn)代社會易于獲取的服務,每個人都會隔一段時間訪問銀行.不同的人,訪問銀行的相隔時間會有不同的差異,有的人一天會訪問好多次,有的人很長一段時間內(nèi)都不會親自訪問銀行.根據(jù)上文分析,一個網(wǎng)點接受該地區(qū)客戶訪問單位時間內(nèi)的客戶數(shù)量會有很大的漲落,類似情況也發(fā)生在客戶到訪的間隔時間上,有的時段一個客戶也沒有,而有的時段幾秒鐘就有一個客戶到訪.這些現(xiàn)象再次說明,人類的行為并不能被認為是一種泊松過程,而是大部分不同客戶之間都有著某種共同的特性,經(jīng)過研究,發(fā)現(xiàn)這種特性與泊松分布有很大的差異.本文將一段時間內(nèi)所有客戶或同一類型客戶看成一個整體,考察客戶到訪銀行的間隔時間統(tǒng)計特征,從而獲得該網(wǎng)點客戶訪問銀行的總體行為特征.
統(tǒng)計結(jié)果顯示,銀行客戶到訪的間隔時間分布滿足P(τ)∝τ-α(α為冪指數(shù)),冪指數(shù)約為3,如圖3所示.客戶訪問量的高峰一般出現(xiàn)在10:00~11:00、13:00~14:00點之間,訪問量的低峰出現(xiàn)在12:00~13:00、16:00~17:00之間,這主要和該網(wǎng)點員工的工作時間與休息時間有關(guān).大部分的客戶到訪間隔時間較短,像周末中午時間段出現(xiàn)很長的到訪間隔時間是很少的,正是時間間隔的不均勻性造成了冪律分布的形成.
圖3 雙對數(shù)坐標下所有銀行客戶到訪的間隔時間分布Fig.3 Inter-arrival distribution of bank customers visiting in 19days under double logarithmic coordinates
圖4是某個休息日和某個工作日客戶到訪的間隔時間分布.統(tǒng)計結(jié)果顯示,客戶到訪的間隔時間分布也符合冪律分布,而冪指數(shù)分別約為2.45和2.5.該休息日的客戶訪問量為417人次,其中個人業(yè)務392人次,公司業(yè)務3人次,其它22人次;該工作日的客戶訪問量為620人次,其中個人業(yè)務364人次,公司業(yè)務203人次,其它53人次.而休息日客戶到訪平均間隔時間為69s,工作日客戶到訪平均間隔時間為47s.休息日最大到訪間隔時間為6 060s,工作日最大到訪間隔時間為597s,兩天最小到訪間隔時間皆為1s.客戶訪問量、客戶結(jié)構(gòu)、客戶到訪平均間隔時間等都有較大差異,而冪指數(shù)十分相近.接著計算數(shù)據(jù)庫中每一天的客戶到訪間隔時間分布,發(fā)現(xiàn)都近似服從冪律分布,而冪指數(shù)范圍為2.3~2.5之間.休息日與工作日的冪指數(shù)并沒有較大差異,這表明銀行客戶到訪有著共同的特性,而且對于休息日、工作日并無差別,形成這種特性的機制還尚不清楚.
圖4 某個休息日和某個工作日客戶到訪的間隔時間分布Fig.4 Inter-arrival distributions of bank customers visiting on an off day and on a working day
銀行個人業(yè)務和公司業(yè)務具有很大的差別,那么個人業(yè)務客戶和公司業(yè)務客戶前往銀行辦理業(yè)務的行為是否還會保持著某種特有的性質(zhì),接下來本文分析細分客戶到訪行為的分布情況,見圖5.由于數(shù)據(jù)量的關(guān)系無法對其它業(yè)務進行合理的分析,待今后能得到更多相關(guān)數(shù)據(jù)時再次討論.細分客戶到訪的間隔時間分布是一種特定客戶的分析(用戶都是某銀行網(wǎng)點的客戶),每一類型的客戶訪問銀行都受到很多因素的影響,例如工作時間、休息時間等.所以,可能和其他類型客戶訪問銀行的情況在冪指數(shù)上存在一定的偏差,如退休職工辦理個人業(yè)務時對于工作日或者休息日的選擇并沒有差異,而公司業(yè)務一般是在工作日前往銀行辦理,這種分析反映了社會某一個層面的人類活動特性.
圖5 19天內(nèi)銀行細分客戶到訪的間隔時間分布Fig.5 Inter-arrival distributions of customers visiting for personal banking business and for corporate banking business in 19days
統(tǒng)計結(jié)果顯示,個人業(yè)務客戶到訪的間隔時間分布服從冪律分布,冪指數(shù)約為3.1.公司業(yè)務客戶到訪的間隔時間分布服從冪律分布,冪指數(shù)約為2.9.這種差異可以從個人業(yè)務和公司業(yè)務的特點上解釋.個人業(yè)務在總的業(yè)務量上占了約70%,銀行開門后密集訪問的客戶群和銀行當日歇業(yè)前最后一個客戶都是個人業(yè)務客戶,正是個人業(yè)務客戶到訪時間間隔的不均勻性使間隔時間分布出現(xiàn)了冪律.圖6給出的個人業(yè)務客戶到訪間隔時間圖,可以發(fā)現(xiàn)個人業(yè)務客戶的間隔時間圖與所有客戶的間隔時間圖的形狀十分相似.那些長釘一般的豎線是由于個人業(yè)務客戶在周末中午到訪間隔時間較大造成的,這些豎線與圖2中長釘般豎線的長度及出現(xiàn)的位置基本一致.而公司員工一般集中在工作日前往銀行辦理業(yè)務,很少會在休息日處理,除非有緊急事務,因此每逢周末都會出現(xiàn)相比個人業(yè)務客戶更長的間隔時間(見圖7).正是由于個人業(yè)務客戶和公司業(yè)務客戶到訪時間間隔的極不均勻性形成了冪律.
圖6 19天內(nèi)個人業(yè)務客戶到訪間隔時間Fig.6 Inter-arrival time of customers visiting for personal banking business in 19days
圖7 19天內(nèi)公司業(yè)務客戶到訪間隔時間Fig.7 Inter-arrival time of customers visiting for corporate banking business in 19days
本文主要討論銀行客戶的到訪行為模式和個人業(yè)務客戶、公司業(yè)務客戶到訪的間隔時間分布的統(tǒng)計特性.由分析結(jié)果可以得出銀行客戶到訪的間隔時間分布、單日銀行客戶到訪間隔時間分布、個人業(yè)務客戶到訪間隔時間分布、公司業(yè)務客戶到訪間隔分布都是滿足P(τ)∝τ-α(α在2到3之間)的冪律分布.因此,有理由認為銀行客戶到訪的時間間隔分布具有冪律特性.統(tǒng)計結(jié)果再次說明人類行為可能在很多個層面上都偏離泊松過程.這個發(fā)現(xiàn)為排隊理論的創(chuàng)新奠定了實證基礎(chǔ),具有一定的意義,同時也為解決銀行排隊擁擠問題奠定了理論基礎(chǔ).就排隊論視角而言,銀行排隊問題還牽涉客戶等待時間、服務時間、隊長等,后續(xù)工作將對這些問題進行研究.進而,將實證某高校財務事務排隊系統(tǒng)和研究統(tǒng)計的時間單位對排隊指標分布形狀的影響.
[1] 曹杰.行為科學[M].北京:科學技術(shù)文獻出版社,1987.
[2] 李楠楠,周濤,張寧.人類動力學基本概念與實證分析[J].復雜系統(tǒng)與復雜性科學,2008,5(2):15-24.
[3] Haight F A.Handbook of the Poisson distribution[M].New York:Wiley,1967.
[4] Barabási A L.The origin of bursts and heavy tails in human dynamics[J].Nature,2005,435(7039):207-211.
[5] 郭進利.博客評論的人類行為動力學實證研究和建模[J].計算機應用研究,2011,28(4):1422-1424.
[6] 李楠楠,張寧,周濤.人類通信模式中基于時間統(tǒng)計的實證研究[J].復雜系統(tǒng)與復雜性科學,2008,5(3):43-47.
[7] 樊超,郭進利.基于圖書借閱的人類行為標度律分析[J].圖書情報工作,2010,54(1):35-39.
[8] 顏薇娜.基于蒙特卡洛模擬的商業(yè)銀行排隊問題研究[J].技術(shù)經(jīng)濟與管理,2009(1):20-22.
[9] 楊米沙.銀行排隊系統(tǒng)數(shù)據(jù)分析及窗口設(shè)置優(yōu)化研究[J].武漢理工大學學報(信息與管理工程版),2008,30(4):20-22.