周慧珺,龍濤,陳景航
(1 中山火炬職業(yè)技術(shù)學(xué)院, 中山 528436;2 中國(guó)移動(dòng)通信集團(tuán)廣東有限公司中山分公司,中山 528400)
隨著互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等技術(shù)的發(fā)展,越來越多的軟件利用TD-LTE等技術(shù)接入網(wǎng)絡(luò),采用Android手機(jī)、iPhone手機(jī)、平板電腦等訪問移動(dòng)設(shè)備軟件,實(shí)現(xiàn)4G移動(dòng)數(shù)據(jù)通信和語音通信,進(jìn)一步實(shí)現(xiàn)了人類生活的信息化、智能化和便捷化。TD-LTE網(wǎng)絡(luò)覆蓋面積非常大,覆蓋環(huán)境涉及崇山峻嶺、丘陵溝壑、高樓大廈等,較多的障礙物非常容易遮擋信號(hào),另外雷電、風(fēng)雨、冰雪和斷電等事故多發(fā),也容易造成基站無法工作,信號(hào)傳輸中斷,引起移動(dòng)客戶的投訴。
目前,中國(guó)移動(dòng)客戶數(shù)以億計(jì),因此產(chǎn)生的投訴量非常大,每一條投訴信息都需要客服人員進(jìn)行處理,如果不對(duì)投訴信息進(jìn)行分類,投訴處理進(jìn)度就會(huì)非常慢,無法及時(shí)回復(fù)客戶,造成客戶轉(zhuǎn)網(wǎng)或離網(wǎng),不利于占有市場(chǎng)和提升企業(yè)利潤(rùn)[1]。因此,本文基于筆者多年的工作實(shí)踐,提出采用數(shù)據(jù)挖掘算法針對(duì)海量投訴數(shù)據(jù)進(jìn)行分類,將投訴信息自動(dòng)化地歸納到每一個(gè)類別中,實(shí)現(xiàn)對(duì)投訴信息的分類處理,進(jìn)一步改進(jìn)客戶服務(wù)水平。
目前,移動(dòng)客戶投訴頻發(fā),投訴條數(shù)以千萬計(jì),但是處理投訴的客服人員少,從雜亂無章的海量投訴信息中隨機(jī)地進(jìn)行人工分類速度慢,因此對(duì)投訴信息進(jìn)行分類,將其劃分為網(wǎng)絡(luò)類、業(yè)務(wù)類等分配到每一個(gè)客服組中,可以迅速地獲取投訴處理口徑,提高處理速度[2]。目前,移動(dòng)客戶投訴數(shù)據(jù)分類慢,客戶信息處理時(shí)效性較低,客戶服務(wù)水平低下,反饋速度慢[3]。具體描述如下:
(1)客戶投訴數(shù)據(jù)分類慢。移動(dòng)通信客戶的投訴種類非常多,這些投訴信息涉及流量業(yè)務(wù)、語音業(yè)務(wù)、數(shù)據(jù)業(yè)務(wù)、基礎(chǔ)業(yè)務(wù)、終端業(yè)務(wù)、集團(tuán)業(yè)務(wù)、家庭業(yè)務(wù)、國(guó)際/港澳臺(tái)業(yè)務(wù)、信息安全等,但是對(duì)這些業(yè)務(wù)進(jìn)行人工對(duì)比分析的速度非常慢,無法從海量數(shù)據(jù)中實(shí)時(shí)地將投訴信息進(jìn)行分類[4]。
(2)客戶信息處理時(shí)效性較低。處理客戶投訴時(shí),由于不同的業(yè)務(wù)描述關(guān)鍵詞不同,也有可能同樣的投訴信息描述的關(guān)鍵詞不同,因此容易造成信息處理混亂,因此人工匹配關(guān)鍵詞很慢,客戶投訴信息處理的時(shí)效性非常低,另外也非常容易產(chǎn)生反饋錯(cuò)誤[5]。
(3)沒有實(shí)現(xiàn)簡(jiǎn)單問題自動(dòng)回復(fù)。由于投訴數(shù)據(jù)全靠人工、半人工進(jìn)行比對(duì),所以許多數(shù)據(jù)分析需要人工映射,沒有實(shí)現(xiàn)簡(jiǎn)單的投訴問題自動(dòng)化回復(fù)功能,因此大大地增加了客服人員的工作量,大大地降低了投訴處理水平,降低了客戶的感知[6]。
因此,為了解決客戶投訴處理速度慢、服務(wù)水平低、解決投訴不準(zhǔn)確的問題,本文引入K均值算法,該算法可以將客戶投訴劃分為不同類型,分發(fā)給每一個(gè)處理人員。
為了能夠更加準(zhǔn)確的發(fā)現(xiàn)移動(dòng)客戶投訴數(shù)據(jù)信息,本文引入了基于K均值的大數(shù)據(jù)挖掘算法,該算法假設(shè)移動(dòng)客戶投訴數(shù)據(jù)集合可以使用X={x1,x2,…xn}進(jìn)行描述,這些數(shù)據(jù)集中包含了K條投訴記錄,其中mi可以描述第i個(gè)簇的中心,i=1,2,…k。另外,也可以使用uj(xi)描述使用K均值算法挖掘移動(dòng)客戶投訴記錄中的而相關(guān)信息,比如第xi個(gè)樣本對(duì)第j類的隸屬度,這樣引入模糊數(shù)學(xué)的K均值算法目標(biāo)函數(shù)可以使用公式(1)描述。
其中,常數(shù)b是一個(gè)模糊度控制因子,其可以根據(jù)實(shí)際需求調(diào)節(jié)模糊度。算法執(zhí)行過程中可以針對(duì)目標(biāo)函數(shù)求導(dǎo),獲取最優(yōu)解,具體的最優(yōu)解如公式(2)和公式(3)所示。
在程序?qū)崿F(xiàn)過程中,基于模糊數(shù)學(xué)的K均值聚類算法可以使用以下偽代碼描述。
算法輸入?yún)?shù)包括四個(gè),分別是移動(dòng)客戶投訴記錄數(shù)據(jù)、包含N條投訴記錄、用戶期望得到的K個(gè)簇、模糊度控制因子b。
算法輸出:用戶期望得到的K個(gè)簇。
算法步驟:
(1)針對(duì)N條投訴記錄進(jìn)行初始化,將其隨機(jī)的劃分到K個(gè)簇中,并且可以指定每一個(gè)簇的中心為mi。
(2)使用公式(3)計(jì)算每一個(gè)投訴記錄的隸屬度,這樣就可以得到投訴記錄的隸屬概率。
(3)然后針對(duì)步驟(2)處理的結(jié)果進(jìn)行排序,選擇最大隸屬度值的數(shù)據(jù)劃分到一個(gè)簇,使用公式(2)重新計(jì)算K個(gè)簇的中心值mi。
(4)然后重復(fù)性操作步驟(2)和步驟(3),遍歷移動(dòng)客戶投訴記錄數(shù)據(jù)集中的每一個(gè)數(shù)據(jù)對(duì)象,直到隸屬度不再發(fā)生任何變化時(shí),算法終止。
為了更好地驗(yàn)證移動(dòng)客戶投訴數(shù)據(jù)處理成效,本文采集了廣東移動(dòng)2017年6月和7月的投訴數(shù)據(jù),預(yù)處理之后每個(gè)月選擇183萬條處理工單,詳細(xì)數(shù)據(jù)如表1所示。
實(shí)驗(yàn)設(shè)計(jì):2017年6月投訴工單量采用傳統(tǒng)方法進(jìn)行分類,7月份采用K均值進(jìn)行分類。7月份60萬條流量業(yè)務(wù)的處理時(shí)間是0.4 s,6月份耗費(fèi)1.3 s,數(shù)據(jù)處理速度提高了70%;7月份183萬條工單的平均處理時(shí)間為0.34 s,6月份平均處理時(shí)間為1.16 s,因此利用數(shù)據(jù)挖掘方法可以提高處理速度,縮短處理時(shí)效,分類時(shí)間如圖1所示。
K均值算法不僅可以提高移動(dòng)客戶投訴數(shù)據(jù)處理時(shí)效,還可以更加準(zhǔn)確地對(duì)其進(jìn)行分類。為了驗(yàn)證本文數(shù)據(jù)處理的準(zhǔn)確度,可以對(duì)7月份數(shù)據(jù)進(jìn)行分類,采用的對(duì)比方法包括不使用K均值方法和使用K均值方法兩類,詳細(xì)數(shù)據(jù)描述如表2所示。
通過對(duì)實(shí)驗(yàn)進(jìn)行分析,移動(dòng)客戶投訴處理采用K均值算法之后,投訴處理具有很多優(yōu)勢(shì),這些優(yōu)勢(shì)包括以下幾個(gè)方面。
表1 廣東移動(dòng)客戶投訴工單量
表2 兩種算法的實(shí)驗(yàn)結(jié)果精確度對(duì)比
圖1 投訴工單分類處理時(shí)間(s)
(1)大幅度縮短投訴數(shù)據(jù)處理時(shí)間。K均值是一種數(shù)據(jù)分類算法,其可以對(duì)海量的投訴工單數(shù)據(jù)按照既定的模式進(jìn)行分類,將紛亂、無章的數(shù)據(jù)劃分到一個(gè)個(gè)簇中,在這個(gè)過程中全部進(jìn)行自動(dòng)化處理,不需要人工進(jìn)行任何操作,也不需要輸入任何先驗(yàn)數(shù)據(jù),因此數(shù)據(jù)處理時(shí)間就會(huì)大幅度縮短。
(2)進(jìn)一步提升投訴數(shù)據(jù)處理準(zhǔn)確度,方便客服人員反饋處理結(jié)果??蛻敉对V的內(nèi)容非常多,這些內(nèi)容包括流量扣費(fèi)不合理、機(jī)卡分離不返費(fèi)、信息泄露、家庭賬戶扣費(fèi)不正常等,這些投訴既包括大眾市場(chǎng)業(yè)務(wù),又包括集團(tuán)市場(chǎng)業(yè)務(wù),投訴的內(nèi)容有可能涉及多個(gè)類別,既包括流量又包括語音等,采用K均值算法之后,數(shù)據(jù)處理的分析程度比較全面,可以根據(jù)不同類別的歸屬將其歸到某一類,然后由這一類客服人員進(jìn)行處理,可以更快向客戶反饋投訴結(jié)果。
隨著“互聯(lián)網(wǎng)+”時(shí)代的到來,移動(dòng)4G通信也逐漸向5G時(shí)代邁進(jìn),廣東移動(dòng)服務(wù)的客戶也越來越多。隨著用戶文化水平的提升,越來越多的客戶開始重視自身權(quán)益,一旦出現(xiàn)信號(hào)不好、扣費(fèi)不合理、流量用得快等情況,移動(dòng)客戶就會(huì)發(fā)出投訴信息。因此,處理數(shù)以億計(jì)的客戶投訴工單需要耗費(fèi)大量的人力、物力和財(cái)力,因此移動(dòng)公司一直在致力于提升客戶服務(wù)水平,引入K均值等更加先進(jìn)的數(shù)據(jù)處理技術(shù),及時(shí)、準(zhǔn)確地將投訴工單進(jìn)行分類,然后將處理結(jié)果反饋給客戶。
[1] 李睿穎, 柳炳祥, 萬義成. 一種基于K-Means算法的移動(dòng)客戶聚類分析方法[J]. 數(shù)字技術(shù)與應(yīng)用, 2016(8):157-158.
[2] 劉璐璐, 惠曾強(qiáng). 一種基于K-均值聚類算法的站點(diǎn)結(jié)構(gòu)優(yōu)化研究[J]. 中國(guó)科技信息, 2016(20):68-69.
[3] 穆榮斌, 仲梁維. 基于K-均值算法的數(shù)據(jù)挖掘技術(shù)研究及應(yīng)用[J]. 軟件導(dǎo)刊, 2017,16(4):185-187.
[4] 饒喆, 唐雙喜, 劉國(guó)平. 基于蟻群粒子群混合算法的K均值聚類優(yōu)化算法研究[J]. 數(shù)字技術(shù)與應(yīng)用, 2015(4):122-123.
[5] 李鶯. 運(yùn)營(yíng)商投訴行為的大數(shù)據(jù)分析及應(yīng)用[J]. 通信企業(yè)管理, 2016(10):67-69.
[6] 岳丹陽. 移動(dòng)通信客戶投訴的智能診斷方法研究[J]. 中國(guó)新通信, 2016(17):1-3.