国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種基于K均值的移動(dòng)客戶投訴數(shù)據(jù)處理算法研究

2018-07-04 03:27:14周慧珺龍濤陳景航
關(guān)鍵詞:工單數(shù)據(jù)處理均值

周慧珺,龍濤,陳景航

(1 中山火炬職業(yè)技術(shù)學(xué)院, 中山 528436;2 中國(guó)移動(dòng)通信集團(tuán)廣東有限公司中山分公司,中山 528400)

1 引言

隨著互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等技術(shù)的發(fā)展,越來越多的軟件利用TD-LTE等技術(shù)接入網(wǎng)絡(luò),采用Android手機(jī)、iPhone手機(jī)、平板電腦等訪問移動(dòng)設(shè)備軟件,實(shí)現(xiàn)4G移動(dòng)數(shù)據(jù)通信和語音通信,進(jìn)一步實(shí)現(xiàn)了人類生活的信息化、智能化和便捷化。TD-LTE網(wǎng)絡(luò)覆蓋面積非常大,覆蓋環(huán)境涉及崇山峻嶺、丘陵溝壑、高樓大廈等,較多的障礙物非常容易遮擋信號(hào),另外雷電、風(fēng)雨、冰雪和斷電等事故多發(fā),也容易造成基站無法工作,信號(hào)傳輸中斷,引起移動(dòng)客戶的投訴。

目前,中國(guó)移動(dòng)客戶數(shù)以億計(jì),因此產(chǎn)生的投訴量非常大,每一條投訴信息都需要客服人員進(jìn)行處理,如果不對(duì)投訴信息進(jìn)行分類,投訴處理進(jìn)度就會(huì)非常慢,無法及時(shí)回復(fù)客戶,造成客戶轉(zhuǎn)網(wǎng)或離網(wǎng),不利于占有市場(chǎng)和提升企業(yè)利潤(rùn)[1]。因此,本文基于筆者多年的工作實(shí)踐,提出采用數(shù)據(jù)挖掘算法針對(duì)海量投訴數(shù)據(jù)進(jìn)行分類,將投訴信息自動(dòng)化地歸納到每一個(gè)類別中,實(shí)現(xiàn)對(duì)投訴信息的分類處理,進(jìn)一步改進(jìn)客戶服務(wù)水平。

2 移動(dòng)客戶投訴數(shù)據(jù)處理現(xiàn)狀及存在問題

目前,移動(dòng)客戶投訴頻發(fā),投訴條數(shù)以千萬計(jì),但是處理投訴的客服人員少,從雜亂無章的海量投訴信息中隨機(jī)地進(jìn)行人工分類速度慢,因此對(duì)投訴信息進(jìn)行分類,將其劃分為網(wǎng)絡(luò)類、業(yè)務(wù)類等分配到每一個(gè)客服組中,可以迅速地獲取投訴處理口徑,提高處理速度[2]。目前,移動(dòng)客戶投訴數(shù)據(jù)分類慢,客戶信息處理時(shí)效性較低,客戶服務(wù)水平低下,反饋速度慢[3]。具體描述如下:

(1)客戶投訴數(shù)據(jù)分類慢。移動(dòng)通信客戶的投訴種類非常多,這些投訴信息涉及流量業(yè)務(wù)、語音業(yè)務(wù)、數(shù)據(jù)業(yè)務(wù)、基礎(chǔ)業(yè)務(wù)、終端業(yè)務(wù)、集團(tuán)業(yè)務(wù)、家庭業(yè)務(wù)、國(guó)際/港澳臺(tái)業(yè)務(wù)、信息安全等,但是對(duì)這些業(yè)務(wù)進(jìn)行人工對(duì)比分析的速度非常慢,無法從海量數(shù)據(jù)中實(shí)時(shí)地將投訴信息進(jìn)行分類[4]。

(2)客戶信息處理時(shí)效性較低。處理客戶投訴時(shí),由于不同的業(yè)務(wù)描述關(guān)鍵詞不同,也有可能同樣的投訴信息描述的關(guān)鍵詞不同,因此容易造成信息處理混亂,因此人工匹配關(guān)鍵詞很慢,客戶投訴信息處理的時(shí)效性非常低,另外也非常容易產(chǎn)生反饋錯(cuò)誤[5]。

(3)沒有實(shí)現(xiàn)簡(jiǎn)單問題自動(dòng)回復(fù)。由于投訴數(shù)據(jù)全靠人工、半人工進(jìn)行比對(duì),所以許多數(shù)據(jù)分析需要人工映射,沒有實(shí)現(xiàn)簡(jiǎn)單的投訴問題自動(dòng)化回復(fù)功能,因此大大地增加了客服人員的工作量,大大地降低了投訴處理水平,降低了客戶的感知[6]。

因此,為了解決客戶投訴處理速度慢、服務(wù)水平低、解決投訴不準(zhǔn)確的問題,本文引入K均值算法,該算法可以將客戶投訴劃分為不同類型,分發(fā)給每一個(gè)處理人員。

3 基于K均值的移動(dòng)客戶投訴數(shù)據(jù)處理算法設(shè)計(jì)

為了能夠更加準(zhǔn)確的發(fā)現(xiàn)移動(dòng)客戶投訴數(shù)據(jù)信息,本文引入了基于K均值的大數(shù)據(jù)挖掘算法,該算法假設(shè)移動(dòng)客戶投訴數(shù)據(jù)集合可以使用X={x1,x2,…xn}進(jìn)行描述,這些數(shù)據(jù)集中包含了K條投訴記錄,其中mi可以描述第i個(gè)簇的中心,i=1,2,…k。另外,也可以使用uj(xi)描述使用K均值算法挖掘移動(dòng)客戶投訴記錄中的而相關(guān)信息,比如第xi個(gè)樣本對(duì)第j類的隸屬度,這樣引入模糊數(shù)學(xué)的K均值算法目標(biāo)函數(shù)可以使用公式(1)描述。

其中,常數(shù)b是一個(gè)模糊度控制因子,其可以根據(jù)實(shí)際需求調(diào)節(jié)模糊度。算法執(zhí)行過程中可以針對(duì)目標(biāo)函數(shù)求導(dǎo),獲取最優(yōu)解,具體的最優(yōu)解如公式(2)和公式(3)所示。

在程序?qū)崿F(xiàn)過程中,基于模糊數(shù)學(xué)的K均值聚類算法可以使用以下偽代碼描述。

算法輸入?yún)?shù)包括四個(gè),分別是移動(dòng)客戶投訴記錄數(shù)據(jù)、包含N條投訴記錄、用戶期望得到的K個(gè)簇、模糊度控制因子b。

算法輸出:用戶期望得到的K個(gè)簇。

算法步驟:

(1)針對(duì)N條投訴記錄進(jìn)行初始化,將其隨機(jī)的劃分到K個(gè)簇中,并且可以指定每一個(gè)簇的中心為mi。

(2)使用公式(3)計(jì)算每一個(gè)投訴記錄的隸屬度,這樣就可以得到投訴記錄的隸屬概率。

(3)然后針對(duì)步驟(2)處理的結(jié)果進(jìn)行排序,選擇最大隸屬度值的數(shù)據(jù)劃分到一個(gè)簇,使用公式(2)重新計(jì)算K個(gè)簇的中心值mi。

(4)然后重復(fù)性操作步驟(2)和步驟(3),遍歷移動(dòng)客戶投訴記錄數(shù)據(jù)集中的每一個(gè)數(shù)據(jù)對(duì)象,直到隸屬度不再發(fā)生任何變化時(shí),算法終止。

4 移動(dòng)客戶投訴處理改進(jìn)后的優(yōu)勢(shì)

為了更好地驗(yàn)證移動(dòng)客戶投訴數(shù)據(jù)處理成效,本文采集了廣東移動(dòng)2017年6月和7月的投訴數(shù)據(jù),預(yù)處理之后每個(gè)月選擇183萬條處理工單,詳細(xì)數(shù)據(jù)如表1所示。

實(shí)驗(yàn)設(shè)計(jì):2017年6月投訴工單量采用傳統(tǒng)方法進(jìn)行分類,7月份采用K均值進(jìn)行分類。7月份60萬條流量業(yè)務(wù)的處理時(shí)間是0.4 s,6月份耗費(fèi)1.3 s,數(shù)據(jù)處理速度提高了70%;7月份183萬條工單的平均處理時(shí)間為0.34 s,6月份平均處理時(shí)間為1.16 s,因此利用數(shù)據(jù)挖掘方法可以提高處理速度,縮短處理時(shí)效,分類時(shí)間如圖1所示。

K均值算法不僅可以提高移動(dòng)客戶投訴數(shù)據(jù)處理時(shí)效,還可以更加準(zhǔn)確地對(duì)其進(jìn)行分類。為了驗(yàn)證本文數(shù)據(jù)處理的準(zhǔn)確度,可以對(duì)7月份數(shù)據(jù)進(jìn)行分類,采用的對(duì)比方法包括不使用K均值方法和使用K均值方法兩類,詳細(xì)數(shù)據(jù)描述如表2所示。

通過對(duì)實(shí)驗(yàn)進(jìn)行分析,移動(dòng)客戶投訴處理采用K均值算法之后,投訴處理具有很多優(yōu)勢(shì),這些優(yōu)勢(shì)包括以下幾個(gè)方面。

表1 廣東移動(dòng)客戶投訴工單量

表2 兩種算法的實(shí)驗(yàn)結(jié)果精確度對(duì)比

圖1 投訴工單分類處理時(shí)間(s)

(1)大幅度縮短投訴數(shù)據(jù)處理時(shí)間。K均值是一種數(shù)據(jù)分類算法,其可以對(duì)海量的投訴工單數(shù)據(jù)按照既定的模式進(jìn)行分類,將紛亂、無章的數(shù)據(jù)劃分到一個(gè)個(gè)簇中,在這個(gè)過程中全部進(jìn)行自動(dòng)化處理,不需要人工進(jìn)行任何操作,也不需要輸入任何先驗(yàn)數(shù)據(jù),因此數(shù)據(jù)處理時(shí)間就會(huì)大幅度縮短。

(2)進(jìn)一步提升投訴數(shù)據(jù)處理準(zhǔn)確度,方便客服人員反饋處理結(jié)果??蛻敉对V的內(nèi)容非常多,這些內(nèi)容包括流量扣費(fèi)不合理、機(jī)卡分離不返費(fèi)、信息泄露、家庭賬戶扣費(fèi)不正常等,這些投訴既包括大眾市場(chǎng)業(yè)務(wù),又包括集團(tuán)市場(chǎng)業(yè)務(wù),投訴的內(nèi)容有可能涉及多個(gè)類別,既包括流量又包括語音等,采用K均值算法之后,數(shù)據(jù)處理的分析程度比較全面,可以根據(jù)不同類別的歸屬將其歸到某一類,然后由這一類客服人員進(jìn)行處理,可以更快向客戶反饋投訴結(jié)果。

5 結(jié)束語

隨著“互聯(lián)網(wǎng)+”時(shí)代的到來,移動(dòng)4G通信也逐漸向5G時(shí)代邁進(jìn),廣東移動(dòng)服務(wù)的客戶也越來越多。隨著用戶文化水平的提升,越來越多的客戶開始重視自身權(quán)益,一旦出現(xiàn)信號(hào)不好、扣費(fèi)不合理、流量用得快等情況,移動(dòng)客戶就會(huì)發(fā)出投訴信息。因此,處理數(shù)以億計(jì)的客戶投訴工單需要耗費(fèi)大量的人力、物力和財(cái)力,因此移動(dòng)公司一直在致力于提升客戶服務(wù)水平,引入K均值等更加先進(jìn)的數(shù)據(jù)處理技術(shù),及時(shí)、準(zhǔn)確地將投訴工單進(jìn)行分類,然后將處理結(jié)果反饋給客戶。

[1] 李睿穎, 柳炳祥, 萬義成. 一種基于K-Means算法的移動(dòng)客戶聚類分析方法[J]. 數(shù)字技術(shù)與應(yīng)用, 2016(8):157-158.

[2] 劉璐璐, 惠曾強(qiáng). 一種基于K-均值聚類算法的站點(diǎn)結(jié)構(gòu)優(yōu)化研究[J]. 中國(guó)科技信息, 2016(20):68-69.

[3] 穆榮斌, 仲梁維. 基于K-均值算法的數(shù)據(jù)挖掘技術(shù)研究及應(yīng)用[J]. 軟件導(dǎo)刊, 2017,16(4):185-187.

[4] 饒喆, 唐雙喜, 劉國(guó)平. 基于蟻群粒子群混合算法的K均值聚類優(yōu)化算法研究[J]. 數(shù)字技術(shù)與應(yīng)用, 2015(4):122-123.

[5] 李鶯. 運(yùn)營(yíng)商投訴行為的大數(shù)據(jù)分析及應(yīng)用[J]. 通信企業(yè)管理, 2016(10):67-69.

[6] 岳丹陽. 移動(dòng)通信客戶投訴的智能診斷方法研究[J]. 中國(guó)新通信, 2016(17):1-3.

猜你喜歡
工單數(shù)據(jù)處理均值
基于量化考核的基層班組管理系統(tǒng)的設(shè)計(jì)與應(yīng)用
認(rèn)知診斷缺失數(shù)據(jù)處理方法的比較:零替換、多重插補(bǔ)與極大似然估計(jì)法*
ILWT-EEMD數(shù)據(jù)處理的ELM滾動(dòng)軸承故障診斷
基于transformer的工單智能判責(zé)方法研究
基于HANA的工單備件采購(gòu)聯(lián)合報(bào)表的研究與實(shí)現(xiàn)
均值不等式失效時(shí)的解決方法
均值與方差在生活中的應(yīng)用
基于希爾伯特- 黃變換的去噪法在外測(cè)數(shù)據(jù)處理中的應(yīng)用
電力95598熱線全業(yè)務(wù)集中后的工單預(yù)警機(jī)制
關(guān)于均值有界變差函數(shù)的重要不等式
建德市| 南澳县| 板桥市| 耿马| 东源县| 开原市| 兰州市| 抚州市| 孙吴县| 江北区| 苗栗市| 汤原县| 巩义市| 达州市| 澄江县| 房山区| 吉首市| 策勒县| 寻甸| 台湾省| 陕西省| 名山县| 福鼎市| 河津市| 金川县| 陆河县| 合山市| 新疆| 龙里县| 旺苍县| 扎兰屯市| 普宁市| 辽阳县| 滕州市| 仲巴县| 安宁市| 鹤庆县| 玉环县| 长子县| 宣化县| 正蓝旗|