趙文豪 胡曄明 夏建軍
摘 要: 智能手機(jī)帶來了便利,也存在危害,手機(jī)成癮問題已經(jīng)引起社會的關(guān)注。文章提出一種針對手機(jī)成癮用戶的K-means輔助研究方法。將使用時(shí)間抽象出來,將手機(jī)使用時(shí)間與使用次數(shù)相結(jié)合進(jìn)行研究,將成癮用戶根據(jù)不同原因分成為四類。對每類用戶進(jìn)行不同方法研究,以便對其進(jìn)行針對性的幫助。
關(guān)鍵詞: 手機(jī)成癮; 聚類; K-means; 數(shù)據(jù)挖掘
中圖分類號:TP391 文獻(xiàn)標(biāo)志碼:A 文章編號:1006-8228(2018)07-17-04
Abstract: Smart phone has brought people the convenience but also the harm, the problem of addiction of smart phone has attracted the attention of the society. This paper proposes a research method of K-means clustering for the addiction users of smart phone. The use time of smart phone is abstracted, the use time and use number of smart phone are combined to study the addiction users, and the addiction users are classified to four categories according to the different reasons. Different type of users is studied with different method so as to help them in a targeted way.
Key words: addiction of smart phone; clustering; K-means; data mining
0 引言
據(jù)統(tǒng)計(jì),2017年上半年智能手機(jī)的用戶規(guī)模已經(jīng)達(dá)到了6.55億人,智能手機(jī)的出貨量也呈現(xiàn)出逐年遞增的趨勢。智能手機(jī)擁有極高的普及率,在日常生活中擁有和使用手機(jī)的人數(shù)遠(yuǎn)遠(yuǎn)超過其他電子產(chǎn)品。此外,未成年人群體雖然不具有較高的購買能力,但持有智能手機(jī)的未成年人數(shù)量不斷增多。手機(jī)成癮現(xiàn)象日趨普遍。本文研究的重點(diǎn)在于:根據(jù)用戶日常使用手機(jī),將使用時(shí)間與使用次數(shù)抽象成統(tǒng)一的度量單位,對用戶進(jìn)行分類,試圖通過分類,能夠做出有針對性的解決方案。
1 手機(jī)成癮現(xiàn)狀
智能手機(jī)不僅便于攜帶,美觀時(shí)尚,且操作簡單,功能多樣,吸引著未成年人以及成年人。智能手機(jī)已成為人們?nèi)粘I钪械闹匾糠郑⑸羁谈淖冎藗兊纳罘绞?。隨之而來的問題是,智能手機(jī)成癮現(xiàn)象十分嚴(yán)重。據(jù)BBC報(bào)道,有關(guān)人員在韓國約1000名學(xué)生的調(diào)查發(fā)現(xiàn),72%的學(xué)生在11歲或12歲時(shí)就有了一部智能手機(jī),他們平均每天花5.4小時(shí)在手機(jī)上。其中四分之一的孩子被認(rèn)為對智能手機(jī)上癮。不僅是未成年人,由于控制力不強(qiáng)導(dǎo)致手機(jī)成癮,大部分成年人也在社交、娛樂等方面對智能手機(jī)產(chǎn)生了過度依賴。
Flurry機(jī)構(gòu)曾對來自13億臺移動(dòng)設(shè)備、50萬個(gè)應(yīng)用數(shù)據(jù)進(jìn)行了分析。如圖1所示,我們可以很清楚的發(fā)現(xiàn),2014年相比于2013年,一年時(shí)間內(nèi)的智能手機(jī)成癮者從7900萬上升到1.76億人次。以一天八小時(shí)睡眠,每天打開應(yīng)用60次計(jì)算,平均每個(gè)智能手機(jī)使用者一小時(shí)要打開手機(jī)應(yīng)用3.75次(每16分鐘打開一次)。當(dāng)下智能手機(jī)成癮狀況不容樂觀,故協(xié)助或幫助手機(jī)成癮用戶是非常有必要的。
本文將數(shù)據(jù)挖掘領(lǐng)域與智能手機(jī)成癮問題結(jié)合,力求尋找該問題的解決方法。在研究過程中,不僅將用戶分為成癮者與非成癮者,還將成癮者根據(jù)不同原因進(jìn)一步分類。我們將采用K-means算法對用戶進(jìn)行聚類,根據(jù)智能手機(jī)使用者不同的成癮原因?qū)で笙鄬?yīng)的解決方法,從而對各類手機(jī)成癮者實(shí)施合理有效的干預(yù)與幫助。
2 相關(guān)工作
2.1 手機(jī)成癮研究
目前在手機(jī)成癮方面的研究基本上局限于提出問題、分析原因。很少有研究者能夠切實(shí)關(guān)注到解決問題上,采用數(shù)據(jù)挖掘的方法進(jìn)行研究更是少數(shù)[1-2]。有很多文章都是對大學(xué)生成癮問題進(jìn)行分析,成癮問題沒有得到解決[3]。分析表明青少年網(wǎng)絡(luò)成癮與智能手機(jī)成癮成正比,根據(jù)詳盡數(shù)據(jù)分析,得出了互聯(lián)網(wǎng)成癮和智能手機(jī)成癮之間存在重要的相關(guān)性[4]。本文研究了一款A(yù)pp,讓人們意識到智能手機(jī)上癮和智能手機(jī)綜合癥,為減少成癮人數(shù),該App提供了引導(dǎo)使用者練習(xí)瑜伽來緩解對手機(jī)的依賴。
目前已有眾多試圖解決手機(jī)使用成癮問題的手機(jī)軟件,主要的有以下幾類。
⑴ 停止手機(jī)(スマやめ)[5]軟件是由Takeshi Segawa公司開發(fā)的軟件。該軟件是一款寵物養(yǎng)成類小游戲,只有在不使用手機(jī)時(shí),電子寵物才會成長,一旦運(yùn)行其他程序,一部分成果就會作廢。
⑵ Timer lock3開發(fā)了這種懲罰措施更加嚴(yán)格的軟件,設(shè)置一定時(shí)間內(nèi),手機(jī)會被上鎖,除了緊急電話外一切操作都無法進(jìn)行。
⑶ RealizD Pty Ltd開發(fā)的小容通過記錄用戶解鎖次數(shù)和時(shí)間等,給使用者呈現(xiàn)使用數(shù)據(jù)。
⑷ 還有一些軟件針對干預(yù)未成年人的手機(jī)使用時(shí)間,例如監(jiān)護(hù)人可以通過設(shè)定使用時(shí)間來控制未成年人使用手機(jī)的時(shí)間長度等。
這幾類軟件有利于手機(jī)用戶控制手機(jī)使用時(shí)間,短時(shí)間內(nèi)可能會有一定的效果,但也存在對手機(jī)用戶造成反感心理的情況。
2.2 方法研究
聚類是一種常見的數(shù)據(jù)分析工具,其目的是把大量的數(shù)據(jù)分成若干蔟,每一個(gè)蔟都具有相似特征[6]。文將聚類算法分為五類:層次聚類算法、分割聚類算法、基于約束的聚類算法、機(jī)器學(xué)習(xí)中的聚類算法以及用于高維數(shù)據(jù)的聚類算法。在這幾類分類算法中,各有其優(yōu)缺點(diǎn)。本文選取分割聚類算法中的K-means聚類算法,它的優(yōu)缺點(diǎn)正是我們研究的重點(diǎn)。K-means聚類算法是最經(jīng)典的算法之一[7],它以其簡單實(shí)用應(yīng)用廣泛[8]。文對K-means算法進(jìn)行了改進(jìn),在聚類之前排除了孤立點(diǎn)的影響,提出了一種新的選取初始聚類中心的方法。
3 數(shù)據(jù)挖掘輔助解決手機(jī)成癮
3.1 數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘過程中的首要步驟,數(shù)據(jù)的好壞直接關(guān)系最終結(jié)果的正確性。原始數(shù)據(jù)可能因?yàn)槿狈y(tǒng)一標(biāo)準(zhǔn),數(shù)據(jù)的結(jié)構(gòu)形式差異較大,有些數(shù)據(jù)甚至是不可用的。一個(gè)良好的數(shù)據(jù)挖掘系統(tǒng)必須包含數(shù)據(jù)預(yù)處理這重要的一步。本文從數(shù)據(jù)采集開始就注意對原始數(shù)據(jù)的標(biāo)準(zhǔn)化,防止原始數(shù)據(jù)影響最后結(jié)果。
手機(jī)用戶對智能手機(jī)成癮的主要原因是現(xiàn)在智能手機(jī)軟件豐富多樣,吸引力巨大。在豐富多彩的手機(jī)軟件中,游戲類軟件、社交類軟件、視頻類軟件三類軟件是最容易產(chǎn)生手機(jī)成癮的軟件類型。我們認(rèn)為使用其他類軟件對用戶的成癮危害的影響較小,暫不考慮。
我們根據(jù)用戶對各類軟件使用時(shí)間進(jìn)行數(shù)據(jù)采集,生成一個(gè)用戶的特征向量:
數(shù)據(jù)主要根據(jù)軟件的使用時(shí)間來決定,但根據(jù)不同情景做出不同的調(diào)整。我們定義幾條規(guī)則,規(guī)則如下。
定義1:將一天每半小時(shí)為一個(gè)增長點(diǎn),一天平均設(shè)為48時(shí)間段,每個(gè)時(shí)間段都屬于一個(gè)軟件類型。
定義2:如果不足半小時(shí),屬于在此時(shí)間段中使用時(shí)間最長的軟件類型。
定義3:某時(shí)間段內(nèi)對一種軟件類型使用時(shí)間過大,可以適量增加該軟件類型的數(shù)值。
定義4:當(dāng)獲取若干天的數(shù)據(jù)時(shí),計(jì)算該用戶的平均數(shù)據(jù)。
根據(jù)定義1、2、3和各類軟件的使用次數(shù)獲得用戶的特征向量A。
3.2 K-means聚類
1967年,MacQueen首次提出K-means算法。到現(xiàn)在,K-means以其速度快,便于理解且聚類效果不錯(cuò)的優(yōu)點(diǎn)得到研究者的廣泛親睞。該算法的核心思想是找到K個(gè)聚類中心C1,C2,…..CK,使得每一個(gè)數(shù)據(jù)點(diǎn)Xi和與其相近的聚類中心Cv的平方距離和最小化[9]。
步驟1 選取K個(gè)中心點(diǎn),計(jì)算樣本Xi與這個(gè)中心點(diǎn)的距離,得到距離中心最近的,將其歸為同一個(gè)簇。
步驟2 將獲得的K個(gè)蔟,每個(gè)蔟重新計(jì)算中心點(diǎn),再重復(fù)執(zhí)行步驟1。
步驟3 不斷進(jìn)行迭代,知道滿足一定條件方可終止。
雖然K-means應(yīng)用非常廣泛,然而K-means本身存在的幾個(gè)缺點(diǎn)需要解決,對此我們做了以下幾個(gè)研究。
⑴ 在使用K-means進(jìn)行聚類時(shí)首先要確定下來K的值,因?yàn)镵是該算法的關(guān)鍵部分。本文的研究中,我們將手機(jī)用戶分為K個(gè)分類,分別是無成癮用戶,對社交軟件成癮用戶,對游戲成癮用戶,對視頻軟件成癮用戶。
⑵ K-means算法采用歐幾里德距離。
⑶ 對使用者進(jìn)行建??梢愿訙?zhǔn)確的進(jìn)行分類。當(dāng)用戶對一類軟件使用時(shí)間過長,可以增加該類軟件的比重,例如游戲成癮者會連續(xù)使用游戲類游戲1小時(shí),2小時(shí),甚至更久。定義3對該問題做出合理解決使分類可以進(jìn)一步準(zhǔn)確。
⑷ 每個(gè)蔟不再發(fā)生變化或達(dá)到預(yù)設(shè)的迭代次數(shù)時(shí)聚類結(jié)束。
通過以上研究可以將用戶合理的分成K類,根據(jù)不同類中用戶的不同特點(diǎn)對其進(jìn)行合理,有效的方法幫助手機(jī)成癮用戶。
4 實(shí)驗(yàn)結(jié)果
我們尋找了60位志愿者來進(jìn)行實(shí)驗(yàn),其中大學(xué)生40人,非大學(xué)生20人。要求志愿者照常使用手機(jī)軟件,記錄了該60位志愿者一天的手機(jī)軟件使用情況。我們可以較為清楚地得出用戶一天內(nèi)各類軟件使用時(shí)間和使用次數(shù)。根據(jù)定義2,假設(shè)時(shí)段T中多種軟件都有使用,我們只會記錄使用時(shí)間最久的軟件種類。同時(shí)會記錄T時(shí)刻全部軟件的打開次數(shù),因此,數(shù)據(jù)會出現(xiàn)打開次數(shù)大于使用時(shí)間,甚至出現(xiàn)使用時(shí)間為零、打開次數(shù)不為零的數(shù)據(jù)。
我們通過PCA(主成分分析方法)對數(shù)據(jù)進(jìn)行降維,然后使用K-means進(jìn)行聚類得到如圖2所示的分類圖。圖中加粗的圖形為每一簇的中心點(diǎn)。將用戶分成四類,分別是無成癮,游戲類成癮,社交類成癮和視頻類成癮。
對不同用戶進(jìn)行分類,根據(jù)各自特點(diǎn)和喜好進(jìn)行針對性研究,例如,游戲愛好者對手機(jī)的要求很高,可以相應(yīng)的在某個(gè)時(shí)間段內(nèi)降級手機(jī)的主頻,對游戲產(chǎn)生較差的體驗(yàn),從而降低游戲愛好者對游戲的依賴。對社交軟件使用量過大的用戶,采用不及時(shí)的推送方案,集中推送等措施。
5 結(jié)束語
能夠幫助人們對手機(jī)的過度依賴是本文研究的主要出發(fā)點(diǎn)。對這方面的研究,大多數(shù)研究者停留在對成癮原因的分析,尚未采取有效措施來解決成癮的問題。雖然有不少軟件采取禁止使用來達(dá)到目的,但此類軟件的主動(dòng)權(quán)在用戶手中。我們結(jié)合數(shù)據(jù)挖掘領(lǐng)域?qū)υ搯栴}進(jìn)行研究。實(shí)驗(yàn)證明,我們的研究做到了根據(jù)軟件的使用情況對用戶分成四類,數(shù)據(jù)的收集工作可以通過操作系統(tǒng)、軟件等多種途徑。對不同分類用戶采取不同推送內(nèi)容,以轉(zhuǎn)移其注意力,減少游戲類、社交類等消息推送,提醒使用者已經(jīng)處于成癮階段,適度減少手機(jī)性能,影響用戶體驗(yàn),這些實(shí)際措施能夠幫助到手機(jī)成癮用戶。
參考文獻(xiàn)(References):
[1] 韓登亮,齊志斐.大學(xué)生手機(jī)成癮癥的心理學(xué)探析[J].當(dāng)代青年研究,2005.12:34-38
[2] 王小運(yùn),伍安春.大學(xué)生手機(jī)成癮行為的成因及其對策[J].重慶郵電大學(xué)學(xué)報(bào)(社會科學(xué)版),2012.24(1):40-43,63
[3] T. Rapeepisarn, S. Tatiyanupanwong, B. Kornvisitvatin and S. Tangsripairoj, "iRelief: An Android application for smartphone syndrome prevention and treatment,"2016 Fifth ICT International Student Project Conference (ICT-ISPC), Nakhon Pathom,2016:121-124
[4] W. Jun, "An Analysis Study on Correlation of Internet Addiction and Smartphone Addiction of Teenagers," 2015 2nd International Conference on Information Science and Security (ICISS), Seoul,2015:1-3
[5] https://itunes.apple.com.
[6] 賀玲,吳玲達(dá),蔡益朝.數(shù)據(jù)挖掘中的聚類算法綜述[J].計(jì)算機(jī)應(yīng)用研究,2007.1:10-13
[7] 金建國.聚類方法綜述[J].計(jì)算機(jī)科學(xué),2014.41(S2):288-293
[8] 周愛武,于亞飛.K-Means聚類算法的研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2011.21(2):62-65
[9] 孫吉貴,劉杰,趙連宇.聚類算法研究[J].軟件學(xué)報(bào),2008.1:48-61