徐維艷,林夢云,程 瑞,孫 波
(江蘇科技大學(xué) 數(shù)理學(xué)院,江蘇 鎮(zhèn)江 212003)
隨著智能手機日益普及,其功能也日趨多樣化.智能手機除了是方便快捷的通訊工具外,還具有聽音樂、游戲、攝影等多種娛樂功能,因此很多自制力差的大學(xué)生患上了手機依賴癥,嚴(yán)重影響了學(xué)業(yè).通過調(diào)查分析,本文用粗糙集理論來分析大學(xué)生對手機依賴的緣由,從而更加準(zhǔn)確地指出大學(xué)生對手機依賴的影響因素,對指導(dǎo)大學(xué)生正確使用手機具有重要的意義.
波蘭數(shù)學(xué)家Pawlak[1-2]提出的粗糙集理論是一種處理不精確信息和模糊信息的新型數(shù)學(xué)方法,近年來成功應(yīng)用于醫(yī)療診斷、圖像處理、模式識別、知識獲取、數(shù)據(jù)挖掘和決策支持等領(lǐng)域.經(jīng)典粗糙集理論是通過論域U上的不可分辨二元關(guān)系(即等價關(guān)系)導(dǎo)出的等價類,作為基本的知識顆粒,用一對上下近似集合來逼近數(shù)據(jù)庫中的不精確概念.粗糙集的核心思想是在保持分類能力不變的前提下,通過知識約簡,導(dǎo)出問題的決策或分類規(guī)則[3-7].
關(guān)于大學(xué)生對手機依賴的因素分析研究,文獻[8-10]通過調(diào)查問卷的形式,從統(tǒng)計學(xué)的角度對在校大學(xué)生對手機依賴的各種因素僅進行了定性分析和理論說明,沒有建立數(shù)學(xué)模型定量分析;文獻[11]雖然用粗糙集理論作了定量分析,但決策屬性值設(shè)定偏主觀,約簡后條件屬性的主觀分類可信程度沒有度量,影響結(jié)果對事實的客觀反映.為此,本文將粗糙集理論用于對大學(xué)生依賴手機因素進行定量分析,通過屬性約簡算法(思維方式與其互逆)[10]對指標(biāo)體系進行簡化,刪除冗余信息,獲取影響學(xué)生依賴手機的原因規(guī)則,并對這些規(guī)則的可信度程度進行度量,為學(xué)生工作者提供智能決策依據(jù),以指導(dǎo)大學(xué)生合理使用手機,學(xué)校和家長也可借鑒此規(guī)則引導(dǎo)學(xué)生,避免學(xué)生對手機的過度依賴.
定義1[5]信息系統(tǒng)(information system,記為IS)可定義為一個四元組:IS= 〈U,AT,V,f〉,其中U是一個非空有限對象的集合,又稱為論域;AT是非空有限屬性集合,?a∈AT,Va表示屬性a的值域;V表示全體屬性的值域集合,即V=VAT=∪a∈ATVa;f為信息函數(shù),?x∈U,a∈AT,定義f(x,a)表示x在屬性a上的取值,則有f(x,a)∈Va.如果AT=C∪D,其中C是非空有限條件屬性集合,D是非空有限決策屬性集合,則〈U,C∪D,V,f〉又被稱為決策信息系統(tǒng)(DIS).當(dāng)D= {d}時,稱〈U,C∪ {d},V,f〉為單決策信息系統(tǒng).
定義2[5]設(shè)IS= 〈U,AT,V,f〉,?A?AT,定義A上的不可分辨關(guān)系IND(A)= {(x,y)∈U2:?a∈A,f(x,a)=f(y,a)}.不可分辨關(guān)系滿足自反性、對稱性和傳遞性,是U上的一個等價關(guān)系.由此等價關(guān)系可以導(dǎo)出U上的一個劃分,記為U/IND(A),?x∈U,x的等價類記為[x]A,且[x]A= {y∈U:(x,y)∈IND(A)}.
定義3[5]設(shè)IS= 〈U,AT,V,f〉,?X?U,A?AT,定義X關(guān)于屬性A的下、上近似,分別記為
序偶〈A(X)(X)〉稱為X關(guān)于屬性A的粗糙集.通過下近似和上近似,可以得到X的正域、邊界域負域分別為
在將粗糙集用于決策規(guī)則獲取的理論中時,隱藏在決策信息系統(tǒng)DIS= 〈U,C∪ {d},V,f〉中的知識將以決策規(guī)則的形式被提取出來,通過考察訓(xùn)練樣本或待考察的對象x(x∈U),可以得到如下決策規(guī)則[6]:
其中des([x]C)是決策規(guī)則rx的條件部分,表示對象x在條件屬性集C下的描述,即des([x]C)=∧c∈C(c,vc);des([x]d)是決策規(guī)則rx的決策部分,表示對象x在決策屬性d下的描述,即des([x]d)=∨i∈Vd(d,i),其中i∈Vd,i是類別標(biāo)簽.規(guī)則rx為決策者做出判決和分類提供了依據(jù).文獻[4-6]對決策規(guī)則rx定義了確定性度量因子Cer(rx)來衡量rx的可信度程度:
其中card(X)表示集合X的基數(shù);‖[x]C‖表示x在條件屬性集C上描述相同元素構(gòu)成的集合,記為‖[x]C‖ = {y∈U:f(y,c)=f(x,c),?c∈C};‖[x]d‖表示x在決策屬性d上描述相同元素的集合,記為 ‖[x]d‖ = {y∈U:f(y,d)=f(x,d)}.
令Cer(rx)=α,當(dāng)α=1時,規(guī)則rx:des([x]C)→des([x]d)的決策能力是確定的,此時稱之為確定性決策規(guī)則;當(dāng)0<α<1時,規(guī)則rx:des([x]C)→des([x]d)的決策能力是不確定的,此時稱之為不確定性決策規(guī)則,其不確定性的程度由α×100%來度量.
定理1 設(shè)DIS= 〈U,C∪ {d},V,f〉,論域U上由決策屬性d導(dǎo)出的劃分記為U/{d}={D1,D2,…,Di},其中Vd= {1,2,…,i},Di= {x∈U:f(x,d)=i}又被稱為決策類,i是類別標(biāo)簽.則對任意x∈U對應(yīng)決策規(guī)則rx:des([x]C)→des([x]d),有下面的命題成立:
(1)若x∈POSC(Di),則規(guī)則rx:des([x]C)→des([x]d)是一條確定性決策規(guī)則;
(2)若x∈BNDC(Di),則規(guī)則rx:des([x]C)→des([x]d)是一條不確定性決策規(guī)則.
證明 (1)由x∈POSC(Di)可知,有[x]C≠?,[x]C?Di成立.由[x]C的定義可知,任何與x在條件屬性集C上描述均相同的元素,其決策屬性值都取i,即f(x,d)=i,i∈Vd.所以有Cer(rx)=1成立,因此rx是一條確定性決策規(guī)則.
(2)證明與(1)類似.
定義4 設(shè)DIS= 〈U,C∪ {d},V,f〉,Vd={1,2,…,i,…,r},A?C.由決策屬性d導(dǎo)出的劃分記為U/d= {D1,D2,…,Di,…,Dr},其中Di= {x∈U:f(x,d)=i}.定義
(1)若LOW(A)=LOW(C),則稱A是C的一個下近似分布一致協(xié)調(diào)集;若A是C的一個下近似分布一致協(xié)調(diào)集,且?B?A,B都不是C的下近似分布一致協(xié)調(diào)集,則稱A是C的下近似分布約簡.
(2)若UPP(A)=UPP(C),則稱A是C的一個上近似分布一致協(xié)調(diào)集;若A是C的一個上近似分布一致協(xié)調(diào)集,且?B?A,B都不是C的上近似分布一致協(xié)調(diào)集,則稱A是C的上近似分布約簡.
(3)若LOW(A)= LOW(C),且 UPP(A)=UPP(C),則稱A是C的分布一致協(xié)調(diào)集;若A是C的分布一致協(xié)調(diào)集,且?B?A,B都不是C的分布協(xié)調(diào)集,則稱A是C的分布約簡.
定義5 設(shè)IS= 〈U,AT,V,f〉是一個信息系統(tǒng),C∪ {d}=AT,集合族{D1,D2,…,Dr}是由決策屬性d導(dǎo)出的劃分,則C對{d}的近似分類質(zhì)量γC({d})計為
其中γC({d})表示在條件屬性集C下能夠確切劃入決策類U/{d}中的對象占論域中對象總數(shù)的比率,表示了決策屬性對條件屬性的依賴程度;POSC({d})稱為{d}的相對于C的正域.
定義6 設(shè)IS= 〈U,AT,V,f〉是一個信息系統(tǒng),C∪ {d}=AT,條件屬性ci∈C(i=1,2,…,n),ci對 于 決 策 屬 性 的 重 要 性 程 度 為 Sig(ci,C,{d}),其中Sig(ci,C,{d})=γC({d})-γC-{ci}({d}).POSC-{ci}({d})稱為{d}相對于C-{ci}的正域,即U中所有根據(jù)屬性集C-{ci}劃分后,仍可準(zhǔn)確劃分到{d}的等價類中的對象集合.
經(jīng)過專家打分本文評選出13個影響因素,做了100份的問卷調(diào)查,最后所構(gòu)建的決策信息表如表1所示.
表1 調(diào)查問卷設(shè)計Table 1 Questionnaire design
表1中用“0,1,2,3”來表示不同的取值.U={u1,u2,…,u100}表示100份問卷的集合,A= {c1,c2,…,c11,d1,d2}表示屬性集.其中C= {c1,c2,…,c11}表示條件屬性,{c1,c2,…,c11}分別對應(yīng)屬性1~11;D={d1,d2}表示2個決策屬性,為便于討論將{d1,d2}轉(zhuǎn)為單決策屬性d,根據(jù)領(lǐng)域?qū)<业慕?jīng)驗判定d的取值如表2所示,即Vd={不依賴,輕度依賴,非常依賴}= {0,1,2}.
表2 單決策屬性表Table 2 Single-decision attribute table
經(jīng)過上述處理之后可得如表3所示的決策信息系統(tǒng)表.
已知DIS= 〈U,C∪ {d},V,f〉,屬 性集C={c1,c2,…,ci},U/d= {D1,D2,…,Di,…,Dr}是由決策屬性d導(dǎo)出的覆蓋,則條件屬性集C的下近似分布約簡的步驟如下:
Step 1 令C的下近似分布約簡R=?;
Step 2 判斷LOW(R)=LOW(C)是否成立,若成立則轉(zhuǎn)Setp 4,否則轉(zhuǎn)Setp 3;
Step 3 對任意ai∈ (C-R),取Sig(ai,C,{d})獲得最小值時的ai,更新R,使R=R∪ {ai},轉(zhuǎn)Setp 2;
Step 4 最后輸出R,則R即為C的下近似分布約簡.
表3 決策信息系統(tǒng)Table 3 Decision information system
算法的時間復(fù)雜度分析:在Step 2中計算LOW(R)與LOW(C)是否相等的時間復(fù)雜度是O(|C||U|2),Step 3的時間復(fù)雜度是O(|C|log2|C|),因此該算法的時間復(fù)雜度是O(|C||U|2).將Step 2中的判斷條件改為 UPP(R)=UPP(C),Step 3的啟發(fā)信息也做相應(yīng)調(diào)整,即可求得C的上近似分布約簡.
通過計算約掉的冗余數(shù)據(jù)為{c4,c8,c9},最終得到C對 {d}的 相 對 約 簡 為 {c1,c2,c3,c5,c6,c7,c10,c11}.因此由表3獲取的確定性決策規(guī)則如下:
r1:(c1=3)∧ (c2=0)∧ (c3=1)∧ (c5=0)∧ (c6=0)∧ (c7=0)∧ (c10=1)∧ (c11=0)→(d=1),可信度為1;
r2:(c1=2)∧ (c2=0)∧ (c3=1)∧ (c5=0)∧ (c6=1)∧ (c7=0)∧ (c10=1)∧ (c11=0)→(d=1),可信度為1;
r3:(c1=2)∧ (c2=0)∧ (c3=1)∧ (c5=1)∧ (c6=0)∧ (c7=1)∧ (c10=1)∧ (c11=0)→(d=0),可信度為1;
r4:(c1=2)∧ (c2=0)∧ (c3=0)∧ (c5=1)∧ (c6=1)∧ (c7=0)∧ (c10=0)∧ (c11=0)→(d=0),可信度為1;
r5:(c1=1)∧ (c2=0)∧ (c3=1)∧ (c5=1)∧ (c6=1)∧ (c7=0)∧ (c10=0)∧ (c11=0)→(d=1),可信度為1;
r6:(c1=1)∧ (c2=0)∧ (c3=1)∧ (c5=1)∧ (c6=0)∧ (c7=0)∧ (c10=0)∧ (c11=0)→(d=2),可信度為1.
上述確定性規(guī)則用通俗語言解釋如下:
(1)大學(xué)四年級,用手機學(xué)習(xí)或獲取有用信息的時間在2h以下,平時的空余時間在2~8h,拿過獎學(xué)金,談戀愛,注重手機的性價比,老師不禁止學(xué)生上課玩手機,覺得大學(xué)課程有點困難.具有以上屬性的大學(xué)生,他們通常對手機依賴,且可信度為1.
(2)大學(xué)三年級,用手機學(xué)習(xí)或獲取有用信息的時間在2h以下,平時的空余時間在2~8h,沒拿過獎學(xué)金,談戀愛,注重手機的品牌,老師不禁止學(xué)生上課玩手機,覺得大學(xué)課程有點困難.具有以上屬性的大學(xué)生,他們通常對手機不依賴,且可信度為1.
(3)大學(xué)二年級,用手機學(xué)習(xí)或獲取有用信息的時間在2h以下,平時的空余時間在2~8h,沒拿過獎學(xué)金,談戀愛,注重手機的性價比,老師禁止學(xué)生上課玩手機,覺得大學(xué)課程有點困難.具有以上屬性的大學(xué)生,他們通常對手機非常依賴,且可信度為1.
注 限于篇幅,其他規(guī)則本文不再一一羅列.
本文用粗糙集的知識對大學(xué)生手機依賴程度進行數(shù)據(jù)處理,通過屬性約簡可以看出,影響大學(xué)生對手機產(chǎn)生依賴的主要因素是:① 用手機學(xué)習(xí)時間較少;② 平時空余時間較多;③ 談戀愛;④ 老師不約束學(xué)生上課玩手機;⑤ 大學(xué)課程較難等.所得研究結(jié)果比僅從統(tǒng)計學(xué)角度作出的定性分析結(jié)果更具有客觀性,學(xué)校和家長可以有針對性地采取有效措施,正確引導(dǎo)大學(xué)生合理使用手機,這對高校學(xué)生管理工作有一定的參考價值.
[1] PAWLAK Z.Rough sets[J].International Journal of Computer and Information Sciences,1982,11(5):341-356.
[2] PAWLAK Z,SKOWRON A.Rough sets:some extensions[J].Information Sciences,2007,177(1):28-40.
[3] YAO Yiyu.Three-way decisions with probabilistic rough sets[J].Information Sciences,2010,180(3):341-353.
[4] YANG Xibei,XIE Jun,SONG Xiaoning,et al.Credible rules in incomplete decision system based on descriptors[J].Knowledge-Based Systems,2009,22(1):8-17.
[5] 張明,唐振民,楊習(xí)貝.可變多粒度粗糙集模型[J].模式識別與人工智能,2012,25(4):709-720.
[6] 徐維艷,魏敏,張明.基于相似關(guān)系粗糙集中的否定規(guī)則及約簡[J].微電子學(xué)與計算機,2012,29(11):53-57.
[7] 徐蘇平,楊習(xí)貝,范霽月,等.基于混合不可分辨關(guān)系的粗糙集模型與知識獲取[J].淮海工學(xué)院學(xué)報:自然科學(xué)版,2012,21(4):28-32.
[8] 羅玉華,黃彥萍,游敏惠.手機對大學(xué)生的影響及對策研究[J].重慶郵電大學(xué)學(xué)報:社會科學(xué)版,2011,23(2):22-26.
[9] 胥鑒霖,王泗通.大學(xué)生手機依賴現(xiàn)狀調(diào)查探究——以HH大學(xué)J校區(qū)為例[J].電子測試,2013(14):137-139.
[10] 馬斌,馬瀟萌,朱記偉.手機過度使用危害及影響分析——基于大學(xué)生群體的實證[J].電子測試,2011(29):184-185.
[11] 高雨菲,林夢云,杜佩珊,等.大學(xué)生手機依賴調(diào)查和因素分析[J].科技信息,2014(2):95-97.