国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于稀疏凸非負(fù)矩陣分解的混合數(shù)據(jù)特征提取與評價研究

2021-05-25 10:56胡怡宇杜倩倩
關(guān)鍵詞:分級矩陣個體

周 靜,余 超,胡怡宇,杜倩倩

(江漢大學(xué) 人工智能學(xué)院,湖北 武漢 430056)

0 引言

國外學(xué)者較為重視在線課程平臺數(shù)據(jù)資源的研究[1-2],如美國教育部門建立了“學(xué)習(xí)分析系統(tǒng)”對學(xué)生線上教育數(shù)據(jù)進(jìn)行挖掘、模化和案例運用,可以幫助教師了解學(xué)生更多、更好、更精確的學(xué)習(xí)信息;加拿大面向高等教育領(lǐng)域的學(xué)生推出“學(xué)生成功系統(tǒng)”,幫助教師系統(tǒng)地分析每個學(xué)生的在線學(xué)習(xí)數(shù)據(jù),并預(yù)測學(xué)生的期末考試成績。國內(nèi)關(guān)于在線課程平臺的數(shù)據(jù)資源的研究大多集中在北京、上海、廣州等地,目前已經(jīng)利用新的數(shù)據(jù)信息處理手段為在線課程用戶提供基本公共在線教育服務(wù),并初步建立在線教育數(shù)據(jù)挖掘與分析子系統(tǒng)。

綜合國內(nèi)外研究現(xiàn)狀,雖然目前已對在線教育數(shù)據(jù)進(jìn)行了挖掘和分析,并開發(fā)出數(shù)據(jù)分析平臺;但研究基本僅限于在線教育數(shù)據(jù),未考慮線下傳統(tǒng)課堂數(shù)據(jù);同時數(shù)據(jù)分析基本采用的是傳統(tǒng)的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘方法,如回歸分類、聚類等方法,難以有效提取出混合學(xué)習(xí)數(shù)據(jù)中的群集特征。針對目前的研究現(xiàn)狀,本文通過融合傳統(tǒng)教學(xué)和互聯(lián)網(wǎng)線上的教育數(shù)據(jù)構(gòu)建混合教育數(shù)據(jù)特征網(wǎng)絡(luò),對傳統(tǒng)的非負(fù)矩陣分解(non-negative matrix factorization,NMF)方法進(jìn)行改進(jìn),提取出混合數(shù)據(jù)特征網(wǎng)絡(luò)中影響教育質(zhì)量的主要群集特征,并基于狀態(tài)-壓力-響應(yīng)(pressurestate-response,PSR)模型構(gòu)建教育指標(biāo)多級評價模型,對個體進(jìn)行有效分級。

1 數(shù)據(jù)特征網(wǎng)絡(luò)構(gòu)建

數(shù)據(jù)特征網(wǎng)絡(luò)的一個重要特征是網(wǎng)絡(luò)包含少量的高度節(jié)點,這些高度節(jié)點的“度”很大,說明它們之間以很高的連接概率互聯(lián),構(gòu)成群集[3-4]。學(xué)習(xí)行為特征節(jié)點的“度”越大,表示該行為與其他行為被執(zhí)行的次數(shù)越多,則說明該學(xué)習(xí)行為特征越重要,這樣的學(xué)習(xí)行為特征之間存在的聯(lián)系可以看成群集。群集函數(shù)特征的差異表明,網(wǎng)絡(luò)呈現(xiàn)出明顯的層次拓?fù)浣Y(jié)構(gòu),大多數(shù)節(jié)點分別依附在若干個節(jié)點上,形成若干個小網(wǎng)絡(luò),小網(wǎng)絡(luò)經(jīng)過選擇性的互聯(lián)形成大網(wǎng)絡(luò)并產(chǎn)生少數(shù)幾個中心節(jié)點,最后這幾個中心節(jié)點互聯(lián)成完整的網(wǎng)絡(luò),如圖1所示。圖1中10個節(jié)點分別代表個體的各學(xué)習(xí)行為特征,由圖1可知,10個學(xué)習(xí)行為特征匯聚形成了4個群集[5-6],基于4個群集特征構(gòu)建形成了教育特征網(wǎng)絡(luò),該網(wǎng)絡(luò)中的學(xué)習(xí)行為特征是指綜合學(xué)習(xí)效果特征指標(biāo)。

圖1 基于群集特征的數(shù)據(jù)特征網(wǎng)絡(luò)Fig.1 Data feature network based on cluster feature

2 改進(jìn)的稀疏CNMF特征提取方法

NMF方法提取數(shù)據(jù)群集特征的思路是對于任意給定的m×n大小的高維非負(fù)矩陣X,壓縮分解成兩個低維非負(fù)矩陣F和U,其中F的維度為m×k,U的維度為n×k,F(xiàn)和U滿足X=FUT,其中F為特征矩陣。

凸非負(fù)矩陣(conves nonnegative matrix factorization,CNMF)分解是NMF模型的推廣,可更有效地抽取混合數(shù)據(jù)中的群集特征,并通過對特征矩陣的稀疏化減少矩陣分解與特征提取的計算量。CNMF[4,7]模型將矩陣F替換成原始矩陣X的非負(fù)凸組合,即F=XV。原始矩陣X維度為m×n,非負(fù)凸組合系數(shù)矩陣V的維度為n×k,用于表示特征的基矩陣,特征矩陣F的維度為m×k,則可得到CNMF的分解形式為X=XVUT,其中V和U被約束成非負(fù),X沒有約束。

基本CNMF的目標(biāo)函數(shù)[8]為

本文提出一個新的目標(biāo)函數(shù)J(V)如(1)式所示,新目標(biāo)函數(shù)比傳統(tǒng)的目標(biāo)函數(shù)更簡單和易于計算,能夠有效提高收斂速度,且對V、U等系數(shù)矩陣的優(yōu)化效果更好,群集特征的識別率更高,

式中,B+=(XTX)+U,A-=(XTX)-,C=UTU。且分別表示矩陣A的正負(fù)部分,如(2)式所示,

定義一個輔助函數(shù)Z(V,V′),它滿足

對于任一V和V′,定義

可知:

因此,只要找到符合(3)式的Z(V,V′),可保證目標(biāo)函數(shù)J(V(t))不增且收斂。

其中

符合(3)式的Z(V,V′)由(5)式定義:

為找到Z(V,V′)的最小值,令其導(dǎo)數(shù)為0,則有

Z(V,V′)的最小值由公式(6)計算得到,即可得到使Z取最小值時的V ik,

又因為

可得到V的迭代規(guī)則如(9)式所示:

同理可得到U的迭代公式為

由公式(9)、(10)定義的迭代規(guī)則可保證J(V(t))=Z(V(t),V(t))≥Z(V(t+1),V(t))≥J(V(t+1)),使得目標(biāo)函數(shù)J(V(t))是個不增函數(shù)且收斂。按照新的迭代規(guī)則進(jìn)行迭代運算時,為消除數(shù)據(jù)間的冗余信息,需對系數(shù)矩陣V加以稀疏條件約束,因此采用閾值判斷方法在迭代中對系數(shù)矩陣V進(jìn)行稀疏化約束。即選擇一個閾值,對V的每一列分別進(jìn)行處理,將大于這個閾值的部分保留,其他區(qū)域置零,則處理后的矩陣被稀疏化,降低了計算量,同時特征更稀疏可使得提取出的混合數(shù)據(jù)的群集特征更為集中。

3 基于改進(jìn)的稀疏CNMF方法提取群集特征

以混合教學(xué)數(shù)據(jù)為例,采集教育個體的學(xué)習(xí)行為及學(xué)習(xí)效果等教育特征數(shù)據(jù),由教育特征指標(biāo)數(shù)據(jù)構(gòu)成X矩陣。對X進(jìn)行CNMF分解得到系數(shù)矩陣UT,其維度為K×J,即得到了K個群集,UT的第k行第j列的數(shù)值記為表示第k個學(xué)習(xí)行為特征指標(biāo)隸屬于第j個群集的權(quán)值系數(shù)。值越大,說明第k個學(xué)習(xí)特征指標(biāo)隸屬于第j個群集的程度越高,因此可找到高度隸屬于第j個群集的特征指標(biāo)。

對江漢大學(xué)公共課《計算機(jī)基礎(chǔ)》教學(xué)中的個體行為特征指標(biāo)數(shù)據(jù)進(jìn)行稀疏CNMF分解,得到4個群集,表征各學(xué)習(xí)特征指標(biāo)分別隸屬于4個群集的系數(shù)矩陣U如表1所示。由表1可知,U的第1列的第6、5、1、2行的值較高,說明第6、5、1、2指標(biāo)隸屬于第一個群集的權(quán)重較高,即隸屬于第一群集的指標(biāo)按照權(quán)重高低分別是:學(xué)習(xí)進(jìn)度、任務(wù)點、視頻觀看率、測驗成績。隸屬于第二群集的指標(biāo)按照權(quán)重高低分別是:實驗成績、考勤。隸屬于第三群集的指標(biāo)按照權(quán)重高低分別是:作業(yè)、訪問數(shù)。隸屬第四群集的指標(biāo)按照權(quán)重高低分別是:期末考試成績、期中考試成績。

表1 教育特征數(shù)據(jù)指標(biāo)的權(quán)值系數(shù)Tab.1 The weight coefficient of educational char acteristic data index

采用基本CNMF及改進(jìn)的CNMF方法在特征矩陣維度N取不同值時分別進(jìn)行群集特征提取,實驗結(jié)果如圖2所示,可知在不同的矩陣維度下改進(jìn)后的CNMF方法提取群集特征所需時間均小于基本CNMF方法。

圖2 群集特征提取時間對比Fig.2 Comparison of cluster feature extraction time

4 教育個體PSR評價體系構(gòu)建及權(quán)值求解

4.1 教育個體PSR評價指標(biāo)體系構(gòu)建

基于上述方法提取到的混合教學(xué)數(shù)據(jù)中的群集特征,選取多級指標(biāo),采用PSR[9]模型,構(gòu)建評價層—群集層—特征層的3個層次上的PSR評價指標(biāo)體系如圖3所示。圖3中一級指標(biāo)(評價層)分為所提取到的群集1至群集4的4個二級指標(biāo),4個二級指標(biāo)(群集層)下面又進(jìn)一步分為10個三級特征指標(biāo)。

圖3 基于稀疏CNMF的教育個體PSR評價指標(biāo)體系Fig.3 PSR evaluation index system of educational individuals based on sparse CNMF

4.2 基于熵值法求解PSR各指標(biāo)權(quán)重

基于個體質(zhì)量PSR評價指標(biāo)體系,考慮到個體的分級不僅由個體的學(xué)習(xí)特征行為指標(biāo)決定,還應(yīng)考慮個體的綜合學(xué)習(xí)效果指標(biāo)。為了確定各指標(biāo)對個體分級影響的權(quán)值,本文采用熵值法[10]確定指標(biāo)權(quán)值,主要步驟如下:

步驟一對由M個個體、N個指標(biāo)構(gòu)建的原始指標(biāo)數(shù)據(jù)矩陣X按照(11)式進(jìn)行標(biāo)準(zhǔn)化,

計算第j項指標(biāo)下第i個個體指標(biāo)值x ij的權(quán)重P ij,

計算第j項指標(biāo)的熵值E j,

式中,k=1/lnM。

步驟二計算第j項評價指標(biāo)的差異性系數(shù)gj,

步驟三計算第j項評價指標(biāo)的權(quán)重w j,

步驟四計算評價指標(biāo)權(quán)值。基于特征層的指標(biāo)值,可通過如(16)式所示的加權(quán)綜合計算方法計算群集層(二級指標(biāo))及評價層(一級指標(biāo))的指標(biāo)值,

式中,D j表示上一層指標(biāo)值;Cj表示下一級指標(biāo)值;Rj表示Cj相對于D j的權(quán)重;N為Cj級指標(biāo)的數(shù)量。

根據(jù)上述方法,確定各個指標(biāo)之間的相對重要程度,可以得到PSR評價指標(biāo)體系中各指標(biāo)的權(quán)重(見表2)。

5 教育質(zhì)量綜合評價及教育個體分級模型

5.1 教育個體分級理論模型

基于表2中的PSR指標(biāo)體系中各指標(biāo)的權(quán)重,采用綜合加權(quán)法計算得到個體的綜合評價值,用于衡量個體質(zhì)量,實現(xiàn)對個體質(zhì)量的綜合評價[9,11]以及個體的分級。

設(shè)x i″為第i個一級評價指標(biāo)所得評價值,x ik′為第i個一級評價指標(biāo)的第k個二級評價指標(biāo)所得的評價值,x ikl為第i個一級評價指標(biāo),第k個二級評價指標(biāo)的第l個三級評價指標(biāo)所得的評價值。將教育質(zhì)量分級綜合評價指標(biāo)所得的評價值以相應(yīng)的權(quán)重系數(shù)來加權(quán),其加權(quán)和作為教育質(zhì)量的綜合評價值y,教育質(zhì)量分級綜合評價模型為

表2 PSR評價指標(biāo)體系中各指標(biāo)的權(quán)重值Tab.2 The weight value of each index in the PSR evaluation index system

5.2 分級階梯模型建立

由式(17)所計算得到的教育個體質(zhì)量綜合評價值越大,則說明教育質(zhì)量級別越高,個體質(zhì)量越好,級別數(shù)越靠前,反之亦然。因此可建立分級階梯模型如式(18)所示,用于確定教育個體質(zhì)量的級別數(shù),

由(17)式和(18)式可求得各個體樣本的綜合評價指標(biāo)值與分級值,并給出200個個體樣本分屬于10級的分布曲線(見圖4),圖4橫軸表示級別數(shù),縱軸表示學(xué)生人數(shù)。圖4同時給出了依據(jù)學(xué)生期末考試成績得到的理想分級值的分布曲線。

圖4 個體分級分布圖Fig.4 Individual classification distribution map

由圖4可知,本文所提出的評價指標(biāo)體系對學(xué)生進(jìn)行分級評價的結(jié)果與學(xué)生個體期末考試成績的理想分級結(jié)果基本一致,證明了本文所提出的特征提取方法及評價分級模型的有效性。

6 結(jié)語

本文針對線上和線下混合教學(xué)中所獲取的教育特征數(shù)據(jù),構(gòu)建基于群集的教育特征網(wǎng)絡(luò);采用改進(jìn)迭代規(guī)則的稀疏凸非負(fù)矩陣分解特征提取算法對教育特征網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行降維,提取影響教育特征網(wǎng)絡(luò)的群集特征。根據(jù)該反映個體質(zhì)量的群集特征的權(quán)值大小,可分析得到個體質(zhì)量的核心指標(biāo);同時,通過選取多級特征指標(biāo)構(gòu)建了混合教學(xué)模式下個體質(zhì)量的PSR評價指標(biāo)體系;采用綜合評價法構(gòu)建個體質(zhì)量綜合評價模型和分級模型,并對該課程混合教學(xué)中的教育個體進(jìn)行了有效分級,分級結(jié)果分布與學(xué)生個體期末考試成績的理想分級結(jié)果基本一致,證明了本文算法的有效性。

猜你喜歡
分級矩陣個體
關(guān)注個體防護(hù)裝備
明確“因材施教” 促進(jìn)個體發(fā)展
多項式理論在矩陣求逆中的應(yīng)用
2016年年末凈值規(guī)模低于5000萬元的分級基金
矩陣
矩陣
矩陣
How Cats See the World
完形填空分級演練
完形填空分級演練
达日县| 东方市| 密云县| 固镇县| 平乐县| 北流市| 彰武县| 南木林县| 荣成市| 同德县| 周口市| 莎车县| 长乐市| 咸宁市| 南江县| 浪卡子县| 白山市| 茂名市| 永仁县| 紫金县| 万州区| 新津县| 永川市| 潮安县| 宜黄县| 宁安市| 石柱| 江津市| 咸丰县| 东宁县| 彰武县| 广南县| 温州市| 南郑县| 亳州市| 商南县| 青田县| 芦山县| 双峰县| 兴宁市| 江川县|