国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于校園上網(wǎng)行為感知的學(xué)生成績預(yù)測(cè)方法

2022-08-12 14:28:10崔超然馬樂樂王飛超馬玉玲尹義龍
關(guān)鍵詞:注意力校園預(yù)測(cè)

姚 麗 崔超然 馬樂樂 王飛超,3 馬玉玲 陳 勐 尹義龍

1(山東大學(xué)軟件學(xué)院 濟(jì)南 250100)2(山東財(cái)經(jīng)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 濟(jì)南 250014)3(齊魯師范學(xué)院網(wǎng)絡(luò)信息中心 濟(jì)南 250001)4(山東建筑大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 濟(jì)南 250101)

教育是立國之本,強(qiáng)國之基.隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,收集教育相關(guān)數(shù)據(jù)變得更為方便快捷,對(duì)教育大數(shù)據(jù)的分析、挖掘和應(yīng)用是教育發(fā)展的重要需求和必然趨勢(shì)[1].學(xué)生成績預(yù)測(cè),又稱為學(xué)生學(xué)業(yè)表現(xiàn)預(yù)測(cè),是指利用學(xué)生的相關(guān)信息預(yù)測(cè)其在未來的學(xué)業(yè)表現(xiàn)[2],包括課程成績、學(xué)期末綜合成績以及是否存在退學(xué)風(fēng)險(xiǎn)等.借助學(xué)生成績預(yù)測(cè)技術(shù),教師可以清晰洞察學(xué)生的學(xué)習(xí)狀態(tài)與質(zhì)量,并以此為基礎(chǔ)開展差異化教學(xué),滿足學(xué)生的個(gè)性化學(xué)習(xí)需求,真正達(dá)到“以評(píng)促學(xué)”的目的.此外,學(xué)生成績預(yù)測(cè)技術(shù)也有助于高校開展學(xué)業(yè)預(yù)警工作,特別是根據(jù)對(duì)學(xué)生成績的實(shí)時(shí)預(yù)測(cè)結(jié)果建立動(dòng)態(tài)的預(yù)警機(jī)制,及時(shí)發(fā)現(xiàn)可能無法正常完成學(xué)業(yè)的學(xué)生,引導(dǎo)他們走出困境,順利實(shí)現(xiàn)人才培養(yǎng)的目標(biāo).因此,無論是從提升教學(xué)效果還是從強(qiáng)化學(xué)生管理的角度來看,學(xué)生成績預(yù)測(cè)技術(shù)都具有重要的研究價(jià)值和實(shí)踐意義.

近年來,學(xué)生成績預(yù)測(cè)受到國內(nèi)外學(xué)者的廣泛關(guān)注,涌現(xiàn)出了一系列卓有成效的研究工作.早期的研究大多集中在教育學(xué)和心理學(xué)領(lǐng)域,試圖探索影響學(xué)生學(xué)業(yè)表現(xiàn)的關(guān)鍵因素,例如性格構(gòu)成、學(xué)習(xí)動(dòng)機(jī)、家庭環(huán)境等.這類研究主要依據(jù)部分學(xué)生提供的自我評(píng)估報(bào)告,在樣本規(guī)模、時(shí)效性等方面存在較大的缺陷,所得出的結(jié)論也易受到受訪個(gè)體主觀意識(shí)的影響.部分研究采用學(xué)生在學(xué)習(xí)過程中的表現(xiàn)信息,例如出勤情況[3]、作業(yè)完成情況[4]、階段性測(cè)試成績[5]等,對(duì)學(xué)生的課程最終成績進(jìn)行預(yù)測(cè).由于課程學(xué)習(xí)過程的表現(xiàn)信息與最終成績存在較強(qiáng)的關(guān)聯(lián)性,所得模型往往可以取得較好的預(yù)測(cè)性能.但是,此類研究需要課程開展之后一段時(shí)間方可進(jìn)行,因而無法預(yù)測(cè)學(xué)生在課程初始階段的學(xué)習(xí)表現(xiàn),導(dǎo)致預(yù)測(cè)結(jié)果存在一定的滯后性[6].

值得注意的是,隨著我國高校信息化建設(shè)的持續(xù)推進(jìn),大學(xué)校園網(wǎng)絡(luò)認(rèn)證系統(tǒng)越來越完善,學(xué)生可以通過個(gè)人電腦或者移動(dòng)設(shè)備在校園內(nèi)方便地接入校園網(wǎng)絡(luò),各高校也逐步積累了豐富的學(xué)生校園上網(wǎng)行為數(shù)據(jù).教育心理學(xué)領(lǐng)域的研究已經(jīng)表明:人的外在行為表現(xiàn)和學(xué)習(xí)能力密切相關(guān).受此啟發(fā),我們認(rèn)為不同的上網(wǎng)行為可能也在一定程度上反映了學(xué)生不同的學(xué)習(xí)狀態(tài).例如,課余時(shí)間頻繁訪問教育類型網(wǎng)站表明學(xué)生持續(xù)保持學(xué)習(xí)狀態(tài),因而在考試中更有可能取得優(yōu)異的成績.因此,本文提出以校園上網(wǎng)行為感知為切入點(diǎn),對(duì)學(xué)生成績預(yù)測(cè)問題展開研究,通過分析挖掘?qū)W生的上網(wǎng)行為日志,構(gòu)建有效的學(xué)生行為特征,進(jìn)而預(yù)測(cè)學(xué)生未來的學(xué)業(yè)表現(xiàn).

然而,在實(shí)現(xiàn)上述目標(biāo)時(shí)仍面臨著諸多挑戰(zhàn):

1) 學(xué)生的上網(wǎng)行為通常按照時(shí)間順序被記錄,因而對(duì)上網(wǎng)行為進(jìn)行分析可以被看作是一個(gè)典型的行為序列建模問題[7].但是,上網(wǎng)行為往往持續(xù)發(fā)生,導(dǎo)致行為序列的長度很大,傳統(tǒng)的序列分析方法難以對(duì)長序列數(shù)據(jù)進(jìn)行有效分析.

2) 現(xiàn)有的相關(guān)工作[8-9]需要通過特征工程對(duì)學(xué)生行為序列進(jìn)行處理并提取特征,特征的可靠性高度依賴于人工經(jīng)驗(yàn)和領(lǐng)域先驗(yàn)知識(shí),設(shè)計(jì)合理有效的序列特征具有很高的難度.

3) 由于很難準(zhǔn)確地預(yù)測(cè)學(xué)生的具體成績分值,現(xiàn)有方法大多關(guān)注于預(yù)測(cè)學(xué)生在成績上的相對(duì)排名.但是,對(duì)于學(xué)生數(shù)量有限的專業(yè),如何在訓(xùn)練時(shí)有效緩解數(shù)據(jù)稀疏性問題是一個(gè)亟待解決的問題.

針對(duì)上述問題,本文提出了一種雙層自注意力網(wǎng)絡(luò)(dual-level self-attention network, DEAN)來建模學(xué)生的上網(wǎng)行為特征.受到近年來自注意力機(jī)制在諸多序列建模任務(wù)上的良好表現(xiàn)[10],該深度學(xué)習(xí)模型可以端到端地學(xué)習(xí)學(xué)生上網(wǎng)行為特征,避免引入特征工程.具體來說,首先利用低層級(jí)的自注意力層來建模學(xué)生一天內(nèi)不同時(shí)間段的上網(wǎng)行為,構(gòu)建局部上網(wǎng)行為特征;進(jìn)一步地,利用高層級(jí)的自注意力層將學(xué)生在不同日期的局部上網(wǎng)行為進(jìn)行融合,最終構(gòu)建全局上網(wǎng)行為特征.相比于傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)等方法[11],自注意力網(wǎng)絡(luò)被證明可以更為有效地捕獲序列數(shù)據(jù)之間的長時(shí)依賴關(guān)系[10],而本文進(jìn)一步引入級(jí)聯(lián)式架構(gòu)來分別提取學(xué)生的局部上網(wǎng)行為特征和全局上網(wǎng)行為特征,從而可以更好地解決長序列數(shù)據(jù)建模問題.

此外,本文引入多任務(wù)學(xué)習(xí)策略[12].通過共享雙層自注意力層的模型參數(shù),實(shí)現(xiàn)在統(tǒng)一的框架下同時(shí)訓(xùn)練面向不同專業(yè)的學(xué)生成績預(yù)測(cè)模型,從而有效緩解部分專業(yè)訓(xùn)練樣本不足的問題.最后,設(shè)計(jì)了一個(gè)基于學(xué)生排名差的代價(jià)敏感損失函數(shù)(cost-sensitive loss)[13],進(jìn)一步提升了預(yù)測(cè)方法的準(zhǔn)確性.

本文工作的主要貢獻(xiàn)有3個(gè)方面:

1) 與傳統(tǒng)方法基于學(xué)生歷史學(xué)習(xí)表現(xiàn)或校園一卡通刷卡記錄等數(shù)據(jù)進(jìn)行研究的思路不同,本文從校園上網(wǎng)行為感知的角度來進(jìn)行學(xué)生成績預(yù)測(cè),為后續(xù)研究提供了新思路、新視角.

2) 構(gòu)建了一個(gè)端到端的雙層自注意力網(wǎng)絡(luò)來有效建模學(xué)生的上網(wǎng)行為序列數(shù)據(jù),進(jìn)而預(yù)測(cè)學(xué)生成績;同時(shí),引入多任務(wù)學(xué)習(xí)策略將面向不同專業(yè)的學(xué)生成績預(yù)測(cè)問題進(jìn)行關(guān)聯(lián),并設(shè)計(jì)了基于學(xué)生排名差的代價(jià)敏感損失函數(shù)進(jìn)一步提高預(yù)測(cè)性能.

3) 收集構(gòu)建了一個(gè)真實(shí)的校園上網(wǎng)行為數(shù)據(jù)集,并將學(xué)生上網(wǎng)行為數(shù)據(jù)和成績數(shù)據(jù)相關(guān)聯(lián).在該數(shù)據(jù)上的實(shí)驗(yàn)結(jié)果表明,相比于傳統(tǒng)的序列分析方法,本文所提出的方法具有更好的性能.

1 相關(guān)工作

學(xué)生成績是衡量教育質(zhì)量和教學(xué)水平的關(guān)鍵指標(biāo).學(xué)生成績預(yù)測(cè)研究對(duì)于實(shí)現(xiàn)個(gè)性化教學(xué)、提升教學(xué)質(zhì)量具有重要意義,因而近年來受到研究人員的廣泛關(guān)注.

1.1 在線教學(xué)場(chǎng)景中的學(xué)生成績預(yù)測(cè)

面向在線教學(xué)場(chǎng)景,Ren等人[14]基于學(xué)生在慕課平臺(tái)上的視頻觀看時(shí)長、每日學(xué)習(xí)的模塊數(shù)目以及完成測(cè)驗(yàn)的次數(shù)等信息,采用多元線性回歸模型預(yù)測(cè)學(xué)生在課程上的最終成績.Jiang等人[15]根據(jù)學(xué)生開課后第一周的學(xué)習(xí)行為來預(yù)測(cè)他們最終的課程成績等級(jí).He等人[16]根據(jù)學(xué)生每周的課程參與情況,采用遷移學(xué)習(xí)方法在每一周預(yù)測(cè)學(xué)生中途放棄課程學(xué)習(xí)的可能性.Macfadyen等人[17]考慮學(xué)生在課程討論區(qū)中的發(fā)帖數(shù)量和評(píng)測(cè)完成情況,分別利用回歸和分類方法預(yù)測(cè)學(xué)生最終的成績分值以及是否存在不及格的風(fēng)險(xiǎn).蔣卓軒等人[18]針對(duì)中文慕課中學(xué)習(xí)行為的特點(diǎn)將學(xué)生分類,并選擇開課后前幾周的學(xué)習(xí)行為特征,采用線性分類器預(yù)測(cè)學(xué)生是否能順利獲得課程結(jié)業(yè)證書.Li等人[19]將不同的在線學(xué)習(xí)行為看作學(xué)生的多視圖特征,利用半監(jiān)督多視圖學(xué)習(xí)算法預(yù)測(cè)學(xué)生是否能完成課程.Feng等人[20]基于學(xué)習(xí)行為對(duì)學(xué)生進(jìn)行聚類,并利用卷積神經(jīng)網(wǎng)絡(luò)融合學(xué)生個(gè)人學(xué)習(xí)行為、同一類別中的他人學(xué)習(xí)行為和課程信息來預(yù)測(cè)學(xué)生是否能完成課程.

在線教育更加需要個(gè)性化、多樣性以及適應(yīng)性的學(xué)習(xí).在學(xué)生數(shù)量龐大的情況下,跟蹤和了解每個(gè)學(xué)生的學(xué)習(xí)情況對(duì)于老師來說困難很大.因此,知識(shí)追蹤(knowledge tracing, KT)近年來受到越來越多的關(guān)注.知識(shí)追蹤的流行算法有貝葉斯知識(shí)追蹤(Bayesian knowledge tracing, BKT)[21]、深度知識(shí)追蹤(deep knowledge tracing, DKT)[22]等.當(dāng)學(xué)生完成一個(gè)練習(xí)后,模型會(huì)動(dòng)態(tài)地更新學(xué)生的知識(shí)狀態(tài).從這個(gè)角度來看,知識(shí)追蹤的基本思想與典型的序列行為挖掘[23]相似,基于學(xué)生相關(guān)的靜態(tài)數(shù)據(jù),如考試數(shù)據(jù)[24]等,發(fā)現(xiàn)和建模學(xué)生的潛在特征或技能熟練程度.Yu等人[25]收集了學(xué)生的練習(xí)記錄和習(xí)題信息,LSTM結(jié)合注意力機(jī)制來關(guān)注學(xué)生對(duì)于類似題目的訓(xùn)練情況.Chen等人[26]提出的KPT(knowledge proficiency tracing)模型通過加入教育先驗(yàn)知識(shí)提高了模型的可解釋性.

1.2 在校園教學(xué)場(chǎng)景中的學(xué)生成績預(yù)測(cè)

面向校園教學(xué)場(chǎng)景,Huang等人[5]根據(jù)學(xué)生在前導(dǎo)課程和開課后過程性考核中的成績,分別采用4種常見的機(jī)器學(xué)習(xí)模型來預(yù)測(cè)學(xué)生在期末考試中的成績.類似地,Polyzou等人[27]根據(jù)學(xué)生的過往成績,利用多種機(jī)器學(xué)習(xí)模型來嘗試在學(xué)期開始之前對(duì)學(xué)生的課程期末成績進(jìn)行預(yù)測(cè).黃建明[28]根據(jù)不同課程之間的依賴關(guān)系以及學(xué)生在先導(dǎo)課程上的成績,提出了一種基于貝葉斯網(wǎng)絡(luò)模型的課程成績預(yù)測(cè)方法.Ma等人[29]在前期基于學(xué)生在已完成課程上的學(xué)習(xí)情況來預(yù)測(cè)其在新學(xué)期待開設(shè)課程上的成績.針對(duì)學(xué)生已完成課程不一致的問題,采用多示例學(xué)習(xí)方法將學(xué)生表示為包含不同課程的集合;并且采用多標(biāo)記學(xué)習(xí)方法同時(shí)建立多門待開設(shè)課程的預(yù)測(cè)模型,使得課程間的關(guān)聯(lián)關(guān)系得到潛在的利用.

考慮到人的外在行為表現(xiàn)和學(xué)習(xí)能力密切相關(guān),目前已有少量研究將校園行為信息引入到學(xué)生成績預(yù)測(cè)中.例如Lian等人[30]根據(jù)學(xué)生的借書記錄數(shù)據(jù),利用矩陣分解算法為學(xué)生推薦書目并預(yù)測(cè)學(xué)生的平均學(xué)分績點(diǎn)(grade point average, GPA)成績.此外,該研究組通過統(tǒng)計(jì)不同學(xué)生在同一地點(diǎn)共同出現(xiàn)的次數(shù)來度量學(xué)生之間的關(guān)系親密程度,并采用圖傳播算法預(yù)測(cè)學(xué)生的GPA等級(jí)[31].Cao等人[8]和Yao等人[32]根據(jù)校園一卡通刷卡記錄數(shù)據(jù),人為定義了代表學(xué)生校園行為規(guī)律性、學(xué)習(xí)勤奮程度和睡眠習(xí)慣的指標(biāo),并依據(jù)這些指標(biāo)預(yù)測(cè)學(xué)生的GPA排名.

對(duì)于學(xué)生上網(wǎng)行為,Cao等人[33]統(tǒng)計(jì)分析了505名手機(jī)社交網(wǎng)站用戶收集的日志數(shù)據(jù),發(fā)現(xiàn)過度使用手機(jī)社交網(wǎng)站會(huì)對(duì)學(xué)業(yè)成績產(chǎn)生負(fù)面影響.Chen等人[34]利用問卷調(diào)查的方法探討了大學(xué)生網(wǎng)絡(luò)使用情況與學(xué)業(yè)成績、人際關(guān)系、社會(huì)心理適應(yīng)及自我評(píng)價(jià)之間的關(guān)系,發(fā)現(xiàn)輕度上網(wǎng)用戶的學(xué)業(yè)成績以及對(duì)學(xué)習(xí)狀況的滿意度均優(yōu)于重度上網(wǎng)用戶.Xu等人[9]人為定義了上網(wǎng)時(shí)間、上網(wǎng)頻率、上網(wǎng)流量和分時(shí)段上網(wǎng)時(shí)間4種特征,基于淺層機(jī)器學(xué)習(xí)的方法來預(yù)測(cè)學(xué)生成績.

近些年,深度學(xué)習(xí)發(fā)展迅速,大家開始將深度學(xué)習(xí)與時(shí)間序列的傳統(tǒng)模型結(jié)合起來,出現(xiàn)了一些新的時(shí)間序列建模方法.Salinas等人[35]在深度學(xué)習(xí)的基礎(chǔ)上,提出了深度自回歸模型(DeepAR)對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行深度學(xué)習(xí),設(shè)計(jì)了基于LSTM(long short-term memory)的自回歸RNN架構(gòu)來解決概率預(yù)測(cè)問題.Vaswani等人[10]提出Transformer模型,該模型使用注意力機(jī)制來處理數(shù)據(jù),Transformer模型可以使用任意的歷史數(shù)據(jù),更加適合具有長期依賴的數(shù)據(jù).曹洪江等人[7]發(fā)現(xiàn)學(xué)生學(xué)習(xí)知識(shí)的時(shí)間是動(dòng)態(tài)的,提出利用LSTM模型預(yù)測(cè)學(xué)生成績.

如上所述,盡管文獻(xiàn)[9,33-34]已經(jīng)從校園上網(wǎng)行為感知的角度開展學(xué)生成績預(yù)測(cè)工作,也有序列建模的方式來進(jìn)行學(xué)生成績預(yù)測(cè),但在實(shí)現(xiàn)時(shí)都采用基本的統(tǒng)計(jì)分析方法或基于特征工程的淺層機(jī)器學(xué)習(xí)方法.與之相反,本文構(gòu)建了一個(gè)端到端的雙層自注意力網(wǎng)絡(luò)來有效建模學(xué)生的上網(wǎng)行為序列.

2 數(shù)據(jù)收集與分析

為了支撐研究順利開展,本文收集構(gòu)建了學(xué)生校園上網(wǎng)行為數(shù)據(jù)集,并將學(xué)生的上網(wǎng)行為數(shù)據(jù)和成績數(shù)據(jù)相關(guān)聯(lián).本節(jié)首先介紹數(shù)據(jù)集的收集過程,然后通過相關(guān)性分析來說明不同校園上網(wǎng)行為和學(xué)生成績之間的關(guān)系.

2.1 數(shù)據(jù)收集

隨著教育信息化的發(fā)展,校園網(wǎng)絡(luò)認(rèn)證系統(tǒng)在各高校內(nèi)迅速普及,每個(gè)學(xué)生海量的細(xì)粒度校園上網(wǎng)行為以一種完全隱蔽的方式被記錄下來.學(xué)生通過學(xué)生ID可接入校園網(wǎng),一旦學(xué)生發(fā)出網(wǎng)絡(luò)訪問請(qǐng)求,都會(huì)在網(wǎng)絡(luò)日志文件中產(chǎn)生有良好格式和標(biāo)識(shí)符的相應(yīng)記錄,包括一個(gè)加密的學(xué)生ID、請(qǐng)求的URL、請(qǐng)求的時(shí)間、應(yīng)用類型、具體應(yīng)用、源和目標(biāo)IP地址,以及一些終端、服務(wù)器端口等信息.結(jié)合這些記錄可以將學(xué)生ID和他們的上網(wǎng)行為進(jìn)行一一對(duì)應(yīng).

本文中的學(xué)生校園上網(wǎng)行為數(shù)據(jù)來自于國內(nèi)一所公立大學(xué),經(jīng)過網(wǎng)絡(luò)中心批準(zhǔn),我們收集了7個(gè)不同的專業(yè)共519名學(xué)生80天內(nèi)的校園上網(wǎng)行為數(shù)據(jù),時(shí)間跨度是從2020-10-01—2020-12-19.我們對(duì)上網(wǎng)行為數(shù)據(jù)進(jìn)行脫敏處理,用偽學(xué)號(hào)代替真實(shí)學(xué)號(hào)從而達(dá)到匿名化效果,把偽學(xué)號(hào)作為主鍵把其他不相關(guān)的字段刪除,確保不會(huì)泄露網(wǎng)絡(luò)用戶的隱私.具體專業(yè)以及各專業(yè)學(xué)生數(shù)量如表1所示:

Table 1 Number of Students of Different Majors表1 不同專業(yè)學(xué)生數(shù)量

在對(duì)學(xué)生的校園上網(wǎng)行為進(jìn)行分析的過程中發(fā)現(xiàn),學(xué)生日常訪問站點(diǎn)的數(shù)量龐大,為了便于理解學(xué)生的上網(wǎng)行為模式,我們按照訪問站點(diǎn)的類型對(duì)學(xué)生的上網(wǎng)行為進(jìn)行了分類,分別將學(xué)生對(duì)于新聞、IT相關(guān)、教育、娛樂、Web應(yīng)用、生活相關(guān)、經(jīng)濟(jì)、流媒體、社交、網(wǎng)購、導(dǎo)航、移動(dòng)下載以及其他類別網(wǎng)站的訪問作為13種不同類型的上網(wǎng)行為.考慮到絕大多數(shù)學(xué)生在夜晚休息期間較少進(jìn)行上網(wǎng)操作,本文以1 h為單位時(shí)間段,僅統(tǒng)計(jì)學(xué)生在每天早上6點(diǎn)至晚上12點(diǎn)共計(jì)18個(gè)時(shí)間段內(nèi)產(chǎn)生不同類型上網(wǎng)行為的頻次.

對(duì)于成績信息,我們通過學(xué)校教務(wù)系統(tǒng)獲取了全部學(xué)生在2020—2021學(xué)年秋季學(xué)期末在不同課程上取得的考試成績和課程學(xué)分,并進(jìn)一步計(jì)算得到學(xué)生的GPA.直接對(duì)學(xué)生的絕對(duì)GPA分?jǐn)?shù)進(jìn)行估計(jì)是相當(dāng)困難的,相比之下,更為可行的方式是預(yù)測(cè)學(xué)生在成績上的相對(duì)排名[8,32].為此,本文按照GPA分?jǐn)?shù)遞減的順序?qū)W(xué)生進(jìn)行排序,即成績較好的學(xué)生被排在較靠前的位置.

2.2 學(xué)生校園上網(wǎng)行為與成績的相關(guān)性分析

在獲取數(shù)據(jù)后,本文對(duì)學(xué)生的上網(wǎng)行為和成績進(jìn)行了相關(guān)性分析.圖1(a)和圖1(b)分別展示了各專業(yè)學(xué)生對(duì)于教育類型網(wǎng)站和娛樂類型網(wǎng)站的訪問頻率與他們成績排名之間的相關(guān)關(guān)系散點(diǎn)圖.

Fig. 1 The relationship between interview rating and score ranking圖1 訪問頻率與成績排名之間的關(guān)系

為了方便展示,我們對(duì)網(wǎng)站訪問頻率進(jìn)行了去均值化操作,即先統(tǒng)計(jì)出同一專業(yè)所有學(xué)生對(duì)某類型網(wǎng)站訪問頻率的平均值,再將該專業(yè)每一位學(xué)生對(duì)此類型網(wǎng)站訪問頻率減去平均值.同時(shí),采用離差標(biāo)準(zhǔn)化(min-max normalization)方法將成績排名變量變化到0~1之間,即成績排名值越接近0,意味著成績?cè)胶?從圖上可以觀察到,越頻繁訪問教育類型網(wǎng)站的學(xué)生通常會(huì)取得更好的成績,而娛樂類型網(wǎng)站的訪問頻率卻與學(xué)生成績排名呈現(xiàn)明顯的負(fù)相關(guān)關(guān)系.

其次,本文統(tǒng)計(jì)了任意兩名學(xué)生在相同時(shí)間段產(chǎn)生同一種上網(wǎng)行為的頻率,以及他們?cè)趯W(xué)期末成績排名上的差值.進(jìn)一步地,將成績排名差值相同的學(xué)生集合在一起,并統(tǒng)計(jì)集合內(nèi)每一對(duì)學(xué)生相同上網(wǎng)行為頻率的中位數(shù).圖2展示了學(xué)前教育專業(yè)的學(xué)生的成績排名差值與相同上網(wǎng)行為頻率中位數(shù)之間的相關(guān)關(guān)系散點(diǎn)圖.這里依舊采用了離差標(biāo)準(zhǔn)化方法將2個(gè)變量的值變化到0~1之間.可以看到,成績排名越接近的學(xué)生會(huì)更頻繁地在同一時(shí)間段內(nèi)產(chǎn)生相同類型的上網(wǎng)行為.這再次驗(yàn)證了,學(xué)生的校園上網(wǎng)行為和學(xué)習(xí)成績之間具有密切的關(guān)聯(lián)性.

Fig. 2 The relationship between the median of the same online behavior frequency and the ranking difference圖2 相同上網(wǎng)行為頻率的中位數(shù)與排名差值之間的關(guān)系

3 方 法

為了有效利用學(xué)生上網(wǎng)行為數(shù)據(jù)來預(yù)測(cè)他們的成績,本文構(gòu)建了一個(gè)端到端的雙層自注意力網(wǎng)絡(luò)DEAN.同時(shí),引入多任務(wù)學(xué)習(xí)機(jī)制,將面向不同專業(yè)學(xué)生的成績預(yù)測(cè)問題進(jìn)行關(guān)聯(lián),并設(shè)計(jì)了一個(gè)代價(jià)敏感損失函數(shù)來進(jìn)一步提高方法的性能.

3.1 問題定義

給定一個(gè)學(xué)生,本文收集該學(xué)生連續(xù)n天的上網(wǎng)行為記錄,即學(xué)生對(duì)于不同類型網(wǎng)站的訪問頻率.具體來說,可以用矩陣Ai∈l×m編碼學(xué)生在第i天的上網(wǎng)行為,其中m表示一天中時(shí)間段的個(gè)數(shù),l表示網(wǎng)站的類別個(gè)數(shù).設(shè)l為Ai的第j列,其進(jìn)一步表示了學(xué)生在第i天第j個(gè)時(shí)間段的上網(wǎng)行為,它的第k個(gè)元素代表了學(xué)生在該時(shí)間段內(nèi)對(duì)于第k種類型網(wǎng)站的訪問頻率.

遵循現(xiàn)有工作中的問題設(shè)定[8,32],本文旨在預(yù)測(cè)學(xué)生之間在成績上的相對(duì)排名.形式上,方法需要找到一個(gè)映射函數(shù)f,該函數(shù)將一個(gè)學(xué)生的上網(wǎng)行為表示映射為一個(gè)成績值,并根據(jù)該值對(duì)學(xué)生進(jìn)行排序.設(shè)u和v代表2個(gè)學(xué)生,yuv∈{+1,-1}代表兩者之間真實(shí)的成績相對(duì)關(guān)系,即yuv=+1表示u的成績優(yōu)于v,yuv=-1表示u的成績落后于v.在訓(xùn)練中,方法的目標(biāo)是使得映射函數(shù)f的輸出盡可能地滿足學(xué)生u和v之間的成績相對(duì)關(guān)系.也就是說,若yuv=+1,則應(yīng)使得f(u)>f(v);否則,則應(yīng)使得f(u)

(1)

其中S表示訓(xùn)練學(xué)生集合.

3.2 雙層自注意力網(wǎng)絡(luò)

由于學(xué)生上網(wǎng)行為序列的長度很大,傳統(tǒng)的序列建模方法難以對(duì)長序列數(shù)據(jù)進(jìn)行有效分析.為了解決該問題,本文提出的DEAN包含一個(gè)由局部自注意力層和全局自注意力層構(gòu)成的級(jí)聯(lián)式架構(gòu),分層次建模學(xué)生一天內(nèi)的局部上網(wǎng)行為特征和整個(gè)時(shí)間跨度上的全局上網(wǎng)行為特征. DEAN的框架圖如圖3所示:

Fig. 3 Architecture of the proposed DEAN圖3 本文提出的DEAN架構(gòu)圖

3.2.1 局部自注意力層

(2)

(3)

(4)

其中,Vl∈d×l是另一個(gè)需要學(xué)習(xí)的變換矩陣.

本文采用多頭自注意力機(jī)制(multi-head self-attention mechanism),學(xué)習(xí)h組不同的變換矩陣Ql,Kl和Vl,即同時(shí)在h個(gè)潛在空間內(nèi)進(jìn)行特征變換,然后將結(jié)果進(jìn)行拼接以實(shí)現(xiàn)信息互補(bǔ),并通過參數(shù)矩陣Wl∈hd×d與它們相乘,獲取多頭注意力機(jī)制的輸出,計(jì)算過程:

(5)

(6)

3.2.2 全局自注意力層

(7)

最終,經(jīng)過求和操作整合不同天的上網(wǎng)行為特征以獲得學(xué)生的全局行為特征表示:

(8)

其中,n為總天數(shù).

3.2.3 預(yù)測(cè)層

給定學(xué)生u,DEAN將u的全局行為特征表示輸入一個(gè)帶有sigmoid激活函數(shù)的全連接層來預(yù)測(cè)u的成績水平,即:

f(u)=σ(wpg+b),

(9)

其中,σ代表sigmoid函數(shù),wp代表權(quán)重向量,b代表偏置量.

3.3 多任務(wù)學(xué)習(xí)

由于不同專業(yè)的課程設(shè)置以及考試內(nèi)容不一致,不同專業(yè)的學(xué)生的成績無法進(jìn)行直接比較.本文將對(duì)各專業(yè)學(xué)生的成績預(yù)測(cè)問題視為一項(xiàng)單獨(dú)的任務(wù),并引入多任務(wù)學(xué)習(xí)策略[38-39],在一個(gè)統(tǒng)一的框架中同時(shí)建模多個(gè)任務(wù).遵循經(jīng)典的硬參數(shù)共享(hard parameter sharing)策略[40],使不同任務(wù)共享局部自注意力層和全局自注意力層的模型參數(shù),但分別構(gòu)建各自的預(yù)測(cè)層以實(shí)現(xiàn)特定任務(wù)的成績預(yù)測(cè).通過多任務(wù)學(xué)習(xí),DEAN可以利用不同任務(wù)之間潛在的關(guān)聯(lián)性,而且可以緩解由于某些專業(yè)的學(xué)生人數(shù)較少而導(dǎo)致的訓(xùn)練樣本不足的問題.

3.4 代價(jià)敏感學(xué)習(xí)

在模型實(shí)現(xiàn)過程中,我們發(fā)現(xiàn)模型可以較好地判斷2個(gè)排名差距較大的學(xué)生之間的成績相對(duì)關(guān)系,但對(duì)于排名較為接近的2個(gè)學(xué)生,在預(yù)測(cè)時(shí)卻經(jīng)常出現(xiàn)錯(cuò)誤.本文將前者稱為簡單樣本,將后者稱為困難樣本.直觀上解釋,困難樣本會(huì)導(dǎo)致更大的樣本損失和更多的反向傳播梯度;相反,簡單樣本在訓(xùn)練過程中的貢獻(xiàn)較小,在學(xué)習(xí)模型參數(shù)時(shí)作用有限.有鑒于此,本文進(jìn)一步引入代價(jià)敏感學(xué)習(xí)(cost-sensitive learning)的思想[41],根據(jù)成績排名差距為不同的學(xué)生樣本對(duì)分配不同的權(quán)重.給定2個(gè)學(xué)生u和v,定義他們組成的學(xué)生樣本對(duì)的權(quán)重:

(10)

其中,r(u)和r(v)表示u和v真實(shí)的成績排名,|S|代表專業(yè)內(nèi)的學(xué)生總數(shù).式(10)表明若r(u)和r(v)的差別越小,則u和v構(gòu)成了一個(gè)困難樣本,對(duì)應(yīng)的權(quán)重wuv越大,在訓(xùn)練過程中更應(yīng)優(yōu)先確保對(duì)u和v之間成績相對(duì)關(guān)系預(yù)測(cè)的準(zhǔn)確性.相應(yīng)地,模型的損失函數(shù)被修改:

(11)

4 實(shí) 驗(yàn)

本文數(shù)據(jù)集為隨機(jī)抽取的20萬對(duì)學(xué)生對(duì),實(shí)驗(yàn)過程中數(shù)據(jù)集的正負(fù)樣本比為1∶1.本文進(jìn)行了一系列實(shí)驗(yàn),從不同角度對(duì)本文所提出的學(xué)生成績預(yù)測(cè)方法的有效性進(jìn)行了驗(yàn)證.數(shù)據(jù)集統(tǒng)計(jì)情況如表2所示.所有的實(shí)驗(yàn)均在配置有2核2.4 GHz Intel Xeon處理器和1塊NVIDIA Titan XP顯卡的工作站上進(jìn)行.

Table 2 Dataset Statistics表2 數(shù)據(jù)集統(tǒng)計(jì)情況

4.1 實(shí)驗(yàn)設(shè)置

實(shí)驗(yàn)分別從每個(gè)專業(yè)中隨機(jī)挑選出70%和10%的學(xué)生用于訓(xùn)練和驗(yàn)證,將剩余20%的學(xué)生作為測(cè)試對(duì)象.基于深度學(xué)習(xí)框架Pytorch[42]對(duì)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練和測(cè)試.在訓(xùn)練時(shí),采用Adam優(yōu)化器[43],設(shè)批處理大小為32,所有網(wǎng)絡(luò)層的初始學(xué)習(xí)率為10-5.在訓(xùn)練過程中,每20個(gè)周期將學(xué)習(xí)率減半,總共訓(xùn)練50個(gè)周期.

4.2 評(píng)價(jià)指標(biāo)

準(zhǔn)確率(accuracy,Acc)和ROC曲線下方的面積大小(area under curve,AUC)都是被經(jīng)常采用的評(píng)價(jià)模型分類性能的評(píng)價(jià)指標(biāo).面向?qū)W生成績預(yù)測(cè)任務(wù),本文遵循了先前工作[30-32]的做法,選擇了Acc和斯皮爾曼等級(jí)相關(guān)系數(shù)評(píng)價(jià)模型的好壞.本文首先度量算法對(duì)于成對(duì)學(xué)生之間成績好壞判斷的Acc.給定測(cè)試學(xué)生集合S,Acc指標(biāo)定義:

(12)

同時(shí),采用斯皮爾曼等級(jí)相關(guān)系數(shù)[44]來度量算法預(yù)測(cè)的學(xué)生成績排序和真實(shí)成績排序之間的相關(guān)性.斯皮爾曼等級(jí)相關(guān)系數(shù)越高,表明算法對(duì)于學(xué)生成績排序的預(yù)測(cè)性能越好.斯皮爾曼等級(jí)相關(guān)系數(shù)ρ定義:

(13)

4.3 實(shí)驗(yàn)結(jié)果與分析

Fig. 4 Performance comparison between the methods across students of different majors圖4 不同專業(yè)學(xué)生在不同方法上的準(zhǔn)確率比較

4.3.1 對(duì)比實(shí)驗(yàn)

在實(shí)驗(yàn)中,將本文所提出的雙層自注意力網(wǎng)絡(luò)DEAN與3種傳統(tǒng)的深度序列建模方法進(jìn)行對(duì)比,包括:長短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory, LSTM)[45]、時(shí)序卷積網(wǎng)絡(luò)(temporal convolutional network, TCN)[46]以及Transformer網(wǎng)絡(luò)[10].此外,實(shí)驗(yàn)還選擇分層注意力網(wǎng)絡(luò)(hierarchical attention network, HAN)[47]作為基線方法. 與DEAN類似,HAN基于LSTM采用雙層注意力機(jī)制首先融合學(xué)生一天內(nèi)不同時(shí)間段的上網(wǎng)行為,進(jìn)而將學(xué)生在不同天的上網(wǎng)行為進(jìn)行融合.不同方法之間的性能對(duì)比如表3所示:

Table 3 Performance Comparison of Different Methods表3 不同方法的性能比較 %

從表3中可以看出,相比其他4種方法,本文所提出的DEAN模型在學(xué)生成績預(yù)測(cè)任務(wù)上取得了最好的結(jié)果.具體地說,DEAN在準(zhǔn)確率和斯皮爾曼等級(jí)相關(guān)系數(shù)上分別達(dá)到了74.06%和65.85%的成績,大幅超過了次優(yōu)模型Transformer,在2個(gè)指標(biāo)上分別獲得了3.78%和4.68%的相對(duì)提升.

比較而言,LSTM,TCN和Transformer直接將學(xué)生長時(shí)間連續(xù)的行為序列作為輸入進(jìn)行學(xué)習(xí),但如前文所分析,對(duì)長序列數(shù)據(jù)直接建模面臨著較大的困難.HAN和DEAN都采用了級(jí)聯(lián)式架構(gòu),分別對(duì)學(xué)生每一天的局部上網(wǎng)行為特征和整體時(shí)間跨度上的全局上網(wǎng)行為特征進(jìn)行建模.我們認(rèn)為,DEAN優(yōu)于HAN的原因可能包括:1)HAN以LSTM作為模型主框架,而過往的工作[7,10]已經(jīng)證明LSTM在許多序列建模任務(wù)上的性能落后于DEAN所采用的自注意力網(wǎng)絡(luò);2)DEAN引入了多頭注意力機(jī)制,從而可以同時(shí)在多個(gè)不同的潛在空間內(nèi)進(jìn)行特征學(xué)習(xí),并通過融合不同空間的特征實(shí)現(xiàn)信息互補(bǔ),有效提升了模型的預(yù)測(cè)能力.

不同專業(yè)的學(xué)生數(shù)量不同,會(huì)影響到實(shí)驗(yàn)結(jié)果.本文進(jìn)一步討論了不同方法對(duì)不同專業(yè)的學(xué)生進(jìn)行成績預(yù)測(cè)時(shí)的性能比較,圖4展示了實(shí)驗(yàn)結(jié)果.正如預(yù)期的那樣,本文所提出的DEAN在全部專業(yè)的預(yù)測(cè)結(jié)果都優(yōu)于其他的方法.

4.3.2 消融實(shí)驗(yàn)

為了進(jìn)一步驗(yàn)證本文所提方法中關(guān)鍵部件的有效性,我們進(jìn)行了一系列消融研究:

1) 級(jí)聯(lián)式自注意力架構(gòu)的有效性

本實(shí)驗(yàn)對(duì)比了DEAN的變體,即僅考慮學(xué)生在各時(shí)間段局部上網(wǎng)行為的單層自注意力網(wǎng)絡(luò)DEAN-Local和僅融合學(xué)生在不同天上網(wǎng)行為的單層自注意力網(wǎng)絡(luò)DEAN-Global.DEAN-Local是指直接將學(xué)生在整個(gè)時(shí)間跨度上的上網(wǎng)行為按照時(shí)間段展開為一個(gè)長序列數(shù)據(jù),輸入單層自注意力網(wǎng)絡(luò)進(jìn)行成績預(yù)測(cè).DEAN-Global則是指直接統(tǒng)計(jì)學(xué)生在每一天訪問不同類型網(wǎng)站的頻次來獲得日期級(jí)別的行為特征,通過單層注意力網(wǎng)絡(luò)融合不同日期的上網(wǎng)行為進(jìn)行成績預(yù)測(cè).

表4列出了DEAN,DEAN-Local以及DEAN-Global之間的性能對(duì)比.可以看到,DEAN在2個(gè)評(píng)價(jià)指標(biāo)上均明顯優(yōu)于僅基于單層注意力網(wǎng)絡(luò)的DEAN-Local和DEAN-Global,這表明DEAN中的級(jí)聯(lián)式自注意力網(wǎng)絡(luò)架構(gòu)可以有效提高模型的特征學(xué)習(xí)能力.

Table 4 Effect of Hierarchical Self-Attention Architecture表4 級(jí)聯(lián)式自注意力架構(gòu)的影響 %

2) 多任務(wù)學(xué)習(xí)的有效性

本文通過引入多任務(wù)學(xué)習(xí)策略來緩解面向單個(gè)專業(yè)的學(xué)生成績預(yù)測(cè)任務(wù)中訓(xùn)練數(shù)據(jù)較小的問題.表5比較了引入和不引入多任務(wù)學(xué)習(xí)策略的DEAN方法在性能上的差異.可以看到,前者在準(zhǔn)確率和斯皮爾曼等級(jí)相關(guān)系數(shù)上分別提高了2.16%和1.12%.這說明多任務(wù)學(xué)習(xí)策略確實(shí)使得模型可以充分利用不同任務(wù)之間潛在的關(guān)聯(lián)性,并在一定程度上緩解了數(shù)據(jù)不足的問題.

Table 5 Effect of Multi-Task Learning表5 引入多任務(wù)學(xué)習(xí)的影響 %

3) 代價(jià)敏感學(xué)習(xí)的有效性

為了緩解困難樣本帶來的預(yù)測(cè)準(zhǔn)確率低的問題,本文引入了基于學(xué)生排名差的代價(jià)敏感損失函數(shù),即根據(jù)成對(duì)樣本中2個(gè)學(xué)生的成績排名差距,自適應(yīng)地為其生成一個(gè)權(quán)重,排名越相近的樣本權(quán)重越大.表6展示了在使用和沒有使用代價(jià)敏感損失的情況下所提出的DEAN方法的結(jié)果,即分別通過最小化式(1)和式(11)中的損失函數(shù)來訓(xùn)練模型.可以看到,基于學(xué)生排名差的代價(jià)敏感損失函數(shù)確實(shí)對(duì)方法性能提升起到了正向作用.

Table 6 Effect of Cost-Sensitive Loss表6 使用代價(jià)敏感損失的影響 %

4.3.3 不同類型上網(wǎng)行為對(duì)成績的影響比較

如2.2節(jié)所述,學(xué)生不同類型的上網(wǎng)行為與學(xué)習(xí)成績之間的關(guān)聯(lián)性是不同的.為了進(jìn)一步定量地分析這種差異性,我們分別利用單一類型上網(wǎng)行為數(shù)據(jù)進(jìn)行成績預(yù)測(cè).圖5展示了各方法在利用不同類型上網(wǎng)行為時(shí)的預(yù)測(cè)準(zhǔn)確率.

Fig. 5 Performance comparison between different methods when using each type of online behavior data圖5 不同方法在利用單一類型上網(wǎng)行為數(shù)據(jù)時(shí)的性能比較

從圖5中可以得到3個(gè)結(jié)論:1)相比于表3中的結(jié)果,當(dāng)僅利用單一類型上網(wǎng)行為數(shù)據(jù)時(shí),各方法的性能均出現(xiàn)了顯著下降,這說明有效融合多種類型的上網(wǎng)行為數(shù)據(jù)對(duì)于提升學(xué)生成績預(yù)測(cè)的精度至關(guān)重要;2)無論使用何種類型的上網(wǎng)行為數(shù)據(jù),DEAN均優(yōu)于其他對(duì)比方法,再次驗(yàn)證了本文所提方法的有效性;3)基于學(xué)生對(duì)于教育、IT相關(guān)、新聞以及娛樂類型站點(diǎn)的訪問數(shù)據(jù)可以相對(duì)更為準(zhǔn)確地預(yù)測(cè)學(xué)生的成績,這與之前我們進(jìn)行數(shù)據(jù)分析的結(jié)果大致吻合.直觀上理解,頻繁地訪問教育、IT相關(guān)或新聞?lì)愋途W(wǎng)站,可能代表學(xué)生在持續(xù)地?cái)U(kuò)充自己的知識(shí)面,反映了學(xué)生良好的學(xué)習(xí)態(tài)度,因而與學(xué)生成績密切相關(guān);相反,長時(shí)間瀏覽娛樂類型站點(diǎn)的學(xué)生可能無法在學(xué)習(xí)中投入足夠的精力,導(dǎo)致相對(duì)落后的成績,這種負(fù)相關(guān)關(guān)系也可以幫助我們更好地進(jìn)行學(xué)生成績預(yù)測(cè).

5 總結(jié)與展望

本文提出以校園上網(wǎng)行為感知為切入點(diǎn),對(duì)學(xué)生成績預(yù)測(cè)問題展開研究,通過分析挖掘?qū)W生的上網(wǎng)行為日志,構(gòu)建有效的學(xué)生行為特征,進(jìn)而預(yù)測(cè)學(xué)生未來的學(xué)業(yè)表現(xiàn).本文提出了一種端到端的雙層自注意力網(wǎng)絡(luò),引入級(jí)聯(lián)式的自注意力機(jī)制來分別提取學(xué)生每一天的局部上網(wǎng)行為特征和長時(shí)間的全局上網(wǎng)行為特征.同時(shí),引入多任務(wù)學(xué)習(xí)策略將面向不同專業(yè)的學(xué)生成績預(yù)測(cè)問題進(jìn)行關(guān)聯(lián),并設(shè)計(jì)了基于學(xué)生排名差的代價(jià)敏感損失函數(shù)進(jìn)一步提高預(yù)測(cè)性能.在真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果證明了本文提出的雙層自注意力網(wǎng)絡(luò)在學(xué)生成績預(yù)測(cè)問題上的有效性.

我們希望通過本研究,能夠激發(fā)人們對(duì)校園上網(wǎng)行為與學(xué)習(xí)成績關(guān)聯(lián)性的研究興趣.進(jìn)一步的研究可以通過分析更多類型的上網(wǎng)行為,為教育者開展學(xué)生學(xué)習(xí)管理提供更全面的參考.在未來的研究中,可以參考課程學(xué)習(xí)的思想,使模型先從容易的樣本開始學(xué)習(xí),再逐漸進(jìn)階到困難的樣本并進(jìn)一步驗(yàn)證方法在更大規(guī)模數(shù)據(jù)集上的有效性.

作者貢獻(xiàn)聲明:姚麗為論文所述工作的主要完成人,負(fù)責(zé)收集數(shù)據(jù)、實(shí)驗(yàn)設(shè)計(jì)與實(shí)施、文章撰寫;崔超然對(duì)論文提出針對(duì)性修改意見,負(fù)責(zé)文章校審;馬樂樂負(fù)責(zé)處理數(shù)據(jù)、構(gòu)建數(shù)據(jù)集,并完善課題思路和實(shí)驗(yàn)設(shè)計(jì);王飛超負(fù)責(zé)提供數(shù)據(jù)、收集數(shù)據(jù)、分析數(shù)據(jù);馬玉玲負(fù)責(zé)論文排版與圖形繪制;陳勐負(fù)責(zé)對(duì)實(shí)驗(yàn)部分提供技術(shù)性指導(dǎo);尹義龍對(duì)論文的方法缺陷提出改進(jìn)意見并完善最終版修訂.

猜你喜歡
注意力校園預(yù)測(cè)
無可預(yù)測(cè)
黃河之聲(2022年10期)2022-09-27 13:59:46
選修2-2期中考試預(yù)測(cè)卷(A卷)
選修2-2期中考試預(yù)測(cè)卷(B卷)
讓注意力“飛”回來
“揚(yáng)眼”APP:讓注意力“變現(xiàn)”
不必預(yù)測(cè)未來,只需把握現(xiàn)在
校園的早晨
琴童(2017年3期)2017-04-05 14:49:04
春滿校園
A Beautiful Way Of Looking At Things
開心校園
巴中市| 西林县| 拜泉县| 彩票| 垦利县| 余江县| 神池县| 广汉市| 同德县| 合江县| 凌源市| 商城县| 荔波县| 崇左市| 嘉祥县| 随州市| 岱山县| 于都县| 伊川县| 莱州市| 固镇县| 定兴县| 太白县| 新兴县| 竹山县| 故城县| 隆昌县| 临海市| 绥江县| 平陆县| 德保县| 武乡县| 合肥市| 汉源县| 明星| 新巴尔虎右旗| 青阳县| 姜堰市| 宁晋县| 称多县| 汕头市|