国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于邏輯回歸算法的MOOC平臺學習行為特征相關(guān)性研究

2017-07-07 13:21:36
上饒師范學院學報 2017年3期
關(guān)鍵詞:次數(shù)邏輯學習者

侯 海 平

(安徽財貿(mào)職業(yè)學院 電子信息系,安徽 合肥 230061)

?

基于邏輯回歸算法的MOOC平臺學習行為特征相關(guān)性研究

侯 海 平

(安徽財貿(mào)職業(yè)學院 電子信息系,安徽 合肥 230061)

主要研究和分析軟件技術(shù)領域的MOOC平臺學習者行為數(shù)據(jù)與學習完成度之間關(guān)系。先將學習者行為劃分為選課行為和聽課行為,再匯總和預處理相關(guān)指標數(shù)據(jù),并采用邏輯回歸算法的分類模型計算得出相關(guān)系數(shù)。最后評價該模型的有效性,并提出MOOC平臺在引導用戶學習行為功能上的設計建議。

MOOC;軟件技術(shù);學習行為;邏輯回歸

MOOC(慕課)這一新的教學模式相比單純的視頻公開課,具有正規(guī)課程的效能[1],與傳統(tǒng)的遠程教育相比,慕課又具有免費、課程豐富、自由度大、易于獲取等優(yōu)勢[2-4]。近年來,越來越多的人開始關(guān)注MOOC平臺的學習行為,試圖分析MOOC平臺的學習效果。

目前多數(shù)文章的研究主要集中在優(yōu)化教學設計、促進資源開發(fā)、改進評價方式、優(yōu)化教學平臺和改進學習支持服務等[5-6]方面。這些研究主要包括MOOC平臺發(fā)展的研究、學習者學習行為的研究、學習特征的研究、學習效果的研究等。文獻[7]總結(jié)分析了MOOC的發(fā)展、現(xiàn)狀和趨勢。文獻[8]主要圍繞學習者學習特征如注冊時間、下載資源次數(shù)、練習次數(shù)、測驗成績與最后能否獲取證書進行相關(guān)性研究。文獻[9]針對學習者學習特征進行分類的研究,根據(jù)學習過程和學習動機等因素將學習者進行分類。文獻[10]從大數(shù)據(jù)的角度分析了北大6門課在Coursera上學習者學習行為表現(xiàn)。

本文重點分析軟件技術(shù)專業(yè)相關(guān)課程MOOC平臺學習者學習行為特征,重點研究慕課網(wǎng)、51CTO學院、極客學院、CSDN學院、網(wǎng)易云課堂IT頻道、騰訊IT頻道等國內(nèi)領先的MOOC平臺。這些平臺用戶規(guī)模達百萬、課程數(shù)量達十萬、新課制作日更新量高、講師規(guī)模千人以上,為本課題調(diào)研學習者學習行為特點和規(guī)律提供了數(shù)據(jù)保障。

1 模型框架建立

本文主要對學習行為與學習完成度是否達標之間關(guān)系進行研究,屬于分類問題。解決分類問題的算法主要有決策樹、貝葉斯、邏輯回歸等。決策樹常應用于非線性問題,貝葉斯算法對自變量條件限制嚴格,而學習行為數(shù)據(jù)中大多是量化指標,邏輯回歸主要用于解決量化線性問題,且對指標數(shù)據(jù)限制較為寬松,即使數(shù)據(jù)不滿足條件獨立,也能通過訓練得到最優(yōu)模型。

邏輯回歸是屬于有監(jiān)督學習,該模型的因變量要求是一個二分類變量,如研究某某疾病檢驗是否為陽性、學習者成績是否及格等問題。本文研究的學習完成度是否達標正是一個二分類問題。

目前國內(nèi)外都有將邏輯回歸模型應用于MOOC學習者行為分析,然而現(xiàn)行研究中較少有對某一特定領域的MOOC學習行為與學習效果的關(guān)聯(lián)性進行研究。不同專業(yè)、不同課程MOOC平臺的適應度不一樣,學習行為特征差異較大。如軟件技術(shù)專業(yè)是一個強調(diào)動手實踐、課程體系內(nèi)容豐富、技術(shù)方向多、技術(shù)發(fā)展迭代快的領域。本文對各類主流軟件技術(shù)領域?qū)W習平臺海量學習行為數(shù)據(jù)進行收集、整理、提取和分析,總結(jié)分析學習者學習行為特點和規(guī)律,最終為MOOC平臺設計者在平臺設計、課程設計、用戶行為引導等方面提供改進建議。

本文首先通過Python開發(fā)爬蟲程序從MOOC平臺抓取相關(guān)數(shù)據(jù),根據(jù)學習者學習過程把上課前行為確定為選課行為,把選課后正式學習階段確定為聽課行為,并將所抓取數(shù)據(jù)預處理成相關(guān)行為數(shù)據(jù)。由于邏輯回歸模型的輸入數(shù)據(jù)大多要求為連續(xù)型或離線型指標,需要在數(shù)據(jù)處理過程中將某些定性指標離散化。然后通過輸入訓練數(shù)據(jù),對模型系數(shù)進行訓練,并對模型進行評價。最后根據(jù)模型結(jié)果對MOOC的改進提供相關(guān)建議。圖1是基于邏輯回歸模型對學習行為進行分析的流程,其中小箭頭表示模型設計過程中的數(shù)據(jù)流,大箭頭表示不同階段的銜接。

圖1 邏輯回歸分析流程圖

2 軟件領域MOOC平臺學習行為特征選取

通過Python編寫爬蟲程序獲取MOOC平臺學習行為數(shù)據(jù),獲取數(shù)據(jù)包括注冊時間早于開課時間的用戶數(shù)據(jù)、開課完成的課程數(shù)據(jù)以及學習者每次學習行為數(shù)據(jù)。然后從學習者整體學習過程中抽取關(guān)鍵學習環(huán)節(jié),這里抽取選課和聽課兩個環(huán)節(jié)進行分析。具體指標描述如表1。

表1 學習行為指標分類

選課行為分為所選課程每節(jié)課平均時長、課程包含案例程度兩個方面指標。每節(jié)課平均時長可以通過課程總時長除以課程節(jié)數(shù)求得。課程包含案例程度分為:純理論課案例較少、理論加實踐案例小但案例數(shù)量多、項目開發(fā)課程以案例為主線穿插知識。

聽課行為分為每次登錄賬戶時長、最近一個星期登錄次數(shù)、重復聽課次數(shù)。每次登錄賬戶聽課時長是指用戶每次登錄后的在線時長,從登錄成功到離開平臺的整個過程。最近一個星期登錄次數(shù)是指從數(shù)據(jù)采集時間點倒推7天內(nèi)統(tǒng)計用戶登錄次數(shù)。重復聽課次數(shù)是指學習者對課程中某節(jié)內(nèi)容反復學習的次數(shù)和,如第一節(jié)學習2次計重復1次,第二節(jié)學習3次計重復2次,其他節(jié)還未學習,則計該學習者該門課學習重復次數(shù)為3。

3 邏輯回歸模型構(gòu)建

3.1 學習完成度的定義

軟件開發(fā)技術(shù)課程難以使用試題考核成績反映學習效果,一般來說課程學習完成情況對于技能掌握具有重要影響。課程學習完成度是指學習者學習課程完成比例,也就是所學課程節(jié)數(shù)除以課程總節(jié)數(shù)。為了便于對問題的研究,這里采用平臺內(nèi)所有符合注冊時間早于課程發(fā)布時間的所有學習者課程完成度的均值為達標基準線,達到這一基準比例為學習完成度達標。從抓取數(shù)據(jù)中篩選符合條件的數(shù)據(jù),求得學習完成度平均水平為56.12%。如果某一次課程學習行為中學習完成度高于56.12%,則認為此次學習完成度達標,否則認為學習完成度未達標。

對于是否達標可以通過G→{0,1}來進行映射。邏輯回歸的因變量就可以通過0或1來表示。0表示學習完成度未達標,1表示學習完成度達標。那么就可以構(gòu)建5個指標與學習完成度是否達標之間的邏輯回歸模型。

3.2 輸入數(shù)據(jù)的預處理

由于很多MOOC平臺對于用戶請求數(shù)有單位時間限制,Python抓取數(shù)據(jù)是一個高頻的請求行為。整理Python所抓取的數(shù)據(jù)進行匯總,整理出有效數(shù)據(jù)50條。這些數(shù)據(jù)符合:(1)樣本數(shù)據(jù)是自變量指標的5~10倍,有利于訓練出更高準確率的自變量指標系數(shù);(2)所有參與的課程開課都已結(jié)束,方可統(tǒng)計學習完成度情況;(3)選取的數(shù)據(jù)中學習者必須在開課前報名選擇該門課。這些數(shù)據(jù)的采集通過編寫Python相關(guān)方法來將采集的原始數(shù)據(jù)計算后插入一個最終的數(shù)據(jù)庫表中。

每節(jié)課平均時長是連續(xù)型數(shù)值變量,反映的是每節(jié)課程的內(nèi)容量,用x1表示。課程包含案例程度必須進行離散化處理?!凹兝碚撜n案例較少”量化打分標記為1,“理論加實踐案例小但案例數(shù)量多”量化打分標記為2,“項目開發(fā)課程以案例為主線穿插知識”量化打分標記為3,用x2表示。每次登錄賬戶時長是求用戶每次登錄時長的平均值,用x3表示。最近一個星期登錄次數(shù)(x4表示)和重復聽課次數(shù)(x5表示)也是一個連續(xù)型數(shù)值變量,可以通過SQL函數(shù)和存儲過程進行處理獲得。學習完成度是否達標用y表示,0表示未達標,1表示已達標。表2為50條數(shù)據(jù)中前10條的示例數(shù)據(jù)。

表2 樣本數(shù)據(jù)中前10條情況

3.3 邏輯回歸模型構(gòu)建

當β邏輯回歸系數(shù),α截距項通過訓練數(shù)據(jù)確定后就能計算出學習完成度達標發(fā)生的概率。

3.4 使用樣本數(shù)據(jù)對邏輯回歸系數(shù)進行訓練

使用SPSS軟件對樣本數(shù)據(jù)進行訓練,為求得邏輯回歸模型中系數(shù)這里采用逐步回歸的方法。通過該方法將合理的引入自變量,每次引入對因變量影響最為顯著的自變量,同時對模型中的已有變量逐個進行檢驗,把不顯著的自變量逐個從模型中去除,最終得到的模型中既包含對因變量影響最為顯著的自變量,又去除了對因變量影響不顯著的自變量。在Block 0階段,從表3中觀察到常量,也就是截距項系數(shù)具有顯著性表現(xiàn)。表4為Block 0階段未引入變量的顯著性表現(xiàn)。

表3 方程式中的變量

表4 方程式中沒有的變量

在進入Block 1階段,SPSS將根據(jù)自變量顯著性逐個引入到邏輯回歸模型中,根據(jù)表4首先引入x2自變量進行訓練。根據(jù)表5數(shù)據(jù),可以看出模型再次引入x5。根據(jù)表6可以看出剩余自變量顯著性不符合要求將被剔除。

表5 方程式中的變量

表6 方程式中沒有的變量

表7 分類表a

再根據(jù)表5,可以得出邏輯回歸模型為:

求得學習完成度達標的概率為:

3.5 邏輯回歸模型評價

根據(jù)表7情況,在引入2個變量后預測準確性提高到96%,可見當前邏輯回歸模型較為理想,預測準確率較高。根據(jù)最終決定的邏輯回歸模型可以分析出:每節(jié)課平均時長、每次登錄賬戶時長、最近一個星期登錄次數(shù)并不能解釋學習完成度是否達標,而課程包含案例程度、重復聽課次數(shù)則與學習完成度是否達標有較強的關(guān)系。

4 結(jié)束語

首先分析學習者學習行為,總結(jié)歸納出5個方面指標:每節(jié)課平均時長、課程包含案例程度、每次登錄賬號時長、重復聽課次數(shù)。為了收集樣本數(shù)據(jù),使用Python語言編程根據(jù)數(shù)據(jù)有效性條件抓取了50個樣本數(shù)據(jù),并對邏輯回歸模型進行訓練。在模型的訓練階段使用逐步回歸方法,最終得出課程包含案例程度和重復聽課次數(shù)對學習完成度達標有較大影響。因此建議MOOC平臺應該引導講師發(fā)布更多含有綜合案例的課程,同時可以通過獎勵辦法提高重復聽課次數(shù),這些措施都將對學習者學習完成度有較好的影響。

[1] 李曉明.慕課:是櫥窗?還是店堂?[J].中國計算機學會通訊,2013,9(12):24-28.

[2] SIEMENS G.Connectivism:A learning theory for the digital age[EB/OL].(2005-04-05)[2014-06-01].http://www.ingedewaard.net/paper/connectivism/2005_siemens_ALearning Theory For The Digital Age.pdf.

[3] OSVALDO R C.Moocs and the AI-Stanford like courses:Two successful and distinct course formats for massive open online courses[J/OL].European Journal of Open,Distance and E-Learning,2012(2):1-13.[2014-06-01].http://files.eric.ed.gov/fulltext/EJ982976.pdf.

[4] DOWNS S.New technology supporting informal learning[J].Journal of Emerging Technologies in Web Intelligence,2010,2(1):27-33.

[5] 彭文輝,楊宗凱,黃克斌.網(wǎng)絡學習行為分析及其模型研究[J].中國電化教育,2006(10):31-35.

[6] 魏順平.在線學習行為特點及其影響因素分析研究[J].開放教育研究,2012(4):81-90.

[7] WALDROP M M.Online learning:Campus 2.0[J].Nature,2013,495(7440):160-163.

[8] 蔣卓軒,張巖,李曉明.基于MOOC數(shù)據(jù)的學習行為分析與預測[J].計算機研究與發(fā)展,2015(3):614-628.

[9] 梁林梅.MOOCs學習者:分類、特征與堅持性[J].比較教育研究,2015(1):28-34.

[10] 賈積有,廖靜敏,汪瓊.MOOC學習行為及效果的大數(shù)據(jù)分析——以北大6門MOOC為例[J].工業(yè)和信息化教育,2014(9):23-29.

Research on the Correlation of Learning Behavior Characteristics of MOOC Platform based on Logistic Regression Algorithm

HOU Haiping

(Department of Electronic Information ,Anhui Finance & Trade Vocational College,Hefei ,Hefei Anhui 230061,China)

This paper mainly researches and analyzes the relationship between the learners' behavior data and the degree of completion in the MOOC platform of software technology. First of all, the learners' behavior is divided into selecting course behavior and learning behavior, then summarizes and preprocesses relevant indicators data, and calculates the correlation coefficient of the classification model of logistic regression algorithm. Finally, the validity of the model is evaluated, and the design proposal of the MOOC platform is put forward to guide the user learning behavior.

MOOC; software technology; learning behavior; logistic regression

2017-03-27

安徽省高等學校省級質(zhì)量工程教學研究重點項目(2015jyxm629,2016jyxm0032)

侯海平(1980-),男,安徽無為人,講師,碩士,主要從事軟件技術(shù)、管理信息化方向研究。E-mail:hhp895@163.com

TP301.6

A

1004-2237(2017)03-0044-06

10.3969/j.issn.1004-2237.2017.03.009

猜你喜歡
次數(shù)邏輯學習者
刑事印證證明準確達成的邏輯反思
法律方法(2022年2期)2022-10-20 06:44:24
機場航站樓年雷擊次數(shù)計算
邏輯
2020年,我國汽車召回次數(shù)同比減少10.8%,召回數(shù)量同比增長3.9%
商用汽車(2021年4期)2021-10-13 07:16:02
創(chuàng)新的邏輯
一類無界算子的二次數(shù)值域和譜
你是哪種類型的學習者
學生天地(2020年15期)2020-08-25 09:22:02
十二星座是什么類型的學習者
女人買買買的神邏輯
37°女人(2017年11期)2017-11-14 20:27:40
依據(jù)“次數(shù)”求概率
安义县| 南康市| 九龙坡区| 城市| 曲松县| 蕲春县| 云霄县| 汪清县| 广安市| 瓮安县| 永德县| 鄂尔多斯市| 东港市| 龙江县| 杨浦区| 镇宁| 红河县| 台湾省| 洮南市| 陈巴尔虎旗| 土默特左旗| 桐乡市| 望都县| 南投市| 陇西县| 堆龙德庆县| 丰台区| 阜阳市| 潼关县| 临颍县| 定兴县| 鹤峰县| 通道| 巫山县| 时尚| 左云县| 卢湾区| 达拉特旗| 长葛市| 德保县| 潢川县|