張紫毓 李玉斌
摘 ?要: 隨著多媒體技術的發(fā)展,教育技術進入到大數(shù)據(jù)時代,數(shù)據(jù)挖掘等學習技術對教育領域的各種原理研究十分重要,然而怎樣把數(shù)據(jù)挖掘這種技術有效的應用到教育教學中是問題的關鍵所在。其中,本體構建就是一個重要的方法,該方法將會對研究行為規(guī)律、分析學生的行為產(chǎn)生重大的影響。本文在已有本體構建方法基礎上,通過總結本體構建過程,設計網(wǎng)絡學習空間中學習者本體構建方法并成功實施,最后對學習者本體進行一致性分析。這將為學習者提供精準的教學支持服務,實現(xiàn)個性化學習。同時,學習者本體的成功構建也將為智慧教育提供重要幫助。
關鍵詞: 數(shù)據(jù)挖掘;本體構建;一致性分析;個性化學習
中圖分類號: G434 ? ?文獻標識碼: A ? ?DOI:10.3969/j.issn.1003-6970.2019.04.036
本文著錄格式:張紫毓,李玉斌. 基于網(wǎng)絡學習行為的學習者本體構建[J]. 軟件,2019,40(4):168174
【Abstract】: With the development of multimedia technology, education technology has entered the era of big data. Learning technology such as data mining is very important to the study of various principles in the field of education. However, how to effectively apply data mining technology to education and teaching is the key to the problem. Among them, ontology construction is an important method, which will have a significant impact on the research of behavior rules and the analysis of students'behavior. Based on the existing ontology construction methods, this paper summarizes the process of ontology construction, designs and successfully implements the method of learner ontology construction in web-based learning space, and finally makes a consistent analysis of learner ontology. This will provide precise teaching support services for learners and realize personalized learning. At the same time, the successful construction of learner ontology will also provide important help for wisdom education.
【Key words】: Data mining; Ontology construction; Consistency analysis; Individualized learning
0 ?引言
近年來,本體構建成為人工智能領域發(fā)展較快的一項技術。對于本體的理解,不同的學者有不同的說法,有學者指出,本體的目的是知識共享和互操作;也有學者認為本體是不同個體間進行交流的一種語義基礎。此前,本體研究在資源、生物、醫(yī)學等領域已經(jīng)得到了廣泛的應用。例如,在個性化學習系統(tǒng)中對于數(shù)據(jù)庫原理這一學科的學習,要通過本體技術表示個性化學習系統(tǒng)中的學習資源,以此實現(xiàn)個性化學習系統(tǒng)的共享和個性化學習路徑推薦[1]。但是本體研究在學習者領域的應用還比較鮮見,本文是一個新的嘗試。學習者本體構建,就是要對學習者的信息進行標準化的描述,實現(xiàn)學習者信息的重用,為學習者提供個性化的教學支持。本文中,我們主要基于學習者學習行為這一屬性展開研究。
在進行學習者本體構建之前,首先要確定學習者本體構建的內(nèi)容和范圍?!痘趚API開放學習者畫像的構建與應用研究》一文已經(jīng)為本文學習者本體構建提供了重要的理論基礎[2],在此基礎上,本文將學習者本體構建對象分為成績、人工制品、學習報告、操作性行為、課程學習行為、互動交流行為、總結反思行為、學習投入、學習滿意度、使用意愿、學習動機和學習態(tài)度共12個方面。學習者本體包含與學習者本體構建對象相對應的12個子本體,這些子本體有機的組合在一起,形成完整的學習者本體。
學習者在網(wǎng)絡學習空間中的信息多種多樣,個體間又具有獨特性,因此學習者本體對象的劃分會根據(jù)我們研究的需求不同而不同。學習者的行為特征是學習者本體構建中最基本的對象,其他學習者本體構建對象都圍繞學習者行為特征進行刻畫和描述。
1 ?學習者本體的構建方法
1.1 ?學習者本體構建方法研究現(xiàn)狀
80年代,人工智能領域正式將“Ontology”用來表示建立抽象模型的一種理論;90年代,關于本體的研究逐年增長;進入21世紀,本體作為一項重要技術,廣泛應用于各個領域。國內(nèi)外學者提出了很多本體構建方法,他們通過這些方法,從流程、技術、方法的細節(jié)、應用領域等方面進行了系統(tǒng)的比較[3-4]。例如:馮蘭萍等通過重用等技術把本體用模塊的形式進行表示[5];李勇和張志剛提出本體構建流程包括8個環(huán)節(jié)[6];張文秀和朱慶華綜合多種方法的優(yōu)點提出了“循環(huán)法”[7]。
本研究以“循環(huán)法”為理論基礎,通過對本體構建過程和方法的總結,設計學習者本體構建方法,主要包括3個階段:學習者信息的收集階段、學習者本體模型的建立階段和學習者本體的一致性分 析[8]。該方法有兩點優(yōu)勢:
(1)增加信息的需求分析。在構建學習者本體之前,從不同的維度對本體構建所需數(shù)據(jù)的需求進行總結。這樣才能在收集數(shù)據(jù)時,明確需求,保證學習者本體中信息的標準化和精確性,切實解決教學利益相關者關注的焦點問題。
(2)模型構建階段明確給出學習者本體的詞匯表,保證學習者本體的可擴展性和易維護性。
1.2 ?學習者本體的構建原則
本文按照電影本體的構建原則并根據(jù)學習者本體的特點[8],給出以下學習者本體的構建原則,如下:
(1)盡量使用標準術語對本體進行描述
(2)要做到定義清晰。
(3)確保不使用不同的動詞來表達相同的概念,同層次概念保持最小的語義距離。
(4)可擴展性。學習者本體提供一個可共享的詞匯表,有足夠的動詞來清楚的表達任何可預見的學習事件。
(5)學習者本體位于信息的表達層次,與特定的符號級編碼無關。
1.3 ?利用本體開發(fā)軟件構建學習者本體
本文以OWL DL作為本體描述語言,它可以為本體構建提供描述邏輯的推理功能,描述邏輯是OWL的形式化基礎。Protege4.1作為本體編輯工具,具有如下幾個方面的優(yōu)勢[9]:
(1)作為一種開放資源,Protege4.1提供在線及本地兩種使用模式
(2)支持多種國際標準本體文件格式存儲,并且提供格式轉化功能。
(3)Protege4.1開發(fā)界面友好,易于學習和使用,提供平臺手工編輯本體,通過可視化操作直接生成OWL語言,本體開發(fā)人員可以隨時對其進行訪問并直接管理本體。
(4)Protege4.1不斷更新,功能日趨完善。
2 ?學習者本體的構建過程
2.1 ?學習者本體構建三階段
第1階段 ?學習者信息的收集。
數(shù)據(jù)的采集是一個非常重要的環(huán)節(jié),采集到的數(shù)據(jù)的質量對后續(xù)結果的分析有著直接的影響。在網(wǎng)絡學習平臺中,學習者可以通過多種途徑進行學習,當我們對其學習信息進行收集時,要注意以下兩點。
(1)你需要什么樣的數(shù)據(jù)[2]?
結合自身的經(jīng)驗推測在網(wǎng)絡學習空間中,學習者會產(chǎn)生哪些學習行為?
對于學習者產(chǎn)生的所有學習行為數(shù)據(jù)對本體的構建工作是否都具有意義?
(2)如何獲取數(shù)據(jù)[2]?
當我們確定了所需數(shù)據(jù)的類型和范圍,下一步的工作就是要獲取這些數(shù)據(jù)。有以下幾種方法:
將xAPI技術直接嵌入到學習平臺中對學習者的學習行為數(shù)據(jù)進行獲取,這是一種最為常用的方法。
對與學習行為相關的事件進行跟蹤。比如,你可能發(fā)現(xiàn)某學習者點擊了某節(jié)課程。
讓學習者自己記錄自己的學習經(jīng)歷。
讓其他人報告學習者的學習經(jīng)歷和成就,比如教師、同學等,這是評估學習者的學習表現(xiàn)的最合適的方法。
第2階段 ?學習者本體模型的建立。
(1)學習者本體范圍的界定。學習者本體是學習者各方面特征的綜合。學習者本體模型越完整,對學習者的刻畫就越全面,就越有利于對學習者提供個性化的服務。本文基于行為特征這個維度構建網(wǎng)絡學習空間中學習者本體。
(2)建立學習者本體詞匯表。類是具有相同屬性的一組對象的集合。類與類之間存在父子關系,即Superclass父類,Subclass子類;Equivalent class相同類,主要用于推理;Disjointclass互不相交關系。學習者本體中設置學習者相關聯(lián)的同級類共12個,每個類包含相應的子類。屬性是對于一個對象的抽象的刻畫,有對象屬性和數(shù)據(jù)屬性兩種。
(3)確定學習者本體的類和實例。實例就是個體,是本體構建中最基本的對象。類的等級體系的建立是確定屬性關系的基礎。這一步中我們需要根據(jù)本體的描述力度來確定學習者本體對象中哪些可以作為類。
(4)劃分學習者本體的類間關系。本文學習者本體的構建采用綜合法,形成以“基于行為屬性的學習者本體”為父類的多級樹狀結構。學習者本體的分類結構如圖1所示。(另外還有知識水平和態(tài)度特征兩個維度的分類結構,在這里不一一列出。)
(5)復用已有本體。本體復用是本體信息共享的重要步驟。
(6)描述學習者本體類的屬性。最簡單的結構是<執(zhí)行者+動作+對象>,其中執(zhí)行者是學習者,動作比如瀏覽、點擊等,對象指交互的對象,該對象可以是學習者的表現(xiàn),也可以圖片、文字、視頻等有形的物體。執(zhí)行者、動作、對象這三個是必選屬性,其他屬性從不同的側面對學習者進行描述。
(7)利用OWL描述公理和規(guī)則,對學習者本體的一致性做出分析。
第3階段 ?學習者本體的一致性分析。這一部分在第3節(jié)中進行詳細說明。
2.2 ?類
依據(jù)上文提出的學習者本體包含的12個子本體,現(xiàn)將學習者本體的類詞匯分為:成績、人工制品、學習報告、操作性行為、課程學習行為、互動交流行為、總結反思行為、學習投入、學習滿意度、使用意愿、學習情緒、學習動機。本研究結合開放學習者畫像構建活動流設計[2],分別給出了12個類的子類。例如,“課程學習行為”包括“搜索”、“瀏覽”、“保存”、“中斷”、“軌跡”和“點擊”。學習者本體的類表如下表1所示。
2.3 ?屬性
屬性是對一個對象的抽象的刻畫。子類和父類的屬性之間存在繼承關系。本研究結合網(wǎng)絡學習環(huán)境中學習資源呈現(xiàn)的多種表現(xiàn)形式[10]以及網(wǎng)絡問題學習行為的研究[11],列出了5個對象屬性和5個數(shù)據(jù)屬性。具體描述如下表2所示。
2.4 ?實例描述
我們通過以下實例對學習者本體進行直觀的描述,表3給出學習者小紅的實例。
學習者小紅的OWL DL表示如下:
< /owl:NamedIndividual rdf:about=”O(jiān)ntology/學習者#小紅>
< rdf:type rdf:resource=”O(jiān)ntology/學習者#學習者”/ >
< 搜索次數(shù) rdf:datatype=”&xsd;string”>5次 搜索次數(shù)>
< 課程成績 rdf:datatype=”&xsd;float”>5次課程成績>
< 在線答題正確率 rdf:datatype=”&xsd; float” >5次在線答題正確率>
< 發(fā)帖提問的頻次 rdf:datatype=”&xsd; float” >5次發(fā)帖提問的頻次>
< 姓名 rdf:resource=” & 學習者信息;小紅”/ >
< 性別 rdf:resource=” & 學習者信息;女”/ >
< 點擊 rdf:resource=” & 操作性行為;學習管理平臺”/ >
< 瀏覽 rdf:resource=” & 課程學習行為;瀏覽知識點提綱”/ >
< 軌跡 rdf:resource=” & 課程學習行為;首先觀看了第一節(jié)視頻,然后又觀看了第二節(jié)視頻”/ >
< 評論 rdf:resource=” & 互動交流行為;對其他人提出的問題進行評論”/ >
< 在線答題 rdf:resource=” & 總結反思行為;
完成練習和自我測試”/ >
< 積極情緒 rdf:resource=” & 學習情緒;可以成功的在網(wǎng)絡學習空間中進行操作,完成學習任務”/ >
< /owl:NamedIndividual >
2.5 ?公理和推理規(guī)則
公理表示永遠存在并且永真的條件,它用來描述類之間存在的約束條件。學習者本體的公理也同樣依據(jù)領域本體的公理集,如表4所示[8]。為了便于描述,這里設定 (i=1,2,…,n)表示領域本體中的一個類。
根據(jù)學習者本體的屬性和關系,列出學習者本體的公理集,如表5所示[8]。公里集中的字母定義:a,b,c分別表示類名或實例名,p表示屬性,lo表示LearnerOntology,即學習者本體。
推理規(guī)則可以對學習者信息進行維護和完善,以此來確保本體的一致性。學習者本體構建的推理規(guī)則如下表6所示。
3 ?學習者本體一致性分析
關系可以描述類或概念之間的某種聯(lián)系。一般情況下它是一個動詞,表示一個命題。學習者本體構建中的某一對象導致其他對象的屬性的形成或學習者的某一行為促進某一屬性都屬于學習者本體的
推理規(guī)則 描述
規(guī)則1 (?學習者 lo:點擊學習管理平臺頻次低?操作性行為)(?學習者 lo:學習動機?學習興趣不高)
規(guī)則2 (?學習者 lo:瀏覽觀看視頻頻次低?課程學習行為),(?學習者 lo:知識點的學習順序不正確?學習軌跡)(?學習者 lo:在線答題正確率低?總結反思行為)
規(guī)則3 (?學習者 lo:在線答題正確率高?總結反思行為)(?學習者 lo:個人學習報告質量較高?總結反思行為)
規(guī)則4 (?學習者 lo:無目的瀏覽?課程學習行為),(?學習者 lo:目標不明確?目標信息)(?學習者 lo:無效學習?學習效率)
規(guī)則5 (?學習者 lo:保存視頻?課程學習行為)(?學習者 lo:學習興趣?學習動機)
規(guī)則6 (?學習者 lo:發(fā)帖求助?互動交流行為),(?學習者 lo:搜索相關知識?課程學習行為)(?學習者 lo:對學習內(nèi)容較為關注?積極情緒)
規(guī)則7 (?學習者 lo:學習中斷?課程學習行為),(?學習者 lo:知識點的學習順序混亂?學習軌跡)(?學習者 lo:作業(yè)完成質量不高?總結反思行為)
規(guī)則8 (?學習者 lo:獲得文憑?學習動機),(?學習者 lo:回應問題?互動交流行為)(?學習者 lo:積極情緒?學習情緒)
類間關系。本體的一致性是指類之間不會出現(xiàn)矛盾的情況,本體各部分之間所形成的邏輯關系都是合理的。學習者本體類間的兩種關系定義如下:
定義1 ?對于任意個體,若它同時屬于類1和類2,則稱類1和類2之間是繼承關系。
定義2 ? 對于任意個體,若它既不是類1的實例也不是類2的實例,則稱類1和類2之間是不相交關系。
3.1 ?類間關系的一致性分析
不相交關系會引起學習者本體的類間關系的不一致,即不存在一個個體同時屬于所有類當中的任意2個或多個,也可以說類之間的交集為空。如果我們沒有定義兩個類之間為DisjointWith關系,那么就會出現(xiàn)一個個體同時屬于兩個類的情況,而且這種情況是被protege中的推理機默認的,因此就出現(xiàn)了本體的不一致性。
圖2給出學習者本體不一致性判定算法的流 程圖。
3.2 ?基于公理的一致性分析
基于公理的一致性分析是指學習者的多種行為信息之間不存在矛盾的關系。由于學習者行為信息收集的方式多種多樣,學習者的行為數(shù)據(jù)又十分復雜,本體構建者所獲取的信息和數(shù)據(jù)有可能存在誤差,這些都可能是造成本體不一致的原因。下面結合表6列出的學習者本體推理規(guī)則做出以下分析:
以規(guī)則2為例,(?學習者 lo:瀏覽觀看視頻頻次低?課程學習行為),(?學習者 lo:知識點的學習順序不正確?學習軌跡) (?學習者 lo:在線答題正確率低?總結反思行為)
該規(guī)則說明對于任意一個學習者,在他的在線學習過程中表現(xiàn)為觀看視頻的頻次較低并且沒有按照正確的順序對知識點進行學習,則他的隨堂在線測試成績不理想。如果學習者本體中出現(xiàn)觀看視頻的頻次較低并且沒有按照正確的順序對知識點進行學習,而隨堂在線測試成績很理想的情況,則報告本體出現(xiàn)不一致情況。本體的一致性分析涉及本體的類、屬性和實例各個方面,作為本體構建者,我們要有組織有計劃地收集學習者數(shù)據(jù),對數(shù)據(jù)進行有效的分析,以定性數(shù)據(jù)為主,將定量信息歸類為定性數(shù)據(jù),聚類出不同類型的學習者群體,采用強相關信息,忽略弱相關信息。同時,對于學習者本體的構建不能太細,雖然對學習者的細致刻畫更有利于解決利益相關者關注的問題,但是與此同時也提高本體構建的成本,導致學習者本體的使用度下降。
4 ?結語
學習者本體的構建是基于大數(shù)據(jù)、學習分析等技術的發(fā)展而產(chǎn)生,有利于促進學習者個性化學習和全面健康成長。本文基于行為屬性提出了學習者本體的構建過程并作出一致性分析。學習者本體的成功構建可實現(xiàn)在教學實踐中精準識別不同的學習者群體,為不同學習者群體提供個性化的教學支持;同時,學習者本體的成功構建也將為智慧教育的發(fā)展提供重要的幫助。本體構建工作是一個反復疊加的過程,隨著信息的豐富和開放環(huán)境的不斷發(fā)展變化,學習者本體模型將隨時更新,不斷完善。
參考文獻
[1] 郝娟, 林華. 個性化學習系統(tǒng)中領域本體構建研究[J]. 2016, 07: 65-66.
[2] 喬惠. 基于xAPI開放學習者畫像的構建與應用研究[D]. 華東師范大學. 2018.
[3] 李景, 孟連生. 構建知識本體方法體系的比較研究[J]. 現(xiàn)代圖書情報技術. 2004, 07: 17-22.
[4] 尚新麗. 國外本體構建方法比較分析[J]. 圖書情報工作. 2011, 09: 116-119.
[5] 馮蘭萍, 朱禮軍, 蔣亞東. 一種模塊化本體構建方法研究[J]. 現(xiàn)代圖書情報技術. 2010, 06: 53-59.
[6] 李勇, 張志剛. 領域本體構建方法研究[J]. 計算機工程與科學. 2008, 30: 129-131.
[7] 張文秀, 朱慶華. 領域本體的構建方法研究[J]. 圖書與情報. 2011, 01: 16-40.
[8] 高小龍, 朱信忠, 趙建民, 曹存根, 徐慧英. 電影本體的構建與一致性分析. 計算機應用. 2014, 34(8): 2192-2196.
[9] 李曉瑛, 李丹亞, 夏光輝. 腫瘤本體構建研究[J]. 數(shù)字圖書館論壇. 2015, 8: 37-42.
[10] 方海光, 劉靜, 黃榮懷, 李玉順. 基于學習對象化的移動學習資源自適應引擎的研究[J]. 中國電化教育. 2009, 07: 51-55.
[11] 彭文輝. 網(wǎng)絡問題學習行為研究[J]. 遠程教育與網(wǎng)絡教育. 2014, 02: 40-45.
[12] 孫吉鵬, 袁郭苑, 杜澤林. 學習行為分析的段落粒度在線教程系統(tǒng)[J]. 軟件, 2018, 39(4): 137-141.
[13] 岳鋼, 王楠. 網(wǎng)絡學習中知識可視化效率研究[J]. 軟件, 2015, 36(2): 92-96.
[14] 趙旭劍, 鄧思遠, 李波, 等. 互聯(lián)網(wǎng)新聞話題特征選擇與構建[J]. 軟件, 2015, 36(7): 17-20.
[15] 蒲杰方, 盧熒玲. 基于聚類算法和神經(jīng)網(wǎng)絡的客戶分類模型構建[J]. 軟件, 2018, 39(4): 130-136.
[16] 孔令東. 基于WF Flowchart的UML活動圖動態(tài)構建與測試[J]. 軟件, 2018, 39(5): 121-125.