国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基礎(chǔ)教育課程知識(shí)圖譜構(gòu)建技術(shù)框架研究

2019-09-10 07:22朱曉悅杜雨雯王家若
南北橋 2019年18期
關(guān)鍵詞:知識(shí)圖譜基礎(chǔ)教育

朱曉悅 杜雨雯 王家若

【摘? ? 要】基礎(chǔ)教育知識(shí)圖譜能體現(xiàn)出知識(shí)之間的聯(lián)系,以可視化方式向教師與學(xué)生反饋結(jié)構(gòu)化知識(shí),進(jìn)行教學(xué)支架服務(wù),輔助學(xué)生進(jìn)行知識(shí)管理和教師教與學(xué)的設(shè)計(jì)。本文從基礎(chǔ)教育知識(shí)圖譜構(gòu)建的框架出發(fā),分實(shí)體抽取和實(shí)體關(guān)系抽取兩個(gè)角度研究知識(shí)圖譜構(gòu)建的技術(shù)路徑,并生成高中數(shù)學(xué)必修二的知識(shí)圖譜。

【關(guān)鍵詞】知識(shí)圖譜? 實(shí)體抽取? 實(shí)體關(guān)系抽取? 基礎(chǔ)教育

中圖分類號(hào):G4? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.3969/j.issn.1672-0407.2019.18.007

一、緒論

(一)研究背景與意義

在課堂教學(xué)過程中,教師通過圖像、視頻、互動(dòng)軟件等多媒體教學(xué)載體的應(yīng)用,教學(xué)知識(shí)的表達(dá)有了越來越多圖形化、生動(dòng)化的展現(xiàn)方式。隨著大數(shù)據(jù)與機(jī)器學(xué)習(xí)的深入發(fā)展,通過數(shù)據(jù)挖掘的方式能夠發(fā)現(xiàn)更深層次的知識(shí)聯(lián)系。知識(shí)圖譜就是其中一種表達(dá)方式,知識(shí)圖譜是結(jié)構(gòu)化的語義知識(shí)庫,用于以符號(hào)形式描述物理世界中的概念及其相互關(guān)系:實(shí)體間通過關(guān)系相互聯(lián)結(jié),構(gòu)成網(wǎng)狀的知識(shí)結(jié)構(gòu)。

(二)國(guó)內(nèi)研究現(xiàn)狀

知識(shí)圖譜的應(yīng)用領(lǐng)域一般具有“新”或“熱”的特征,旨在通過對(duì)目標(biāo)領(lǐng)域的分析把握其發(fā)展態(tài)勢(shì)。因此,統(tǒng)計(jì)并梳理知識(shí)圖譜應(yīng)用領(lǐng)域的新關(guān)鍵詞,可以窺見我國(guó)各時(shí)間段的研究重點(diǎn)及整體趨勢(shì)。1.研究重點(diǎn)。從關(guān)鍵詞來看,我國(guó)知識(shí)圖譜應(yīng)用較多的是對(duì)某學(xué)科和某主題進(jìn)行知識(shí)圖譜分析。如學(xué)科知識(shí)圖譜:王琪等以1991-2009年間與“體育”相關(guān)的博士論文為數(shù)據(jù),深入探討了科學(xué)知識(shí)圖譜在體育學(xué)科研究中的應(yīng)用前景。如主題知識(shí)圖譜:王晴用CitespaceⅢ分析2015年以前的“慕課”研究相關(guān)文獻(xiàn),發(fā)現(xiàn)當(dāng)前我國(guó)“慕課”研究的熱點(diǎn)集中在技術(shù)支持、教學(xué)效果、教學(xué)活動(dòng)、教學(xué)模式等問題。2.整體趨勢(shì)。時(shí)代化。通過觀察知識(shí)圖譜應(yīng)用領(lǐng)域的相關(guān)關(guān)鍵詞發(fā)現(xiàn),從“數(shù)據(jù)挖掘”到“云計(jì)算”再到“慕課”,知識(shí)圖譜的研究對(duì)象一直緊跟時(shí)代、與時(shí)俱進(jìn)。通過研讀論文發(fā)現(xiàn),目前中國(guó)在學(xué)科知識(shí)圖譜方面的研究還是比較缺乏的,而本項(xiàng)目的研究?jī)?nèi)容就關(guān)注于基礎(chǔ)教育學(xué)科的知識(shí)數(shù)據(jù)庫的建立,并通過知識(shí)圖譜建立一個(gè)知識(shí)框架,以作為一個(gè)學(xué)科標(biāo)準(zhǔn)對(duì)照。

二、知識(shí)圖譜構(gòu)建技術(shù)框架

(一)實(shí)體抽取

實(shí)體抽取是圖譜構(gòu)建中最關(guān)鍵的步驟,它是決定了圖譜質(zhì)量的關(guān)鍵。簡(jiǎn)單來說實(shí)體抽取就是從文本中抽取關(guān)鍵詞,實(shí)體抽取流程大致如圖2-1所示,將文本切分成獨(dú)立的詞,并對(duì)詞進(jìn)行分析(本質(zhì)是聚類分析),常見方法有機(jī)器學(xué)習(xí)分析、統(tǒng)計(jì)分析與語義分析,由于技術(shù)水平等限制,我們采用了統(tǒng)計(jì)分析方式。

1.分詞。分詞是將連續(xù)字符串切分成詞的過程,為避免漏詞,本項(xiàng)目使用ansj分詞工具中的最小顆粒度分詞再進(jìn)行復(fù)合詞拼接,將文本中的內(nèi)容切分成獨(dú)立的詞,并進(jìn)行詞性標(biāo)注。同時(shí)在分詞結(jié)果中進(jìn)行詞性過濾,考慮到漢語語法,作為關(guān)鍵詞只保留動(dòng)詞相關(guān)、名詞相關(guān)等詞性。2.復(fù)合詞拼接。需要將分割后的詞拼接,以達(dá)到較高的召回率,本項(xiàng)目采用基于統(tǒng)計(jì)的規(guī)則進(jìn)行拼接,主要體現(xiàn)在兩點(diǎn)上:互信息與信息熵。這里簡(jiǎn)單介紹:互信息體現(xiàn)兩個(gè)變量的相互依賴程度,常用定義如下:

其中X、Y表示相鄰詞語,該公式為相鄰詞出現(xiàn)的概率與作為單獨(dú)詞出現(xiàn)的概率之比的對(duì)數(shù),數(shù)值越大則說明二者作為一個(gè)詞的概率較大信息熵主要是用詞語的左邊界熵和右邊界熵,用來判斷兩個(gè)詞出現(xiàn)的順序可能性。3.關(guān)鍵詞抽取。在得到候選復(fù)合詞之后,需要進(jìn)行進(jìn)一步處理得到關(guān)鍵詞。關(guān)鍵詞作為一篇文章中重要的詞,其特點(diǎn)是出現(xiàn)頻率高并且與其他文章相關(guān)度不高,綜合考慮下,本項(xiàng)目使用簡(jiǎn)單的TF-IDF算法進(jìn)行關(guān)鍵詞抽取,TF-IDF算法用以評(píng)估某詞對(duì)文檔集的重要程度。計(jì)算公式如:TF-IDF=TF*IDF

(二)實(shí)體關(guān)系抽取

在提取完實(shí)體后,需要進(jìn)行實(shí)體間關(guān)系的抽取。本文中,分類關(guān)系和非分類關(guān)系是兩種主要的實(shí)體關(guān)系類型。分類關(guān)系中最典型的是上下位關(guān)系,它表明了上位詞和下位詞之間的層次關(guān)系,例如銳角與三角形。而非分類關(guān)系體現(xiàn)了實(shí)體之間的關(guān)聯(lián)性,實(shí)體間沒有層次之分,例如銳角與鈍角。在獲得實(shí)體間分類關(guān)系的過程中,我們利用字符串匹配法。即通過字符串匹配遍歷列表中的詞,提取概念之間的詞串包含關(guān)系,這種概念之間的分類關(guān)系是顯而易見的。在獲取實(shí)體間非分類關(guān)系的過程中,本項(xiàng)目采用了Apriori算法。通過計(jì)算支持度(support)、置信度(confidence)和提升度,找出數(shù)據(jù)中的頻繁項(xiàng)集,從而挖掘出數(shù)據(jù)間的關(guān)聯(lián)規(guī)則。

三、結(jié)果分析

按照上述流程,采用手動(dòng)+自動(dòng)結(jié)合的方式,以人教版高中數(shù)學(xué)必修一為例,提取教案、課本、教材等57個(gè)純文本文件作為語料,手動(dòng)設(shè)置閾值,將最終得到的實(shí)體與實(shí)體關(guān)系通過網(wǎng)頁D3.js展現(xiàn)出如下圖所示結(jié)果:

由于是人工評(píng)測(cè)(實(shí)際應(yīng)為由現(xiàn)有語料庫自動(dòng)評(píng)測(cè),但限于項(xiàng)目人工調(diào)整閾值等因素,采用專家評(píng)估),單就實(shí)體抽取來說結(jié)果如下:抽取詞共37個(gè),實(shí)際應(yīng)有實(shí)體98個(gè),錯(cuò)誤1個(gè)

P=97.3%? R=36.7%? F=53.2%

總的來看:我們過于追求準(zhǔn)確而丟失了很多數(shù)據(jù),導(dǎo)致F值有點(diǎn)低,且由于是人工調(diào)整閾值效率極低,需要改進(jìn)方法。

參考文獻(xiàn)

[1]劉嶠等:《知識(shí)圖譜構(gòu)建技術(shù)綜述》,《計(jì)算機(jī)研究與發(fā)展》2016年第三期.

[2]王琪,徐成立.知識(shí)圖譜視野下我國(guó)體育科學(xué)研究的發(fā)展路徑——基于1991~2009年體育學(xué)博士論文關(guān)鍵詞共詞網(wǎng)絡(luò)的可視化分析[J].體育學(xué)刊,2010,17(12):118-125.

猜你喜歡
知識(shí)圖譜基礎(chǔ)教育
改革開放以來我國(guó)基礎(chǔ)教育課程政策話語的遷嬗
教育均衡發(fā)展:現(xiàn)代教育發(fā)展的新境界
基于微課應(yīng)用的專遞課堂教學(xué)模式研究
從《ET&S》與《電化教育研究》對(duì)比分析中管窺教育技術(shù)發(fā)展
鄂尔多斯市| 克什克腾旗| 韶山市| 武威市| 横山县| 安徽省| 万盛区| 海兴县| 北安市| 泗水县| 琼中| 杂多县| 东乌| 鄂托克旗| 海盐县| 福安市| 蒙城县| 伊金霍洛旗| 咸丰县| 永城市| 宜黄县| 包头市| 河北省| 册亨县| 松阳县| 孟村| 新兴县| 哈尔滨市| 博湖县| 五河县| 兴文县| 高清| 辉南县| 阳朔县| 特克斯县| 湛江市| 道孚县| 敦煌市| 宽城| 苍梧县| 平阴县|