[摘 要] 知識(shí)工程研究已逐漸成為教育技術(shù)學(xué)研究的熱點(diǎn),其中構(gòu)建領(lǐng)域本體是知識(shí)工程的一個(gè)重要方面。從已有的基于本體的應(yīng)用研究來(lái)看,領(lǐng)域本體可以在資源聚合、學(xué)習(xí)資源個(gè)性化推薦、網(wǎng)站導(dǎo)航、平臺(tái)開(kāi)發(fā)等諸多方面發(fā)揮重要作用,而構(gòu)建領(lǐng)域本體是各種應(yīng)用得以實(shí)現(xiàn)的前提。目前,構(gòu)建領(lǐng)域本體是一項(xiàng)浩大的工程,需要大量領(lǐng)域?qū)<业膮⑴c,常常是手工完成,建設(shè)周期長(zhǎng)。面對(duì)一個(gè)知識(shí)迅速增長(zhǎng)的時(shí)代,僅僅依靠領(lǐng)域?qū)<襾?lái)手工構(gòu)建領(lǐng)域本體顯然不能滿(mǎn)足需求。本研究提出了一種基于術(shù)語(yǔ)部件的領(lǐng)域本體自動(dòng)構(gòu)建方法,該方法通過(guò)術(shù)語(yǔ)部件之間的關(guān)系來(lái)自動(dòng)發(fā)現(xiàn)術(shù)語(yǔ)之間的屬種關(guān)系和并列關(guān)系,并以《電化教育研究》期刊為例,通過(guò)分析該期刊數(shù)年期刊論文的題錄信息,提取出1719個(gè)術(shù)語(yǔ),并通過(guò)領(lǐng)域本體自動(dòng)構(gòu)建方法構(gòu)建起一個(gè)初步的教育技術(shù)學(xué)領(lǐng)域本體。
[關(guān)鍵詞] 領(lǐng)域本體; 教育技術(shù)學(xué); 知識(shí)工程; 術(shù)語(yǔ)提??; 術(shù)語(yǔ)部件
[中圖分類(lèi)號(hào)] G434 [文獻(xiàn)標(biāo)志碼] A
[作者簡(jiǎn)介] 魏順平(1981—),男,江西南昌人。副研究員,博士,主要從事教育數(shù)據(jù)挖掘研究。E-mail:wsp2049@163.com。
一、問(wèn)題的提出
20世紀(jì)90年代初期至今,本體已經(jīng)成為包括知識(shí)工程、自然語(yǔ)言處理和知識(shí)表示在內(nèi)的諸多人工智能研究團(tuán)體的熱門(mén)課題。隨著本體領(lǐng)域的第一個(gè)主題會(huì)議ICFOIS 1998(信息系統(tǒng)中形式本體論國(guó)際會(huì)議)的召開(kāi),這個(gè)領(lǐng)域的研究成果無(wú)論是數(shù)量還是質(zhì)量都在大幅提高中。作為一種有效表現(xiàn)概念層次結(jié)構(gòu)和語(yǔ)義的模型,本體在國(guó)外得到了許多科研人員的極大關(guān)注,并被廣泛地應(yīng)用到包括計(jì)算機(jī)科學(xué)在內(nèi)的眾多領(lǐng)域中。[1]在T. B. Lee所倡導(dǎo)的第二代互聯(lián)網(wǎng)語(yǔ)義網(wǎng)的七層結(jié)構(gòu)中,本體層在其中占據(jù)著承上啟下的關(guān)鍵位置,已經(jīng)成為語(yǔ)義網(wǎng)的基石。[2]金芝對(duì)本體作了分類(lèi),包括知識(shí)表示本體、通用或常識(shí)本體、領(lǐng)域本體、語(yǔ)言學(xué)本體、任務(wù)本體等。[3]在教育教學(xué)領(lǐng)域,領(lǐng)域本體已經(jīng)在資源聚合、[4]學(xué)習(xí)資源個(gè)性化推薦、[5][6][7]網(wǎng)站導(dǎo)航、[8][9]平臺(tái)開(kāi)發(fā)[10][11]等方面得到了應(yīng)用。
領(lǐng)域本體的構(gòu)建是一項(xiàng)浩大的工程,需要大量領(lǐng)域?qū)<业膮⑴c,常常是人工完成,建設(shè)周期長(zhǎng)。面對(duì)一個(gè)知識(shí)迅速增長(zhǎng)的時(shí)代,這種人工構(gòu)建本體方式顯然不能滿(mǎn)足需求。因?yàn)樾赂拍顚映霾桓F,概念之間的關(guān)系也在發(fā)生變化,這就使得經(jīng)過(guò)若干年時(shí)間建立起的本體落后于學(xué)科現(xiàn)狀。因此,本研究將提出一種基于術(shù)語(yǔ)部件的領(lǐng)域本體自動(dòng)構(gòu)建方法,從而加快領(lǐng)域本體建設(shè)速度。鑒于教育技術(shù)學(xué)科迅速發(fā)展的特點(diǎn),以及筆者所在教育技術(shù)學(xué)專(zhuān)業(yè)的背景,本研究將選取教育技術(shù)學(xué)作為研究個(gè)案,試圖以教育技術(shù)學(xué)術(shù)語(yǔ)表為基礎(chǔ)來(lái)構(gòu)建教育技術(shù)學(xué)領(lǐng)域本體,以便及時(shí)給教育技術(shù)學(xué)研究者以及專(zhuān)業(yè)學(xué)習(xí)者展示教育技術(shù)學(xué)知識(shí)體系的新面貌。
二、相關(guān)概念
下面對(duì)本文中涉及的一些主要概念進(jìn)行介紹。
1. 本體(Ontology)
斯坦福大學(xué)知識(shí)系統(tǒng)實(shí)驗(yàn)室(KSL)的Gruber于1993年給出了經(jīng)典的關(guān)于本體的定義: 本體是概念模型(Conceptualization,有時(shí)也譯作概念化)的明確的(Explicit)規(guī)范說(shuō)明(Specification)。[12]目前,該定義在人工智能領(lǐng)域得到研究者的普遍認(rèn)同,引用率最高。本體定義體現(xiàn)了四個(gè)主要方面的內(nèi)容:(1)概念化(Conceptualization):客觀(guān)世界的抽象模型;(2)明確(Explicit):概念及它們之間聯(lián)系都被精確定義;(3)形式化(Formal):精確的數(shù)學(xué)描述;(4)共享(Share):本體中反映的知識(shí)是使用者共同認(rèn)可的。
2. 領(lǐng)域本體(Domain Ontology)
領(lǐng)域本體是指在一個(gè)特定的領(lǐng)域中可重用,他們提供該特定領(lǐng)域的概念定義和概念之間的關(guān)系,提供該領(lǐng)域中發(fā)生的活動(dòng)及該領(lǐng)域的主要理論和基本原理等的一個(gè)本體。[13]
3. 概念
概念是客體在人們心理上的反映。在一個(gè)知識(shí)領(lǐng)域中,概念用定義描述,被賦予約定的指稱(chēng)(即術(shù)語(yǔ))。一組概念可依據(jù)概念間的相互關(guān)系構(gòu)建成概念體系。一般來(lái)說(shuō),概念體系反映相應(yīng)的知識(shí)體系。[14]
4. 概念的特征
任一客體都具有眾多特性,人們根據(jù)一群客體所共有的特性形成某一概念。這些共同特性在心理上的反映,稱(chēng)為該概念的特征。[15]
5. 概念表征
概念的表征方法有很多,如原型說(shuō)、特征表說(shuō)。本文采用特征表說(shuō),因?yàn)閼?yīng)用這種方法表示概念,使得概念間的關(guān)系具有可計(jì)算性。[16]
6. 內(nèi)涵和外延
一個(gè)概念所反映的客體的全部特征稱(chēng)為概念的內(nèi)涵,一個(gè)概念所指客體的范圍稱(chēng)為概念的外延。一般來(lái)說(shuō),概念的內(nèi)涵越豐富,外延越?。环粗?,內(nèi)涵越貧乏,外延越大。[17]
7. 層級(jí)關(guān)系
根據(jù)概念間的包含關(guān)系,可將概念區(qū)分為上位概念和下位概念。上位概念稱(chēng)為大概念,下位概念稱(chēng)為小概念。按同一標(biāo)準(zhǔn)(同一維度)劃分并處于同一層面的概念稱(chēng)為并列概念。概念間的關(guān)系除了層級(jí)關(guān)系外,還有序列關(guān)系、聯(lián)想關(guān)系等。[18]
8. 屬種關(guān)系
屬種關(guān)系是層級(jí)關(guān)系的一種,屬種關(guān)系指概念外延的包含關(guān)系。小概念(種)的外延是大概念(屬)外延的一部分,小概念除了具有大概念的一切特征外,還具有本身獨(dú)有的區(qū)別特征。[19]
9. 術(shù)語(yǔ)
術(shù)語(yǔ)是專(zhuān)業(yè)領(lǐng)域中概念的語(yǔ)言指稱(chēng)。術(shù)語(yǔ)和概念之間應(yīng)一一對(duì)應(yīng),即一個(gè)術(shù)語(yǔ)只表示一個(gè)概念(單義性);一個(gè)概念只有一個(gè)指稱(chēng),即只由一個(gè)術(shù)語(yǔ)來(lái)表示(單名性)。在相關(guān)學(xué)科或至少在一個(gè)專(zhuān)業(yè)領(lǐng)域內(nèi)應(yīng)做到這一點(diǎn),否則會(huì)出現(xiàn)異義、多義和同義現(xiàn)象。[20]
10. 單詞術(shù)語(yǔ)和多詞術(shù)語(yǔ)
術(shù)語(yǔ)一般分為單詞術(shù)語(yǔ)和多詞術(shù)語(yǔ)兩類(lèi)。[21]單詞術(shù)語(yǔ)由單個(gè)詞語(yǔ)組成,多詞術(shù)語(yǔ)由多個(gè)詞語(yǔ)組成。吳云芳等人曾對(duì)單詞術(shù)語(yǔ)和多詞術(shù)語(yǔ)的比重進(jìn)行過(guò)統(tǒng)計(jì),發(fā)現(xiàn)多詞術(shù)語(yǔ)遠(yuǎn)遠(yuǎn)多于單詞術(shù)語(yǔ),并且新生的術(shù)語(yǔ)大部分還是多詞術(shù)語(yǔ)。[22]
11. 術(shù)語(yǔ)部件
術(shù)語(yǔ)部件是指組成多詞術(shù)語(yǔ)的詞。這里研究者補(bǔ)充一個(gè)研究假設(shè),即單詞術(shù)語(yǔ)也有術(shù)語(yǔ)部件,就是它自身。[23]
三、研究假設(shè)
1. 概念間的屬種關(guān)系與術(shù)語(yǔ)間的屬種關(guān)系一一對(duì)應(yīng)
我們構(gòu)建領(lǐng)域本體,主要的工作是提取概念并發(fā)現(xiàn)概念間的層次關(guān)系特別是屬種關(guān)系,所以本研究所要研制的本體自動(dòng)構(gòu)建方法主要用于概念自動(dòng)提取和概念間的層次關(guān)系自動(dòng)發(fā)現(xiàn)。根據(jù)前文定義,術(shù)語(yǔ)與概念有著一一對(duì)應(yīng)的關(guān)系,因此本文規(guī)定概念間的屬種關(guān)系就是術(shù)語(yǔ)間的屬種關(guān)系;提取學(xué)科概念可通過(guò)提取術(shù)語(yǔ)來(lái)完成。
2. 概念的特征可用術(shù)語(yǔ)部件來(lái)表示
我們假設(shè),概念的特征可以通過(guò)術(shù)語(yǔ)部件來(lái)表示,在同一知識(shí)領(lǐng)域不用術(shù)語(yǔ)所具備的相同術(shù)語(yǔ)部件其意義相同。根據(jù)前文定義,概念間的屬種關(guān)系可以通過(guò)比較概念間的特征來(lái)求取。因此,我們可通過(guò)比較構(gòu)成術(shù)語(yǔ)的術(shù)語(yǔ)部件來(lái)求取術(shù)語(yǔ)間的屬種關(guān)系。具有屬種關(guān)系的一對(duì)術(shù)語(yǔ)分別稱(chēng)作上位術(shù)語(yǔ)和下位術(shù)語(yǔ),其中小術(shù)語(yǔ)具有大術(shù)語(yǔ)的所有部件,還具有本身獨(dú)有的部件。
四、研究過(guò)程
本研究過(guò)程由術(shù)語(yǔ)提取、術(shù)語(yǔ)部件獲取、術(shù)語(yǔ)關(guān)系計(jì)算、領(lǐng)域本體可視化表示等部分構(gòu)成。
(一) 術(shù)語(yǔ)提取
我們要構(gòu)建教育技術(shù)學(xué)的領(lǐng)域本體,首先要獲取領(lǐng)域本體的構(gòu)成元素——術(shù)語(yǔ)。學(xué)術(shù)期刊反映了某領(lǐng)域研究的最新進(jìn)展和發(fā)展歷程,某領(lǐng)域的全部術(shù)語(yǔ)基本上都會(huì)在該領(lǐng)域的重要學(xué)術(shù)期刊中出現(xiàn)。因此,我們可以通過(guò)期刊論文來(lái)提取術(shù)語(yǔ)。期刊論文的題錄信息如標(biāo)題、摘要、關(guān)鍵詞等已經(jīng)包含了大量的術(shù)語(yǔ),可以成為我們提取術(shù)語(yǔ)的理想語(yǔ)料,因此我們沒(méi)有必要通過(guò)期刊論文全文來(lái)提取術(shù)語(yǔ),這樣可以大大減輕工作量。由于《電化教育研究》雜志是教育技術(shù)研究領(lǐng)域創(chuàng)刊時(shí)間最早、最具權(quán)威性的學(xué)術(shù)期刊之一,于是我們選取該雜志的論文題錄信息作為術(shù)語(yǔ)提取的語(yǔ)料。
我們先從CNKI中國(guó)期刊全文數(shù)據(jù)庫(kù)下載《電化教育研究》雜志近10年的論文題錄信息,并導(dǎo)入到數(shù)據(jù)庫(kù)中。然后采用自行研制的規(guī)則和統(tǒng)計(jì)相結(jié)合的術(shù)語(yǔ)提取算法來(lái)處理題錄信息,提取術(shù)語(yǔ)。[24]該術(shù)語(yǔ)提取算法的準(zhǔn)確率為66.7%,召回率為76.7%,與現(xiàn)有的一些術(shù)語(yǔ)提取算法性能相近,可以較好地幫助研究者完成術(shù)語(yǔ)提取工作。經(jīng)術(shù)語(yǔ)提取程序的處理,并經(jīng)過(guò)人工對(duì)術(shù)語(yǔ)提取結(jié)果的校對(duì),最后我們得到2159個(gè)術(shù)語(yǔ)。
(二) 術(shù)語(yǔ)部件提取
術(shù)語(yǔ)部件是計(jì)算術(shù)語(yǔ)間的屬種關(guān)系的依據(jù)。我們?cè)诘玫叫g(shù)語(yǔ)后,需要對(duì)術(shù)語(yǔ)進(jìn)行分解,得到構(gòu)成術(shù)語(yǔ)的術(shù)語(yǔ)部件。前文已經(jīng)提到,術(shù)語(yǔ)部件其實(shí)就是構(gòu)成術(shù)語(yǔ)的詞語(yǔ),因此要得到術(shù)語(yǔ)部件,其實(shí)就是要對(duì)術(shù)語(yǔ)進(jìn)行分詞操作。
中文分詞是中文信息處理領(lǐng)域中的一項(xiàng)基礎(chǔ)技術(shù)。一些比較簡(jiǎn)單的分詞算法有最大匹配法、最大概率法等。由于開(kāi)發(fā)分詞工具需要建立大型的詞庫(kù)和語(yǔ)法知識(shí)庫(kù),費(fèi)時(shí)費(fèi)力。所幸的是,中國(guó)科學(xué)院計(jì)算技術(shù)研究所在多年研究基礎(chǔ)上,耗時(shí)一年研制出了基于多層隱馬模型的漢語(yǔ)詞法分析系統(tǒng)ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),并在網(wǎng)上公布了源碼。該系統(tǒng)的功能有中文分詞和詞性標(biāo)注,分詞正確率高達(dá)97.58%。于是在本研究中我們采用了該分詞工具。表1給出ICTCLAS分詞工具對(duì)文本進(jìn)行分詞處理后的一個(gè)片斷。
我們采用ICTCLAS分詞工具對(duì)術(shù)語(yǔ)進(jìn)行分詞操作,得到表1的結(jié)果。由于分詞工具也有不準(zhǔn)確的地方,我們還需對(duì)術(shù)語(yǔ)分詞結(jié)果進(jìn)行校對(duì),并將校對(duì)結(jié)果以表2的形式存儲(chǔ)。
其中,“部件位置”表示該部件在術(shù)語(yǔ)中出現(xiàn)的順序,這是后面用于術(shù)語(yǔ)關(guān)系計(jì)算的一個(gè)重要數(shù)據(jù)。
(三)術(shù)語(yǔ)關(guān)系計(jì)算
我們進(jìn)行術(shù)語(yǔ)關(guān)系計(jì)算的依據(jù)是前文所提出的假設(shè):
具體算法描述如下:
(1)從術(shù)語(yǔ)表中讀取一個(gè)術(shù)語(yǔ)T;
(2)通過(guò)術(shù)語(yǔ)部件存儲(chǔ)表查找術(shù)語(yǔ)T的全部下位術(shù)語(yǔ),下位術(shù)語(yǔ)的判斷依據(jù)是具有術(shù)語(yǔ)T所有部件且出現(xiàn)順序與T一致的所有術(shù)語(yǔ);
(3)將得到的術(shù)語(yǔ)作為術(shù)語(yǔ)T的下位術(shù)語(yǔ)存儲(chǔ)術(shù)語(yǔ)關(guān)系表;
(4)回到第一步,直到術(shù)語(yǔ)表中所有術(shù)語(yǔ)都被讀取。
經(jīng)過(guò)上述算法操作,我們最終得到了一張術(shù)語(yǔ)關(guān)系表,其片斷見(jiàn)表3。
不過(guò)此時(shí)得到的術(shù)語(yǔ)表存在一定的冗余,即上位術(shù)語(yǔ)的部分下位術(shù)語(yǔ)其實(shí)是該上位術(shù)語(yǔ)的下位術(shù)語(yǔ)的下位術(shù)語(yǔ),見(jiàn)表3,“學(xué)習(xí)模式”的下位術(shù)語(yǔ)有“協(xié)作學(xué)習(xí)模式”、“校際協(xié)作學(xué)習(xí)模式”,“校際協(xié)作學(xué)習(xí)模式”也是“協(xié)作學(xué)習(xí)模式”的下位術(shù)語(yǔ),這就需要對(duì)下位術(shù)語(yǔ)中屬于下位術(shù)語(yǔ)的下位術(shù)語(yǔ)的部分進(jìn)行清理,這樣才能保證術(shù)語(yǔ)關(guān)系表更為精簡(jiǎn)。冗余術(shù)語(yǔ)關(guān)系清除之后,構(gòu)建領(lǐng)域本體的主要工作就基本完成。
(四) 領(lǐng)域本體可視化表示
由于表3所示的術(shù)語(yǔ)關(guān)系表可讀性較差,且每行記錄只能反映一對(duì)術(shù)語(yǔ)之間的屬種關(guān)系。其實(shí),在發(fā)現(xiàn)術(shù)語(yǔ)之間屬種關(guān)系的同時(shí),我們也就發(fā)現(xiàn)了下位術(shù)語(yǔ)之間的并列關(guān)系,如表3中“探究學(xué)習(xí)模式”、“協(xié)作學(xué)習(xí)模式”、“研究性學(xué)習(xí)模式”等下位術(shù)語(yǔ)間就存在著并列關(guān)系,而這種關(guān)系無(wú)法通過(guò)幾行記錄直觀(guān)呈現(xiàn)。因此,我們需要將表轉(zhuǎn)換為圖的形式,以直觀(guān)的方式展示教學(xué)技術(shù)學(xué)的領(lǐng)域本體,這就是領(lǐng)域本體可視化過(guò)程。我們主要采用樹(shù)型結(jié)構(gòu)來(lái)展示教育技術(shù)學(xué)領(lǐng)域本體的局部,樹(shù)狀結(jié)構(gòu)通過(guò)JavaScript腳本在網(wǎng)頁(yè)中生成。之所以采用網(wǎng)頁(yè)來(lái)呈現(xiàn)領(lǐng)域本體,是因?yàn)橐粋€(gè)領(lǐng)域本體應(yīng)該可以通過(guò)WEB服務(wù)的方式供用戶(hù)查詢(xún)。本研究的后續(xù)工作之一就是開(kāi)發(fā)在線(xiàn)教育技術(shù)學(xué)領(lǐng)域本體查詢(xún)頁(yè)面,以便從事教育技術(shù)學(xué)研究和專(zhuān)業(yè)學(xué)習(xí)的朋友都可以來(lái)使用這一知識(shí)工程產(chǎn)品。圖1是以樹(shù)型結(jié)構(gòu)方式展示的領(lǐng)域本體的局部?jī)?nèi)容。
我們從圖1中便清楚地看到“學(xué)習(xí)模式”這一術(shù)語(yǔ)的所有下位術(shù)語(yǔ),還可以看到更低層次的下位術(shù)語(yǔ),如“校際協(xié)作學(xué)習(xí)模式”,并可看到具有并列關(guān)系的多個(gè)術(shù)語(yǔ)。
五、研究結(jié)果與討論
(一) 從高頻部件看教育技術(shù)學(xué)的學(xué)科性質(zhì)
通過(guò)對(duì)術(shù)語(yǔ)進(jìn)行分詞得到術(shù)語(yǔ)部件,并對(duì)術(shù)語(yǔ)部件進(jìn)行歸并處理,共得到術(shù)語(yǔ)部件972個(gè)。其中,一些部件常常為多個(gè)術(shù)語(yǔ)所共有,我們把共有某個(gè)部件的術(shù)語(yǔ)的個(gè)數(shù)稱(chēng)為該部件的術(shù)語(yǔ)頻次。這里我們關(guān)注一些術(shù)語(yǔ)頻次高的部件,從這些部件中,我們將能看到教育技術(shù)學(xué)科所處的更為廣泛的領(lǐng)域。下面列出術(shù)語(yǔ)頻次在前10位的術(shù)語(yǔ)及其術(shù)語(yǔ)頻次,如圖2所示。
這10個(gè)部件占部件總數(shù)的1%,所涉及的術(shù)語(yǔ)的個(gè)數(shù)(即包含這10個(gè)部件中任何一個(gè)的術(shù)語(yǔ)個(gè)數(shù))卻達(dá)1248,占術(shù)語(yǔ)總數(shù)的57.8%。
術(shù)語(yǔ)頻次超過(guò)200的部件是“教育”、“教學(xué)”、“學(xué)習(xí)”,這三個(gè)部件涉及術(shù)語(yǔ)871個(gè),占術(shù)語(yǔ)總數(shù)的40.3%,說(shuō)明教育技術(shù)學(xué)科中所討論的話(huà)題(這里特指在《電化教育研究》所刊載的論文的語(yǔ)境下)有五分之二與這三個(gè)部件所指代的領(lǐng)域直接相關(guān),這三個(gè)部件比教育技術(shù)學(xué)科中的任何術(shù)語(yǔ)都更為抽象,教育技術(shù)學(xué)科中的許多術(shù)語(yǔ)可以從這三個(gè)部件中演繹得來(lái)。由此我們推斷,這三個(gè)部件中的一個(gè)或多個(gè)可能就是教育技術(shù)學(xué)的邏輯起點(diǎn)。
我們可以來(lái)回顧一下以往關(guān)于邏輯起點(diǎn)的討論。自2004年以來(lái),教育技術(shù)學(xué)界開(kāi)展了一場(chǎng)關(guān)于教育技術(shù)學(xué)邏輯起點(diǎn)的討論,迄今已發(fā)表了七篇學(xué)術(shù)論文,其中,馮秀琪提出“教育中的技術(shù)”是教育技術(shù)理論研究的邏輯起點(diǎn),[25]鄭旭東將以“借助于技術(shù)的學(xué)習(xí)”作為教育技術(shù)學(xué)的邏輯起點(diǎn),[26]江北戰(zhàn)指出教育技術(shù)學(xué)的邏輯起點(diǎn)是“借助工業(yè)技術(shù)的學(xué)習(xí)”,[27]何克抗認(rèn)為教育技術(shù)學(xué)的邏輯起點(diǎn)是“借助技術(shù)的教育”,[28]趙劍認(rèn)為教育技術(shù)學(xué)的邏輯起點(diǎn)是“教育軟技術(shù)創(chuàng)新”,[29]劉瑞儒認(rèn)為教育技術(shù)學(xué)的邏輯起點(diǎn)是“借助現(xiàn)代教育技術(shù)的教與學(xué)的方法”。[30]我們認(rèn)為,這六種觀(guān)點(diǎn)中,“借助技術(shù)的教育”、“借助工業(yè)技術(shù)的學(xué)習(xí)”、“借助于技術(shù)的學(xué)習(xí)”較其他三種觀(guān)點(diǎn)更為合理,因?yàn)檫@三種觀(guān)點(diǎn)將教育技術(shù)學(xué)的邏輯起點(diǎn)的討論范圍限定在“教育”或“學(xué)習(xí)”上。
“設(shè)計(jì)”、“資源”這兩個(gè)部件則印證了教育技術(shù)學(xué)科以設(shè)計(jì)(如教學(xué)設(shè)計(jì)、課件設(shè)計(jì)、任務(wù)設(shè)計(jì)、交互設(shè)計(jì)、活動(dòng)設(shè)計(jì)、學(xué)習(xí)環(huán)境設(shè)計(jì)等)和資源(如教育資源、學(xué)習(xí)資源、資源平臺(tái)、資源共享、資源庫(kù)、資源標(biāo)準(zhǔn)等)為核心內(nèi)容的特點(diǎn)?!靶畔ⅰ?、“網(wǎng)絡(luò)”、“遠(yuǎn)程”這三個(gè)部件則反映了教育技術(shù)學(xué)科當(dāng)前研究和實(shí)踐的熱點(diǎn)。
表4是術(shù)語(yǔ)頻次位列11至30位的部件,涉及這些部件的術(shù)語(yǔ)占術(shù)語(yǔ)總數(shù)的75.9%。
(二) 領(lǐng)域本體可視化中存在的問(wèn)題
在術(shù)語(yǔ)關(guān)系表中,不僅一個(gè)術(shù)語(yǔ)可以有多個(gè)下位術(shù)語(yǔ),并且一個(gè)術(shù)語(yǔ)可以有多個(gè)上位術(shù)語(yǔ)。通過(guò)樹(shù)型圖來(lái)呈現(xiàn)領(lǐng)域本體,可以很好地將一個(gè)術(shù)語(yǔ)的多個(gè)下位術(shù)語(yǔ)呈現(xiàn)出來(lái),但是卻無(wú)法將一個(gè)術(shù)語(yǔ)的多個(gè)上位術(shù)語(yǔ)直觀(guān)呈現(xiàn)出來(lái)。例如,以“教學(xué)系統(tǒng)”術(shù)語(yǔ)為根節(jié)點(diǎn),繪制樹(shù)型結(jié)構(gòu),得到結(jié)果如圖3所示。
從圖3中我們發(fā)現(xiàn),“多媒體網(wǎng)絡(luò)教學(xué)系統(tǒng)”有兩個(gè)上位術(shù)語(yǔ),即“多媒體教學(xué)系統(tǒng)”和“網(wǎng)絡(luò)教學(xué)系統(tǒng)”,“多媒體遠(yuǎn)程教學(xué)系統(tǒng)”也有兩個(gè)上位術(shù)語(yǔ),即“多媒體教學(xué)系統(tǒng)”和“遠(yuǎn)程教學(xué)系統(tǒng)”,因此,該部分領(lǐng)域本體的更為簡(jiǎn)潔的可視化結(jié)果如圖4所示,該圖中省去了一些只有一個(gè)上位術(shù)語(yǔ)的術(shù)語(yǔ)節(jié)點(diǎn)。
圖4已經(jīng)不再是一個(gè)樹(shù)型結(jié)構(gòu),而是一個(gè)網(wǎng)狀圖。如此一來(lái),術(shù)語(yǔ)之間的關(guān)系更為明了。因此,后續(xù)研究將致力于網(wǎng)狀圖的繪制,使領(lǐng)域本體的可視化結(jié)果更為簡(jiǎn)潔、直觀(guān)。
(三) 缺乏對(duì)領(lǐng)域部件的語(yǔ)義關(guān)系描述所引起的問(wèn)題
由于目前的術(shù)語(yǔ)部件之間沒(méi)有任何語(yǔ)義關(guān)系的描述如同義關(guān)系,致使術(shù)語(yǔ)間的同義關(guān)系未能發(fā)現(xiàn)。例如,“數(shù)字化”與“電子化”、“電子”等部件在教育技術(shù)學(xué)這一語(yǔ)境下可視為同義,由此便可推出“數(shù)字化學(xué)習(xí)”、“電子化學(xué)習(xí)”、“電子學(xué)習(xí)”等術(shù)語(yǔ)之間具有同義關(guān)系。
另外,未能對(duì)已有術(shù)語(yǔ)的同義關(guān)系進(jìn)行描述也會(huì)引起更多術(shù)語(yǔ)同義關(guān)系的出現(xiàn)。例如,在教育技術(shù)學(xué)語(yǔ)境中,“CAI”與“計(jì)算機(jī)輔助教學(xué)”同義,由此便可推出“CAI軟件”和“計(jì)算機(jī)輔助教學(xué)軟件”之間是同義關(guān)系。在后續(xù)研究中將對(duì)術(shù)語(yǔ)部件的語(yǔ)義關(guān)系以及一些術(shù)語(yǔ)之間的語(yǔ)義關(guān)系進(jìn)行人工設(shè)定,以便使術(shù)語(yǔ)之間的關(guān)系更為精確。
六、研究結(jié)論
本研究提出了一種基于術(shù)語(yǔ)部件的領(lǐng)域本體自動(dòng)構(gòu)建方法,該方法通過(guò)術(shù)語(yǔ)部件偏序集的包含關(guān)系來(lái)自動(dòng)發(fā)現(xiàn)術(shù)語(yǔ)之間的屬種關(guān)系和并列關(guān)系,并以《電化教育研究》期刊為例,通過(guò)分析該期刊近10年論文的題錄信息提取出1719個(gè)術(shù)語(yǔ),通過(guò)領(lǐng)域本體自動(dòng)構(gòu)建方法構(gòu)建起一個(gè)初步的教育技術(shù)學(xué)領(lǐng)域本體,實(shí)現(xiàn)了以樹(shù)型結(jié)構(gòu)呈現(xiàn)領(lǐng)域本體。由于缺乏對(duì)術(shù)語(yǔ)部件語(yǔ)義關(guān)系的描述和部分術(shù)語(yǔ)之間語(yǔ)義關(guān)系的描述,致使術(shù)語(yǔ)之間的關(guān)系不夠緊密,缺少更多同義關(guān)系和屬種關(guān)系的建立。并且以樹(shù)型結(jié)構(gòu)呈現(xiàn)領(lǐng)域本體也使可視化結(jié)果存在冗余節(jié)點(diǎn),需要進(jìn)一步研究如何使用網(wǎng)狀圖來(lái)呈現(xiàn)領(lǐng)域本體。因此,后續(xù)研究將從這兩方面不足出發(fā)去對(duì)領(lǐng)域本體建構(gòu)方法進(jìn)行進(jìn)一步完善,使得到的領(lǐng)域本體更好地反映當(dāng)前學(xué)科的知識(shí)體系,從而更好地為學(xué)科研究者和學(xué)習(xí)者提供知識(shí)服務(wù)。
[參考文獻(xiàn)]
[1] 陳天. SWOM網(wǎng)絡(luò)本體模型及其應(yīng)用研究[D]. 北京:北京師范大學(xué),2005.
[2] Tim Berners-Lee. Semantic Web - XML2000.W3C Web site 2000.URL[DB/OL].http://www.w3.org/2000/Talks/1206-xml2k-tbl/slide10-0.html.
[3] [13] 金芝. 知識(shí)工程中的本體論研究[A]. 世紀(jì)之交的知識(shí)工程與知識(shí)科學(xué)[M]. 北京:清華大學(xué)出版社,2001:451~452.
[4] 余勝泉,楊現(xiàn)民,程罡.泛在學(xué)習(xí)環(huán)境中的學(xué)習(xí)資源設(shè)計(jì)與共享——“學(xué)習(xí)元”的理念與結(jié)構(gòu)[J],開(kāi)放教育研究,2009,(1):47~53. [5] 楊麗娜,劉科成,顏志軍. 面向虛擬學(xué)習(xí)社區(qū)的學(xué)習(xí)資源個(gè)性化推薦研究[J]. 電化教育研究,2010,(4):67~71,85.
[6] 姜強(qiáng),趙蔚,杜欣,梁明. 基于用戶(hù)模型的個(gè)性化本體學(xué)習(xí)資源推薦研究[J]. 中國(guó)電化教育,2010,(5):106~111.
[7] 袁靜,焦玉英. 基于情景信息的學(xué)習(xí)資源個(gè)性化推薦[J]. 情報(bào)理論與實(shí)踐,2009,(7):116~119.
[8] 裘江南,師花艷,王延章. 基于事件鏈的知識(shí)導(dǎo)航模型研究[J]. 中國(guó)管理科學(xué),2009,(1):138~143.
[9] 楊發(fā)毅,陸敏,彭駿. 基于語(yǔ)義檢索的知識(shí)導(dǎo)航研究[J]. 情報(bào)雜志,2009,(4):176~179,207.
[10] 吳飛,吳兵,申志斌. 新一代網(wǎng)絡(luò)教學(xué)平臺(tái)特征和技術(shù)難點(diǎn)的分析與探討[J]. 開(kāi)放教育研究,2009,(1):10~20.
[11] 趙蔚,余延冬,張賽男. 開(kāi)放式e-Learning解決方案?jìng)€(gè)性化推薦服務(wù)——一種面向終身學(xué)習(xí)的數(shù)字化學(xué)習(xí)服務(wù)模式的探索思路[J]. 中國(guó)電化教育,2010,(11):110~116.
[12] 杜小勇,李曼,王大治. 語(yǔ)義Web與本體研究綜述[J]. 計(jì)算機(jī)應(yīng)用,2004,(10):14~16.
[14] [15] [17] [18] [19] [20] [21] 中國(guó)標(biāo)準(zhǔn)研究院.中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)GB/T10112-959 術(shù)語(yǔ)工作 原則與方法[S].1999.
[16] 王甦,汪安圣.認(rèn)知心理學(xué)[M].北京:北京大學(xué)出版社,1992,(4):262.
[22] 吳云芳,穗志方,邱利坤,宋作燕,胡俊峰. 信息科學(xué)與技術(shù)領(lǐng)域術(shù)語(yǔ)部件描述[J]. 語(yǔ)言文字應(yīng)用,2003,(4):34~39.
[23] 中國(guó)標(biāo)準(zhǔn)研究院.中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn) GB/T 19102-2003|術(shù)語(yǔ)部件庫(kù)的信息描述規(guī)范[S]. 2003.
[24] 傅騫,魏順平,王斌,路秋麗. 教育技術(shù)領(lǐng)域術(shù)語(yǔ)提取研究[J]. 現(xiàn)代教育技術(shù),2008,(5):60~65.
[25] 馮秀琪. 教育技術(shù)理論研究邏輯起點(diǎn)的思考[J]. 電化教育研究,2004,(7):24~26.
[26] 鄭旭東. 教育技術(shù)學(xué)的邏輯起點(diǎn)及其理論結(jié)構(gòu)[J]. 電化教育研究,2004,(8):23~27.
[27] 江北戰(zhàn). 探尋教育技術(shù)學(xué)的邏輯起點(diǎn)[J]. 電化教育研究,2005,(3):32~34.
[28] 何克抗. 關(guān)于教育技術(shù)學(xué)邏輯起點(diǎn)的論證與思考[J]. 電化教育研究,2005,(11):3~18.
[29] 趙劍. 教育技術(shù)學(xué)邏輯起點(diǎn)再探[J]. 電化教育研究,2006,(6):33~36.
[30] 劉瑞儒,黃榮懷. 也談教育技術(shù)學(xué)的邏輯起點(diǎn)[J]. 電化教育研究,2006,(8):29~33.