国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于DL和領(lǐng)域本體的題目自動(dòng)生成技術(shù)

2012-08-16 01:10
關(guān)鍵詞:出題選擇題本體

李 慧

(鹽城師范學(xué)院,江蘇 鹽城 224000)

1 研究背景及意義

隨著計(jì)算機(jī)技術(shù)的普及,計(jì)算機(jī)等級考試作為一種測試計(jì)算機(jī)應(yīng)用知識掌握程度和上機(jī)實(shí)際操作能力的評判標(biāo)準(zhǔn)被迅速推廣起來。為了更好地幫助學(xué)生掌握計(jì)算機(jī)基礎(chǔ)知識,許多高校都建立計(jì)算機(jī)等級考試的試題庫供學(xué)生學(xué)習(xí)、檢測使用。然而,傳統(tǒng)的試題庫存在以下幾點(diǎn)缺陷:一是試題庫的維護(hù)需要花費(fèi)大量的人力、物力和時(shí)間;二是隨著試題庫的不斷增大,題庫中的題目不可避免地會(huì)出現(xiàn)冗余和重復(fù)[1]。為此,本課題研究了利用本體技術(shù)建立一個(gè)計(jì)算機(jī)基礎(chǔ)知識的知識庫,通過分析現(xiàn)有的江蘇省計(jì)算機(jī)等級考試的真題,總結(jié)出各類出題模式,并利用描述邏輯(Description Logic,DL)的有關(guān)理論生成多項(xiàng)選擇題的干擾項(xiàng),從而實(shí)現(xiàn)目前計(jì)算機(jī)等級考試中的理論題目(填空題、多項(xiàng)選擇題和判斷題)的自動(dòng)出題。

目前自動(dòng)出題系統(tǒng)雖然方法各異,但所有系統(tǒng)的基本框架都是一致的,通過總結(jié),得出一個(gè)題目自動(dòng)生成系統(tǒng)的一般框架如圖1所示。

圖1 題目自動(dòng)生成系統(tǒng)一般構(gòu)架

圖中知識庫、語料庫和文檔是試題題目的來源,一般只考慮一種,虛線框1是填空題必須經(jīng)過的步驟,虛線框1和2是選擇題必須經(jīng)過的步驟。

2 自動(dòng)出題系統(tǒng)分析和總體設(shè)計(jì)

2.1 可行性分析

文中以江蘇省計(jì)算機(jī)一級考試的真題考試為研究對象,詳細(xì)說明自動(dòng)出題技術(shù)的技術(shù)可行性。文中隨機(jī)選擇了近幾年的江蘇省計(jì)算機(jī)一級考試的8份試卷,人工地將每份試卷中的與概念有關(guān)的試題提取出來,與概念相關(guān)的題目具體情況見表1。

表1 歷年概念題題量分析表

由表1可見,與概念相關(guān)的試題題目的比例基本達(dá)到50%,有些甚至超過50%,這就說明利用本體技術(shù)可以解決計(jì)算機(jī)一級考試中的相當(dāng)一部分試題題目。

綜合一級考試的題目特點(diǎn),文中完全可以利用本體技術(shù)和描述邏輯技術(shù)來解決本系統(tǒng)的出題技術(shù)。本體技術(shù)主要用來解決概念的問題,邏輯描述技術(shù)可以用來解決試題中的并、非、包含、等價(jià)等形式[2]。

2.2 系統(tǒng)總體設(shè)計(jì)

系統(tǒng)利用DL技術(shù),利用本體中的概念及其關(guān)系和出題策略來生成一個(gè)完整的題目題干以及正確答案。系統(tǒng)共可以生成3種類型的題目:填空題、判斷題和選擇題,也即是系統(tǒng)共有3個(gè)模塊。系統(tǒng)最后可以將生成的題目放入到試題庫中。本系統(tǒng)的具體數(shù)據(jù)流程如圖2所示。

圖2 系統(tǒng)數(shù)據(jù)流程

3 自動(dòng)出題系統(tǒng)本體的設(shè)計(jì)和出題模式

文中采用的是斯坦福大學(xué)研究開發(fā)的Protégé軟件作為工具,并參考了當(dāng)前比較常用的一些本體建立方法,選取了彭勝華老師主編的《大學(xué)計(jì)算機(jī)信息技術(shù)》中的第二、三章為知識源,建立了一個(gè)OWL(Web Ontology Language)測試本體[1]。

3.1 本體的建立

文中所建立的本體中,共列舉了16個(gè)概念和術(shù)語。在這些概念中共建立了86個(gè)類,其中,計(jì)算機(jī)、電腦、主機(jī)、主板、顯示器、鼠標(biāo)等被定義為類;定義了9個(gè)屬性(其中,5個(gè)對象屬性,4個(gè)數(shù)據(jù)屬性)。另外還建立了26個(gè)個(gè)體實(shí)例,如ENIAC、超級計(jì)算機(jī)、大型計(jì)算機(jī)等,本體定義了所選章節(jié)中具有多個(gè)屬性值的個(gè)體,比如個(gè)體“ENIAC”具有的屬性值有:所屬國家美國,加法速度為5000次/s,乘法速度為300次/s等。

類的關(guān)系中主要建立了兩類關(guān)系:一類是父類和子類的關(guān)系,如計(jì)算機(jī)和大型計(jì)算機(jī)的關(guān)系;另外一類是等價(jià)關(guān)系,即兩個(gè)類表示同一個(gè)事物,如電腦和計(jì)算機(jī)為等價(jià)關(guān)系。在建立類的關(guān)系時(shí),還要設(shè)置互不相交關(guān)系,計(jì)算機(jī)分為巨型、大型、中型、小型和微型計(jì)算機(jī),這些類型的計(jì)算機(jī)之間互不相交。當(dāng)然,除了個(gè)體類之間存在以上關(guān)系外,屬性的關(guān)系也存在以上兩種情況。

另外,分別建立了對象屬性關(guān)系和數(shù)據(jù)屬性關(guān)系,通過這些屬性關(guān)系,建立了個(gè)體和個(gè)體之間的聯(lián)系。比如“所屬國家”屬性是一個(gè)對象屬性,用于連接兩個(gè)個(gè)體,如“ENIAC”所屬國家為“美國”[3]。

3.2 本體的層次結(jié)構(gòu)

所建立的本體中,類的層次圖如圖3所示。

其中,owl:Thing類是由Protégé初始建立的,表示包含所有個(gè)體集合的概括類,其它任何由用戶建立的類都是該類的子孫類。在owl:Thing類下,本體共定義了5個(gè)大類:電腦、硬件屬性、國家、計(jì)算機(jī)和計(jì)算機(jī)系統(tǒng),其中電腦和計(jì)算機(jī)屬于等價(jià)類,實(shí)際上建立的類一共4個(gè)。國家類主要用于描述個(gè)體實(shí)例的所屬地,它只有一個(gè)類元素組成。硬件屬性類主要描述硬件中的一些屬性指標(biāo),如字長、主頻等。計(jì)算機(jī)類主要描述計(jì)算機(jī)的分類,如分為巨型、大型計(jì)算機(jī)等。計(jì)算機(jī)系統(tǒng)類主要描述計(jì)算機(jī)的組成與結(jié)構(gòu),下有軟件和硬件類。

圖3 類的層次圖

本體所建立的屬性層次圖如圖4所示。

圖4 屬性層次圖

其中有1個(gè)屬性“所屬國家”為對象屬性,專門用于描述各類計(jì)算機(jī)以及各種硬件、軟件中的個(gè)體和國家類的個(gè)體之間的關(guān)系。數(shù)據(jù)類型屬性共有4個(gè)。屬性也可以有子屬性。本體中所建立的個(gè)體有26個(gè),一個(gè)個(gè)體可以屬于多個(gè)不相矛盾的類。

3.3 基于DL Axiom的出題策略

為了更好地表示出題策略,文中根據(jù)DL和OWL的一些語法,定義了一些符號的規(guī)則:利用大寫的A,B,C,D來表示Class,利用R,S來表示屬性關(guān)系,利用小寫的a,b,c來表示個(gè)體,利用A(a)來表示個(gè)體a屬于類A,利用R(b,c)來表示個(gè)體b和個(gè)體c存在二元關(guān)系R,利用?,≡等符號來表示子關(guān)系、等價(jià)關(guān)系等。

3.3.1 基于Class的出題策略

3.3.1.1 SubClassOf關(guān)系

在本體中,一般情況下,一個(gè)類如果有子類,往往有多個(gè)子類,即Ci?D(i>=1)。這種情況可以填空、選擇和判斷題。

3.3.1.2 EquivalentClasses關(guān)系

判斷題的出題策略為C≡D is True or C≡D is False。填空題與多項(xiàng)選擇題的出題策略是:如果兩個(gè)類是等價(jià)的,即C≡D,可以利用這種相等關(guān)系進(jìn)行出題。如果是多項(xiàng)選擇題,其干擾項(xiàng)可以利用C的父類、子類和兄弟類等。

3.3.1.3 DisjointUnion關(guān)系

不相交集主要表述的是一個(gè)類,是由其它幾個(gè)類組成的,并且組成的這幾個(gè)類互不相交,即C=D1∪…∪Di(i>1,Di∩Dj=Φ)。這種公理模式一般用以描述一個(gè)類的組成部分,如DisjointUnion(a:計(jì)算機(jī)a:軟件a:硬件)。

3.3.2 基于Property的出題策略

3.3.2.1 SubPropertyOf和 EquivalentProperties關(guān)系

在基于屬性的出題策略上,SubPropertyOf關(guān)系和SubClassOf的關(guān)系以及EquivalentProperties與EquivalentClasses的關(guān)系類似,其出題策略只需將類換成屬性即可,在此不再贅述。

3.3.2.2 利用 ObjectProperty關(guān)系

ObjectProperty關(guān)系主要用以連接兩個(gè)個(gè)體,以表達(dá)個(gè)體間的關(guān)系。

3.3.2.3 DataProperty關(guān)系

DataProperty關(guān)系主要用以連接一個(gè)個(gè)體和一個(gè)數(shù)值,即:R(a,Datatype),其中 Datatype可以是int,float等。對于多項(xiàng)選擇題,干擾項(xiàng)的選取可以采用加倍的關(guān)系,由于計(jì)算機(jī)中均采用二進(jìn)制,則一般可采用2的n次倍或者縮小2的n次倍的形式。

3.3.3 基于Individual的出題策略[4]

3.3.3.1 SameIndividual關(guān)系

SameIndividual關(guān)系主要用以描述兩個(gè)個(gè)體雖然名字不同,但實(shí)際上是指的同一事物這種情況,即a=b,出題策略與EquivalentClasses相同,這里就不再贅述。

3.3.3.2 DifferentIndividuals關(guān)系

DifferentIndividuals關(guān)系主要描述兩個(gè)個(gè)體不相同的情況,即a≠b。

3.3.3.3 Class Assertions

Class Assertions主要描述某一個(gè)個(gè)體a屬于一個(gè)Class類的情況。例如,描述ENIAC是第一代計(jì)算機(jī),利用類斷言可以表示為:ClassAssertion(a:第一代計(jì)算機(jī)a:ENIAC)。

3.3.4 基于 Annotation的出題策略[5]

Annotation用以對本體中的各種Class,Property和Individual進(jìn)行注釋和說明。類的注釋對于出題非常重要,類的注釋一般用以描述對該類(概念)的解釋、說明,有時(shí)候是定義,即:AA(C,String),AA 代 表 AnnotationAssertion,String為一個(gè)字符串。例如,AnnotationAssertion(計(jì)算機(jī)軟件“計(jì)算機(jī)系統(tǒng)中的程序及其文檔,程序是計(jì)算任務(wù)的處理對象和處理規(guī)則的描述;文檔是為了便于了解程序所需的闡明性資料”)。對于多項(xiàng)選擇題,干擾項(xiàng)可以選擇C的兄弟類、父類、子類均可。

3.3.5 多種策略的組合[6]

以上所出的策略都是基于單個(gè)Axiom得出的,其句子結(jié)構(gòu)往往都比較簡單,為了能夠構(gòu)造復(fù)雜的出題策略,將以上策略通過并、交、連接等操作進(jìn)行組合。

以上策略都是以判斷題和子類關(guān)系為例,對于填空題和其它類型關(guān)系與前面所述類似,這里也就不再贅述。

3.3.6 自動(dòng)出題系統(tǒng)功能實(shí)現(xiàn)[7]

系統(tǒng)根據(jù)算法中的出題策略,可以出填空題、判讀題和單項(xiàng)選擇題3種類型。系統(tǒng)對本體的訪問和操作實(shí)現(xiàn)是通過HP公司的Jena開發(fā)包來完成的。

要利用本體出題,首先要將本體文件讀入內(nèi)存(Ontology Model)中,然后遍歷整個(gè)本體,在遍歷過程中,利用各個(gè)出題策略進(jìn)行出題[8]。如果是單項(xiàng)選擇題,則根據(jù)正確選項(xiàng)和干擾項(xiàng)生成原則生成干擾項(xiàng),判斷是否遍歷結(jié)束,如果沒有的話就繼續(xù)遍歷,直至完成遍歷。將生成的題目存放到題庫中備用。

系統(tǒng)要遍歷本體中所有類、屬性和個(gè)體,在遍歷過程中,根據(jù)出題策略生成3種類型的題目,由于類、屬性和個(gè)體的遍歷的過程相似,詳細(xì)步驟如圖5所示[9]。

圖5 自動(dòng)出題的算法流程

[1]丁向民.基于本體的多項(xiàng)選擇題自動(dòng)生成技術(shù)研究[D]:[碩士學(xué)位論文].南京:南京航天航空大學(xué),2008.

[2]Studer R,Benjamins V R,F(xiàn)ensel D.Knowledge engineering,principles and methods[J].Dataand Knowledge Engineering,1998,25(1/2):161-197.

[3]許春霞.基于本體和描述邏輯的信息檢索研究[D]:[碩士學(xué)位論文].南京:東南大學(xué),2009.

[4]李華.基于本體的應(yīng)急領(lǐng)域知識表示與復(fù)用研究[D]:[博士學(xué)位論文].天津:天津大學(xué),2008.

[5]呂秋培,解素芳,李新利,等.關(guān)于元數(shù)據(jù)及其應(yīng)用[J].檔案學(xué)通訊,2003(3):47-50.

[6]周明.基于領(lǐng)域本體的網(wǎng)絡(luò)產(chǎn)品檢索引擎的研究與實(shí)現(xiàn)[D]:[碩士學(xué)位論文].長沙:湖南大學(xué),2009.

[7]劉秀琴.基于語義網(wǎng)的自適應(yīng)學(xué)習(xí)系統(tǒng)中領(lǐng)域本體的創(chuàng)建研究[D]:[碩士學(xué)位論文].長春:東北師范大學(xué),2008.

[8]禚全剛.企業(yè)應(yīng)用集成中一種基于領(lǐng)域本體的WEB服務(wù)組合方法[D]:[碩士學(xué)位論文].濟(jì)南:山東大學(xué),2007.

[9]蘇海華.基于本體的環(huán)境信息系統(tǒng)框架[J].長春工業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2006,27(4):89-92.

猜你喜歡
出題選擇題本體
民生實(shí)事 請人大代表“出題”“閱卷”
單項(xiàng)選擇題狂練
眼睛是“本體”
數(shù)列選擇題精選精練
例說速解選擇題的幾種有效方法
我只出題,不管證明
棉和綿
基于本體的機(jī)械產(chǎn)品工藝知識表示
十種妙招握在手 破解選擇題無憂
專題
全州县| 荔波县| 太康县| 鄂伦春自治旗| 辽中县| 准格尔旗| 丁青县| 泉州市| 上饶县| 朝阳县| 平乡县| 中山市| 龙陵县| 定州市| 句容市| 宝兴县| 独山县| 瑞丽市| 阿巴嘎旗| 九江市| 长宁区| 湖口县| 永泰县| 靖州| 蓬莱市| 云阳县| 吉安市| 冀州市| 德江县| 海阳市| 荥阳市| 安国市| 衡山县| 库尔勒市| 苍南县| 新乡市| 马关县| 鸡泽县| 江源县| 抚远县| 大连市|