尹 付,尹 川
(1.常州工學(xué)院 外國語學(xué)院,江蘇 常州 213002;2.四川理工學(xué)院 自動化與電子信息工程學(xué)院,四川 自貢 643000)
基于粗糙集理論的應(yīng)用型本科院校英語教師科研水平評價研究
尹 付1,尹 川2
(1.常州工學(xué)院 外國語學(xué)院,江蘇 常州 213002;2.四川理工學(xué)院 自動化與電子信息工程學(xué)院,四川 自貢 643000)
粗糙集理論是一種新型的處理模糊和不確定數(shù)據(jù)的數(shù)學(xué)工具,將粗糙集理論運用于應(yīng)用型本科院校英語教師科研水平評價具有可操作性和準確性等特點. 利用粗糙集理論對江蘇省某些應(yīng)用型本科院校的 50名英語老師科研水平進行的隨機調(diào)查數(shù)據(jù)表進行處理計算得出決策屬性的影響度并分析其結(jié)果. 結(jié)果表明:研究結(jié)果可以為學(xué)校教學(xué)評估和教育評價以及學(xué)校教育管理提供理論支撐.
粗糙集理論;應(yīng)用型本科院校;科研水平
隨著信息技術(shù)的高速發(fā)展,人類產(chǎn)生并積累了大量的數(shù)據(jù),然而這些數(shù)據(jù)中卻存在著不確定性因素. 在這些大量的不確定數(shù)據(jù)背后隱藏著許多重要信息,充分利用這些重要信息可以很好地支持人們的決策. 當數(shù)據(jù)越來越多,數(shù)據(jù)規(guī)模急劇增長時,如何不被信息淹沒,如何能夠科學(xué)、合理、正確、有效地利用這些數(shù)據(jù)以產(chǎn)生對人們有用的信息和知識己成為當下一個非常令人關(guān)注的課題[1]. 迄今為止,一般只會利用簡單而單一的概率統(tǒng)計方法來研究科研水平,而這種傳統(tǒng)的方法有著很大的局限性,它只能從感性上說明問題,得到模糊、抽象的結(jié)論,并不能給人以直觀的確定的結(jié)果. 隨著社會的進步,這種模糊的分析方法已經(jīng)不能滿足人們的需求,而利用粗集理論來分析就可以彌補這樣的不足[2].
本文利用粗集理論的條件屬性約簡方法,分別以應(yīng)用性本科院校英語教師的科研申請項目數(shù)量、教材出版數(shù)量、發(fā)表論文數(shù)量、科研時間投入量、學(xué)歷學(xué)位、圖書擁有冊數(shù)、教師職稱、教師教齡、教師性別作為條件屬性,以教師的科研水平作為決策屬性,以江蘇省不同的應(yīng)用性本科院校共 50名英語教師作為研究對象,從而得出各個條件屬性對結(jié)果的重要性差異,并應(yīng)用粗集理論中知識的依賴性,分析出各個條件屬性對目標的依賴性和重要程度,結(jié)果更為具體、量化.
粗糙集理論(Rough Set,又稱粗集理論),是波蘭數(shù)學(xué)家Z·Pawlak于1982年提出的新的數(shù)學(xué)理論. 這一方法與概率統(tǒng)計方法,模糊集方法和證據(jù)理論方法等其它處理不確定性問題理論的最顯著區(qū)別是它無需提供問題所需處理的數(shù)據(jù)集合之外的任何先驗信息. 同時,由于該理論未能包含處理不精確或不確定原始數(shù)據(jù)的機制,使得該方法與其它處理不確定性問題的理論有很強的互補性,因此對問題的處理比較客觀[3].
為了更好地介紹粗集理論的應(yīng)用,這里有必要先具體解釋一下幾個重要的基本概念.
信息系統(tǒng)及研究論域 信息系統(tǒng)的基本成分是研究對象的集合,關(guān)于這些對象的知識是通過指定對象的屬性和它們的屬性值來描述的. 一般來說,一個信息系統(tǒng)S可以表示為四元組. S= f(U ,R,V,F),其中U為論域,是對象的非空有限集合,既研究對象的集合;R是屬性的非空有限集合,就是條件屬性;V是屬性值的集合,F(xiàn): U×R→V是一個信息函數(shù),它指定U中每一個對象x的屬性值. 通常信息系統(tǒng)S= f(U ,R,V,F)也可簡記為 S=(U, R).
離散歸一化處理 在智能信息處理中,很多時候遇到對事物的描述可能是定性的說明,也可能是數(shù)據(jù)的表達,表達可能是有層次分別的,也可能是無序的某種性質(zhì). 而定性就是比較模糊的,比較不精確的,粗集理論的研究則需要一個定量的準確的數(shù)據(jù)庫. 因此,就有了把定性的信息轉(zhuǎn)變?yōu)槎繑?shù)據(jù)表的問題,這就是離散歸一化處理. 而離散歸一化的方法應(yīng)滿足歸一化后的空間維數(shù)盡量小和歸一化后信息丟失盡量少這兩個特點[4].
上近似,下近似,邊界正域以及負域 在討論的論域U中,存在子集X∈U,定義R為一等價關(guān)系. 當X能用R屬性集確切的描述時,它可用某些R基本集合的并來表達,稱X是R可定義的,否則X為R不可定義的. 假設(shè)給定知識庫 K=(U, R),把U中所有一定能歸入X的元素的集合稱為X的R正域,既POSR(X). 用數(shù)學(xué)表達式表達就是 R_(X )={ X? U:[X ]R?X }而當R?(X )={ X? U:[X ]R∩X ≠}時,是上近似集. 此時上近似集中一定不能歸入下近似集的部分就被稱為X的R邊界,既 BNR(X),U中一定不能歸入X的集合就成為X的R負域,數(shù)學(xué)表達式為 NEGR(X).
屬性簡化 在實際工程應(yīng)用中,系統(tǒng)表達中并不需要定義全部的知識,也就是說在用一系列屬性來描述系統(tǒng)時,有一些屬性是冗余的,去掉冗余的屬性就可以達到簡化系統(tǒng)的目的,而簡化的這個過程就是屬性簡化[5].
給定知識庫 K=(U, R),對于所研究的系統(tǒng)U,定義一個等價關(guān)系 R∈ind( K ),令R為一等價關(guān)系,則作下面的定義:
地理國情普查作為一項全面的地理空間大調(diào)查,工作作業(yè)范圍廣、涉及部門多、成果豐富,服務(wù)于國家發(fā)展的方方面面,經(jīng)濟建設(shè)的各行各業(yè)。在當前形勢下,地理國情普查的成果轉(zhuǎn)化與應(yīng)用推廣,對于測繪工作者來說既是挑戰(zhàn)更是機遇。我們應(yīng)當以地理國情普查為契機,突破傳統(tǒng)測繪的局限性,逐漸豐富其內(nèi)容覆蓋的廣度與深度,融合不同領(lǐng)域?qū)I(yè)知識,面向政府部門、專業(yè)機構(gòu)、社會公眾的不同需求,創(chuàng)新地理信息產(chǎn)品,提供多樣化的應(yīng)用成果和技術(shù)服務(wù),實現(xiàn)測繪與地理信息事業(yè)的轉(zhuǎn)型升級。
如果 ind( R ) = ind( R ? {r}),則r為R中可省略的,否則r為R中不可省略的. 在一些近似表達中,有一些特征沒有作用,可以去掉這些特征而不影響對研究對象的表達.
核 對于任一r∈R,R不可省略,則族R是獨立的;當K獨立,且 ind( K) =ind( P),K?P為P的簡化;P中所有不可省略關(guān)系的交集,稱為P的核,記作core( P).
上面介紹了屬性簡化的定義及方法,那么具體是如何來計算每個條件屬性對決策屬性的重要性,下面將給于比較詳細的闡述.
首先令知識庫 K=(U, R),且P, S∈U,那么存在的性質(zhì):(1)當 ind( P) =ind( S),知識S依賴與知識P;(2)當P→S且S→P,知識P和S是等價的,記為P≡S;(3)當不存在P→S,且不存在S→P,P,S為獨立的[5].
這里 card( P OSP(S ))為決策屬性的個數(shù) card( U )為條件屬性的個數(shù),當K=1時,稱S是由P全可導(dǎo)的;當0 設(shè)(U, C ∪D, F)是一個決策表,其中C和D分別為條件屬性集和決策屬性集,屬性子集C'∈C關(guān)于D的重要性定義為,(特別地,當C'=a時,屬性a∈C關(guān)于D的重要性為: PCD(a) = rC(D ) ? rC?a(D))[7]. 以上是從理論上分析條件屬性對決策屬性影響度的計算,下面就把它應(yīng)用于目標知識系統(tǒng),利用屬性簡約的方法對教師的各個屬性進行分析. 這里是對江蘇省某些應(yīng)用型本科院校的50名英語老師進行的隨機調(diào)查,得到的數(shù)據(jù)表如表1(只給出前10名教師的調(diào)查情況): 表1 對英語老師的隨機調(diào)查表 首先對表1的原始信息進行離散歸一化處理,在此之前要先對上述的條件屬性進行定義,并將條件屬性設(shè)置為P,則根據(jù)表1可以看出P{1}、P{2}、P{3}、P{4}、P{5}、P{6}、P{7}、P{8}、P{9}這樣9個元素. 它們分別表示英語教師的科研申請項目數(shù)量、發(fā)表論文數(shù)量、教材出版數(shù)量、科研時間投入量、學(xué)歷學(xué)位、圖書擁有冊數(shù)、教師教齡、教師職稱和教師性別. 定義論文發(fā)表的數(shù)量2篇或2篇以下的為0,2篇到5篇的為1,而5篇以上的為2;科研時間投入量小于或等于3h以下為0,4h到7h為1,大于7h的為2;學(xué)歷為碩士或碩士以下為0,碩士以上為1;個人圖書擁有量40冊以下為0,40冊到80冊為1,80冊以上為2;教師教齡10年以下為0,10年到20年為1,20年以上為2;教師職稱副教授以下為0,副教授或教授為1,定義男性為0,女性為1,教師的科研水平為決策屬性,分別有強,較強,一般這樣三個屬性值,把它們分別定義為0、1、2這樣三個數(shù). 至此已經(jīng)全部定義了上表中的所有屬性,接著,把定性的屬性值按照定義歸一化成定量的屬性值得到表2(只給出前10名教師的調(diào)查情況): 表2 歸一化后的調(diào)查表 得到上面的歸一化后的知識系統(tǒng)后,就可以進行計算分析,首先可以對上表進行屬性的簡約,通過檢驗 ind( R ) = ind( R ? {r})這樣的條件來確定線性無關(guān)的屬性. 經(jīng)過分析可以發(fā)現(xiàn) ind( U ) = ind( U ? P{9}),即教師的性別對他的科研能力是沒有影響的. 接著對剩下的8項條件屬性分別根據(jù)計算公式計算他們的重要度. Card( U)= 100,條件屬性P{1,2,3,4,5,6,7,8},決策屬性S{教師的科研能力}. 然后計算各個條件屬性的重要性: 其余的各項也是通過上述方法來進行計算,他們分別是教材出版數(shù)量0.18,科研時間投入量0.12,教師學(xué)歷0.08,個人圖書擁有量0.07,教師教齡0.04,教師職稱0.05. 從上面的計算結(jié)果來看,可以較為清楚地了解對應(yīng)用型本科院校英語教師的科研水平進行分析的結(jié)果.此項研究結(jié)果可以為學(xué)校教學(xué)評估和教育評價以及學(xué)校教育管理提供理論支撐. 當然,不能認為這種評價就是完美無缺,它還需要教育管理部門和評估機構(gòu)的嘗試和驗證,希冀能為應(yīng)用型本科院校的英語教學(xué)目標實現(xiàn)和人才培養(yǎng)以及教師個人的科研水平提升都起到積極的作用. [1] PAWLAK Z ROUGH. Set theory and its applications to data analysis[M]. The Netherlands: Kluwer Academic Publishers,1991. [2] 曾黃麟. 粗集理論及其應(yīng)用——關(guān)于數(shù)據(jù)推理的新方法[M]. 重慶: 重慶大學(xué)出版社, 1996. [3] 姚 毅. 知識發(fā)現(xiàn)中概率統(tǒng)計與粗集方法的比較[J]. 四川輕化工學(xué)院學(xué)報, 2003(2): 9-15 [4] 曾黃麟, 姚 毅. Image Recognition Using Adaptive Fuzzy Neural Network And Wavelet Transform,Rough Sets, Fuzzy Sets, Data Mining, and Granular Computing[J]. Springer-Verlag, 2003: 635-639. [5] 尹 川, 姚 毅. 基于粗集理論的教師教學(xué)水平分析[J]. 河北軟件職業(yè)技術(shù)學(xué)院學(xué)報, 2009(3):34-36. [6] 張文修, 吳偉志, 梁吉業(yè), 等. 粗集理論與方法[M]. 北京: 科學(xué)出版社, 2001. [7] 劉 清. Rough集及Rough推理[M]. 北京: 科學(xué)出版社, 2003. [8] 石純一. 數(shù)理邏輯與集合論[M]. 北京: 清華大學(xué)出版社, 2000. Assessment on the English Teachers’ Researching Proficiency in the Application-Oriented Colleges Based on the Theory of Rough Set YIN Fu1, YIN Chuan2 The theory of Rough set is a new mathematical tool which deals with the fuzzy and uncertain data. It has the characteristics of operability and accuracy to apply the theory of Rough set on the assessment of the English teachers’ researching proficiency in the application-oriented colleges. By means of the theory of Rough set, the investigated data at random in the table on the fifty English teachers’ researching proficiency from the application-oriented colleges in Jiang Su province has been calculated and dealt with, by which the affecting degree of decision attributes has been got and the result has been analyzed. It proves that the result of the research can provide the theoretical support for teaching assessment, education evaluation and college management. Rough set theory; Application-oriented colleges; Scientific research proficiency H0-05 A 1009-2854(2010)08-0005-04 2010-06-15 尹付(1963- ), 男, 安徽和縣人,常州工學(xué)院外國語學(xué)院副教授, 上海外國語大學(xué)在讀博士, 研究方向為: 英語教學(xué)法, 認知語言學(xué). 饒 超)3 實例應(yīng)用
4 結(jié)語
(1.School of Foreign Language, Changzhou Institute of Technology, Changzhou 213002, China;2.School of Automation and Electronic Information Engineering, Si Chuan University of Science and Technology, Zigong 643000, China)