陶利民
(杭州師范大學杭州國際服務工程學院,浙江杭州310012)
外語學習中的一個重要部分就是詞匯學習.詞匯量的大小直接影響到學習者語言輸入和輸出的質量,也影響其語用和語言交際的能力[1].同時,詞匯量對于教學目標的確定、教材編寫、教學組織和考試要求具有宏觀指導意義,也是教學診斷和教學評估的重要指標.因此,詞匯教學成為了外語教學中的一個重要方面,若這一環(huán)節(jié)不能很好地完成,也就很難完成教學目標.對外語學習者所掌握詞匯進行測試評估,是衡量詞匯教學效果的一種重要手段.傳統(tǒng)的詞匯量測試方法主要有詞頻法和詞典法,就是在詞匯表中隨機抽取若干詞匯作為測試樣本.其中,詞頻法是以詞匯頻率為依據(jù)進行詞匯抽樣,詞典法則是以一本詞典為調查對象等距離抽樣.抽取好測試樣本后,采用多項選擇法、翻譯法、是非判斷法、填空法或釋義法評測外語學習者對樣本詞匯掌握程度;再根據(jù)樣本詞匯測試結果按比例計算總體詞匯量,最終給出被測人員詞匯量大小的估計值,可用式(1)[2]表示:
由于測試結果會受到測試人員的穩(wěn)定性、心理素質等多種因素的影響,傳統(tǒng)的測試方法顯得粗糙簡單,不夠深刻全面,本文將采用基于云模型的定性評價方法來評估外語學習者的詞匯量水平[3].
李德毅院士在傳統(tǒng)模糊集合理論及概率論基礎上提出了云模型[4],借助模糊數(shù)學中隸屬度函數(shù)的思想,建立了一種定性定量不確定性轉換模型.云是用語言值表示的某個定性概念與其數(shù)值表示之間的不確定性轉換模型,用來反映自然語言中概念的不確定性.云模型能統(tǒng)一表達定性概念的模糊性及隨機性,并將二者有機集成到一起,構成定性和定量相互間的映射,作為知識表示的基礎,從而實現(xiàn)了不確定語言值與定量數(shù)值之間的一種自然轉換.
定義1(云) 設U是一個用精確數(shù)值表示的定量論域空間U={x},T是與U相聯(lián)系的語言值.若U中的定量值x是定性概念T的一次隨機實現(xiàn),x對于T所表達的定性概念的隸屬度μT(x)是一個具有穩(wěn)定傾向的隨機數(shù),隸屬度在論域上的分布稱之為隸屬云,簡稱云(Cloud).每一個x稱為一個云滴[5].
μT(x)在[0,1]區(qū)間上取值,云是從論域U到區(qū)間[0,1]的映射,即:
μT(x):U→[0,1],?x∈Ux→μT(x).
在進行詞匯量測試評估的背景下,U表示測試結果,如2 000;T表示詞匯量掌握程度,如初級;μ表示某一測試結果對于某一程度的隸屬度.
定義2(詞匯量云) 詞匯量云(Vocabulary Cloud)是一種特殊形式的云模型,它將測試人員所掌握詞匯量用云模型的方式反映出來.可將詞匯量云定性表示成:VC=Cloud(Ex,En,He).其中,Ex,En,He是反映詞匯量云的3個數(shù)字特征[6]:Ex是詞匯量期望,是最能代表詞匯量概念的點,表明測試人員所掌握的基本詞匯量.En是詞匯量熵,反映了測試人員掌握詞匯量達到某種程度所具有的不確定性.一方面En反映了能夠代表這個詞匯量概念的云滴所具有的離散程度,另一方面也反映了對詞匯量概念是一種亦此亦彼的度量.He是詞匯量超熵,反映了詞匯量熵的不確定性,由熵的隨機性和模糊性共同決定.
若要用云模型表示“詞匯量約2 000”這一定性概念,則可將期望Ex的值定為2 000,設En和He的值分別為150,20.圖1就是利用正向云發(fā)生器算法(算法2)生成的語言值“詞匯量約2 000”的隸屬云.
云模型具有3En規(guī)則,就是對于某一個定性概念或者知識,其相應的云對象大部分位于[Ex-3En,Ex+3En]之內,位于[Ex-3En,Ex+3En]之外的云滴元素只是小概率事件,通常都可忽略.圖1中就體現(xiàn)了這一規(guī)則.
圖1 語言值“詞匯量2 000左右”的隸屬云Fig.1 Membership cloud of“vocabulary around 2 000”
利用云模型進行詞匯量測試評估,主要經(jīng)過以下步驟:
1)抽樣測試.對測試人員進行n次詞匯抽樣測試,產(chǎn)生一系列的測試結果定量值:x1,x2,…,xn.
2)生成詞匯量云.將測試結果xi作為n個云滴,利用逆向云發(fā)生器算法[4,7](算法1),生成詞匯量云VC的3個數(shù)字特征(Ex,En,He).
算法1 逆向云發(fā)生器算法
輸入:n個云滴xi.
輸出:(Ex,En,He).
算法步驟:
①根據(jù)xi計算數(shù)據(jù)的樣本均值,一階樣本中心距,樣本方差S2=;
②Ex=
3)綜合詞匯量云.若對同一測試人員作了不同級別(設有N個級別)詞匯的測試,那么每一個級別會形成一個詞匯量云,共有N個詞匯量云,VCi(Exi,Eni,Hei),i=1,2,…,N.此時,需要利用式(2)將不同級別的詞匯量云綜合起來得到測試人員詞匯量的綜合評估云(Comprehensive Assessment Cloud)CAC(Ex,En,He).
4)結果分析.結合綜合評估云CAC(Ex,En,He),利用正向云發(fā)生器算法[8-9](算法2),對測試人員的詞匯量進行定性分析.
算法2 正向云發(fā)生器算法
輸入:表示定性概念的3個數(shù)字特征(Ex,En,He),云滴數(shù)量N.
輸出:N個云滴x及其確定度μ,即(drop(x1,μT(x1)),drop(x2,μT(x2)),…,drop(xN,μT(xN))).
算法步驟:
①生成以En為期望值,He為方差的一個正態(tài)隨機數(shù)En′i=NORM(En,He);
②生成以Ex為期望值,En′i為方差的一個正態(tài)隨機數(shù)xi=NORM(Ex,En′i);
③計算μT(xi)=;
④令帶有確定度μT(xi)的xi成為數(shù)域中的一個云滴;
⑤重復①~⑤,直至產(chǎn)生N個云滴止.
當然,也可以利用算法2對各個級別的測試結果作定性分析.
日本語能力測試(JLPT:The Japanese-Language Proficiency Test)是由日本國際交流基金會及日本國際教育支援協(xié)會于1984年建立的一套較為完整的考試評價體系,共分為5個級別(N1、N2、N3、N4、N5),所要求的詞匯量分別為12 000、7 000、3 600、1 800、900.本文以N2級所要求的詞匯量作為測試樣本,將其分為2 000個初級詞匯、2 000個中級詞匯、3 000個高級詞匯.測試時詞匯量樣本的大小影響測試結果,詞匯量樣本越大測試結果越準確.考慮到測試人員的心理,取各級別詞匯的10%作為測試樣本[10-11].為了計算需要,進行15組測試,根據(jù)測試人員的測試結果,利用式(1)可以估算出測試人員所掌握的詞匯量.表1列出的是A,B兩位測試人員每組詞匯的實際測試結果.可將每組詞匯測試結果看作是一個云滴,因此每個級別的詞匯測試可產(chǎn)生15個云滴.
表1 被測人員每組詞匯實際測試結果Tab.1 Vocabulary actual test results of tested personnel
將表1中每個級別的測試結果當作云滴,作為逆向云發(fā)生器算法(算法1)的輸入,就能計算出每個被測人員的初級、中級和高級3個級別分級詞匯量云的特征參數(shù)(Ex,En,He),由此得到被測人員的各級詞匯量的定性評價結果.結合云模型的3個特征參數(shù)的含義及實際應用情況,可利用這3個參數(shù)來反映影響被測人員測試結果的不同因素,其中,期望Ex最能體現(xiàn)被測人員的詞匯量水平,熵En反映了被測人員的穩(wěn)定性,超熵He反映心理素質,如表2所示.
表2 分級詞匯量評估結果特征參數(shù)Tab.2 Characteristic parameters of graded vocabulary assessment results
根據(jù)表2中分級詞匯量云的特征參數(shù),利用正向云發(fā)生器算法(算法2)可以得到被測人員A,B的分級詞匯量評估結果的云圖(圖2~圖3).從圖中可以直觀地看出:被測人員A分級詞匯量水平整體上比B高,但A測試結果較離散,穩(wěn)定性不如B.相較而言,B的測試結果較集中,發(fā)揮也比較穩(wěn)定.
圖2 被測人員A分級詞匯量云圖Fig.2 Graded vocabulary cloud of tested personnel A
圖3 被測人員B分級詞匯量云圖Fig.3 Graded vocabulary cloud of tested personnel B
分級詞匯量評估結果見表2.利用式(2)將其綜合,得到被測人員的整體詞匯量水平,如表3所示.
根據(jù)表3結果,利用正向云發(fā)生器算法(算法2)可以得到被測人員的整體詞匯量評估云圖,如圖4所示.從圖中可直觀地看出:被測人員A的詞匯量較大但是發(fā)揮不夠穩(wěn)定,比較而言,B的詞匯量中等,但是發(fā)揮較為穩(wěn)定.
表3 整體詞匯量評估結果特征參數(shù)Tab.3 Characteristic parameters of overall vocabulary assessment results
圖4 被測人員的整體詞匯量水平云圖Fig.4 Whole vocabulary level cloud of tested personnel
云模型能揭示自然語言中概念的兩種不確定性即模糊性和隨機性的內在關聯(lián)性,并把兩者完全集成在一起,實現(xiàn)定性語言值與定量數(shù)值之間的轉換.與傳統(tǒng)的定性評價方法相比較,基于云模型的定性評價方法實用性強,而且評價結果直觀、全面深刻,更加符合實際情況.另外,此方法也具有可行性和有效性,用之來評估外語學習者的詞匯量,具有實用意義.
[1]錢旭菁.詞匯量測試研究初探[J].世界漢語教學,2002,62(4):53-62.
[2]楊大平,劉桓中.英語詞匯量自測與學習策略研究[J].山東外語教學,2002,91(6):49-51.
[3]李廣琴.詞匯量對第二語言習得的影響和詞匯習得策略研究[J].西安外國語學院學報,2006,14(1):9-10.
[4]李德毅,劉常昱.論正態(tài)云模型的普適性[J].中國工程科學,2004,6(8):28-34.
[5]杜湘瑜,尹全軍,黃柯棣,等.基于云模型的定性定量轉換方法及其應用[J].系統(tǒng)工程與電子技術,2008,30(4):772-776.
[6]李德毅,孟海軍,史雪梅.隸屬云和隸屬云發(fā)生器[J].計算機研究與發(fā)展,1995,32(6):15-20.
[7]沈進昌,杜樹新,羅祎,等.基于云模型的模糊綜合評價方法及應用[J].模糊系統(tǒng)與數(shù)學,2012,26(6):115-123.
[8]呂輝軍,王曄,李德毅,等.逆向云在定性評價中的應用[J].計算機學報,2003,26(8):1009-1014.
[9]王洪利.基于云模型的不確定性變量半定量化研究[J].統(tǒng)計與決策,2012,362(14):4-6.
[10]郁梅.大學生英語詞匯量問題研究的回顧與思考[J].金陵科技學院學報:社會科學版,2006,20(2):100-103.
[11]周頌波,顧曄,郭亞莉.詞匯量測試述評[J].外語界,2008,124(1):90-95.