霍小靜
(西安培華學(xué)院 人文與國(guó)際教育學(xué)院,西安 710125)
目前英語(yǔ)考試智能組卷多以計(jì)算機(jī)自動(dòng)組卷技術(shù)為主,計(jì)算機(jī)自動(dòng)組卷技術(shù)能夠按照用戶的組卷需求,在計(jì)算機(jī)題庫(kù)里選取英語(yǔ)試題構(gòu)建一套滿足用戶需求的英語(yǔ)試卷.計(jì)算機(jī)自動(dòng)組卷技術(shù)能夠降低人力物力的投入,優(yōu)化英語(yǔ)考試組卷質(zhì)量與效率.
組卷問(wèn)題屬于一類多目標(biāo)優(yōu)化問(wèn)題,研究一種滿足組卷需求的智能組卷方法,是完成計(jì)算機(jī)智能組卷的核心,存在一定研究?jī)r(jià)值.
諸多學(xué)者為了提高組卷的水平對(duì)此進(jìn)行了研究,并取得了一定成果.例如,李瑞森等人[1]針對(duì)試題庫(kù)建設(shè)需求,提出了一種自底向上的試題庫(kù)建設(shè)方案,研究了試卷圖形化交互布局;杜明等人[2]針對(duì)信息化發(fā)展中在線試卷的組卷工作中存在的問(wèn)題,設(shè)計(jì)了基于知識(shí)水平的改進(jìn)智能遺傳組卷算法;此外,潘婷婷等人[3]研究了基于知識(shí)點(diǎn)權(quán)重與錯(cuò)誤率關(guān)聯(lián)的個(gè)性化訓(xùn)練模型,提高組卷水平.
和聲搜索算法能夠?qū)Χ嗄繕?biāo)優(yōu)化問(wèn)題存在較好的求解功能,但是傳統(tǒng)的和聲搜索算法易進(jìn)入局部最優(yōu),求解精度有待考證.為此,本文提出基于改進(jìn)和聲搜索算法的英語(yǔ)考試智能組卷策略,該方法中采用的和聲搜索算法為離散和聲搜索算法,并對(duì)離散和聲搜索算法進(jìn)行改進(jìn),使算法不易陷入局部最優(yōu).而且本文策略在求取英語(yǔ)考試智能組卷最優(yōu)解時(shí),題庫(kù)試題質(zhì)量較好;并且在計(jì)算機(jī)自動(dòng)組卷后,種群多樣性在組卷前期都較高,伴隨迭代次數(shù)增多,組卷后期本文策略種群多樣性快速降低,能夠快速獲取全局最優(yōu)解.
將英語(yǔ)考試知識(shí)點(diǎn)屬性φ1(y)設(shè)成:
其中,組卷任務(wù)的英語(yǔ)試題總量是m,第j個(gè)英語(yǔ)試題涵蓋的知識(shí)點(diǎn)比例是是第j個(gè)英語(yǔ)試題涵蓋的知識(shí)點(diǎn)數(shù)目,Stotal是知識(shí)點(diǎn)的總數(shù)量.
難度屬性可以描述英語(yǔ)試題難度φ2(y):
其中,Q1、Q2分別是主觀類、客觀類英語(yǔ)試題的難度;高分組、低分組的得分均值依次是、;此英語(yǔ)試題的總分值與本試題答對(duì)的人數(shù)依次是U、G;參與英語(yǔ)考試的所有人數(shù)是P;組卷人設(shè)置的難度值是φ,φ值較大,英語(yǔ)試題難度較高;yj表示第j個(gè)試題的難度水平.
區(qū)分度屬性能夠判斷英語(yǔ)試題得分程度[4–6].區(qū)分度屬性設(shè)成φ3(y):
其中,是γ 組卷人設(shè)定的區(qū)分度值,其值越大,代表英語(yǔ)試題得分高低差距越顯著.
時(shí)間期望屬性能描述一套英語(yǔ)考試時(shí)間多少,英語(yǔ)考試完成時(shí)間與組卷設(shè)定的時(shí)間較為靠近,則英語(yǔ)考試智能組卷的時(shí)間質(zhì)量較優(yōu)[7].試卷時(shí)間期望屬性φ4(y)具體設(shè)定是:
其中,第j個(gè)英語(yǔ)試題耗費(fèi)的期望時(shí)間是Hj,Hj值由組卷人設(shè)置;Htotal是整體測(cè)試時(shí)間.
為了優(yōu)化組卷質(zhì)量,構(gòu)建的模型需要以上述屬性為核心,構(gòu)建英語(yǔ)考試智能組多目標(biāo)優(yōu)化函數(shù)是:
英語(yǔ)考試智能組卷屬于離散問(wèn)題,必須采用離散和聲搜索算法求解式(8),獲取組卷最優(yōu)方案[8,9].離散和聲搜索算法先初始化和聲記憶庫(kù),各個(gè)組卷難度決策變量的值域設(shè)成組卷難度決策變量可能取值的數(shù)量設(shè)成L.在離散和聲搜索算法各次迭代時(shí),對(duì)φ (y)進(jìn)行求解,獲取智能組卷策略的可行解集合表示M個(gè)可行解.新的智能組卷策略可行解獲取方法是:
其中,rand表示[0 1]間的隨機(jī)數(shù),通過(guò)rand產(chǎn)生一個(gè)[0 1]間的隨機(jī)數(shù),然后將HMCR與該隨機(jī)數(shù)進(jìn)行比較,根據(jù)比較結(jié)果產(chǎn)生新的新和聲.HMCR表示和聲記憶庫(kù)取值(題庫(kù)使用)概率.
調(diào)整和聲記憶庫(kù)(Harmony Memory,HM)中的新和聲:
其中,音調(diào)(英語(yǔ)試題)調(diào)整概率是PAR;h、n分別代表一維變量與組卷的干擾變量.若獲取的新和聲比HM中最劣和聲好,把最劣和聲換成新和聲.當(dāng)?shù)螖?shù)達(dá)到最大值后,算法停止[10].
離散和聲搜索算法流程是:
(1)設(shè)定離散和聲搜索算法參數(shù):和聲記憶庫(kù)(題庫(kù))的大小HMS、音調(diào)(英語(yǔ)試題)調(diào)整概率PAR、和聲記憶庫(kù)取值(題庫(kù)使用)概率HMCR與迭代次數(shù)最大值N.
(2)在組卷難度決策變量可能取值的整數(shù)區(qū)間中任意建立多個(gè)和聲,運(yùn)算相應(yīng)的和聲適應(yīng)度值Ω (y1,y2),適應(yīng)度值能夠體現(xiàn)題庫(kù)試題的優(yōu)劣,將和聲記憶庫(kù)實(shí)施初始化處理[11,12].
其中,y1、y2依次表示英語(yǔ)試卷第1 道題與第2 道題的優(yōu)劣變量.
(3)使用式(9)獲取一個(gè)新和聲.使用式(11)調(diào)整HM中新和聲.如果新和聲比HM中最劣和聲優(yōu),把最劣和聲換成新和聲,運(yùn)算相應(yīng)和聲適應(yīng)度值,刷新HM.
(4)如果迭代次數(shù)為最大值,算法停止;反之回到第(2)步.
因?yàn)殡x散和聲搜索算法運(yùn)行時(shí),各次迭代僅可以使用和聲記憶庫(kù)的一個(gè)新和聲,新和聲與HM 里最劣的和聲相比之下,若新和聲比HM中最劣和聲優(yōu),把最劣和聲換成新和聲,實(shí)現(xiàn)HM 更新.此類方法屬于單個(gè)體更新處理,HM中的信息不能被充分使用,且算法具有非固定搜索屬性,獲取的智能組卷新解伴隨迭代次數(shù)的增多,難以存儲(chǔ)于和聲記憶庫(kù)中,和聲搜索算法的局部搜索性能將變差[13].為此,本文對(duì)此問(wèn)題進(jìn)行優(yōu)化,優(yōu)化模式如下:有和聲集合yj中建立一個(gè)相應(yīng)的新和聲,通過(guò)優(yōu)勝劣汰的模式將和HM中最劣和聲實(shí)施更新.在HM 外隨機(jī)設(shè)定一個(gè)收斂因子vj,防止算法進(jìn)入局部最佳,獲取的新解是:
(1)個(gè)性記憶考慮過(guò)程.在個(gè)體記憶考慮過(guò)程中可以全面使用HM中的全部積累信息.因?yàn)閭鹘y(tǒng)和聲搜索算法是一種維記憶考慮模式,記憶僅對(duì)和聲的部分維而言具備有效性.本文中,個(gè)體記憶考慮過(guò)程需要將各個(gè)個(gè)體實(shí)施全局記憶考慮.部分維記憶的模式將有損于和聲信息的完整度,但個(gè)體記憶考慮過(guò)程對(duì)和聲信息的完整度不存在損壞[14].算法在各次迭代時(shí),在已
其中,v1∈vj.若v1 (2)擾動(dòng)搜索過(guò)程.擾動(dòng)搜索過(guò)程為局部搜索,存在較顯著的局部搜索性能.能夠調(diào)整音調(diào),在小范圍中獲取和聲最優(yōu)解,不會(huì)進(jìn)入局部最優(yōu)[15]. 若新解屬于HM,使用音調(diào)調(diào)整概率PAR將ynew的各維變量實(shí)施調(diào)整搜索: 其中,v2∈vj,v3∈vj. (3)競(jìng)爭(zhēng)淘汰機(jī)制.因?yàn)楦翲S是在新解與最劣解之間實(shí)現(xiàn)競(jìng)爭(zhēng)更新,HM中信息更新效率低.為此改進(jìn)和聲搜索算法使用競(jìng)爭(zhēng)淘汰機(jī)制,將和聲記憶庫(kù)實(shí)施更新.在競(jìng)爭(zhēng)淘汰機(jī)制里,各個(gè)新解與HM中相應(yīng)的最劣解實(shí)施競(jìng)爭(zhēng).競(jìng)爭(zhēng)淘汰機(jī)制可以提升HM中優(yōu)勝劣汰的速度,優(yōu)化單個(gè)個(gè)體與和聲庫(kù)的整體質(zhì)量,將新和聲實(shí)施優(yōu)劣評(píng)價(jià),以此實(shí)現(xiàn)和聲記憶庫(kù)的更新.更新方法是: 使用此類競(jìng)爭(zhēng)淘汰機(jī)制提高HM 全局往最優(yōu)解靠近的效率. 為了測(cè)試本文基于改進(jìn)和聲搜索算法的英語(yǔ)考試智能組卷策略對(duì)英語(yǔ)考試試卷的智能組卷有效性,以2019年遼寧省英語(yǔ)四級(jí)考試的試卷為例,該省相關(guān)組卷機(jī)構(gòu)使用計(jì)算機(jī)自動(dòng)組卷系統(tǒng)進(jìn)行智能組卷,在該系統(tǒng)中引入本文策略進(jìn)行組卷.使用Java 語(yǔ)言編程進(jìn)行程序編寫,實(shí)驗(yàn)環(huán)境是Windows XP 系統(tǒng),處理器為851 MHz,內(nèi)存為64 MB.2019年某省英語(yǔ)四級(jí)考試的題庫(kù)里全部試題的知識(shí)點(diǎn)均值、難度均值、區(qū)分度均值依次設(shè)成0.65、0.52、0.63. 試卷分?jǐn)?shù)總值是100 分,填空題分?jǐn)?shù)是12 分,選擇題分?jǐn)?shù)是32 分,名詞解釋分?jǐn)?shù)是12 分,簡(jiǎn)答題分?jǐn)?shù)是22 分,綜合題分?jǐn)?shù)是22 分.設(shè)定試卷預(yù)期完成3個(gè)時(shí)間段指標(biāo)上下限值分別是30–60 min、61–90 min、91–120 min,3個(gè)時(shí)間段的組卷效果如圖1、圖2、圖3所示.組卷精度表示本文策略使用前后,計(jì)算機(jī)自動(dòng)組卷40 次獲取組卷策略可行解的概率;最優(yōu)值、最劣值、均值依次是本文策略組卷40 次后,計(jì)算機(jī)自動(dòng)組卷系統(tǒng)獲取可行解質(zhì)量的最優(yōu)值、最劣值、均值.圖1、圖2、圖3中,使用本文策略前,計(jì)算機(jī)自動(dòng)組卷系統(tǒng)獲取3個(gè)時(shí)間段可行解的概率依次是0.86、0.99、0.91;本文策略使用后,計(jì)算機(jī)自動(dòng)組卷獲取可行解的概率都是0.99.且本文策略使用后,計(jì)算機(jī)自動(dòng)組卷40 次獲取可行解的最優(yōu)值、均值大于使用前. 圖1 30–60 min 試卷的組卷效果 圖2 61–90 min 試卷的組卷效果 設(shè)定本文基于改進(jìn)和聲搜索算法的英語(yǔ)考試智能組卷策略在求取英語(yǔ)考試智能組卷策略的最優(yōu)解時(shí),和聲記憶庫(kù)中種群的個(gè)體數(shù)量都是100個(gè),迭代次數(shù)為350 次.本文策略使用前后的適應(yīng)度最大值如圖4所示.分析圖4可知,本文策略使用后的適應(yīng)度最大值為0.70,使用前的適應(yīng)度值是0.65,則使用本文策略求取英語(yǔ)考試智能組卷最優(yōu)解時(shí),題庫(kù)的試題質(zhì)量較好. 圖3 91–120 min 試卷的組卷效果 圖4 種群適應(yīng)度最大值 試卷種群的多樣性可表示題庫(kù)試題間的差異水平.試題差異較大,種群多樣性較高,否則,種群多樣性較低,試題差異較小.種群多樣性計(jì)算方法是: 其中,題庫(kù)中第j套智能組卷的最優(yōu)解種類均值為;h為維數(shù). 針對(duì)和聲搜索算法而言,種群的多樣性和算法的搜索性能存在直接影響,如果種群多樣性較大,算法的整體搜索性能較優(yōu),能夠探索未曾探索過(guò)的搜索范圍,用在本文研究?jī)?nèi)容中,可理解成能夠獲取新題型.但是,若種群多樣性始終較大,獲取全局最優(yōu)解的難度便提升,因此在搜索開始階段,種群需要存在較好的種群多樣性,搜索后階段,為了得到準(zhǔn)確的全局最優(yōu)解,種群需要往最優(yōu)解靠攏,種群的多樣性需要逐漸變小. 測(cè)試本文策略使用前后,計(jì)算機(jī)自動(dòng)組卷系統(tǒng)智能組卷后的種群多樣性,設(shè)定需要組卷的試題時(shí)間分別是30–60 min、91–120 min,結(jié)果如圖5、圖6所示.分析圖5、圖6可知,英語(yǔ)考試時(shí)間存在約束時(shí),本文策略使用下,計(jì)算機(jī)自動(dòng)組卷后,種群多樣性在組卷前期都較高,伴隨迭代次數(shù)增多,組卷后期本文策略種群多樣性快速降低,能夠快速獲取全局最優(yōu)解.相比之下,使用本文策略后,計(jì)算機(jī)自動(dòng)組卷性能較佳. 圖5 30–60 min 試卷的種群多樣性 圖6 91–120 min 試卷的種群多樣性 為了進(jìn)一步證明本文策略的有效性,采用文獻(xiàn)[1]、文獻(xiàn)[2]策略與本文策略進(jìn)行對(duì)比.對(duì)比方向?yàn)榻M卷精度以及組卷時(shí)間,比較結(jié)果分別如圖7、圖8所示. 根據(jù)圖7、圖8對(duì)比結(jié)果可以清晰看出,無(wú)論在50、100、150、200 還是250 次迭代次數(shù)中,本文策略的組卷精度明顯高于另外兩種策略,精度最高可達(dá)97%,而從組卷時(shí)間也可以看出,采用本文策略組卷的組卷時(shí)間明顯低于另外兩種方法,有效證明了本文策略的有效性. 圖7 不同策略組卷的精度對(duì)比 圖8 不同策略組卷的時(shí)間對(duì)比 以英語(yǔ)考試智能組卷這一問(wèn)題為研究核心,提出基于改進(jìn)和聲搜索算法的英語(yǔ)考試智能組卷策略.實(shí)驗(yàn)結(jié)果表明,不同試卷期望時(shí)間下本文策略獲取英語(yǔ)考試智能組卷可行解的概率都是0.99,組卷精度較高;迭代次數(shù)是300 次時(shí),本文策略適應(yīng)度最大值為0.70,本文策略在求取英語(yǔ)考試智能組卷最優(yōu)解時(shí),題庫(kù)試題質(zhì)量較好;本文策略使用下,計(jì)算機(jī)自動(dòng)組卷后,種群多樣性在組卷前期都較高,伴隨迭代次數(shù)增多,組卷后期本文策略種群多樣性快速降低,能夠快速獲取全局最優(yōu)解.2 仿真實(shí)驗(yàn)
2.1 不同試卷期望時(shí)間下組卷效果分析
2.2 試卷種群適應(yīng)度分析
2.3 試卷種群多樣性分析
3 結(jié)束語(yǔ)