周 梅
?
信息化背景下普通話水平測試管理制度研究
周梅
摘要:普通話水平測試是國家級漢語口語測試,目前,計算機輔助測試已經(jīng)基本取代了人工測試,并且實現(xiàn)了全國測試管理網(wǎng)絡(luò)化。考務(wù)復(fù)雜化,測試安全性受到多方威脅,測試環(huán)境一致性差是普通話水平測試信息化階段產(chǎn)生的新問題。測試的組織者和管理者,需要厘清問題、尋找對策,保證普通話水平測試的質(zhì)量與公平。
關(guān)鍵詞:普通話水平測試;管理;信息化
普通話水平測試是一項大規(guī)模的以漢語作為母語者的口語測試活動,是由一系列測試環(huán)節(jié)按時間先后順序排列組成的測試行為過程。普通話水平測試包括四個基本要素:測試主體、測試客體、測試依據(jù)、測試手段。[1]74組織管理是普通話水平測試手段的重要組成部分。組織管理以測試目的為紐帶,將測試主體和測試客體聯(lián)結(jié)為矛盾統(tǒng)一體,使測試活動朝著既定的測試目標運行。2007年,計算機輔助普通話水平測試(下稱“機輔測試”)率先在安徽和上海試點推行,至2015年年底,各省(直轄市、自治區(qū))已經(jīng)全部開始推行“機輔測試”,實現(xiàn)了全國普通話水平測試信息化管理。因此,以2007年“機輔測試”試點為界,技術(shù)的應(yīng)用將普通話水平測試劃分為傳統(tǒng)測試與現(xiàn)代化測試兩個階段。現(xiàn)代化測試組織管理階段既積累了經(jīng)驗,也堆積了問題。本文嘗試總結(jié)機輔測試管理系統(tǒng)運行中存在的問題并剖析原因,在系統(tǒng)開發(fā)者和使用者之間建立信息通道,以期改進系統(tǒng)、改善管理,最終實現(xiàn)保障效率,保證質(zhì)量,維護測試安全性與權(quán)威性的目的。
一、普通話水平測試中管理制度的重要性
普通話水平測試是一項復(fù)雜的語言能力評測系統(tǒng)工程。從測試實施之初,普通話水平測試的管理一直是研究者們討論與關(guān)注的重要議題。
(一)普通話水平測試是口語測試
普通話水平測試方法為口試,和筆試相比,口語測試的組織難度與控制難度都比較大,主要表現(xiàn)在:程序復(fù)雜,除了應(yīng)試環(huán)節(jié),還有備測與候測環(huán)節(jié);考場要求高;應(yīng)試序次性不僅影響測試規(guī)模,在考務(wù)管理方面也更加復(fù)雜;需要對應(yīng)試人進行應(yīng)試培訓(xùn)方能保證測試順利進行;主試人需要具備一定的專業(yè)能力,且有數(shù)量上的要求。
(二)普通話水平測試規(guī)模宏大
隨著普通話的推廣進程,普通話水平測試規(guī)模迅速發(fā)展。從1994年普通話水平測試實施以來,全國每年參加測試的人數(shù)不斷攀升;應(yīng)試人群多樣化,具有廣泛性特點;測試主體(測試員)在管理與發(fā)展上,存在滿足測試規(guī)模的數(shù)量上的要求和測試能力的專業(yè)上要求的矛盾??傊?,前所未有的測試規(guī)模對測試工作提出了新的控制與管理上的課題。
(三)普通話水平測試是一項國家級、高風(fēng)險性的語言測試
時任教育部語言文字應(yīng)用研究所所長、國家語委普通話培訓(xùn)與測試中心主任姚喜雙在《推普工作的重要抓手——談依法推進的普通話水平測試》中曾經(jīng)指出:“普通話水平測試不是一般的學(xué)術(shù)性測試,不是可有可無的,而是關(guān)系到推普大業(yè)的一項測試?!盵2]普通話水平測試是國家級考試,普通話水平測試等級證書全國通用。《國家通用語言文字法》施行后,普通話水平測試成為國內(nèi)唯一經(jīng)法律確認、受政府委托而開展的語言測試?!秶彝ㄓ谜Z言文字法》還明確規(guī)定:“凡以普通話作為工作語言的崗位,其工作人員應(yīng)當具備說普通話的能力。以普通話作為工作語言的播音員、節(jié)目主持人和影視話劇演員、教師、國家機關(guān)工作人員的普通話水平,應(yīng)當分別達到國家規(guī)定的等級標準;對尚未達到國家規(guī)定的普通話等級標準的,分別情況進行培訓(xùn)?!?第十九條)普通話水平測試的結(jié)果和證書具有對相關(guān)行業(yè)的資格的證明作用,具有較高的社會權(quán)重。從社會學(xué)角度看,普通話水平測試又是一項高風(fēng)險的語言測試。這些特性都要求普通話水平測試的組織管理必須保證考試的嚴肅、公正和權(quán)威。
上述特征決定了普通話水平測試的組織管理的復(fù)雜性,對普通話水平測試管理制度的探索是測試實踐的重要內(nèi)容。
二、普通話水平測試信息化管理制度中存在的問題
嵌入信息化管理系統(tǒng)的計算機輔助普通話水平測試,不論在測試方式方面,還是在管理手段方面,都與過去完全的人工測試大不相同。學(xué)者們也對機輔測試給予了高度關(guān)注,圍繞著考務(wù)問題、測試安全問題、作弊問題、環(huán)境問題以及技術(shù)應(yīng)用問題進行了深入研究。因為各地使用的是同一套測試軟件和管理系統(tǒng),因此從這些研究中可以管窺全國機輔測試信息化管理中存在的問題。
(一)考務(wù)問題
考務(wù)問題是一個持續(xù)熱議的話題,具體表現(xiàn)為報名系統(tǒng)功能不完善[3]和監(jiān)考程序復(fù)雜[4]。就測試報名而言,一是系統(tǒng)不支持網(wǎng)上報名,當測試任務(wù)集中、報名量大時,該系統(tǒng)就會暴露出任務(wù)繁重、容易出錯的缺點。二是測試管理系統(tǒng)不支持與學(xué)校教務(wù)系統(tǒng)對接。高校學(xué)生是普通話水平測試的主要對象,據(jù)2009年的統(tǒng)計,在普通話水平測試中,學(xué)生參測比例高達77.5%。[5]2測試報名系統(tǒng)信息收集項目與學(xué)校管理不一致,與學(xué)校的教務(wù)管理系統(tǒng)無法對接,造成測試管理上的不便。就監(jiān)考程序而言,一是機輔測試監(jiān)考機缺少語音提示,人工操作程序繁復(fù)、耗時,考務(wù)工作任務(wù)相對較重。二是測試時間安排以批次為單位進行銜接,而不是以考生個人為單位,不能像托福網(wǎng)考那樣實現(xiàn)隨到隨考的時間安排。
(二)測試安全性問題
安全性始終是考試管理的核心問題。機輔測試的安全涉及面非常廣泛,主要包括軟件的安全、數(shù)據(jù)的安全和試題的安全。
1.軟件安全問題
在傳統(tǒng)的紙筆考試中,試卷安全是考試安全的首要問題。在信息化時代,首要問題是軟件。數(shù)據(jù)的傳輸、試題的發(fā)布等都需要通過軟件操作來進行。目前機輔測試的軟件尚未增設(shè)加密措施,考試結(jié)束后,需要考務(wù)人員通過操作考試機刪除考生身份信息、測試題目以及考生作答的語音數(shù)據(jù)等信息。但是,這些與測試有關(guān)的數(shù)據(jù)可以通過一些數(shù)據(jù)恢復(fù)軟件進行恢復(fù)。許多校園電腦使用的恢復(fù)軟件都具備這種功能,從而增大了考試信息泄露的可能性。
2.數(shù)據(jù)安全問題
考試數(shù)據(jù)(比如:考生信息、考生答題語音數(shù)據(jù)等)在考試結(jié)束后,必須安全回收,回送給考試的管理者,以便于評分、存檔等。這個環(huán)節(jié)特別重要,因為任何考試數(shù)據(jù)的丟失都將給考試帶來不可挽回的損失。為了保證考試數(shù)據(jù)的安全,通常需要:異地備份考試數(shù)據(jù);封存考場服務(wù)器,直至考試成績公布,并確認考生對考試成績無異議。
普通話水平測試在考務(wù)管理中,由于測試數(shù)據(jù)上傳速度慢,考務(wù)人員不得不將數(shù)據(jù)長時間存儲于機房,而普通話水平測試場地多數(shù)為開放式的非專用考場,在此期間很容易造成測試數(shù)據(jù)外泄,包括試題、考生身份信息和答題信息外泄。同時,不能排除有學(xué)生為獲得試題有意竊取這些信息。此外,單機版測試可能造成考試過程中數(shù)據(jù)的意外丟失。為了防止病毒入侵,便于機房維護,一般高校機房的電腦都裝有還原卡,以保證電腦重新啟動后會恢復(fù)到原有狀態(tài)。在進行普通話水平測試時,如果出現(xiàn)電腦崩潰、機房停電等意外情況,存儲于計算機中的測試數(shù)據(jù)就會丟失,對測試而言這種意外是毀滅性的。
從理論上講,在服務(wù)器上建立虛擬磁盤進行網(wǎng)絡(luò)數(shù)據(jù)存儲,或者增加一臺普通話考試專用計算機并使用密封機柜管理,可以解決軟件安全和數(shù)據(jù)安全問題。但是現(xiàn)實中存在操作上的障礙:一是導(dǎo)致硬件成本提高,而學(xué)校僅負責考試組織,考試的質(zhì)量與安全與其并無直接的利害關(guān)系,因而對加大投入并不積極;二是空間有限,存在沒有足夠的空間擺放新的設(shè)備的問題;三是數(shù)據(jù)管理缺乏制度保障,作為與不作為只取決于責任心;四是管理者自身對安全問題認識不足,技術(shù)能力有限。
3.試題安全問題
考試的次數(shù)多了,也會影響試題的安全,因為試題曝光次數(shù)多了,容易發(fā)生泄露。因此,試題庫必須能夠為計算機化考試提供足夠的試題,而且試題必須能夠定期更新。題庫的試題更新是保障考試安全的一個重要措施。試題的更新不是簡單地向試題庫添加新試題,這些新試題必須經(jīng)過試測并等值到試題庫的參數(shù)后才能加入試題庫。因此,基于計算機的考試可以通過隨機試測的辦法獲取新的試題:每一次考試都嵌入一些試測試題,這些試題不參與考生能力的估算,只是獲取考試數(shù)據(jù)并進行等值分析,這就意味著,試題庫應(yīng)隨著考試的不斷組織而得到自動更新。
機輔測試后,由于試題外泄,普通話水平測試用試卷已經(jīng)越來越無密可保。其原因在于:①普通話水平測試題庫試題有限,固定使用的僅有50套試卷,不能自動更新,且各個省(區(qū)、市)在使用時又有所縮減。②普通話水平測試頻次很高,試卷曝光率高。③機測軟件不支持隨機抽題。測試分批進行,測試任務(wù)必須由管理人員事先分配,更改批次任務(wù)需要花費很長時間。在實際考試過程中,為了保證考試效率,只能在間隔幾輪后再循環(huán)一次試卷,試卷使用重復(fù)率高。④測試軟件不支持隨機組卷,試卷固定不利于保密。⑤測試自身對應(yīng)試的反撥作用。在市場上和網(wǎng)絡(luò)上都出現(xiàn)了測試第四項“說話”的答案,一些考生將這些答案帶進考場或者背誦下來應(yīng)試,對測試造成嚴重干擾。
(三)測試環(huán)境問題
《計算機輔助普通話水平測試操作規(guī)程》對專用測試室和兼用測試室都有所規(guī)定:專用測試室應(yīng)有獨立測試機位若干,測試機位應(yīng)為2平方米以上獨立空間,隔音效果良好,內(nèi)置測試設(shè)備1套。利用常規(guī)教室或語音室作為測試室的,其室內(nèi)各機位的間隔不得少于3米。但是在實踐中,機輔測試使用專用測試室比例遠遠少于兼用、共享的計算機房。在機輔測試試驗初期,葉軍等人的研究提出測試的環(huán)境要求是,獨立測試室一室一機,多媒體或計算機房共用測試室,一間機房以不超過8臺考試機為宜。[6]多年實踐證明,這樣的要求很難做到。
利用現(xiàn)有機房作為測試考場,優(yōu)點是不需要太多投入,這是目前普通話水平測試考場安排的主要方式。但是,在機房測試存在考生之間相互影響的問題。由于考生的應(yīng)試作答的語音數(shù)據(jù)中相近的測試機位彼此聲音混雜,前三題機測成績受到了影響而失真。[7]還有研究者觀察到的測試站的測試現(xiàn)場情況是,考場人數(shù)太多,應(yīng)試人距離間隔不足,測試現(xiàn)場過于嘈雜。[8]此外,由于測試場地是共用機房,測試安全存在隱患,硬件設(shè)備也較容易出現(xiàn)故障。
普通話水平測試是一項標準化考試,理論上要求對每一位考生提供的測試軟硬件必須統(tǒng)一,施測條件標準化是其基本要求,也就是說,在測試環(huán)境方面應(yīng)該實行嚴格控制,保證所有考生都能在同等條件和相同的氣氛中應(yīng)試,使每個考生的水平都可以得到全面真實有效的反映。當然,就地區(qū)差異顯著的現(xiàn)實情況而言,要實現(xiàn)測試環(huán)境的標準化在目前來說還只能是一種理想。
三、對普通話水平測試信息化管理制度的思考
目前有關(guān)普通話水平測試信息化管理的研究成果多是問題研究,從某種角度來說正是對機輔測試管理現(xiàn)狀的描述和呈現(xiàn)。將這些零散的研究聚攏一起的時候,有些問題就會漸漸眉目分明,對探索機輔測試管理制度改革具有一定啟示意義。
首先,測試安全性一直困擾著基于計算機的語言測試,特別是大規(guī)模的、高風(fēng)險的語言測試。托福、GRE考試都出現(xiàn)了關(guān)鍵題目被考生記住然后用于傳播和散布的現(xiàn)象。測試安全性事關(guān)測試的健康發(fā)展。一是損害了測試的效度。不論是泄題還是替考,都導(dǎo)致了測試的分數(shù)已經(jīng)不能解釋為應(yīng)試人的普通話水平,考試成績和水平推斷之間斷裂了邏輯聯(lián)系,考試成績變得沒有證據(jù)價值。二是降低了測試的聲望。一個試題滿天飛的測試沒有什么嚴肅性可言。不能有效遏制替考、作答舞弊的測試也是缺乏權(quán)威性的。三是影響了測試的發(fā)展。比如題庫建設(shè)、試題改進,在測試安全性不能得到保障的前提下,題庫建設(shè)只會白白耗時耗力、浪費錢財。四是違背了測試倫理。國際語言測試協(xié)會(International Language Testing Association)于2000年專門頒布了語言測試的道德準則,從道德哲學(xué)層面提出九項規(guī)范測試行為的原則。個人隱私保密原則是其中的第二項,規(guī)定語言測試從業(yè)人員對測試中的考生所有信息負有保密責任。應(yīng)試人報名信息、答題語音信息數(shù)據(jù)的丟失,其危害性后果應(yīng)該被充分估量。普通話水平測試要想發(fā)展成為一個與國際著名語言測試相比肩的品牌,測試管理者需要在管理思想上與國際接軌。
其次,就目前考務(wù)管理來說,應(yīng)該改進管理系統(tǒng),使管理系統(tǒng)更加成熟和方便。在軟件改進過程中,應(yīng)該吸收一些組織管理者的意見,軟件設(shè)計團隊應(yīng)該多元化,測試、編程、管理成員在專業(yè)上互補,從而進一步完善測試管理,使技術(shù)更好地服務(wù)于測試。除此之外,鑒于機測管理環(huán)節(jié)多,考務(wù)工作比人工測試時期對考試安全性影響大得多,可以考慮從制度建設(shè)方面來保障考務(wù)工作的規(guī)范化。
再次,場地標準化是考試的基本要求??煽匦詮娛菢藴驶荚嚨闹匾卣髦?,要求考試設(shè)計和實施的全過程,均按一套系統(tǒng)的、科學(xué)的程序進行,并能有效控制整個流程中與測試無關(guān)因素的干擾,使各個環(huán)節(jié)的質(zhì)量符合規(guī)定的標準。目前,測試場地的顯著差異造成了一定程度的不公平。當然,讓所有應(yīng)試人都在專用測試室中考試,實現(xiàn)這一理想還有很長的路要走。那么,目前可以調(diào)整的就是對測試的進一步規(guī)范管理,嚴格限定考場中的人數(shù),在追求效率的同時兼顧質(zhì)量。
機輔測試管理現(xiàn)狀不容樂觀,高層級的測試管理機構(gòu)有必要對機輔測試進一步跟蹤研究、全面評估,從而更好地為普通話水平測試工作提供業(yè)務(wù)指導(dǎo)、質(zhì)量監(jiān)控和技術(shù)支持。
參考文獻:
[1]姚喜雙,韓玉華,聶丹,等.普通話水平測試概論[M].北京:高等教育出版社,2011.
[2]姚喜雙.推普工作的重要抓手:談依法推進的普通話水平測試[J].語言文字應(yīng)用,2010(3):26.
[3]李洪亮.高校計算機輔助普通話水平測試規(guī)范化研究[J].中國考試,2011(10):44-47.
[4]劉愛民.高校計算機輔助普通話水平測試中存在的問題及對策[J].重慶文理學(xué)院學(xué)報:自然科學(xué)版,2011(3):90-92.[5]韓其洲.國家普通話測試回顧與展望[M].北京:語文出版社,2010.
[6]葉軍,王頤嘉,周鳴之,等.計算機輔助普通話水平測試實施研究[J].語言文字應(yīng)用,2007(S1):142-148.
[7]項立.計算機輔助普通話水平測試中混響時間及數(shù)據(jù)安全問題探討[J].語文學(xué)刊:基礎(chǔ)教育版,2011(9):11-12.
[8]韓玉華.計算機輔助普通話水平測試試點地區(qū)的調(diào)查研究[J].首都師范大學(xué)學(xué)報:社會科學(xué)版,2009(S3):29-33.
(責任編輯 孟俊紅)
文章編號:1006-2920(2016)03-0074-04
doi:10.13892/j.cnki.cn41-1093/i.2016.03.014
作者簡介:周梅,文學(xué)博士,安徽警官職業(yè)學(xué)院基礎(chǔ)部副教授(合肥 230031)。