張繼威 張兆遠(yuǎn)
摘? 要:隨著教育全球化的深入推進(jìn)各國之間的教育合作與交流變得愈加緊密,此過程中各國互取所長、相輔相成。特別是教材的交流與學(xué)習(xí)成為教育領(lǐng)域合作的一個(gè)重要環(huán)節(jié)。中國不少出版社積極引進(jìn)、翻譯眾多國外的精品教材為國內(nèi)教師、學(xué)者和學(xué)生提供寶貴的教學(xué)資源。選擇合適的教材對(duì)于提高課程質(zhì)量至關(guān)重要。該文將圍繞“教育測(cè)量與評(píng)價(jià)”這個(gè)主題,對(duì)比分析國內(nèi)外的經(jīng)典教材,旨在探尋教材之間的差異和相似之處,以期為教師提供綜合應(yīng)用的參考,同時(shí)也為未來編寫更具創(chuàng)新性的教材奠定基礎(chǔ)。最后,該文的研究方法也可以為其他學(xué)科的教材研究提供借鑒。
關(guān)鍵詞:教育測(cè)量與評(píng)價(jià);教材;內(nèi)容分析;對(duì)比研究;全球化
中圖分類號(hào):G423? ? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? ? ? 文章編號(hào):2096-000X(2024)10-0006-05
Abstract: With the deepening advancement of educational globalization, cooperation and exchanges between countries in the field of education have become increasingly close, benefiting from mutual learning and complementing each other. In particular, the exchange and study of textbooks have become a crucial aspect of educational collaboration. Many Chinese publishers have proactively introduced and translated numerous high-quality foreign textbooks, offering valuable educational resources for domestic teachers, scholars, and students. The selection of appropriate textbooks is paramount to enhancing course quality. This paper focuses on the theme of "educational measurement and evaluation", and conducts a comparative analysis of classic textbooks from both domestic and international sources. The aim is to discern the differences and similarities between these materials, offering comprehensive references for educators and laying a foundation for the creation of more innovative textbooks in the future. Furthermore, the research methodology employed in this article can also serve as a reference for textbook research in other disciplines.
Keywords: educational measurement and assessment; textbooks; content analysis; comparative study; globalization
在當(dāng)今這個(gè)數(shù)字化深入滲透到每一處角落的互聯(lián)網(wǎng)時(shí)代,教育與數(shù)字化和全球化緊密融合正在經(jīng)歷一場(chǎng)前所未有的變革。從技術(shù)維度來審視,線上課程與MOOCs(大規(guī)模開放在線課程)的出現(xiàn)以及虛擬課堂、遠(yuǎn)程學(xué)習(xí)的普及,均為教育技術(shù)的全球化共享與交流提供了堅(jiān)實(shí)的技術(shù)支撐。而人工智能在教育領(lǐng)域中的廣泛應(yīng)用則進(jìn)一步推動(dòng)了教育方法和手段的創(chuàng)新。同時(shí),各國之間教學(xué)合作項(xiàng)目的快速增長,留學(xué)生人數(shù)的穩(wěn)步上升,以及學(xué)歷和學(xué)位的國際互認(rèn)都極大地促進(jìn)了全球教育資源和人才的流動(dòng)。這些因素共同推進(jìn)了教育領(lǐng)域全球化的深入發(fā)展,預(yù)示著一個(gè)跨文化、高效和多元的未來教育格局。
正是在這樣的大背景下,教材作為教育的重要組成部分,其內(nèi)容、結(jié)構(gòu)和教學(xué)理念也隨之發(fā)生變革。教育測(cè)量與評(píng)價(jià)作為教育領(lǐng)域的核心課程,相關(guān)教材在外國的表現(xiàn)和特色如何。基于此本文針對(duì)國內(nèi)外的優(yōu)秀教材進(jìn)行深入的對(duì)比研究,期望能揭示不同文化和教育背景下的教材特色和創(chuàng)新點(diǎn),以及在全球化背景下各國如何處理教育評(píng)價(jià)這一核心議題。這樣的對(duì)比分析不僅有助于完善和豐富現(xiàn)有教材的內(nèi)容和形式,更為教師提供了一種跨文化的視角,助力其在全球化的大背景下作出更加合理的教學(xué)和研究決策。此外,隨著教育領(lǐng)域全球化的深入發(fā)展,教材的內(nèi)容、結(jié)構(gòu)和教學(xué)理念的對(duì)比和研究不僅具有理論意義,更在實(shí)踐中有著廣泛的應(yīng)用價(jià)值。教材研究和改進(jìn)將成為跨文化、高效和多元的未來教育格局的重要基石。
一? 挑戰(zhàn)與機(jī)遇
(一)? 挑戰(zhàn)
1? 背景差異
現(xiàn)代社會(huì)隨著全球化國際化日益深入,彼此間的了解也越來越廣泛和深入,但是不同地域不同國家的文化和教育背景可能依然存在著顯著差異。國內(nèi)和國外的教育系統(tǒng)、教育哲學(xué)、教育觀念、評(píng)價(jià)體系和價(jià)值觀念等都可能有所不同,這些因素都可能會(huì)影響教材的內(nèi)容和結(jié)構(gòu)。
2? 語言和翻譯
翻譯有時(shí)難以完美捕捉原作的深意,更不用說每位讀者在閱讀原著時(shí)都可能產(chǎn)生各自的解讀。因此,即便翻譯能夠忠實(shí)于原文的內(nèi)容,但文化、語境和教育背景的差異依然可能帶來某些概念的解讀偏差或誤解。
3? 技術(shù)的局限性
盡管機(jī)器學(xué)習(xí)和自然語言處理技術(shù)為內(nèi)容分析提供了有力的輔助,但其依然存在局限性,例如可能無法充分領(lǐng)會(huì)文本的復(fù)雜性與深意。最終,真正的使用者和評(píng)估者還是人類。
4? 評(píng)價(jià)指標(biāo)的選擇
確定哪些指標(biāo)能夠最為準(zhǔn)確地揭示教材的質(zhì)量和獨(dú)特性無疑是一大挑戰(zhàn)。面對(duì)同樣的問題,不同的專家或許會(huì)因其學(xué)術(shù)背景和研究經(jīng)驗(yàn)而有所偏好,導(dǎo)致他們?cè)谶x擇指標(biāo)時(shí)的側(cè)重點(diǎn)產(chǎn)生差異。這也意味著評(píng)價(jià)一本教材時(shí)單一的評(píng)價(jià)標(biāo)準(zhǔn)可能并不全面,需要綜合多方意見才能更為深入地挖掘其內(nèi)涵和價(jià)值。
(二)? 機(jī)遇
1? 全球化的視角
通過對(duì)比國內(nèi)與國外的教材,我們不僅能夠獲得一個(gè)全球化的視角,更能借此一角洞察到各種文化和教育體系如何處理、解讀和傳授教育測(cè)量與評(píng)價(jià)這一關(guān)鍵主題。這種跨文化的對(duì)比分析將極大地豐富我們的認(rèn)知,使我們能夠多維度地去思考同一問題,并挖掘出不同教育傳統(tǒng)和方法在實(shí)踐中的獨(dú)特價(jià)值和智慧。同時(shí),這也為我們?cè)诮虒W(xué)或研究中采納和融合不同的思想和方法提供了更加堅(jiān)實(shí)的基礎(chǔ)。
2? 教育實(shí)踐的創(chuàng)新
通過比較和分析我們不僅有可能發(fā)現(xiàn)新穎的教學(xué)方法、理論框架和實(shí)踐策略,更重要的是可以從全球的豐富實(shí)踐中汲取智慧和經(jīng)驗(yàn)。將這些國際化的視角和策略引入到自己的教育體系中,不僅可以豐富教育的內(nèi)涵還可以有效提升教育質(zhì)量和效果。同時(shí),這樣的交流和對(duì)比也促進(jìn)了教育者之間的相互學(xué)習(xí)和合作,進(jìn)一步推動(dòng)教育創(chuàng)新和進(jìn)步。
3? 技術(shù)的進(jìn)步
隨著機(jī)器學(xué)習(xí)和自然語言處理技術(shù)(Natural Language Processing,NLP)的迅猛發(fā)展,我們已經(jīng)可以看到在內(nèi)容分析領(lǐng)域的種種變革。這些尖端技術(shù)不僅為我們打開了新的研究視野,讓我們得以更加深入、準(zhǔn)確地挖掘和理解教材內(nèi)容,而且在處理大規(guī)模數(shù)據(jù)時(shí)顯示出前所未有的速度和效率。利用這些技術(shù)我們能夠探索和發(fā)現(xiàn)教材中的隱含模式、關(guān)聯(lián)和趨勢(shì),這些可能是傳統(tǒng)方法難以覺察的。因此,機(jī)器學(xué)習(xí)和NLP技術(shù)不僅為教育研究帶來了高效率,還為我們提供了更廣泛、更深層次的認(rèn)知視角。
4? 促進(jìn)國際合作
教材的對(duì)比研究不僅具有學(xué)術(shù)價(jià)值還有可能引起國際教育界的關(guān)注和興趣。這為不同文化和背景的教育者提供了一個(gè)交流平臺(tái)促進(jìn)知識(shí)、技術(shù)和經(jīng)驗(yàn)的共享。在這樣的交流與碰撞中教育者們可以互相學(xué)習(xí)取長補(bǔ)短,從而共同推進(jìn)教育測(cè)量與評(píng)價(jià)領(lǐng)域的繁榮與進(jìn)步。此外,這種跨文化跨國界的合作還可能碰撞出思想的火花催生新的教育理念和方法為全球教育質(zhì)量的提升夯實(shí)基礎(chǔ)。
5? 小結(jié)
總而言之,雖然基于內(nèi)容分析的教育測(cè)量與評(píng)價(jià)國內(nèi)外教材的對(duì)比研究面臨一些挑戰(zhàn),但同時(shí)也帶來了許多機(jī)遇,為我們提供了一個(gè)全球化的新穎的視角來看待“教育測(cè)量與評(píng)價(jià)”這一主題。
二? 研究方法的創(chuàng)新
本文將傳統(tǒng)內(nèi)容分析與現(xiàn)代技術(shù)相結(jié)合進(jìn)行研究,采用機(jī)器學(xué)習(xí)和NLP技術(shù)輔助內(nèi)容分析。傳統(tǒng)的內(nèi)容分析主要依賴人工的方式來解讀、分類和總結(jié)文本內(nèi)容。隨著科技的發(fā)展機(jī)器學(xué)習(xí)和NLP技術(shù)的不斷進(jìn)步,內(nèi)容分析的方式和方法也得益于技術(shù)的進(jìn)步得到了很大的拓展和深化。
(一)? 傳統(tǒng)內(nèi)容分析的局限性
主觀性強(qiáng)。傳統(tǒng)內(nèi)容分析很大程度上依賴研究者的經(jīng)驗(yàn)和判斷。同時(shí),不同的研究者還會(huì)受到自身背景和偏好的影響。這些都有可能造成分析結(jié)果帶有很強(qiáng)的主觀性。
效率低。處理大量數(shù)據(jù)時(shí)人工分析非常耗時(shí)。通常一本教材幾十萬字的內(nèi)容仔細(xì)閱讀進(jìn)行內(nèi)容分析需要耗費(fèi)大量時(shí)間才能完成,這無疑是低效率的。
結(jié)果一致性差。傳統(tǒng)內(nèi)容分析效率低,因此有時(shí)研究者可能會(huì)采取分工合作的方式來完成研究工作,而不同研究者的主觀性又很可能得到前后意見不一致的分析結(jié)果。
(二)? 現(xiàn)代技術(shù)的優(yōu)勢(shì)
高效性??梢钥焖俜治龃罅康奈谋緮?shù)據(jù)。這正好能夠滿足幾十萬字的教材內(nèi)容分析的需要,極大地提高了工作效率。
客觀性強(qiáng)。機(jī)器學(xué)習(xí)算法的決策是基于數(shù)據(jù)(包括文字、圖像、語音和數(shù)字等)和預(yù)設(shè)模型的,這在很大程度上降低了主觀偏見。
模式識(shí)別。能夠識(shí)別教材中的復(fù)雜模式,如復(fù)雜度評(píng)估、可視化分析、比較分析、情感分析和主題建模等。
(三)? 評(píng)價(jià)指標(biāo)的意義
內(nèi)容質(zhì)量。準(zhǔn)確性,即內(nèi)容是否正確無誤,沒有明顯的錯(cuò)誤或遺漏;全面性,即內(nèi)容是否涵蓋了該領(lǐng)域的核心概念和關(guān)鍵知識(shí)點(diǎn);深度,即內(nèi)容是否深入,提供了足夠的詳細(xì)信息,以幫助學(xué)生深入理解;時(shí)效性,即內(nèi)容是否是最新的,反映了領(lǐng)域的最新發(fā)展。
組織結(jié)構(gòu)。邏輯性,即章節(jié)和內(nèi)容的組織是否具有邏輯性,易于理解;連續(xù)性,即內(nèi)容是否連貫,每一部分是否都有清晰的連接。
易讀性和呈現(xiàn)方式。布局和設(shè)計(jì),即頁面設(shè)計(jì)是否清晰,圖表、圖片和文本是否協(xié)調(diào);文字表述,即語言是否清晰、簡潔,沒有冗余;實(shí)例與案例,即是否提供了充分的實(shí)際例子來闡明概念。
互動(dòng)和參與?;顒?dòng)和練習(xí),即是否包含了有效的練習(xí)和活動(dòng),幫助學(xué)生實(shí)踐和加深理解;反饋機(jī)制,即是否有為學(xué)生提供反饋的工具或資源,如答案解析。
文化和價(jià)值觀。多樣性,即內(nèi)容是否反映了多種文化、背景和觀點(diǎn);中立性;內(nèi)容是否公正、客觀,避免了偏見和刻板印象。
教學(xué)支持。教學(xué)指導(dǎo),即是否提供教師手冊(cè)或指導(dǎo)資源,幫助教師更好地使用教材;資源和補(bǔ)充材料,即是否有在線資源、額外閱讀材料、習(xí)題庫等。
適用性。適用對(duì)象,即該教材是否適合其目標(biāo)讀者,例如初學(xué)者或進(jìn)階學(xué)者;靈活性,即教材是否能靈活適應(yīng)不同的教學(xué)方式和環(huán)境。
價(jià)值。價(jià)格,即考慮到其內(nèi)容和質(zhì)量,該教材的價(jià)格是否合理;持久性,即教材是否能長時(shí)間使用,不會(huì)很快過時(shí)。
評(píng)價(jià)教材時(shí),可以根據(jù)上述指標(biāo)進(jìn)行詳細(xì)的分析,但也需要考慮到特定的教育背景和目標(biāo)。
(四)? 結(jié)合現(xiàn)代技術(shù)的方法
使用機(jī)器學(xué)習(xí)和NLP技術(shù)可以自動(dòng)識(shí)別并評(píng)估上述評(píng)價(jià)指標(biāo)。例如,通過情感分析可以判斷內(nèi)容的情感深度;通過主題建??梢耘袛鄡?nèi)容的多元化;文本的復(fù)雜性和長度可以用來評(píng)估易讀性等。結(jié)合傳統(tǒng)內(nèi)容分析與現(xiàn)代技術(shù),不僅可以提高內(nèi)容分析的效率還可以提高其準(zhǔn)確性和一致性。這種結(jié)合為研究者提供了一個(gè)全新的、有效的工具來深入探索文本內(nèi)容,并從中獲得有價(jià)值的見解??偟膩碚f,傳統(tǒng)內(nèi)容分析和現(xiàn)代技術(shù)的結(jié)合為研究者提供了一個(gè)更為全面、深入的工具,可以更好地評(píng)估和理解文本內(nèi)容。
三? 數(shù)據(jù)視角下的內(nèi)容分析
(一)? 可讀性分析
選取4本英文《教育測(cè)量與評(píng)價(jià)》教材[1-4],采用Python中的textstat包對(duì)這4本教材進(jìn)行分析,選取其中4個(gè)指標(biāo)進(jìn)行分析結(jié)果見表1。從表1中可知,文獻(xiàn)[4]教材的Flesch閱讀便利性指標(biāo)值最大,說明它是這4本教材中最容易閱讀的;文獻(xiàn)[3]教材指標(biāo)值最低,說明它是這4本教材中最難閱讀的;文獻(xiàn)[2]教材的文本標(biāo)準(zhǔn)指標(biāo)值為12最低,最高值為14,從總體年級(jí)估計(jì)結(jié)果來看這些教材都適合大學(xué)生閱讀學(xué)習(xí);文獻(xiàn)[4]教材的平均句子長度指標(biāo)值為17.6最低,文獻(xiàn)[3]教材的值為19.3最高,通常認(rèn)為句子越長越難閱讀這正好與Flesch閱讀便利性指標(biāo)值意義相反。
由于textstat包是針對(duì)英文的語言特點(diǎn)進(jìn)行編寫的,所以此處僅對(duì)選取的4本英文教材進(jìn)行文本分析,文獻(xiàn)[1]教材有對(duì)應(yīng)的中文翻譯版教材文獻(xiàn)[5]。Python中的cntext包是一款中文文本分析工具,其中包含可讀性分析,文獻(xiàn)[5]教材的可讀性得分為47.03,文獻(xiàn)[6]教材的可讀性得分為53.08,指標(biāo)值越大文章復(fù)雜度越高可讀性越差,這與textstat包中的Flesch閱讀便利性指標(biāo)值的意義相反。下面我們主要對(duì)翻譯版文獻(xiàn)[5]教材(2015)與中文文獻(xiàn)[6]教材(2016)進(jìn)行深入分析,它們年份相近且都是中文適合比較,文獻(xiàn)[6]教材的第二版[7]已于2022年出版。
(二)? 目錄分析
對(duì)比分析文獻(xiàn)[5]教材與文獻(xiàn)[6]教材的目錄發(fā)現(xiàn),這兩本教材都涵蓋了教育測(cè)量和評(píng)價(jià)的重要內(nèi)容,但也存在側(cè)重和差異,對(duì)比分析如下所述。
1? 章節(jié)數(shù)量和結(jié)構(gòu)
兩本教材的章節(jié)數(shù)量大致相似,文獻(xiàn)[5]教材比文獻(xiàn)[6]教材多兩章,整體的章節(jié)結(jié)構(gòu)和標(biāo)題有所不同。例如,文獻(xiàn)[5]教材前三章主要涵蓋了教育評(píng)估簡介、數(shù)學(xué)基礎(chǔ)和測(cè)試得分的意義;而文獻(xiàn)[6]教材的前三章主要涵蓋了教育測(cè)量與評(píng)價(jià)的概論、歷史和基礎(chǔ)理論。這表明兩本教材對(duì)相同主題的處理方式有所不同:文獻(xiàn)[5]教材更注重基礎(chǔ)知識(shí)和實(shí)踐,并且在每章結(jié)尾提供推薦讀物;文獻(xiàn)[6]教材更注重把握理論發(fā)展和全局。
2? 主題涵蓋
兩本教材都包括關(guān)于教育測(cè)量、評(píng)價(jià)的基本概念、理論和方法。然而,它們的涵蓋范圍略有不同。例如,文獻(xiàn)[5]教材更加關(guān)注測(cè)驗(yàn)特性和測(cè)驗(yàn)設(shè)計(jì),而文獻(xiàn)[6]教材更強(qiáng)調(diào)教育評(píng)估的實(shí)際應(yīng)用。
3? 附錄和參考文獻(xiàn)
文獻(xiàn)[6]教材提供了參考文獻(xiàn),文獻(xiàn)[5]教材提供了更為豐富的內(nèi)容包括參考文獻(xiàn)、索引、練習(xí)題答案和附錄A—G各類與教育測(cè)量有關(guān)的規(guī)范及標(biāo)準(zhǔn)。
綜合來看,兩本教材都提供了有關(guān)教育測(cè)量與評(píng)價(jià)領(lǐng)域的重要內(nèi)容,但它們的重點(diǎn)和深度有所不同。教師可以根據(jù)具體的教學(xué)需求和研究興趣進(jìn)行選擇。如果更關(guān)注某些特定的主題,可以選擇涵蓋這些主題更廣泛或更深入的那本教材。比如文獻(xiàn)[6]教材中特殊學(xué)習(xí)障礙的一個(gè)新的評(píng)估策略:干預(yù)反應(yīng)(RTI),以及評(píng)估調(diào)整關(guān)于殘疾學(xué)生的評(píng)估等。
(三)? 內(nèi)容摘要分析
使用NLP技術(shù)自動(dòng)提取教材的關(guān)鍵內(nèi)容為讀者提供摘要,可以調(diào)用Python中的jieba包來實(shí)現(xiàn),jieba包也是一個(gè)適合中文的文本分析工具。
第一組,文獻(xiàn)[5]教材中的關(guān)鍵內(nèi)容結(jié)合詞頻由高到低排序:測(cè)驗(yàn),評(píng)估,試題,學(xué)生,得分,測(cè)量,教育,信度,教師,評(píng)分,效度,考生,解釋,表現(xiàn)性,成就,標(biāo)準(zhǔn),方法,論述題,量表,分?jǐn)?shù),提供,成績,開發(fā)。
第二組,文獻(xiàn)[6]教材中的關(guān)鍵內(nèi)容結(jié)合詞頻由高到低排序:測(cè)驗(yàn),測(cè)評(píng),評(píng)價(jià),測(cè)量,教育,教師,學(xué)生,受測(cè)者,信度,教學(xué),學(xué)校,效度,難度,方法,發(fā)展,區(qū)分度,分析,課堂教學(xué),結(jié)果,試題,測(cè)題,SPSS,內(nèi)容。
通過對(duì)比兩組關(guān)鍵內(nèi)容,我們可以分析出兩本教材的不同側(cè)重點(diǎn)和特色,以下是基于兩組關(guān)鍵內(nèi)容的對(duì)比分析。
1? 共同的核心主題
兩組關(guān)鍵內(nèi)容中都出現(xiàn)了“測(cè)驗(yàn)”、“評(píng)估”(第二組為“測(cè)評(píng)”)、“測(cè)量”、“教育”、“教師”、“學(xué)生”、“試題”、“信度”和“效度”等關(guān)鍵詞。這些詞語均與教育測(cè)量與評(píng)價(jià)的核心概念密切相關(guān),說明兩本教材都涵蓋了該領(lǐng)域的基礎(chǔ)概念。
2? 側(cè)重點(diǎn)的差異
第一組關(guān)鍵內(nèi)容中出現(xiàn)了“得分”“評(píng)分”“使用”“考生”“表現(xiàn)性”和“成就”等,意味著文獻(xiàn)[5]教材可能更側(cè)重于考試評(píng)分、學(xué)生的成就表現(xiàn)、考生的特性。
第二組關(guān)鍵內(nèi)容中出現(xiàn)了“教學(xué)”“學(xué)校”“難度”“SPSS”“課堂教學(xué)”和“項(xiàng)目”等,這些詞匯意味著文獻(xiàn)[6]教材可能更多地關(guān)注教育的實(shí)際應(yīng)用、學(xué)校和課堂的評(píng)估、不同難度層次的題目設(shè)計(jì),以及使用SPSS這類統(tǒng)計(jì)軟件的數(shù)據(jù)分析。
3? 數(shù)據(jù)分析與工具
第二組關(guān)鍵內(nèi)容中特別提到了“SPSS”,這是一款常用的統(tǒng)計(jì)分析軟件。這意味著文獻(xiàn)[6]教材可能詳細(xì)討論了如何使用SPSS進(jìn)行數(shù)據(jù)分析,可能更適合希望進(jìn)行實(shí)際操作和數(shù)據(jù)分析的讀者。
4? 概念的深入探討
第一組關(guān)鍵內(nèi)容中的“解釋”和第二組中的“分析”可能意味著兩本教材都在一定程度上對(duì)關(guān)鍵概念進(jìn)行了深入的探討和解析。
5? 實(shí)際應(yīng)用與教學(xué)
第二組關(guān)鍵內(nèi)容中的“課堂教學(xué)”“學(xué)?!焙汀敖虒W(xué)”等詞匯說明文獻(xiàn)[6]教材可能更側(cè)重于教育測(cè)量與評(píng)價(jià)在實(shí)際教學(xué)環(huán)境中的應(yīng)用。
6? 相似度分析
余弦相似度(Cosine Similarity)是一種在多維空間中評(píng)價(jià)兩個(gè)向量方向一致性的度量方法,常用于文本分析中計(jì)算兩段文本或兩組數(shù)據(jù)的相似性。杰卡德相似度(Jaccard Similarity)是用來比較兩個(gè)集合相似度的一種指標(biāo),它是兩個(gè)集合交集大小與并集大小之間的比例,通常用于文本相似性比較、推薦系統(tǒng)、數(shù)據(jù)挖掘等應(yīng)用場(chǎng)景。調(diào)用Python中的cntext包計(jì)算文獻(xiàn)[5]教材與文獻(xiàn)[6]教材的余弦相似度與杰卡德相似度分別為0.36與0.22。由相似度計(jì)算結(jié)果可知,雖然兩本教材都在講述教育測(cè)量與評(píng)價(jià)課程,但顯然它們的風(fēng)格和講述方式存在明顯差異。
綜上所述,兩本教材都涵蓋了教育測(cè)量與評(píng)價(jià)的核心概念但各有側(cè)重。文獻(xiàn)[5]教材內(nèi)容廣泛、附錄豐富實(shí)用性強(qiáng)更側(cè)重于考試評(píng)分和學(xué)生的特性與表現(xiàn),而文獻(xiàn)[6]教材理論性強(qiáng)更關(guān)注教育全過程,包括學(xué)校發(fā)展、課堂教學(xué)、教師發(fā)展和學(xué)業(yè)成就的測(cè)量與評(píng)價(jià)。教師或?qū)W生在選擇教材時(shí)可以根據(jù)自己的需求和興趣進(jìn)行選擇。對(duì)數(shù)據(jù)進(jìn)行可視化處理,繪制詞云圖能幫助我們更加直觀清晰地理解和感受上述分析,如圖1所示。
四? 現(xiàn)代教材的發(fā)展趨勢(shì)
數(shù)字化和個(gè)性化是現(xiàn)代教育的兩大趨勢(shì),現(xiàn)代教材也應(yīng)該適應(yīng)這種趨勢(shì)。首先,數(shù)字化教材更加便于個(gè)性化和自適應(yīng)學(xué)習(xí),能夠根據(jù)學(xué)生的學(xué)習(xí)進(jìn)度和需求進(jìn)行調(diào)整。其次,互動(dòng)性和多媒體元素越來越多,如嵌入的視頻、動(dòng)畫和自動(dòng)評(píng)分的練習(xí),這些都增加了學(xué)習(xí)的吸引力和效率。此外,數(shù)字化教材具有出色的可擴(kuò)展性和可訪問性,使得遠(yuǎn)程學(xué)習(xí)和自主學(xué)習(xí)更為便捷。在這方面文獻(xiàn)[6]教材提供的二維碼關(guān)聯(lián)了課程的教學(xué)錄像、教學(xué)課件等數(shù)字化資源,學(xué)習(xí)者通過掃描二維碼就可以觀看相應(yīng)的數(shù)字化資源。
綜合來看,在數(shù)字化時(shí)代教育測(cè)量與評(píng)價(jià)課程的教材在數(shù)字化方面有著顯著的優(yōu)勢(shì),除了延續(xù)傳統(tǒng)教材的評(píng)測(cè)理論和方法,還可以集成各種在線評(píng)測(cè)工具。充分利用在線資源如錄制小視頻、案例研究等,進(jìn)一步豐富教學(xué)內(nèi)容和形式,增強(qiáng)教材的互動(dòng)性、實(shí)用性和靈活性更好地適應(yīng)現(xiàn)代教育的需求和發(fā)展趨勢(shì)。
五? 總結(jié)與討論
在教育事業(yè)的不斷發(fā)展和變革中,教材作為教與學(xué)的關(guān)鍵載體其重要性不言而喻。本文針對(duì)教育測(cè)量與評(píng)價(jià)課程國內(nèi)外教材的對(duì)比研究提供了傳統(tǒng)內(nèi)容分析結(jié)合機(jī)器學(xué)習(xí)和NPL技術(shù)的方法,期望有助于未來教材的改進(jìn)和發(fā)展。
在全球化背景下教材的國際化趨勢(shì)日益明顯。通過國內(nèi)外教材的對(duì)比分析,我們發(fā)現(xiàn)不同文化背景下對(duì)教育測(cè)量與評(píng)價(jià)有著不同的教學(xué)理念和方法。例如,西方教材更強(qiáng)調(diào)實(shí)證研究和案例分析,而國內(nèi)教材則更側(cè)重于理論框架和基礎(chǔ)知識(shí)。因此,推進(jìn)國際合作共同編寫教材,不僅可以借鑒國外的優(yōu)點(diǎn),還可以整合各方的優(yōu)勢(shì)使教材更全面、更國際化。教育測(cè)量與評(píng)價(jià)本身是一個(gè)跨學(xué)科的領(lǐng)域,既有數(shù)學(xué)統(tǒng)計(jì)的嚴(yán)謹(jǐn),也需要教育學(xué)和心理學(xué)的實(shí)用視角。因此,未來的教材應(yīng)注重多學(xué)科的融合與創(chuàng)新,例如在傳統(tǒng)的測(cè)評(píng)理論基礎(chǔ)上加入大數(shù)據(jù)分析、人工智能等前沿科技,以拓寬學(xué)科邊界和應(yīng)用場(chǎng)景。依靠這些技術(shù)支撐教材不僅可以實(shí)現(xiàn)數(shù)字化更可以進(jìn)行個(gè)性化推薦以實(shí)現(xiàn)更靈活、更個(gè)性化的教學(xué),同時(shí)可以適應(yīng)不同學(xué)生的學(xué)習(xí)需求和節(jié)奏,這是傳統(tǒng)教材難以實(shí)現(xiàn)的。創(chuàng)新教材應(yīng)將這種融合和創(chuàng)新體現(xiàn)出來以滿足現(xiàn)代教育多樣化和復(fù)雜化的需求。
綜上所述,教育測(cè)量與評(píng)價(jià)作為現(xiàn)代教育體系中的核心部分[8],其教材的研究和發(fā)展具有重要意義。未來的教材應(yīng)該是一個(gè)融合了多學(xué)科知識(shí)、國際視野、現(xiàn)代教育技術(shù)以及個(gè)性化教學(xué)需求等多角度的創(chuàng)新和改進(jìn)的綜合體。這樣的教材更能適應(yīng)快速發(fā)展的現(xiàn)代社會(huì),滿足不同學(xué)生群體的多樣需求。本文的研究由于時(shí)間和資源的限制仍存在一定的局限性,例如樣本范圍較小,沒有涵蓋所有類型的教育測(cè)量與評(píng)價(jià)教材,缺乏長期實(shí)證研究等,期待在今后的研究中有機(jī)會(huì)與相關(guān)領(lǐng)域的學(xué)者共同探討繼續(xù)深入研究。
參考文獻(xiàn):
[1] REYNOLDS C R,LIVINGSTON R B, WILLSON V. Measurement and assessment in education[M].Upper Saddle River: Pearson Education International, 2010.
[2] SIVAKUMAR A,Thirumoorthy G. Measurement and evaluation in education[M].A.P.H.Publishing Corporation,2019.
[3] PAL K. Educationalmeasurement and evaluation[M]. Lovely Professional University, Phagwara.
[4] KUMAR H,ROUT S K ,DALABH M. Educational measurement and evaluation[M].Directorate of Distance Education, Tripura University, Vikas Publishing House Pvt. Ltd, 2013.
[5] REYNOLDS C R, LIVINGSTON R B, WILLSON V. 教育評(píng)估與測(cè)量[M].霍黎,霍舟,譯.北京:科學(xué)出版社,2015.
[6] 朱德全,徐小容,李鵬.教育測(cè)量與評(píng)價(jià)[M].北京:高等教育出版社,2016:7.
[7] 朱德全,徐小容,李鵬.教育測(cè)量與評(píng)價(jià)[M].2版.北京:高等教育出版社,2022:9.
[8] RANDY E B.教育測(cè)量的未來趨勢(shì)[J].教育測(cè)量與評(píng)價(jià),2019(3):3-14,18.