技術增強型學習環(huán)境下的靈活思維：量表的本土化研究及應用

2022-09-19 08:27:48趙亞如李朝乾陳云紅李書明

考試研究 2022年5期

趙亞如李朝乾陳云紅李書明

一、前言

創(chuàng)新人才培養(yǎng)是我國建設創(chuàng)新型國家的關鍵步驟。《中國教育現代化2035》明確提出“新時代教育需創(chuàng)新人才培養(yǎng)方式，培養(yǎng)學生創(chuàng)新精神與實踐能力[1]”，創(chuàng)新思維與創(chuàng)新能力的培養(yǎng)已成為當前教育領域關注的重點問題。靈活性是創(chuàng)新思維的三大基本特征之一，是指個人面對問題情境時，能夠靈活處理、隨機應變，不墨守成規(guī)[2]。《21世紀教學技能與評估框架》將靈活性作為思維方式培養(yǎng)的主要部分，并提出受教育者將會具有靈活的思維能力以及適應新的學習方式和交流方式的能力[3]。靈活思維的培養(yǎng)是創(chuàng)新型人才培養(yǎng)的重要步驟。

互聯網、大數據等新興技術的迅猛發(fā)展正在改變著人們的學習習慣和方式，大量的學習管理平臺、學習工具以及智慧學習環(huán)境的開發(fā)與應用都表明，當前已進入技術增強型學習環(huán)境[4]。國外研究認為，技術增強型學習環(huán)境是基于信息技術的，以數字化學習資源的豐富性和可獲取性、學習工具的可移動性和可交互性、學習支持服務的智能化和個性化、學習空間的開放性和虛實融合為主要特征，旨在為學生信息化學習賦能，促進學生有效學習、與傳統(tǒng)學習環(huán)境相對的一種新型學習環(huán)境[5]。

隨著教育技術的不斷更新和學習環(huán)境的不斷變化，眾多學者呼吁，應基于新型學習環(huán)境，創(chuàng)新靈活思維的內涵及評價標準，以適應當代教育領域的發(fā)展[6]。而目前國內研究者更多關注基礎教育領域的創(chuàng)造性思維[7]、批判性思維[8]等思維方式的培養(yǎng)，對靈活思維的關注相對較少，且尚無較成熟的靈活思維評價工具。Miri Barak等人在對靈活思維進行重新定義的基礎上，開發(fā)了技術增強型學習環(huán)境下靈活思維量表（Flexible Thinking in Learning Scale,FTL），并證實了FTL量表的內容、結構和同時效度（concurrent validity）[9]。目前，作為一項新型教學環(huán)境下專門評估和預測學習者靈活思維能力及傾向的測評工具，FTL量表在西方背景下的適用性和有效性已得到了檢驗[10]，但在我國文化背景下的應用尚未出現。因此，本研究將引進FTL量表，對其進行本土化，并基于現代測量理論，重點探究FTL量表中文版的測量學特性和大學生的靈活思維特點，以期為高校創(chuàng)新人才及思維能力培養(yǎng)的相關研究提供參考。

二、研究設計

（一）研究工具

為應對當前的技術變革和教育挑戰(zhàn)，以色列學者Miri Barak等將技術增強型學習環(huán)境下的靈活思維概念化為一種包含開放思維的高階思維技能，并將其作為學習者適應學習情境變化、接受新的不斷變化的技術的能力基礎，結合技術接受模型（Technology Acceptance Model）[11]、開放思維問卷（Open-Minded Thinking Questionnaire）[12]和個體適應量表[13]（I-ADAPT Scale）編制了FTL量表。

FTL量表從3個維度、17個項目對學生在技術增強型學習環(huán)境下的靈活思維能力及傾向進行評價，分別是：（1）對學習技術的接受度（Learning Technology Acceptance，TA），即適應先進技術并有效地利用它們進行有意義學習的能力，共5個項目；（2）學習中的開放思維（Open-mindedness in Learning，OM），即學習他人能力、管理團隊合作精神、傾聽多種觀點和處理復雜問題的能力，共7個項目；（3）對新的學習情境的適應度（Adapting to New Learning Situations，AL），即找到多種解決方案、解決不熟悉問題以及將知識遷移到新情境中的能力，共5個項目，所有項目均采用李克特六點式計分。Miri Barak測量的量表整體信度為0.91，信度良好。其研究結果同時證實了FTL量表的內容效度、結構效度、并發(fā)有效性以及跨群體和隨著時間推移的穩(wěn)定性，表明FTL量表是一個良好的靈活思維評估工具。

（二）研究方法

量表的本土化研究是依據Brislin經典翻譯模型實現的，經過對原量表的翻譯、回譯與專家咨詢，形成最終的FTL量表中文版。量表的測量學特性檢驗以多元概化理論和經典測量理論為理論依據。首先應用多元概化理論進行量表的信度檢驗，并提出優(yōu)化策略；之后應用經典測量理論檢驗量表的內容效度和結構效度，分別通過皮爾遜相關分析、條目分析、探索性因子分析（Exploratory Factor Analysis，EFA）和驗證性因子分析（Confirmatory Factor Analysis,CFA）實現。數據的處理與分析主要通過mGENOVA2.1、SPSS24.0和AMOS軟件實現。

（三）研究對象

分別抽取華中地區(qū)H大學文史類和理工類專業(yè)一至四年級本科生參與本次研究。問卷以線上方式統(tǒng)一發(fā)放，共發(fā)放問卷500份，回收492份，問卷回收率98.40%，其中有效問卷473份，有效率96.14%。樣本人口統(tǒng)計變量見表1。

表1樣本人口統(tǒng)計變量的描述性統(tǒng)計

三、研究結果

（一）量表的本土化

本研究依據Brislin經典翻譯模型[14]，依次經過對量表的翻譯、回譯以及專家咨詢，形成最終的FTL量表中文版。（1）翻譯：邀請1名具有中英背景的教育技術學博士與1名專業(yè)英語八級的教育學博士組成翻譯小組，采用獨立翻譯的方式，將FTL量表翻譯為中文，之后將兩位博士翻譯的FTL量表中文版本進行綜合討論，形成一個中文版量表。（2）回譯：邀請1名專業(yè)英語大學教授，在對原版FTL量表未知的情況下，將中文版量表回譯為英文。（3）專家咨詢：邀請1名教育技術學專業(yè)教授將回譯的英文版量表與中文版量表進行細致的比較、分析，并與進行翻譯和回譯工作的博士和教授進行討論。

對中文版量表內容進行修改和語句的本土化調整。如條目5“I like to experience new learning technologies”翻譯為“我喜歡體驗新的學習技術”，專家認為“體驗、學習技術”的表達不夠清晰、準確，將其修改為“我喜歡嘗試新的助于學習的技術”。條目11“For deep learning，I tend to examine diverse viewpoints”翻譯為“對于深度學習，我傾向于檢查各種觀點”，專家認為“傾向”不夠具體，可能會影響學生的自我判斷，將其修改為“為了實現深度學習，我經常仔細檢驗各種觀點”?！癆dapting to new learning situations”維度中的“l(fā)earning situation、learning condition”統(tǒng)一翻譯為“學習條件”，專家認為學習條件的概念不夠具體，不能區(qū)分出學習環(huán)境和學習情境，因此將條目中的“l(fā)earning situation”翻譯為學習情境、“l(fā)earning condition”翻譯為學習環(huán)境。最終形成的FTL量表中文版見表2。

表2 FTL量表中文版

（二）基于多元概化理論的量表信度分析

多元概化理論（Multivariate Generalizability Theory，MGT）可以看作是概化理論（Generalizability Theory,GT）的延伸，概化理論是在經典測量理論（Classical Test Theory，CTT）基礎之上發(fā)展起來的現代測量理論[15]，其基本原理是運用實驗設計的思想，采用方差分析的方法來全面估計各種方差成分的相對大小，包括主效應和交互效應，并能對各估計值的大小進行直接比較。

在概化理論中，估計各方差成分相對大小的過程，稱為概化理論的G研究；G研究的下一個階段是D研究，即通過實驗研究，進一步考察不同測驗設計條件下概化系數的變化狀況（如試題容量變化對于概化系數的影響），從而尋找能夠控制誤差的最佳方法，作出最佳的設計決策[16]。概化理論對測量誤差變異的構成提供了多個維度的視角，但只能實現單變量測量信度的分析。多元概化理論與概化理論的方法構架相同，是對GT的推廣和發(fā)展，便于深入研究測量目標由多個變量組成的問題（如總測驗可以分解為多個不同維度的分測驗）[17]。近年來，基于這一理論的研究設計已應用于教師資格證考試、普通話考試、高考等大規(guī)模測驗，拓寬了常模參照測驗和標準化測驗的信度檢驗方式。

1.G研究

FTL量表由3個分量表（技術接受度、思想開放度、環(huán)境適應度）組成，可視為包含3個分測驗的綜合測驗，因此研究設計可以設定為涉及3個潛在因子的p×i隨機單面交叉設計（p表示被試，i表示量表項目）。根據多元概化理論的數學模型，可編寫一個包含3個分測驗的mGENOVA程序進行G研究，以估計不同誤差來源的方差比例，評價各分量表對總測驗的貢獻程度。G研究結果如表3所示。

表3 G研究中各效應在三個分因子上的方差與協方差分量估計矩陣

多元概化理論認為，一項測驗中被試效應（及測量目標）所占的方差分量比例應為最大，其他效應則均被看作是測量側面，并要求它們應盡量占更小比例的方差[18]。通過表3數據可知，僅有思想開放維度的被試效應方差分量估計值高于其余效應（3.33279>2.24035>0.52748），技術接受和環(huán)境適應維度的被試效應方差分量均低于項目效應的方差分量，表明思想開放維度的項目質量最高，能有效測量出學生開放思維之間的差異。在項目效應中，技術接受維度的項目分差分量最大（5.36272），其次為環(huán)境適應維度（4.06391），表明這兩個維度的項目區(qū)分度略低。進一步分析協方差分量和相關性，發(fā)現被試在三個分量表間的協方差分量偏小（均小于0.5），但在三個分量表間的相關系數較大（均大于0.6）。以上表明，將三個分量表的測驗得分進行合成是可行的，各分量表項目本身所占的方差分量較大，而被試與項目的交互效應很小，可以認為FTL量表適宜作為常模參照性測驗使用。

2.D研究

為探索各分量表及總體對測量總分可靠性的貢獻程度，進行P×I三因子隨機單面交叉設計的D研究。根據G研究估計的方差與協方差矩陣，可以進一步估計被試在各分量表及總量表上的全域分數以及相應的誤差估計的方差分量，進而估計概化系數與可靠性指數，D研究結果如表4所示。

表4全域分數等在各因子上估計的方差分量值（D研究）

由表4可知：環(huán)境適應度分量表的全域分數方差、相對誤差方差以及絕對誤差方差分量均最大，說明該分量表的信度較低；技術接受度的均值誤差方差最大，表明本次測驗中，該分量表的一致性最低；從概化系數和可靠性指數兩個方面看，3個分量表的信度均達到較好水平（概化系數和可靠性指數均大于0.8），FTL總量表的概化系數和可靠性指數均高于各分量表（大于0.9），這表明將FTL以整體進行測驗時信度最高，測驗效果最好，既可作為常模參照性測驗，也可作為標準參照性測驗。

3.提高測量信度的D研究

為進一步改進測量信度，本研究考察了各分量表樣本容量變化對FTL總量表概化系數的影響情況，結果如表5所示。由表中數據可看出，FTL總量表的概化系數隨著各分量表樣本容量的增加也逐漸增大，但當概化系數增量達到極值后，其增加幅度也逐漸減小。仔細觀察數據可發(fā)現，在結合研究成本等條件下，技術接受度分量表的樣本容量為7、思想開放度分量表的樣本容量為12、環(huán)境適應度分量表的樣本容量為7時，FTL量表總體的概化系數和測量效果最理想。

表5樣本容量對FTL總量表的概化系數變化（D研究）

（三）基于經典測量理論的量表效度分析

概化理論彌補了經典測量理論信度分析的缺點，實現了誤差來源的精準分析和量表優(yōu)化，但經典測量理論提出的效度分析方法仍是應用最為廣泛的[19]，因此本研究將應用經典測量理論對量表的內容效度和結構效度進行分析，以檢驗量表對大學生靈活思維能力及傾向的真實反映程度。

1.內容效度

采用極端組法和皮爾遜相關分析法檢測該量表條目的區(qū)分度。將473份有效問卷中的17個條目總分按降序排列，選取總分≥83分（前27%）為高分組，將總分按升序排列，選取總分≤68分（后27%）為低分組。

對高分組和低分組進行獨立樣本t檢驗，結果顯示，高分組和低分組每個條目得分比較差異均有統(tǒng)計學意義（P<0.01），95%的置信區(qū)間未包括0，說明條目具有較高的鑒別度。進一步進行條目得分與總分之間的相關性分析，結果顯示，各條目得分與總分的Pearson相關系數為0.379~0.870（P<0.01），說明量表各條目具有良好的鑒別度，內容效度良好。

2.結構效度

運行SPSS軟件，對量表進行探索性因子分析，以實現對量表效度的檢驗。首先進行KMO檢驗和巴特利球體檢驗。借助最大方差法，進行分量矩陣的旋轉，結果顯示，KMO值為0.916（數值越接近于1，變量間的相關性越強，偏相關性越弱，因子分析的效果越好），表明適合進行因子分析；Bartlett’s球形檢驗值x2=1453.569，P=0.000，表明各變量間具有相關性，因子分析有效。其次，使用主成分分析法進行方差最大旋轉，來實現公共因素的提取，共提取特征值>1的公因子3個，旋轉后特征值分別為3.653、3.335、3.266，可解釋結果的60.316%，各公因子負荷量見表6。

表6 FTL量表各維度在各公因子的負荷量

運行AMOS軟件，進行驗證性因子分析，以實現量表的結構方程模型檢驗。將數據導入，運行軟件得到結構方程模型（見圖1）及相應擬合指數（CFI的值為0.964、IFI的值為0.965、NFI的值為0.901、GFI的值為0.911、RMSEA的值為0.054、CMIN/DF的值為1.490）。其中，CFI、IFI和NFI是增值擬合指標，其值介于0和1之間，越接近1，則模型與數據之間的擬合度越好，模型擬合度越高；GFI、RMSEA、CMIN/DF為絕對擬合指數，GFI的值大于0.9為可接受范圍；RMSEA的數值越小越好，CMIN/DF數值<3則表示模型的適配度好。將結構方程模型的擬合指數與模型的分析值進行比較，可知，模型與數據的擬合度較好，適配度較高，符合“既簡單擬合度又高”的模型標準。

（四）FTL量表中文版的應用分析

為探究FTL量表中文版在大學生群體中的應用效果，本節(jié)將分別對被試的靈活思維總體水平、差異性及相互關系展開分析。

1.描述性統(tǒng)計分析

為研究被試樣本的靈活思維整體水平，對收集的有效數據進行描述性統(tǒng)計分析。數據顯示FTL量表中文版的平均得分為M=4.45，SD=0.74，學習中的開放思維平均得分最高(M=4.55，SD=0.75)，學習技術接受度平均得分為M=4.47，SD=0.86，適應新學習情境的平均得分為M=4.31，SD=0.86。進一步統(tǒng)計發(fā)現，有50.74%的被試在FTL量表中文版上得分大于4.45，有53.91%的被試在學習中的開放思維上得分大于4.55，有49.68%的被試在學習技術接受度上得分大于4.47，有50.32%的被試在適應新學習情境上得分大于4.31。

這表明參與調查的被試樣本中，有超過一半的學生更傾向于聽取不同的觀點和觀點，而很少傾向于重復做同樣的事情。然而，仍有很大比例的大學生對靈活思考的傾向較低，對抵制技術變革的傾向較高，尤其表現在對新技術的接受度上。

2.差異性分析

為探究被試在不同條件下的靈活思維差異性，分別以年級和專業(yè)為分類標準對其差異性進行了分析。結果顯示，FTL總分、學習技術接受度和適應新學習情境維度在年級上的差異顯著性均為0.000，達到極其顯著水平，開放思維的差異顯著性最低0.001，為較顯著水平；但在專業(yè)上不存在顯著性差異。

圖1驗證性因子分析模型圖

圖2不同年級靈活思維均值情況

進一步統(tǒng)計各維度在年級上的差異水平，得到如圖2所示的柱形圖。由圖2可看出，從年級層面來看，二三年級的整體水平無顯著差距，一年級與四年級之間存在較大差距，尤其表現在新的學習情境的適應度方面，部分大一新生表示自己在適應新的學習情境和學習方式時存在困難，但表示可以通過個人努力使自己適應學習方式的變化；在開放思維方面，各年級之間差距不大，但平均水平較低（均低于4.55）；在對學習技術的接受度方面，表現出隨年級遞增的現象。

3.相關性分析

一般認為，兩變量的相關系數絕對值在0.8-1.0之間時為極強相關，相關系數絕對值在0.6-0.8之間時為強相關，相關系數絕對值在0-0.2之間時為極弱相關，而相關系數的正負則分別表示兩變量間的促進與抑制作用。

首先,對靈活思維各表現水平（因變量）進行相關性分析，結果見表7。由表中數據可發(fā)現，各表現水平之間都存在顯著的強相關性（p<0.01，r>0.6），其中靈活思維總水平與各維度表現水平均呈現出極強程度的正相關關系，但與開放思維表現水平的相關性最強（r=0.904）；各維度之間的相關程度為強相關，其中開放思維表現水平與新學習情境適應水平之間的相關系數最高（r=0.725）。

其次，將學生的學習成績與靈活思維總水平進行了雙變量相關分析，結果顯示兩變量間呈顯著極弱相關（r=0.183，p<0.05）。綜合上述分析結果可發(fā)現，大學生的靈活思維水平與其學習成績間存在顯著但極弱的相關性、與開放思維間存在顯著且極強的相關性，學生的開放思維水平與新學習情境的適應水平存在顯著而強的相關性，表明開放思維與靈活思維之間具有極強的直接促進關系，新情境的適應水平可以較準確地反映開放思維水平，大學生的學習成績與靈活思維之間的促進關系極小可忽略。

表7靈活思維各水平相關分析表

四、研究結論

本研究為兩個部分，第一部分對FTL量表進行了六階段的本土化研究，第二部分是對第一部分形成的FTL量表中文版的應用分析，得到的主要結論如下：

第一部分的量表本土化研究前兩個階段主要是FTL量表的翻譯與回譯。主要對“l(fā)earning situations”與“l(fā)earning conditions”處作了修改，在考慮學習情境與學習環(huán)境的界定范圍后，將第三個維度的相關概念統(tǒng)一設定為“學習情境”。

第三、第四階段主要是應用多元概化理論進行FTL量表中文版的信度分析和改進優(yōu)化。通過G研究結果可以發(fā)現，被試在三個分量表上的方差分量占比均等，與各分量表的項目數量占比相同，符合多元概化理論中權系數的設計。從協方差分量和相關系數上看，3個分量表間的一致性和相關性較大，可以將三個分量表的測驗得分進行合成。此外，在方差貢獻率上，項目效應在技術接受度和環(huán)境適應度2個分量表所占的方差分量均最大，表明這兩個分量表的測驗項目有較好的區(qū)分度。D研究結果顯示，FTL量表漢化版的整體信度較高，且高于各分量表的概化系數和可靠性指數，環(huán)境適應度分量表的誤差分量最大，可進行適度優(yōu)化調整。而后，從調整項目側面的樣本容量角度進行了D研究，發(fā)現增加樣本容量能有效提高量表的信度，但隨著樣本容量倍數的增加，其信度的增勢呈現減緩趨勢，因此少量增加各分量表的項目數量能夠最大限度地增大量表的整體信度。

第五、第六階段主要對FTL量表中文版進行了效度分析。在第五階段運用極端組法和皮爾遜相關分析檢測了量表項目的區(qū)分度，結果顯示各項目均具有較高的鑒別度且呈現顯著正相關。第六階段通過探索性因子分析（EFA）和驗證性因子分析（CFA）檢驗了中文版量表的結構效度，并構建了良好的擬合模型。結構方程模型表明，學生接受先進技術的能力、適應新的學習環(huán)境的能力和其開放性思維之間均具有顯著的正向相關性，其中學生的開放性思維與新環(huán)境的適應度之間的相關關系最顯著。此外，在標準化的情況下，指標與潛變量之間的復相關系數就是因子負荷的平方。本模型中三個潛變量，即技術接受度（TA）、思想開放度（OM）和環(huán)境適應度（AL）在17個觀測指標上的標準化因子不小于0.708的有8個，因此，有8個復相關系數大于0.5，即三個潛在因子變量能解釋項目的50%以上，模型的解釋能力良好。

第二部分的FTL量表中文版實踐應用分析是以473名本科生為研究對象，從描述性、相關性、差異性三個方面展開量化研究。

通過描述性統(tǒng)計分析發(fā)現，被試的FTL量表中文版平均得分為4.45，且有超過一半比例的被試達到了平均水平。靈活思維的三個維度中，學習中的開放思維平均得分最高，達到該維度平均水平的學生數量也是最高的（53.91%），但在新技術接受維度上達到平均水平的學生數量未超過一半。表明該樣本中有超過一半的被試具有開放的思維，傾向于聽取不同的觀點，而很少傾向于重復做同樣的事情，但有很大比例的被試不能快速適應新的學習技術。

在差異性分析中發(fā)現，被試群體表現出年級上的極其顯著差異性，在開放思維維度的差異性表現最低，但在專業(yè)上未表現出顯著的差異性。一至四年級學生的靈活思維呈現出隨年級階梯遞增的現象，一年級學生在對新的學習情境的適應方面水平較低，四年級學生在整體水平上表現出明顯的優(yōu)勢，但各年級學生的開放思維水平均需提高。

在相關性分析上發(fā)現，FTL總水平與各維度間均存在顯著正向相關性，學習中的開放思維與靈活思維的相關系數最大（0.904），而學習中的開放思維與對新學習情境適應性維度的相關性最顯著，因此可從培養(yǎng)學生傾聽他人不同觀點以及表達個人觀點方面培養(yǎng)學生的開放思維，從提升學生的信息意識、信息素養(yǎng)及信息交流能力方面促進學生對新的學習情境的適應度，進而培養(yǎng)學生的靈活思維。

綜上所述，FTL量表既是一種研究工具，也是一種自我評估工具。它可以有助于評估學習者靈活思考的性格傾向，或幫助解釋關于使用新的學習方法或新技術的個人差異。本研究依據Brislin經典翻譯模型形成了FTL量表中文版，并進行了信效度檢驗和實證分析，結果表明中文版量表整體的信度較高，增加項目數量可進一步提高信度系數，內容效度和結構效度良好，當前大學生的靈活思維處于中等水平，且存在年級上的差異。

由于本項研究的樣本只涉及一所高校的本科生，因此尚不能驗證FTL量表中文版在各類學習者上的穩(wěn)定性與一致性。未來與FTL相關的研究還可專注于教學干預對學習者靈活思維的影響程度以及靈活思維與協作學習之間的關系等方面。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡