崔宇紅,白 帆,張蕊芯
(北京理工大學 a.人文與社會科學學院; b.圖書館, 北京 100081)
在21世紀的高等教育領域,人工智能和自適應學習技術(shù)的融合應用正在引發(fā)顛覆性變革。自2019年起,美國高等教育信息化協(xié)會(EDUCAUSE)連續(xù)4年發(fā)布《地平線報告:教與學版》,均將人工智能列為未來影響高等教育發(fā)展的趨勢和核心技術(shù)。在黨的二十大報告中,人工智能被認為是“推進教育數(shù)字化,建設全民終身學習的學習型社會、學習型大國”的重要戰(zhàn)略支撐。此外,2023年2月在北京召開的世界數(shù)字教育大會以“數(shù)字變革與教育未來”為主題,也強調(diào)了人工智能在高等教育數(shù)字化轉(zhuǎn)型中的重要作用。與此同時,代表人工智能最新突破的ChatGPT技術(shù),則有可能成為這場變革的催化劑,引領人工智能教育應用走向成熟,重塑未來高等教育的形態(tài)。
ChatGPT是美國人工智能研究實驗室OpenAI于2022年11月30日發(fā)布的智能對話代理程序,亮相僅一周后就已經(jīng)有100萬用戶注冊,截至2023年1月,其月活躍用戶已經(jīng)達到1億,成為歷史上增長最快的消費者應用程序。ChatGPT受到國外主流媒體的廣泛報道,其中,BBC、彭博社、連線、福布斯和《紐約時報》等的報道涵蓋了ChatGPT的基本信息、功能、應用場景和對未來的潛在影響;《麻省理工商業(yè)評論》將ChatGPT列入2022年度閱讀量最高的話題;2023年2月7日,ChatGPT登上了微博熱搜榜,話題涉及“多家學術(shù)期刊禁止將ChatGPT列為合著者”“美國89%的大學生都是用ChatGPT做作業(yè)”“百度類ChatGPT產(chǎn)品名為ERNIEBO”等??梢哉f,ChatGPT已經(jīng)成為全球范圍內(nèi)備受關(guān)注的現(xiàn)象級科技事件。
教育科研界從不同視角探討了ChatGPT在高等教育應用中的復雜影響。《科學》雜志探討了ChatGPT的作者身份問題并相應調(diào)整了出版策略[1],《自然》雜志的編輯認為ChatGPT可能會損害科學的透明性[2]。來自不同專業(yè)學科,例如計算機科學、數(shù)學、化學、語言學和醫(yī)學等的學者,對ChatGPT在高等教育中的實踐進行了探索。計算機科學領域的研究表明,GPT-3可以生成多樣易懂的代碼解釋,幫助學生更好地理解代碼和掌握編程技巧,自動化代碼審查和文檔生成有助于提高編碼的質(zhì)量和可讀性,輔助教師更有效地指導學生[3]。在化學教育中,微調(diào)后的大型語言模型可以幫助教師評估學生答案的質(zhì)量[4]。ChatGPT在語言教學中具有很大的潛力,它可以提供個性化的交互和指導,緩解學習者的焦慮情緒,提高學習效果和學習興趣[5]。
ChatGPT在醫(yī)學教育領域的應用最為廣泛,包括自動評分、教學輔助、信息獲取、生成案例場景等以及在臨床管理和決策過程中發(fā)揮作用。研究人員使用ChatGPT開發(fā)基于自適應學習的系統(tǒng),根據(jù)學生的個人需求和學習風格,為其提供量身定制的醫(yī)學教育資料和學習反饋。在臨床診斷中,ChatGPT與臨床數(shù)據(jù)相結(jié)合,創(chuàng)建了一個自動化的決策支持系統(tǒng),預測患者的疾病風險、評估診斷結(jié)果的可信度,并提供個性化的治療建議[6]。同時,研究人員評估了ChatGPT在美國醫(yī)學執(zhí)照考試(USMLE)中的表現(xiàn),發(fā)現(xiàn)ChatGPT在預測考試成績方面的表現(xiàn)達到或接近考試通過的分數(shù)閾值,具有很高的準確性和穩(wěn)定性[7]。
ChatGPT在高等教育領域的應用仍處于起步期,具有巨大的發(fā)展?jié)摿?在進一步探索技術(shù)發(fā)展的同時,也需要解決諸多倫理、隱私、安全以及法律方面的風險問題,拓展進入公眾認知和政府議程。本文在回顧總結(jié)高等教育領域人工智能應用研究的基礎上,重點探討ChatGPT在未來高等教育中的應用場景和風險挑戰(zhàn),以確保ChatGPT技術(shù)在高等教育的轉(zhuǎn)型過程中獲得安全、可靠和有效的應用。
ChatGPT指使用GPT(Generative Pretrained Transformer)模型架構(gòu)的聊天機器人應用程序。作為一種廣泛應用于自然語言處理領域的預訓練模型,ChatGPT引領了大型語言模型的新時代。相較于Facebook和Google的類似預訓練模型,ChatGPT在智能客服、智能問答、機器翻譯、文本摘要等領域的表現(xiàn)更加自然流暢。這主要歸功于其采取的核心技術(shù),即在大規(guī)模數(shù)據(jù)上訓練模型,基于Transformer模型架構(gòu)以及對特定任務使用預訓練—微調(diào)策略進行優(yōu)化。
大型語言模型(Large Language Models,LLMs)是指參數(shù)規(guī)模巨大、預訓練的深度神經(jīng)網(wǎng)絡模型。2020年6月發(fā)布的GPT-3模型是迄今為止最大的語言模型,涵蓋1.75萬億個參數(shù),使用來自多種來源的海量語料庫進行預訓練,包括互聯(lián)網(wǎng)、電子圖書、維基百科、論壇、新聞文章、博客、多媒體文本等[8]。LLMs通過學習大規(guī)模的語料庫來理解語言結(jié)構(gòu)、語法、語義、邏輯等方面的知識,從而完成生成自然語言文本、回答問題、翻譯、對話等任務。
ChatGPT作為一種大型語言模型,展示了驚人的文本生成能力和廣泛的通用性,能夠完成多種自然語言任務。研究發(fā)現(xiàn),盡管在某些領域,例如金融和心理學,人類專家的回答準確率明顯高于ChatGPT,但在其他領域如法律和技術(shù)方面,ChatGPT的表現(xiàn)接近甚至超越人類專家。為了探究ChatGPT在醫(yī)學領域中的表現(xiàn),研究者收集了來自兩個醫(yī)學問答網(wǎng)站的人類專家回答和ChatGPT回答,并進行了比較。研究發(fā)現(xiàn),ChatGPT在臨床醫(yī)學領域的回答準確率低于人類專家,但在醫(yī)學研究和基礎醫(yī)學方面,ChatGPT的表現(xiàn)與人類專家相當。此外,ChatGPT在提供具體建議和特定細節(jié)方面表現(xiàn)優(yōu)于人類專家[9]。
Transformer模型是由谷歌在2017年提出的一種基于注意力機制的深度神經(jīng)網(wǎng)絡模型,并進一步在機器翻譯的效果上得到了顯著提升[10]。自注意力機制可以比喻為人類閱讀一段文字的過程,人類在閱讀時也會對每個詞匯給予不同的注意力權(quán)重,將其與上下文進行聯(lián)系,從而理解全文的含義。在傳統(tǒng)的神經(jīng)網(wǎng)絡模型中,每個神經(jīng)元的輸入都是前一層所有神經(jīng)元的輸出,因此無法充分利用輸入序列中各個元素之間的關(guān)系。而Transformer模型引入了自注意力機制,通過給予不同位置的元素不同的注意力權(quán)重,使得模型可以根據(jù)序列中元素之間的相關(guān)性來加權(quán)組合信息。
ChatGPT的Transformer結(jié)構(gòu)的核心創(chuàng)新點在于提出了多頭自注意力機制(Multi-head Self-attention),即在不同的“頭”中分別計算注意力權(quán)重,以獲得更多細粒度的關(guān)注信息。這種機制使模型可以更好地捕捉不同元素之間的關(guān)系,并且可以并行計算多個頭的注意力權(quán)重,加速了模型的訓練和推理過程。這使ChatGPT在處理長序列和建模長期依賴關(guān)系方面更加有效,并且在自然語言處理等領域取得了很好的表現(xiàn)。
ChatGPT的預訓練—微調(diào)機制包括預訓練、微調(diào)和Fine-tune這3個階段。具體來說,預訓練階段采用Transformer架構(gòu),在大規(guī)模數(shù)據(jù)集上進行無監(jiān)督的預訓練,以訓練出通用的語言表示。預訓練過程采用了自回歸語言建模任務,即讓模型根據(jù)前面的文本預測下一個詞的概率分布,并最大化預測正確詞的概率。微調(diào)階段通常采用有監(jiān)督的學習方法,即使用標注好的數(shù)據(jù)集進行訓練,以調(diào)整模型在特定任務上的權(quán)重,以便更好地完成任務。微調(diào)的具體方法包括單個任務微調(diào)、多任務聯(lián)合微調(diào)、遷移學習等。在微調(diào)階段后進一步進行Fine-tune,即進一步調(diào)整模型在目標任務上的性能。Fine-tune的方法通常包括超參數(shù)調(diào)整、數(shù)據(jù)增強、知識蒸餾等[11]。
這種預訓練—微調(diào)的策略已經(jīng)被證明是一種高效的方式,能夠在各種自然語言處理任務上取得很好的性能。
這里以學習生命周期的概念為框架,涵蓋了教學內(nèi)容優(yōu)化、教學過程輔導輔助、教學方法優(yōu)化、學術(shù)論文寫作以及教學和學習效果評價等5個階段,并從學習者和教師兩個維度提供了12種人工智能支持的學術(shù)教學和學習服務,并基于此展望ChatGPT在高等教育背景下的應用場景。
1.教學目標確立
教學目標是關(guān)于教學將使學生發(fā)生何種變化的明確表述,是指在教學活動中所期待得到的學生的學習結(jié)果。教學目標的確立是開展一切教學活動的前提和基礎。人工智能技術(shù)可以結(jié)合教育目的及學生情況確定當前課程的教學目標,近年來,已有多項工作使用了人工智能技術(shù)來協(xié)助確立教學目標。例如:利用機器學習算法來確定可能對學生畢業(yè)率造成不利影響的因素[12],或采用結(jié)果導向教育(OBE)的方法,確定學位課程預期的結(jié)果,從而確定教學目標[13]。
2.教學內(nèi)容設計
教學內(nèi)容設計是教學活動的重要前置因素。ChatGPT在教學內(nèi)容設計方面得到了廣泛的應用。教師可以輸入學科領域的相關(guān)信息,如歷史事件、科學原理等,ChatGPT便可以輸出自然、流暢的文本,這些文本可以用于課程大綱的編寫,其中包含對每個主題的簡短描述,在此基礎上還可以提供相關(guān)知識的擴展和重新組合以及教學輔助工具的開發(fā)。在學生學習方面,ChatGPT可以通過學生的學習歷史記錄和興趣愛好,為每個學生生成適合其學習風格和學科領域的學習材料和作業(yè),從而提升學習效果和增強學習動力。此外,人工智能也可在標準化考試中發(fā)揮作用,如設置多套試卷以避免剽竊問題或設計一系列難度遞增的作業(yè)或考試。深度學習技術(shù)可以用于特征提取或難度估計,例如利用注意力機制模擬閱讀問題中每個句子的難度測試。
3.教學材料自動問題生成
教學材料自動問題生成(Automatic Question Generation,AQG)可以幫助改進學生的學習和理解,評估材料的信息,并幫助教師添加補充材料。AQG主要由兩個方面組成:內(nèi)容選擇和問題構(gòu)建。內(nèi)容選擇通常使用不同的統(tǒng)計特征來完成[14]。問題構(gòu)建傳統(tǒng)上采用基于規(guī)則的方法[15]和基于循環(huán)神經(jīng)網(wǎng)絡(RNN)的方法對數(shù)學表達式和主題詞進行編碼,以自動生成問題[16]。現(xiàn)有研究集中在使用一系列方法提高話題相關(guān)性、表達相關(guān)性、語言連貫性以及生成問題的完整性和有效性[17]。對于一般知識測試,有學者提出了一個自動生成問題和答案的框架可用于教學材料的創(chuàng)作,如閱讀理解任務[18]。
語言模型還可以產(chǎn)生問題和提示,鼓勵不同知識和能力水平的人參與,并引發(fā)批判性思維和問題解決。此外,它們還可以用于生成有針對性和個性化的練習題和測驗,生成防止剽竊的標準化考試題目,這有助于確保學生掌握材料。
1.交互式輔導輔助工具
基于“積極互動促進學習”的理論,早期的交互式輔導輔助框架通過口頭或動作交流的方式,讓學生與教師或教學實體互動,并獲得反饋或指示。隨著時間的推移,交互式輔導系統(tǒng)逐漸采用深度學習算法,結(jié)合各種數(shù)據(jù)(如文本、語音等),推斷學生實時狀態(tài)并定制互動方式,提供精確的反饋和進一步指導。最新的交互式輔助工具通過使用資源密集型算法和復雜的組合,不斷發(fā)展和提高定制化教育的水平。
2.個性化輔導輔助工具
個性化教育對學生學習成果具有積極的影響。因此,個性化學習系統(tǒng)和輔導輔助工具被廣泛應用于教育領域。在課程內(nèi)容方面,個性化可以通過課程內(nèi)容排序、提示和附加資源的顯示等方式實現(xiàn)。創(chuàng)造性學習的個性化路徑可以通過訓練決策樹并根據(jù)學生背景信息推斷出來。深度強化學習在教學排序問題上的應用也越來越普遍。此外,還有一些基于信息檢索和自然語言處理技術(shù)的框架,可以連接學生過去的討論,定制學習內(nèi)容,以及促進學生之間的協(xié)作。為了減少信息過載并提高學習體驗,基于深度學習的課程推薦系統(tǒng)(DECOR)已被提出,該系統(tǒng)利用學生行為和課程相關(guān)數(shù)據(jù)來訓練基于神經(jīng)網(wǎng)絡的推薦系統(tǒng)[19]。
3.情感感知輔導輔助工具
研究建議在設計輔導系統(tǒng)時應將學習者的情感和行為狀態(tài)納入考慮,以提高教學的有效性[20]。傳感器數(shù)據(jù)可以用于跟蹤學生微小的身體運動(例如目光、面部表情和姿勢),從而推斷學生的情感和行為狀態(tài)。研究者使用交互數(shù)據(jù)構(gòu)建了情感檢測模型,以檢測學生的情感狀態(tài)。研究者比較了在軍事訓練中傳遞激勵提示時使用傳感器和交互數(shù)據(jù)的效果[21]。研究者進一步探討了情感感知智能教學輔助工具的不同用例和研究進展。這些工具可以豐富用戶體驗、更好地管理和評估學習材料、提供評估提示與導航指令等[22]。
4.學習風格感知輔導輔助工具
在教學過程中,了解學生的學習風格可以提高教學效果。傳統(tǒng)的自我管理問卷被用于推斷個人學習風格,最近基于機器學習的方法使用多種數(shù)據(jù)源作為輸入內(nèi)容,如完成的調(diào)查表、交互數(shù)據(jù)和學生的行為數(shù)據(jù)等,然后使用前饋神經(jīng)網(wǎng)絡進行分類[23]。ChatGPT等大型語言模型可用于個性化教學內(nèi)容的匹配和資源提供,從而支持教師的教學過程。通過面向教師的AI系統(tǒng),教師可以自動化評估學生的答案并提供適應性反饋,從而減輕教師的工作量。自動評分系統(tǒng)(AES)是常見的人工智能評估系統(tǒng)之一,ChatGPT和其他大型語言模型不僅支持學生評價和反饋,還可用于生成練習和提供解決方案[24]。
ChatGPT廣泛應用于教育領域后改變了傳統(tǒng)的教師傳授為主導的單一教學模式,有利于創(chuàng)新教學方法。在高等教育中,借助適當?shù)慕虒W策略,ChatGPT可用于促進學習者之間的協(xié)作和團隊合作。具體而言,ChatGPT能以學生為中心的學習策略為基準,設計各式各樣的小組游戲,為學生提供不同場景下解決問題和實現(xiàn)目標的手段,從而提升學生在學習中的參與度和互動效果。在協(xié)作寫作活動中,ChatGPT可通過提供風格和編輯建議以及其他集成的協(xié)作寫作特征來提供幫助。對于國際學生或需要遠程輔導的學生,ChatGPT帶來的學術(shù)和經(jīng)濟潛力在跨地理位置服務、教學和時差方面更加深遠。同時,ChatGPT可以與語音文字轉(zhuǎn)換系統(tǒng)結(jié)合使用,以幫助殘疾學習者(如視力障礙的學生),以保證所有學生的完全參與。此外,將GPT-3用作教學代理來激發(fā)學生好奇心和提高提問技能也是一種有效的方法,通過與ChatGPT的互動,學生可以得到更深入、更廣泛的知識,從而提高他們的學習動力和學習效果[25]。
1.自動論文寫作
在教育領域中,人工智能技術(shù)可通過自動化評估與反饋的機器學習系統(tǒng),提升學生寫作技能[26]。研究者以ChatGPT為案例,在不需要專業(yè)知識的情況下,以邏輯組織文本并添加字幕,指導ChatGPT撰寫了一篇題為《人工智能教育》的論文。結(jié)果表明,ChatGPT生成的論文連貫、準確、豐富且系統(tǒng)[27]。對于同一問題,不同語言模式的提問,ChatGPT的回答格式相同,具備良好的邏輯銜接和信息涵蓋能力。此外,與人類相比,人工智能寫作能力強,能夠高效找到信息并編寫專業(yè)文本,從而減輕人類智能工作負荷,有可能改變勞動力市場需求。因此,研究者建議調(diào)整高等教育的學習目標、學習活動和評估實踐,培養(yǎng)學生合理使用人工智能的能力,同時注重發(fā)展人工智能無法替代的創(chuàng)造力和批判思維。
2.學術(shù)誠信檢測
人工智能用于學生學習結(jié)果評估和監(jiān)測的另一個方面是通過發(fā)現(xiàn)剽竊和其他形式的學術(shù)不當行為,確保維護學術(shù)誠信。在關(guān)于文本中學術(shù)剽竊檢測的綜述論文里(例如論文、報告、研究論文等)根據(jù)模糊程度的升序?qū)ω飧`形式進行分類,從逐字和近似逐字復制到翻譯、釋義、保留創(chuàng)意的剽竊和代寫[28]。同樣,剽竊檢測方法已經(jīng)被開發(fā)用于日益復雜的剽竊類型,并廣泛采用自然語言處理和機器學習技術(shù)。例如:詞匯檢測方法使用N-gram或向量空間模型來創(chuàng)建文檔表示,隨后對文檔表示進行閾值化或聚類以識別可疑文檔。最近,深度學習模型(如卷積和遞歸神經(jīng)網(wǎng)絡架構(gòu)的不同變體)也已被用于剽竊檢測[29-30]。
1.學生學習效果評價
人工智能在學生學習結(jié)果的評價和監(jiān)控中扮演著重要角色,其中知識追蹤、評價和反饋是主要應用。知識追蹤通過對學生的知識發(fā)展進行建模,預測他們正確回答下一個問題的能力,幫助學生確定需要努力的領域,教育者也可以根據(jù)預測結(jié)果提供有針對性的練習和學習建議[31]。深度知識追蹤(DKT)是一種使用遞歸神經(jīng)網(wǎng)絡架構(gòu)動態(tài)建模學生潛在知識狀態(tài)以預測未來表現(xiàn)的模型[32]。
自動評估是另一個重要問題,自動論文評分和自動短文答案評分等系統(tǒng)已經(jīng)被廣泛應用,這些系統(tǒng)通過深度神經(jīng)網(wǎng)絡自動提取特征并進行評分,根據(jù)論文質(zhì)量的不同維度(如組織結(jié)構(gòu)、論文清晰度、論點強度等)提供細致的評分,同時提供形成性反饋以及最終分數(shù)。這樣的系統(tǒng)可以消除評估中的年級間差異,減輕教師負擔,同時提供實時反饋幫助學生加快學習進度,因此具有更廣泛的教學用途。
2.教師教學效果評價
教學素質(zhì)評估是評價教學成效和保證學習目標實現(xiàn)的重要手段,研究結(jié)果可通過相應培訓和支持提升教師教學技能,對教師的聘任、任期決策和專業(yè)成長有重要作用。傳統(tǒng)的評估模式涉及學生評價、教師互評、自評和專家評價,但需要消耗大量的勞動力。機器學習和深度學習算法可通過學生對教師表現(xiàn)的評論進行情感分析,以展示學生對教師的態(tài)度和學習過程的滿意程度[33]。此外,這些情緒和情緒效價分數(shù)可用于預測學生對教師的推薦分數(shù),以確定影響學生評價的關(guān)鍵因素[34]。人工智能還可根據(jù)其他學習數(shù)據(jù)點來評估教學策略,如使用基于符號回歸的方法評估作業(yè)結(jié)構(gòu)和協(xié)作類型對學生成績的影響,幫助教師進行自我評價。
在高等教育中,教師可以利用以ChatGPT為代表的大型語言模型,監(jiān)控學生學習進程,通過突出討論作業(yè)的潛在優(yōu)點和缺陷,半自動地對論文、研究報告和其他寫作作業(yè)進行評分,節(jié)省時間用于向?qū)W生提供個性化反饋。此外,大型語言模型還可被用于檢查剽竊,有助于防止作弊。最后,大型語言模型可幫助教師自我評價,反思自己的教學策略,識別學生存在哪些困難,更準確地評估學生的學習發(fā)展和挑戰(zhàn)。這些針對性的教學模式有助于學生獲得優(yōu)異成績,并提供進一步發(fā)展的機會。
在強調(diào)ChatGPT等技術(shù)發(fā)展的同時,我們應該清醒地認識到此類技術(shù)的可靠性仍存在局限,由于人工智能技術(shù)在教育中的應用涉及諸多風險,包括學術(shù)誠信風險、偏見與歧視倫理風險、數(shù)據(jù)隱私與安全風險、法律與知識產(chǎn)權(quán)風險等,還需要加強對這些問題的研究和探討。
ChatGPT等大型語言模型在自然語言處理和計算機視覺等任務中表現(xiàn)出色,但其復雜的結(jié)構(gòu)和訓練過程導致其可解釋性較差,模型訓練過程缺乏透明度,很難解釋模型在具體任務中的決策過程。此外,ChatGPT還存在對抗性攻擊、隱私泄露和安全性漏洞等技術(shù)風險。模型在高等教育領域的應用也存在局限性,實驗研究發(fā)現(xiàn),ChatGPT在高等教育領域的應用過程中存在11類錯誤,包括推理錯誤、事實錯誤、數(shù)學錯誤、編碼錯誤、偏見等[35]。因此,在高等教育中應將ChatGPT作為一種輔助工具來使用,教師應該更多地依賴自己的專業(yè)知識,而不是將其視為教學過程的唯一依靠。同時,教師應該引導學生了解這些模型的局限性,以便他們能夠更好地利用它們,并在需要時采取必要的預防措施。
ChatGPT等大型語言模型在高等教育中的應用引發(fā)了學術(shù)誠信、剽竊、學生作業(yè)真實性和原創(chuàng)性等方面的挑戰(zhàn)和擔憂。尤其是在論文寫作方面,學生可以利用ChatGPT等機器人生成并提交非自己完成的論文,繞過大多數(shù)剽竊檢測器。針對此類問題,美國紐約的教育部門已經(jīng)開始禁止使用ChatGPT設備,斯坦福大學的研究小組提出了一種名為“DetectGPT”的新方法,旨在成為打擊高等教育中機器生成文本的首批工具之一。OpenAI正在研究如何在生成的文本中嵌入水印,以減少文本濫用和剽竊的風險。這些勢必導致文本生成器和文本生成檢測工具之間的競賽更加激烈。此外,ChatGPT在高等教育中的應用可能會產(chǎn)生關(guān)于論文作者的真實性和可信度的疑慮,引發(fā)學術(shù)界的出版、再版、聘用和晉升等倫理問題,需要相關(guān)方面采取措施解決。
大型語言模型中存在的偏見是指所生成的語言輸出中存在系統(tǒng)性的不準確或刻板印象,它受到訓練數(shù)據(jù)的影響,反映了該數(shù)據(jù)中存在的社會和文化偏見。這些偏見會對語言模型產(chǎn)生負面影響,如使刻板印象永久存在、造成誤解或傳播有害和錯誤的信息。特別是對于偏向某些人群的數(shù)據(jù)構(gòu)建的模型,可能會產(chǎn)生對特定人群不公平或歧視的結(jié)果(例如:少數(shù)族裔群體或本地文化知識可能會被忽略)[36]。在高等教育領域中,大型語言模型的偏見可能會影響教育過程和結(jié)果。因此,人們正在努力減少語言模型中的偏見,盡管ChatGPT也采取了一些措施來避免偏見,但要徹底審查監(jiān)管數(shù)據(jù)并避免模型中的歧視性行為是一項具有挑戰(zhàn)性的任務,還可能存在內(nèi)在的風險。
人工智能教育研究的法律和倫理指導方面存在不足,主要原因是大多數(shù)人工智能教育的研究人員集中在技術(shù)先進的地區(qū),而目前大多數(shù)人工智能教育的平臺和應用程序由私營部門擁有,其開發(fā)和運營缺乏透明度和有效監(jiān)管[37]。這導致教學人員對這些平臺訪問的數(shù)據(jù)、存儲數(shù)據(jù)的隱私和安全性以及部署模型的可解釋性越來越擔憂。在高等教育應用中,教師和學生普遍擔心使用ChatGPT等大型語言模型可能對他們的隱私和數(shù)據(jù)安全造成威脅,包括對數(shù)據(jù)泄露、未經(jīng)授權(quán)訪問學生數(shù)據(jù)以及將學生數(shù)據(jù)用于教育以外的目的的擔憂。
ChatGPT的法律和知識產(chǎn)權(quán)風險是一個備受關(guān)注的問題,目前該領域還存在許多法律空白地帶。ChatGPT生成的內(nèi)容屬于誰、是否能夠賦予其作者身份,是目前面臨的重要問題。根據(jù)《中華人民共和國著作權(quán)法》,人工智能不被視為著作權(quán)的“作者”,因此ChatGPT無法依據(jù)現(xiàn)有法律被直接賦予作者身份。同時,根據(jù)OpenAI的使用條款,盡管用戶享有輸入內(nèi)容的所有權(quán)利、所有權(quán)和利益,但由于機器學習的特性,ChatGPT輸出的內(nèi)容在不同用戶間并不具有唯一性,這種輸出內(nèi)容的轉(zhuǎn)讓需要排除呈現(xiàn)給其他ChatGPT用戶的結(jié)果,這導致輸出內(nèi)容著作權(quán)的不確定性會加劇[38]。
借助ChatGPT等大型語言模型,人工智能正在對高等教育領域產(chǎn)生越來越大的影響,人工智能是否會帶來“知識工作結(jié)束的開始”和“大規(guī)模失業(yè)的前兆”等重大社會變革仍未可知。站在時代變革的起點,教師、學生、高等教育機構(gòu)以及政策主管部門都應密切關(guān)注該領域的發(fā)展趨勢,適時調(diào)整學習、教學和評估方法,以推動高等教育的高質(zhì)量發(fā)展并適應當前時代的需要。
高校教師應減少和規(guī)避學生過度依賴ChatGPT等大型文本工具完成課程作業(yè)或考試的風險。為此,教師需要轉(zhuǎn)變評估方式,避免公式化考試和作業(yè),強調(diào)知識的廣度和深度,設計一些如圖像、視頻、課堂討論等ChatGPT不擅長的寫作分析任務。此外,教師還可以要求學生在寫作中整合個人經(jīng)歷和觀點,分析不適合提示的較長文本以及那些還未被收錄的最新熱點事件[39]。然而,這種方法的局限性在于不適合有效評價或僅是短期解決方案。長期來看,教師應該將ChatGPT等人工智能工具納入教學中,培養(yǎng)學生的創(chuàng)造性和批判性思維能力,并引導學生理解人工智能的優(yōu)缺點。
高等教育階段的學生使用ChatGPT等新興技術(shù)的熟練程度相較教師更高,因此大學生更應該具備以下能力:第一,熟悉學術(shù)誠信規(guī)范和不端行為后果;第二,具備數(shù)字素養(yǎng),掌握利用人工智能工具提高學術(shù)能力的方法;第三,在使用人工智能工具時應視其為提高寫作技能和產(chǎn)生新想法的方式,避免簡單復制粘貼;第四,警惕不合標準的信息源、錯誤和虛假信息;第五,廣泛閱讀以提高批判性和創(chuàng)造性思維;第六,學習使用人工智能語言工具編寫和調(diào)試代碼,并練習使用人工智能工具來解決現(xiàn)實世界的問題。
相較于學生和教師對新技術(shù)的接納度,高等教育機構(gòu)的反應顯得遲緩,各高等教育機構(gòu)始終在禁止使用和將其納入課程的極端態(tài)度之間搖擺。從長遠看,高等教育機構(gòu)不應該將其視為簡單的危機或挑戰(zhàn),而是應該看到其中的可能性,積極應對新技術(shù),并專注于如何保持學術(shù)誠信,同時將人工智能作為創(chuàng)新資源,與以學生為中心的教學模式建立良好的信任關(guān)系,在機器學習中超越其局限性獲得成功。為此,應推廣數(shù)字掃盲教育,鼓勵并支持相關(guān)研究,制定必要的課程,加強教職員工的培訓,以及為學生提供學術(shù)誠信方面的講座或課程。同時,更新學術(shù)誠信政策和榮譽守則,制定明確、易于理解的指導方針,以保證人工智能工具的合理使用。
為了促進ChatGPT等大型語言模型在教育領域的應用,政策制定者應該進行前瞻思考,并有效應對教育和技術(shù)中的新挑戰(zhàn)、新發(fā)展和更大的道德問題。首先,政府可以通過制定相關(guān)政策和法規(guī)來規(guī)范人工智能教育工具的開發(fā)和使用,并加強監(jiān)管;其次,政府可以加大對人工智能教育的投入力度,鼓勵企業(yè)和機構(gòu)開發(fā)和應用人工智能教育工具,同時建立相應的監(jiān)管機制,將模型的研發(fā)和應用與人類監(jiān)控、指導和批判性思維結(jié)合起來,實現(xiàn)科技發(fā)展和社會責任的平衡;最后,政府還可以通過宣傳和培訓來提高人工智能教育的普及度,引導學生和教師正確使用人工智能教育工具,保障人工智能教育的質(zhì)量和安全性。