吳豐華 韓文龍
(1. 西北大學(xué) 經(jīng)濟(jì)管理學(xué)院,陜西 西安 710127;2. 西南財經(jīng)大學(xué) 經(jīng)濟(jì)學(xué)院,四川 成都 610074)
以GPT(Generative Pre-Trained Transformer)為代表的大型語言模型(Large Language Model,LLM)的橫空出世①,其用戶增長至1 億人所用的時間遠(yuǎn)遠(yuǎn)少于其他熱門應(yīng)用,其強(qiáng)大功能和迭代速度遠(yuǎn)遠(yuǎn)超過了包括其開發(fā)者在內(nèi)的從業(yè)者、社會大眾和相關(guān)領(lǐng)域科學(xué)家的估計。 比爾·蓋茨認(rèn)為其是“平生見識過兩次令我印象深刻、革命性的技術(shù)演示”之一②。 GPT 是一種基于Transformer 架構(gòu)的,經(jīng)過預(yù)訓(xùn)練的、生成性的模型。 本質(zhì)上,這類語言模型的功能是對文本進(jìn)行“合理的延續(xù)”,即預(yù)測下一個詞該說什么,其中“合理”的意思是“在查看了數(shù)十億個網(wǎng)頁等人類編寫的文本之后,我們可能會期望某個人會寫下這樣的內(nèi)容”[1]。 其中Transformer 架構(gòu)發(fā)揮了關(guān)鍵作用,而訓(xùn)練GPT 的主要方法就是無監(jiān)督學(xué)習(xí),即不需要對素材進(jìn)行標(biāo)注的學(xué)習(xí)方法。 已投入商業(yè)應(yīng)用的最新一代GPT——GPT-4 的性能十分強(qiáng)大,在美國各項主流考試中的成績均較GPT-3.5 模型有了大幅進(jìn)步。 著名計算機(jī)科學(xué)家、物理學(xué)家沃爾夫勒姆在新書《ChatGPT 在做什么……以及它為什么好使》中分析認(rèn)為,GPT 更像人腦,而不像一般的計算機(jī)程序。
正如比爾·蓋茨所言,人工智能的發(fā)展與微處理器、個人電腦、互聯(lián)網(wǎng)和移動電話的誕生一樣意義重大。 它將改變?nèi)藗児ぷ?、學(xué)習(xí)、旅行、獲得醫(yī)療保健以及交流的方式。 整個行業(yè)將圍繞人工智能重新洗牌,企業(yè)也將根據(jù)其利用人工智能技術(shù)的程度來區(qū)分優(yōu)劣[2]。 同樣,包括高校在內(nèi)的教育部門也將受到人工智能和LLM 的巨大沖擊,根據(jù)OpenAI 的一份研究報告,教育行業(yè)受GPT的影響在全部行業(yè)中排在中等偏上水平③。
實際上這種沖擊已經(jīng)發(fā)生:在美國,紐約市教育部2023 年1 月初宣布禁止學(xué)生在其學(xué)校的設(shè)備和網(wǎng)絡(luò)上使用ChatGPT,以預(yù)防學(xué)生的作弊行為。 據(jù)《紐約時報》報道,包括喬治·華盛頓大學(xué)在內(nèi)的多所高校,教授們正在逐步淘汰更易受到ChatGPT 影響的開放式作業(yè),作為替代,他們更多選擇課堂作業(yè)、手寫論文、小組作業(yè)和口試等方法。 在歐洲,巴黎政治學(xué)院在2023 年1 月末發(fā)出通知,禁止全體學(xué)生及教職工利用ChatGPT 完成教學(xué)任務(wù)。 在澳大利亞,新南威爾士州、昆士蘭州等多個州已宣布禁止在校內(nèi)使用ChatGPT[3]。 在國內(nèi),《暨南學(xué)報(哲學(xué)社會科學(xué)版)》發(fā)表聲明暫不接受任何大型語言模型工具(如ChatGPT)單獨(dú)或聯(lián)合署名的文章,《天津師范大學(xué)學(xué)報(基礎(chǔ)教育版)》也發(fā)布相關(guān)聲明,建議作者在參考文獻(xiàn)、致謝等文字中對使用人工智能寫作工具(如Chat-GPT 等)的情況予以說明。 然而,將ChatGPT 徹底從教育領(lǐng)域清除并不是所有高等教育者達(dá)成的共識。 英國劍橋大學(xué)副校長B.Vira 教授表示,人工智能是一種供人們使用的工具,大學(xué)禁用像ChatGPT 這樣的人工智能軟件并不“明智”。 他說,大學(xué)應(yīng)該對學(xué)習(xí)、教學(xué)和考試過程進(jìn)行相應(yīng)的調(diào)整,以確保學(xué)生在使用該工具的同時保持學(xué)術(shù)誠信[3]。 面對教育界的巨大爭論,OpenAI 首席執(zhí)行官S.Altman 近期表示,OpenAI 正在研發(fā)幫助學(xué)校識別人工智能參與作弊的技術(shù)[3]。
智能化時代,社會對人才提出了正確價值觀、多學(xué)科交叉能力、人工智能專業(yè)素養(yǎng)和創(chuàng)新決策能力的需求[4]。 利用數(shù)字化技術(shù)創(chuàng)新高教模式已成為全球共識。 2022 年12 月召開的世界慕課與在線教育大會上,《無限的可能——世界高等教育數(shù)字化發(fā)展報告》獲得廣泛共識,報告提出,“新一輪科技革命和產(chǎn)業(yè)變革帶來了前所未有的發(fā)展機(jī)遇,數(shù)字化的知識、信息和數(shù)據(jù)已成為關(guān)鍵生產(chǎn)要素。 ……利用現(xiàn)代信息技術(shù),高等教育將在育人方式、辦學(xué)模式等方面產(chǎn)生系統(tǒng)變革”。我國也認(rèn)識到了發(fā)展人工智能的重要性,2023 年4 月28 日,中央政治局會議首次提出要發(fā)展通用人工智能并提出要辯證對待,“要重視通用人工智能發(fā)展,營造創(chuàng)新生態(tài),重視防范風(fēng)險?!保?]2022 年全國教育工作會議也提出要實施教育數(shù)字化戰(zhàn)略行動,把教育信息化作為發(fā)展的戰(zhàn)略制高點,加快推進(jìn)教育信息化和教育資源數(shù)字化建設(shè)。 面對LLM 給高等教育所帶來客觀的、巨大的挑戰(zhàn)和機(jī)遇,我們應(yīng)該積極應(yīng)對,深入研究以GPT為代表的大型語言模式與高等教育結(jié)合的可能性、對我國高等教育產(chǎn)生的短期和長期影響以及帶來的挑戰(zhàn)等問題,并給出中國的應(yīng)對方案。
第一,基于超大模型和預(yù)訓(xùn)練的強(qiáng)大生成性。GPT 中的“G”(Generative)就是生成性的。 作為超大型語言模型的代表,GPT-4 通過對含有1.8萬億參數(shù)④的GPT 模型進(jìn)行無監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)⑤和大規(guī)模的分布式訓(xùn)練⑥,在海量語料庫⑦中獲得了強(qiáng)大的自然語言理解和生成能力。 這樣,ChatGPT 和GPT-4 表現(xiàn)出極強(qiáng)的自組織能力,通過思維鏈(Chain-of-Thought)機(jī)制,出現(xiàn)積少成多的開悟時刻,即“涌現(xiàn)”。 可以說,強(qiáng)大的生成性奠定了GPT 最基礎(chǔ)也是最有力的生產(chǎn)力屬性。
第二,基于多模態(tài)算法和相關(guān)領(lǐng)域情境學(xué)習(xí)和微調(diào)的高行業(yè)滲透性。 “多模態(tài)、推理能力、預(yù)測擴(kuò)展性”是GPT-4 的三大亮點[6],其中以多模態(tài)對教育行業(yè)的影響最為直觀。 多模態(tài)算法即融合文字、圖片、音視頻等多種內(nèi)容形式的AI 算法。具體來說,給定由穿插文本和圖像組成的輸入,GPT-4 可以生成文本輸出(自然語言、代碼等)⑧。 不論是AI,抑或其高級形態(tài)——通用人工智能(Artificial general intelligence,AGI)要滲透到各個行業(yè),向多模態(tài)發(fā)展是必然趨勢,畢竟現(xiàn)實世界中的數(shù)據(jù)天然就是多模態(tài)的,必然需要有能感知和理解多模態(tài)數(shù)據(jù)的能力。 進(jìn)一步,針對各個應(yīng)用場景需要交互的輸入、輸出各不相同的情況,多模態(tài)的大模型可以且必須通過細(xì)分領(lǐng)域的數(shù)據(jù)和指令微調(diào)以及少樣本的情境學(xué)習(xí)⑨,才能高效地應(yīng)用到各個領(lǐng)域和行業(yè)之中⑩,形成很強(qiáng)的任務(wù)通用性,可廣泛使用于下游任務(wù)(生成、預(yù)測、判別等)。 同樣的,基于對不同教育場景的針對性微調(diào),大型語言模型在高等教育領(lǐng)域的多任務(wù)執(zhí)行和多場景應(yīng)用才成為可能。
第三,基于思維鏈產(chǎn)生的復(fù)雜推理能力。GPT-4 具備極強(qiáng)的推理機(jī)制,無論是復(fù)雜的邏輯推理、編程推導(dǎo)或者是密集型內(nèi)容幫助,GPT-4皆表現(xiàn)不俗。 這意味著GPT-4 可處理未知問題,即沒有現(xiàn)成答案的問題。 其原因在于GPT-4 是通過思維鏈,即通過合適的提示,將邏輯較為復(fù)雜的問題拆解為多個簡單的子問題來“解答”問題,這里不是搜索答案而是回答問題。 如此,GPT-4會對編程、內(nèi)容審核等場景產(chǎn)生深遠(yuǎn)影響。 特別的,以GPT-4 為代表的AI 對問題的回答思路或提出的解決方案,大部分時候符合人類回答或解題的理性思路,但有時也會發(fā)現(xiàn)其并非人類的理性思路或套路,它能找到并采取人理解范圍之外的解決方案。 這意味著,高等教育中最重要的目標(biāo)之一——創(chuàng)新,就有可能在師生與以GPT 為代表的LLM 的互動中產(chǎn)生。
第一,LLM 的使用過程更接近學(xué)習(xí)的最本源模式。 人與大型語言模型的交互模式更接近對話式學(xué)習(xí),正所謂“真?zhèn)饕痪湓?,假傳萬卷書”。 學(xué)生可以通過與大型語言模型不斷的問答和追問式的互動,以最快的方式獲得知識,而且能夠有針對性地彌補(bǔ)自身知識的短板。 更進(jìn)一步,可以通過對LLM 的針對性訓(xùn)練(如“喂給”特定知識領(lǐng)域的語料),實現(xiàn)像某領(lǐng)域、某學(xué)派甚至某位學(xué)者那樣回答問題。 這樣,大型語言模型就有極大可能成為一種高效的學(xué)習(xí)方式。 當(dāng)然,這種對話式學(xué)習(xí)也存在一定挑戰(zhàn):它可能會把知識講錯,可能會憑空編造知識,特別是冷門知識。 這就需要提高訓(xùn)練LLM 的語料庫的更新頻次,但更為重要的是要通過提高算法,識別并屏蔽編造知識的行為。
第二,基于LLM 的AI 助手將極大解放并賦能教學(xué)雙方,實現(xiàn)以學(xué)生為中心的教學(xué)。 一旦擁有一位教育領(lǐng)域的大型語言模型AI 助手,那將是對師生雙方的共同解放和賦能,極大地提高效率。作為教師的教學(xué)助手,AI 助手可以用自然語言打破各種語言障礙,如外語、編程語言等,深度賦能教師;AI 助手還可以幫助教師和管理者評估學(xué)生對某一學(xué)科的理解,以提供有針對性、個性化的學(xué)習(xí)方案;AI 助手還可以就學(xué)生的職業(yè)規(guī)劃提供建議。 目前,一些國外教師已經(jīng)在使用ChatGPT 這樣的工具來生成對學(xué)生寫作的評語。 作為學(xué)生的學(xué)習(xí)助手,通過一段時間的使用,AI 助手會了解學(xué)生的興趣、學(xué)習(xí)風(fēng)格和長板短板,從而為學(xué)生量身定制內(nèi)容,保持每位學(xué)生的參與度和學(xué)習(xí)效果;它會衡量學(xué)生的理解能力,注意到學(xué)生何時失去興趣,并了解不同的學(xué)生傾向于哪種激勵方式;AI助手還能給出即時反饋,以解決高等教育中的最大難題之一——學(xué)習(xí)過程中的及時教學(xué)評估。 這些變化已經(jīng)發(fā)生,在不久的將來,AI 助手將最終改革高校的教學(xué)方式。
第三,LLM 更豐富的輸出形式為教學(xué)活動提供了更多可能。 前文分析了多模態(tài)所帶來的諸多好處。 未來,如果基于LLM 的教學(xué)AI 能夠提供除自然語言外更為豐富的輸出形式,如圖像、音頻,甚至是視頻等?,那么其輔助教學(xué)的能力和效果必將明顯提升,其中,尤其以視頻形式最為重要,因為到目前為止,視頻被認(rèn)為是講授演示的首選媒體。 一旦基于LLM 的視頻輸出成為可能,那么將明顯區(qū)別于現(xiàn)在單純依靠教師設(shè)計內(nèi)容、撰寫腳本進(jìn)行錄制的視頻類課程。 很顯然,慕課等大規(guī)模網(wǎng)絡(luò)課程和在線課程的效果之所以沒有達(dá)到預(yù)期,其原因就在于課程內(nèi)容從設(shè)計策劃到生成制作,都是教師“居高臨下”地對學(xué)生進(jìn)行單向度傳輸,并沒有充分圍繞學(xué)生這一中心展開,難以滿足學(xué)生個性化、動態(tài)化的學(xué)習(xí)要求。
第四,中國高等教育的巨量規(guī)模為大型語言模型在高教領(lǐng)域的拓展應(yīng)用提供了數(shù)據(jù)基礎(chǔ)和廣闊前景。 經(jīng)過多年發(fā)展,我國建成了世界上最大規(guī)模的高等教育體系,在學(xué)總?cè)藬?shù)超過4 430 萬人,高等教育毛入學(xué)率從2012 年的30%提高至2021 年的57.8%[7]。 此外,我國慕課建設(shè)與應(yīng)用在課程數(shù)量、應(yīng)用范圍、多模式應(yīng)用和促進(jìn)高校教學(xué)改革等方面取得了顯著成就[8]。 截至2022 年11 月,慕課數(shù)量超過6.19 萬門,注冊用戶4.02億,學(xué)習(xí)人數(shù)達(dá)9.79 億人次,中國慕課數(shù)量和學(xué)習(xí)人數(shù)均居世界第一[9]。 世界第一的高教規(guī)模背后是世界第一的高等教育大數(shù)據(jù)庫,海量的數(shù)據(jù)將為LLM 的訓(xùn)練提供最為豐富的語料資源,也將為LLM 的應(yīng)用提供最為廣闊的用戶群體,前者將大大加速LLM 針對中國高等教育的拓展應(yīng)用的開發(fā),后者將大大降低在中國高教領(lǐng)域應(yīng)用或開發(fā)LLM 的相關(guān)應(yīng)用的成本,為其商業(yè)化應(yīng)用和大規(guī)模推廣奠定基礎(chǔ)。
大型語言模型對高等教育的影響可以從短期的直接影響和長期的間接影響兩個維度來分析,前者主要體現(xiàn)在對教學(xué)模式、教學(xué)方法、線上教學(xué)、教學(xué)助手等方面的影響,后者則主要體現(xiàn)在對我國高校學(xué)科建設(shè)與發(fā)展、拔尖人才培養(yǎng)、高校結(jié)構(gòu)變革等方面。
第一,LLM 可以幫助創(chuàng)設(shè)教學(xué)情境、創(chuàng)新教學(xué)模式。 當(dāng)前高等教育面臨的嚴(yán)重問題之一便是課堂教學(xué)單通道、單向度,師生互動層次低、停留在表層,而且受限于教師的時間與精力,難以向課前、課后延伸。 雨課堂、學(xué)習(xí)通等教學(xué)輔助軟件的誕生和使用,雖然有所緩解上述問題,但是難以從根本上改變這一狀況。 而在LLM 上,可以實現(xiàn)大師、學(xué)者、老師和學(xué)生之間,以角色互換、多角色Cosplay 等方式進(jìn)行深度互動。 各學(xué)科、專業(yè)的老師也可圍繞LLM 創(chuàng)設(shè)多種教學(xué)情境,如在基礎(chǔ)學(xué)科的專業(yè)課程上,通過LLM 復(fù)活那些已經(jīng)逝去的偉大科學(xué)家、先賢先哲,讓學(xué)生和他們直接對話;在編程課上,可以由LLM 模擬某種特定的計算機(jī)語言,對學(xué)生進(jìn)行編程訓(xùn)練;在論文寫作課上,可以讓LLM 來擔(dān)任編輯、編審或?qū)徃迦说慕巧瑢W(xué)生開展寫作、投稿和返修指導(dǎo);在新聞類課程上,可以讓LLM 出任記者、編輯等不同崗位,幫助學(xué)生充分體驗新聞創(chuàng)作和采編過程。 可以發(fā)現(xiàn),這種互動完全可以在教師相當(dāng)有限的指導(dǎo)和監(jiān)督下展開,并向課前和課后充分延伸,這在突破學(xué)習(xí)的物理時空限制,大大提高學(xué)生學(xué)習(xí)的個性化、自主性的同時,也能充分解放教師,有助于他們投入更富創(chuàng)造力的教學(xué)和科研工作中。 這種運(yùn)用LLM 的教學(xué)情境創(chuàng)設(shè)和模式創(chuàng)新,既充分彰顯了“以學(xué)生發(fā)展為中心”的教育理念,大大緩解學(xué)習(xí)者的焦慮和畏難情緒,提高學(xué)生學(xué)習(xí)效果和學(xué)習(xí)興趣,也高度契合了“兩性一度”的金課標(biāo)準(zhǔn)。
第二,基于LLM 開發(fā)的各類教學(xué)小程序?qū)⒋蠓嵘虒W(xué)和科研效率。 隨著LLM 不斷迭代并逐漸成熟,其算法也將不斷優(yōu)化,算力也將逐漸節(jié)省,并向高校、高教管理機(jī)構(gòu)和教育類公司開源,基于LLM 開發(fā)的各類教學(xué)或?qū)W習(xí)輔助小程序?qū)⒋罅砍霈F(xiàn)。 目前,我國主流的幾款輔助教學(xué)軟件——雨課堂、學(xué)習(xí)通等,都在進(jìn)行相關(guān)人工智能程序的嵌入式開發(fā)。 可以想象,未來將會有大量的教學(xué)助手出現(xiàn),它們能夠幫助教師完成學(xué)生形式靈活的課前預(yù)習(xí)、及時的課后答疑、快捷的隨堂和課后測評、輔助課堂討論、教學(xué)材料和案例的自動生成、全周期的教學(xué)數(shù)據(jù)分析等多種任務(wù);或者幫助學(xué)生完成課前預(yù)習(xí)、課后復(fù)習(xí)、學(xué)習(xí)效果自測、課程作業(yè)協(xié)同創(chuàng)作?等多種任務(wù)。 這還僅僅是在教學(xué)層面。 實際上,科研層面的應(yīng)用前景將更加廣泛,如基于LLM 開發(fā)的能夠閱讀和初步提煉歸納文獻(xiàn)內(nèi)容的文獻(xiàn)管理軟件、寫作輔助插件、特定領(lǐng)域的編程工具、統(tǒng)計分析、計量分析和大數(shù)據(jù)分析的插件,等等。 一個可供參照的實例是,隨著開發(fā)ChatGPT 的公司OpenAI 把API?流量價格降低90%之后,短短幾天內(nèi)就涌現(xiàn)出11 個基于ChatGPT 的小應(yīng)用程序和應(yīng)用插件上線應(yīng)用——實現(xiàn)了PDF 文檔分析、復(fù)雜計算、調(diào)用瀏覽器等LLM 模型自身并不具備的擴(kuò)展性新功能。
第三,LLM 為高校大規(guī)模、個性化在線學(xué)習(xí)提供了極大的想象空間。 LLM 在高等教育領(lǐng)域的使用,使基于問題導(dǎo)向的線上教學(xué)、教師幫助、學(xué)生自主學(xué)習(xí)乃至人工智能助教變得技術(shù)可行且成本可控;線上課程開發(fā)、建設(shè)和內(nèi)容更新都將更為方便,在線課程的呈現(xiàn)形式也將大大豐富。 未來可能出現(xiàn)的情況是,雖然所有學(xué)生都在學(xué)習(xí)同一門在線課程,但是伴隨著課程開始前對學(xué)生的知識基礎(chǔ)和能力的評估,以及課程進(jìn)行中不斷與LLM 的交互,實際上每位學(xué)生學(xué)習(xí)的課程內(nèi)容、進(jìn)行的課程練習(xí)、課程的進(jìn)度安排、被推薦的教學(xué)資源,乃至所采用的教學(xué)方法和教學(xué)模式都是不一樣的,真正實現(xiàn)了“千人千面”式的個性化在線學(xué)習(xí)。 當(dāng)然,LLM 還需要大量的訓(xùn)練和進(jìn)一步發(fā)展,才能理解某個學(xué)生學(xué)習(xí)的最佳方式或其學(xué)習(xí)的驅(qū)動因素。 即使技術(shù)十分完善,創(chuàng)造性學(xué)習(xí)仍將取決于師生之間的良好關(guān)系。 它將助力但永遠(yuǎn)不會取代學(xué)生和老師在課堂上共同完成的工作。
第四,LLM 將助力虛擬仿真課程開發(fā)和虛擬教研室建設(shè)。 LLM 與AR(增強(qiáng)現(xiàn)實)、VR(虛擬現(xiàn)實)技術(shù)和設(shè)備的匹配與融合,是LLM 在高等教育領(lǐng)域的又一重要應(yīng)用方向。 受制于無法進(jìn)行人機(jī)交互,現(xiàn)有的虛擬仿真課程,包括國家級虛擬仿真實驗教學(xué)一流課程,帶給學(xué)生的體驗感和學(xué)習(xí)效果都不盡如人意。 隨著LLM 及其在基于高等教育各專業(yè),特別是在新工科、新醫(yī)科、新農(nóng)科專業(yè)不斷深入的課程內(nèi)容建設(shè)和開發(fā),虛擬仿真、虛擬實驗的內(nèi)容質(zhì)量,師生的沉浸式體驗感和逼真感,以及學(xué)習(xí)效果都將大幅提升。 同樣,教育部正在推進(jìn)的虛擬教研室建設(shè),也將隨著LLM 的應(yīng)用,打破不同院校之間的空間限制和教育上下級之間的體制限制,開展充分的跨區(qū)域和跨級交流,甚至可提供一個類似于第二大腦的教研交流對象。 每一個虛擬教研室都將擁有一個類似于教學(xué)指導(dǎo)委員會或?qū)W科建設(shè)指導(dǎo)委員會一樣的交流和咨詢對象,以實現(xiàn)對每個虛擬教研室富有針對性的教學(xué)指導(dǎo)和幫助。
第一,LLM 將有力助推新工科、新醫(yī)科、新農(nóng)科與新文科建設(shè)。 “四新”建設(shè)旨在從教育思想、發(fā)展理念、質(zhì)量標(biāo)準(zhǔn)、技術(shù)方法、質(zhì)量評價等方面推進(jìn)相關(guān)學(xué)科人才培養(yǎng)范式的全方位改革。 就賦能新工科而言,LLM 建設(shè)及其應(yīng)用將有力助推組織模式創(chuàng)新、內(nèi)容方式創(chuàng)新和實踐體系創(chuàng)新,助力構(gòu)建產(chǎn)學(xué)研用多要素融合、多主體協(xié)同的育人機(jī)制,將有助于支撐本科院校與企業(yè)深度合作,將賦能建設(shè)一批示范性微電子學(xué)院、網(wǎng)絡(luò)安全學(xué)院、現(xiàn)代產(chǎn)業(yè)學(xué)院、特色化示范性軟件學(xué)院、未來技術(shù)學(xué)院等,推動工程教育深層次變革。 就賦能新醫(yī)科而言,LLM 建設(shè)及其應(yīng)用將助力復(fù)合型高層次醫(yī)學(xué)拔尖創(chuàng)新人才培養(yǎng),推動“醫(yī)學(xué)+X”復(fù)合型人才培養(yǎng)改革走向深入。 就賦能新農(nóng)科而言,LLM 建設(shè)及其應(yīng)用將助力設(shè)立更多創(chuàng)新形式的新農(nóng)科實踐項目,促進(jìn)“大國三農(nóng)”系列在線開放課程和耕讀教育相關(guān)國家級一流課程提質(zhì)升級,賦能耕讀教育實踐基地建設(shè),有力支撐新農(nóng)業(yè)、新農(nóng)村、新農(nóng)民和新生態(tài)建設(shè)。 就賦能新文科而言,新文科建設(shè)的要義之一是促進(jìn)學(xué)科交叉融合,2012—2022 年間,教育部統(tǒng)籌推進(jìn)在全國高校新增三千多個文理、文工等學(xué)科交叉融合專業(yè)點[10]。 LLM的發(fā)展與建設(shè),將有助于文科背景的教師和管理者更好理解和推進(jìn)文理、文工等交叉學(xué)科的建設(shè),并加快涉外法治、國際傳播、國際組織等相關(guān)人才培養(yǎng),推進(jìn)文科教育與社會實務(wù)緊密結(jié)合。
第二,LLM 將賦能基礎(chǔ)學(xué)科拔尖人才培養(yǎng)。在百年未有之大變局下,為貫徹習(xí)近平總書記“加強(qiáng)基礎(chǔ)學(xué)科拔尖學(xué)生培養(yǎng),在數(shù)理化生等學(xué)科建設(shè)一批基地,吸引最優(yōu)秀的學(xué)生投身基礎(chǔ)研究”[11]的重要指示,2018 年教育部全面啟動基礎(chǔ)學(xué)科拔尖學(xué)生培養(yǎng)計劃2.0(簡稱“珠峰計劃”),在77 所高校布局建設(shè)了288 個學(xué)生培養(yǎng)基地,累計吸引1 萬余名優(yōu)秀學(xué)生投身基礎(chǔ)學(xué)科[10]。 其中,涉及190 個左右的理科基地、60 個左右的文科基地以及10 個左右的醫(yī)科基地。 LLM 建設(shè)及其AI 智能應(yīng)用,將有利于發(fā)現(xiàn)、選拔和培養(yǎng)上述基礎(chǔ)學(xué)科領(lǐng)域的天才、偏才和怪才。 從學(xué)生能力角度考量,基本技能中的初級寫作、編程等最容易被LLM 代替或至少輔助完成,而批判性思維、創(chuàng)新能力和綜合運(yùn)用理論解釋、解決現(xiàn)實問題的能力就變得更為重要;從教育者角度考量,通過LLM 得到的是相對碎片化的知識,而對拔尖人才的培養(yǎng),應(yīng)重點引導(dǎo)啟發(fā)學(xué)生提問能力、獨(dú)立思考能力、創(chuàng)新思維的涌現(xiàn)。 可以說,LLM 的廣泛應(yīng)用,將助力國家形成基礎(chǔ)學(xué)科拔尖人才的梯隊網(wǎng)絡(luò),探索基礎(chǔ)學(xué)科拔尖人才培養(yǎng)的中國范式,為建設(shè)世界重要人才中心和創(chuàng)新高地筑牢基礎(chǔ)。
第三,LLM 將促進(jìn)高校進(jìn)行以學(xué)生能力為核心的結(jié)構(gòu)性變革。 包括我國在內(nèi)的世界高校教學(xué)的現(xiàn)行組織方式都是以專業(yè)為基礎(chǔ),圍繞“專業(yè)+年級”或“學(xué)科大類+年級”的核心單元進(jìn)行組織。未來,在LLM 及其與之相匹配的AI 教學(xué)的加持下,高校教學(xué)有極大可能充分基于學(xué)生的不同能力水平,打破專業(yè)、班級教學(xué)的整齊劃一,圍繞“專業(yè)+能力”或“學(xué)科大類+能力”的核心單元進(jìn)行組織,在知識習(xí)得和掌握的基礎(chǔ)上,以多維能力和綜合素質(zhì)提升為最終目標(biāo),組織師生、教學(xué)資源和學(xué)習(xí)空間,大幅提升高校針對學(xué)生情況開展個性化教學(xué)的可能性。 這樣,學(xué)校將實現(xiàn)從圍繞年級展開的“年級進(jìn)階”向圍繞能力提升展開的“能力進(jìn)階”轉(zhuǎn)型升級[12]。
第一,LLM 在高等教育領(lǐng)域的使用可能引發(fā)國家安全風(fēng)險。 這種安全風(fēng)險主要來自三個方面:一是數(shù)據(jù)泄露風(fēng)險。 一旦LLM 在高等教育領(lǐng)域大規(guī)模使用,其背后的海量教育數(shù)據(jù),包括但不限于學(xué)科數(shù)據(jù)、專業(yè)數(shù)據(jù)、教師數(shù)據(jù)、學(xué)生數(shù)據(jù)、學(xué)習(xí)數(shù)據(jù)、師生互動和人機(jī)互動數(shù)據(jù)等,以及背后巨量的個體參數(shù),包括但不限于聲音、語言、思維模式和學(xué)習(xí)習(xí)慣等,一旦被GPT 自動收集并分析上述敏感信息,既有可能侵害個人隱私,又很有可能被敵視我國的國家所掌握,存在一定的隱患風(fēng)險[13]29。 二是意識形態(tài)風(fēng)險。 LLM 技術(shù)領(lǐng)先的某些西方霸權(quán)國家,有可能利用其LLM 在中國高等教育中的大規(guī)模應(yīng)用,針對我國進(jìn)行潛移默化的意識形態(tài)滲透和制度破壞,這種隱蔽的、持續(xù)性的輸出可能會影響師生,特別是青年學(xué)生的政治判斷和選擇。 三是技術(shù)依賴風(fēng)險。 目前,幾款主流的LLM 都是由美國公司開發(fā),美國又在算力、算法、芯片等關(guān)鍵領(lǐng)域擁有較大優(yōu)勢,在中美科技競爭的背景下,LLM 在高等教育領(lǐng)域的應(yīng)用,很可能加劇我國對美國的依賴,從而對我國高教安全和獨(dú)立自主發(fā)展構(gòu)成嚴(yán)重影響。
第二,LLM 的使用可能帶來新的高等教育“智能鴻溝”。 雖然教育信息化、教育資源數(shù)字化建設(shè)在我國高等教育中的發(fā)展和應(yīng)用已經(jīng)有十余年時間?,但是仍存在區(qū)域之間、城鄉(xiāng)之間、不同層級學(xué)校之間和家庭之間等多維度的發(fā)展不平衡:東、中、西部在互聯(lián)網(wǎng)基礎(chǔ)設(shè)施與數(shù)字化學(xué)習(xí)資源方面差異明顯[14];城鄉(xiāng)學(xué)生在基本硬件條件、網(wǎng)絡(luò)條件和場地條件方面存在顯著差異[15],有網(wǎng)絡(luò)問題的農(nóng)村學(xué)生比例達(dá)37.63%,高于城鎮(zhèn)學(xué)生[16];一項基于全國12 所高校學(xué)生的調(diào)查表明,相對于重點大學(xué)的本科生,普通院校本科生和高職院校學(xué)生擁有互聯(lián)網(wǎng)設(shè)備的可能性要分別低82%和93%[17];中上經(jīng)濟(jì)水平家庭安裝互聯(lián)網(wǎng)的概率較劣勢家庭高出1.4 ~4.4 倍,而父親學(xué)歷是小學(xué)及以下的家庭安裝互聯(lián)網(wǎng)的概率僅為??萍耙陨系?0%[18]。 面對即將到來的LLM,可以想見的是,上述教育“數(shù)字鴻溝”尚未彌合,新的區(qū)域、群體和家庭的教育“智能鴻溝”又會出現(xiàn),LLM 及其衍生的高等教育工具很有可能被優(yōu)先提供給有能力購買的高?;蛑攸c院校,但我們需要確保這些工具也會被提供給全國各類型、各層次的高校使用。 但是這個美好的均等化愿景的實現(xiàn)并不樂觀。
第三,LLM 存在被少數(shù)大企業(yè)高度壟斷的極大可能性。 LLM 的開發(fā)和不斷更新,需要持續(xù)的巨大算力的投入,這背后又是巨大的資金和智力投入,一般企業(yè)難以企及?。 而一旦被少數(shù)企業(yè)掌握,勢必導(dǎo)致寡頭壟斷。 那么,一旦個別企業(yè)掌握這種超級生產(chǎn)力,對整個行業(yè)的生態(tài)將造成什么樣的影響? 對高等教育管理者、高校教師和學(xué)生將產(chǎn)生什么樣的影響? 如果上述問題處理不當(dāng),不僅會對LLM 的使用者產(chǎn)生不良影響,也會影響LLM 及其相關(guān)應(yīng)用的使用和推廣,最終反噬少數(shù)壟斷企業(yè)。
第一,開發(fā)自身的LLM。 面對上述數(shù)據(jù)安全、意識形態(tài)、技術(shù)依賴等方面的風(fēng)險,根本性方法是要發(fā)展中國自己的LLM 及其在高等教育領(lǐng)域的拓展應(yīng)用和軟件。 只有擁有國產(chǎn)自主可控的LLM,才能既保證我國享有LLM 及其拓展應(yīng)用帶來的各項便利,又能規(guī)避被人卡脖子以及風(fēng)險不可控等問題[13]33。 這就需要我們用好市場和國家兩種力量,以市場力量為核心,適當(dāng)發(fā)揮科技攻關(guān)舉國體制的作用,加快開發(fā)中國的LLM。 進(jìn)一步,高等教育主管部門應(yīng)主動加強(qiáng)與LLM 類公司的深度合作,開展聯(lián)合研發(fā),并開發(fā)適配高等教育場景,具備對話輔導(dǎo)、技能訓(xùn)練、講授演示、協(xié)同創(chuàng)作、交互評價等功能的LLM 應(yīng)用軟件或插件。 實際上,我國已經(jīng)具備研發(fā)LLM 的技術(shù)基礎(chǔ)和智力儲備,在全球人工智能高等院校排名中,我國的清華大學(xué)、北京大學(xué)位居第二、三位。 同時,中國企業(yè)在人工智能領(lǐng)域也取得了較好的成績,Gartner公布的人工智能報告中,有三家企業(yè)(阿里巴巴、百度、騰訊)進(jìn)入前十名[13]34。 未來,即使是我國的LLM 成功開發(fā)并在高等教育領(lǐng)域大規(guī)模應(yīng)用,也需要高度關(guān)注數(shù)據(jù)安全問題。
第二,多措并舉促進(jìn)LLM 均等化可達(dá)并使用。 在LLM 的研發(fā)階段,就需要將LLM 在不同的數(shù)據(jù)集和語料庫上進(jìn)行訓(xùn)練,確保其不含城鄉(xiāng)、區(qū)域、民族、群體等方面的偏見。 在基于LLM 的高等教育課程開發(fā)、師資培訓(xùn)、推廣應(yīng)用階段,可設(shè)立專門的教學(xué)改革研究項目,劃撥專項教育經(jīng)費(fèi),向中西部高校、地方高校進(jìn)行傾斜性支持。 如此,數(shù)字鴻溝和智能鴻溝才有可能逐漸彌合,來自農(nóng)村地區(qū)、廣大中西部地區(qū)、偏遠(yuǎn)地區(qū)、低收入家庭的學(xué)生才不會掉隊。
第三,提升教師數(shù)字教學(xué)素養(yǎng)和學(xué)生數(shù)字學(xué)習(xí)能力。 教師數(shù)字素養(yǎng)是指教師適當(dāng)利用數(shù)字技術(shù)獲取、加工、使用、管理和評價數(shù)字信息和資源,發(fā)現(xiàn)、分析和解決教育教學(xué)問題,優(yōu)化、創(chuàng)新和變革教育教學(xué)活動而具有的意識、能力和責(zé)任[19]。提升高校教師數(shù)字素養(yǎng)需重點圍繞高校教師的數(shù)字化意識、數(shù)字技術(shù)知識與技能、數(shù)字化應(yīng)用、數(shù)字社會責(zé)任和專業(yè)發(fā)展五方面展開培訓(xùn),并對教師運(yùn)用LLM 和相關(guān)拓展工具開展專項培訓(xùn),最終整體提升教師數(shù)字化教學(xué)勝任力[20]。 提升學(xué)生數(shù)字學(xué)習(xí)能力主要從三方面展開。 一是提高數(shù)字化技能。 提升學(xué)生正確、主動運(yùn)用數(shù)字技術(shù)改進(jìn)學(xué)習(xí)的意識和能力,提升學(xué)生數(shù)字化學(xué)習(xí)力、適應(yīng)力與創(chuàng)造力。 二是營造數(shù)字化學(xué)習(xí)氛圍。 構(gòu)建數(shù)字化、智能化學(xué)習(xí)環(huán)境,探索基于LLM、VR 的沉浸式、體驗式學(xué)習(xí)模式,并配套建設(shè)相應(yīng)數(shù)字化教育基礎(chǔ)設(shè)施。 整合校內(nèi)外學(xué)習(xí)資源,為學(xué)生提供充分、完備、便捷的學(xué)習(xí)支持。 三是養(yǎng)成數(shù)字化責(zé)任規(guī)范。 加強(qiáng)學(xué)生信息道德、網(wǎng)絡(luò)誠信、數(shù)據(jù)倫理、數(shù)據(jù)安全教育,倡導(dǎo)并規(guī)范學(xué)生安全、合法、健康、負(fù)責(zé)地使用LLM 及其衍生工具,提高學(xué)生信息和隱私保護(hù)能力[21]43。
第四,夯實數(shù)字化教學(xué)支撐環(huán)境。 一是創(chuàng)建優(yōu)質(zhì)高效的數(shù)字化教學(xué)環(huán)境。 依循“以學(xué)生發(fā)展為中心”的原則,創(chuàng)建高質(zhì)量、可觸及的數(shù)字化教學(xué)和研學(xué)的環(huán)境空間。 既要建設(shè)新的基于智能信息技術(shù)的多元教學(xué)場域[22],更要充分挖掘各高校原有數(shù)字化平臺和學(xué)習(xí)空間的潛力,并適當(dāng)進(jìn)行更新改造,促進(jìn)服務(wù)育人全過程的數(shù)字化轉(zhuǎn)變,實現(xiàn)數(shù)字化教學(xué)應(yīng)用常態(tài)化。 二是構(gòu)建多網(wǎng)融合的高校新基建。 構(gòu)建高速率、大容量、高效率的高校骨干網(wǎng)絡(luò),推進(jìn)以IPv6、WIFI6 和5G 等為基礎(chǔ)的“多網(wǎng)融合”的校園基礎(chǔ)網(wǎng)絡(luò)教學(xué)環(huán)境建設(shè)。 進(jìn)一步整合全校計算資源、存儲資源,推進(jìn)綠色、集約的教育系統(tǒng)數(shù)據(jù)中心建設(shè)和多云模式。 三是提高教學(xué)數(shù)據(jù)治理水平。 各高校要運(yùn)用云計算、大數(shù)據(jù)、LLM 等新技術(shù),為高校教師、行政管理人員和決策者提供及時、全面、精準(zhǔn)的數(shù)據(jù)支持。 將教學(xué)數(shù)據(jù)與LLM 及其拓展應(yīng)用充分對接,實現(xiàn)相互打通的教學(xué)數(shù)據(jù)在高校教學(xué)和育人各環(huán)節(jié)的充分有效應(yīng)用,推進(jìn)數(shù)據(jù)、教學(xué)和個性化培養(yǎng)的深度融合[21]45。
雖然LLM 在高等教育領(lǐng)域的應(yīng)用作為一項通用技術(shù),尚處于點解決方案和一定的應(yīng)用解決方案的階段。 但是,新紀(jì)元的大門已經(jīng)打開了一條縫隙,隨著機(jī)器學(xué)習(xí)和超強(qiáng)計算能力的飛速發(fā)展,通用人工智能正在成為現(xiàn)實。 面對這種形勢,信息時代、智能時代的高校應(yīng)積極擁抱AI、LLM等智能技術(shù),高等教育主管部門也十分有必要根據(jù)中國式現(xiàn)代化對高等教育的發(fā)展需要、世界高等教育的發(fā)展趨勢和中國高校的實際發(fā)展情況,進(jìn)一步謀劃發(fā)展我國自身的LLM 及其在高教領(lǐng)域的應(yīng)用,開展相關(guān)教學(xué)體系重構(gòu)、硬件建設(shè)、師資培訓(xùn)、風(fēng)險防范等系統(tǒng)性工作。 唯有如此,我們才能以LLM 賦能高等教育不斷創(chuàng)新升級,培養(yǎng)更具有問題意識、學(xué)習(xí)能力、協(xié)作能力、創(chuàng)新能力的,堪當(dāng)推進(jìn)中國式現(xiàn)代化重任的卓越人才。
注釋:
①“橫空出世”這個詞并不準(zhǔn)確,早在2017 年,A.Vaswani 等人發(fā)表了Attention is All you Need,就推出了一個超越RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))的新型神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),即Transformer。 之后的兩年里,機(jī)器學(xué)習(xí)領(lǐng)域的從業(yè)者們在Transformer 的基礎(chǔ)上提出了一系列具有里程碑意義的模型,包括GPT、BERT、GPT-2 等及其改進(jìn)版,如ChatGPT、GPT-4 等。 這些模型把機(jī)器處理文本的能力提升到了前所未有的高度,因此很快被產(chǎn)業(yè)界接受并得到了廣泛引用。
②另一項是1980 年出現(xiàn)的圖形用戶界面,是包括Windows 在內(nèi)的所有現(xiàn)代操作系統(tǒng)的前身。
③衡量某個行業(yè)受GPT 影響的水平是Exposure 指標(biāo),衡量的是在保證完成質(zhì)量相同的情況下,GPT 是否能夠?qū)⑼瓿晒ぷ骱腿蝿?wù)的時間縮短至少50%以上。 具體可參見http:/ /openai.com/research/gpts-are-gpts/.
④這比它的上一代GPT-3.5 中包含的1 750 億個參數(shù)整整多了一個數(shù)量級。
⑤無監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)是兩種流行神經(jīng)算法網(wǎng)絡(luò),另外一種是監(jiān)督學(xué)習(xí)。 監(jiān)督學(xué)習(xí)需要標(biāo)注素材,無監(jiān)督學(xué)習(xí)不需要標(biāo)注素材,強(qiáng)化學(xué)習(xí)是在動態(tài)環(huán)境中開展,AI 每執(zhí)行一步都要獲得反饋的學(xué)習(xí)。
⑥分布式訓(xùn)練具有極強(qiáng)的擴(kuò)展性,允許更大的模型在更大的數(shù)據(jù)上進(jìn)行更久的訓(xùn)練。 這種訓(xùn)練需要大量的計算資源和存儲資源來支持,因此其訓(xùn)練成本高達(dá)1 200 萬美元。
⑦GPT-4 使用更多樣化和更大的1PB 數(shù)據(jù)集,而GPT-3 使用較小的45TB 的文本數(shù)據(jù)集。
⑧在多模態(tài)技術(shù)出現(xiàn)之前,AI 模型只能專注于單一領(lǐng)域,例如自然語言處理或計算機(jī)視覺等,多模態(tài)技術(shù)出現(xiàn)后,模型已經(jīng)從單一的自然語言處理和機(jī)器視覺發(fā)展成自動生成圖畫、圖像文字、音視頻等多模態(tài)內(nèi)容,極大地推動了AIGC(AI generated content,翻譯為“生成式AI”,即利用人工智能技術(shù)來生成內(nèi)容的一種新型技術(shù))的內(nèi)容多樣性和通用性。
⑨即給出少量的任務(wù)示例,大型語言模型從給定情境中學(xué)習(xí)并解決新任務(wù)。
⑩例如AI 繪畫從輸入圖像或者文字得到圖像,PalM-E 同時處理視覺、語言和傳感器,極可能應(yīng)用到工業(yè)生產(chǎn)中。 PalM-E 是由谷歌與柏林工業(yè)大學(xué)的人工智能研究小組,于2023 年3 月推出的一個多模態(tài)具象化視覺語言模型(VLM),取名為PaLME,該模型的參數(shù)規(guī)模達(dá)到了5 620 億個。
?OpenAI 公司開發(fā)的最新一代GPT-4,可以實現(xiàn)文字(上限為25 000 字)和圖片的單獨(dú)或混合輸入,文本輸出(含自然語言、代碼)。
?這里的創(chuàng)作是廣義的,包括論文、研究報告、讀書筆記、程序代碼編寫、活動方案設(shè)計等多種形式。 學(xué)生向LLM 陳述題目或主題、內(nèi)容要件、編程需求、制作說明等任務(wù)要求,LLM 會生成初始版本(或者方案),學(xué)生進(jìn)一步向LLM 提出修改要求,LLM給出新版本,……在多輪迭代后,生成一個作品或者方案。 正是這一點讓廣大教師頭疼不已,卻讓一些學(xué)生歡欣鼓舞。 因為教師和管理者無法判斷這個過程中學(xué)生和LLM 各發(fā)揮了多少作用,所以已經(jīng)有部分高校和學(xué)術(shù)期刊明確表態(tài)禁止使用LLM參與作業(yè)和學(xué)術(shù)創(chuàng)作。
?API(Application Programming Interface,應(yīng)用程序編程接口)是一些預(yù)先定義的函數(shù),目的是提供應(yīng)用程序與開發(fā)人員基于某軟件或硬件的以訪問一組例程的能力,而又無需訪問源碼,或理解內(nèi)部工作機(jī)制的細(xì)節(jié)。
?2018 年4 月,教育部實施《教育信息化2.0 行動計劃》,明確到2022 年基本實現(xiàn)“三全兩高一大”的發(fā)展目標(biāo)。 隨后,教育部等部門相繼出臺《高等學(xué)校人工智能創(chuàng)新行動計劃》《教育部關(guān)于實施全國中小學(xué)教師信息技術(shù)應(yīng)用能力提升工程2.0 的意見》《教育部等十一部門關(guān)于促進(jìn)在線教育健康發(fā)展的指導(dǎo)意見》,全面提升教育信息化能力。
?根據(jù)國盛證券計算機(jī)分析師劉高暢、楊然發(fā)布的報告《ChatG-PT,需要多少算力》(2023-02-12)中估算,GPT-3 訓(xùn)練一次的成本約為140 萬美元,對于一些更大的LLM 模型,訓(xùn)練成本介于200 萬~1 200 萬美元之間。 2023 年1 月,平均每天約有1 300萬獨(dú)立訪客使用ChatGPT,對應(yīng)芯片需求為3 萬多片英偉達(dá)A100GPU,初始投入成本約為8 億美元,每日電費(fèi)在5 萬美元左右。