摘 要:鑒于ChatGPT等大語言模型的發(fā)展,大模型已經(jīng)在教育與培訓(xùn)、制造業(yè)、金融業(yè)、醫(yī)療健康、科研與創(chuàng)新等多個行業(yè)和領(lǐng)域展現(xiàn)出巨大的應(yīng)用潛力。運用人工智能和自然語言處理技術(shù),基于Transformer架構(gòu),以資源構(gòu)建、模型設(shè)計算法和安全保障為核心路徑,構(gòu)建了數(shù)據(jù)、模型、應(yīng)用、服務(wù)、運維和反饋六層架構(gòu),并系統(tǒng)分析了思政大模型搭建過程中可能遇到的數(shù)據(jù)收集、模型訓(xùn)練優(yōu)化、系統(tǒng)集成與部署、學(xué)生體驗反饋,以及倫理責(zé)任和保密性等問題,提出了基于數(shù)據(jù)共享、模型偏見消除、系統(tǒng)性能優(yōu)化、用戶界面設(shè)計與倫理審查機制等維度的解決方案。
關(guān)鍵詞:高校思政工作;生成式人工智能;大語言模型
中圖分類號:G641 文獻標(biāo)識碼:A 文章編號:1009 — 2234(2024)07 — 0023 — 07
一、問題的提出
黨的十八大以來,習(xí)近平總書記極具前瞻地將人工智能發(fā)展提升至國家戰(zhàn)略層面,多次發(fā)表重要講話,為我國人工智能領(lǐng)域的發(fā)展指明了方向,確立了基本原則[1]。近年來,隨著Transformer架構(gòu)的興起,尤其是BERT、GPT等預(yù)訓(xùn)練模型的突破性成功,自然語言處理領(lǐng)域邁入了深度學(xué)習(xí)的新階段,生成式人工智能作為這一領(lǐng)域的關(guān)鍵分支實現(xiàn)了歷史性飛躍,能夠基于海量數(shù)據(jù)學(xué)習(xí)來生成文本、圖像乃至音頻等多種形式的內(nèi)容,教育也在這種背景下不斷塑造新的形態(tài)[2]。我國在生成式人工智能領(lǐng)域亦取得了顯著進展。這對高校的思想政治工作提出了挑戰(zhàn),也開辟了新的發(fā)展機遇。新時代高校思政工作面臨新形勢新任務(wù),必須有新氣象新作為[3],人工智能更需要在人們?nèi)粘9ぷ?、學(xué)習(xí)、生活中的深度運用,創(chuàng)造更加智能的學(xué)習(xí)方式、工作方式和生活方式[4]。因此,構(gòu)建一個針對高等教育專業(yè)化的思政大語言模型,不僅是對國家加強和改進思想政治工作、加快推進教育現(xiàn)代化的積極響應(yīng),也為思政教育工作的創(chuàng)新與發(fā)展注入了強勁動力。
在技術(shù)層面上,人工智能(AI)與自然語言處理(NLP)技術(shù)的飛速發(fā)展為特定領(lǐng)域語言模型的應(yīng)用提供了堅實的技術(shù)支撐。這些模型通過大規(guī)模無監(jiān)督學(xué)習(xí),已經(jīng)在問答系統(tǒng)、文本生成、情感分析等多個領(lǐng)域展現(xiàn)了卓越的性能,特別是針對特定領(lǐng)域的微調(diào)技術(shù),能夠使模型在保留廣泛知識的同時,掌握特定領(lǐng)域的專業(yè)語言風(fēng)格和知識體系。未來的通用模型將迎來一種新的范式轉(zhuǎn)變[5],即向著面向特定專業(yè)領(lǐng)域的大模型發(fā)展[6]。這一趨勢在國外醫(yī)療領(lǐng)域已經(jīng)顯現(xiàn),例如康復(fù)領(lǐng)域[7]和腫瘤學(xué)[8],同時引發(fā)了對企業(yè)環(huán)境中大模型安全性的探討[9]。中文的專業(yè)大語言預(yù)訓(xùn)練模型也隨之興起[10],在醫(yī)學(xué)[11]、金融[12]及文化[13]等領(lǐng)域已建立起專業(yè)模型。鑒于此,從政策導(dǎo)向、技術(shù)成熟度、數(shù)據(jù)基礎(chǔ),以及現(xiàn)實的迫切需求來看,構(gòu)建思政大語言模型不僅是可行的,而且是推動高校思政教育高質(zhì)量發(fā)展的必然選擇。
二、思政大語言模型構(gòu)建的路徑、功能與架構(gòu)體系
思政大語言模型是指一種基于大語言模型(如GPT、BERT等)的智能化教育工具,專門用于高校思想政治教育。通過整合和分析大量的思政教育資源,利用人工智能和自然語言處理技術(shù),實現(xiàn)智能問答、個性化學(xué)習(xí)資源推薦、學(xué)習(xí)進度跟蹤、輿情分析等功能。以下從思政大語言模型的構(gòu)建路徑、功能建構(gòu)和架構(gòu)體系分別闡釋。
(一)思政大語言模型的構(gòu)建路徑
思政大語言模型從本質(zhì)上看是一個人工智能的大語言模型,其核心在于數(shù)據(jù)資源的深度整合與管理、模型設(shè)計的創(chuàng)新與適用性、算法技術(shù)的定向研發(fā)與倫理嵌入,以及安全保障機制的周密部署與持續(xù)監(jiān)督。
1.資源層構(gòu)建。構(gòu)建思政大語言模型的首要步驟是建立一個豐富、規(guī)范且持續(xù)更新的資源庫。這一過程需整合廣泛的思政資源,主要包括國家政策法規(guī)、經(jīng)典理論教材、權(quán)威案例分析、時事評論文章、多媒體教學(xué)視頻及音頻資料等。為確保資源的規(guī)范性,需設(shè)立一套標(biāo)準化的文本處理流程,對收集的資料去噪、歸類與標(biāo)注,形成高質(zhì)量的訓(xùn)練語料。對保密性問題,可采取分級管理制度,對敏感信息加密處理,并限定特定權(quán)限的訪問;同時,通過建立反饋激勵機制,鼓勵各級教育機構(gòu)與學(xué)者貢獻最新研究成果,確保資源庫的時效性和全面性,解決資源更新動力不足的難題。
2.模型設(shè)計。模型設(shè)計需充分考慮高校思政工作的特殊性和現(xiàn)實需求,設(shè)計一個既能處理文本又能融合圖像、音頻等多模態(tài)信息的復(fù)合型架構(gòu)。采用Transformer等先進模型作為基礎(chǔ),結(jié)合注意力機制和跨模態(tài)融合技術(shù),確保模型能夠理解并生成蘊含深刻思想內(nèi)涵的多形式內(nèi)容。此外,模型設(shè)計還需預(yù)留接口,以便未來接入更多類型的數(shù)據(jù)源,如虛擬現(xiàn)實(VR)、增強現(xiàn)實(AR)等新興教育工具,以適應(yīng)未來思政教育的多元化需求。
3.算法與技術(shù)。針對思政教育的價值導(dǎo)向性,選擇或開發(fā)專有的訓(xùn)練算法至關(guān)重要,可以探索結(jié)合強化學(xué)習(xí)與監(jiān)督學(xué)習(xí)的方法,讓模型在模擬真實世界的價值判斷和道德決策的過程中學(xué)習(xí),確保輸出內(nèi)容的正確價值取向。此外,引入知識圖譜技術(shù),將抽象的思政理念與具體實例相結(jié)合,增強模型的知識理解和推理能力。算法設(shè)計時,還應(yīng)考慮持續(xù)學(xué)習(xí)機制,使模型能在新數(shù)據(jù)輸入時自我優(yōu)化,保持對最新政策和理論動態(tài)的敏感性。
4.安全保障。安全問題是構(gòu)建思政大語言模型不可忽視的環(huán)節(jié)。在數(shù)據(jù)收集與處理階段,應(yīng)嚴格遵守《網(wǎng)絡(luò)安全法》等相關(guān)法律法規(guī),確保個人隱私和數(shù)據(jù)安全。建立多層次的數(shù)據(jù)安全防護體系,包括數(shù)據(jù)加密傳輸、訪問控制、異常監(jiān)測等技術(shù)手段。在內(nèi)容審查上,采用自動化與人工相結(jié)合的方式,對模型生成內(nèi)容進行嚴格的倫理與合規(guī)性篩查,防止不當(dāng)言論或不良信息的輸出;同時,構(gòu)建倫理審查委員會,對模型的設(shè)計、訓(xùn)練及應(yīng)用進行定期評估,確保其符合社會主義核心價值觀和教育倫理標(biāo)準。
(二)思政大語言模型的功能建構(gòu)
思政大語言模型由一個可視化綜合展示模塊和六個業(yè)務(wù)子系統(tǒng)組成,功能結(jié)構(gòu)如圖1所示。核心功能是實現(xiàn)思政類問題的智能問答,能夠與使用者進行互動討論,并進行學(xué)習(xí)跟蹤,即記憶功能,以及反饋功能和資源推薦功能,還包括數(shù)據(jù)管理、模型訓(xùn)練、系統(tǒng)集成與運維監(jiān)控等多功能模塊。
1.核心功能。一是智能問答。利用自然語言處理(NLP)和深度學(xué)習(xí)技術(shù),智能問答系統(tǒng)能夠理解并精準回應(yīng)學(xué)生的思政問題,提供即時、權(quán)威的解答,促進思政相關(guān)知識的深度學(xué)習(xí)和快速傳播。通過構(gòu)建龐大的問題——答案數(shù)據(jù)庫,系統(tǒng)得以持續(xù)學(xué)習(xí),不斷提升回答的準確性和豐富度。智能問答功能是思政大語言模型的核心,通過自然語言處理技術(shù),模型能夠理解用戶的提問,并提供準確、詳盡的回答。涵蓋了馬克思主義理論、中國特色社會主義理論體系、習(xí)近平新時代中國特色社會主義思想、黨的政策方針等內(nèi)容。智能問答功能依賴于數(shù)據(jù)管理功能提供的數(shù)據(jù)和模型訓(xùn)練功能提供的訓(xùn)練結(jié)果。二是互動討論。通過模擬與用戶的對話,引導(dǎo)用戶思考和理解思政理論和實際問題。互動討論功能不僅能回答問題,還能進行深入的討論,幫助用戶更好地理解和掌握思政知識。該功能在智能問答功能的基礎(chǔ)上,能夠?qū)崿F(xiàn)更高層次的互動。構(gòu)建基于AI輔助的在線互動論壇,利用語義分析技術(shù)對討論內(nèi)容進行分類、排序,促進有價值的思政議題深入探討。平臺鼓勵學(xué)生間的觀點碰撞與知識共享,提升學(xué)生的思辨能力和團隊協(xié)作精神,營造活躍的學(xué)術(shù)氛圍。
2.輔助功能。學(xué)習(xí)資源推薦功能能夠推薦相關(guān)的學(xué)習(xí)資源,如文章、視頻、書籍等;該功能依賴于智能問答功能來獲取學(xué)生的需求,并依靠數(shù)據(jù)管理功能存儲和檢索學(xué)習(xí)資源,為學(xué)生提供個性化的學(xué)習(xí)材料。學(xué)習(xí)進度跟蹤功能記錄學(xué)生的學(xué)習(xí)過程,并提供個性化的學(xué)習(xí)建議和目標(biāo)設(shè)定。通過分析學(xué)生的學(xué)習(xí)軌跡,模型可以提供系統(tǒng)化的學(xué)習(xí)計劃,幫助學(xué)生逐步掌握思政知識。該功能依賴于學(xué)生的互動記錄和數(shù)據(jù)管理功能存儲用戶數(shù)據(jù)。反饋收集功能通過學(xué)生反饋機制,收集學(xué)生對系統(tǒng)的評價和建議,以便于系統(tǒng)優(yōu)化。學(xué)生可以評價回答的質(zhì)量,并提供改進建議,幫助模型不斷提升。這一功能依賴于核心功能和輔助功能的學(xué)生使用數(shù)據(jù)。
3.數(shù)據(jù)管理功能。數(shù)據(jù)即語料基礎(chǔ),需要不斷更新,數(shù)據(jù)管理主要包括數(shù)據(jù)采集和數(shù)據(jù)清洗以及預(yù)處理。數(shù)據(jù)采集功能通過自動化工具,從教材、學(xué)術(shù)論文、政策文件、教學(xué)視頻等多渠道收集思政相關(guān)數(shù)據(jù),確保模型具備豐富的知識庫。數(shù)據(jù)采集作為數(shù)據(jù)清洗與預(yù)處理的輸入。數(shù)據(jù)清洗與預(yù)處理功能對采集的數(shù)據(jù)進行清洗和預(yù)處理,包括去重、格式標(biāo)準化、去除敏感信息和分詞與標(biāo)注。經(jīng)過處理的數(shù)據(jù)為模型訓(xùn)練功能提供高質(zhì)量的輸入數(shù)據(jù),確保模型訓(xùn)練效果。
4.模型訓(xùn)練功能。模型選擇與初始化階段,可依托于深度學(xué)習(xí)框架,選擇適合思政教育場景的預(yù)訓(xùn)練模型,如基于Transformer架構(gòu)之上的BERT、GPT-4,以及Qwen2-72B等模型均通過對模型參數(shù)進行恰當(dāng)?shù)某跏蓟渲谩?/p>
模型訓(xùn)練功能使用預(yù)處理后的數(shù)據(jù),對預(yù)訓(xùn)練模型進行多輪次訓(xùn)練,調(diào)整超參數(shù),優(yōu)化模型性能。訓(xùn)練后的模型結(jié)果為智能問答和其他應(yīng)用功能提供支持。模型微調(diào)功能根據(jù)具體的應(yīng)用需求,對已經(jīng)訓(xùn)練好的模型進行微調(diào)和優(yōu)化。通過微調(diào),模型在特定任務(wù)上的表現(xiàn)得到進一步提升,確保其在實際應(yīng)用中的準確性和有效性。利用大規(guī)模無監(jiān)督學(xué)習(xí)對模型進行初步訓(xùn)練,隨后,結(jié)合有監(jiān)督學(xué)習(xí)進行微調(diào),使模型精準理解思政領(lǐng)域特有的語言模式和知識體系。微調(diào)過程包括參數(shù)調(diào)整、超參數(shù)優(yōu)化等,確保模型的泛化能力和領(lǐng)域適應(yīng)性。
5.系統(tǒng)集成與部署。前端界面設(shè)計功能為學(xué)生提供友好的交互界面,支持多設(shè)備訪問,確保學(xué)生能夠方便地使用系統(tǒng)功能。前端界面設(shè)計依賴于后端服務(wù)管理實現(xiàn)學(xué)生與模型的交互。后端服務(wù)管理功能支持前端服務(wù)的邏輯處理和數(shù)據(jù)管理,確保系統(tǒng)的穩(wěn)定運行。該功能還包括數(shù)據(jù)加密、訪問控制和日志管理,確保數(shù)據(jù)和系統(tǒng)安全。云端與本地部署功能根據(jù)實際需求,提供靈活的部署方案,滿足不同高校的需求。通過合理的部署,確保系統(tǒng)的高效運行和學(xué)生的無縫體驗。
6.運維與監(jiān)控功能。系統(tǒng)監(jiān)控功能實時監(jiān)控系統(tǒng)運行狀態(tài),發(fā)現(xiàn)并解決異常情況。通過監(jiān)控工具,確保系統(tǒng)的穩(wěn)定運行,及時發(fā)現(xiàn)并排除故障。性能優(yōu)化功能定期分析系統(tǒng)性能,優(yōu)化系統(tǒng)架構(gòu)和運行效率。通過性能優(yōu)化,提高系統(tǒng)的響應(yīng)速度和運行效率,確保學(xué)生體驗。支持功能提供技術(shù)支持和專業(yè)培訓(xùn),確保學(xué)生能夠順利使用系統(tǒng)功能。通過技術(shù)支持和培訓(xùn),以利于充分發(fā)揮系統(tǒng)的功能優(yōu)勢。
(三)思政大語言模型的架構(gòu)體系
架構(gòu)體系是確保思政大語言模型從底層數(shù)據(jù)到頂層服務(wù)都能高效運作的關(guān)鍵。綜合了國外專業(yè)大模型設(shè)計思路[14],參考了國內(nèi)情報學(xué)大模型構(gòu)建的思路[15],借鑒了社會治理云平臺的實際思路[16],將思政大語言模型的架構(gòu)分為數(shù)據(jù)層、模型層、應(yīng)用層、服務(wù)層、運維層和反饋層,圖2所示。
1.數(shù)據(jù)層。數(shù)據(jù)層是思政大語言模型的基礎(chǔ),其設(shè)計與實施凸顯了對多元化數(shù)據(jù)源的精細管理與深度整合。此層要有多種來源的數(shù)據(jù),包括教材、學(xué)術(shù)論文、政策文件、教學(xué)視頻等。確保數(shù)據(jù)來源的權(quán)威性和全面性。從政策文件、學(xué)術(shù)論文、經(jīng)典案例等豐富來源中精心篩選并采集信息,數(shù)據(jù)清洗:去重、格式標(biāo)準化、去除敏感信息。通過數(shù)據(jù)處理,確保數(shù)據(jù)的高質(zhì)量和高一致性。還可以通過高級數(shù)據(jù)清洗技術(shù)剔除冗余與噪聲,確保數(shù)據(jù)的純凈性。數(shù)據(jù)預(yù)處理:分詞、標(biāo)注、構(gòu)建專用詞庫與術(shù)語庫。提升數(shù)據(jù)的可用性和模型對數(shù)據(jù)的理解能力。在整合過程中,運用數(shù)據(jù)融合策略,將異構(gòu)數(shù)據(jù)源無縫連接,構(gòu)建一個高度關(guān)聯(lián)且結(jié)構(gòu)化的數(shù)據(jù)倉庫。采用分布式存儲技術(shù),如Hadoop或Spark等大數(shù)據(jù)處理框架,不僅提升了數(shù)據(jù)存儲的彈性與擴展性,還通過復(fù)制與分散存儲策略,增強了數(shù)據(jù)安全性和訪問效率,為模型訓(xùn)練提供了一個堅實且高效的資源庫。
2.模型層。模型層的核心在于構(gòu)建能夠深刻理解思政內(nèi)涵并生成精準內(nèi)容的智能化模型。此過程目前的主流是采用預(yù)訓(xùn)練模型,如BERT、GPT等架構(gòu),依托大規(guī)模無監(jiān)督學(xué)習(xí),在海量文本語料中捕捉語言規(guī)律與上下文關(guān)系。隨后,通過細致的有監(jiān)督微調(diào),模型被進一步調(diào)校以適應(yīng)思政教育領(lǐng)域特有語言模式與知識體系,包括但不限于政策解讀、價值觀引導(dǎo)、案例分析等。模型選擇、訓(xùn)練與優(yōu)化策略均需經(jīng)過嚴格評估與測試,確保模型在專業(yè)性、準確性和泛化能力上的卓越表現(xiàn),從而實現(xiàn)對思政教育內(nèi)容的深度理解和有效生成。
3.應(yīng)用層。應(yīng)用層直接對接終端使用者學(xué)生,將模型的智能潛力轉(zhuǎn)化為直觀、實用的教育服務(wù)。智能問答系統(tǒng),依托自然語言處理(NLP)技術(shù),實現(xiàn)對復(fù)雜問題的即時理解與精準反饋,提升學(xué)生的互動體驗與學(xué)習(xí)效率。支持用戶通過自然語言交互獲取思政知識和解答問題。提供高質(zhì)量的問答服務(wù),滿足學(xué)生的學(xué)習(xí)需求。根據(jù)學(xué)生的提問和興趣,推薦相關(guān)的學(xué)習(xí)資源。通過推薦系統(tǒng),幫助學(xué)生拓展學(xué)習(xí)資源。記錄學(xué)生的提問歷史和學(xué)習(xí)進度,提供個性化的學(xué)習(xí)建議和目標(biāo)設(shè)定,進而幫助學(xué)生系統(tǒng)化地學(xué)習(xí)和掌握思政知識。基于學(xué)習(xí)行為分析模型與機器學(xué)習(xí)算法,深度挖掘個體學(xué)習(xí)偏好與知識缺口,制訂個性化學(xué)習(xí)路徑。通過實時監(jiān)測與分析學(xué)習(xí)活動數(shù)據(jù),為教師與管理者提供全面的學(xué)習(xí)狀態(tài)視圖,為教學(xué)策略調(diào)整與效果評估提供科學(xué)依據(jù)。
4.服務(wù)層。服務(wù)層保障系統(tǒng)的穩(wěn)定運行與學(xué)生體驗。構(gòu)建從前端到后端的全方位服務(wù)生態(tài),確保平臺的易用性、穩(wěn)定性和安全性。前端設(shè)計遵循以學(xué)生為中心的原則,采用人性化的界面與交互邏輯,提升學(xué)生滿意度與參與度。服務(wù)端邏輯處理高效可靠,通過微服務(wù)架構(gòu)實現(xiàn)模塊化與松耦合,增強系統(tǒng)靈活性與可維護性。數(shù)據(jù)加密與訪問控制機制遵循國際標(biāo)準,確保用戶數(shù)據(jù)與隱私安全無虞。數(shù)據(jù)加密、訪問控制、日志管理,確保數(shù)據(jù)和系統(tǒng)安全。通過多重安全措施,保護用戶隱私和系統(tǒng)數(shù)據(jù)安全。此外,云部署與自動化更新機制降低了運維成本,提升了系統(tǒng)的響應(yīng)速度與穩(wěn)定性。支持云端與本地混合部署,滿足不同高校的需求。根據(jù)具體應(yīng)用場景,選擇最適合的部署方式。
5.運維層。運維層關(guān)注系統(tǒng)的持續(xù)優(yōu)化與維護,是平臺穩(wěn)定運行與持續(xù)演進的關(guān)鍵。通過實施實時系統(tǒng)監(jiān)控與預(yù)警機制,能夠迅速識別并響應(yīng)系統(tǒng)異常,保障服務(wù)的連續(xù)性。性能調(diào)優(yōu)策略基于數(shù)據(jù)分析,不斷優(yōu)化資源分配與負載均衡,提升整體性能。技術(shù)支持與學(xué)生反饋系統(tǒng)建立了高效的響應(yīng)機制,確保學(xué)生問題能夠得到及時解決。此外,通過持續(xù)收集系統(tǒng)日志與用戶反饋,進行深入分析與模式識別,運維層驅(qū)動了平臺的迭代升級與功能優(yōu)化,形成了自我完善的閉環(huán)系統(tǒng)。
6.反饋層。反饋層構(gòu)建了一個閉環(huán)反饋系統(tǒng),是平臺持續(xù)進化的核心機制。該機制不僅收集學(xué)生直接反饋,還可以通過深度學(xué)習(xí)算法分析學(xué)生行為模式,自動識別服務(wù)效果與學(xué)生體驗的潛在改進空間。這種機制確保了模型與服務(wù)能夠根據(jù)實際應(yīng)用中的表現(xiàn)和需求變化進行動態(tài)調(diào)整與優(yōu)化,促進了模型的自我學(xué)習(xí)與服務(wù)能力的持續(xù)提升,實現(xiàn)了平臺的智能化與個性化服務(wù)水平的不斷飛躍。
三、思政大語言模型構(gòu)建可能存在的問題分析與對策
(一)思政大語言模型建設(shè)可能存在的問題分析
1.數(shù)據(jù)相關(guān)問題。數(shù)據(jù)是大模型的基礎(chǔ)。思政大語言模型因為其特殊性,數(shù)據(jù)問題是思政大語言模型構(gòu)建的首要難點。主要是數(shù)據(jù)收集困難、時間與資源消耗:數(shù)據(jù)質(zhì)量問題、數(shù)據(jù)隱私與安全、難以量化和地區(qū)差異等問題。
思政教育領(lǐng)域涉及大量的政策文件、學(xué)術(shù)論文和教材等資料,這些資料的獲取和整理需要投入大量的時間和資源,極大地增加了數(shù)據(jù)收集的難度。部分數(shù)據(jù)受版權(quán)保護,獲取和使用受到嚴格限制,這在一定程度上影響了數(shù)據(jù)的全面性和合法性。數(shù)據(jù)來源廣泛,質(zhì)量參差不齊,存在重復(fù)、冗余、錯誤和不完整的數(shù)據(jù),需要進行復(fù)雜的清洗和預(yù)處理工作,以確保數(shù)據(jù)的準確性和一致性。雖然數(shù)據(jù)來源廣泛,但高質(zhì)量、結(jié)構(gòu)化的數(shù)據(jù)集較為稀缺,如何整合和處理這些數(shù)據(jù)是一大挑戰(zhàn)。涉及學(xué)生和教師的敏感信息,必須確保數(shù)據(jù)的隱私和安全,防止數(shù)據(jù)泄露和濫用,保障個人信息的安全性和合法性。許多非正式、口頭傳承的思政教育內(nèi)容難以量化和數(shù)字化,如何將這些內(nèi)容有效地融入大模型中是一大難題。不同地區(qū)、不同學(xué)校在資金、技術(shù)和人才等資源上存在較大差異,可能導(dǎo)致思政大語言模型的建設(shè)與發(fā)展不平衡,影響整體推進效果。
2.模型訓(xùn)練與優(yōu)化問題?;赥ransformer的自然語言處理模型已經(jīng)取得了質(zhì)的突破,但仍然存在一定的局限性,尤其是面對思政領(lǐng)域大模型的構(gòu)建,主要體現(xiàn)在理解與生成能力不足、模型訓(xùn)練數(shù)據(jù)不足、模型存在偏見和計算資源消耗等問題。
當(dāng)前的人工智能技術(shù)雖然在理解和生成具有深刻思想性和人文關(guān)懷的思政內(nèi)容方面仍然存在局限性,難以全面把握思政教育的深度和廣度。思政教育相關(guān)的高質(zhì)量訓(xùn)練數(shù)據(jù)較為稀缺,可能導(dǎo)致模型訓(xùn)練效果不理想。如何有效利用有限的數(shù)據(jù)、提升模型的泛化能力和準確性是重要的挑戰(zhàn)。模型可能存在偏見,特別是在處理涉及敏感話題的思政教育內(nèi)容時,必須確保模型的公平性和客觀性。需要設(shè)計合理的評估和調(diào)整機制,消除模型中的偏見。模型訓(xùn)練和優(yōu)化需要大量的計算資源,特別是在處理大規(guī)模數(shù)據(jù)和進行復(fù)雜模型訓(xùn)練時,對硬件和基礎(chǔ)設(shè)施要求較高,增加了建設(shè)成本。
3.系統(tǒng)集成與部署問題。系統(tǒng)的復(fù)雜性存在模塊集成難度大,以及實時性與響應(yīng)速度高的相應(yīng)要求,還存在應(yīng)對安全威脅的安全和穩(wěn)定性的要求。
思政大語言模型涉及多個模塊和功能的集成,包括數(shù)據(jù)管理、模型訓(xùn)練、應(yīng)用服務(wù)和運維監(jiān)控等,系統(tǒng)設(shè)計和實現(xiàn)較為復(fù)雜,需要確保各模塊之間的無縫集成和協(xié)同工作。系統(tǒng)需要在用戶提問時提供實時的回答,對響應(yīng)速度有較高的要求。如何優(yōu)化系統(tǒng)架構(gòu)和模型推理效率,確保用戶體驗,是一個重要的問題。系統(tǒng)需要應(yīng)對各種安全威脅,確保數(shù)據(jù)和服務(wù)的安全。需要構(gòu)建穩(wěn)定可靠的系統(tǒng)架構(gòu),防止服務(wù)中斷和故障發(fā)生,保障系統(tǒng)的連續(xù)性和可靠性。
4.學(xué)生體驗與反饋問題。如何設(shè)計友好直觀的用戶界面,確保學(xué)生能夠方便地使用系統(tǒng)功能是體驗設(shè)計的關(guān)鍵。需要不斷收集學(xué)生的反饋,優(yōu)化交互設(shè)計,提升學(xué)生滿意度。系統(tǒng)需要根據(jù)學(xué)生反饋和使用情況,進行持續(xù)的改進和升級,確保其始終符合學(xué)生需求和技術(shù)發(fā)展趨勢。如何高效地進行系統(tǒng)迭代和功能升級是一個需要關(guān)注的問題。思政教育內(nèi)容的敏感性和重要性要求系統(tǒng)提供的信息必須準確可信。如何建立學(xué)生對系統(tǒng)的信任,確保系統(tǒng)輸出的內(nèi)容符合教育要求和政策導(dǎo)向是一個重要的挑戰(zhàn)。教師和學(xué)生對于新技術(shù)的接受程度不一,可能存在抵觸情緒。如何引導(dǎo)和培養(yǎng)學(xué)生的使用習(xí)慣,增加其參與度,是推廣和應(yīng)用的關(guān)鍵。
5.倫理責(zé)任與保密問題。人工智能模型可能受訓(xùn)練數(shù)據(jù)影響,存在價值觀偏差或不當(dāng)言論的風(fēng)險。如何確保模型輸出符合社會主義核心價值觀,避免偏見和誤導(dǎo)是一個嚴峻考驗。在智能化決策過程中,若出現(xiàn)錯誤或不良后果,如何界定責(zé)任歸屬,平衡技術(shù)自主性與人的責(zé)任,也是亟待解決的倫理問題?,F(xiàn)行教育管理制度可能無法適應(yīng)智能教育的快速發(fā)展,制度創(chuàng)新的速度和深度可能不足以支撐大模型的全面推廣。涉及到國家機密、個人隱私的思政內(nèi)容在上傳至云平臺時,如何確保不違反相關(guān)法律法規(guī)是必須解決的問題。
(二)思政大語言模型建構(gòu)對策
1.數(shù)據(jù)問題對策。數(shù)據(jù)是大模型的基礎(chǔ)。思政大語言模型因為其特殊性,數(shù)據(jù)問題是思政大語言模型構(gòu)建的首要難點。主要存在的問題包括數(shù)據(jù)收集困難、數(shù)據(jù)質(zhì)量有待提高、數(shù)據(jù)隱私與安全、難以量化和地區(qū)差異等問題。一是建立數(shù)據(jù)共享機制。通過推動建立跨機構(gòu)、跨地區(qū)的數(shù)據(jù)共享平臺,統(tǒng)一標(biāo)準,促進優(yōu)質(zhì)數(shù)據(jù)資源的流通和利用,與高校、科研機構(gòu)和相關(guān)政府部門建立合作機制,共享數(shù)據(jù)資源,減輕單一機構(gòu)的數(shù)據(jù)收集壓力,確保數(shù)據(jù)來源合法,積極與出版社和知識產(chǎn)權(quán)機構(gòu)溝通,獲取數(shù)據(jù)使用許可,解決版權(quán)問題。二是實現(xiàn)數(shù)據(jù)質(zhì)量控制,開發(fā)專門的數(shù)據(jù)清洗和質(zhì)量控制工具,引入人工智能輔助識別重復(fù)、錯誤數(shù)據(jù),確保數(shù)據(jù)的準確性和一致性。制訂詳細的數(shù)據(jù)清洗與預(yù)處理流程,確保數(shù)據(jù)的準確性和一致性。利用多源數(shù)據(jù)融合技術(shù),提高數(shù)據(jù)的覆蓋面和多樣性,減少單一數(shù)據(jù)源的局限性。三是引入專家團隊,對關(guān)鍵數(shù)據(jù)進行驗證和標(biāo)注,提高數(shù)據(jù)的可靠性。充分運用隱私保護技術(shù),采用加密技術(shù)和匿名處理方法保護個人隱私,建立嚴格的數(shù)據(jù)訪問權(quán)限控制體系,并遵守相關(guān)數(shù)據(jù)保護法規(guī)。對數(shù)據(jù)進行脫敏與加密,對涉及學(xué)生和教師敏感信息的數(shù)據(jù)進行脫敏處理,并在數(shù)據(jù)傳輸和存儲過程中使用加密技術(shù)。采用分布式存儲和數(shù)據(jù)備份策略,確保數(shù)據(jù)的安全性和可靠性。
2.模型訓(xùn)練與優(yōu)化對策。采用數(shù)據(jù)增強與合成技術(shù),增加訓(xùn)練數(shù)據(jù)的多樣性,減少模型訓(xùn)練中的偏見。設(shè)計偏見檢測和修正機制,定期評估模型輸出結(jié)果的公平性。建立模型倫理審查委員會,監(jiān)督模型訓(xùn)練和應(yīng)用過程中的倫理問題。利用遷移學(xué)習(xí)技術(shù),借助其他領(lǐng)域的預(yù)訓(xùn)練模型,提高模型的泛化能力。鼓勵跨學(xué)科研究,融合教育學(xué)、心理學(xué)和社會科學(xué)等領(lǐng)域的知識,提升模型的理解深度和人文關(guān)懷能力。在模型訓(xùn)練中加入偏見檢測模塊,定期進行公平性審計,確保模型輸出的中立性和公正性。采用高效的算法和模型架構(gòu),減少計算資源的消耗。采用分布式計算、云計算等技術(shù),合理規(guī)劃資源使用,降低計算成本,提高訓(xùn)練效率。
3.系統(tǒng)集成與部署對策。建立思政大語言模型的高效、靈活且安全的應(yīng)用體系是核心目標(biāo)。要確保系統(tǒng)不僅能滿足當(dāng)前的需求,還能在未來持續(xù)演進,同時保障學(xué)生數(shù)據(jù)的安全與交互體驗的流暢。首先,可以采用模塊化設(shè)計與微服務(wù)架構(gòu)以提升軟件開發(fā)效率和系統(tǒng)可維護性,這種設(shè)計將大型復(fù)雜的系統(tǒng)拆解為多個小型、相互獨立的服務(wù)或模塊,每個模塊專注于完成特定的功能。這樣做的優(yōu)勢在于可以并行開發(fā)和部署各個模塊,極大地提高迭代速度。在安全防護領(lǐng)域,構(gòu)建多維度的安全體系,為系統(tǒng)穿上了一層堅固的“防護甲”。從網(wǎng)絡(luò)層面的防火墻設(shè)置,到數(shù)據(jù)傳輸和存儲過程中的加密處理,再到應(yīng)用層面的入侵檢測系統(tǒng),形成了立體化的防御機制。尤為重要的是,實施定期的安全審查和漏洞掃描,能夠及時發(fā)現(xiàn)并修復(fù)安全漏洞,有效抵御外部攻擊;同時,制訂并執(zhí)行詳細的災(zāi)備方案,確保在面臨突發(fā)事件時,系統(tǒng)能夠迅速恢復(fù),最大限度減少服務(wù)中斷的影響。
4.學(xué)生體驗與反饋對策。通過對學(xué)生的調(diào)研和需求分析,了解學(xué)生的使用習(xí)慣和偏好,建立有效的反饋機制,及時了解學(xué)生的需求和問題,改進系統(tǒng)設(shè)計。建設(shè)學(xué)生交流社區(qū),促進學(xué)生之間的交流和分享,提高學(xué)生的參與度和活躍度。設(shè)計友好的用戶界面。根據(jù)學(xué)生反饋,持續(xù)優(yōu)化交互設(shè)計,提升學(xué)生體驗。采用用戶體驗(UX)設(shè)計原則,簡化操作流程,提供個性化推薦,增強學(xué)生參與度和滿意度。透明化算法邏輯,公開審核過程,設(shè)置反饋渠道,及時響應(yīng)學(xué)生關(guān)切,增強學(xué)生對系統(tǒng)的信任。建立敏捷開發(fā)機制,快速回應(yīng)學(xué)生反饋,定期邀請學(xué)生參與測試和評價,形成良性循環(huán)。定期進行可用性測試,發(fā)現(xiàn)并解決用戶界面和交互流程中的問題。采用敏捷開發(fā)模式,根據(jù)學(xué)生反饋和技術(shù)發(fā)展趨勢,進行持續(xù)的改進和升級。
5.倫理責(zé)任與保密問題對策。在構(gòu)建人工智能倫理框架以指導(dǎo)思政大語言模型的開發(fā)與應(yīng)用時,首要任務(wù)是確立一套AI倫理準則,該準則需深刻嵌入正確的價值觀,并通過成立倫理審查委員會來監(jiān)督模型輸出,保證其倫理性。這包括建立從模型訓(xùn)練至應(yīng)用全鏈條的倫理審查機制,確保每一個環(huán)節(jié)都與正確的價值觀相符。為預(yù)防和糾正偏見,應(yīng)引入偏見檢測工具定期檢查并調(diào)整模型偏差。在保障保密性與合規(guī)性方面,要求在數(shù)據(jù)處理各階段實施嚴格的合規(guī)審查流程,遵守相關(guān)法律條款,特別是在數(shù)據(jù)保護與國家安全方面。應(yīng)用先進安全技術(shù)保護敏感信息在云端的安全性,并實施定期的安全及合規(guī)審計,確保能夠迅速識別并糾正任何潛在的違規(guī)或安全隱患。
〔參 考 文 獻〕
[1]段雨晨.以人工智能賦能高質(zhì)量發(fā)展[J].紅旗文稿,2024(07):26-28.
[2]胡鑫月.人工智能教育應(yīng)用的倫理審思——基于維貝克的技術(shù)哲學(xué)視角[J].理論觀察,2023,(07):120-126.
[3]夏文斌.新時代學(xué)校思政課建設(shè)的根本遵循——學(xué)習(xí)貫徹習(xí)近平總書記關(guān)于學(xué)校思政課建設(shè)的重要指示[J].紅旗文稿,2024(10):9-12.
[4]習(xí)近平在中共中央政治局第九次集體學(xué)習(xí)時強調(diào)加強領(lǐng)導(dǎo)做好規(guī)劃明確任務(wù)夯實基礎(chǔ) 推動我國新一代人工智能健康發(fā)展[J].黨建,2018(11):1+19.
[5]Grote T , Berens P .A paradigm shift—On the ethics of medical large language models[J].Bioethics, 38:383[2024-07-02].
[6]Ozmen B B , Schwarz G S .Future of artificial intelligence in plastic surgery: Toward the development of specialty-specific large language models[J].Journal of Plastic, Reconstructive & Aesthetic Surgery, 2024, 93:70-71.
[7]Bruno Bonnechère.Unlocking the Black Box? A Comprehensive Exploration of Large Language Models in Rehabilitation[J].American Journal of Physical Medicine & Rehabilitation, 2024, 103(6):532-537.
[8]Vera S, Yiftach B, Eli K,etal.Large language models for oncological applications[J].Journal of Cancer Research and Clinical Oncology, 2023(11):149.
[9]Gupta, Brij B., Akshat Gaurav, Varsha Arya. Navigating the security landscape of large language models in enterprise information systems[J].Enterprise Information Systems, 2024, 18(04):427-441.
[10]李東聞,鐘震宇,孫羽菲,等.玲瓏:一個小規(guī)模的高質(zhì)量中文預(yù)訓(xùn)練語言模型[J/OL].計算機研究與發(fā)展:1-12[2024-07-02].http://kns.cnki.net/kcms/detail/11.1777.TP.20240529.1525.002.html.
[11]羅妍,劉宇煬,李曉瑛,等.面向醫(yī)學(xué)大模型的體系化人工智能框架構(gòu)建與應(yīng)用[J/OL].北京郵電大學(xué)學(xué)報:1-7[2024-07-02].https://doi.org/10.13190/j.jbupt.2023-287.
[12]羅世杰.金融大模型:應(yīng)用、風(fēng)險與制度應(yīng)對[J/OL].金融發(fā)展研究:1-9[2024-07-02].https://doi.org/10.19647/j.cnki.37-1462/f.2024.06.007.
[13]王霞霞.文化大模型建構(gòu)的需求、模式與哲思[J].科技與出版,2024(06):60-67.
[14]Min B , Ross H , Sulem E ,et al.Recent Advances in Natural Language Processing via Large Pre-Trained Language Models: A Survey[J]. 2021.
[15]張洪廣,楊林,楊雄軍,等.大模型驅(qū)動的智能輔助決策原理與典型應(yīng)用[J/OL].指揮與控制學(xué)報:1-8[2024-07-02].http://kns.cnki.net/kcms/detail/14.1379.TP.20240318.1241.002.html.
[16]劉靈輝,田茂林.市域社會治理現(xiàn)代化的制度困境突破:基于制度云平臺的構(gòu)想[J].電子科技大學(xué)學(xué)報(社科版),2022,24(01):65-73.
〔責(zé)任編輯:丁 冬〕