章雷, 胡蓉, 唐振貴, 賀彩云, 王瓊宇
1.西南大學(xué) 圖書館,重慶 400715; 2.西南大學(xué) 教師教育學(xué)院,重慶 400715; 3.廣西財(cái)經(jīng)學(xué)院 新聞與文化傳播學(xué)院,南寧 530007; 4.西南大學(xué) 計(jì)算機(jī)與信息科學(xué)學(xué)院,重慶 400715
2021年2月,中共中央辦公廳、國(guó)務(wù)院辦公廳印發(fā)了《關(guān)于加快推進(jìn)鄉(xiāng)村人才振興的意見》,明確強(qiáng)調(diào)要加強(qiáng)鄉(xiāng)村教師隊(duì)伍建設(shè).鄉(xiāng)村教育是鄉(xiāng)村振興戰(zhàn)略的基礎(chǔ)性工作,教育興則鄉(xiāng)村興.鄉(xiāng)村教育振興關(guān)鍵在人,在于鄉(xiāng)村教師教育對(duì)于“合格”乃至“卓越”鄉(xiāng)村教師的培養(yǎng).而如何推動(dòng)鄉(xiāng)村教師教育事業(yè)全面發(fā)展的話題可以追溯到20世紀(jì)20~30年代興起并興盛的民國(guó)鄉(xiāng)村師范教育,期間以陶行知、黃質(zhì)夫等教育家為代表的鄉(xiāng)村師范教育實(shí)踐,不僅為當(dāng)下鄉(xiāng)村教師教育的內(nèi)涵式發(fā)展提供了歷史依據(jù),更為中國(guó)特色鄉(xiāng)村教師教育的本土化創(chuàng)生帶來現(xiàn)實(shí)啟示.
對(duì)于民國(guó)鄉(xiāng)村師范教育的整體性考察得益于對(duì)相關(guān)文獻(xiàn)的系統(tǒng)把握,更依賴于對(duì)那段塵封歷史的深入挖掘.重慶作為民國(guó)鄉(xiāng)村教育實(shí)踐匯聚之地,珍藏有該段歷史實(shí)踐的豐富史料,其中不乏海內(nèi)外珍本.作為一種技術(shù)邏輯與人文邏輯相耦合的全新研究范式,數(shù)字人文(Digital Humanities)為民國(guó)鄉(xiāng)村師范教育文獻(xiàn)內(nèi)容的語(yǔ)義組織與智慧應(yīng)用帶來契機(jī),通過深入文獻(xiàn)內(nèi)容層面的語(yǔ)義組織,可為挖掘民國(guó)鄉(xiāng)村師范教育的當(dāng)代價(jià)值提供數(shù)據(jù)基礎(chǔ)設(shè)施和便捷利用機(jī)制.為此,本研究以構(gòu)建民國(guó)鄉(xiāng)村師范教育本體為基礎(chǔ),針對(duì)民國(guó)鄉(xiāng)村師范教育文獻(xiàn)進(jìn)行語(yǔ)義組織,探索其智慧應(yīng)用場(chǎng)景,實(shí)現(xiàn)民國(guó)鄉(xiāng)村師范教育文獻(xiàn)的“活化”應(yīng)用.研究成果將實(shí)現(xiàn)一源多用,可為國(guó)家或地區(qū)鄉(xiāng)村教師教育政策的制定提供便捷化借鑒與參考,服務(wù)鄉(xiāng)村振興; 為相關(guān)學(xué)術(shù)研究提供平臺(tái)與數(shù)據(jù)支撐,服務(wù)鄉(xiāng)村教育研究; 也可為公眾提供智慧化的歷史記憶與文化共享傳播服務(wù),服務(wù)歷史文化傳播.
民國(guó)鄉(xiāng)村師范教育是一個(gè)歷史概念,萌芽于1912年中華民國(guó)臨時(shí)政府成立時(shí)對(duì)文化教育的全面改革.隨著五四運(yùn)動(dòng)時(shí)期鄉(xiāng)村教育思潮的興起,國(guó)內(nèi)教育家和教育團(tuán)體逐漸意識(shí)到創(chuàng)立鄉(xiāng)村師范教育是解決鄉(xiāng)村問題的良方[1].1919年余家菊首先倡導(dǎo)鄉(xiāng)村教育運(yùn)動(dòng),其方向就是“向師范學(xué)校去運(yùn)動(dòng)”,具體而言就是要在師范學(xué)校各科教授中著眼于鄉(xiāng)村,設(shè)置鄉(xiāng)村教育學(xué)科,創(chuàng)立鄉(xiāng)村實(shí)驗(yàn)學(xué)校,并養(yǎng)成師范生服務(wù)鄉(xiāng)村社會(huì)的精神[2].1921年袁希濤、黃炎培等人成立了義務(wù)教育期成會(huì),認(rèn)為中國(guó)的廣大民眾在鄉(xiāng)村,推行義務(wù)教育必須著眼于鄉(xiāng)村,開展鄉(xiāng)村教育,為此,必須大力培養(yǎng)鄉(xiāng)村師資.在該會(huì)所辦《義務(wù)教育》刊物上,人們紛紛撰文要求設(shè)立鄉(xiāng)村師范,探討鄉(xiāng)村師范教育的樣式,如《辦理農(nóng)村師范學(xué)校之管見》(9期)、《籌設(shè)鄉(xiāng)村師范學(xué)校之意見》(15期)、《辦理農(nóng)村師范學(xué)校的商榷》(20期)、《辦理農(nóng)村師范的旨趣》(24期)等[3].此后鄉(xiāng)村師范教育經(jīng)歷了從理論準(zhǔn)備走向?qū)嵺`探索的過程.典型的鄉(xiāng)村師范教育實(shí)踐如黃質(zhì)夫從1923年起先后創(chuàng)辦的江蘇界首鄉(xiāng)村師范學(xué)校、江蘇棲霞鄉(xiāng)村師范學(xué)校、浙江湘湖鄉(xiāng)村師范學(xué)校、貴州省立貴陽(yáng)鄉(xiāng)村師范學(xué)校(后改名為國(guó)立貴州師范學(xué)校); 晏陽(yáng)初1924年以保定地區(qū)作為實(shí)驗(yàn)區(qū)進(jìn)行鄉(xiāng)村教育實(shí)驗(yàn),對(duì)鄉(xiāng)村教師實(shí)施培訓(xùn); 而陶行知1927年領(lǐng)導(dǎo)創(chuàng)辦的曉莊師范學(xué)校(以下簡(jiǎn)稱曉莊學(xué)校)則將鄉(xiāng)村師范教育推向高潮.不過,直到1928年大學(xué)院召開第一次全國(guó)教育會(huì)議提出《整頓師范教育制度案》,鄉(xiāng)村師范學(xué)校才被明確列入師范教育制度中[3],獲得其在師范教育制度中的合法地位.總體上,20世紀(jì)20~30年代是中國(guó)鄉(xiāng)村師范教育興起與發(fā)展的重要時(shí)期,本文所指民國(guó)鄉(xiāng)村師范教育也主要涉及此時(shí)期.
崔運(yùn)武在《中國(guó)師范教育史》中將鄉(xiāng)村師范教育界定為“是以一種辦在鄉(xiāng)村,以培養(yǎng)鄉(xiāng)村小學(xué)教員為基本目標(biāo)的師范教育,就其教育程度而言,是一種中等師范教育”[3].教育家古楳在《鄉(xiāng)村師范概要》中明確表示“設(shè)在都市的師范學(xué)校不能造就適合鄉(xiāng)村發(fā)展需要的師資,鄉(xiāng)村師范學(xué)校宜與都市師范學(xué)校分離,鄉(xiāng)村師范教育要培養(yǎng)能發(fā)展鄉(xiāng)村教育之人”[4].為此,本文所探討的民國(guó)鄉(xiāng)村師范教育主要指20世紀(jì)20~30年代辦在鄉(xiāng)村,以培養(yǎng)合格鄉(xiāng)村小學(xué)師資和改造鄉(xiāng)村社會(huì)為目的的中等師范教育.
《辭?!穼?duì)“文獻(xiàn)”一詞的解釋有三:一指典籍與賢者; 二指具有歷史價(jià)值的圖書文物資料,亦指與某一學(xué)科有關(guān)的重要圖書資料; 三指如今記錄有知識(shí)的一切載體的統(tǒng)稱,即用文字、圖像、符號(hào)、聲頻、視頻等手段以記錄人類知識(shí)的各種載體.本研究所指民國(guó)鄉(xiāng)村師范教育文獻(xiàn),主要是指記錄了民國(guó)時(shí)期(尤其是20世紀(jì)20~30年代鄉(xiāng)村師范教育發(fā)展與興盛時(shí)期)鄉(xiāng)村師范教育相關(guān)人物、理論、實(shí)踐等,具有突出歷史價(jià)值與史料價(jià)值的圖書、報(bào)刊、文集等資料.上述資料在本研究團(tuán)隊(duì)所在西南大學(xué)圖書館館藏較為豐富,團(tuán)隊(duì)前期已整理出版的《民國(guó)鄉(xiāng)村教育文獻(xiàn)叢刊三編》(全三十冊(cè))和《民國(guó)鄉(xiāng)村建設(shè)文獻(xiàn)叢刊》(全六十五冊(cè)),以及館藏的《民國(guó)鄉(xiāng)村教育文獻(xiàn)叢刊》(全二十八冊(cè))、《民國(guó)鄉(xiāng)村教育文獻(xiàn)叢刊續(xù)編》(全三十四冊(cè)),為研究提供了有力的文獻(xiàn)保障.本研究擬通過整合數(shù)字人文的技術(shù)邏輯與人文邏輯,深入挖掘這一時(shí)期涉及鄉(xiāng)村師范教育的文獻(xiàn)中所承載的鄉(xiāng)村師范教育管理、理論與實(shí)踐等內(nèi)容,以語(yǔ)義組織方式提供便捷與智慧化的文獻(xiàn)知識(shí)服務(wù),為新時(shí)代鄉(xiāng)村教師教育提供借鑒與參考.
數(shù)字人文(Digital Humanities)源于人文計(jì)算(Humanities Computing)[5],致力于圍繞人文社會(huì)科學(xué)領(lǐng)域研究對(duì)象本體,實(shí)現(xiàn)與之相關(guān)的各類數(shù)字資源的深度整合與保存,向用戶提供專題信息服務(wù)并為相關(guān)應(yīng)用提供支持[6],其一端是高效的計(jì)算,另一端是人文溝通[7].?dāng)?shù)據(jù)密集、工具支持、跨界合作是數(shù)字人文研究最鮮明的三大特征.作為一種技術(shù)邏輯與人文邏輯相耦合的新興跨學(xué)科研究熱點(diǎn)領(lǐng)域,數(shù)字人文正從廣度和深度兩個(gè)維度重構(gòu)人文社會(huì)科學(xué)研究[8].?dāng)?shù)字人文的技術(shù)體系涉及數(shù)字化技術(shù)、數(shù)據(jù)內(nèi)容加工技術(shù)、數(shù)據(jù)分析技術(shù)、可視化技術(shù)、VR/AR 技術(shù)與機(jī)器學(xué)習(xí)等技術(shù):①數(shù)字化技術(shù)如掃描、拍攝、OCR 識(shí)別等; ②數(shù)據(jù)內(nèi)容加工技術(shù)如本體建模、文本圖像編碼與語(yǔ)義描述、命名實(shí)體提取等,其中本體的建立支持概念關(guān)系的管理,支持語(yǔ)料庫(kù)的智能擴(kuò)展,支持文本自動(dòng)分析與語(yǔ)義分析,因而成為數(shù)字人文建設(shè)中非常重要的知識(shí)組織工具; ③數(shù)據(jù)分析技術(shù)如文本分析、內(nèi)容挖掘、時(shí)序分析、地理空間分析、社會(huì)關(guān)系分析等; ④VR/AR技術(shù)如人機(jī)交互技術(shù)、互動(dòng)測(cè)量、游戲化學(xué)習(xí)等,在數(shù)字人文成果的展示與傳播方面發(fā)揮著重要作用; ⑤機(jī)器學(xué)習(xí)技術(shù)如自動(dòng)分類、圖像視頻音頻識(shí)別和分析、個(gè)性化服務(wù)、精準(zhǔn)推送等[9].整個(gè)技術(shù)體系由底層到高級(jí),體現(xiàn)出數(shù)字人文的實(shí)現(xiàn)邏輯,其中,本體的構(gòu)建是數(shù)字人文項(xiàng)目的知識(shí)組織基礎(chǔ),在此基礎(chǔ)上構(gòu)建的知識(shí)庫(kù)則將形成數(shù)字人文項(xiàng)目的信息資源基礎(chǔ),基于本體和知識(shí)庫(kù)則可實(shí)現(xiàn)各種智慧應(yīng)用開發(fā).
近年來,世界各地陸續(xù)成立數(shù)字人文研究機(jī)構(gòu)并開展數(shù)字人文項(xiàng)目,全球范圍內(nèi)有近 200 個(gè)以“數(shù)字人文”命名的中心、項(xiàng)目、實(shí)驗(yàn)室、團(tuán)隊(duì)或圈子.相關(guān)數(shù)字人文項(xiàng)目如美國(guó)布朗大學(xué)數(shù)字學(xué)術(shù)中心的“加里波第與意大利統(tǒng)一運(yùn)動(dòng)檔案”[10],紐約公共圖書館數(shù)字畫廊的“地圖整經(jīng)機(jī)”[11],美國(guó)弗吉尼亞大學(xué)歷史研究中心完成的“影谷項(xiàng)目”[12],國(guó)家圖書館“華夏記憶項(xiàng)目”[13],中國(guó)科學(xué)院計(jì)算機(jī)研究所、武漢大學(xué)與浙江大學(xué)聯(lián)合開展的“數(shù)字敦煌”項(xiàng)目[14],武漢大學(xué)信息資源研究中心董慧教授主持開發(fā)的“中華基本史籍分析系統(tǒng)”,Coursera 推出的北京大學(xué)“中國(guó)古代文化”,上海交通大學(xué)的“中醫(yī)藥與中華傳統(tǒng)文化”,上海圖書館開發(fā)的“家譜知識(shí)庫(kù)系統(tǒng)”“盛宣懷檔案庫(kù)”“上海年華”,中華書局開發(fā)的“中華經(jīng)典古籍庫(kù)”[15],浙江大學(xué)圖書館開發(fā)的“民國(guó)文獻(xiàn)大全”[16]等.
如前所述,在數(shù)字人文項(xiàng)目中,本體構(gòu)建是知識(shí)組織基礎(chǔ).具體到教育領(lǐng)域,國(guó)內(nèi)外相關(guān)研究也在探索各種教育領(lǐng)域本體的構(gòu)建.例如,文獻(xiàn)[17]構(gòu)建了教育領(lǐng)域頂層本體,將該本體與相關(guān)教育網(wǎng)站和教育信息系統(tǒng)聯(lián)合,可以實(shí)現(xiàn)異構(gòu)信息資源的語(yǔ)義檢索; 文獻(xiàn)[18]以教育語(yǔ)義網(wǎng)為背景,提出基于本體的自適應(yīng)學(xué)習(xí)系統(tǒng)架構(gòu),為學(xué)習(xí)者提供基于個(gè)人知識(shí)空間和偏好的學(xué)習(xí)服務(wù); 文獻(xiàn)[19]構(gòu)建了教育技術(shù)學(xué)專業(yè)圖書領(lǐng)域本體,為專業(yè)課程的發(fā)展提供智能服務(wù); 文獻(xiàn)[20]構(gòu)建了基于關(guān)聯(lián)課程數(shù)據(jù)與知識(shí)點(diǎn)本體的知識(shí)圖譜,增強(qiáng)了教學(xué)資源間的語(yǔ)義關(guān)系; 文獻(xiàn)[21]構(gòu)建了涵蓋學(xué)校、學(xué)生、試卷、實(shí)體、知識(shí)點(diǎn)及各種測(cè)評(píng)指標(biāo)等元素的教育測(cè)評(píng)知識(shí)圖譜,包括了基于本體技術(shù)的模式層構(gòu)建和依托于模式層結(jié)構(gòu)定義的數(shù)據(jù)層構(gòu)建; 文獻(xiàn)[22]構(gòu)建了課程及教學(xué)大綱本體,并將其應(yīng)用于課程和教學(xué)大綱相關(guān)知識(shí)的語(yǔ)義搜索,實(shí)現(xiàn)智能服務(wù); 文獻(xiàn)[23]構(gòu)建了面向場(chǎng)景的MOOC資源本體,并探討了該本體模型在語(yǔ)義檢索、知識(shí)導(dǎo)航和個(gè)性化場(chǎng)景推薦方面的應(yīng)用.國(guó)外的教育領(lǐng)域本體研究主要涉及了課程建模與管理本體、描述學(xué)習(xí)領(lǐng)域的本體、描述學(xué)習(xí)者數(shù)據(jù)的本體、描述e-learning服務(wù)的本體、描述學(xué)習(xí)領(lǐng)域與學(xué)習(xí)者數(shù)據(jù)的多本體[24].
綜上,盡管目前已有多樣化的教育本體,但均不適合描述民國(guó)鄉(xiāng)村師范教育文獻(xiàn).首先,教育領(lǐng)域的通用型頂層本體不適合描述具體專題或是微觀層面的教育現(xiàn)象; 而當(dāng)下多數(shù)教育專題本體主要基于現(xiàn)代教育體系來構(gòu)建,例如教學(xué)本體、課程本體等,這些本體提供的類及實(shí)例不能體現(xiàn)出民國(guó)鄉(xiāng)村師范教育的特點(diǎn).其次,上述基于現(xiàn)代教育體系來構(gòu)建的本體,缺乏從歷史的視角進(jìn)行描述,即已有本體主要是教育本體,不是教育史本體,而從本質(zhì)上看,民國(guó)鄉(xiāng)村師范教育本體應(yīng)彰顯教育史研究的特點(diǎn).第三,現(xiàn)有教育本體主要從教育知識(shí)體系的角度構(gòu)建,忽略了知識(shí)使用者的研究與利用需求和作為知識(shí)生產(chǎn)來源的教育史料之間的密切關(guān)系,未能在二者之間搭建起供需匹配的橋梁.鑒于此,本研究擬從數(shù)字人文視角切入,結(jié)合民國(guó)鄉(xiāng)村師范教育及其文獻(xiàn)特征,以及教育史研究與利用需求,在構(gòu)建民國(guó)鄉(xiāng)村師范教育本體基礎(chǔ)上,探索對(duì)民國(guó)鄉(xiāng)村師范教育文獻(xiàn)的語(yǔ)義組織與智慧應(yīng)用.
通過調(diào)研民國(guó)鄉(xiāng)村師范教育文獻(xiàn)和教育史研究者的需求,本研究發(fā)現(xiàn):
1) 民國(guó)鄉(xiāng)村師范教育在教育管理(如教育政策制定、教育經(jīng)費(fèi)投入、教育推廣方式)、教學(xué)內(nèi)容(如師范類和農(nóng)業(yè)類相關(guān)課程的設(shè)置)、教學(xué)方法(如教學(xué)做合一的方法)、實(shí)習(xí)要求(如涵蓋教育實(shí)習(xí)和農(nóng)事實(shí)習(xí))等方面有著突出的特點(diǎn),成為構(gòu)建民國(guó)鄉(xiāng)村師范教育專題本體的重要元素.
2) 教育史研究中強(qiáng)調(diào)對(duì)原始資料的引證溯源,因此需要在民國(guó)鄉(xiāng)村師范教育本體中添加有關(guān)溯源的類,需在本體中考慮例如民國(guó)時(shí)間、民國(guó)時(shí)期教育的分期、教育歷史地理等方面.
3) 當(dāng)前民國(guó)鄉(xiāng)村師范教育本體的構(gòu)建并非要尋求一種大而全的宏觀思路,而是可以先從學(xué)者們對(duì)民國(guó)鄉(xiāng)村師范教育史研究的主題需求中選定和凝練語(yǔ)義化的主題,如涉及教育管理、教學(xué)、課程、實(shí)習(xí)等方面; 同時(shí),本體的構(gòu)建要從史料文獻(xiàn)的形式特點(diǎn)出發(fā)來思考能夠?yàn)檫@些研究主題提供什么樣的信息,進(jìn)而從知識(shí)服務(wù)的角度來處理知識(shí)供求的問題.因此,本研究中本體構(gòu)建的總體原則是兼顧教育史研究需求與民國(guó)鄉(xiāng)村師范教育文獻(xiàn)的內(nèi)容和形式特征,構(gòu)建一個(gè)初步滿足學(xué)者研究需要的專題本體,而本體內(nèi)容的豐富與完善則可通過后期迭代來實(shí)現(xiàn).
李小樹很愕然的樣子,他瞪大眼睛盯著我說:“怎么可以說藝術(shù)與女人是兩碼事情呢?我認(rèn)為女人本身就是藝術(shù)品,只要你懂得去欣賞她,才能品出她的滋味?!?/p>
本體是一個(gè)開放集成的概念體系,是共享概念模型的形式化規(guī)范說明,能夠在語(yǔ)義和知識(shí)層次上描述信息.領(lǐng)域本體構(gòu)建方法各不相同,國(guó)內(nèi)外較為成熟的本體構(gòu)建方法有IDEF-5法、TOVE企業(yè)建模法、Methodolody法、循環(huán)獲取法、七步法和骨架法等.鑒于七步法具有最強(qiáng)的本體建模表達(dá)能力[25],并被廣泛應(yīng)用于本體建模中,具有較強(qiáng)的成熟性和普適性,本研究選擇七步法構(gòu)建本體.具體而言,在明確構(gòu)建民國(guó)鄉(xiāng)村師范教育領(lǐng)域本體基礎(chǔ)上,復(fù)用現(xiàn)有本體、借助教育主題詞表構(gòu)建概念術(shù)語(yǔ)、定義類之間的層次關(guān)系和屬性間關(guān)系,并定義屬性約束,創(chuàng)建實(shí)例.
如圖1所示,民國(guó)鄉(xiāng)村師范教育(Rural Teacher Education in the Republican Period)本體(簡(jiǎn)稱RTEduRP本體)兼顧宏觀、中觀與微觀三層視角,采用Graffoo[26]本體圖形框架來表示.
從宏觀視角看,RTEduRP本體以民國(guó)教育研究的教育管理、課程與教學(xué)等主題為中心,通過名如“aspectOf*”格式的對(duì)象屬性來關(guān)聯(lián)各類主題實(shí)體,如aspectOfCurriculum,aspectOfManagement等.每一主題通過分類層次關(guān)系進(jìn)一步細(xì)分,也為中觀視角和微觀視角的知識(shí)分類組織,以及文獻(xiàn)的主題標(biāo)引和知識(shí)導(dǎo)航提供語(yǔ)義支撐.
圖1 民國(guó)鄉(xiāng)村師范教育本體RTEduRP
從中觀視角看,RTEduRP本體詳細(xì)刻畫了教育教學(xué)中的核心概念及概念間的關(guān)系,如學(xué)校、課程、教學(xué)與教材等實(shí)體的特征及其之間的關(guān)系.民國(guó)鄉(xiāng)村師范學(xué)校在人才培養(yǎng)方面頗具特色,師范生的培養(yǎng)方案中對(duì)入學(xué)資格和培養(yǎng)目標(biāo)通常都有明確規(guī)定,例如,曉莊學(xué)校以培養(yǎng)鄉(xiāng)村兒童和人民所敬愛的導(dǎo)師為培養(yǎng)目標(biāo),具體分目標(biāo)為健康的體魄、農(nóng)人的身手、科學(xué)的頭腦、藝術(shù)的興趣、社會(huì)改造的精神,因此,該本體中入學(xué)資格和培養(yǎng)目標(biāo)成為師范生培養(yǎng)方案實(shí)體的兩個(gè)重要的對(duì)象屬性值.在學(xué)校課程設(shè)置方面,民國(guó)鄉(xiāng)村師范學(xué)校的課程涉及豐富的科目,例如公民、體育、家事、衛(wèi)生、國(guó)文、算學(xué)、地理、歷史、生物、化學(xué)、物理、倫理學(xué)、勞作(工藝)、美術(shù)、音樂、農(nóng)業(yè)及實(shí)習(xí)、農(nóng)村經(jīng)濟(jì)及合作、水利概要、教育概論、教育心理、小學(xué)教材及教學(xué)法、小學(xué)行政、教育測(cè)驗(yàn)及統(tǒng)計(jì)、鄉(xiāng)村教育、實(shí)習(xí)等,且各科都有相應(yīng)的課程標(biāo)準(zhǔn)[27].系統(tǒng)性的課程設(shè)置將為當(dāng)下鄉(xiāng)村教師教育相關(guān)課程設(shè)置帶來重要啟示,因此,RTEduRP本體將學(xué)科與課程標(biāo)準(zhǔn)作為課程實(shí)體的兩個(gè)重要的對(duì)象屬性值.此外,鑒于民國(guó)時(shí)期鄉(xiāng)村師范學(xué)校與普通師范學(xué)校相比有其特殊性,前者重在培養(yǎng)學(xué)生畢業(yè)后深入農(nóng)村,辦理適合農(nóng)村需要的教育事業(yè),因此其教育范圍以及教育實(shí)習(xí)范圍更廣,除教育實(shí)習(xí)(如參觀、見習(xí)、試教)外,還涉及農(nóng)事實(shí)習(xí)(如勞作教育實(shí)習(xí))[28].因此,教育實(shí)習(xí)和農(nóng)事實(shí)習(xí)將作為RTEduRP本體中實(shí)習(xí)實(shí)體的兩個(gè)對(duì)象屬性值.在教學(xué)方面,民國(guó)鄉(xiāng)村師范學(xué)?;谵r(nóng)村教育較為通行的學(xué)級(jí)編制(如單級(jí)編制)和教學(xué)方法(如教學(xué)做合一)實(shí)施師范生教學(xué),例如,特別強(qiáng)調(diào)培養(yǎng)師范生對(duì)于單級(jí)小學(xué)的行政設(shè)施、編制、管理、教材、教法等問題的研究,以及體現(xiàn)教學(xué)做合一的生活法.由此,針對(duì)的學(xué)級(jí)編制和采用的教學(xué)方法將作為教學(xué)實(shí)體的重要對(duì)象屬性值.在課程使用教材方面,針對(duì)民國(guó)鄉(xiāng)村師范教育實(shí)際情況,區(qū)分出規(guī)定教材和鄉(xiāng)土教材兩個(gè)子類.
從微觀視角看,RTEduRP本體主要描述民國(guó)鄉(xiāng)村師范教育中的人物、時(shí)間、地點(diǎn)、事件等基本實(shí)體,以增強(qiáng)或擴(kuò)展民國(guó)鄉(xiāng)村師范教育文獻(xiàn)在文本內(nèi)容方面的語(yǔ)義解釋.具體而言,本研究基于W3C的Time本體構(gòu)建順序坐標(biāo)結(jié)構(gòu)的民國(guó)紀(jì)年表示形式,通過繼承time:General Date Time Descriptionl建立民國(guó)紀(jì)時(shí)的時(shí)間描述,同時(shí)建立起民國(guó)時(shí)間與公歷時(shí)間的對(duì)應(yīng); 此外,采用民國(guó)分期表示從不同教育研究維度、以時(shí)間段表示的民國(guó)時(shí)期的教育發(fā)展階段劃分.地點(diǎn)實(shí)體涉及民國(guó)地名、行政區(qū)劃的屬性(如歸屬關(guān)系、層級(jí)、別名、方位等),同時(shí)建立與現(xiàn)代行政區(qū)劃的關(guān)聯(lián).人物實(shí)體在foaf:Person基礎(chǔ)上增補(bǔ)人物的曾用名,字、號(hào)等別名; 針對(duì)民國(guó)時(shí)期的教育家類,建立其教育理論、教育經(jīng)歷、教育活動(dòng)等方面的描述.事件實(shí)體對(duì)事件進(jìn)行命名與描述,并與相關(guān)的人物、時(shí)間和地點(diǎn)進(jìn)行關(guān)聯(lián).除此之外,教育團(tuán)體、教育文章和著作復(fù)用已有本體的org:Oraniazation,bibo:Article和bibo:Book等類; 溯源實(shí)體用于描述實(shí)體的定義或?qū)嶓w的屬性值所依據(jù)的史料文獻(xiàn)來源,體現(xiàn)出RTEduRP本體的溯源功能.
在關(guān)聯(lián)方面,本研究通過繼承、映射(owl:equivalent Class,owl:equivalent Property,owl:sameAs)和特定關(guān)聯(lián)屬性等多種方法,將RTEduRP本體與教育術(shù)語(yǔ)知識(shí)庫(kù)、外部知識(shí)庫(kù)進(jìn)行關(guān)聯(lián).其中教育術(shù)語(yǔ)知識(shí)庫(kù)(EduTKB,Educatioinal Term Kownledge Base)是基于SKOS本體來組織教育類的分類主題詞表、教育辭典和教育大百科中的術(shù)語(yǔ)詞匯,通過描述這些術(shù)語(yǔ)的概念和結(jié)構(gòu)構(gòu)建術(shù)語(yǔ)知識(shí)庫(kù).
最后形成的當(dāng)前版本的RTEduRP本體共包含145個(gè)類、154個(gè)數(shù)據(jù)屬性、167個(gè)對(duì)象屬性.
民國(guó)鄉(xiāng)村師范教育文獻(xiàn)的語(yǔ)義組織成果體現(xiàn)為相關(guān)知識(shí)庫(kù)的構(gòu)建,構(gòu)建流程如圖2.
首先,構(gòu)建民國(guó)鄉(xiāng)村師范教育知識(shí)庫(kù)RTEduRPKB.使用Topbraid Composer來構(gòu)建RTEduRP本體,包括類、屬性及SHACL(shapes constraint language)約束; 選擇民國(guó)教育相關(guān)的學(xué)術(shù)研究文獻(xiàn)《中國(guó)行政區(qū)劃通史·中華民國(guó)卷》[29]、教育大辭典中的詞條(如人物、事件等文本)等外部知識(shí)來源,通過機(jī)器半自動(dòng)抽取和專家構(gòu)建的方法來構(gòu)建RTEduRP本體的實(shí)例數(shù)據(jù); 并將部分人物、書目等數(shù)據(jù)與上海圖書館的數(shù)字人文開放數(shù)據(jù)平臺(tái)進(jìn)行關(guān)聯(lián).
其次,構(gòu)建教育術(shù)語(yǔ)知識(shí)庫(kù)EduTKB.將詞典通過抽取、轉(zhuǎn)換后存入關(guān)系數(shù)據(jù)庫(kù),再使用python編寫轉(zhuǎn)換程序,用SKOS來組織術(shù)語(yǔ)的名稱、定義,表示術(shù)語(yǔ)上位、下位、相關(guān)等語(yǔ)義關(guān)系以及相關(guān)匹配、精確匹配等映射屬性.
圖2 民國(guó)鄉(xiāng)村師范教育文獻(xiàn)的語(yǔ)義組織
第三,構(gòu)建民國(guó)鄉(xiāng)村師范教育文獻(xiàn)知識(shí)庫(kù)RTEduRPDocKB.RTEduRPDocKB包括原始文獻(xiàn)的影像庫(kù)、文本全文庫(kù)和語(yǔ)義知識(shí)庫(kù),目前收錄范圍涉及前文所述館藏的民國(guó)鄉(xiāng)村教育文獻(xiàn)叢刊及其續(xù)編和三編.具體而言,通過OCR識(shí)別和人工校對(duì)的方法將影像轉(zhuǎn)換成文本格式的全文庫(kù); 通過機(jī)器自動(dòng)識(shí)別和專家構(gòu)建兩種方式從文本中進(jìn)行命名實(shí)體識(shí)別、關(guān)系識(shí)別和語(yǔ)義標(biāo)注,構(gòu)建基于RTEduRP本體描述的語(yǔ)義知識(shí)庫(kù),同時(shí)建立該知識(shí)庫(kù)與RTEduRPKB和EduTKB兩個(gè)知識(shí)庫(kù)的關(guān)聯(lián).其中,機(jī)器自動(dòng)識(shí)別采用基于huggingface的預(yù)訓(xùn)練模型的finetune方法實(shí)現(xiàn),主要對(duì)人名、地名、時(shí)間和事件進(jìn)行初步識(shí)別,再通過人工審核來確認(rèn)識(shí)別的結(jié)果.對(duì)于教育領(lǐng)域?qū)iT的實(shí)體,如課程、教學(xué)方法等實(shí)體及其關(guān)系,本研究搭建專門的語(yǔ)義標(biāo)注平臺(tái),由專家構(gòu)建結(jié)合專業(yè)知識(shí)和本體進(jìn)行實(shí)體及其關(guān)系的語(yǔ)義標(biāo)注.
最后,構(gòu)建檢索平臺(tái).將知識(shí)庫(kù)的RDF數(shù)據(jù)存儲(chǔ)在neo4j圖數(shù)據(jù)庫(kù)中,全文文本和RDF數(shù)據(jù)使用solr構(gòu)建索引.前端檢索界面采用vue開發(fā),RDF可視化功能采用LodLive組件實(shí)現(xiàn),后臺(tái)應(yīng)用服務(wù)采用node.js技術(shù)實(shí)現(xiàn).
語(yǔ)義增強(qiáng)(Semantic Enrichment)是一種通過應(yīng)用語(yǔ)義技術(shù)來增強(qiáng)數(shù)據(jù)價(jià)值的策略,可應(yīng)用于各行各業(yè)各種類型的數(shù)據(jù),以提高數(shù)據(jù)質(zhì)量、可發(fā)現(xiàn)性和再使用性,在智慧數(shù)據(jù)建設(shè)中具有重要意義[30].文獻(xiàn)[31]將語(yǔ)義增強(qiáng)的方法與技術(shù)歸為語(yǔ)義搜索和瀏覽、語(yǔ)義中介、語(yǔ)義標(biāo)注、語(yǔ)義分析和知識(shí)發(fā)現(xiàn)4類.本研究在前述對(duì)民國(guó)鄉(xiāng)村師范教育文獻(xiàn)進(jìn)行語(yǔ)義組織基礎(chǔ)上,搭建民國(guó)鄉(xiāng)村師范教育文獻(xiàn)知識(shí)庫(kù)(RTEduRPDocKB)平臺(tái),提供簡(jiǎn)單檢索、全文檢索、語(yǔ)義檢索等多種檢索方式.語(yǔ)義檢索的結(jié)果記錄提供影像視圖、全文視圖和知識(shí)視圖3種查閱視圖,其中:影像視圖提供文獻(xiàn)原件的影印圖像; 全文視圖提供文本形式的內(nèi)容,并對(duì)文本中特定概念實(shí)體標(biāo)注其語(yǔ)義信息,通過關(guān)聯(lián)知識(shí)庫(kù)的相關(guān)知識(shí),實(shí)現(xiàn)對(duì)文本的語(yǔ)義增強(qiáng); 知識(shí)視圖以RDF可視化的方式呈現(xiàn)實(shí)體(結(jié)點(diǎn))及其關(guān)聯(lián)(關(guān)系),用戶可以根據(jù)結(jié)點(diǎn)上的聚焦、展開、關(guān)閉等操作圖標(biāo)來進(jìn)行知識(shí)導(dǎo)航.上述3種視圖可以按平鋪模式排列,通過聯(lián)動(dòng)設(shè)置,同步呈現(xiàn)影像、文本、知識(shí)的互動(dòng).圖3所示的案例展示了“農(nóng)事課程”語(yǔ)義檢索結(jié)果的其中一條記錄,通過三視圖同時(shí)呈現(xiàn)出該實(shí)體所在的史料原文、文本上下文以及知識(shí)關(guān)聯(lián).其中,全文視圖呈現(xiàn)出相關(guān)擴(kuò)展信息,知識(shí)視圖中則呈現(xiàn)出該課程與學(xué)校、地點(diǎn)、時(shí)任校長(zhǎng)等關(guān)聯(lián)信息.總體上看,平臺(tái)的語(yǔ)義檢索和語(yǔ)義增強(qiáng)功能初步實(shí)現(xiàn)了民國(guó)鄉(xiāng)村師范教育文獻(xiàn)的一種智慧應(yīng)用.
圖3 民國(guó)鄉(xiāng)村師范教育文獻(xiàn)知識(shí)庫(kù)中的語(yǔ)義檢索與語(yǔ)義增強(qiáng)示例
教育是國(guó)之大計(jì)、黨之大計(jì),教師是立教之本、興教之源,鄉(xiāng)村教師教育是鄉(xiāng)村振興戰(zhàn)略的基礎(chǔ)性工作.從數(shù)字人文視角,對(duì)民國(guó)鄉(xiāng)村師范教育文獻(xiàn)展開語(yǔ)義組織與智慧應(yīng)用研究,將實(shí)現(xiàn)該類文獻(xiàn)的“活化”應(yīng)用,為挖掘民國(guó)鄉(xiāng)村師范教育的當(dāng)代價(jià)值提供數(shù)據(jù)基礎(chǔ)設(shè)施和便捷利用機(jī)制.基于此驅(qū)動(dòng)力,本研究在構(gòu)建RTEduRP本體,進(jìn)而構(gòu)建相關(guān)知識(shí)庫(kù)基礎(chǔ)上,搭建了RTEduRPDocKB平臺(tái),通過語(yǔ)義檢索和語(yǔ)義增強(qiáng)功能,初步實(shí)現(xiàn)了民國(guó)鄉(xiāng)村師范教育文獻(xiàn)的智慧應(yīng)用探索.未來的研究可著眼于以下幾方面:
1) 豐富與完善RTEduRP本體.當(dāng)前本體主要聚焦于教育管理、課程、教學(xué)等主題,并且對(duì)教育管理方面僅作了宏觀主題描述.未來可進(jìn)一步拓展相關(guān)主題,并著力從中觀和微觀角度對(duì)本體加以細(xì)化.
2) 擴(kuò)大知識(shí)庫(kù)規(guī)模.鑒于民國(guó)鄉(xiāng)村師范教育主題研究的專業(yè)性,目前研究中自動(dòng)化技術(shù)的使用較為有限,人工審核和專家構(gòu)建工作較為費(fèi)時(shí)費(fèi)力,增加了研究成本,也導(dǎo)致數(shù)據(jù)加工規(guī)模不大.未來在探索提升自動(dòng)化技術(shù)應(yīng)用程度的同時(shí),可考慮通過眾包方式構(gòu)建大規(guī)模文獻(xiàn)知識(shí)庫(kù).
3) 構(gòu)建更加豐富的應(yīng)用體系.本研究所構(gòu)建的本體與知識(shí)庫(kù)當(dāng)前主要應(yīng)用于語(yǔ)義檢索,未來可考慮探索構(gòu)建一整套數(shù)字人文方法(如利用社會(huì)網(wǎng)絡(luò)、大數(shù)據(jù)和可視化方法),實(shí)現(xiàn)對(duì)民國(guó)鄉(xiāng)村師范教育文獻(xiàn)的系統(tǒng)、深入挖掘.