摘 要 語(yǔ)料庫(kù)輔助工具書(shū)編寫(xiě)的歷史由來(lái)已久,教材語(yǔ)料庫(kù)對(duì)學(xué)生工具書(shū)的編寫(xiě)尤其重要。文章首先梳理了20世紀(jì)80年代以來(lái)國(guó)內(nèi)主流的教材語(yǔ)料庫(kù),并評(píng)述了其在輔助新時(shí)代學(xué)生工具書(shū)編寫(xiě)方面的局限性;繼而從架構(gòu)設(shè)計(jì)、語(yǔ)料情況、功能實(shí)現(xiàn)幾個(gè)方面介紹了人民教育出版社自建的中小學(xué)生教材語(yǔ)料庫(kù)PEPTC;并詳細(xì)介紹了PEPTC如何從種數(shù)統(tǒng)計(jì)、頻率統(tǒng)計(jì)、搭配統(tǒng)計(jì)、統(tǒng)計(jì)與多重條件過(guò)濾相結(jié)合、知識(shí)圖譜等幾個(gè)方面,驅(qū)動(dòng)人教學(xué)生工具書(shū)在立目出條、完善釋義、補(bǔ)充例證、板塊設(shè)計(jì)、難度分級(jí)、中觀呼應(yīng)和立體編寫(xiě)等諸多方面不斷提升。最后,文章總結(jié)了PEPTC在驅(qū)動(dòng)人教學(xué)生工具書(shū)編寫(xiě)方面發(fā)揮的實(shí)際效能,并對(duì)包括PEPTC在內(nèi)的漢語(yǔ)語(yǔ)料庫(kù)的發(fā)展方向進(jìn)行了探討。
關(guān)鍵詞 教材語(yǔ)料庫(kù) 學(xué)生工具書(shū) PEPTC 人教辭書(shū)
一、 語(yǔ)料庫(kù)輔助工具書(shū)編寫(xiě)的歷史
辭書(shū)編寫(xiě)者對(duì)語(yǔ)料庫(kù)的應(yīng)用由來(lái)已久?!霸谟?jì)算機(jī)出現(xiàn)之前,研究者——特別是詞典編纂者,也有語(yǔ)料庫(kù),只是規(guī)模小、范圍窄,因而難以在學(xué)術(shù)界形成氣候?!保S昌寧等 2002)而隨著信息技術(shù)的不斷發(fā)展,“用辭書(shū)語(yǔ)料庫(kù)代替人工卡片庫(kù),是詞典編纂方法上的重大變革”(呂海春 2023)。早在20世紀(jì)60年代,美國(guó)Heritage出版社為了編寫(xiě)適合中學(xué)生使用的詞典,就專門(mén)設(shè)計(jì)了AHI語(yǔ)料庫(kù)(American Heritage Intermediate Corpus),收錄出版物1000余種約500萬(wàn)詞次。20世紀(jì)80年代,柯林斯出版社資助了COBUILD語(yǔ)料庫(kù)的建設(shè),該庫(kù)收錄2000萬(wàn)詞次,柯林斯也利用該庫(kù)編寫(xiě)出版了《柯林斯COBUILD英語(yǔ)大詞典》,它被譽(yù)為“全世界第一部用計(jì)算機(jī)編纂的詞典”,開(kāi)創(chuàng)了辭書(shū)例句全部來(lái)自真實(shí)語(yǔ)料的先河,該詞典時(shí)至今日仍然不斷修訂再版。20世紀(jì)80至90年代,我國(guó)開(kāi)始探索建設(shè)辭書(shū)語(yǔ)料庫(kù),并應(yīng)用于辭書(shū)編纂,其中比較有代表性的是南京大學(xué)雙語(yǔ)詞典研究中心從1986年起開(kāi)始進(jìn)行的《綜合英漢大辭典》編纂工作,“為便于今后對(duì)這本大型英漢詞典進(jìn)行修訂、增訂及由其生成各種系列派生詞典”,南京大學(xué)與商務(wù)印書(shū)館共同籌建了“商務(wù)—南大英漢語(yǔ)言資料庫(kù)(CONULEXID)”。(張柏然 1995)時(shí)至今日,依托適配程度高、功能相對(duì)完善的語(yǔ)料庫(kù)已經(jīng)成為了辭書(shū)編纂現(xiàn)代化的重要特征。但是,國(guó)內(nèi)為辭書(shū)編寫(xiě)而專門(mén)建設(shè)的語(yǔ)料庫(kù),仍主要服務(wù)于雙語(yǔ)工具書(shū),漢語(yǔ)辭書(shū)的編寫(xiě)還是主要依靠北京大學(xué)CCL現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)、北京語(yǔ)言大學(xué)BCC語(yǔ)料庫(kù)、國(guó)家動(dòng)態(tài)平衡語(yǔ)料庫(kù)這樣的大型綜合性語(yǔ)料庫(kù)。
人教社[1]的辭書(shū)編纂以學(xué)生工具書(shū)為主。學(xué)生工具書(shū),通常指面向母語(yǔ)學(xué)習(xí)者的學(xué)習(xí)型工具書(shū),以語(yǔ)文詞條為主,兼收百科詞條。與《新華字典》《現(xiàn)代漢語(yǔ)詞典》等“面向大眾”的工具書(shū)不同,人教社出版的《新編小學(xué)生字典》《新編學(xué)生字典》《新編學(xué)生詞典》等學(xué)生工具書(shū)明確“以中小學(xué)生為讀者對(duì)象”,所以既要考慮學(xué)生的認(rèn)知能力與水平,又要最大限度地滿足學(xué)生的學(xué)習(xí)需要。上述大型綜合性語(yǔ)料庫(kù)雖然規(guī)模龐大,但是來(lái)源復(fù)雜,對(duì)教材及青少年語(yǔ)料的收錄規(guī)模和標(biāo)注精細(xì)度不能滿足學(xué)生工具書(shū)的編寫(xiě)需求。人教辭書(shū)亟需一個(gè)針對(duì)性強(qiáng)、精標(biāo)細(xì)注的教材語(yǔ)料庫(kù)輔助編寫(xiě)。
二、 中小學(xué)教材語(yǔ)料庫(kù)的現(xiàn)狀與局限
教材語(yǔ)料庫(kù),是語(yǔ)料庫(kù)中的一個(gè)特殊門(mén)類,是“主要以教材中的課文和練習(xí)為建庫(kù)對(duì)象的語(yǔ)料庫(kù),其語(yǔ)料來(lái)源多為書(shū)面語(yǔ)或用書(shū)面語(yǔ)轉(zhuǎn)寫(xiě)的口語(yǔ),庫(kù)內(nèi)的語(yǔ)料根據(jù)需要進(jìn)行賦碼和標(biāo)注,并具有檢索功能”(羅慶銘 2017)。通過(guò)調(diào)研,我們發(fā)現(xiàn),我國(guó)教材語(yǔ)料庫(kù)的構(gòu)建工作有著起步早、發(fā)展慢的特點(diǎn):(1) 1979—1980年,北京語(yǔ)言學(xué)院(今北京語(yǔ)言大學(xué))對(duì)約200萬(wàn)字語(yǔ)料進(jìn)行了詞語(yǔ)切分和統(tǒng)計(jì),其中約52萬(wàn)字語(yǔ)料來(lái)自中小學(xué)語(yǔ)文教材,包括人教社1978—1980年出版的全日制十年制《語(yǔ)文》課本(試用本)共20冊(cè); (2) 1985年,北京師范大學(xué)建成了“中小學(xué)語(yǔ)文課本語(yǔ)料庫(kù)”,收錄1983—1984年中國(guó)統(tǒng)一使用的中小學(xué)語(yǔ)文教材共24冊(cè);(3) 21世紀(jì)初,廈門(mén)大學(xué)國(guó)家語(yǔ)言資源監(jiān)測(cè)與研究教育教材中心建設(shè)了“現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)”,其中的教材語(yǔ)料包括2016年以前出版的部分對(duì)外漢語(yǔ)教材、中小學(xué)語(yǔ)文教材、其他學(xué)科教材語(yǔ)料,教材語(yǔ)料可以單獨(dú)檢索,但是在總庫(kù)內(nèi)的占比不詳;[2](4) 一些高校學(xué)者也敏銳地意識(shí)到了教材語(yǔ)料庫(kù)的重大意義,對(duì)自建語(yǔ)料庫(kù)進(jìn)行了相關(guān)研究,如果在中國(guó)知網(wǎng)以“教材語(yǔ)料庫(kù)”為主題關(guān)鍵詞進(jìn)行檢索,可得到期刊和碩博論文檢索結(jié)果400多條,其中大部分以自建的教材語(yǔ)料庫(kù)為研究基礎(chǔ),僅供內(nèi)部使用。
若將現(xiàn)有的中小學(xué)教材語(yǔ)料庫(kù)應(yīng)用于學(xué)生工具書(shū)的編寫(xiě),主要存在以下問(wèn)題:(1) 建庫(kù)初衷并非服務(wù)辭書(shū)編寫(xiě)或出版,標(biāo)注極為有限;(2) 年代久遠(yuǎn)、語(yǔ)料陳舊;(3) 取材時(shí)段短,不能提供歷時(shí)研究線索;(4) 覆蓋學(xué)科少,以語(yǔ)文為主;(5) 大庫(kù)套小庫(kù),大庫(kù)語(yǔ)料來(lái)源說(shuō)明包含教材,但不能單獨(dú)檢索教材語(yǔ)料;(6) 提供的檢索和分析工具有限,不能滿足研究者導(dǎo)出、統(tǒng)計(jì)、量化分析等需求;(7) 未開(kāi)放權(quán)限,難以調(diào)用。
因此,構(gòu)建與時(shí)俱進(jìn)的中小學(xué)教材語(yǔ)料庫(kù),對(duì)于人教社這樣集教材編寫(xiě)和研究于一體的出版單位來(lái)說(shuō),勢(shì)在必行、意義重大。一方面,在開(kāi)發(fā)建設(shè)的過(guò)程中,人教社基于多年的教材和教育類圖書(shū)編修積累,有著資源方面的天然優(yōu)勢(shì);另一方面,在建庫(kù)完成之后,人教社也能夠從中獲得可供檢索和分析的一手資料,反哺新選題的策劃和編寫(xiě)出版。因此,人教社研發(fā)了自有的、集成語(yǔ)料和語(yǔ)料分析工具的教材語(yǔ)料庫(kù)。
三、 人教社中小學(xué)教材語(yǔ)料庫(kù)(PEPTC)概況
人教社中小學(xué)教材語(yǔ)料庫(kù)(People’s Education Press Textbook Corpus,以下簡(jiǎn)稱PEPTC)依托人教社資源管理及智能服務(wù)平臺(tái)建設(shè),遵從元數(shù)據(jù)規(guī)范標(biāo)引、海量存儲(chǔ)、引入大數(shù)據(jù)分析、面向服務(wù)的原則進(jìn)行開(kāi)發(fā)。目前,二期工程已通過(guò)驗(yàn)收。
語(yǔ)料庫(kù)包含“現(xiàn)代漢語(yǔ)、古代漢語(yǔ)、英語(yǔ)語(yǔ)料庫(kù)”三個(gè)子庫(kù),目前已入庫(kù)教材近300種,語(yǔ)料近2500萬(wàn)字節(jié)。其中,現(xiàn)代漢語(yǔ)語(yǔ)料以人教社中小學(xué)各科教材中的現(xiàn)代漢語(yǔ)內(nèi)容為主體,涉及語(yǔ)文、歷史、政治、數(shù)學(xué)、物理、化學(xué)生物等多學(xué)科領(lǐng)域;古代漢語(yǔ)語(yǔ)料以國(guó)家統(tǒng)編語(yǔ)文教材中的古代漢語(yǔ)篇目為主體,輔以文言文和古代詩(shī)詞的常見(jiàn)選本選篇;英語(yǔ)語(yǔ)料庫(kù)以人教社中小學(xué)英語(yǔ)教材為主體,輔以歷年中高考真題、權(quán)威英語(yǔ)報(bào)刊資料等。三個(gè)子庫(kù)集成于統(tǒng)一頁(yè)面,通過(guò)首頁(yè)側(cè)欄的點(diǎn)選調(diào)取相應(yīng)子庫(kù)的語(yǔ)料。[3]詳見(jiàn)圖1。
在語(yǔ)料加工方面,近些年建立的語(yǔ)料庫(kù)的主流趨勢(shì)是對(duì)語(yǔ)料進(jìn)行加工,通過(guò)自動(dòng)分詞、自動(dòng)標(biāo)注等處理,將“生語(yǔ)料”變?yōu)椤笆煺Z(yǔ)料”。但實(shí)際上,正如詹衛(wèi)東等(2019)所言,對(duì)于語(yǔ)料庫(kù)中的語(yǔ)料是否應(yīng)該標(biāo)注,一直有不同的觀點(diǎn):支持標(biāo)注的,是考慮到豐富的標(biāo)注信息可以在研究中提供工具支持;不支持標(biāo)注的,是認(rèn)為標(biāo)注不可避免地暗含著預(yù)設(shè)的理論,這會(huì)影響研究者對(duì)語(yǔ)料的判斷。這兩種主張實(shí)際上反映的是不同類型的研究需要,為了兼顧二者,我們?cè)诔尸F(xiàn)界面保留了生語(yǔ)料和熟語(yǔ)料兩個(gè)選項(xiàng),比如:進(jìn)行“AABB”模式的檢索時(shí),若選擇“生語(yǔ)料”,則凡是符合檢索要求的形式都會(huì)出現(xiàn)在檢索結(jié)果中,既有“可可愛(ài)愛(ài)”“兢兢業(yè)業(yè)”類的詞語(yǔ),也有“他的詩(shī)讀起來(lái)往往朗朗上口”中的“往往朗朗”。若選擇“熟語(yǔ)料”,經(jīng)過(guò)分詞處理的“往往朗朗”類結(jié)果就不會(huì) 出現(xiàn)。
在功能實(shí)現(xiàn)方面,PEPTC采用瀏覽器—服務(wù)器的體系架構(gòu)、語(yǔ)料庫(kù)與語(yǔ)料庫(kù)分析工具合二為一的模式,通過(guò)友好的交互界面,為用戶提供:信息概覽(關(guān)鍵數(shù)據(jù)概覽、入庫(kù)統(tǒng)計(jì)、學(xué)科統(tǒng)計(jì)、詞云畫(huà)像等),語(yǔ)料分析工具(多重條件過(guò)濾器、多模式檢索、多維度統(tǒng)計(jì)和對(duì)比、近義詞辨析等),資源管理工具(人工干預(yù)、標(biāo)注審核、語(yǔ)料導(dǎo)入等),大數(shù)據(jù)分析工具(語(yǔ)義分析、關(guān)鍵字提取、實(shí)體識(shí)別、情感分析)等。
值得一提的是,PEPTC的研發(fā)與應(yīng)用始終同步進(jìn)行。在首批XML文件入庫(kù)、網(wǎng)頁(yè)基本框架搭建完成之后,辭書(shū)編輯就開(kāi)始利用語(yǔ)料庫(kù)開(kāi)展編寫(xiě)編輯工作,將語(yǔ)料分析結(jié)果應(yīng)用到編校實(shí)踐當(dāng)中,也將改進(jìn)意見(jiàn)反饋給語(yǔ)料庫(kù)工程師;工程師們根據(jù)反饋調(diào)整平臺(tái),同時(shí)導(dǎo)入新語(yǔ)料、按原定計(jì)劃進(jìn)行功能開(kāi)發(fā)。筆者認(rèn)為這是很好的開(kāi)發(fā)模式,語(yǔ)料庫(kù)資源第一時(shí)間發(fā)揮價(jià)值,也第一時(shí)間得到調(diào)整完善。
四、 PEPTC對(duì)人教學(xué)生工具書(shū)編寫(xiě)的驅(qū)動(dòng)作用
關(guān)于語(yǔ)料庫(kù)在研究和應(yīng)用中的定位,通常有“corpus-based(基于語(yǔ)料庫(kù)的)”和“corpus-driven(語(yǔ)料庫(kù)驅(qū)動(dòng)的)”兩種提法。詹衛(wèi)東等(2019)談到了二者的區(qū)別:前者把語(yǔ)料庫(kù)作為工具看待,主張?jiān)跇?biāo)注語(yǔ)料基礎(chǔ)上開(kāi)展研究和實(shí)踐;后者則更看重語(yǔ)料的原汁原味。人教學(xué)生工具書(shū)的編寫(xiě)雖然把語(yǔ)料庫(kù)當(dāng)作重要工具,并且參考語(yǔ)料標(biāo)注的結(jié)果,但是也深知語(yǔ)料標(biāo)注的局限性,并在觀照原始語(yǔ)料和對(duì)標(biāo)注結(jié)果進(jìn)行人工干預(yù)的前提下開(kāi)展工作,所以從本質(zhì)上來(lái)說(shuō),PEPTC對(duì)人教辭書(shū)編寫(xiě)的作用是“驅(qū)動(dòng)”性的。
關(guān)于語(yǔ)料庫(kù)數(shù)據(jù)在詞典中的呈現(xiàn)方式,Rundell(2009a,2009b)將其分為隱性和顯性兩種:“隱性”呈現(xiàn)方式是指語(yǔ)料庫(kù)提供的數(shù)據(jù)或分析結(jié)果并不直接在詞典中顯現(xiàn)出來(lái),而是在編寫(xiě)過(guò)程中幫助詞典編寫(xiě)者決策如何立條立項(xiàng)、排序、設(shè)立板塊;“顯性”呈現(xiàn)方式則是將數(shù)據(jù)直接呈現(xiàn)在讀者面前,包括例證、頻率數(shù)據(jù)、核心詞表、搭配說(shuō)明等。PEPTC在人教學(xué)生工具書(shū)中的隱形呈現(xiàn)主要包括本節(jié)(一)至(三)小節(jié)的內(nèi)容,顯性呈現(xiàn)主要包括本節(jié)(四)、(五)小節(jié)中的內(nèi)容。
(一) 字種詞種數(shù)統(tǒng)計(jì)——輔助出條
和大多數(shù)具備第四代語(yǔ)料庫(kù)分析工具的語(yǔ)料庫(kù)一樣,字詞語(yǔ)種數(shù)的統(tǒng)計(jì)和分析是PEPTC的基礎(chǔ)功能之一。其中,字種統(tǒng)計(jì)靠統(tǒng)計(jì)字形即可完成,詞和語(yǔ)的統(tǒng)計(jì)需要依靠中文分詞和詞性標(biāo)注算法輔助。這項(xiàng)工作對(duì)人教辭書(shū)的編寫(xiě)完善起到了一定的作用:
1. 覆蓋教材字頭,增收現(xiàn)代漢語(yǔ)詞條
一般的中小型紙質(zhì)工具書(shū)受篇幅限制,釋義通常以常用義、本義為先,選字立條通??紤]一般大眾的使用頻率。但教材語(yǔ)言在共時(shí)層面涉及學(xué)科廣、在歷時(shí)層面涉及部分古代漢語(yǔ)和近代漢語(yǔ)內(nèi)容,學(xué)生對(duì)字詞學(xué)習(xí)性內(nèi)容的需求也遠(yuǎn)遠(yuǎn)超出成年人。為了讓這些內(nèi)容得到較好的呈現(xiàn),人教學(xué)生工具書(shū)在PEPTC的幫助下,利用字種統(tǒng)計(jì)功能實(shí)現(xiàn)了教材漢字的全覆蓋,避免教材用字失查;利用詞統(tǒng)計(jì)功能切分并提取出教材中的全部詞語(yǔ),通過(guò)與已有詞條的比對(duì),查缺補(bǔ)漏。
比如,在《新編學(xué)生詞典》的修訂過(guò)程中,編寫(xiě)組根據(jù)PEPTC的詞種統(tǒng)計(jì)結(jié)果補(bǔ)充了統(tǒng)編語(yǔ)文教材七上《從百草園到三味書(shū)屋》中“木蓮、斑蝥、何首烏、赤練蛇”等諸多動(dòng)植物名詞。這一類詞有的在課文中只進(jìn)行了簡(jiǎn)單的隨文注釋,但學(xué)生往往不能從中獲得更加全面具體的認(rèn)知(如“木蓮”);有的完全沒(méi)有注釋(如“赤練蛇”);如果查檢學(xué)生常用的《現(xiàn)代漢語(yǔ)詞典》第7版(以下簡(jiǎn)稱《現(xiàn)漢》),則發(fā)現(xiàn)有些收條而未配圖,有些則沒(méi)有收條(詳見(jiàn)表1)。通過(guò)PEPTC窮盡性地提取、比對(duì)和補(bǔ)條,學(xué)生可以更好地理解課文內(nèi)容,而不是模模糊糊地“大概知道是個(gè)動(dòng)物/植物”。
2. 增收古代漢語(yǔ)用字義項(xiàng)和詞條
得益于計(jì)算機(jī)古漢語(yǔ)分詞研究的成果,PEPTC對(duì)古代漢語(yǔ)子庫(kù)中的生語(yǔ)料進(jìn)行了加工處理,“中文詞統(tǒng)計(jì)”亦可對(duì)教材古詩(shī)文字詞進(jìn)行檢索、定位、統(tǒng)計(jì)。[4]據(jù)此,人教辭書(shū)補(bǔ)充了部分古代漢語(yǔ)字的義項(xiàng)和詞條,如:語(yǔ)文教材一上《江南》中的“田田”、九上《長(zhǎng)沙過(guò)賈誼宅》中的“謫宦”,等等。這些詞在教材中未提供相應(yīng)的注釋或釋而不詳,學(xué)生的理解難免疏誤;即便學(xué)生能夠自主查檢工具書(shū),他們常見(jiàn)的《現(xiàn)漢》和《新華字典》也都是以現(xiàn)代漢語(yǔ)字詞為收錄對(duì)象,無(wú)法從中查得古詩(shī)文中字詞的準(zhǔn)確釋義。而突出學(xué)習(xí)功能的學(xué)習(xí)型詞典,可以不受時(shí)間界限的約束,兼顧教材中的古今字詞,人教辭書(shū)通過(guò)PEPTC對(duì)教材古詩(shī)文篇目中的字詞進(jìn)行窮盡性地立項(xiàng)、出條、舉例,為學(xué)生提供了幫助。(二) 統(tǒng)計(jì)與多重條件過(guò)濾相結(jié)合——輔助難度分級(jí)、板塊設(shè)計(jì)等配合著多維度的統(tǒng)計(jì),PEPTC還提供了多重條件過(guò)濾功能,用戶可以對(duì)“年代”“查詢對(duì)象(課文/注釋/標(biāo)題)”“學(xué)科”“年級(jí)”“階段”“語(yǔ)料范圍(生語(yǔ)料/熟語(yǔ)料)”等十余項(xiàng)條件進(jìn)行過(guò)濾,并決定是否“去重”、范圍是否限定在“統(tǒng)編三科”或“最新教材”等(詳見(jiàn)圖2)。
多重條件過(guò)濾和統(tǒng)計(jì)分析結(jié)合,可以挖掘出教材蘊(yùn)含的許多數(shù)據(jù)信息,包括教材難度、教學(xué)重點(diǎn)的變化等,這些信息同樣可以服務(wù)于辭書(shū)編寫(xiě)的多個(gè)方面,如:
1. 辭書(shū)的難度階梯設(shè)計(jì)
如果分年級(jí)、分學(xué)段地統(tǒng)計(jì)字詞種數(shù)和頻率,可以發(fā)現(xiàn):PEPTC統(tǒng)計(jì)小學(xué)階段的字種數(shù)為4000多個(gè),而統(tǒng)計(jì)小初高三個(gè)階段的字種數(shù)則為6000多個(gè)。這意味著,編寫(xiě)服務(wù)小學(xué)階段的學(xué)生字典應(yīng)以這4000多字為重點(diǎn)進(jìn)行釋義和知識(shí)講解,同時(shí)根據(jù)頻率統(tǒng)計(jì)和教學(xué)經(jīng)驗(yàn)調(diào)整篇幅,并適當(dāng)擴(kuò)充收字范圍;而編寫(xiě)服務(wù)整個(gè)基礎(chǔ)教育階段的學(xué)生字典,則應(yīng)在6000多字的基礎(chǔ)上,調(diào)整內(nèi)容、適當(dāng)擴(kuò)充。通過(guò)PEPTC,我們對(duì)小初高的用字情況進(jìn)行了比對(duì)分析,并對(duì)服務(wù)不同學(xué)段的工具書(shū)進(jìn)行了細(xì)化,如:我們發(fā)現(xiàn)“”字只出現(xiàn)在統(tǒng)編語(yǔ)文教材八年級(jí)上冊(cè)《三峽》“絕多生怪柏”中,小學(xué)教材及同齡讀物中沒(méi)有出現(xiàn);因此,該字只收錄在服務(wù)全學(xué)段的《新編學(xué)生字典》中,并以“絕”為例證,并未收錄專門(mén)服務(wù)小學(xué)階段的《新編小學(xué)生字典》中。又如:“酐”“炔”等只在高中化學(xué)教材中出現(xiàn)的用字,也只收錄《新編學(xué)生字典》中。如此,《新編小學(xué)生字典》可以將更多的版面留給筆順、組詞、辨析等小學(xué)階段更需要的知識(shí)板塊,兩個(gè)系列產(chǎn)品在收字方面的難度階梯也自然形成。
2. 辭書(shū)知識(shí)板塊設(shè)計(jì)
教材同樣體現(xiàn)著教學(xué)重點(diǎn)的變化,教學(xué)重點(diǎn)也應(yīng)在配套教材的學(xué)生工具書(shū)中得到體現(xiàn)。比如:《義務(wù)教育語(yǔ)文課程標(biāo)準(zhǔn)》(2022年版)在第一學(xué)段(1~2年級(jí))“學(xué)段要求”的“識(shí)字與寫(xiě)字”板塊就明確提出“掌握漢字的基本筆畫(huà)和常用的偏旁部首,能按基本的筆順規(guī)則用硬筆寫(xiě)字……”。由此,《新編學(xué)生字典》等工具書(shū)不僅在附錄中提供《漢字筆畫(huà)名稱表》《寫(xiě)字筆順規(guī)則表》等,還通過(guò)PEPTC分別提取了小學(xué)各個(gè)學(xué)段的識(shí)寫(xiě)漢字,以第一學(xué)段識(shí)寫(xiě)表中的漢字為重點(diǎn),以二、三學(xué)段識(shí)寫(xiě)表中的漢字為補(bǔ)充,為其中常用于構(gòu)字的獨(dú)體字和易錯(cuò)字(如“里”“為”“鼠”等)設(shè)立“筆順”板塊,提供逐筆書(shū)寫(xiě)示范。
(三) 頻率統(tǒng)計(jì)——輔助排序和篇幅設(shè)定
“一個(gè)語(yǔ)詞的使用頻率與其復(fù)雜性(該詞的意義數(shù)量、詞組和搭配數(shù)量等)之間存在著顯著的相關(guān)性。反過(guò)來(lái),語(yǔ)詞的使用頻率和復(fù)雜性與它們對(duì)學(xué)習(xí)者的重要性之間又存在著相關(guān)性?!保≧undell等 2009b)故使用頻率是學(xué)生工具書(shū)編寫(xiě)的參考數(shù)據(jù)之一,PEPTC將頻率信息單獨(dú)放在“語(yǔ)料報(bào)表”板塊,可據(jù)選定的語(yǔ)料范圍對(duì)中文字、中文詞、古詩(shī)文字進(jìn)行統(tǒng)計(jì),并詳列其具體位置、頻次、頻率、累計(jì)頻率。這些信息可以為編寫(xiě)學(xué)生工具書(shū)提供多方面的參考,如:
1. 義項(xiàng)設(shè)立和排序
工具書(shū)中字頭和詞條通常按照音序排列,但義項(xiàng)的排序通常和是否為本義、常用義相關(guān)。對(duì)于學(xué)生工具書(shū)而言,義項(xiàng)排序不僅要考慮這些,還要考慮中小學(xué)生使用頻率高、與教學(xué)內(nèi)容正相關(guān)等因素。通過(guò)PEPTC,我們可以得到字詞的頻率統(tǒng)計(jì),看到它們?cè)诮滩闹忻恳淮纬霈F(xiàn)時(shí)的語(yǔ)境,并據(jù)此判斷是否對(duì)義項(xiàng)進(jìn)行分合增減或改變排序的調(diào)整。如“孵化”一詞,通過(guò)PEPTC提取并去重之后,可看到出現(xiàn)在教材的37處語(yǔ)境當(dāng)中,有30處表示“昆蟲(chóng)、魚(yú)類、鳥(niǎo)類或爬行動(dòng)物的卵在一定的溫度和其他條件下變成幼蟲(chóng)或幼體”——這是常見(jiàn)語(yǔ)文工具書(shū)中收列的義項(xiàng),又有7處用來(lái)“比喻對(duì)新事物進(jìn)行培育、培養(yǎng)”(如“對(duì)高新技術(shù)成果、科技型企業(yè)和創(chuàng)業(yè)企業(yè)進(jìn)行孵化”),這個(gè)用法近年來(lái)隨著高新技術(shù)發(fā)展和創(chuàng)業(yè)環(huán)境變化也已經(jīng)被大眾所接受認(rèn)可,因而《新編學(xué)生詞典》為其增加新義項(xiàng),但又因其使用頻率不及前者,故而列為第二義項(xiàng)。
2. 釋義篇幅的設(shè)定
Rundell等(2009b)提道,在沒(méi)有為讀者提供顯性頻率信息或重要性等級(jí)的情況下,“衡量一個(gè)單詞‘重要性’的唯一指標(biāo)就是詞典用于解釋該詞的篇幅”。這個(gè)說(shuō)法雖然未免過(guò)于絕對(duì),但工具書(shū)在設(shè)計(jì)編寫(xiě)體例的過(guò)程中,確實(shí)會(huì)對(duì)篇幅大小有所約定,而且越是預(yù)設(shè)中讀者需要的信息,獲得的篇幅就越大。人教學(xué)生工具書(shū)的編寫(xiě)者要對(duì)PEPTC的頻率統(tǒng)計(jì)結(jié)果進(jìn)行分析:一是,高頻出現(xiàn)的,特別是學(xué)生常在其義項(xiàng)區(qū)分和用法上有困惑的,需要單獨(dú)列表,并交由主編確認(rèn)是否需要擴(kuò)充篇幅,甚至增加學(xué)習(xí)板塊進(jìn)行詳細(xì)解釋,如:在PEPTC提供的對(duì)教材用詞頻次排名中,我們發(fā)現(xiàn),像“起來(lái)”這樣的詞,看似不起眼,卻在教材中使用超過(guò)3000次,頻次排名前60,其用例涉及它作為主動(dòng)詞、趨向動(dòng)詞,充當(dāng)謂語(yǔ)、補(bǔ)語(yǔ)等情況,因而經(jīng)過(guò)主編分析討論,在《新編學(xué)生詞典》相應(yīng)的位置,一方面結(jié)合“起來(lái)”的語(yǔ)法位置和語(yǔ)義特點(diǎn)進(jìn)行釋義,另一方面設(shè)立“小知識(shí)”板塊,由“起來(lái)”聯(lián)系“下去、上來(lái)、上去、出來(lái)、出去、過(guò)來(lái)、過(guò)去、進(jìn)來(lái)、進(jìn)去”等一系列趨向動(dòng)詞,講解它們的用法和讀音變化。二是,低頻出現(xiàn)的,且學(xué)生在其他常用工具書(shū)中不易查得的,也需要作為收錄對(duì)象單獨(dú)列表,這是解決篇幅的從無(wú)到有,如:“午時(shí)花”一詞只在統(tǒng)編語(yǔ)文三年級(jí)下冊(cè)《花鐘》中出現(xiàn)1次,且其他語(yǔ)文工具書(shū)多未收錄,為幫助小學(xué)生更好地理解課文,《新編學(xué)生詞典》收錄該詞條并選配彩圖。
(四) 搭配統(tǒng)計(jì)——在例證和學(xué)習(xí)板塊中補(bǔ)充語(yǔ)法語(yǔ)用信息
詞語(yǔ)搭配也是運(yùn)用語(yǔ)料庫(kù)開(kāi)展詞典學(xué)應(yīng)用與研究的基本方向之一。黃昌寧等(2002)指出:“一個(gè)詞的詞義只能通過(guò)與之相伴出現(xiàn)的搭配詞才能加以辨識(shí)。從這一觀點(diǎn)出發(fā),無(wú)論是要識(shí)別一個(gè)詞的不同詞義,還是學(xué)會(huì)這個(gè)詞的不同用法,都必須普遍調(diào)查詞語(yǔ)的搭配關(guān)系和用法模式?!庇⒄Z(yǔ)學(xué)習(xí)型詞典一直對(duì)呈現(xiàn)詞語(yǔ)搭配情況非常重視,也很早就開(kāi)始利用語(yǔ)料庫(kù)分析并描寫(xiě)單詞的搭配情況——“眾所周知,搭配是語(yǔ)言的共性,是文本‘地道’與否的關(guān)鍵之一(也許是最關(guān)鍵點(diǎn))。對(duì)學(xué)習(xí)者來(lái)說(shuō),其重要性怎么強(qiáng)調(diào)都不過(guò)分。所以,詞典——從最早期的學(xué)習(xí)詞典開(kāi)始——已經(jīng)努力去記錄語(yǔ)詞的搭配特征?,F(xiàn)在,科技的發(fā)展使我們?cè)谶@一領(lǐng)域可以做得更多”(Rundell等 2009b)。漢語(yǔ)語(yǔ)料的搭配統(tǒng)計(jì)原先需要通過(guò)AntConc等專門(mén)的語(yǔ)料管理工具來(lái)完成,近年來(lái),隨著第四代語(yǔ)料庫(kù)工具的發(fā)展,語(yǔ)料庫(kù)也開(kāi)始向用戶提供搭配統(tǒng)計(jì)和分析的功能。在PEPTC的漢語(yǔ)檢索結(jié)果中,點(diǎn)擊“搭配統(tǒng)計(jì)”選項(xiàng),可分別顯示被檢索詞左搭配和右搭配的成分,以及搭配成分的相關(guān)信息,包括:詞性、詞總數(shù)、占比、頻率、語(yǔ)義韻等(詳見(jiàn)圖3)。
這里提供的是被檢詞語(yǔ)及相關(guān)成分在文本中的語(yǔ)法分布和語(yǔ)用信息,可以幫助我們解決在教學(xué)一線調(diào)研中發(fā)現(xiàn)的“搭配不當(dāng)”“使用不當(dāng)”“句式雜糅”等問(wèn)題。比如:
* 這頓火鍋真是津津有味。
* 鵝嶺公園太美了,我都流連忘返了。[5]
這兩個(gè)錯(cuò)例反映出,學(xué)生掌握了兩個(gè)詞語(yǔ)的基本含義[前者是“滋味濃厚”,后者是“留戀于某種事物(多指景物)而舍不得離去”],但是對(duì)于前者的比喻用法及二者和相關(guān)成分的句法分布把握不準(zhǔn)。這樣的問(wèn)題在教學(xué)一線的調(diào)研中非常普遍,學(xué)生能夠理解新詞、高階詞語(yǔ)的基本含義,也有很強(qiáng)的使用意愿,卻不了解詞語(yǔ)使用的語(yǔ)境、句式、表達(dá)的感情色彩等;教師在感性認(rèn)識(shí)上知道“用得別扭”,卻不能“一針見(jiàn)血”地指出癥結(jié)所在。
學(xué)生工具書(shū)在適當(dāng)?shù)奈恢锰峁┱Z(yǔ)法和語(yǔ)用信息,可以幫助學(xué)生正確地運(yùn)用這些詞語(yǔ)。為此,我們結(jié)合教材使用經(jīng)驗(yàn)和一線調(diào)研反饋,遴選出具有代表性的一批詞語(yǔ),在PEPTC中進(jìn)行檢索,導(dǎo)出并分析教材用例的搭配情況,比如:“津津有味”在教材中出現(xiàn)過(guò)11次,緊挨著的左側(cè)成分最多的是“得”,“得”左側(cè)的成分是動(dòng)詞,細(xì)察每一個(gè)用例,其主語(yǔ)都是人或擬人化的動(dòng)物,最常見(jiàn)的句式是“主語(yǔ)sb+V看、聽(tīng)、吃+得+津津有味”;“流連忘返”出現(xiàn)5次,緊挨著的左側(cè)成分有代詞(3次)、名詞(2次,都是“人”),再左側(cè)的成分是致使動(dòng)詞“使”“讓”“令”。在之后的修訂中,我們將考慮把這些語(yǔ)法和語(yǔ)用信息融入例證、辨析或小知識(shí)板塊,通過(guò)這些顯性的呈現(xiàn)方式,幫助學(xué)生提高字詞語(yǔ)的運(yùn)用能力。(五) 知識(shí)圖譜——關(guān)聯(lián)知識(shí)點(diǎn)、輔助工具書(shū)的中觀呼應(yīng)和立體編寫(xiě)劉嶠等(2016)對(duì)知識(shí)圖譜的定義是:“知識(shí)圖譜是結(jié)構(gòu)化的語(yǔ)義知識(shí)庫(kù),用于以符號(hào)形式描述物理世界中的概念及其相互關(guān)系?!敝R(shí)圖譜的前身是“語(yǔ)義網(wǎng)”的概念,關(guān)注“語(yǔ)義”意味著人們對(duì)自然語(yǔ)言的分析處理不再滿足于形式,而將目光將轉(zhuǎn)向更深層次的意義理解。Google于2012年5月17日正式提出了知識(shí)圖譜(Knowledge Graph),其初衷是讓人們?cè)跈z索時(shí),不僅能獲得檢索字段本身,還能夠獲得最佳的概括和更深、更廣的知識(shí):It’s why we’ve been working on an intelligent model-in geek-speak,a“ graph”-that understands real-world entities and their relationships to one another:things,not strings。[6]
比如,人們?cè)诶脗鹘y(tǒng)方式檢索“甲骨文”的時(shí)候,本質(zhì)上就是將關(guān)鍵字與查詢相匹配,但它其實(shí)有更豐富的含義,它代表世界上最古老的文字之一,同時(shí)也是一個(gè)公司的名稱,而且它會(huì)讓人們聯(lián)想到安陽(yáng)、殷墟、龜甲、獸骨、金文、石鼓文等,這些在人們認(rèn)知中與之關(guān)聯(lián)的信息點(diǎn),以及它們之間的關(guān)系,應(yīng)該能夠通過(guò)更先進(jìn)的檢索方式得到呈現(xiàn)。最近幾年,隨著自然語(yǔ)言處理技術(shù)取得巨大進(jìn)展,大型預(yù)訓(xùn)練語(yǔ)言模型與知識(shí)圖譜融合,使得文本的檢索和理解更加智能,也大大提升了語(yǔ)料庫(kù)向知識(shí)庫(kù)轉(zhuǎn)化的效率。
知識(shí)圖譜技術(shù)應(yīng)用以web為基礎(chǔ),因此天然與網(wǎng)絡(luò)詞典(主要是網(wǎng)絡(luò)百科詞典)相關(guān)聯(lián),不僅是Wikipedia、Baidu等搜索引擎都使用該技術(shù),由傳統(tǒng)紙質(zhì)出版轉(zhuǎn)型的《中國(guó)大百科全書(shū)》第三版也使用了該技術(shù)。目前,PEPTC也在嘗試通過(guò)知識(shí)圖譜技術(shù),由語(yǔ)料庫(kù)向知識(shí)庫(kù)轉(zhuǎn)型,但仍處于初級(jí)階段,其成果主要體現(xiàn)在“知識(shí)檢索”板塊,效果尚不盡如人意。如對(duì)“甲骨文”進(jìn)行知識(shí)檢索時(shí),確實(shí)可以關(guān)聯(lián)到歷史和道法教材中的與語(yǔ)言文字歷史、政策相關(guān)的段落,但檢索不到語(yǔ)文課文《我愛(ài)你,漢字》中的相關(guān)段落。
目前,我們正致力于進(jìn)一步完善知識(shí)圖譜技術(shù)和大模型的結(jié)合,我們希望它未來(lái)能夠輔助的詞典編修工作包括但不限于:同一語(yǔ)義場(chǎng)內(nèi)的詞條選錄,如檢索“動(dòng)物”則出現(xiàn)教材內(nèi)的所有動(dòng)物條;輔助完善詞條編寫(xiě)的中觀結(jié)構(gòu),如檢索“九州”則應(yīng)列舉各種觀點(diǎn)下的九州詞條及其釋義;輔助詞條體例編寫(xiě)一致性的檢查,如檢索“化學(xué)元素”,則應(yīng)給出所有的化學(xué)元素字頭及釋義,通過(guò)對(duì)比查檢編寫(xiě)體例是否一致;輔助插圖選配,如檢索“植物”,則出現(xiàn)教材內(nèi)的所有植物條,并與人教選圖庫(kù)相關(guān)聯(lián),提示教材內(nèi)是否已經(jīng)選配了科學(xué)插圖;輔助學(xué)習(xí)板塊的編寫(xiě),如輸入“寫(xiě)字表”,則應(yīng)按順序列出語(yǔ)文教材識(shí)字表內(nèi)的所有漢字,并標(biāo)示在人教相關(guān)工具書(shū)中,哪些已經(jīng)提供了筆順、字理等相關(guān)信息;等等。
事實(shí)上,知識(shí)圖譜的服務(wù)目標(biāo)就是窺一斑而見(jiàn)全豹;通過(guò)知識(shí)圖譜,立足于檢索和分析的語(yǔ)料庫(kù)便如虎添翼,逐步向知識(shí)庫(kù)轉(zhuǎn)化,隨著更多數(shù)據(jù)的入庫(kù)發(fā)揮更大的作用。
五、 結(jié) 語(yǔ)
綜上所述,PEPTC對(duì)人教辭書(shū)的驅(qū)動(dòng)作用可以概括為:(1) 對(duì)教材及相關(guān)圖書(shū)中的信息進(jìn)行數(shù)據(jù)化處理和儲(chǔ)存,并通過(guò)方便友好地檢索和分析工具,輔助人教辭書(shū)提升編纂效能;(2) 使人教辭書(shū)在立項(xiàng)立目、板塊設(shè)計(jì)、釋義例證等諸多方面,更高程度地適配教材、更精準(zhǔn)地服務(wù)學(xué)生,在幫助學(xué)生查漏補(bǔ)缺、開(kāi)拓視野、提升語(yǔ)言文字運(yùn)用能力和綜合素養(yǎng)的同時(shí),也凸顯了人教辭書(shū)的品牌價(jià)值;(3) 為人教辭書(shū)未來(lái)的選題研發(fā)、圖書(shū)編寫(xiě)、數(shù)字產(chǎn)品研發(fā)提供了完整的內(nèi)容資源儲(chǔ)備,賦能教育出版新模式。
未來(lái),專門(mén)為配合圖書(shū)編寫(xiě)出版而建設(shè)的現(xiàn)代化新型語(yǔ)料庫(kù)仍有很長(zhǎng)的路要走。毛文濤(2023)將辭書(shū)編纂現(xiàn)代化的歷程概括為三個(gè)階段:第一階段是信息化階段,已經(jīng)基本完成;第二階段是數(shù)字化階段,接近完成,還將持續(xù);第三階段是智能化階段,初露端倪,即將開(kāi)啟。我們現(xiàn)在正是處于從第二階段邁向第三階段的關(guān)鍵時(shí)期,以GPT為代表的預(yù)訓(xùn)練模型應(yīng)用于辭書(shū)編寫(xiě)出版,乃至整個(gè)出版領(lǐng)域,為這個(gè)傳統(tǒng)行業(yè)帶來(lái)了新的契機(jī)。為了更好地服務(wù)垂直領(lǐng)域,包括PEPTC在內(nèi)的教材語(yǔ)料庫(kù),以及其他各類語(yǔ)料庫(kù)在未來(lái)的發(fā)展中都需要面對(duì)以下幾個(gè)重要任務(wù):
(1) 擴(kuò)充語(yǔ)料。從數(shù)字時(shí)代走向智能時(shí)代,無(wú)論是對(duì)于致力發(fā)展人工智能的科技大廠來(lái)說(shuō),還是對(duì)于數(shù)字化轉(zhuǎn)型中的傳統(tǒng)出版企業(yè)來(lái)說(shuō),標(biāo)注數(shù)據(jù)(即標(biāo)注語(yǔ)料)的質(zhì)量和規(guī)模始終是核心競(jìng)爭(zhēng)力。因此,PEPTC的一期、二期著重于基礎(chǔ)搭建,三期開(kāi)始將進(jìn)行語(yǔ)料的大批量入庫(kù)。其中,精細(xì)標(biāo)注的熟語(yǔ)料需花費(fèi)較多時(shí)間,可按需求程度排期入庫(kù),包括現(xiàn)行教材語(yǔ)料、各時(shí)期人教版教材語(yǔ)料,部分人教自主版權(quán)的教參、教輔、一般圖書(shū)等。無(wú)需精細(xì)標(biāo)注就能反映兒童和青少年語(yǔ)言特征的一般讀物,則可作為生語(yǔ)料直接入庫(kù)。
(2) 完善功能。便捷易用是語(yǔ)料庫(kù)建設(shè)和應(yīng)用之間良性循環(huán)的重要基礎(chǔ)。因此,PEPTC一是要進(jìn)一步加深服務(wù)應(yīng)用的開(kāi)發(fā),逐步實(shí)現(xiàn)配置式開(kāi)放型導(dǎo)入、英漢雙語(yǔ)對(duì)照檢索與分析、各類英漢工具書(shū)的同一檢索與個(gè)性化展現(xiàn)等;二是要進(jìn)一步增加和改進(jìn)分析工具,如增加繁簡(jiǎn)轉(zhuǎn)換、漢英互譯、音視頻轉(zhuǎn)錄等智能工具。
(3) 向知識(shí)庫(kù)轉(zhuǎn)型。如上文第四節(jié)第(五)小節(jié)所述,從數(shù)據(jù)點(diǎn)狀分布的簡(jiǎn)單語(yǔ)料庫(kù)、走向樹(shù)結(jié)構(gòu)的數(shù)據(jù)庫(kù),再走向圖結(jié)構(gòu)的知識(shí)庫(kù),是語(yǔ)言資源建設(shè)的大勢(shì)所趨。利用知識(shí)圖譜和預(yù)訓(xùn)練模型,構(gòu)建教材知識(shí)庫(kù),不僅能助益?zhèn)鹘y(tǒng)紙質(zhì)辭書(shū)、教材等的編寫(xiě),更打破了系統(tǒng)內(nèi)部的信息孤島、促進(jìn)數(shù)據(jù)的互聯(lián)互通,激發(fā)和提升數(shù)據(jù)資源的應(yīng)用價(jià)值。
附 注
[1] 人民教育出版社,以下簡(jiǎn)稱“人教社”;人民教育出版社所出版的圖書(shū)產(chǎn)品,以下簡(jiǎn)稱“人教……”。
[2] http://nclds.xmu.edu.cn/default。該語(yǔ)料庫(kù)說(shuō)明中,將語(yǔ)料來(lái)源分為國(guó)內(nèi)對(duì)外漢語(yǔ)教材、中小學(xué)語(yǔ)文教材、現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)、現(xiàn)代漢語(yǔ)分類詞典、學(xué)科教材語(yǔ)料庫(kù),對(duì)于教材類語(yǔ)料只說(shuō)明了學(xué)段、出版/初審時(shí)間,并未說(shuō)明具體冊(cè)次。且“詞典”類語(yǔ)料顯示“無(wú)統(tǒng)計(jì)數(shù)據(jù)”,因而無(wú)法計(jì)算各類語(yǔ)料的占比。
[3] 由于本文討論漢語(yǔ)學(xué)生工具書(shū)的編寫(xiě),以下內(nèi)容均只圍繞PEPTC的漢語(yǔ)子庫(kù)展開(kāi)。
[4] 截至本文寫(xiě)作完成時(shí),古漢語(yǔ)的自動(dòng)分詞技術(shù)仍有很大的提升空間,所以目前的PEPTC的古漢語(yǔ)分詞結(jié)果仍需改善。
[5] 以上例句均來(lái)自中國(guó)教育學(xué)會(huì)2023年度課堂教學(xué)展示與觀摩(培訓(xùn))系列活動(dòng)教學(xué)現(xiàn)場(chǎng)。[6] https://blog.google/products/search/introducing-knowledge-graph-things-not。
參考文獻(xiàn)
1. 黃昌寧,李涓子.語(yǔ)料庫(kù)語(yǔ)言學(xué).北京:商務(wù)印書(shū)館,2002.
2. 黃水清,王東波.國(guó)內(nèi)語(yǔ)料庫(kù)研究綜述.信息資源管理學(xué)報(bào),2021,11(3):4-17,87.
3. 劉華.語(yǔ)料庫(kù)語(yǔ)言學(xué)——理論、工具與案例.北京:外語(yǔ)教學(xué)與研究出版社,2020.
4. 劉嶠,李楊,段宏,等.知識(shí)圖譜構(gòu)建技術(shù)綜述.計(jì)算機(jī)研究與發(fā)展,2016,53(3):582-600.
5. 羅慶銘. 教材語(yǔ)料庫(kù)的建構(gòu)與應(yīng)用:以新加坡小學(xué)華文教材為例. 北京:中國(guó)社會(huì)科學(xué)出版社,2017.
6. 呂海春.中國(guó)辭書(shū)數(shù)字化發(fā)展三十年. 語(yǔ)言戰(zhàn)略研究,2023,8(5):85-96.
7. 毛文濤. 從《辭海》到“聚典數(shù)據(jù)開(kāi)放平臺(tái)”. //第十三屆中國(guó)數(shù)字出版博覽會(huì),2023.
8. 錢(qián)小飛. 語(yǔ)言數(shù)據(jù)資源建設(shè)中的關(guān)鍵問(wèn)題及對(duì)策. 語(yǔ)料庫(kù)語(yǔ)言學(xué),2021,8(2):94-105.
9. 人民教育出版社辭書(shū)研究中心,北京大學(xué)中文系現(xiàn)代漢語(yǔ)教研室,北京大學(xué)中文系古代漢語(yǔ)教研室編.新編學(xué)生詞典.北京:人民教育出版社,2020.
10. 孫仕光. 語(yǔ)料庫(kù)數(shù)據(jù)性質(zhì)面面觀. 語(yǔ)料庫(kù)語(yǔ)言學(xué),2020,7(1):44-56,114.
11. 詹衛(wèi)東. 近30年來(lái)中文語(yǔ)言知識(shí)資源發(fā)展及應(yīng)用.語(yǔ)言戰(zhàn)略研究,2018,3(4):58-69.
12. 詹衛(wèi)東,郭銳,常寶寶,等. 北京大學(xué)CCL語(yǔ)料庫(kù)的研制.語(yǔ)料庫(kù)語(yǔ)言學(xué),2019,6(1):71-86,116.
13. 張柏然. 語(yǔ)言資料庫(kù)與雙語(yǔ)詞典編纂.辭書(shū)研究,1995(1):2-10.
14. 張永偉,吳冰欣. 基于網(wǎng)絡(luò)的第四代語(yǔ)料庫(kù)分析工具核心功能評(píng)介.當(dāng)代語(yǔ)言學(xué),2023,25(4):611-624.
15. 中國(guó)社會(huì)科學(xué)院語(yǔ)言研究所詞典編輯室編.現(xiàn)代漢語(yǔ)詞典(第7版).北京:商務(wù)印書(shū)館,2021.
16. 中華人民共和國(guó)教育部制定.義務(wù)教育語(yǔ)文課程標(biāo)準(zhǔn)(2022年版).北京:北京師范大學(xué)出版社,2022.
17. Rundell M,夏立新,朱冬生.語(yǔ)料庫(kù)詞典學(xué)的最新發(fā)展和未來(lái)趨勢(shì)(上)——語(yǔ)料庫(kù)數(shù)據(jù)在學(xué)習(xí)詞典中的顯性應(yīng)用.辭書(shū)研究,2009a(3):71-78.
18. Rundell M,夏立新,朱冬生.語(yǔ)料庫(kù)詞典學(xué)的最新發(fā)展和未來(lái)趨勢(shì)(下)——語(yǔ)料庫(kù)數(shù)據(jù)在學(xué)習(xí)詞典中的顯性應(yīng)用.辭書(shū)研究,2009b(4):81-91.
(人民教育出版社課程教材研究所 北京 100081)
(責(zé)任編輯 劉 博)