国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

學(xué)科融合視域下醫(yī)學(xué)漢語學(xué)術(shù)詞表的構(gòu)建*

2023-06-12 08:35:16袁亮杰王治敏
關(guān)鍵詞:詞表預(yù)科覆蓋率

錢 隆, 袁亮杰, 王治敏

(北京語言大學(xué) 國際中文教育研究院,北京 100083)

一、引 言

學(xué)科融合是一種跨學(xué)科的思維方式和方法,旨在將不同學(xué)科領(lǐng)域的知識(shí)、理論、技術(shù)和方法有機(jī)地結(jié)合起來,以解決現(xiàn)實(shí)世界中的復(fù)雜問題。隨著中資企業(yè)對(duì)外投資業(yè)務(wù)的不斷擴(kuò)大,國際中文教育與職業(yè)領(lǐng)域的融合發(fā)展已成為豐富國際中文教育學(xué)科內(nèi)涵、探索教育改革創(chuàng)新的新方向。專業(yè)是學(xué)科的基礎(chǔ),(1)馮向東.學(xué)科、專業(yè)建設(shè)與人才培養(yǎng)[J].高等教育研究,2002,(3).做強(qiáng)學(xué)科的前提首先是要做好專業(yè)。就醫(yī)學(xué)專業(yè)而言,2018年,中國接收醫(yī)學(xué)專業(yè)(2)這里的醫(yī)學(xué)教育包含西醫(yī)和中醫(yī)兩個(gè)學(xué)科。的來華學(xué)歷留學(xué)生共61883名,占學(xué)歷生總?cè)藬?shù)的23.97%;接收本科留學(xué)生人數(shù)最多的前50所高校中,有11所是醫(yī)科大學(xué)。(3)教育部.2018來華留學(xué)生簡明統(tǒng)計(jì)[M].北京:教育部國際合作與交流司,2018.可見,我國已經(jīng)培養(yǎng)了大量的醫(yī)學(xué)留學(xué)專業(yè)人才。雖然我國在來華留學(xué)生醫(yī)學(xué)學(xué)歷培養(yǎng)上取得了突出的成就,但醫(yī)學(xué)漢語研究起步晚,規(guī)模小,(4)張悅,李莉,崔濤.基于中國知網(wǎng)的近20年我國來華留學(xué)生醫(yī)學(xué)漢語研究現(xiàn)狀分析[J].中國繼續(xù)醫(yī)學(xué)教育,2023,(2).中文專業(yè)和醫(yī)學(xué)專業(yè)、預(yù)科教育和本科教育缺少一定的銜接,導(dǎo)致現(xiàn)有的國際中文教育資源不能滿足醫(yī)學(xué)專業(yè)留學(xué)生的中文教學(xué)和學(xué)習(xí)。中文專業(yè)和醫(yī)學(xué)專業(yè)的融合發(fā)展已經(jīng)成為必然趨勢,這也是學(xué)科發(fā)展的必然選擇,針對(duì)外籍學(xué)生的醫(yī)學(xué)教育亟須提供通用漢語與專業(yè)漢語資源的有效銜接。因此,本研究構(gòu)建了醫(yī)學(xué)漢語學(xué)術(shù)詞表(Medical Chinese Academic Vocabulary List,簡稱MCAVL)以服務(wù)于醫(yī)學(xué)專業(yè)留學(xué)生的中文教學(xué)和學(xué)習(xí)。

學(xué)術(shù)詞表是對(duì)一般通用詞表的擴(kuò)展,通過強(qiáng)調(diào)在各類學(xué)術(shù)文本中經(jīng)常出現(xiàn)的詞匯,能夠向?qū)W習(xí)者直接展示學(xué)習(xí)目標(biāo)。毫無疑問,學(xué)術(shù)詞表提高了學(xué)術(shù)詞匯的學(xué)習(xí)效率,可以減輕學(xué)習(xí)者的學(xué)習(xí)負(fù)擔(dān),能極大地滿足學(xué)術(shù)詞匯教學(xué)和學(xué)習(xí)的需要。(5)Nation ISP.Learning Vocabulary in Another Language[M].Cambridge:Cambridge University Press,2001.

目前,英語學(xué)術(shù)詞表研究已有相當(dāng)豐富的研究成果。(6)劉迪麟,雷蕾.學(xué)術(shù)詞表研究綜述[J].外語教學(xué),2020,(2).最具代表性和影響力的學(xué)術(shù)英語詞表,一個(gè)是Coxhead開發(fā)的學(xué)術(shù)單詞表(Academic Word List,簡稱AWL),另一個(gè)是Gardner和Davies創(chuàng)建的學(xué)術(shù)詞匯表(7)Gardner D,Davies M,A new academic vocabulary list[J].Applied Linguistics,2014,(3).(Academic Vocabulary List,簡稱AVL)。學(xué)者們借鑒AWL和AVL的編制方法又陸續(xù)開發(fā)了各學(xué)科的學(xué)術(shù)英語詞表,如:醫(yī)學(xué)英語學(xué)術(shù)詞表(8)Wang J,Liang S,Ge G.Establishment of a medical academic word list.English for Specific Purposes[J],2008,(4).、化學(xué)英語學(xué)術(shù)詞表(9)Valipouri L,Nassaji H.A corpus-based study of academic vocabulary in chemistry research articles[J].Journal of English for Academic Purposes,2013,(4).、護(hù)理學(xué)英語學(xué)術(shù)詞表(10)Yang M.A nursing academic word list[J].English for specific purposes,2015,(37).、環(huán)境科學(xué)英語學(xué)術(shù)詞表(11)Liu J,Han L.A corpus-based environmental academic word list building and its validity test[J].English for Specific Purposes,2014,(39).等。漢語學(xué)術(shù)詞表的開發(fā)和研究目前尚處于起步階段,相關(guān)研究成果較少,目前僅見薛蕾開發(fā)的漢語語言學(xué)學(xué)術(shù)詞表(12)薛蕾.基于漢語語言學(xué)論文語料庫的學(xué)術(shù)漢語詞匯析取及特征研究[D].云南師范大學(xué)碩士學(xué)位論文,2017.、朱明玉構(gòu)建的通用領(lǐng)域?qū)W術(shù)詞表(13)朱明玉.通用學(xué)術(shù)漢語詞表研究[D].云南大學(xué)碩士學(xué)位論文,2020.、王笑然和王佶旻開發(fā)的經(jīng)貿(mào)類本科專業(yè)學(xué)術(shù)漢語詞表(14)王笑然,王佶旻.經(jīng)貿(mào)類本科專業(yè)學(xué)術(shù)漢語詞表研究[J].語言教學(xué)與研究,2022,(4).等。而在醫(yī)學(xué)領(lǐng)域,暫未發(fā)現(xiàn)有研究者開發(fā)醫(yī)學(xué)漢語學(xué)術(shù)詞表。教育部中外語言交流合作中心曾在2020年開發(fā)了醫(yī)學(xué)漢語水平考試(Medical Chinese Test,簡稱MCT)大綱,該大綱提供了1500個(gè)醫(yī)學(xué)漢語專業(yè)詞匯。不過MCT大綱詞表收錄了很多醫(yī)學(xué)專業(yè)詞匯,并不是一份服務(wù)于醫(yī)學(xué)學(xué)術(shù)教學(xué)的詞表。積累學(xué)術(shù)詞匯是攻讀學(xué)位的學(xué)習(xí)者面臨的一個(gè)主要挑戰(zhàn),(15)Evans S,Green C.Why EAP is necessary:A survey of Hong Kong tertiary students[J].Journal of English for Academic Purposes,2007,(1);Durrant P.To what extent is the Academic Vocabulary List relevant to university student writing?[J].English for specific purposes,2016,(43).因而醫(yī)學(xué)漢語學(xué)術(shù)詞表的缺失將不利于醫(yī)學(xué)學(xué)術(shù)詞匯的教學(xué),也不利于醫(yī)學(xué)漢語教材的編寫,在一定程度上會(huì)影響學(xué)生的學(xué)術(shù)學(xué)習(xí)和訓(xùn)練。

漢語學(xué)術(shù)詞表的開發(fā)主要是為了銜接預(yù)科教育和本科教育這兩個(gè)階段。進(jìn)入醫(yī)學(xué)本科專業(yè)學(xué)習(xí)的留學(xué)生通常不熟悉醫(yī)學(xué)專業(yè)的學(xué)術(shù)詞匯,聽課、聽報(bào)告、讀文獻(xiàn)和寫論文都會(huì)遇到問題,現(xiàn)有的預(yù)科生醫(yī)學(xué)漢語教材對(duì)醫(yī)學(xué)本科基礎(chǔ)教材的詞匯銜接度較低,不能滿足醫(yī)學(xué)漢語教學(xué)和學(xué)習(xí)的需要。(16)陳蒙,甄珍.來華預(yù)科生醫(yī)學(xué)漢語教材與本科生醫(yī)學(xué)專業(yè)教材的詞匯銜接度研究[J].醫(yī)學(xué)教育研究與實(shí)踐,2023,(2).并且醫(yī)學(xué)留學(xué)生大都來自發(fā)展中國家,學(xué)生的總體素質(zhì)有待提高,這就給醫(yī)學(xué)漢語教學(xué)帶來更大的困難。(17)姜安.論醫(yī)學(xué)專業(yè)留學(xué)生的醫(yī)學(xué)漢語教學(xué)[J].現(xiàn)代醫(yī)藥衛(wèi)生,2009,(20).因此,本研究的目標(biāo)是開發(fā)醫(yī)學(xué)漢語學(xué)術(shù)詞表,服務(wù)于醫(yī)學(xué)專業(yè)的預(yù)科留學(xué)生和本科留學(xué)生,用于銜接預(yù)科教育和本科教育這兩個(gè)階段。

本研究擬回答以下問題:(1)構(gòu)建的MCAVL可以覆蓋多少醫(yī)學(xué)學(xué)術(shù)文本?(2)MCAVL與MCT大綱詞表有哪些差異?

二、研究設(shè)計(jì)

(一)構(gòu)建醫(yī)學(xué)漢語學(xué)術(shù)語料庫

學(xué)術(shù)詞表的構(gòu)建通常需要借助大規(guī)模文本語料庫來完成。語料庫可以反映出詞表中詞匯的頻數(shù)和覆蓋情況,(18)Nation ISP.Learning Vocabulary in Another Language[M].Cambridge:Cambridge University Press,2001.因此本文采用語料庫驅(qū)動(dòng)的研究方法,(19)衛(wèi)乃興.基于語料庫和語料庫驅(qū)動(dòng)的詞語搭配研究[J].當(dāng)代語言學(xué),2002,(2).通過自建醫(yī)學(xué)漢語學(xué)術(shù)語料庫(Medical Chinese Academic Corpus,簡稱MCAC)來開發(fā)MCAVL。

學(xué)術(shù)語料庫中的語料一般采集自學(xué)科專業(yè)教材和學(xué)術(shù)期刊論文。(20)Coxhead A.A new academic word list[J].TESOL Quarterly,2000,(2).為確保語料庫設(shè)計(jì)更具科學(xué)性,我們兼顧語料的代表性和典型性等原則來選取語料。(21)郭曙綸.漢語語料庫應(yīng)用教程[M].上海:上海交通大學(xué)出版社,2013.根據(jù)MCAVL的構(gòu)建目標(biāo),本研究調(diào)查了中國大陸地區(qū)6所代表性的醫(yī)學(xué)院提供的本科生培養(yǎng)計(jì)劃和培養(yǎng)方案,統(tǒng)計(jì)了各個(gè)院校開設(shè)的醫(yī)學(xué)專業(yè)及其專業(yè)課程,將這些課程使用的教材作為MCAC的教材語料。據(jù)此,我們收集了82本醫(yī)學(xué)教材,全部由人民衛(wèi)生出版社出版。根據(jù)醫(yī)學(xué)一級(jí)學(xué)科的劃分以及醫(yī)學(xué)專家的建議,將82本醫(yī)學(xué)教材歸入8個(gè)子庫,分別是基礎(chǔ)醫(yī)學(xué)庫、臨床醫(yī)學(xué)庫、口腔醫(yī)學(xué)庫、公共衛(wèi)生與預(yù)防醫(yī)學(xué)庫、中醫(yī)學(xué)庫、藥學(xué)庫、醫(yī)學(xué)技術(shù)庫和護(hù)理學(xué)庫。考慮到接受醫(yī)學(xué)教育的留學(xué)生除了要學(xué)習(xí)專業(yè)教材外,還需要閱讀學(xué)術(shù)期刊論文,因此本文還收集了醫(yī)學(xué)期刊論文作為MCAC的期刊論文語料。語料選自2011年至2020年被北京大學(xué)中文核心期刊目錄收錄的22種醫(yī)學(xué)期刊,每種期刊每年隨機(jī)采集兩篇文章,據(jù)此我們收集了440篇醫(yī)學(xué)期刊論文,論文全部歸入期刊子庫。

語料采集完畢后,對(duì)語料進(jìn)行了清洗,刪除了作者信息、基金項(xiàng)目、圖表、注釋、參考文獻(xiàn)等冗余信息。清洗結(jié)束后,使用教育部語言文字應(yīng)用研究所提供的漢語分詞和詞性標(biāo)注系統(tǒng)CorpusWordParser進(jìn)行了機(jī)器自動(dòng)分詞,并進(jìn)行人工校對(duì)以修正部分錯(cuò)誤。最終,我們構(gòu)建的MCAC包含9個(gè)子庫、29594872個(gè)字、18763879個(gè)詞例(word tokens)、67328個(gè)詞型(word types)。語料庫詳細(xì)信息見表1。

表1 MCAC詳細(xì)信息

(二)醫(yī)學(xué)漢語學(xué)術(shù)詞表的構(gòu)建維度

編制學(xué)術(shù)詞表前,通常需要確定選詞標(biāo)準(zhǔn)。詞表中的學(xué)術(shù)詞匯必須用系統(tǒng)、嚴(yán)格的選詞標(biāo)準(zhǔn)來提取,(22)Lei L,Liu D.A new medical academic word list:A corpus-based study with enhanced methodology[J].Journal of English for Academic Purposes,2016,22.Coxhead曾使用高頻性、專業(yè)性和廣泛分布性3個(gè)原則來編制AWL。(23)Coxhead A.A new academic word list[J].TESOL Quarterly,2000,(2).Gardner和Davies在編制AVL時(shí),則確定了專業(yè)性、廣泛分布性、均勻分布性和學(xué)科指數(shù)四個(gè)標(biāo)準(zhǔn)。(24)Gardner D,Davies M,A new academic vocabulary list[J].Applied Linguistics,2014,(3).這兩份詞表的選詞標(biāo)準(zhǔn)都受到了一些質(zhì)疑。首先Coxhead在專業(yè)性選詞時(shí),刪除了全部的高頻詞匯,(25)Coxhead A.A new academic word list[J].TESOL Quarterly,2000,(2).研究發(fā)現(xiàn)通用詞匯和學(xué)術(shù)詞匯之間并沒有明晰的界限,高頻詞匯可能是學(xué)術(shù)詞匯,學(xué)術(shù)詞匯也可能是高頻詞匯,開發(fā)學(xué)術(shù)詞表時(shí)沒有必要排除所有的高頻詞。(26)劉迪麟,雷蕾.學(xué)術(shù)詞表研究綜述[J].外語教學(xué),2020,(2).其次,Gardner和Davies在提取學(xué)術(shù)詞匯時(shí),沒有使用高頻性選詞標(biāo)準(zhǔn),(27)Gardner D,Davies M,A new academic vocabulary list[J].Applied Linguistics,2014,(3).這使得AVL收錄了更多的低頻詞。為了規(guī)避以上問題,本研究選擇了以下6個(gè)標(biāo)準(zhǔn)來提取醫(yī)學(xué)漢語學(xué)術(shù)詞匯。

1. 高頻性

詞頻是判斷詞匯是否常用的重要指標(biāo)。詞的出現(xiàn)頻率越高,說明詞越常用,在詞表中位置越靠前。(28)崔維霞,王均松.基于語料庫的詞表創(chuàng)建原則及方法研究[J].中國科技術(shù)語,2013,(2).依據(jù)齊普夫定律(Zipf’s Law),可以幫助學(xué)習(xí)者提取性價(jià)比最高的學(xué)術(shù)詞匯來減輕學(xué)習(xí)負(fù)擔(dān)。二語學(xué)習(xí)者通常需要掌握文本中95%~98%的詞匯才可以較好地理解文章的內(nèi)容。(29)Nation ISP.Learning Vocabulary in Another Language[M].Cambridge:Cambridge University Press,2001.因此我們?cè)O(shè)定95%的覆蓋率來確定最低詞頻。在MCAC中,當(dāng)詞頻設(shè)定為200時(shí),6968個(gè)詞型覆蓋了17827227個(gè)詞例,即10.35%的詞型覆蓋了95.01%的詞例,詞匯的抽取效果較好。因此,詞頻在MCAC中大于或等于200的詞語才可以入選MCAVL。

2. 專業(yè)性

設(shè)定專業(yè)性選詞標(biāo)準(zhǔn)是為了將學(xué)術(shù)文本中經(jīng)常出現(xiàn)的詞匯提取出來并區(qū)別于通用詞匯。Coxhead在編制AWL時(shí)去除了2000個(gè)通用詞族;(30)Coxhead A.A new academic word list[J].TESOL Quarterly,2000,(2).Gardner和Davies則使用了頻率比標(biāo)準(zhǔn),確定詞在學(xué)術(shù)文本和非學(xué)術(shù)文本中的頻率比來選取學(xué)術(shù)詞匯。(31)Gardner D,Davies M,A new academic vocabulary list[J].Applied Linguistics,2014,(3).考慮到Coxhead研究的不足,本研究選擇了頻率比標(biāo)準(zhǔn)來提取醫(yī)學(xué)漢語學(xué)術(shù)詞匯。首先將北京語言大學(xué)語料庫中心(BLCU Corpus Center,簡稱BCC)的文學(xué)庫、新聞庫和微博庫合并為非學(xué)術(shù)文本語料庫,然后計(jì)算預(yù)收錄詞在MCAC中的出現(xiàn)頻率與其在BCC非學(xué)術(shù)文本語料庫中出現(xiàn)頻率的比值。若頻率比大于1,表示該詞在MCAC中的頻率更大,在醫(yī)學(xué)學(xué)術(shù)文本中出現(xiàn)頻次更高;反之,則表明該詞在非學(xué)術(shù)文本中出現(xiàn)的頻次更高。最后,對(duì)頻率比設(shè)定在1到6的范圍內(nèi)進(jìn)行反復(fù)試驗(yàn)來確定合適的頻率比。為了區(qū)分學(xué)術(shù)詞匯和通用詞匯,本研究將《中國政府獎(jiǎng)學(xué)金本科生來華留學(xué)生預(yù)科基礎(chǔ)教育結(jié)業(yè)考試·基礎(chǔ)漢語常用詞匯表》(簡稱:預(yù)科基礎(chǔ)詞表)作為通用詞表進(jìn)行參考,該詞表包含3000個(gè)漢語基礎(chǔ)常用詞匯。結(jié)合預(yù)科基礎(chǔ)詞表設(shè)定不同的頻率比來提取醫(yī)學(xué)學(xué)術(shù)詞匯。

試驗(yàn)發(fā)現(xiàn),當(dāng)頻率比設(shè)定為1.2時(shí),如“家庭”(頻率比:1.24)、“或者”(頻率比:1.34)等通用詞就會(huì)被收錄至MCAVL;如果設(shè)定得太高,頻率比為2時(shí),如“老化”(頻率比:1.93)、“研制”(頻率比:1.89)等醫(yī)學(xué)核心學(xué)術(shù)詞匯就會(huì)被排除出MCAVL。因此,預(yù)收錄詞如果沒有出現(xiàn)在預(yù)科基礎(chǔ)詞表中,頻率比設(shè)定為1.5最為理想。但是,如果預(yù)收錄詞出現(xiàn)在預(yù)科基礎(chǔ)詞表中,頻率比設(shè)定為1.5則過低,如“主動(dòng)”(頻率比:1.51)、“練習(xí)”(頻率比:2.16)、“可能”(頻率比:2.59)等通用詞就會(huì)被MCAVL收錄,且收錄這些詞不利于突出學(xué)術(shù)詞表的專業(yè)性。因此,MCAVL中的詞如果出現(xiàn)在預(yù)科基礎(chǔ)詞表中,頻率比達(dá)到3才能入選。通過該標(biāo)準(zhǔn),我們從6968個(gè)詞型中抽取出4255個(gè)符合專業(yè)性標(biāo)準(zhǔn)的詞型。

3. 廣泛分布性

僅依靠詞頻的高低來提取詞匯有很大的片面性,詞表創(chuàng)建過程中還需考慮到詞語的分布。Coxhead規(guī)定入選AWL的詞要在人文、商業(yè)、法律、科學(xué)4個(gè)學(xué)科和28個(gè)子學(xué)科領(lǐng)域的15個(gè)或更多領(lǐng)域中至少出現(xiàn)10次。(32)Coxhead A.A new academic word list[J].TESOL Quarterly,2000,(2).Gardner和Davies則規(guī)定入選AVL的詞在9個(gè)學(xué)科中至少出現(xiàn)在其中的7個(gè)學(xué)科中,且每個(gè)學(xué)科中出現(xiàn)的頻次(每百萬)至少為20%的數(shù)學(xué)期望。(33)Gardner D,Davies M,A new academic vocabulary list[J].Applied Linguistics,2014,(3).綜合來看,Gardner和Davies設(shè)置的詞在各個(gè)子庫出現(xiàn)的下限值由子庫規(guī)模決定,因此廣泛分布性標(biāo)準(zhǔn)更好。參照該標(biāo)準(zhǔn),我們?cè)贛CAC的9個(gè)子庫中進(jìn)行反復(fù)的實(shí)驗(yàn),最終,本研究規(guī)定入選MCAVL的詞至少需要在MCAC的6個(gè)子庫中出現(xiàn),且在每個(gè)子庫中的出現(xiàn)頻次(每百萬)至少為20%的數(shù)學(xué)期望。據(jù)此,我們從4255個(gè)詞型中抽取出3402個(gè)符合廣泛分布性標(biāo)準(zhǔn)的詞型。

4. 均勻分布性

收錄詞表的詞語還需要考慮在語料庫的各個(gè)子庫中是否均勻分布。某些高頻詞可能廣泛分布于語料庫的各個(gè)子庫,但其在各個(gè)子庫出現(xiàn)的頻率可能是不均勻的。依據(jù)本詞表的構(gòu)建目標(biāo),MCAVL中的詞應(yīng)較為均勻地分布在MCAC的各個(gè)子庫中。為了實(shí)現(xiàn)這一目標(biāo),我們?cè)谠~匯抽取時(shí)選擇了Julliand’s D值(34)Julliand A,Chang-Rodriguez E.Frequency Dictionary of Spanish Words[M].The Hague:Mouton,1994.作為均勻分布的計(jì)算指標(biāo)。詞表構(gòu)建時(shí),D值設(shè)定沒有統(tǒng)一的標(biāo)準(zhǔn),所以我們對(duì)D值設(shè)定在0.3到0.8的區(qū)間內(nèi)進(jìn)行試驗(yàn)。試驗(yàn)發(fā)現(xiàn),如果D值設(shè)定得太高,如設(shè)在0.8,那么“器官”(D值:0.75)、“粘膜”(D值:0.69)等常用醫(yī)學(xué)學(xué)術(shù)詞匯就會(huì)被排除出MCAVL;D值設(shè)定得太低,如低于0.6,詞表的均勻分布性就無法保證,如“精子”這個(gè)詞,D值為0.51,其在基礎(chǔ)醫(yī)學(xué)庫的出現(xiàn)頻次(每百萬)是口腔醫(yī)學(xué)庫的143倍,數(shù)據(jù)表明該詞的分布是不均勻的。我們規(guī)定Julliand’s D值達(dá)到0.6及以上的詞語才能入選MCAVL。通過該標(biāo)準(zhǔn),本研究從3402個(gè)詞型中刪除了925個(gè)詞型,保留了2477個(gè)詞型。

5. 學(xué)科指數(shù)

Gardner和Davies在提取學(xué)術(shù)詞匯時(shí)還選用了學(xué)科指數(shù)標(biāo)準(zhǔn),即收錄AVL的詞在9個(gè)學(xué)科的任何一個(gè)學(xué)科中的頻次(每百萬)不能超過其子庫數(shù)學(xué)期望的3倍。(35)Gardner D,Davies M,A new academic vocabulary list[J].Applied Linguistics,2014,(3).這條標(biāo)準(zhǔn)可以有效保證預(yù)收錄詞不會(huì)只在某一個(gè)學(xué)科領(lǐng)域高頻出現(xiàn)。本研究也考慮了該選詞標(biāo)準(zhǔn),我們對(duì)學(xué)科指數(shù)設(shè)定在2到4的區(qū)間內(nèi)進(jìn)行試驗(yàn)。試驗(yàn)發(fā)現(xiàn),學(xué)科指數(shù)設(shè)定為3時(shí),效果最好,不會(huì)去除過多的學(xué)術(shù)詞匯,也可以保證詞不會(huì)只高頻出現(xiàn)在某一子庫。我們規(guī)定學(xué)科指數(shù)不超過其子庫數(shù)學(xué)期望3倍的詞語才能入選MCAVL。以“宮縮”為例,該詞在護(hù)理學(xué)子庫的出現(xiàn)頻次(每百萬)是330.169次,在護(hù)理學(xué)子庫的數(shù)學(xué)期望為72.861次,實(shí)際頻次(每百萬)是數(shù)學(xué)期望的4.532倍,超過了3??梢?“宮縮”更常見于護(hù)理學(xué)領(lǐng)域,其在護(hù)理學(xué)領(lǐng)域更加突出,不符合MCAVL的構(gòu)建目標(biāo),故予以剔除。最終,從2477個(gè)詞型中抽取出2019個(gè)符合學(xué)科指數(shù)標(biāo)準(zhǔn)的詞型。

6. 人工校對(duì)

完成以上步驟之后,我們根據(jù)實(shí)際需要還進(jìn)行了人工校對(duì)。校對(duì)的主要內(nèi)容為判斷詞表中的每一項(xiàng)詞條是語素、詞、固定短語還是非固定短語?,F(xiàn)代漢語詞匯應(yīng)該包括詞和固定短語兩類。(36)黃伯榮,廖序東.現(xiàn)代漢語(增訂六版,下冊(cè))[M].北京:高等教育出版社,2017.為了體現(xiàn)MCAVL的專業(yè)性和有效性,本研究規(guī)定入選MCAVL的只能是詞、固定短語和醫(yī)學(xué)常用短語,語素和非醫(yī)學(xué)短語不能入選MCAVL。我們從2019個(gè)詞型中刪除了319個(gè)語素和非醫(yī)學(xué)短語,如“泌”“脊”“十年”等,并保留了“用于”“心力衰竭”“動(dòng)脈硬化”等固定短語和醫(yī)學(xué)常用短語。

人工校對(duì)結(jié)束后,我們最終得到了一個(gè)包含1700個(gè)詞型的MCAVL。為了提高醫(yī)學(xué)漢語學(xué)術(shù)詞匯的教學(xué)和學(xué)習(xí)效果,對(duì)MCAVL進(jìn)行了進(jìn)一步分級(jí),詞匯的分級(jí)依據(jù)主要是覆蓋水平,分級(jí)詳情見表2。

表2 MCAVL的分級(jí)情況

分級(jí)前將每個(gè)詞按詞頻大小進(jìn)行排列,詞頻最大的“細(xì)胞”排第1位,詞頻最小的“嗜血”排第1700位。然后按照6:3:1的覆蓋水平對(duì)MCAVL中的詞匯進(jìn)行分級(jí)。其中排序前255的詞占MCAVL總覆蓋水平的60.27%,這些詞歸入一級(jí)詞表;排序256至880的625個(gè)詞占總覆蓋水平的30.48%,這些詞歸入二級(jí)詞表;其余的820個(gè)詞占總覆蓋水平的9.25%,這些詞歸入三級(jí)詞表。分級(jí)后,我們?yōu)閷W(xué)習(xí)者和教師展示了醫(yī)學(xué)漢語學(xué)術(shù)領(lǐng)域的高頻詞、中頻詞和低頻詞。為了達(dá)到最好的學(xué)習(xí)效果,學(xué)習(xí)者應(yīng)當(dāng)依次由一級(jí)到三級(jí)學(xué)習(xí)MCAVL。

三、結(jié)果與討論

(一)MCAVL的覆蓋水平

為了回答前文提出的問題“構(gòu)建的MCAVL可以覆蓋多少醫(yī)學(xué)學(xué)術(shù)文本?”并檢驗(yàn)詞表的有效性,我們計(jì)算了MCAVL對(duì)MCAC的詞匯覆蓋率,見表3。

表3 MCAVL及其處理詞表對(duì)MCAC的覆蓋水平

一般來說,學(xué)術(shù)詞表對(duì)學(xué)術(shù)文本的覆蓋率集中在10%左右。(37)Nation ISP.Learning Vocabulary in Another Language[M].Cambridge:Cambridge University Press,2001.MCAVL的1700個(gè)詞型覆蓋了MCAC中5453059個(gè)詞例,覆蓋率為29.06%,覆蓋效果良好。MCAVL覆蓋率高出約19%可能是因?yàn)楸驹~表沒有像AWL那樣去除所有的通用詞匯。為了進(jìn)行更好的對(duì)比,去除MCAVL中與預(yù)科基礎(chǔ)詞表重復(fù)的詞,再進(jìn)行詞匯覆蓋率計(jì)算。去除后,MCAVL包含1498個(gè)詞型,覆蓋了MCAC中3621614個(gè)詞例,覆蓋率為19.30%。與其他學(xué)術(shù)詞表相比,MCAVL的覆蓋率依然高出約10%,說明本研究提取的學(xué)術(shù)詞匯有較好的專業(yè)性。除此之外,我們還計(jì)算了MCAVL與預(yù)科基礎(chǔ)詞表結(jié)合后的詞匯覆蓋率。兩詞表結(jié)合后,包含4469個(gè)詞型,覆蓋了MCAC中13988633個(gè)詞例,覆蓋率為74.55%。這說明學(xué)習(xí)者學(xué)習(xí)了預(yù)科基礎(chǔ)詞表和MCAVL后,就可以理解醫(yī)學(xué)學(xué)術(shù)文本中大約四分之三的詞匯。

為了調(diào)查MCAVL是否是一份真正的學(xué)術(shù)詞表而非通用詞表或其他語體詞表,我們將MCAVL分別置于BCC的各個(gè)子庫中進(jìn)行詞匯覆蓋率計(jì)算,結(jié)果見表4。

表4 MCAVL對(duì)BCC的覆蓋水平

由表4可知,MCAVL對(duì)BCC學(xué)術(shù)子庫的覆蓋率最高,達(dá)到了12.59%;其對(duì)BCC新聞子庫的覆蓋率為4%,覆蓋水平不足學(xué)術(shù)子庫的三分之一;對(duì)文學(xué)和微博子庫的覆蓋率更低,均不足2%??梢奙CAVL具有較好的學(xué)術(shù)代表性,并不是通用詞表或其他領(lǐng)域詞表。值得注意的是,MCAVL對(duì)BCC學(xué)術(shù)子庫的覆蓋率要比MCAC的覆蓋率(29.06%)低,二者的覆蓋率相差近17%。這是因?yàn)锽CC學(xué)術(shù)子庫收錄的語料除了醫(yī)學(xué)學(xué)術(shù)文本外,還包括其他學(xué)科的學(xué)術(shù)文本。這也表明醫(yī)學(xué)學(xué)術(shù)詞匯和通用學(xué)術(shù)詞匯之間存在明顯差異。

為了考察MCAVL是否在各醫(yī)學(xué)學(xué)科中存在差異,我們調(diào)查了MCAVL在MCAC各個(gè)子庫的覆蓋情況,結(jié)果見表5。

表5 MCAVL對(duì)MCAC各個(gè)子庫的覆蓋水平

由表5可知,MCAVL對(duì)臨床醫(yī)學(xué)庫、基礎(chǔ)醫(yī)學(xué)庫、護(hù)理學(xué)庫和藥學(xué)庫的覆蓋率都超過了30%,覆蓋水平良好,詞表可以在這些醫(yī)學(xué)領(lǐng)域的學(xué)術(shù)漢語教學(xué)和學(xué)習(xí)中發(fā)揮較好的作用。Gardner和Davies發(fā)現(xiàn)通用學(xué)術(shù)詞匯在各專業(yè)各學(xué)科的分布其實(shí)并不均衡,(38)Gardner D,Davies M,A new academic vocabulary list[J].Applied Linguistics,2014,(3).MCAVL也有類似的情況。雖然本研究使用了均勻分布性選詞標(biāo)準(zhǔn),但是MCAVL對(duì)MCAC的覆蓋水平仍不均衡,其中對(duì)中醫(yī)學(xué)庫的覆蓋水平最差,覆蓋率低于20%??梢?通用醫(yī)學(xué)漢語學(xué)術(shù)詞匯在醫(yī)學(xué)各學(xué)科各專業(yè)的使用上仍然存在明顯的差異,特別是在中醫(yī)學(xué)上。

(二)MCAVL與MCT大綱詞表的對(duì)比

為了回答前文提出的問題“MCAVL與MCT大綱詞表有哪些差異?”,我們對(duì)MCAVL和MCT大綱詞表進(jìn)行了對(duì)比??偟膩砜?兩詞表有以下幾點(diǎn)不同:

從服務(wù)對(duì)象上來看,MCT大綱詞表的研制目標(biāo)主要服務(wù)于醫(yī)學(xué)專業(yè)的留學(xué)生和在中國境內(nèi)外使用漢語進(jìn)行臨床診療的漢語非第一語言的醫(yī)護(hù)工作人員;而MCAVL主要服務(wù)于醫(yī)學(xué)專業(yè)的預(yù)科留學(xué)生或者即將進(jìn)入醫(yī)學(xué)專業(yè)的本科留學(xué)生。

從詞表的功能來看,MCT大綱詞表是為了讓學(xué)習(xí)者能夠更好地熟悉醫(yī)院場景,并能就病情進(jìn)行相應(yīng)的描述、溝通和交流;而MCAVL主要是為了讓學(xué)習(xí)者了解和掌握醫(yī)學(xué)學(xué)術(shù)文本中的學(xué)術(shù)詞匯,更好地從預(yù)科階段過渡到本科階段。

從具體的選詞來看,兩詞表也存在明顯差異。MCT大綱詞表既包含通用詞,如“弱”“升高”等,也包含醫(yī)學(xué)學(xué)術(shù)詞,如“病程”“體征”等,還包含醫(yī)學(xué)專業(yè)詞匯和術(shù)語詞匯,如“不飽和脂肪酸”“呼吸性堿中毒”“視神經(jīng)乳頭”等;而MCAVL則主要收錄的是醫(yī)學(xué)學(xué)術(shù)詞匯,只包含少量的通用詞匯和術(shù)語詞匯。通過多字詞占比和平均詞長可以更好地區(qū)別MCAVL和MCT大綱詞表中專業(yè)詞匯和術(shù)語詞匯的數(shù)量差異,見表6。

表6 MCAVL和MCT大綱詞表的單字詞、雙字詞、多字詞占比及平均詞長

與通用詞匯相比,漢語專業(yè)詞匯以雙詞素詞和多詞素詞為主,(39)孫旭東,戴衛(wèi)平.科技詞匯的基本特點(diǎn)探討[J].中國科技術(shù)語,2017,(1).并且這些雙語素詞和多語素詞通常都是多字詞。由表6可知,MCT大綱詞表的平均詞長為2.70,MCAVL則為2.08;MCT大綱詞表的多字詞占比為37.07%,而MCAVL的多字詞占比僅為13.35%,這說明MCT大綱詞表的平均詞長和多字詞占比均大于MCAVL,MCT大綱詞表收錄了更多的醫(yī)學(xué)專業(yè)詞匯和術(shù)語詞匯。

除了對(duì)詞表進(jìn)行以上對(duì)比,本研究還比較了MCAVL和MCT大綱詞表對(duì)MCAC的詞匯覆蓋水平。為了與MCT大綱詞表的全部1500個(gè)詞語進(jìn)行比較,我們對(duì)等選取MCAVL中排序前1500的詞語。詞匯覆蓋情況見表7。

表7 MCAVL(前1500)和MCT大綱詞表對(duì)MCAC的覆蓋水平

由表7可知,MCAVL(前1500)覆蓋了MCAC中5399554個(gè)詞例,覆蓋率為28.78%;而MCT大綱詞表只覆蓋了MCAC中2894052個(gè)詞例,覆蓋率僅為15.42%,二者的覆蓋率相差了13.36%,MCAVL(前1500)的覆蓋水平更好。兩詞表與預(yù)科基礎(chǔ)詞表結(jié)合后依然有較大的差異,MCAVL(前1500)和預(yù)科基礎(chǔ)詞表結(jié)合后,覆蓋率為74.27%;MCT大綱詞表和預(yù)科基礎(chǔ)詞表結(jié)合后,覆蓋率僅為64.15%,二者相差10.12%。可見,無論是否與預(yù)科基礎(chǔ)詞表相結(jié)合,MCAVL(前1500)的覆蓋率都要高于MCT大綱詞表,兩詞表存在明顯差異。從服務(wù)于留學(xué)生的學(xué)術(shù)教學(xué)和學(xué)習(xí)這個(gè)角度來看,MCAVL的有效性更好,能夠有效彌補(bǔ)現(xiàn)有醫(yī)學(xué)漢語詞表缺少學(xué)術(shù)詞匯的不足。

(三)MCAVL中的通用詞匯

在專業(yè)性選詞時(shí),我們選擇了頻率比選詞標(biāo)準(zhǔn),沒有去除所有的通用詞匯,這使得MCAVL包含了少部分的通用詞匯。MCAVL與預(yù)科基礎(chǔ)詞表有202個(gè)重復(fù)詞,這些重復(fù)詞既可以看作是醫(yī)學(xué)學(xué)術(shù)詞匯,也可以看作是通用詞匯。收錄這些詞的理由有以下兩點(diǎn):

一是因?yàn)檫@些詞在學(xué)術(shù)文本中出現(xiàn)的頻率是非學(xué)術(shù)文本的3倍以上,如“疾病”的頻率比為47.77,“細(xì)菌”的頻率比為31.45,“死亡”的頻率比為4.35,這些詞值得引起學(xué)習(xí)者的注意。

二是因?yàn)橛幸徊糠衷~,其在醫(yī)學(xué)學(xué)術(shù)領(lǐng)域常用的詞性和詞義有別于通用領(lǐng)域。詞性上以“酸”為例,“酸”這個(gè)詞在通用領(lǐng)域常作形容詞,《現(xiàn)代漢語詞典(第七版)》中“酸”作形容詞表示“像醋的氣味或味道”;而在醫(yī)學(xué)學(xué)術(shù)領(lǐng)域,“酸”常作名詞,表示“電解質(zhì)電離時(shí)所生成的正離子全部是氫離子的化合物”。因此雖然“酸”在醫(yī)學(xué)學(xué)術(shù)領(lǐng)域和通用領(lǐng)域都高頻出現(xiàn),但是其常用的詞性卻不同。詞義上以“糖”為例,“糖”在《現(xiàn)代漢語詞典(第七版)》中有3個(gè)義項(xiàng)分別是:(1)“有機(jī)化合物的一類,可以分為單糖、雙糖和多糖,是人體內(nèi)產(chǎn)生熱量的主要物質(zhì),也叫碳水化合物”;(2)“食糖的統(tǒng)稱”;(3)“糖果”。經(jīng)過對(duì)語料的觀察,我們發(fā)現(xiàn)在醫(yī)學(xué)學(xué)術(shù)文本中“糖”最常用的是義項(xiàng)(1),而在通用領(lǐng)域中“糖”常用的義項(xiàng)是(2)和(3)??梢?“糖”雖然在醫(yī)學(xué)學(xué)術(shù)領(lǐng)域和通用領(lǐng)域都高頻出現(xiàn),但是其常用的詞義是不同的。

學(xué)術(shù)詞匯教學(xué)要注重學(xué)術(shù)詞匯的學(xué)術(shù)義與通用義的辨析。(40)張博.學(xué)術(shù)漢語詞匯的主要特點(diǎn)及教學(xué)策略[J].世界漢語教學(xué),2022,(4).因此,在醫(yī)學(xué)漢語教學(xué)和學(xué)習(xí)時(shí),教師和學(xué)習(xí)者都應(yīng)注意醫(yī)學(xué)學(xué)術(shù)詞匯在醫(yī)學(xué)學(xué)術(shù)領(lǐng)域和通用領(lǐng)域的差異,并做好這兩方面的辨析。

四、結(jié) 語

本文通過語料庫驅(qū)動(dòng)的研究方法開發(fā)了一個(gè)包含1700個(gè)詞型的醫(yī)學(xué)漢語學(xué)術(shù)詞表(MCAVL)。通過對(duì)比和分析,我們發(fā)現(xiàn)MCAVL對(duì)醫(yī)學(xué)學(xué)術(shù)文本的覆蓋率達(dá)到29.06%,MCT大綱詞表的覆蓋率僅為15.42%,說明該詞表可以很好地服務(wù)醫(yī)學(xué)學(xué)術(shù)漢語的教學(xué)和學(xué)習(xí),并為醫(yī)學(xué)學(xué)術(shù)詞匯研究和醫(yī)學(xué)漢語教材編寫提供依據(jù)。同時(shí),MCAVL與預(yù)科基礎(chǔ)詞表結(jié)合后,對(duì)醫(yī)學(xué)學(xué)術(shù)文本的覆蓋率達(dá)到了74.55%,表明該詞表可以有效銜接預(yù)科教育和本科教育兩個(gè)階段。

除此以外,本研究調(diào)查了MCAVL在醫(yī)學(xué)漢語學(xué)術(shù)語料庫(CAC)各子庫的覆蓋情況,發(fā)現(xiàn)在臨床醫(yī)學(xué)庫、基礎(chǔ)醫(yī)學(xué)庫、護(hù)理學(xué)庫和藥學(xué)庫的覆蓋率都超過了30%,對(duì)中醫(yī)學(xué)庫的覆蓋水平最低(18.93%),表明各學(xué)科各專業(yè)的醫(yī)學(xué)學(xué)術(shù)詞匯之間存在明顯差別。因此,未來研究中可開發(fā)不同學(xué)科領(lǐng)域的醫(yī)學(xué)漢語學(xué)術(shù)詞表,特別是中醫(yī)學(xué)漢語學(xué)術(shù)詞表。

醫(yī)學(xué)漢語學(xué)術(shù)詞表的開發(fā)為醫(yī)學(xué)漢語教學(xué)提供了基礎(chǔ)語言資源的支撐,促進(jìn)了醫(yī)學(xué)學(xué)科和中文學(xué)科的融合。學(xué)科融合可打破學(xué)科壁壘,促進(jìn)知識(shí)的整合和創(chuàng)新。學(xué)科融合視域下,國際中文教育研究要實(shí)現(xiàn)可持續(xù)高質(zhì)量發(fā)展,需要重視同各學(xué)科的深度合作,構(gòu)建針對(duì)不同領(lǐng)域的基礎(chǔ)語言資源,以解決各學(xué)科專業(yè)基礎(chǔ)教學(xué)資源的短缺問題,有效促進(jìn)國際中文教育與不同學(xué)科之間的協(xié)調(diào)發(fā)展。

猜你喜歡
詞表預(yù)科覆蓋率
民政部等16部門:到2025年村級(jí)綜合服務(wù)設(shè)施覆蓋率超80%
我國全面實(shí)施種業(yè)振興行動(dòng) 農(nóng)作物良種覆蓋率超過96%
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會(huì)項(xiàng)目名稱漢英對(duì)照詞表
英語世界(2021年13期)2021-01-12 05:47:51
跟蹤導(dǎo)練(二)(6)
分部積分法在少數(shù)民族預(yù)科理工類高等數(shù)學(xué)教學(xué)中的探索
敘詞表與其他詞表的互操作標(biāo)準(zhǔn)
基于噴丸隨機(jī)模型的表面覆蓋率計(jì)算方法
新疆高?!昂箢A(yù)科時(shí)代”面臨的挑戰(zhàn)及對(duì)策
語言與翻譯(2015年3期)2015-07-18 11:11:05
基于覆蓋率驅(qū)動(dòng)的高性能DSP指令集驗(yàn)證方法
留學(xué)生預(yù)科教育的管理——以北京大學(xué)預(yù)科教育管理經(jīng)驗(yàn)為例
德格县| 金门县| 剑川县| 丰宁| 合水县| 德昌县| 扎兰屯市| 会东县| 柳河县| 永仁县| 包头市| 蕉岭县| 贵州省| 若尔盖县| 旬阳县| 香河县| 顺昌县| 绍兴县| 文登市| 连云港市| 南康市| 东山县| 黑河市| 和林格尔县| 丰城市| 阿拉善盟| 深水埗区| 长沙县| 肥乡县| 宜都市| 莱阳市| 托克逊县| 和政县| 宁国市| 息烽县| 于田县| 杭锦后旗| 恩平市| 三亚市| 宁阳县| 苏尼特左旗|