国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于文獻(xiàn)計量分析漢語方言語料庫建設(shè)及應(yīng)用研究態(tài)勢

2023-11-24 05:47:50敏,劉
晉圖學(xué)刊 2023年5期
關(guān)鍵詞:語料語料庫方言

李 敏,劉 飛

(1.海南師范大學(xué) 圖書館,海南 ???571158;2.新疆醫(yī)科大學(xué) 圖書館,新疆 烏魯木齊 830017)

0 引言

隨著中國城鎮(zhèn)化進(jìn)程的不斷推進(jìn),普通話的普及對漢語方言文化的生存環(huán)境提出了嚴(yán)峻挑戰(zhàn)。如何理解和表征方言特征,傳承和發(fā)揚(yáng)方言所承載的民族文化,成為語言學(xué)界迫在眉睫的重要任務(wù)。

語料庫是指經(jīng)過科學(xué)取樣和加工的大規(guī)模電子語言材料庫,漢語方言語料庫是指以漢語方言為語料基礎(chǔ)進(jìn)行研究的大型語料數(shù)據(jù)庫。近四十年來,中國漢語方言語料庫取得了長足進(jìn)展。漢語方言語料庫的研究在傳承中國各個民族語言,傳播漢語方言文化、增強(qiáng)民族自信中發(fā)揮巨大的作用。20世紀(jì)80年代,對方言語料庫的建設(shè)和應(yīng)用開始起步[1];20世紀(jì)90年代末至二十一世紀(jì)初為漢語方言語料庫相關(guān)研究的初始階段,北京語言大學(xué)等機(jī)構(gòu)建設(shè)了我國較早的方言語料庫,如“北京口語語料庫”等語料庫的產(chǎn)生[2],代表著漢語方言語料庫建設(shè)及應(yīng)用研究步入正軌;2008年國家語委啟動了“中國語言資源有聲數(shù)據(jù)庫建設(shè)”項目后[3],把漢語方言語料庫相關(guān)研究推向了新的高度?,F(xiàn)在,漢語方言語料庫建設(shè)及應(yīng)用研究已經(jīng)成為國內(nèi)語言學(xué)及相關(guān)學(xué)科領(lǐng)域研究的前沿和熱點(diǎn)領(lǐng)域,其文獻(xiàn)數(shù)量不斷增加[4]。

文獻(xiàn)計量法是一種通過借助文獻(xiàn)的各種特征數(shù)量,采用相關(guān)數(shù)學(xué)和統(tǒng)計學(xué)的方法,定量地描述、評價和預(yù)測科學(xué)技術(shù)的發(fā)展動態(tài),凸顯出重要的方法論價值[5]。本文以漢語方言語料庫建設(shè)及應(yīng)用為研究主題,基于文獻(xiàn)計量研究方法,分析漢語方言語料庫相關(guān)研究領(lǐng)域的發(fā)展現(xiàn)狀,分別從研究數(shù)量、研究機(jī)構(gòu)、研究熱點(diǎn)等層面介紹了主要研究力量的研究信息,從而掌握漢語方言語料庫建設(shè)及應(yīng)用的最新研究趨向,為后續(xù)研究提供文獻(xiàn)參考。

1 數(shù)據(jù)來源與分析方法

1.1 數(shù)據(jù)來源

本文以中國知網(wǎng)數(shù)據(jù)庫CNKI為數(shù)據(jù)源分析漢語方言語料庫建設(shè)及應(yīng)用研究態(tài)勢,時間段截取區(qū)間為1995年至2021年(完整的會計年度,即1995-01-01至2021-12-31)。在CNKI數(shù)據(jù)庫中以“語料庫”和“漢語方言語料庫”為主題詞進(jìn)行檢索,為了數(shù)據(jù)的科學(xué)性和可靠性,均選擇核心論文期刊為數(shù)據(jù)來源,在CNKI數(shù)據(jù)庫中運(yùn)用高級篩選機(jī)制“期刊來源”勾選為“SCI來源期刊”,“EI來源期刊”“北大核心”“CSSCI”和“CSDN”,并選擇研究時間段1995-01-01至2021-12-31。本研究按照不同年份對機(jī)構(gòu)、期刊、作者等統(tǒng)計分類信息進(jìn)行篩選,在Excel中進(jìn)行數(shù)據(jù)整理和歸納計算。研究指標(biāo)包括:研究主題、論文數(shù)、被引頻次等。

1.2 分析方法

本文基于文獻(xiàn)計量學(xué)理論,運(yùn)用中國知網(wǎng)可視化分析軟件進(jìn)行文獻(xiàn)信息的挖掘和分析,進(jìn)行文獻(xiàn)的關(guān)鍵詞共被引分析、高產(chǎn)作者分析和主要研究機(jī)構(gòu)分析,形成可視化網(wǎng)絡(luò)圖譜,并進(jìn)一步針對主要信息整理成表格,進(jìn)而能夠從海量文獻(xiàn)中找到關(guān)鍵的信息。通過圖譜和表格信息可以觀察到某一學(xué)科領(lǐng)域的發(fā)展歷程和當(dāng)前研究熱點(diǎn),從而了解該領(lǐng)域最新研究動態(tài)[6]。

2 結(jié)果分析與討論

2.1 文獻(xiàn)總體分析

各個學(xué)科領(lǐng)域在一定時間內(nèi)的論文產(chǎn)出數(shù)量是反映該學(xué)科知識積累程度和研究活躍程度的重要指標(biāo),代表了該學(xué)科研究領(lǐng)域最新的發(fā)展動態(tài)和走向。統(tǒng)計表明:當(dāng)一門學(xué)科處于萌芽和快速發(fā)展階段時,其研究相應(yīng)的文獻(xiàn)數(shù)量呈指數(shù)增長[12]。

語料庫,通俗含義下指的是語言材料庫,系統(tǒng)而全面的語言學(xué)是語料庫的建設(shè)的理論指導(dǎo),對真實(shí)語言材料的搜集和整理是語言學(xué)得以發(fā)展的不竭動力,而方言語料又是幾千年來中國廣大地域上最原始、豐富的語料。根據(jù)2012年《中國語言地圖集》[7]的最新統(tǒng)計,我國共有10種漢語方言大區(qū)、17種方言區(qū)、98種方言片、168種方言小片。對漢語方言語料庫建設(shè)和應(yīng)用的研究是語料庫研究最核心的部分,能夠最大程度的保護(hù)漢語方言話語語料的原生態(tài)屬性[8][13]。

本文選擇檢索條件為:(主題%=‘漢語語料庫’or題名%=‘漢語語料庫’)AND(發(fā)表時間Between(‘1995-01-01’,‘2021-12-31’))。結(jié)果表明:漢語方言語料庫建設(shè)及應(yīng)用領(lǐng)域發(fā)文量呈逐年增加趨勢。1995—2006年為我國漢語語料庫建設(shè)和應(yīng)用的探索期。在這一時期,隨著語料庫建設(shè)在中國的發(fā)展,漢語方言語料庫的建設(shè)和應(yīng)用也與之同步發(fā)展,但是發(fā)文數(shù)量較少。這是因?yàn)殡S著1955年“全國文字改革會議”和“現(xiàn)代漢語規(guī)范問題學(xué)術(shù)會議”的召開,全國實(shí)行推行普通話政策,在一定程度上對漢語方言的生存空間造成擠壓。1956年開始全國開展了各個方言片區(qū)的漢語方言普查工作,此次普查工作積累了豐富的方言材料和方言調(diào)查經(jīng)驗(yàn),為后期漢語方言建設(shè)和應(yīng)用的研究奠定了基礎(chǔ)。2006—2015年為我國漢語方言建設(shè)和應(yīng)用領(lǐng)域研究的成長期,對漢語方言語料庫的探索的文獻(xiàn)數(shù)量大幅度增加。進(jìn)入21世紀(jì)以后,隨著城市化進(jìn)程的加快,普通話的普及,漢語方言文化開始出現(xiàn)代際傳承的斷裂,方言文化瀕危,瀕危方言、弱小方言萎縮甚至消亡,我國各地方言的傳承和發(fā)展面臨前所未有的挑戰(zhàn),漢語方言語料庫的建設(shè)和應(yīng)用成為學(xué)術(shù)界日益關(guān)注的重點(diǎn)[9]。2015—2021年間漢語方言語料庫建設(shè)和應(yīng)用研究步入穩(wěn)定的發(fā)展期,但是數(shù)量上逐年下行,漢語方言語料庫的研究熱度有所下降[10-11]。

2.2 主要研究力量分析

檢索發(fā)現(xiàn)共有40個機(jī)構(gòu)參與了漢語方言語料庫的建設(shè)。主要的研究機(jī)構(gòu)如表1所示。首先,對漢語方言語料庫建設(shè)和應(yīng)用研究的機(jī)構(gòu)大多是科研機(jī)構(gòu),如高校、社科院,尤其是處在少數(shù)民族區(qū)域。中國各大方言片區(qū)的大學(xué)承擔(dān)了漢語方言語料庫建設(shè)和應(yīng)用的重任,對傳承中國漢語文化、保存漢語方言資源起到了重要的作用。其次,暨南大學(xué)和中國社會科學(xué)院語言文字應(yīng)用研究所在論文數(shù)量及篇均被引頻次方面顯著超越其他研究機(jī)構(gòu),顯示了這兩個機(jī)構(gòu)在中國漢語方言語料庫建設(shè)和應(yīng)用領(lǐng)域強(qiáng)大的科技實(shí)力和學(xué)術(shù)影響力。再次,各個研究機(jī)構(gòu)關(guān)注的研究主題側(cè)重點(diǎn)不同。概括來說,盡管不同的研究機(jī)構(gòu)在不同的方言之間進(jìn)行語料庫的探索和研究,但是重點(diǎn)研究主題的重心在不同的漢語方言語料庫、語音語料以及語法研究、方言語料庫的用途等層面。

表1 漢語方言語料庫建設(shè)和研究領(lǐng)域前5個機(jī)構(gòu)的研究主題Table 1 Research topics of the top five institutions in the field of Chinese dialect corpus construction and research

2.3 研究熱點(diǎn)分析

關(guān)鍵詞是對文章內(nèi)容的高度凝練和概括,可以說出現(xiàn)頻次較高的關(guān)鍵詞代表著學(xué)科的研究熱點(diǎn)和最新的研究趨勢。本文通過對高頻關(guān)鍵詞的挖掘和提取,運(yùn)用中國知網(wǎng)CNKI計量可視化分析,創(chuàng)建了關(guān)鍵詞共建網(wǎng)絡(luò),如圖2所示。

Figure 1 Annual distribution of research on the construction and application of Chinese dialect Corpus (1995—2021)圖1 漢語方言語料庫建設(shè)及應(yīng)用相關(guān)研究發(fā)文量年度分布(1995—2021)

Figure 2 Hotspot distribution of Chinese literature research related to the construction and application of Chinese dialect corpus圖2 漢語方言語料庫建設(shè)及應(yīng)用相關(guān)中文文獻(xiàn)研究熱點(diǎn)分布

不同的顏色代表不同的詞組,圓圈的大小代表出現(xiàn)的次數(shù),將出現(xiàn)頻次較高的關(guān)鍵詞根據(jù)不同的主題分類,匯總?cè)绫?。

表2 漢語方言語料庫建設(shè)及應(yīng)用領(lǐng)域熱點(diǎn)關(guān)鍵詞Table 2 Hot keywords in the construction and application of Chinese dialect corpus

漢語方言語料庫建設(shè)和應(yīng)用領(lǐng)域文獻(xiàn)的高頻關(guān)鍵詞主要圍繞四大主題進(jìn)行,分別是現(xiàn)代漢語方言、方言語料庫、語料庫的建設(shè)、語料庫的應(yīng)用。

在漢語方言語料庫的研究領(lǐng)域,主要研究來源是中國各個方言片區(qū)代表區(qū)域文化的地域方言,如中國的七大方言[14](官話方言、客家方言、閩方言、粵方言、贛方言、吳方言、湘方言),還有七大方言的次方言,次方言之下又產(chǎn)生的若干小片和方言點(diǎn)。這些方言體系是中國漢語方言語料庫的語料來源,通過建設(shè)語料庫的方式,促使方言文化傳承在城鎮(zhèn)化的快速進(jìn)程中,尋找新的生存空間和傳承方式,中國漢語方言文化得以源遠(yuǎn)流長[15-16]。

方言語料庫的研究內(nèi)容是不同方言的語料,涵蓋了文學(xué)、戲劇、歷史傳說、祭祀禮儀、相聲小品、口語、讀物、地方傳統(tǒng)等各個領(lǐng)域,對語料研究的表現(xiàn)特征是研究句法、語法、詞匯、詞性、詞綴、不同音系、口語特征,最真實(shí)、全面地反映了各種方言特色[17]。

通過分析文獻(xiàn)發(fā)現(xiàn),語料庫的建設(shè)需要強(qiáng)大的技術(shù)支撐,因而和計算機(jī)發(fā)展的水平有很大關(guān)聯(lián)?,F(xiàn)有的漢語方言語料庫通過不斷更進(jìn)的系統(tǒng)設(shè)計,已經(jīng)完善了語料庫的個性化功能開發(fā)、檢索平臺、數(shù)據(jù)加工、發(fā)布和安全設(shè)置、用戶體驗(yàn)等多項實(shí)踐[18-19]。

漢語方言語料庫的應(yīng)用主要是三大領(lǐng)域:一是語料庫語言學(xué)研究,主要內(nèi)容有社會語言學(xué)、語言變遷、自然語言文本和處理、詞典編纂等;二是方言翻譯,主要有在線檢索、機(jī)器翻譯、語言教學(xué)和高校翻譯等;三是方言信息儲存,不斷更新和增加語料資源,保護(hù)漢語方言文化多樣性。

2.4 學(xué)科、來源期刊和高產(chǎn)作者分析

從學(xué)科角度來看,檢索到的漢語方言語料庫建設(shè)及應(yīng)用研究文獻(xiàn)主要分布在兩大學(xué)科,分別是哲學(xué)與人文科學(xué)、社會科學(xué):哲學(xué)與人文學(xué)科占比較大,文獻(xiàn)數(shù)量占比達(dá)到97.5%;而社會科學(xué)類比較匱乏,僅僅占比2.5%。主要涉及的類別有語言科學(xué)、語言研究、語言生態(tài)學(xué)、語言可持續(xù)發(fā)展等。

漢語方言語料庫建設(shè)及應(yīng)用研究文獻(xiàn)的主要期刊見圖3。這些國內(nèi)期刊主辦機(jī)構(gòu)種類較多、分布較廣,居于前三位的有《世界漢語教學(xué)》《外語教學(xué)與研究》和《中國翻譯》:《世界漢語教學(xué)》收錄文獻(xiàn)最多,文獻(xiàn)數(shù)量占比達(dá)到26.19%;其次是《外語教學(xué)與研究》,文獻(xiàn)數(shù)量占比達(dá)到15.48%;第三位是《中國翻譯》,文獻(xiàn)數(shù)量占比達(dá)到7.14%。

Figure 3 Distribution and proportion of major journals in the construction of Chinese dialect corpus and applied research literature圖3 漢語方言語料庫建設(shè)及應(yīng)用研究文獻(xiàn)的主要期刊分布及占比

對高產(chǎn)作者進(jìn)行分析得到作者網(wǎng)絡(luò)圖譜,如圖4所示??梢钥吹?漢語方言語料庫建設(shè)及應(yīng)用研究領(lǐng)域的高產(chǎn)作者數(shù)量相較而言偏少,大多集中在各個高校和中國社會科學(xué)院語言文字應(yīng)用研究所,且分布并不均勻。

Figure 4 Network atlas of high-yielding authors in Chinese dialect corpus construction and application field圖4 漢語方言語料庫建設(shè)及應(yīng)用領(lǐng)域高產(chǎn)作者網(wǎng)絡(luò)圖譜

進(jìn)一步對高產(chǎn)作者網(wǎng)絡(luò)圖譜中文獻(xiàn)發(fā)文量較高的作者進(jìn)行分析和歸納,在CNKI數(shù)據(jù)庫中以(主題%=‘漢語方言語料庫’or題名%=‘漢語方言語料庫’)AND(發(fā)表時間Between(‘1995-01-01’,‘2021-12-31’))為檢索條件,文獻(xiàn)數(shù)量居于前十位的關(guān)鍵作者檢索的結(jié)果如表3所示。

從表3中可以看出:居于首位的是彭澤潤教授,研究內(nèi)容有漢語語言規(guī)劃、語言應(yīng)用、研究方言事實(shí)描寫等,尤其是對交界區(qū)域的混合方言、三峽區(qū)域移民的方言接觸等問題,彭潤澤教授作出了卓越貢獻(xiàn);居于第二位是詹伯慧教授,總被引和總下載次數(shù)均在較高水平,在漢語方言語料庫建設(shè)和應(yīng)用領(lǐng)域具有較高的影響力,其的研究內(nèi)容涉及語言學(xué)理論、漢語方言、方言辭書編纂、方言文字改革等多項內(nèi)容,研究語言類別有閩、粵、客家等不同類型的方言;居于第三位的是吳福祥教授,其研究內(nèi)容主要涉及漢語歷史語法和中國南方民族語言的語法演變等;居于第四位的是羅昕如教授,主要研究內(nèi)容涉及漢語方言學(xué)、語法學(xué)、修辭學(xué)、應(yīng)用語言學(xué)等,其為湖南漢語方言的發(fā)展和傳承做出了卓越的貢獻(xiàn);居于第五位的是張金橋教授,主要從事傳承漢語方言的華語習(xí)得與認(rèn)同研究,從漢語方言、古漢語等多個視角解釋海外不同區(qū)域的華語特征及形成原因。通過對關(guān)鍵作者的梳理,發(fā)現(xiàn)這些高產(chǎn)作者涉及的主題均在漢語方言語言學(xué)、漢語方言多樣性和可持續(xù)發(fā)展等領(lǐng)域。

3 結(jié)束語

隨著經(jīng)濟(jì)一體化、城鎮(zhèn)化的快速發(fā)展,中國漢語方言多樣性和持續(xù)性發(fā)展正面臨前所未有的沖擊,漢語方言語料庫建設(shè)及應(yīng)用的研究逐漸成為各大高校和社會關(guān)注的熱點(diǎn)。本文運(yùn)用文獻(xiàn)計量的方法,以中國知網(wǎng)CNKI檢索獲得的數(shù)據(jù)為數(shù)據(jù)來源,結(jié)合中國知網(wǎng)可視化分析軟件,通過檢索年限和主題詞的設(shè)置,從漢語方言語料庫建設(shè)和應(yīng)用文獻(xiàn)數(shù)量和總體分析、主要研究機(jī)構(gòu)、研究熱點(diǎn)以及文獻(xiàn)學(xué)科、來源期刊和高產(chǎn)作者分析等多視角的探究,系統(tǒng)全面地梳理了漢語方言語料庫建設(shè)及應(yīng)用領(lǐng)域的最新研究動態(tài)。

通過分析發(fā)現(xiàn),漢語方言語料庫建設(shè)及應(yīng)用研究領(lǐng)域的文獻(xiàn)數(shù)量近幾年取得了大幅度的增長,表明了漢語方言的研究正處在快速發(fā)展時期,但是文獻(xiàn)數(shù)量依然不足,研究成果的應(yīng)用不夠深化,學(xué)術(shù)界對于漢語方言文化持續(xù)性和多樣性發(fā)展的重視程度依然需要提高[20]。

主要研究力量分析說明漢語方言語料庫建設(shè)及應(yīng)用的研究參與者范圍狹窄,漢語方言文化的傳承和發(fā)展有賴于社會大眾共同參與和努力,決不能僅限于高校和其他科研機(jī)構(gòu)的學(xué)術(shù)研究,且各個研究機(jī)構(gòu)由于大多數(shù)的研究內(nèi)容聚焦在自己區(qū)域所在的地域方言文化,研究范圍較窄,研究領(lǐng)域內(nèi)各個機(jī)構(gòu)之間合作少。各個研究機(jī)構(gòu)和企業(yè)應(yīng)該強(qiáng)化學(xué)術(shù)研究合作合力效應(yīng),深化該領(lǐng)域產(chǎn)學(xué)研一體化合作關(guān)系,為漢語方言語料庫建設(shè)及應(yīng)用領(lǐng)域的快速發(fā)展培養(yǎng)提供助力。

研究熱點(diǎn)的角度分析結(jié)果表明,學(xué)者們對中國各個方言片區(qū)的派系方言研究和語料庫建設(shè)熱情較高,但是方言應(yīng)用范圍面較窄,且對小片區(qū)方言及分支方言研究較少,且大部分僅僅用來語言學(xué)研究和在線翻譯、教學(xué)等用途。漢語方言語料庫的建設(shè)及應(yīng)用研究范圍應(yīng)該拓展,加強(qiáng)促進(jìn)多種研究成果的產(chǎn)生。

在對文獻(xiàn)涉及的學(xué)科、來源期刊和高產(chǎn)作者分析中,發(fā)現(xiàn)漢語方言的分布只涉及兩個學(xué)科,主要載文期刊分類多,高產(chǎn)作者數(shù)量不足,且多為權(quán)威專家,學(xué)者分布有年齡斷層現(xiàn)象。高校應(yīng)該提升漢語方言語料庫建設(shè)及應(yīng)用的研究成果轉(zhuǎn)化率,進(jìn)行更深入的漢語方言語言研究和語言應(yīng)用研究。

猜你喜歡
語料語料庫方言
方嚴(yán)的方言
東方少年(2022年28期)2022-11-23 07:09:46
方言
《語料庫翻譯文體學(xué)》評介
留住方言
說說方言
把課文的優(yōu)美表達(dá)存進(jìn)語料庫
基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
華語電影作為真實(shí)語料在翻譯教學(xué)中的應(yīng)用
基于JAVAEE的維吾爾中介語語料庫開發(fā)與實(shí)現(xiàn)
語言與翻譯(2015年4期)2015-07-18 11:07:45
《苗防備覽》中的湘西語料
兴义市| 正蓝旗| 延庆县| 广丰县| 西平县| 柘荣县| 闽侯县| 仲巴县| 汤原县| 馆陶县| 沾化县| 甘孜| 邵东县| 荥阳市| 衡南县| 重庆市| 镇坪县| 台北县| 临漳县| 多伦县| 隆尧县| 舞阳县| 卢湾区| 如东县| 克东县| 杭锦旗| 安宁市| 德阳市| 徐汇区| 阆中市| 武强县| 雷山县| 当涂县| 甘谷县| 洛阳市| 麟游县| 光山县| 旬邑县| 错那县| 阳新县| 巴南区|