主持人語(yǔ):人類(lèi)進(jìn)入數(shù)字時(shí)代,生產(chǎn)力和生產(chǎn)關(guān)系正在發(fā)生深刻變革,語(yǔ)言生活也在這一進(jìn)程中發(fā)生著翻天覆地的變化。數(shù)字時(shí)代的典型特征主要體現(xiàn)在信息的迅速傳播和獲取方式的多樣化,人們通過(guò)多種平臺(tái),如社交網(wǎng)絡(luò)、即時(shí)通訊工具和在線(xiàn)學(xué)習(xí)平臺(tái)等,實(shí)時(shí)分享和獲取信息,這種即時(shí)性和便捷性,使得語(yǔ)言溝通的方式和頻率大幅提升,也推動(dòng)了語(yǔ)言表達(dá)的多樣化。在數(shù)字時(shí)代,語(yǔ)言生活出現(xiàn)了許多新現(xiàn)象和新特征。比如,語(yǔ)言使用的環(huán)境變得更加復(fù)雜和多元,用戶(hù)在不同平臺(tái)往往采用不同的表達(dá)方式;數(shù)字時(shí)代還推動(dòng)了全球化語(yǔ)言交流的進(jìn)程,這種跨文化的語(yǔ)言互動(dòng),為語(yǔ)言生活帶來(lái)了新的活力,但也可能導(dǎo)致某些語(yǔ)言的邊緣化和消亡,帶來(lái)保護(hù)和傳承的挑戰(zhàn)。面對(duì)這些新現(xiàn)象、新論題,研究者應(yīng)加強(qiáng)跨學(xué)科合作,結(jié)合語(yǔ)言學(xué)、社會(huì)學(xué)、心理學(xué)和信息技術(shù)等多方面的知識(shí),深入分析數(shù)字化對(duì)語(yǔ)言使用的影響,通過(guò)定量和定性的研究方法,探索用戶(hù)在不同場(chǎng)景中的語(yǔ)言行為及其背后的社會(huì)文化因素;建立開(kāi)放的研究平臺(tái),鼓勵(lì)不同領(lǐng)域的學(xué)者和從業(yè)者分享經(jīng)驗(yàn)和觀(guān)點(diǎn),以便形成多元化的研究視角。此外,利用大數(shù)據(jù)和人工智能技術(shù),分析海量的語(yǔ)言數(shù)據(jù),揭示語(yǔ)言變化的趨勢(shì)和規(guī)律。本期專(zhuān)題聚焦數(shù)字語(yǔ)言學(xué)和大語(yǔ)言模型給世界語(yǔ)言生活帶來(lái)的新變化等話(huà)題,期待能為此專(zhuān)題的研究增磚添瓦。
(本期專(zhuān)題特約主持人:王春輝)
摘 要:數(shù)字語(yǔ)言學(xué)是一門(mén)研究語(yǔ)言在數(shù)字化環(huán)境中的應(yīng)用和發(fā)展的新興學(xué)科。不同于計(jì)算語(yǔ)言學(xué),數(shù)字語(yǔ)言學(xué)有著更加廣闊的研究視野。其核心目標(biāo)不僅限于利用計(jì)算手段解決特定的語(yǔ)言處理任務(wù),而且更專(zhuān)注于語(yǔ)言數(shù)據(jù)的全面采集、系統(tǒng)化管理、精細(xì)化分析和可視化呈現(xiàn),注重研究成果的產(chǎn)業(yè)化,并且與數(shù)字人文密切相關(guān)。中國(guó)在數(shù)字語(yǔ)言學(xué)研究領(lǐng)域,雖然已取得初步進(jìn)展,但還可以在加強(qiáng)基礎(chǔ)設(shè)施建設(shè)、推動(dòng)學(xué)科教育體系構(gòu)建和加快研究成果產(chǎn)業(yè)化等方面進(jìn)一步發(fā)展。未來(lái),數(shù)字語(yǔ)言學(xué)將在語(yǔ)言教育、公共服務(wù)、商業(yè)等更多應(yīng)用場(chǎng)景中展現(xiàn)出獨(dú)特價(jià)值。
關(guān)鍵詞:數(shù)字語(yǔ)言學(xué);計(jì)算語(yǔ)言學(xué);語(yǔ)料庫(kù);數(shù)字人文;語(yǔ)言數(shù)據(jù)
中圖分類(lèi)號(hào):H0-05;H08 文章標(biāo)志碼:A 文章編號(hào):1006-6152(2024)06-0028-09
DOI:10.16388/j.cnki.cn42-1843/c.2024.06.003
一、引 言
人工智能領(lǐng)域的重大進(jìn)展不僅極大地改變了我們的日常生活,也為語(yǔ)言學(xué)研究帶來(lái)了前所未有的新機(jī)遇?,F(xiàn)代語(yǔ)言學(xué)研究正逐漸轉(zhuǎn)向數(shù)據(jù)/計(jì)算密集型的第四/第五范式,為推動(dòng)通用人工智能的發(fā)展貢獻(xiàn)著其獨(dú)特的學(xué)科價(jià)值[1]。在技術(shù)革新和學(xué)術(shù)需求的雙重驅(qū)動(dòng)下,數(shù)字語(yǔ)言學(xué)作為一門(mén)新興學(xué)科應(yīng)運(yùn)而生,不僅為傳統(tǒng)語(yǔ)言學(xué)研究注入了新的活力,提供了全新的研究視角和方法,而且還促進(jìn)了與其他學(xué)科的交流與合作,展現(xiàn)了跨學(xué)科的特性。
目前數(shù)字語(yǔ)言學(xué)的研究還處于初級(jí)階段,現(xiàn)有的研究成果尚顯分散,還沒(méi)有形成一個(gè)完整的研究思路[2]。與此同時(shí),數(shù)字語(yǔ)言學(xué)與其他語(yǔ)言學(xué)分支的關(guān)系也沒(méi)有明確,學(xué)科的研究特征和優(yōu)勢(shì)亟待進(jìn)一步闡明[3]。以上這些問(wèn)題都在一定程度上制約了數(shù)字語(yǔ)言學(xué)的成長(zhǎng)和發(fā)展?;诖耍疚膶@著數(shù)字語(yǔ)言學(xué)的界定、基本特征、發(fā)展歷程、在高等教育機(jī)構(gòu)中的構(gòu)建以及在中國(guó)的發(fā)展情況進(jìn)行探討,以期加深對(duì)數(shù)字語(yǔ)言學(xué)這門(mén)新興學(xué)科的認(rèn)識(shí),并為其未來(lái)的發(fā)展提供一些有價(jià)值的參考。
二、數(shù)字語(yǔ)言學(xué)的界定
從目前來(lái)看,數(shù)字語(yǔ)言學(xué)作為一門(mén)新興研究領(lǐng)域,其界定邊界持續(xù)擴(kuò)展與深化,尚未形成統(tǒng)一定論。這一現(xiàn)象不僅源于它作為一門(mén)新興學(xué)科正快速發(fā)展,更與其跨學(xué)科性質(zhì)、技術(shù)的日新月異以及社會(huì)對(duì)數(shù)字語(yǔ)言現(xiàn)象認(rèn)知的不斷演變等復(fù)雜因素緊密相連。因此,對(duì)于數(shù)字語(yǔ)言學(xué)的界定,我們應(yīng)保持開(kāi)放與靈活的研究視角,隨著學(xué)科的不斷進(jìn)步而持續(xù)更新與完善。
經(jīng)過(guò)對(duì)現(xiàn)有研究文獻(xiàn)及網(wǎng)絡(luò)資源的系統(tǒng)性梳理與深入分析,可將當(dāng)前與數(shù)字語(yǔ)言學(xué)界定相關(guān)的觀(guān)點(diǎn)概括為以下幾個(gè)類(lèi)別。這些類(lèi)別不僅反映了不同學(xué)科背景的研究者對(duì)于數(shù)字語(yǔ)言學(xué)研究的不同理解,也揭示了它作為一個(gè)跨學(xué)科領(lǐng)域的豐富內(nèi)涵與廣闊前景。
觀(guān)點(diǎn)一:數(shù)字語(yǔ)言學(xué)是對(duì)數(shù)字環(huán)境中語(yǔ)言使用的研究,例如研究在線(xiàn)聊天、社交媒體和短信等數(shù)字通信平臺(tái)中的語(yǔ)言使用趨勢(shì)和模式[4-5]。
這個(gè)觀(guān)點(diǎn)突出了數(shù)字語(yǔ)言學(xué)探索數(shù)字環(huán)境中語(yǔ)言使用的重要性,尤其是在社交媒體、在線(xiàn)聊天和短信等數(shù)字通信平臺(tái)上。通過(guò)聚焦這些日常使用的平臺(tái),數(shù)字語(yǔ)言學(xué)揭示了數(shù)字時(shí)代下語(yǔ)言變異和創(chuàng)新的新趨勢(shì),為傳統(tǒng)語(yǔ)言學(xué)研究提供了新的數(shù)據(jù)來(lái)源和研究領(lǐng)域。然而,這個(gè)觀(guān)點(diǎn)也存在一些不足。首先,它可能過(guò)于狹窄地限定了數(shù)字語(yǔ)言學(xué)的研究范圍,僅僅關(guān)注了數(shù)字通信平臺(tái)上的語(yǔ)言使用,而沒(méi)有涵蓋數(shù)字語(yǔ)言學(xué)可能涉及的其他方面,把數(shù)字語(yǔ)言學(xué)簡(jiǎn)單地等同于網(wǎng)絡(luò)語(yǔ)言學(xué)。其次,該定義沒(méi)有明確指出數(shù)字語(yǔ)言學(xué)與數(shù)字技術(shù)、社會(huì)科學(xué)等其他學(xué)科的交叉性,這些交叉性是數(shù)字語(yǔ)言學(xué)作為一門(mén)跨學(xué)科領(lǐng)域的重要特征。因此,雖然這一界定為我們提供了一個(gè)關(guān)于數(shù)字語(yǔ)言學(xué)研究焦點(diǎn)的清晰視圖,但它需要進(jìn)一步擴(kuò)展,包括該領(lǐng)域的更廣泛研究?jī)?nèi)容和跨學(xué)科特性。
觀(guān)點(diǎn)二:數(shù)字語(yǔ)言學(xué)是有關(guān)語(yǔ)言學(xué)數(shù)字?jǐn)?shù)據(jù)管理的科學(xué),包括語(yǔ)言數(shù)據(jù)的數(shù)字存儲(chǔ)、展示、操作和傳播。它關(guān)注如何以數(shù)字形式表示語(yǔ)言數(shù)據(jù)以及使用現(xiàn)代開(kāi)放網(wǎng)絡(luò)平臺(tái)(OWP)的所有優(yōu)勢(shì)來(lái)處理這些數(shù)據(jù)的最佳實(shí)踐[6]。
這個(gè)觀(guān)點(diǎn)的核心優(yōu)勢(shì)在于它明確地將數(shù)字語(yǔ)言學(xué)定位為一門(mén)專(zhuān)注于語(yǔ)言學(xué)數(shù)字?jǐn)?shù)據(jù)管理的科學(xué),強(qiáng)調(diào)了語(yǔ)言數(shù)據(jù)的數(shù)字化存儲(chǔ)、展示、操作和傳播的重要性,這些都是現(xiàn)代語(yǔ)言學(xué)研究中不可或缺的組成部分。但是,這個(gè)定義也存在一些局限性。首先,它可能過(guò)于側(cè)重于技術(shù)層面,而沒(méi)有充分考慮語(yǔ)言學(xué)研究的理論深度。語(yǔ)言學(xué)不僅僅是關(guān)于數(shù)據(jù)管理的科學(xué),它還涉及對(duì)語(yǔ)言結(jié)構(gòu)、功能、發(fā)展和變異的深入理解。此外,定義中提到的“最佳實(shí)踐”是一個(gè)相對(duì)模糊的界定,它需要進(jìn)一步的闡釋和標(biāo)準(zhǔn)化,以便學(xué)者們能夠在實(shí)踐中達(dá)成共識(shí)。例如,什么樣的數(shù)據(jù)處理方法被認(rèn)為是最佳的?這些方法如何適應(yīng)不同的語(yǔ)言研究需求?
觀(guān)點(diǎn)三:數(shù)字語(yǔ)言學(xué)是傳統(tǒng)語(yǔ)言學(xué)、信息技術(shù)和社會(huì)科學(xué)的交叉點(diǎn)上一個(gè)不斷發(fā)展的跨學(xué)科領(lǐng)域。與計(jì)算語(yǔ)言學(xué)專(zhuān)注于使用計(jì)算機(jī)執(zhí)行與語(yǔ)言相關(guān)的任務(wù)不同(如機(jī)器翻譯或語(yǔ)音識(shí)別),數(shù)字語(yǔ)言學(xué)更加關(guān)注語(yǔ)言數(shù)據(jù)本身,即語(yǔ)言數(shù)據(jù)的收集、處理、分析、可視化、存儲(chǔ)、傳播等方面,即使用語(yǔ)言作為人類(lèi)表達(dá)手段的數(shù)字人工制品。新聞文章、社交媒體內(nèi)容或數(shù)字化的中世紀(jì)手稿等都是數(shù)字語(yǔ)言學(xué)家感興趣的潛在對(duì)象。與數(shù)字人文密切相關(guān),數(shù)字語(yǔ)言學(xué)正吸引著學(xué)術(shù)界以及公共和私營(yíng)部門(mén)越來(lái)越多的關(guān)注,因?yàn)樘幚頂?shù)字語(yǔ)言數(shù)據(jù)的技能被認(rèn)為是現(xiàn)代經(jīng)濟(jì)和社會(huì)中必不可少的[2]。
通過(guò)與前兩個(gè)觀(guān)點(diǎn)的比較,Witt在《數(shù)字語(yǔ)言學(xué)》這本書(shū)中對(duì)數(shù)字語(yǔ)言學(xué)界定的理解顯得比較全面和清晰。這段論述不僅突出了數(shù)字語(yǔ)言學(xué)這門(mén)學(xué)科的跨學(xué)科屬性,強(qiáng)調(diào)了語(yǔ)言數(shù)據(jù)管理在數(shù)字語(yǔ)言學(xué)中的重要性,而且還指出了數(shù)字語(yǔ)言學(xué)側(cè)重于量化分析的特點(diǎn)。值得我們注意的是,這段論述明確提出了數(shù)字語(yǔ)言學(xué)與計(jì)算語(yǔ)言學(xué)的區(qū)別,同時(shí)肯定了它與數(shù)字人文的密切關(guān)系。然而,盡管這一定義在學(xué)術(shù)層面上具有顯著的深度和廣度,但是忽略了數(shù)字語(yǔ)言學(xué)對(duì)于語(yǔ)言資源的價(jià)值貢獻(xiàn),在某種程度上未能充分考慮到數(shù)字語(yǔ)言學(xué)研究成果的產(chǎn)業(yè)化潛力。在當(dāng)今知識(shí)經(jīng)濟(jì)時(shí)代,學(xué)術(shù)研究與產(chǎn)業(yè)應(yīng)用之間的互動(dòng)和融合,對(duì)于推動(dòng)語(yǔ)言學(xué)的理論進(jìn)步和技術(shù)革新具有重要意義。
通過(guò)上述對(duì)數(shù)字語(yǔ)言學(xué)界定的基本梳理,我們大概可以看到數(shù)字語(yǔ)言學(xué)的界定應(yīng)具有以下基本特征:
第一,具有跨學(xué)科的融合性。數(shù)字語(yǔ)言學(xué)并不是簡(jiǎn)單的“數(shù)字+語(yǔ)言”的組合,它有效地整合了計(jì)算機(jī)科學(xué)和社會(huì)科學(xué)等多個(gè)學(xué)科的方法和理念,提升了傳統(tǒng)語(yǔ)言學(xué)的研究質(zhì)量,拓展了語(yǔ)言學(xué)的研究視野。它不僅為解答傳統(tǒng)語(yǔ)言學(xué)中的疑難問(wèn)題提供了新的視角,也使得研究更深層次地揭露了語(yǔ)言的本質(zhì)和功能。
第二,關(guān)注語(yǔ)言數(shù)據(jù)的數(shù)字管理。這里的數(shù)據(jù)管理包括語(yǔ)言數(shù)據(jù)的收集、處理、分析、可視化、存儲(chǔ)、傳播等方面以及語(yǔ)言數(shù)據(jù)在數(shù)字環(huán)境中的表現(xiàn)和變化。數(shù)字語(yǔ)言學(xué)的這一特性適應(yīng)了數(shù)字化社會(huì)的要求,為理解語(yǔ)言在現(xiàn)代社會(huì)中的角色和功能提供了新的視角,為語(yǔ)言保護(hù)、語(yǔ)言教學(xué)、語(yǔ)言服務(wù)和語(yǔ)言管理等領(lǐng)域提供了新的思路和方法。
第三,側(cè)重研究方法的量化性。通過(guò)運(yùn)用統(tǒng)計(jì)學(xué)和計(jì)量學(xué)的工具,研究者能夠?qū)φZ(yǔ)言數(shù)據(jù)進(jìn)行量化分析,揭示語(yǔ)言現(xiàn)象背后的規(guī)律和趨勢(shì)。這種定量的研究方法為語(yǔ)言學(xué)提供了一種新的視角,使得語(yǔ)言研究更加科學(xué)化和精確化。
第四,注重語(yǔ)言研究成果的產(chǎn)業(yè)化。數(shù)字語(yǔ)言學(xué)作為一門(mén)結(jié)合語(yǔ)言學(xué)理論和現(xiàn)代技術(shù)的學(xué)科,其研究成果的產(chǎn)業(yè)化意味著數(shù)字語(yǔ)言學(xué)的研究不僅是為了探索語(yǔ)言的本質(zhì)和規(guī)律,而且是為了將語(yǔ)言的知識(shí)和技術(shù)轉(zhuǎn)化為具有實(shí)用價(jià)值和市場(chǎng)需求的語(yǔ)言產(chǎn)品和服務(wù),從而促進(jìn)語(yǔ)言產(chǎn)業(yè)的發(fā)展和創(chuàng)新。數(shù)字語(yǔ)言學(xué)的研究成果的產(chǎn)業(yè)化,可以為語(yǔ)言產(chǎn)業(yè)提供更多的語(yǔ)言數(shù)據(jù)、語(yǔ)言資源、語(yǔ)言工具和語(yǔ)言服務(wù),滿(mǎn)足不同領(lǐng)域和場(chǎng)景的語(yǔ)言需求,解決語(yǔ)言交流、語(yǔ)言學(xué)習(xí)、語(yǔ)言應(yīng)用等方面的問(wèn)題,創(chuàng)造更多的語(yǔ)言利益和語(yǔ)言紅利[7]。
第五,數(shù)字語(yǔ)言學(xué)區(qū)別于計(jì)算語(yǔ)言學(xué)。雖然兩者都依賴(lài)于先進(jìn)的技術(shù)工具和方法來(lái)處理和分析語(yǔ)言數(shù)據(jù),但是計(jì)算語(yǔ)言學(xué)主要關(guān)注使用計(jì)算機(jī)技術(shù)來(lái)執(zhí)行與語(yǔ)言相關(guān)的任務(wù),如機(jī)器翻譯、語(yǔ)音識(shí)別、自然語(yǔ)言理解等。而數(shù)字語(yǔ)言學(xué)更側(cè)重語(yǔ)言數(shù)據(jù)本身,包括數(shù)據(jù)的收集、處理、分析、可視化、存儲(chǔ)和傳播,更關(guān)注理解和解釋語(yǔ)言數(shù)據(jù)在數(shù)字環(huán)境中的表現(xiàn)形式和使用方式[2]。
第六,數(shù)字語(yǔ)言學(xué)與數(shù)字人文密切相關(guān)。Wang等通過(guò)采用分類(lèi)法,最終確定了中國(guó)數(shù)字人文研究的五個(gè)主要關(guān)注點(diǎn),即圖書(shū)情報(bào)學(xué)、語(yǔ)言學(xué)、歷史學(xué)、文學(xué)、藝術(shù)和文化保存[8]。由此可見(jiàn),數(shù)字語(yǔ)言學(xué)是數(shù)字人文框架內(nèi)的一個(gè)專(zhuān)門(mén)分支,它專(zhuān)注于語(yǔ)言文本數(shù)據(jù)的數(shù)字處理和分析,通過(guò)數(shù)字化手段揭示語(yǔ)言的內(nèi)在規(guī)律和變化趨勢(shì)。相比之下,數(shù)字人文則更為宏觀(guān),它將數(shù)字技術(shù)應(yīng)用于人文學(xué)科的廣泛領(lǐng)域,包括但不限于歷史、藝術(shù)、文學(xué)等,還研究圖片、音樂(lè)、藝術(shù)品等多種類(lèi)型的文化產(chǎn)品,旨在解答人類(lèi)文化與社會(huì)現(xiàn)象中的復(fù)雜問(wèn)題[9]。
三、數(shù)字語(yǔ)言學(xué)的發(fā)展歷程
數(shù)字語(yǔ)言學(xué)的發(fā)展歷程不僅體現(xiàn)了科學(xué)技術(shù)的飛速發(fā)展,也反映了語(yǔ)言學(xué)科在新技術(shù)支持下的自我革新與適應(yīng)。盡管被視為一門(mén)新興學(xué)科,數(shù)字語(yǔ)言學(xué)的根基卻深植于語(yǔ)言量化的傳統(tǒng)之中[10],其歷史脈絡(luò)可追溯至計(jì)算機(jī)技術(shù)的誕生之初。
(一)數(shù)字語(yǔ)言學(xué)的初始與早期發(fā)展(20世紀(jì)50年代—70年代)
這一時(shí)期最顯著的特征之一是語(yǔ)言資料的數(shù)字化。隨著電子計(jì)算機(jī)的出現(xiàn),語(yǔ)言學(xué)者開(kāi)始將傳統(tǒng)的語(yǔ)言資料(如詞典、文本、語(yǔ)料庫(kù))轉(zhuǎn)化為電子格式。早期的數(shù)字文本語(yǔ)料庫(kù)的構(gòu)建與應(yīng)用成為數(shù)字語(yǔ)言學(xué)發(fā)展初期的關(guān)鍵。這些語(yǔ)料庫(kù)的建設(shè),提供了可被計(jì)算機(jī)高效分析的大規(guī)模、結(jié)構(gòu)化的語(yǔ)言數(shù)據(jù),為語(yǔ)言學(xué)界帶來(lái)了巨大的飛躍。特別值得一提的是,20世紀(jì)60年代布朗大學(xué)創(chuàng)建的布朗語(yǔ)料庫(kù),作為第一個(gè)百萬(wàn)詞級(jí)別的英語(yǔ)文本語(yǔ)料庫(kù),在語(yǔ)言研究領(lǐng)域?qū)崿F(xiàn)了顯著的進(jìn)步。布朗語(yǔ)料庫(kù)及其類(lèi)似的文本集合,使得語(yǔ)言學(xué)家得以采用量化方法進(jìn)行語(yǔ)言分析,推動(dòng)了更為實(shí)證和數(shù)據(jù)驅(qū)動(dòng)的研究方法。
(二)數(shù)字語(yǔ)言學(xué)的擴(kuò)展與多樣化(20世紀(jì)80年代—21世紀(jì)初期)
互聯(lián)網(wǎng)的普及和發(fā)展,特別是在20世紀(jì)末至21世紀(jì)初期,為數(shù)字語(yǔ)言學(xué)帶來(lái)了全新的研究視角和挑戰(zhàn)。在這一時(shí)期,互聯(lián)網(wǎng)不僅改變了信息獲取和傳播的方式,而且創(chuàng)造了新的語(yǔ)言形式和交流模式。Dalola指出,自個(gè)人電腦出現(xiàn)以來(lái),數(shù)字話(huà)語(yǔ)已經(jīng)徹底改變了溝通實(shí)踐[11]。每一種新的交流類(lèi)型都有其獨(dú)特的語(yǔ)言特征。在互聯(lián)網(wǎng)時(shí)代,語(yǔ)言形式不再是靜態(tài)的了,而是在技術(shù)變革和數(shù)字文化的快速發(fā)展中不斷演變[12]。
然而,這一時(shí)期的數(shù)字語(yǔ)言學(xué)也面臨著挑戰(zhàn)。隨著網(wǎng)絡(luò)語(yǔ)言和數(shù)字文化的快速發(fā)展,對(duì)于處理和解釋大規(guī)模在線(xiàn)文本和話(huà)語(yǔ)的需求日益增加,這要求語(yǔ)言學(xué)家不僅要熟悉傳統(tǒng)的語(yǔ)言學(xué)理論,還要掌握復(fù)雜的計(jì)算方法和數(shù)據(jù)分析技能[13]。
(三)當(dāng)代數(shù)字語(yǔ)言學(xué)(21世紀(jì)初期—現(xiàn)在)
21世紀(jì)初以來(lái),數(shù)字語(yǔ)言學(xué)領(lǐng)域發(fā)生了重大變革,這主要得益于機(jī)器學(xué)習(xí)、人工智能和大數(shù)據(jù)分析等前沿技術(shù)的融合。這一階段見(jiàn)證了該領(lǐng)域從簡(jiǎn)單的計(jì)算工具向能夠處理復(fù)雜語(yǔ)言現(xiàn)象的高級(jí)計(jì)算工具的顯著轉(zhuǎn)變,催生了許多創(chuàng)新的見(jiàn)解和應(yīng)用。
在這個(gè)時(shí)期,值得注意的是歐洲CLARIN (Common Language Resources and Technology Infrastructure) 研究基礎(chǔ)設(shè)施的建設(shè)?;趯?duì)語(yǔ)言在信息時(shí)代核心作用的普遍認(rèn)可以及歐洲委員會(huì)(EC)在制作文本和翻譯官方語(yǔ)言所需技術(shù)的龐大需求,歐洲研究基礎(chǔ)設(shè)施聯(lián)盟(ERIC)自2008年起便著手規(guī)劃CLARIN項(xiàng)目。該項(xiàng)目的宗旨在于促進(jìn)語(yǔ)言資源和技術(shù)的共享、應(yīng)用及持續(xù)性,為研究者提供一個(gè)統(tǒng)一的框架,以便他們能夠便捷地訪(fǎng)問(wèn)和利用語(yǔ)言數(shù)據(jù)及分析工具。
CLARIN的建立標(biāo)志著一個(gè)重要的學(xué)術(shù)網(wǎng)絡(luò)的形成,它不僅涵蓋了25個(gè)成員國(guó)和觀(guān)察員國(guó),還包括70個(gè)研究中心以及超過(guò)90萬(wàn)條的語(yǔ)言記錄。此外,CLARIN還匯集了眾多的數(shù)據(jù)貢獻(xiàn)者、用戶(hù)和培訓(xùn)師,共同推動(dòng)了語(yǔ)言學(xué)研究的深入發(fā)展。這一基礎(chǔ)設(shè)施的建立,不僅加強(qiáng)了跨學(xué)科研究的合作,也為語(yǔ)言學(xué)的數(shù)字化轉(zhuǎn)型提供了堅(jiān)實(shí)的基礎(chǔ),進(jìn)一步促進(jìn)了語(yǔ)言資源的可持續(xù)利用和學(xué)術(shù)交流的國(guó)際化。
與此同時(shí),在歐美等西方國(guó)家的高等教育機(jī)構(gòu)中,數(shù)字語(yǔ)言學(xué)正逐漸成為課程設(shè)置和研究課題的重要組成部分。例如,美國(guó)的加利福尼亞大學(xué)圣巴巴拉分校(UCSB)、瑞士的蘇黎世應(yīng)用科技大學(xué)(ZHAW)、挪威科技大學(xué)(NTNU)等,均已將數(shù)字語(yǔ)言學(xué)納入其學(xué)術(shù)體系。這些舉措不僅反映了學(xué)術(shù)界對(duì)于數(shù)字語(yǔ)言學(xué)重要性的認(rèn)識(shí),也預(yù)示著該領(lǐng)域在教育和研究方面的迅速擴(kuò)張。隨著這些領(lǐng)先教育機(jī)構(gòu)的積極參與,數(shù)字語(yǔ)言學(xué)無(wú)疑將在未來(lái)的語(yǔ)言學(xué)研究中扮演更加關(guān)鍵的角色,推動(dòng)語(yǔ)言學(xué)科與現(xiàn)代科技的深度融合。
四、數(shù)字語(yǔ)言學(xué)專(zhuān)業(yè)在高等教育機(jī)構(gòu)中的構(gòu)建
隨著數(shù)字語(yǔ)言學(xué)的不斷發(fā)展,全球眾多高等教育機(jī)構(gòu)紛紛開(kāi)設(shè)了以“數(shù)字語(yǔ)言學(xué)”直接命名的專(zhuān)業(yè)學(xué)習(xí)項(xiàng)目。例如,斯洛文尼亞盧布爾雅那大學(xué)、捷克馬薩里克大學(xué)以及克羅地亞薩格勒布大學(xué)聯(lián)合推出的數(shù)字語(yǔ)言學(xué)碩士國(guó)際聯(lián)合培養(yǎng)項(xiàng)目(DigiLing-Joint Master in Digital Linguistics),俄羅斯圣彼得堡彼得大帝理工大學(xué)的數(shù)字語(yǔ)言學(xué)碩士項(xiàng)目(Digital Linguistics Master Program)以及瑞士蘇黎世應(yīng)用科技大學(xué)提供的涵蓋本科至碩士階段的數(shù)字語(yǔ)言學(xué)項(xiàng)目。此外,土耳其的土耳其大學(xué)也提供了數(shù)字語(yǔ)言學(xué)碩士及博士項(xiàng)目(Digital Language Studies)。這些項(xiàng)目的設(shè)立表明,數(shù)字語(yǔ)言學(xué)作為一門(mén)新興學(xué)科,在高等教育體系中正逐漸獲得重視,尤其是在碩士層次的教育中。這些項(xiàng)目的發(fā)展不僅反映了數(shù)字語(yǔ)言學(xué)的學(xué)術(shù)價(jià)值,也預(yù)示著該領(lǐng)域在未來(lái)學(xué)術(shù)研究和人才培養(yǎng)中的重要地位。
下面,我們將以盧布爾雅那大學(xué)、馬薩里克大學(xué)和薩格勒布大學(xué)聯(lián)合提供的數(shù)字語(yǔ)言學(xué)碩士國(guó)際聯(lián)合培養(yǎng)項(xiàng)目(DigiLing-Joint Master in Digital Linguistics)為例,深入探討該項(xiàng)目在目標(biāo)設(shè)定、課程體系構(gòu)建以及畢業(yè)要求等方面的實(shí)施情況,以展現(xiàn)數(shù)字語(yǔ)言學(xué)專(zhuān)業(yè)在該項(xiàng)目框架內(nèi)的學(xué)術(shù)發(fā)展與實(shí)踐應(yīng)用。
盧布爾雅那大學(xué)、馬薩里克大學(xué)和薩格勒布大學(xué)聯(lián)合提供的數(shù)字語(yǔ)言學(xué)碩士國(guó)際聯(lián)合培養(yǎng)項(xiàng)目是一個(gè)為期兩年的碩士培養(yǎng)計(jì)劃。這個(gè)學(xué)習(xí)項(xiàng)目總計(jì)120學(xué)分,旨在通過(guò)跨學(xué)科教育,為具有語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)或社會(huì)科學(xué)背景的學(xué)生提供全面而深入的學(xué)習(xí)機(jī)會(huì)。在項(xiàng)目的實(shí)施過(guò)程中,學(xué)生將有機(jī)會(huì)在這三所大學(xué)中任選一所進(jìn)行注冊(cè)學(xué)習(xí),并在第三學(xué)期前往另一所合作大學(xué)交流深造。這種獨(dú)特的培養(yǎng)模式不僅促進(jìn)了學(xué)生跨學(xué)科的融合學(xué)習(xí),還為他們提供了廣闊的國(guó)際視野和寶貴的跨文化交流經(jīng)驗(yàn)。成功完成該項(xiàng)目的學(xué)生,會(huì)獲得由三所合作大學(xué)聯(lián)合頒發(fā)的碩士學(xué)位證書(shū),這一學(xué)習(xí)經(jīng)歷將為他們未來(lái)的學(xué)術(shù)研究和職業(yè)發(fā)展奠定堅(jiān)實(shí)的基礎(chǔ)。
此外,該項(xiàng)目特別強(qiáng)調(diào)構(gòu)建一個(gè)涵蓋語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)、社會(huì)學(xué)、法律和倫理等多元領(lǐng)域的綜合知識(shí)框架(圖1)。通過(guò)精心設(shè)計(jì)的跨學(xué)科課程體系與實(shí)踐導(dǎo)向的教學(xué)模式,激發(fā)學(xué)生的創(chuàng)新思維,培養(yǎng)他們面對(duì)復(fù)雜問(wèn)題時(shí)的解決能力。這一過(guò)程不僅為學(xué)生的學(xué)術(shù)探索提供了深度與廣度的雙重保障,更為他們未來(lái)在數(shù)字語(yǔ)言學(xué)及其相關(guān)領(lǐng)域的職業(yè)生涯鋪設(shè)了堅(jiān)實(shí)的學(xué)術(shù)基石與實(shí)踐平臺(tái)。
該項(xiàng)目第一年的課程結(jié)構(gòu)分為三個(gè)板塊(表1)。一般基礎(chǔ)模塊依據(jù)學(xué)生既有學(xué)術(shù)背景,靈活補(bǔ)充跨學(xué)科知識(shí)的短板,確保學(xué)生具備全面的學(xué)習(xí)基礎(chǔ)。具體而言,對(duì)于人文或社會(huì)科學(xué)背景的學(xué)生,此模塊注重加強(qiáng)編程和統(tǒng)計(jì)學(xué)的基礎(chǔ)教育;而對(duì)于技術(shù)或計(jì)算背景的學(xué)生,則側(cè)重于深化他們對(duì)語(yǔ)言學(xué)和數(shù)字通信原理的理解;特定學(xué)科基礎(chǔ)模塊則提供了深度探索的機(jī)會(huì),其中包括自然語(yǔ)言處理的必修課程以及一系列涉及社會(huì)語(yǔ)言學(xué)、語(yǔ)料庫(kù)語(yǔ)言學(xué)、信息安全、倫理學(xué)和計(jì)算語(yǔ)言建模等領(lǐng)域的選修課程。這些課程不僅拓寬了學(xué)生的知識(shí)邊界,還促進(jìn)了學(xué)科間的交叉融合。研究與應(yīng)用模塊則強(qiáng)調(diào)了理論與實(shí)踐的緊密結(jié)合。通過(guò)教授研究方法論,鼓勵(lì)學(xué)生參與實(shí)習(xí)或項(xiàng)目實(shí)踐,該模塊旨在培養(yǎng)學(xué)生的實(shí)踐能力和解決問(wèn)題的能力。這種教學(xué)模式有助于學(xué)生將所學(xué)知識(shí)應(yīng)用于實(shí)際情境中,從而加深對(duì)理論知識(shí)的理解和掌握。
該項(xiàng)目第二年的課程結(jié)構(gòu)也分為三個(gè)板塊(表2),即語(yǔ)言與計(jì)算專(zhuān)題、語(yǔ)言與社會(huì)專(zhuān)題、研究與應(yīng)用。在第三個(gè)學(xué)期,學(xué)生需前往任一合作大學(xué)完成一個(gè)強(qiáng)制性的學(xué)期交換,該學(xué)期包含圍繞特定主題的選修課程及一項(xiàng)獨(dú)立研究項(xiàng)目的實(shí)施,以促進(jìn)學(xué)生在國(guó)際環(huán)境中的學(xué)術(shù)探索與交流。在第四學(xué)期,學(xué)生則返回其注冊(cè)大學(xué),繼續(xù)深入學(xué)習(xí)語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)和社會(huì)科學(xué)領(lǐng)域的高級(jí)課程,為他們的知識(shí)體系增添深度與廣度。
通過(guò)對(duì)盧布爾雅那大學(xué)、馬薩里克大學(xué)和薩格勒布大學(xué)聯(lián)合提供的數(shù)字語(yǔ)言學(xué)碩士國(guó)際聯(lián)合培養(yǎng)項(xiàng)目的分析,我們可以明確地認(rèn)識(shí)到,數(shù)字語(yǔ)言學(xué)專(zhuān)業(yè)的設(shè)計(jì)是以跨學(xué)科的教育模式來(lái)深化學(xué)生在語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)及社會(huì)科學(xué)等多個(gè)領(lǐng)域的知識(shí)和技能的。通過(guò)這一綜合性的學(xué)習(xí)體驗(yàn),學(xué)生們不僅深化了對(duì)全球語(yǔ)言技術(shù)挑戰(zhàn)的認(rèn)識(shí),提升了自身的創(chuàng)新潛能和處理復(fù)雜問(wèn)題的能力,而且也為他們?cè)跀?shù)字化時(shí)代的多樣化職業(yè)發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。高校中數(shù)字語(yǔ)言學(xué)專(zhuān)業(yè)的設(shè)立,為該領(lǐng)域的研究和實(shí)踐發(fā)展注入了寶貴的人才資源,確保了學(xué)術(shù)傳承與創(chuàng)新的持續(xù)動(dòng)力。
五、中國(guó)數(shù)字語(yǔ)言研究的建設(shè)與發(fā)展
盡管數(shù)字語(yǔ)言學(xué)的研究在中國(guó)起步較晚,但是卻擁有良好的基礎(chǔ)設(shè)施建設(shè),即豐富多元的語(yǔ)料庫(kù)資源。自20世紀(jì)70年代起,中國(guó)學(xué)者和研究機(jī)構(gòu)致力于構(gòu)建多元化的語(yǔ)料庫(kù)資源,涵蓋了現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)、垂直領(lǐng)域?qū)S谜Z(yǔ)料庫(kù)、平行語(yǔ)料庫(kù)、中介語(yǔ)語(yǔ)料庫(kù)以及多模態(tài)語(yǔ)料庫(kù)等多個(gè)維度。這些語(yǔ)料庫(kù)的建立,如中國(guó)社會(huì)科學(xué)院語(yǔ)言研究所的國(guó)家語(yǔ)料庫(kù)、北京大學(xué)的現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)(CCL)、北京語(yǔ)言大學(xué)的現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)(BCC)等,不僅為數(shù)字語(yǔ)言學(xué)的研究提供了豐富的數(shù)據(jù)基礎(chǔ),而且為該領(lǐng)域的理論創(chuàng)新和應(yīng)用實(shí)踐奠定了堅(jiān)實(shí)的基礎(chǔ)設(shè)施。
為了進(jìn)一步促進(jìn)語(yǔ)言資源的共享與利用,中文語(yǔ)言資源聯(lián)盟(Chinese Language Data Consortium)應(yīng)運(yùn)而生。該聯(lián)盟旨在通過(guò)學(xué)術(shù)合作與資源共享,推動(dòng)中國(guó)語(yǔ)言資源的整合與優(yōu)化。聯(lián)盟的成立,不僅標(biāo)志著中國(guó)在語(yǔ)言資源管理與利用方面邁出了重要步伐,而且對(duì)于提升數(shù)字語(yǔ)言學(xué)研究的國(guó)際影響力具有重要意義。
在學(xué)術(shù)論著方面,近年來(lái)數(shù)字語(yǔ)言學(xué)的研究也取得了顯著的成就。例如,王春輝[14-17]深入探討了數(shù)字社會(huì)背景下的語(yǔ)言及語(yǔ)言生活的新變化以及這些變化對(duì)語(yǔ)言治理提出的新挑戰(zhàn)和語(yǔ)言倫理方面的考量。姜國(guó)權(quán)和李一飛[7]從社會(huì)角度出發(fā),分析了數(shù)字化時(shí)代語(yǔ)言生活的特征。陳麗湘[18]從國(guó)家發(fā)展的層面出發(fā),指出語(yǔ)言的多樣性和多層次性需求正推動(dòng)著語(yǔ)言文字?jǐn)?shù)字化進(jìn)程的快速發(fā)展。戴曼純[3]區(qū)分了數(shù)字與非數(shù)字語(yǔ)言生活兩種界定,并且探討了數(shù)字語(yǔ)言生活研究面臨的問(wèn)題和挑戰(zhàn)。
盡管中國(guó)在數(shù)字語(yǔ)言學(xué)領(lǐng)域的研究已取得初步進(jìn)展,但與國(guó)際同領(lǐng)域相比,我們的研究仍處于相對(duì)初級(jí)階段,具有顯著的發(fā)展?jié)摿?。在未?lái)數(shù)年內(nèi),我們建議集中精力于以下幾個(gè)關(guān)鍵領(lǐng)域。
第一,加強(qiáng)數(shù)字語(yǔ)言研究的基礎(chǔ)設(shè)施建設(shè)。數(shù)字語(yǔ)言研究的基礎(chǔ)設(shè)施指的是由在數(shù)字環(huán)境下進(jìn)行語(yǔ)言研究所需的語(yǔ)言數(shù)據(jù)集、網(wǎng)絡(luò)標(biāo)準(zhǔn)協(xié)議、平臺(tái)、軟件工具和人才以及合作模式形成的一個(gè)聯(lián)合體[19]。目前,一些國(guó)家已將數(shù)字語(yǔ)言研究的基礎(chǔ)設(shè)施建設(shè)納入國(guó)家戰(zhàn)略中。數(shù)字語(yǔ)言研究基礎(chǔ)設(shè)施建設(shè)需要大量的投資和人力以及與國(guó)內(nèi)外其他數(shù)字語(yǔ)言學(xué)機(jī)構(gòu)的合作[20]。研究發(fā)現(xiàn),中國(guó)的數(shù)字語(yǔ)言學(xué)在基礎(chǔ)設(shè)施方面可能會(huì)遇到以下幾個(gè)問(wèn)題:(1)數(shù)據(jù)存儲(chǔ)和管理問(wèn)題。數(shù)字語(yǔ)言學(xué)涉及大量的語(yǔ)料庫(kù)和多語(yǔ)種數(shù)據(jù),它需要高效、可靠的數(shù)據(jù)存儲(chǔ)和管理系統(tǒng)。這不僅包括數(shù)據(jù)的存儲(chǔ),還包括數(shù)據(jù)的組織、訪(fǎng)問(wèn)和長(zhǎng)期保存。由于數(shù)據(jù)量可能非常大,這需要顯著的存儲(chǔ)空間和高效的數(shù)據(jù)管理策略。(2)數(shù)據(jù)共享和訪(fǎng)問(wèn)權(quán)限問(wèn)題。不同學(xué)者和研究機(jī)構(gòu)之間共享數(shù)據(jù)和資源是一個(gè)挑戰(zhàn),包括如何以安全的方式共享數(shù)據(jù)、如何確保數(shù)據(jù)使用的合法性以及如何處理版權(quán)和隱私問(wèn)題。(3)工具和軟件的開(kāi)發(fā)與長(zhǎng)期維護(hù)問(wèn)題。數(shù)字語(yǔ)言學(xué)研究依賴(lài)于專(zhuān)門(mén)的分析工具和軟件,這些工具需要不斷地更新和維護(hù)以適應(yīng)新的研究需求和技術(shù)變革,這需要持續(xù)的技術(shù)支持和資金投入。(4)國(guó)際合作和標(biāo)準(zhǔn)化問(wèn)題。數(shù)字語(yǔ)言學(xué)研究往往具有國(guó)際性,涉及跨語(yǔ)言、跨文化的數(shù)據(jù)和研究[21]。因此建立國(guó)際合作機(jī)制、統(tǒng)一的數(shù)據(jù)格式和標(biāo)準(zhǔn)對(duì)于促進(jìn)全球范圍內(nèi)的研究合作至關(guān)重要。
第二,推動(dòng)高等教育機(jī)構(gòu)設(shè)立數(shù)字語(yǔ)言學(xué)學(xué)科。經(jīng)過(guò)綜合考察,目前尚未發(fā)現(xiàn)國(guó)內(nèi)有高等教育機(jī)構(gòu)設(shè)立明確以“數(shù)字語(yǔ)言學(xué)”命名的本科、碩士或博士層次的學(xué)位項(xiàng)目。同樣,也未見(jiàn)到數(shù)字語(yǔ)言學(xué)與其他學(xué)科交叉融合的學(xué)位點(diǎn)與專(zhuān)業(yè)建設(shè)。鑒于數(shù)字語(yǔ)言學(xué)在現(xiàn)代學(xué)術(shù)研究和社會(huì)實(shí)踐中的應(yīng)用日益廣泛,高等教育機(jī)構(gòu)有責(zé)任著手構(gòu)建相應(yīng)的專(zhuān)業(yè)教育體系,以培育具有數(shù)字語(yǔ)言學(xué)專(zhuān)業(yè)知識(shí)和技能的人才。
第三,加快數(shù)字語(yǔ)言學(xué)研究成果的產(chǎn)業(yè)化轉(zhuǎn)換。語(yǔ)言產(chǎn)業(yè)是數(shù)字時(shí)代重要的產(chǎn)業(yè)形態(tài)和經(jīng)濟(jì)增長(zhǎng)點(diǎn)。加強(qiáng)數(shù)字時(shí)代語(yǔ)言產(chǎn)業(yè)發(fā)展研究,有利于為語(yǔ)言產(chǎn)業(yè)發(fā)展提供智力支撐,為數(shù)字經(jīng)濟(jì)發(fā)展注入活力[22]。數(shù)字語(yǔ)言的研究成果可以在社會(huì)的多個(gè)領(lǐng)域進(jìn)行產(chǎn)業(yè)轉(zhuǎn)換。例如,瑞士蘇黎世應(yīng)用科技大學(xué)的數(shù)字語(yǔ)言學(xué)研究通過(guò)對(duì)公共話(huà)語(yǔ)進(jìn)行建模、分析和模擬,為商業(yè)合作伙伴和客戶(hù)提供溝通技能,使他們能夠處理公共話(huà)語(yǔ),并幫助他們量身制定溝通解決方案。通過(guò)產(chǎn)業(yè)化,數(shù)字語(yǔ)言學(xué)的研究成果可以在教育、健康溝通等多個(gè)領(lǐng)域得到實(shí)際應(yīng)用,滿(mǎn)足社會(huì)和經(jīng)濟(jì)發(fā)展的需求。
六、結(jié) 語(yǔ)
在全球信息化浪潮的推動(dòng)下,數(shù)字語(yǔ)言學(xué)作為一門(mén)前沿交叉學(xué)科,其飛速發(fā)展標(biāo)志著語(yǔ)言學(xué)研究步入了一個(gè)全新的數(shù)字化時(shí)代。該領(lǐng)域不僅在語(yǔ)料庫(kù)構(gòu)建、語(yǔ)言數(shù)據(jù)高效管理方面取得了顯著成就,更通過(guò)與人工智能、大數(shù)據(jù)等尖端技術(shù)的深度融合,重塑了傳統(tǒng)語(yǔ)言學(xué)的研究框架與思維邏輯。數(shù)字語(yǔ)言學(xué)的蓬勃發(fā)展,不僅是技術(shù)進(jìn)步的直觀(guān)體現(xiàn),更深刻推動(dòng)了人類(lèi)對(duì)語(yǔ)言本質(zhì)和結(jié)構(gòu)的理解,實(shí)現(xiàn)了語(yǔ)言學(xué)領(lǐng)域的深層次變革。
與計(jì)算語(yǔ)言學(xué)相比,數(shù)字語(yǔ)言學(xué)展現(xiàn)出更加廣闊的研究視野。其核心目標(biāo)不僅限于利用計(jì)算手段解決特定的語(yǔ)言處理任務(wù),而且更專(zhuān)注于語(yǔ)言數(shù)據(jù)的全面采集、系統(tǒng)化管理、精細(xì)化分析和可視化呈現(xiàn)。這種全方位的研究方法使得數(shù)字語(yǔ)言學(xué)能夠提供對(duì)語(yǔ)言現(xiàn)象更為深刻和多維度的解讀。此外,數(shù)字語(yǔ)言學(xué)與數(shù)字人文研究在目標(biāo)和方法上也存在明顯差異。數(shù)字語(yǔ)言學(xué)聚焦于語(yǔ)言數(shù)據(jù)在數(shù)字環(huán)境中的應(yīng)用價(jià)值與信息挖掘,而數(shù)字人文學(xué)科則主要關(guān)注文化遺產(chǎn)、歷史材料的數(shù)字化處理與分析。通過(guò)對(duì)大量語(yǔ)言數(shù)據(jù)的深入解析,數(shù)字語(yǔ)言學(xué)為理解語(yǔ)言的復(fù)雜性及其動(dòng)態(tài)演變提供了全新的理論框架和研究工具,推動(dòng)了語(yǔ)言研究的范式向更為數(shù)據(jù)驅(qū)動(dòng)的方向轉(zhuǎn)型。
當(dāng)前,中國(guó)在數(shù)字語(yǔ)言學(xué)領(lǐng)域雖已取得初步成果,但仍面臨基礎(chǔ)設(shè)施不健全、數(shù)據(jù)共享機(jī)制缺失、分析工具滯后及學(xué)科體系構(gòu)建滯后等挑戰(zhàn)。高等教育體系中相關(guān)專(zhuān)業(yè)與課程的匱乏,亦阻礙了專(zhuān)業(yè)人才的培養(yǎng)與學(xué)科的國(guó)際化發(fā)展。為應(yīng)對(duì)這些挑戰(zhàn),中國(guó)亟須借鑒國(guó)際先進(jìn)經(jīng)驗(yàn),強(qiáng)化跨學(xué)科合作,加快標(biāo)準(zhǔn)化建設(shè)和數(shù)據(jù)資源共享機(jī)制的落實(shí)。同時(shí),通過(guò)在高校增設(shè)相關(guān)課程,完善人才培養(yǎng)體系,從根本上提升我國(guó)在數(shù)字語(yǔ)言學(xué)領(lǐng)域的科研實(shí)力與國(guó)際影響力。
展望未來(lái),數(shù)字語(yǔ)言學(xué)將在更多應(yīng)用場(chǎng)景中展現(xiàn)出獨(dú)特的價(jià)值。在語(yǔ)言教育領(lǐng)域,數(shù)字語(yǔ)言學(xué)可以為學(xué)習(xí)者提供個(gè)性化的學(xué)習(xí)路徑,并通過(guò)智能化語(yǔ)言學(xué)習(xí)工具提升學(xué)習(xí)效果。在公共服務(wù)領(lǐng)域,數(shù)字語(yǔ)言學(xué)為政府政策制定、語(yǔ)言保護(hù)和語(yǔ)言規(guī)劃提供了科學(xué)依據(jù),有助于優(yōu)化公共服務(wù)和提高社會(huì)溝通效率。此外,數(shù)字語(yǔ)言學(xué)在商業(yè)領(lǐng)域也具有廣闊的前景,特別是在跨國(guó)企業(yè)中,它可以幫助企業(yè)更好地理解和適應(yīng)不同文化背景下的語(yǔ)言使用,避免因語(yǔ)言誤解而帶來(lái)的商業(yè)風(fēng)險(xiǎn)。盡管數(shù)字語(yǔ)言學(xué)的前景光明,但它的未來(lái)發(fā)展不僅取決于技術(shù)進(jìn)步,更依賴(lài)于與其他學(xué)科的深度融合與協(xié)同合作。通過(guò)打破學(xué)科壁壘,推動(dòng)理論研究與實(shí)際應(yīng)用的無(wú)縫銜接,數(shù)字語(yǔ)言學(xué)將進(jìn)一步推動(dòng)全球語(yǔ)言學(xué)研究的范式轉(zhuǎn)型,促進(jìn)國(guó)際間的語(yǔ)言技術(shù)創(chuàng)新與文化交流。
參考文獻(xiàn):
[1] 袁毓林.人工智能大飛躍背景下的語(yǔ)言學(xué)理論思考[J].語(yǔ)言戰(zhàn)略研究, 2023(4):7-18.
[2] Witt A.Digital Linguistics[M].Berlin, Boston: De Gruyter, 2021.
[3] 戴曼純.數(shù)字時(shí)代的語(yǔ)言生活及其研究[J].外國(guó)語(yǔ)(上海外國(guó)語(yǔ)大學(xué)學(xué)報(bào)), 2024(1):17-25.
[4] Vijavakumar S, Sheik H N.Embracing Paralinguistic Elements in Digital Linguistics: A Scooping Review of Emoji Semiotics and Implications for Cross-Cultural Online Communication[J].Journal of the Asiatic Society, 2023(1):40-45
[5] Laghari R.Digital Linguistics: Unraveling the Tapestry: Digital Dimensions of Language Exploration [EB/OL].(2023-07-22) [2024-05-20].https://www.linkedin.com/pulse/digital-linguistics-unraveling-tapestry-dimensions-language-laghari/.
[6] Daniel W H.Digital Linguistics (DLx): The Science of Digital Data Management for Linguistics [EB/OL].(2023-04-16) [2024-05-20].https://digitallinguistics.io/about/.
[7] 姜國(guó)權(quán), 李一飛.數(shù)字時(shí)代的語(yǔ)言新特征[EB/OL].(2022-06-05)[2024-05-20].https://epaper.gmw.cn/gmrb/html/2022-06/05/nw.D110000gmrb_20220605_2-05.htm.
[8] Wang X, Tan X, Li H.The Evolution of Digital Humanities in China[J].Library Trends, 2020(1):7-29.
[9] 宋麗玨.法律翻譯的數(shù)字人文轉(zhuǎn)型研究:以專(zhuān)題數(shù)據(jù)庫(kù)與ChatGPT為中心[J].外語(yǔ)學(xué)刊,2024(2):51-57.
[10] Sargsyan M.Digital Linguistics as A New Direction in Language Study: Development Prospects [EB/OL].(2023-11-08)[2024-05-20].https://arar.sci.am/publication/390546#info.
[11] Dalola A.Introduction to Special Issue on French Variation in Digital Media[J].Journal of French Language Studies, 2022(2):115-119.
[12] Teich E, Degaetano-Ortlieb S, Fankhauser P, et al.The Linguistic Construal of Disciplinarity: A Data‐Mining Approach Using Register Features[J].Journal of the Association for Information Science and Technology, 2016(7):1668-1678.
[13] Tokumaru K.An Information Theory of Language (Digital Linguistics)[J].Linguistics and Literature Studies, 2019(5):206-219.
[14] 王春輝.數(shù)字社會(huì)對(duì)語(yǔ)言治理提出新要求[EB/OL].(2021-09-19)[2024-05-20].https://www.thepaper.cn/newsDetail_forward_14581829.
[15] 王春輝.語(yǔ)言數(shù)據(jù)安全論[J].語(yǔ)言戰(zhàn)略研究, 2022(4):15-25.
[16] 王春輝.數(shù)字時(shí)代語(yǔ)言倫理的新形態(tài)和新表現(xiàn)[J].社會(huì)科學(xué)戰(zhàn)線(xiàn), 2022(12):152-159.
[17] 王春輝.自然人、機(jī)器人、數(shù)字人“三人”共生時(shí)代的語(yǔ)言生活[J].語(yǔ)言戰(zhàn)略研究, 2024(3):7-16.
[18] 陳麗湘.數(shù)字化引領(lǐng)語(yǔ)言文字生活新形態(tài)[EB/OL].(2022-04-06)[2024-05-20].https://news.gmw.cn/2022-04/06/content_35636321.htm.
[19] 趙薇.數(shù)字時(shí)代人文學(xué)研究的變革與超越:數(shù)字人文在中國(guó)[J].社會(huì)科學(xué)文摘, 2022(2):11-14.
[20] 李宇明.語(yǔ)言數(shù)據(jù)是信息時(shí)代的生產(chǎn)要素[EB/OL].(2020-07-04)[2024-05-20].https://news.gmw.cn/2020-07/04/content_33965331.htm.
[21] 劉海濤.數(shù)據(jù)驅(qū)動(dòng)的應(yīng)用語(yǔ)言學(xué)研究[J].現(xiàn)代外語(yǔ), 2021(4):462-469.
[22] 姜國(guó)權(quán),李一飛,趙屹青.試論數(shù)字時(shí)代的語(yǔ)言產(chǎn)業(yè)發(fā)展[J].語(yǔ)言文字應(yīng)用, 2023(3):16-24.
責(zé)任編輯:劉伊念
Definition, Characteristics, and Development of Digital Linguistics
WANG Li1, WANG Chunhui2
(1.School of Literature and Media, Hubei University of Arts and Science, Xiangyang Hubei 441053;
2. Research Center for Language Governance, Capital Normal University, Beijing 100089)
Abstract: Digital linguistics is a new subject which studies the application and development of language in digital environment. Different from computational linguistics, digital linguistics has a broader research horizon. Its core goal, not only limited to the use of computational means to solve specific language processing tasks, focuses on the comprehensive collection, systematic management, fine analysis, and visual presentation of language data; it pays attention to the industrialization of research results, and is closely related to digital people. China has made initial progress in the field of digital linguistics research, yet, it can further develop infrastructure construction, the construction of disciplinary and educational systems, and the industrialization of research results. In the future, digital linguistics will show its unique value in more application scenarios including language education, public service, and business.
Key words: digital linguistics; computational linguistics; corpus; digital humanity; linguistic data
(E-mail:lynsy@ jhun. edu. cn)
收稿日期:2024 - 09 - 02 本刊網(wǎng)址·在線(xiàn)期刊:http://qks. jhun. edu. cn/jhxs
基金項(xiàng)目:國(guó)家語(yǔ)委“十四五”科研規(guī)劃2021年度重大項(xiàng)目“我國(guó)語(yǔ)言文字治理體系現(xiàn)狀及創(chuàng)新研究”(ZDA145-1)
作者簡(jiǎn)介:王 荔,女,湖北襄陽(yáng)人,湖北文理學(xué)院文學(xué)與傳媒學(xué)院講師,博士,E-mail:345688261@qq.com;王春輝(通訊作者),男,山東萊蕪人,首都師范大學(xué)語(yǔ)言治理研究中心教授,(國(guó)家語(yǔ)委)語(yǔ)言治理研究融智協(xié)同創(chuàng)新中心研究員,E-mail:friendwch@126.com。