国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于時(shí)態(tài)GIS的中國歷史方言地理信息系統(tǒng)構(gòu)建

2023-01-14 13:03:38孫光旭
關(guān)鍵詞:時(shí)空方言漢語

孫光旭,張 義

(1.淮北師范大學(xué) 外國語學(xué)院;2.淮北師范大學(xué) 文學(xué)院,安徽 淮北 235000)

漢語方言是一道獨(dú)特且復(fù)雜的文化景觀。從歷史方言的地理發(fā)展情況看,不同方言在語音、詞匯和語法結(jié)構(gòu)上的異同以及其在地理上的不同分布,不僅對語言研究具有重要作用,更能反映歷史文化的歷史變遷。漢語方言是漢語發(fā)展不同階段的活化石,折射出了漢語史的局部面貌,前人在研究漢語史時(shí),已注意到了方言材料的獨(dú)特價(jià)值,關(guān)注語言空間分布的差異,并開展方言的調(diào)查與記錄工作。在地理信息技術(shù)迅速發(fā)展、時(shí)空GIS技術(shù)不斷成熟的當(dāng)下,將海量歷史方言材料與地理信息技術(shù)充分結(jié)合利用,直觀地展示漢語方言時(shí)空的變遷,將為漢語方言的進(jìn)一步研究提供有益的幫助。

本文通過整合漢語歷史方言資料,采用時(shí)空GIS技術(shù),建立中國歷史方言地理信息系統(tǒng),以直觀的方式展示方言在地理空間上的變化,以期補(bǔ)證或驗(yàn)證前人的研究,為進(jìn)一步促進(jìn)對漢語方言、漢語史的研究提供一些參考和新的視角。

一、歷史方言研究現(xiàn)狀

(一)歷史方言數(shù)據(jù)材料的整理

方言數(shù)據(jù)是建成中國歷史方言地理信息系統(tǒng)的基礎(chǔ)。方言研究在我國有悠久的歷史、優(yōu)良的傳統(tǒng)。漢語方言文獻(xiàn)記錄歷經(jīng)幾千年不間斷地累積,可研究的漢語方言文獻(xiàn)數(shù)據(jù)材料已經(jīng)相當(dāng)可觀。這些材料大致可以分為如下幾類:其一,歷史方言調(diào)查材料。包括自西漢揚(yáng)雄以來歷代學(xué)者有意識(shí)進(jìn)行的方言記錄。其二,方言性質(zhì)的歷史文獻(xiàn)。相比有意識(shí)的方言調(diào)查而言,歷代文獻(xiàn)中方言性質(zhì)的材料則更加豐富。歷代的經(jīng)書注疏、字書、韻書以及詩文、詞典、戲文、筆記、小說、野史、地方戲等各類文獻(xiàn)中包含著豐富的方言資料。其三,方音韻書或同音字表。經(jīng)典韻書或多或少也存在一些方音色彩,而明確標(biāo)明實(shí)際方音的近代韻書數(shù)量更多。其四,地方志之方言章。

上述材料從地域、時(shí)間及內(nèi)容分布上來看,都比較零散,給研究者的利用帶來了很大的不便。其一,材料數(shù)據(jù)量龐大,沒有任何一個(gè)課題能夠占有或者利用全部的材料。這使得學(xué)者的所據(jù)材料在很大程度上是局部的、片面的,于是在進(jìn)行漢語方言、漢語史的相關(guān)研究時(shí),難免出現(xiàn)“摸象之惑”。其二,在現(xiàn)實(shí)的研究中,時(shí)空觀念的缺失,導(dǎo)致不能深入、全面、系統(tǒng)地考察語言歷時(shí)共時(shí)的演進(jìn)過程,而忽視了漢語方言的時(shí)間或者空間屬性特征所致的錯(cuò)誤比比皆是,如“葉韻說”以及切韻音系基礎(chǔ)方言的爭論等。其三,不同類型或者不同時(shí)間區(qū)域方言材料之間的內(nèi)在關(guān)系不能得到有效的關(guān)聯(lián),沒有一定的關(guān)系圖譜,則難以多類材料互證,在研究時(shí)就難以形成有效證據(jù)鏈。

(二)漢語方言研究輔助技術(shù)的利用

直到19世紀(jì)末,在青年語法學(xué)派的倡導(dǎo)下,德國學(xué)者吉耶龍等人開始使用地圖的形式描述語言特征的空間分布。這一研究范式極具解釋力,為研究印歐語系的譜系分類提供了有力支持,并形成了一門新興的分支學(xué)科——地理語言學(xué)。地理語言學(xué)主要通過繪制方言地圖,直觀地展示方言特征在空間上的分布,研究者能從全局出發(fā),審視多因素交互背景下的語言變異機(jī)制。

GIS技術(shù)的興起從根本上改變了收集、顯示、存儲(chǔ)、轉(zhuǎn)換、分析和表達(dá)空間信息的方式,為解決上述問題提供了新的思路。然而,傳統(tǒng)的GIS并沒有真正做到時(shí)間、空間和方言屬性的整合。它只描述了語言在某一時(shí)刻的情況,無法顯示全程和預(yù)判其趨勢。而時(shí)空GIS的提出,為我們綜合利用海量歷史方言材料提供了可能。時(shí)空GIS具有空間和時(shí)空特點(diǎn),時(shí)空GIS技術(shù)使信息的時(shí)間、空間和屬性三要素的集成得以實(shí)現(xiàn),使我們能夠重建、跟蹤、預(yù)測和模擬空間數(shù)據(jù)的歷史演變過程,這些特征與龐大且復(fù)雜的漢語方言數(shù)據(jù)融合性更好。

二、中國歷史方言地理信息系統(tǒng)的構(gòu)建過程

筆者嘗試采用時(shí)空GIS模型,以譚其驤《中國歷史地圖集》為底圖,制作中國歷史時(shí)態(tài)GIS數(shù)據(jù)庫,以揚(yáng)雄《方言》為綱,建立歷史方言數(shù)據(jù)庫,同時(shí)創(chuàng)建一個(gè)非語言因素的數(shù)據(jù)庫,整合并構(gòu)建中國歷史方言的地理信息系統(tǒng)。[1]系統(tǒng)構(gòu)成如圖1:

圖1 中國歷史方言地理信息系統(tǒng)框架

(一)制作中國歷史時(shí)態(tài)GIS數(shù)據(jù)庫

以譚其驤的《中國歷史地圖集》為底圖,建立了中國歷史時(shí)態(tài)GIS數(shù)據(jù)庫。從原始社會(huì)到清末,該地圖集有304幅地圖和大約70000個(gè)準(zhǔn)確的地名。內(nèi)容包括各民族政權(quán)的領(lǐng)土或活動(dòng)范圍、行政區(qū)和一些部落的分布、秦朝以前可以考查的名稱的位置和范圍、秦朝以后縣級(jí)以上名稱情況,還有主要的河流、湖泊、山嶺及海岸線、島嶼等。它被公認(rèn)為是我國到目前為止最為完整、權(quán)威的一部大型歷史地圖集,是我們構(gòu)建時(shí)空數(shù)據(jù)模型的最佳選擇。

幾千年來,受政治、經(jīng)濟(jì)等因素的影響,中國的版圖和行政區(qū)劃一直在不斷變化。由于行政區(qū)劃導(dǎo)致空間拓?fù)潢P(guān)系的廢除、更名、邊界變化和一系列復(fù)雜變化,很難實(shí)現(xiàn)對空間的時(shí)間表達(dá)。首先,語言是交際交流工具,長期穩(wěn)定無變化。其次,目前能夠掌握的歷史方言材料在時(shí)間上的分布是很不均勻的,大多數(shù)沒有精確到縣級(jí)程度。再次,雖然不同年代行政區(qū)的邊界和名稱都發(fā)生了很大變化,但行政區(qū)在全國范圍內(nèi)仍有相對穩(wěn)定的傳統(tǒng)邊界和相對較長的存在期。因此,我們認(rèn)為太詳細(xì)的空間數(shù)據(jù)只會(huì)導(dǎo)致冗余。通過調(diào)整提高系統(tǒng)效率,根據(jù)現(xiàn)有方言數(shù)據(jù)的時(shí)空分布對空間粒度的選擇進(jìn)行一些調(diào)整。

由于方言材料的空間離散性會(huì)造成數(shù)據(jù)的冗余問題,可以考慮將時(shí)間作為空間的一種屬性被附加到空間數(shù)據(jù)上,而離散的時(shí)空數(shù)據(jù)在傳統(tǒng)的靜態(tài)數(shù)據(jù)庫中通過某些算法關(guān)聯(lián)起來。對于歷史方言數(shù)據(jù)等時(shí)空粒度大、屬性數(shù)據(jù)量相對穩(wěn)定的系統(tǒng),其實(shí)現(xiàn)簡單便捷,對方言數(shù)據(jù)的處理具有較好的表現(xiàn)。

(二)構(gòu)建語言信息數(shù)據(jù)庫

以揚(yáng)雄《方言》為綱構(gòu)建語言信息數(shù)據(jù)庫。以揚(yáng)雄《方言》為參照,主要有以下原因:首先,時(shí)間早。《方言》是第一部“自覺”的方言調(diào)查專著。其次,收集的方言材料共計(jì)15卷,收錄了9000余字。第三,測區(qū)相對較寬。第四,后世有不少對其注釋或調(diào)查。至少有30多種注釋方言的文獻(xiàn)。比較這些資料,觀察方言詞匯隨時(shí)間變化分布情況,較易知曉揚(yáng)雄時(shí)期到該文獻(xiàn)著錄時(shí)期的歷史變革。

需要說明的是,更為復(fù)雜的是與方言分布有關(guān)的地名體系。例如,揚(yáng)雄《方言》中既包括行政區(qū)劃名稱也包括自然地理名稱;古代地名和漢代地名。我們有必要將不同類型和時(shí)間的地名系統(tǒng)轉(zhuǎn)換和統(tǒng)一為時(shí)空數(shù)據(jù)庫中可接受的時(shí)空ID,我們稱之為方言地域地名的識(shí)別過程,這樣才能保證空間數(shù)據(jù)和方言屬性數(shù)據(jù)的有機(jī)結(jié)合。

另外,與詞匯數(shù)據(jù)不同,語音數(shù)據(jù)具有特殊性。事實(shí)上,語音差異是單詞在不同時(shí)間和空間維度上的語音變化,即語音數(shù)據(jù)只能通過詞匯層面與特定的時(shí)空數(shù)據(jù)聯(lián)系起來。筆者認(rèn)為,一方面,應(yīng)該考慮到所有漢語的語音元素,另一方面,在所有方言中都必須找到作為相關(guān)項(xiàng)目的詞。出于這一考慮,我們在中國社會(huì)科學(xué)院編制的《方言調(diào)查字表》中選擇了一些與揚(yáng)雄《方言》交叉的詞匯。高本漢認(rèn)為:“現(xiàn)代漢語方言,除了閩語之外都從《切韻》語言演化而來。”[2]通過調(diào)查《方言查字表》中各方言條目的表達(dá)情況,我們可以基本確定方言的語音特征。

(三)建立非語言因素?cái)?shù)據(jù)庫

人口遷移、民族融合、自然地理、行政區(qū)劃的演變和其他因素可能會(huì)對語言變異產(chǎn)生影響,但這些因素是離散的,必須單獨(dú)構(gòu)建數(shù)據(jù)庫??紤]到相關(guān)數(shù)據(jù)的多樣性,我們首先建立了一個(gè)人口遷移數(shù)據(jù)庫,后期在此庫的基礎(chǔ)上進(jìn)行擴(kuò)充。人口遷移流動(dòng)對漢語方言形成發(fā)揮了重要作用。移民數(shù)據(jù)主要基于葛劍雄等人的《中國移民史》。這本書論述了從先秦到20世紀(jì)40年代的中國移民問題,列出了從公元前21世紀(jì)到新中國成立前的移民事件,闡釋了其過程和產(chǎn)生的影響。

在中國歷史上,移民存在遷入和遷出情況,各個(gè)地區(qū)特點(diǎn)存在差異,不同類型的移民對漢語方言的形成造成的影響存在差異。為了研究移民對方言的影響,移民事件作為數(shù)據(jù)庫中的唯一ID,需要標(biāo)明移入移出地的ID、移入移出時(shí)間、移民人數(shù)和當(dāng)?shù)卣Z言類型等因素。

以上數(shù)據(jù)可以通過系統(tǒng)中時(shí)間作為空間的屬性加入到空間數(shù)據(jù)。當(dāng)與之對應(yīng)的空間ID確定后,方便確定時(shí)間。另外,方言和移民數(shù)據(jù)也是通過空間分布與地理數(shù)據(jù)關(guān)聯(lián)的。因此,有必要將轉(zhuǎn)換和統(tǒng)一成可接受的時(shí)空ID,以確??臻g數(shù)據(jù)和方言屬性數(shù)據(jù)能有機(jī)結(jié)合。具體模式如圖2:

圖2 方言對應(yīng)空間ID模式

三、中國歷史方言地理信息系統(tǒng)的特點(diǎn)及優(yōu)勢

(一)系統(tǒng)的特點(diǎn)

第一,提供中國歷史方言地理信息系統(tǒng)數(shù)據(jù)框架,而非現(xiàn)成歷史方言數(shù)據(jù)。獲取歷史方言數(shù)據(jù)比現(xiàn)代方言數(shù)據(jù)更加困難,它只能通過研究大量歷史文獻(xiàn)獲得,其結(jié)論的可靠性有待檢驗(yàn),這些工作人力短時(shí)間很難全部完成。因此,搭建此平臺(tái),研究者根據(jù)自己的研究,可以進(jìn)行二次開發(fā)。經(jīng)過校正、改進(jìn)和數(shù)據(jù)積累,形成符合中國歷史方言面貌的漢語歷史方言地理信息系統(tǒng)。系統(tǒng)的搭建分階段實(shí)施,對于數(shù)據(jù)量充分的時(shí)間段優(yōu)先處理入庫,其他數(shù)據(jù)待研究的推進(jìn)而完善入庫。

第二,系統(tǒng)重分布,而非分區(qū)。真正有用的方言地圖是分布圖,而非分區(qū)圖。方言特征分布具有客觀性,而研究者的劃分是高度主觀的。不同的研究者選擇不同的標(biāo)準(zhǔn),所以劃分是不同的。例如,根據(jù)揚(yáng)雄的《方言》,林語堂分為14個(gè)區(qū)[3],羅常培、周祖謨分為7個(gè)區(qū)[4],劉君惠等分為12個(gè)區(qū)[5],司禮儀(Paul L-M Serruys)分為6個(gè)區(qū)[6]。分區(qū)是基于對多種語言特征分布的綜合調(diào)查的主觀判斷,系統(tǒng)無法提供分區(qū)功能。歷史方言地理信息系統(tǒng)構(gòu)建的目的是收集歷史方言特征的分布集,方言研究者依據(jù)數(shù)據(jù)判斷,并為他們進(jìn)一步建立特定歷史時(shí)期的方言劃分提供輔助工具。

(二)系統(tǒng)的優(yōu)勢

采用時(shí)空GIS技術(shù)構(gòu)建的中國歷史方言地理信息系統(tǒng),兼顧了方言的時(shí)空性,以更為立體直觀的方式呈現(xiàn),較之于傳統(tǒng)方言數(shù)據(jù)呈現(xiàn)方式具有很強(qiáng)的優(yōu)勢:

第一,動(dòng)態(tài)顯示方言特征隨時(shí)間演變在空間上面的分布情況。傳統(tǒng)方言地圖無法很好地提供整體、動(dòng)態(tài)的方言地理學(xué)研究需求。時(shí)空GIS技術(shù)的提出,為解決此難題提供了可能性。通過歷史方言地理信息系統(tǒng),我們可以多角度歷時(shí)地觀測漢語方言特征的演變以及共時(shí)分布,考察時(shí)空互動(dòng)背景下漢語方言沿革與更替。例如,通過該系統(tǒng),我們可以動(dòng)態(tài)觀察漢語入聲消失的過程。作為中國古代特有的語音,入聲在宋元時(shí)期逐漸消亡。當(dāng)今在山西和部分南方地區(qū),還能搜尋到一些痕跡。由于普通話的普及,古入聲的痕跡更加弱化。這種演變不是突變的,它有一個(gè)漸變的過程,其在歷代方言材料的時(shí)空分布上有所體現(xiàn),在今天漢語方言的空間分布上也能觀察得到。例如,潮汕方言保留了入聲,并有一個(gè)以弱化狀態(tài)結(jié)尾的喉塞音韻尾。然而,在雷州的閩語中,許多古代入聲字已經(jīng)失去了入聲的韻尾,并被發(fā)音為陰聲韻母。通過比較發(fā)現(xiàn),這些詞在雷州閩方言中失去了入聲韻尾,而在潮汕方言中,它們是喉塞音韻尾的詞。在一些方言中也存在類似的情況,入聲仍然存在,但失去了區(qū)分意義的功能。所有這些都可以證明漢語入聲結(jié)尾的脫落(入聲消失)是有階段性的。傳統(tǒng)的方言學(xué)通常通過文字或紙質(zhì)地圖來描述這一過程。紙質(zhì)地圖只能顯示靜態(tài)結(jié)果,在方言地理信息系統(tǒng)幫助下,動(dòng)態(tài)再現(xiàn)入聲消失過程,并能動(dòng)畫模擬其過程。

第二,具有統(tǒng)計(jì)、分析、判斷和預(yù)測功能。方言數(shù)據(jù)庫強(qiáng)大的統(tǒng)計(jì)和分析功能使我們能夠計(jì)算方言數(shù)據(jù),在統(tǒng)計(jì)和分析的基礎(chǔ)上評(píng)估、判斷和預(yù)測方言演變,擬測某一中間時(shí)間的方言面貌。通過了解方言特征的起點(diǎn)和終點(diǎn)的分布,并結(jié)合歷史行政區(qū)的演變,我們大致在中間階段擬測其分布。[7]

第三,它以不同格式攜帶大量方言數(shù)據(jù)。方言地理信息系統(tǒng)軟件具有方言地圖無級(jí)縮放的功能,不受紙質(zhì)地圖不變比例的束縛。用戶既可查看語言的宏觀地理分布,又可查看方言的細(xì)微地理分布特征。不僅如此,還可以同時(shí)容納一個(gè)區(qū)域的所有地圖內(nèi)容,不需要地圖,也不需要分割,這解決了負(fù)載與地圖大小的矛盾。紙質(zhì)方言地圖攜帶的方言信息相對較少。因?yàn)榈貓D上的信息相對較多,符號(hào)太密集,很難讀取。但方言地理信息系統(tǒng)可任意調(diào)整地圖比例尺,根據(jù)需求放大地圖,精確掌握方言特征分布狀況。

第四,便捷添加、刪除方言數(shù)據(jù)、更改數(shù)據(jù)關(guān)系和結(jié)構(gòu)。隨著新方言事實(shí)的發(fā)現(xiàn)或原始方言數(shù)據(jù)存在訛誤,有必要及時(shí)更新或修正數(shù)據(jù)庫。這樣,方言研究的最新成果可以及時(shí)反映出來,基于現(xiàn)有方言地理信息系統(tǒng)數(shù)據(jù)進(jìn)行深層次的研究。例如,鄭錦全先生將18個(gè)漢語方言點(diǎn)中的905個(gè)詞匯和737個(gè)方言點(diǎn)的聲調(diào)系統(tǒng)導(dǎo)入到計(jì)算機(jī)系統(tǒng)中。鄭錦全先生通過計(jì)算得到了每個(gè)方言點(diǎn)的相關(guān)系數(shù),并繪制了體現(xiàn)方言之間關(guān)系的樹形圖。[8]王士元先生在美國加州大學(xué)伯克利分校建立了“漢語方言計(jì)算機(jī)詞典”(簡稱DOC)。事實(shí)上,DOC是一個(gè)漢語語音數(shù)據(jù)的計(jì)算機(jī)數(shù)據(jù)庫,主要基于《漢語方音字匯》,共收錄2700多個(gè)單詞。每一個(gè)單詞都標(biāo)記有中古音的開合、等級(jí)、韻律、音調(diào)類別,這些音調(diào)基于韻律書和韻律圖(如《切韻》),以及17個(gè)現(xiàn)代地方的方言發(fā)音。這個(gè)數(shù)據(jù)庫為王士元先生對“詞匯擴(kuò)散”理論的論證[9],以及鄭錦全[8]、陸致極[10]、王士元等[11]對漢語方言之間關(guān)系的定量描述提供了豐富的信息資料。數(shù)據(jù)庫所提供的方言歷史數(shù)據(jù),相對于過去只是靠單一類型的靜態(tài)方言數(shù)據(jù),所獲得的結(jié)論更加科學(xué)。

通過構(gòu)建和利用漢語歷史方言地理信息系統(tǒng),研究人員可以將漢語置于廣闊的時(shí)空背景中,了解特定時(shí)期漢語方言特征的共時(shí)分布,快捷查詢方言特征的歷時(shí)演變和分布;直觀觀察方言點(diǎn)、段、區(qū)的歷史演變和替換,了解不同方言區(qū)之間的空間關(guān)系和歷時(shí)關(guān)系;研究方言的分區(qū)和劃界,調(diào)查方言的變化速度、方言的分化年代、相互影響的程度和不同語言之間的密切程度;它還可以驗(yàn)證現(xiàn)有方言研究的正確性,預(yù)測漢語方言的發(fā)展趨勢;它還可以結(jié)合非語言因素來解釋語言的分布,并在此基礎(chǔ)上進(jìn)一步探討語言變異的機(jī)制。在中國歷史的時(shí)空坐標(biāo)下全面考察漢語方言的演變,對于漢語方言和漢語史的研究有重要的幫助。

猜你喜歡
時(shí)空方言漢語
方嚴(yán)的方言
東方少年(2022年28期)2022-11-23 07:09:46
學(xué)漢語
金橋(2022年6期)2022-06-20 01:36:16
跨越時(shí)空的相遇
方言
輕輕松松聊漢語 后海
金橋(2020年11期)2020-12-14 07:52:56
鏡中的時(shí)空穿梭
說說方言
留住方言
玩一次時(shí)空大“穿越”
追劇宅女教漢語
广饶县| 吉木乃县| 建德市| 荔浦县| 蕲春县| 巨鹿县| 会同县| 长治市| 湘潭市| 五峰| 平邑县| 阿克| 岱山县| 禹州市| 遂平县| 义马市| 奉化市| 泗洪县| 沭阳县| 武邑县| 闸北区| 泰兴市| 平遥县| 昌平区| 克什克腾旗| 依兰县| 应用必备| 高要市| 陵水| 大余县| 罗城| 竹溪县| 荃湾区| 日照市| 玛纳斯县| 牙克石市| 万盛区| 沙雅县| 东丽区| 岳普湖县| 积石山|