文 / 甘瑩
如果說建筑是一座城市的筋骨,那么方言便是一座城市的風(fēng)情。陽春白雪般的詩詞歌賦與下里巴人般的鄉(xiāng)音俚語傳達(dá)的都是一座城市生活的點(diǎn)點(diǎn)滴滴。天津方言就是這樣一種極富個(gè)性的城市語言。它的幽默詼諧和調(diào)侃自嘲都體現(xiàn)了天津人的生活態(tài)度。天津能為相聲專門開設(shè)一個(gè)廣播頻道,又能為語言文化的傳承而如火如荼地進(jìn)行方言建檔活動(dòng)。如果說熱播的紀(jì)錄片《五大道》勾勒出天津風(fēng)雅的過往,那么對(duì)于方言的保護(hù)和傳承則使天津的民間風(fēng)情更加令人動(dòng)容。這是一座城市對(duì)文化的尊重,更是對(duì)母語的熱愛。將天津方言作為建檔資源,不僅有助于審視天津的發(fā)展軌跡,而且能挖掘天津骨子里的內(nèi)涵,感受地方文化的色澤。
在過去很長一段時(shí)期,方言建檔主要依靠紙質(zhì)文本,不僅介質(zhì)單一、信息不全面,傳播范圍也有限。到20世紀(jì)末,隨著多媒體技術(shù)的發(fā)展和語檔語言學(xué)[1]的出現(xiàn),語言的多媒體記錄、資料的永久保存和全球傳播逐步成為現(xiàn)實(shí)。俗話說“京油子、衛(wèi)嘴子”,目前中國流行的許多詞匯均出自天津人之口??墒请S著普通話的普及,人們說方言的機(jī)會(huì)日益減少,天津話淡出的進(jìn)程正在加速。一種方言的消失往往帶來地方文化的消亡。為挽救和保存地方語言,傳承地方文脈,天津市檔案館于2014年啟動(dòng)了“天津鄉(xiāng)音記憶工程”,用兩年時(shí)間建立起天津方言語音檔案資料庫,把地道、老派、正宗和具有代表性的天津話以音頻的形式立體地記錄下來,全面描寫和展示天津方言的傳統(tǒng)面貌,為天津鄉(xiāng)音的記錄保存注入了“檔案元素”。
方言建檔是一項(xiàng)高保真的記錄工程,力求呈現(xiàn)方言和口傳文化的自然全貌。天津方言建檔圍繞專家組成立、資料采集、文本檔案選定、發(fā)音人甄選、音頻檔案錄制等方面展開。檔案館面向社會(huì)征集方言資料、詞匯語句、場(chǎng)景對(duì)話、歷史故事和文藝作品,檔案選定內(nèi)容則由專家篩選匯編成天津方言文本。通過對(duì)詞匯、成語、歇后語和例句整理建檔,使天津方言得到系統(tǒng)有效的記錄與傳承。如“崴泥”這個(gè)詞,在歸檔記錄時(shí)要注釋拼讀出來,并且確保標(biāo)注的發(fā)音規(guī)范。建檔還通過錄音的形式為天津的民謠民歌、俗語諺語、俏皮話、大街小巷里的吆喝叫賣、勞動(dòng)號(hào)子等特色方言留聲。為增強(qiáng)現(xiàn)場(chǎng)感,部分語音內(nèi)容采用津味兒小段和情景對(duì)話的形式,生動(dòng)再現(xiàn)了老天津人的生活場(chǎng)景。除了記錄“說天津話”,還要記錄“唱天津話”,有關(guān)相聲、快板、時(shí)調(diào)等說唱曲藝名段都被歸檔,旨在保護(hù)以天津方言為載體的非物質(zhì)文化遺產(chǎn)。
為了留下美麗鄉(xiāng)音與動(dòng)人鄉(xiāng)愁,天津方言建檔工作努力探索紙質(zhì)、音頻、視頻的全媒體、多維度的天津話記錄。2014年《天津方言語音建檔首批文本》公布,其中包括天津方言典型詞匯、方言俗語諺語和具有天津地方民俗特色的地理買賣雜志。2015年《天津方言詞典》面世并正式入藏市檔案館檔案資料庫,成為天津方言詞匯大全。2017年,天津市檔案館牽頭赴安徽拍攝天津話尋根溯源紀(jì)錄片《聽見天津》,挖掘津皖方言在文化、歷史、民俗等方面的關(guān)聯(lián),對(duì)天津方言的保護(hù)形式進(jìn)行了延伸與拓展,實(shí)現(xiàn)檔案記憶與數(shù)字記錄同在同行。
方言建檔是語言學(xué)和檔案學(xué)相互交叉形成的新領(lǐng)域,本質(zhì)上屬于需要語言學(xué)知識(shí)支撐并服務(wù)于語言相關(guān)領(lǐng)域的檔案學(xué)問題。天津方言檔案目前是從語言記錄的角度來完成的,即在天津檔案館的組織下開展方言資源和歷史文化普查、制定方言文本、征集語音發(fā)音人制作音頻,最后歸檔建立檔案數(shù)據(jù)庫。這種建檔模式的主要目標(biāo)在于全方位記錄語言而不是用語言學(xué)知識(shí)去描述和解釋語言現(xiàn)象,因此數(shù)據(jù)庫在語言特征的分析和注解上做得不夠完善,語料數(shù)字化標(biāo)注程度和質(zhì)量有待提高,其用途僅限于檔案保存,后期對(duì)于資料庫的語言學(xué)研究不能有效開展,不能全面反映天津方言的情況。保護(hù)天津方言、從跨學(xué)科跨專業(yè)的角度來記錄天津方言演繹的歷史進(jìn)程迫在眉睫。
語料庫是為了某一個(gè)目的而建立的有關(guān)文本、語音及其標(biāo)注的集合。它是一個(gè)完整的系統(tǒng),不但包括語料及其標(biāo)注集合本身,而且包括數(shù)據(jù)庫管理系統(tǒng)。方言的語料庫建檔已經(jīng)成為方言研究不可或缺的重要技術(shù)手段和工具,其最直接的應(yīng)用就在于可對(duì)方言文本及音像文件進(jìn)行數(shù)字加工處理、多媒體轉(zhuǎn)寫、數(shù)據(jù)統(tǒng)計(jì)和檢索分析,可通過大量參數(shù)使我們對(duì)方言進(jìn)行量化比較和總體描寫。方言語料庫應(yīng)以建立有廣泛社會(huì)共享價(jià)值、可供語言恢復(fù)、語言資源開發(fā)與利用的永久性活態(tài)語料檔案為最終目標(biāo)。在歸檔保存以后,我們要按照長期安全存取的需要進(jìn)行維護(hù)和管理,并提供給用戶進(jìn)行訪問。就天津方言語料庫而言,其數(shù)據(jù)管理系統(tǒng)并不完善,各種分析檢索手段也僅停留在存儲(chǔ)階段。此外,目前天津方言語檔沒有最大限度地進(jìn)行開放性信息平臺(tái)的建設(shè),并未見到公開發(fā)布或面向用戶使用的語料庫或數(shù)據(jù)庫電子產(chǎn)品,也未體現(xiàn)用戶自主采錄、集成和傳輸音視頻語料的開放理念。
語料庫建檔,既要包括文本語料庫,也要包括語音語料庫。天津方言語音檔案資料庫雖然實(shí)現(xiàn)了數(shù)字化的有聲存檔,但是針對(duì)文本文獻(xiàn)和視頻紀(jì)錄片的多媒體介質(zhì)存檔并未完全分類建庫。已建語檔不能提取天津話的個(gè)性特征,如特征發(fā)音、特征詞、特征語法和話語標(biāo)記,也不能提供方言語音識(shí)別等高級(jí)語料庫技術(shù)。此外,天津方言語檔的話語內(nèi)容偏重預(yù)先設(shè)計(jì)和文本朗讀,天津話的自然語言生活狀態(tài)表現(xiàn)不足,體裁、語體覆蓋面和多樣性不廣,沒有完全覆蓋到個(gè)人陳述、獨(dú)白、會(huì)話等語體,也沒有全面覆蓋自然生活中的語言實(shí)踐和語言生活。針對(duì)文化學(xué)、社會(huì)學(xué)等交叉學(xué)科對(duì)地域方言材料和知識(shí)內(nèi)容的基本需求,已建語檔不能全面反映天津方言地域自然生活的環(huán)境知識(shí)和歷史方言文化,尚未真正達(dá)到語言文化建檔的統(tǒng)一。
語言紀(jì)錄的核心是同步標(biāo)音、多層級(jí)注解、翻譯成交際范圍更廣的語言以及建立視聽材料的語料庫[2]。在語料庫的基礎(chǔ)上為天津方言建檔,為方言保護(hù)提供了新的路徑,能夠設(shè)計(jì)較為細(xì)致的語言檔案構(gòu)成體系。語料的采錄、集成、整理、標(biāo)注可實(shí)現(xiàn)從原始語料到生語料再到經(jīng)音標(biāo)、漢語和賦碼等深加工標(biāo)注的熟語料轉(zhuǎn)換,且標(biāo)注得越豐富越精細(xì),對(duì)數(shù)據(jù)的挖掘就越深越廣。建檔語料的深度加工和分析可由語言文字研究機(jī)構(gòu)協(xié)同完成,各專業(yè)部門發(fā)揮各自學(xué)科優(yōu)勢(shì),合作共贏[3]。例如,東莞方言的有聲語料庫制作工作就由暨南大學(xué)漢語方言研究中心負(fù)責(zé)完成。他們通過多元主體合作共建,能夠整合資源,進(jìn)一步統(tǒng)一頂層設(shè)計(jì)標(biāo)準(zhǔn),在語音標(biāo)注形式規(guī)則、語音發(fā)音標(biāo)準(zhǔn)判斷、語義解釋翻譯、音視頻錄制技術(shù)、成果整理內(nèi)容方式、數(shù)據(jù)格式規(guī)范等方言檔案建設(shè)工作上取得一致性,能夠增強(qiáng)方言檔案在音韻、語法、詞匯、話語分析等方面的專業(yè)性和科研性,提高檔案的學(xué)術(shù)用途。
方言語料庫應(yīng)該是一種公益性的成果,不僅語言工作者可以方便地使用,社會(huì)各界以及中外語言學(xué)習(xí)者都應(yīng)該從中受益。近幾十年來,許多國家都相繼建設(shè)了大規(guī)模多品種的語料庫,例如,三大經(jīng)典語料庫——BROWN布朗語料庫、LOB語料庫和LLC倫敦—朗德英語口語語料庫均有目的有系統(tǒng)地收集了大量在生活中使用的書面語和口頭語,并用先進(jìn)的電腦技術(shù)手段進(jìn)行儲(chǔ)存和開放檢索。我國臺(tái)灣政治大學(xué)的“漢語口語語料庫”,江蘇省語委的“中國語言資源有聲數(shù)據(jù)庫(江蘇庫)”均實(shí)現(xiàn)了網(wǎng)上檢索[4]。開放性的語料平臺(tái)設(shè)計(jì)可實(shí)現(xiàn)方言語料的不斷擴(kuò)充,突破方言學(xué)者采錄的瓶頸,使方言區(qū)的群眾把身邊發(fā)生的或自己親歷的豐富活態(tài)語言資源不斷地匯集到語料庫中,完成大規(guī)模、多場(chǎng)合的語料采錄和標(biāo)注解釋,真正實(shí)現(xiàn)方言資源的可持續(xù)發(fā)展?;谝延刑旖蚍窖杂新曎Y料庫,我們可開發(fā)出集基礎(chǔ)性、集成性、權(quán)威性和開放性為一體的天津方言語料查詢和應(yīng)用平臺(tái),使之成為實(shí)現(xiàn)全文本字、詞、句的檢索功能、語音的聲學(xué)分析功能、文化的數(shù)字信息功能和共享擴(kuò)充升級(jí)等多功能、多用途的語料庫集成信息系統(tǒng)。
針對(duì)方言的多用途需求,我們可在已建的天津方言語檔基礎(chǔ)上深入開發(fā)出具有一定規(guī)模量級(jí)的規(guī)范化、標(biāo)準(zhǔn)化的“天津方言有聲語料庫”和“天津方言文本文獻(xiàn)語料庫”,使音像、文本、歷史文化文獻(xiàn)分類存檔,并且確保最新的檔案語料按類別及時(shí)入庫,以豐富語檔的資源體系和內(nèi)容導(dǎo)向。建檔的天津話語料可以遵循開放語檔聯(lián)盟的《OLAC話語類型詞匯》標(biāo)準(zhǔn),采錄各種體裁樣本,實(shí)現(xiàn)語料的合理化分布和覆蓋,盡可能真實(shí)完整地還原方言的使用狀態(tài)和文化特色。我們基于語料庫可開發(fā)天津話電子發(fā)音詞典、天津方言詞頻詞典等文化產(chǎn)品,出版有關(guān)天津話的多媒體學(xué)習(xí)材料和面向大眾的聲像制品或網(wǎng)絡(luò)資源,著重挖掘天津話的語意和文化內(nèi)涵,使天津方言語檔成為民間傳統(tǒng)文化的典藏庫。為了滿足天津方言語檔的保存和管理需求,我們還可進(jìn)一步建立天津方言虛擬檔案館,拓展方言語料庫的數(shù)字化成果,使之成為與天津科技檔案館、天津城市建設(shè)檔案館等具有同樣重要地位的方言數(shù)字檔案管理系統(tǒng)。此外,天津方言產(chǎn)品的開發(fā)使用也可結(jié)合網(wǎng)絡(luò)社交媒體或移動(dòng)APP等新技術(shù),提升用戶體驗(yàn)。
綜上,天津方言的語料建檔對(duì)于天津話應(yīng)用研究的數(shù)字化基礎(chǔ)建設(shè)具有重大的學(xué)術(shù)價(jià)值和現(xiàn)實(shí)意義。從語言學(xué)角度來看,方言是語言的各種地理變體,為方言建檔是中國語言保護(hù)的重要組成部分,是搶救方言的語言文化工程。它將為語言教學(xué)研究、語言學(xué)知識(shí)普及、語言國情傳遞和公眾語言資源意識(shí)的提高起到巨大的推動(dòng)作用。此外,方言不僅是地方信息交流的工具,更是一種特殊的文化符號(hào)和文化情結(jié),其獨(dú)特的人文價(jià)值毋庸置疑。天津方言建檔工作是促進(jìn)天津“文化惠民”的民心工程,也是創(chuàng)建文化強(qiáng)市,響應(yīng)“文化強(qiáng)國”的重要戰(zhàn)略舉措,能夠激發(fā)我們對(duì)天津文化價(jià)值的認(rèn)知與共鳴。天津方言的語料庫建檔一定能夠構(gòu)建起天津城市語言文化的獨(dú)特名片。
[1]陳子丹,鄭宇,武澤淼.我國少數(shù)民族瀕危語言建檔的幾點(diǎn)思考[J].檔案學(xué)通訊,2016(4).
[2]黃有龍,李云兵,王鋒.紀(jì)錄語言學(xué):一門新興交叉學(xué)科[J].語言科學(xué),2011(3).
[3]趙生輝.方言建檔工作的學(xué)科關(guān)系與協(xié)同機(jī)制探析[J].檔案與建設(shè),2014(6).
[4]范俊軍.漢語方言自然口語語料庫建設(shè)的幾個(gè)基本問題[J].學(xué)術(shù)研究,2013(2).