国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

方言——通

2020-04-15 03:59李琪
大學(xué)生 2020年4期
關(guān)鍵詞:音頻文件恩施語言學(xué)

李琪

我是北京語言大學(xué)漢語國際教育研究院2018級的碩士生,師從饒高琦老師,專業(yè)是語言學(xué)及應(yīng)用語言學(xué),平時主要做數(shù)字人文方面的研究。在嚴(yán)峻的疫情面前,作為湖北人,我非常希望能為家鄉(xiāng)的“抗疫”工作出一份力。

語料庫

2月7日下午,國務(wù)院聯(lián)防聯(lián)控機制公布了16個省支援武漢以外地區(qū)的“一省包一市”方式,全力支援湖北省的疫情防控工作。湖北方言比較復(fù)雜,外來的醫(yī)護(hù)團(tuán)隊很難完全聽懂。為方便醫(yī)患的正常溝通,齊魯醫(yī)院醫(yī)療隊制作了一本《國家援鄂醫(yī)療隊武漢方言使用手冊》,它讓我們看到了抗疫一線醫(yī)護(hù)人員與病患順暢溝通的需求。

2月10日中午,我的導(dǎo)師饒高琦告訴我們,北語開始負(fù)責(zé)“抗疫方言通”的制作。我們專業(yè)的工作是快速形成一個小型的日常醫(yī)療場景對話語料庫,并提供與醫(yī)療診斷相關(guān)的“抗疫診療詞語”和“抗疫診療句子”兩個板塊的內(nèi)容,方便方言發(fā)音人錄制方言音頻。

語言來源于生活,也服務(wù)于生活。這段時間我身處“疫區(qū)”,雖不能像那些醫(yī)護(hù)人員一樣去前線發(fā)光發(fā)熱,但我可以通過所學(xué)的語言學(xué)知識為他們保駕前行。

大家迅速行動了起來,首要任務(wù)是使用數(shù)據(jù)分析的方法提取與醫(yī)療診斷相關(guān)的詞語和句子。我們選用了搜狗詞庫以及百度百科中涉及醫(yī)療場景的770個詞匯,篩選出與日常醫(yī)患交流及肺炎相關(guān)的用語,并在此基礎(chǔ)上擴充了與肺炎相關(guān)癥狀的描述。例如從肺炎癥狀“發(fā)燒”擴充到“我發(fā)燒,燒得厲害,燒了幾天了”“量了體溫,38度多”“我的體溫是38度”等癥狀描述用語。一個下午的時間,便形成了由 “患者自述病情”“病房護(hù)理對話”等場景的76個短句,以及與“稱謂語”“身體器官詞”“肺炎相關(guān)醫(yī)療用語”“生活相關(guān)用語”有關(guān)的156個詞語組成的小型“抗疫語料庫”。這個語料庫隨后成為湖北不同方言點方言采錄的基礎(chǔ)。

2月12日,根據(jù)北語提供的方言轉(zhuǎn)寫材料和音頻制作的“抗疫方言通”正式上線,包含了武漢、宜昌、襄陽、黃石、黃岡、孝感、咸寧、鄂州、荊州九個方言點。用戶只需選擇自己所在的方言點,在搜索欄輸入需查詢的關(guān)鍵字,就可以找到和聽到與醫(yī)療診斷相關(guān)的詞語和句子。

方普對

2月15日,為協(xié)助技術(shù)團(tuán)隊制作抖音等平臺的宣傳視頻,我接到了合成“方普對”的任務(wù),需要找出宜昌、荊州及襄陽三地方言所對應(yīng)的普通話所有音頻,并將方言音頻和普通話音頻一一配對拼接起來,最后將整合好的音頻文件交給技術(shù)團(tuán)隊。

在進(jìn)行音頻整合的過程中,我發(fā)現(xiàn)音頻文本排序是音頻合成的一大難題。起初,由于音頻文件數(shù)量眾多(共696個),加上對音頻合成軟件不夠熟悉,我選擇了手動合成的“笨辦法”。一個小時后,我才合成了25個“方普對”。眼看時間不多,我想到了一個名叫Total Commander的文件管理軟件,它可以進(jìn)行文件批量重命名的操作,這樣一來,方言和普通話的音頻就能自動排序。于是,我給音頻文件添加了后綴名,放入對應(yīng)的兩個方言音頻文件夾下,再利用音頻軟件中添加文件夾的功能,將排好音頻文件順序的文件夾放入音頻合成軟件中,這時,只需點擊“音頻合成”按鈕,就快速地完成批量合并。通過這個辦法,在短短30分鐘內(nèi),我和同學(xué)們就將剩下幾個方言片的“方普對”音頻合成完畢,提交給技術(shù)團(tuán)隊。

恩施話

2月17日,在前期九個方言點“抗疫方言通”的基礎(chǔ)上,我們又增加了大冶和恩施兩個方言點。作為恩施人,我義不容辭地?fù)?dān)負(fù)起了恩施話的采錄工作。具體來說,我需要先將 “抗疫語料庫”中的詞句用恩施話寫成文本,并補充一些與其語音相近或語義相同的詞句,再去找恩施話方言發(fā)音人進(jìn)行采錄。方言發(fā)音人最好是長期在本地生活的居民,才能保證發(fā)音的準(zhǔn)確性。

因為本科和讀研都在省外,我擔(dān)心自己的地方話不夠“地道”。于是,我找了兩個一直在恩施生活的同學(xué)來協(xié)助我完成這個任務(wù)。我先按照自己的方言發(fā)音,將恩施話填寫在表格中,然后發(fā)給兩個同學(xué)核對。這種填寫方式,可以很好地避免恩施話采錄時可能出現(xiàn)的錯誤。例如,針對“頭”這個詞,我剛開始填寫的方言說法是“頭”,經(jīng)過同學(xué)提醒,最終改成了更地道的“腦殼”。

填完表格后,我想請其中一位同學(xué)進(jìn)行恩施話的錄音,但因為他身邊設(shè)施不全,我只好硬著頭皮自己上。鑒于我的設(shè)備和錄音環(huán)境實在有限,我只得關(guān)緊門窗,拉上窗簾,連上藍(lán)牙耳機,用學(xué)校的錄音軟件進(jìn)行了采錄。試聽時,我發(fā)現(xiàn)有很多音頻出現(xiàn)了噴麥的情況(話筒被嘴里的氣噴出來弄得撲撲響)。后來我又嘗試了很多次,但效果還是不佳。到網(wǎng)上一查,果然有針對這種情況的調(diào)整攻略。最后,我換了個帶線的耳機,將耳機麥克風(fēng)外面套了層衛(wèi)生紙,這才順利完成了恩施話的采集。

18日,我將采集好的恩施話和方言文本發(fā)給了老師,當(dāng)晚十點就得到了反饋,有一個音頻文件沒有被采錄到。我立馬打開錄音軟件進(jìn)行補錄,卻發(fā)現(xiàn)方言表格中因有一個句子添加了問號,一出現(xiàn)就會令軟件卡頓,于是我用手機進(jìn)行了補錄。

兩小時后,“抗疫方言通”恩施版在微信上線,我迅速轉(zhuǎn)發(fā)到朋友圈。不到十分鐘,同學(xué)和朋友就紛紛在線上找我。有的問這是不是我的聲音,有的從覺得恩施話很有趣,也有人說我做這件事很有意義。還有一個朋友給我提出了意見,說我有一個詞語讀錯了,“頭疼”應(yīng)該說成“腦殼疼”。整個晚上,我都很糾結(jié),也很擔(dān)心,一方面怕給醫(yī)患溝通帶來不便,另一方面擔(dān)心微信平臺不能進(jìn)行音頻的修改。

第二天,我一醒來就向老師反饋了這個問題。很快,老師將聊天記錄截圖發(fā)給了我,時間顯示是2月18日晚上九點半。原來,在我提出這個問題之前,老師們就已經(jīng)討論過這個問題。他們認(rèn)為,即便是方言也是分場景和語域的,診療環(huán)節(jié)是一個相對正式的場景,患者通常會講“頭疼”而不是“腦殼疼”。這下,我懸著的心才放了下來。

語言學(xué)+信息技術(shù)

作為一名語言學(xué)專業(yè)的學(xué)生,我也曾經(jīng)對自己的專業(yè)迷茫過,語言學(xué)專業(yè)在社會上究竟是一個什么樣的定位?它又能給我自己帶來什么?通過這次參與 “方言通”的制作,我想我找到了答案。語言學(xué)不是藏在“象牙塔”里的一門學(xué)科,它存在于我們?nèi)粘I钪械姆椒矫婷?,與我們息息相關(guān)。

同時,語言學(xué)還給我?guī)砹诵碌母形?。“語言學(xué)”+“信息技術(shù)”帶來的專業(yè)優(yōu)勢,通過快速構(gòu)建專門領(lǐng)域的語音資源,幫助醫(yī)護(hù)人員克服語音障礙,這在傳統(tǒng)的語言學(xué)習(xí)中是很難想象的。

語言來源于生活,也服務(wù)于生活。我身處“疫區(qū)”,雖不能像那些醫(yī)護(hù)人員一樣去前線發(fā)光發(fā)熱,但我可以通過所學(xué)的語言學(xué)知識為他們保駕前行。醫(yī)者為人,而我為醫(yī)者,這是一份能被傳遞的溫情。如果恩施版的“方言通”能夠幫助天津救援隊與恩施本地的醫(yī)護(hù)人員及病人進(jìn)行良好的溝通,那么我們的努力就沒有白費,這也是我2020年記事簿上最值得被記錄的一件事情。

責(zé)任編輯:曹曉晨

猜你喜歡
音頻文件恩施語言學(xué)
恩施石油:黨建為經(jīng)營賦能
恩施方言中的“倒”和“起”
基于Android手機的音頻文件取證技術(shù)研究
認(rèn)知語言學(xué)與對外漢語教學(xué)
恩施年俗——點路燭
動真招下苦功創(chuàng)建平安恩施
數(shù)字水印在音頻文件篡改檢測中的應(yīng)用
社會語言學(xué)名詞
語料庫語言學(xué)未來發(fā)展趨勢
基于認(rèn)知語言學(xué)的“認(rèn)知修辭學(xué)”——從認(rèn)知語言學(xué)與修辭學(xué)的兼容、互補看認(rèn)知修辭學(xué)的可行性