鞏曜瑜 陳躍文 張耀中
(1.中國石油大學(華東)外國語學院 山東青島 266580;2.中國石油大學(華東)計算機科學與技術(shù)學院 山東青島 266580)
目前,許多高校的俄語專業(yè)中,絕大多數(shù)學生在中學階段只修讀過英語,俄語學習基礎為零。學生在學習俄語時會不自覺地受其已經(jīng)掌握的語言影響,這是語言遷移在外語習得過程中的典型表現(xiàn)。研究表明,合理利用語言遷移理論的成果,將學生在英語學習中養(yǎng)成的思維方式和概念范疇體系應用在第二外語(俄語)教學中,能夠大大提升學生的學習效果[1]。
語言遷移理論自20世紀50年代末被提出,經(jīng)歷了70余年的發(fā)展,其科學性已經(jīng)在二語習得領域取得了廣泛認可,并被認為是語言學習領域的一項重要策略。進入21世紀,認知心理學、認知語言學等學科與語言遷移的結(jié)合催生了新的主流研究領域——概念遷移。概念遷移理論的優(yōu)越之處在于,不再僅僅停留在遷移現(xiàn)象表面總結(jié)語言遷移的規(guī)律,而是從思維認知層面去探討遷移產(chǎn)生的原因進而把握遷移規(guī)律[2]。認知思維之所以在語言學研究領域非常重要,是因為語言是認知思維的反映,不同語言對單詞語義解釋的差異反映的是不同民族思維認知的差異。因此,相較于從結(jié)構(gòu)主義角度歸納語言異同點的研究方法,從思維認知的角度研究語言差異可以得到更加具有普遍意義的結(jié)論。而語言遷移的研究對象恰恰就是語言間的異同點。從思維認知角度入手的分析方法,不僅可以總結(jié)正負遷移現(xiàn)象,還能夠解釋遷移產(chǎn)生的原因;從遷移現(xiàn)象入手,自語義角度出發(fā)分析語言所反映的認知模式,則能夠幫助研究者更加深刻地解釋語言遷移規(guī)律。
從以往概念遷移研究的研究成果可知,語言遷移研究有所發(fā)展,但由于對“概念遷移”這一概念本身并無明確的概念界定,因而常規(guī)認知中的“概念”與該術(shù)語中“概念”二字的意義范疇的區(qū)別仍待進一步辨析和探討。此外,由于忽略了對語言遷移的內(nèi)在機制的探究,且基于語料庫的分析仍局限于對詞法和句法層面,當前研究結(jié)果尚無法充分地證明遷移的確發(fā)生于概念層面。而在具體的研究方法上,尚缺乏統(tǒng)一且標準的理論框架和基礎,且由于受對比分析時期的語言層面遷移研究方法的影響,目前的概念遷移研究仍然使用傳統(tǒng)的、以歸納方法為主的遷移研究手段。鑒于此,國內(nèi)概念遷移的研究注重擺脫重視邏輯推理和現(xiàn)象歸納。這一領域量化的實證研究主要依賴傳統(tǒng)的實驗方法——即抽取受試者進行語言學習實驗,并觀察他們的學習過程得出結(jié)論。但是這種方法非常依賴受試者和觀察者的主觀意識,因而其結(jié)論的客觀性往往遭到質(zhì)疑[3]。并且,由于受到傳統(tǒng)實驗方法在時長和測試數(shù)量方面的限制,得出的結(jié)論難以從個體層面上升到群體層面??傮w而言,由于國內(nèi)概念遷移研究在起步較晚,因而目前相關(guān)領域的研究水準整體上落后于世界水平,但其作為一個新興的研究領域,不僅仍有較大發(fā)展空間,而且為語言遷移研究提供了新思路。
隨著人工智能技術(shù)的發(fā)展,這一問題有了新的解決方案:利用人工智能技術(shù)Word2vec可以將文字轉(zhuǎn)化為數(shù)學向量,用向量的位置變化來反映語義理解偏差,并且不同語言相同語義的單詞的向量位置相同——該技術(shù)原理與語言遷移理論不謀而合。此項技術(shù)此前被研究者多次應用于語義分析的實驗中,獲得了較高的準確率,從而解決了困擾概念遷移研究者難以客觀地分析語義的難題。
本研究擬遷移理論的核心內(nèi)容設計基于Word2vec實驗程序,并導入中、英、俄語平行語料進行試驗,通過比較實驗結(jié)果與概念遷移理論的預測結(jié)果,檢驗該理論在解釋英語學習促進中俄雙語教學效果中的有效性。
概念遷移理論認為,語言是認知思維實時表現(xiàn),并且人的認知思維會不斷發(fā)展改變,這些變化會體現(xiàn)在語言之中。也就是說,不論漢語、英語還是俄語,一門語言反映的是使用這門語言的一個民族認識事物的方式[4]。
在字母拼寫方面,俄語屬于西里爾字母體系,英語屬于拉丁字母體系,但拉丁字母和西里爾字母都發(fā)源于希臘字母,因而英語字母與俄語字母存在一定的對應關(guān)系,為方便直接對比,此處列出所有俄語字母,若存在與之對應的英語字母,則在括號內(nèi)進行對比說明:Аа(Aa),Бб(Bb),Вв(Vv),Гг(Gg),Дд(Dd),Ее,Ёё,Жж(Jj),Зз(Zz),Ии(Ii),й,Кк(Kk),Лл(Ll),Мм(Mm),Нн(Nn),Оо(Oo),Пп(Pp),Рр(Rr),Сс(Ss),Тт(Tt),Уу(Uu),Фф(Ff),Хх(Hh),Цц(Cc),Чч,Шш,Щщ,ъ,ы(Yy),ь,Ээ(Ee),Юю,Яя。由此不難發(fā)現(xiàn),兩種語言的不少字母在形式上是一樣的,所以,在初次接觸俄語字母時,這些熟悉的字母可以降低俄語字母的記憶難度。在詞匯層面,不少俄語單詞與英語單詞讀音相似、意思相當,例如:America-Америка;Baku-Баку;professorпрофессор;economist-экономист;diplomat-диплом ат;business-бизнес;contract-контракт等。[5]綜上可以推斷,由于俄語(斯拉夫語族)與英語(日耳曼語族)同屬于印歐語系,且俄語、英語中都有部分詞直接來源于拉丁語或希臘語,這會使兩種語言對單詞的底層認識有很多相同點。而且,兩種語言在字母語音和詞匯等因素上的同源性會促進英語和俄語的語言遷移距離縮小,即產(chǎn)生正遷移現(xiàn)象。
近代以來中文也發(fā)生了極大的變化。從西方傳入中國的新名詞或概念非常多地在現(xiàn)代漢語中,而這些概念在古漢語中并不存在。英語是大多數(shù)西方國家的通用語言。長期以來,西方國家在各類國際事務且尤其在經(jīng)濟、科技和學術(shù)領域都有較強的話語權(quán),因而,在跨文化交流實踐中,漢語使用者傾向于將英語作為首選的第二語言進行學習,并以英語與西方國家的交流著進行溝通。在此種情況下,漢語使用者接受英語的文化概念更快,且英語對漢語使用者的概念認知影響更強烈,因此,大量的英語借詞進入漢語,成為規(guī)范漢語的一部分。此外,受互聯(lián)網(wǎng)技術(shù)的應用、跨文化交流的頻繁和經(jīng)濟全球化的影響,漢語中涌入了大量的直接從英語詞音譯而來的學術(shù)術(shù)語、科技成果等新鮮詞匯,這極大地豐富和拓展了漢語的詞匯體系。例如,漢語“特氟隆”就是一個英語外來詞,因為當時漢語中沒有對應英語詞“Teflon”的詞,所以在結(jié)合了其概念范疇意義的基礎上,直接采用音譯方式創(chuàng)造了一個新漢語詞。由此可見,英語的傳播發(fā)展在一定程度上推動中文概念重組——促進英語和中文的語言遷移距離縮小。因此,以英語為媒介,可以拉近漢語、俄語的語言遷移距離。根據(jù)此理論推斷,在人工智能實驗中,語義上與英語單詞有對應關(guān)系的中文、俄語詞匯的遷移距離應該偏小。
實驗整體流程如下:
實驗設計了一套基于Word2vec的人工智能實驗程序。該程序首先將原始的語料進行預處理,即將文本語句拆分成逐個單詞,并剔除無意義的單詞。然后,利用處理好的語料進行訓練,將每個單詞處理成512維的詞向量模型。為了便于計算,程序再將訓練好的高維模型通過降維技術(shù)轉(zhuǎn)化為二維平面詞向量,這樣每個單詞及轉(zhuǎn)化成了計算機中二維平面向量中的向量。如此分別計算語料的中文、英文、俄文版本,就可以得出同一單詞所對應的中、英、俄語在計算機中換算成的二維向量(圖1)。
圖1 實驗架構(gòu)圖
為了排除實驗結(jié)果的偶然性以及文本體裁對結(jié)果的影響,實驗采用了文學類和公文類兩種體裁的文本作為語料,兩種文本互為對照。其中,文學類文本采用弗拉基米爾·納博科夫(Н абоковВ.В.)的小說《洛麗塔》。這是因為這部作品的英、俄版本均出自作者一人之手,是翻譯界公認最忠實于原文的翻譯范例的經(jīng)典之作。除了作者在作品中體現(xiàn)出的極高文學造詣和對兩種語言的極高掌控力,因此兩部作品的情感內(nèi)核和文化認知在同一位作者的筆下能做到最大程度的契合。公文類文本采用了聯(lián)合國9181994號決議(以下簡稱聯(lián)合國決議)中、英、俄語平衡語料。這是因為公文類語體,特別是聯(lián)合國的官方公文用詞嚴謹,所表文意準確無歧義,語種變化引起的語義變化很小,所以概念遷移的距離應該較小且明顯偏向正遷移。采用兩種體裁兩部文本,不僅可以豐富數(shù)據(jù)量,并且可以互為對照,減少由于體裁不同導致的實驗偏差。
理想情況下,在三種語言中同一個單詞的向量應該完全相同,但由于語言遷移現(xiàn)象的存在,在不同語言中單詞的意思有了差別,不同語言的同一單詞的向量會有一定的距離,這段距離就表示單詞在不同語言中產(chǎn)生的語言遷移狀況。距離越大,說明語言遷移更偏向負遷移;距離越小,則偏向正遷移。實驗程序根據(jù)距離聚類中心點平均距離最小的點歸為一類的原則,分別將有正、負遷移現(xiàn)象的單詞分類匯總。
實驗目的最終是比較漢語和俄語的語言遷移現(xiàn)象,并著重觀察英語在其中發(fā)揮的作用,但最終以促進中國學生更好地掌握俄語為目的導向,因而,本研究最終的落腳點仍在于中文與俄語之間的關(guān)系。因此,作者在采用不同體裁文本進行的兩次實驗中,都以中文為參照標準,利用程序分析中英文、中俄文遷移現(xiàn)象。在分析中俄文正遷移現(xiàn)象時,如果中英文有相似的正遷移現(xiàn)象,那么,中國學生就可以借助中英文的正遷移現(xiàn)象來學習俄語。
兩次實驗結(jié)果顯示,《洛麗塔》的中俄、中英文本處理結(jié)果正遷移率均高于75%,聯(lián)合國決議的中俄、中英文本處理結(jié)果正遷移率接近90%(表1)。
表1 正、負遷移率統(tǒng)計
正遷移率高,說明不同語種版本的文本內(nèi)涵總體相符,但也存在語義偏差,即出現(xiàn)了語言遷移現(xiàn)象。小說《洛麗塔》的正遷移率較低,這是因為小說體裁的文學性特點決定了作品在翻譯過程中在使用翻譯手法時可能使內(nèi)容發(fā)生改變。而在聯(lián)合國決議中,為保證其文本傳遞內(nèi)容的嚴謹性與權(quán)威性,在將相同內(nèi)容進行不同語言翻譯的過程中,其展現(xiàn)出較高正遷移率。所以,文學類文本的正遷移率低于公文類文本是正常的。
通過進一步比較實驗數(shù)據(jù)可以發(fā)現(xiàn)(表2),中俄語、中英語對應單詞都呈正遷移的詞在漢語中絕大多數(shù)只有一個語義,與英語、俄語相同意思的單詞有且僅有單一的對應關(guān)系。這些詞在俄語和英語中在構(gòu)詞方法上極為相似,詞的來源基本可以追溯至希臘語或拉丁語。在漢語中,對應詞義只在現(xiàn)代漢語使用,相關(guān)概念自近代以來從西方傳入中國。
例如:
表2發(fā)現(xiàn)與實驗預期一致,由此可以得出,英語確實在拉近中文和俄語概念遷移距離中起到了正向作用。
表2 具有典型正遷移現(xiàn)象單詞的中、英、俄語對照(部分)
本文通過實驗驗證了基于概念遷移理論所做的假設,即證明了在漢語、俄語之間具有正遷移現(xiàn)象的單詞與英語有聯(lián)系,進而證明概念遷移理論認為的英語、俄語兩種語言的兩種語言背后的思維方式和認知角度確實存在聯(lián)系具有科學性。在實踐教學中,教師可以利用英語對語言正遷移這種聯(lián)系促進中俄雙語教學。
此外,通過數(shù)據(jù)結(jié)果中的中文單詞,可以看出,語言和文化本身的可變性。近代以來,中國社會的開放促進了中國民族文化對新事物的吸收,在語言之中,則體現(xiàn)為縮小了中文和英語、俄語等國際性語言的語言遷移距離。隨著全球化進程的不斷推進,世界各民族文化交流會愈發(fā)深入,所以筆者大膽預測未來世界各個民族的文化將會出現(xiàn)更多共性,漢語與俄語的語言的遷移距離將會有下降趨勢。