Sven Tarp 撰 陳 汝 耿云冬 譯
本次講座的主題聚焦“有意學(xué)習(xí)”(intentional learning)和“附帶學(xué)習(xí)”(incidental learning),有關(guān)這對概念的討論已長達(dá)至少十年之久。今天,我將嘗試從一個新的技術(shù)角度來探討這個問題,其靈感來自于愛因斯坦談?wù)撡だ詴r所說的一段話,[1]其中提到,應(yīng)該“從新的角度審視一些固有的問題”(to regard old problems from a new angle)。此次講座內(nèi)容與之前我在中國的另一場會議[2]上所講的內(nèi)容相似。但此次我有更加充足的準(zhǔn)備時間,因此,思考也更加深入。
二語習(xí)得既可以是“有意學(xué)習(xí)”,也可以是“附帶學(xué)習(xí)”。現(xiàn)有學(xué)術(shù)文獻(xiàn)對這兩大概念的定義非常多。例如,在肖恩·洛文(Shawn Loewen)和佐藤正?。∕asatoshi Sato)編著的《勞特利奇課堂二語習(xí)得手冊》(The Routledge Handbook of Instructed Second Language Acquisition,2017)中,就可以找到很多相關(guān)定義,該手冊在部分專欄還列出了一些重要概念的簡短釋義:“附帶學(xué)習(xí)”指學(xué)習(xí)者不帶有特定學(xué)習(xí)意圖的學(xué)習(xí),而“有意學(xué)習(xí)”的概念則相反,它與意圖(intent)或意向(intention)相關(guān)聯(lián)。事實上,區(qū)分這兩個概念并非易事,在“有意學(xué)習(xí)”和“附帶學(xué)習(xí)”之間還存在一個“灰色地帶”(grey zone),而形成這一“灰色地帶”的因素有很多。以我個人的教學(xué)體會為例:我在西班牙語課堂上給學(xué)生做了口語測試,有部分學(xué)生表現(xiàn)非常好,另外一部分卻存在一些問題。近一年半以來,我們一直是線上教學(xué),我建議學(xué)生們利用休息時間多讀一些用西班牙語寫作的書籍,選擇感興趣的主題,以循序漸進(jìn)的方式習(xí)得語言。學(xué)生主動閱讀的過程其實就是在開展“有意學(xué)習(xí)”,因為他們能夠清楚地意識到自己是在自主學(xué)習(xí)。就我自己而言,我已經(jīng)用西班牙語教了三十多年的書。雖然我和學(xué)生同樣都是閱讀西班牙語作品,但于我而言,西班牙語的學(xué)習(xí)主要是“附帶學(xué)習(xí)”。即便如此,我也能夠意識到我有時也在主動學(xué)習(xí),并非完全是“附帶學(xué)習(xí)”。由此,我深感要厘清這兩個概念之間的差異并不容易。在二語習(xí)得環(huán)境下,我們會發(fā)現(xiàn)“有意學(xué)習(xí)”和“附帶學(xué)習(xí)”都可與閱讀活動相關(guān)聯(lián)。然而,我認(rèn)為,“附帶學(xué)習(xí)”與文本產(chǎn)出(尤其是寫作)的聯(lián)系也非常緊密,而且通常情況下,基于書面語文本所發(fā)生的交流情境大致如下:作者和讀者不處在同一時間域,當(dāng)作家在寫作時遇到問題,他們會查閱詞典;而讀者在閱讀時遇到問題,他們同樣是查閱詞典。在這種情況下,詞典似乎成為了他們交流的中介,如果閱讀者只是完成“附帶學(xué)習(xí)”,那么他就要盡可能縮短查閱過程,也就是說花最少的時間查閱不熟悉的單詞。在本次講座中,立足于書面語文本(包括文本閱讀和文本寫作),我將重點從詞典學(xué)視角來探討“有意學(xué)習(xí)”和“附帶學(xué)習(xí)”之間存在的“灰色地帶”。
在詞典學(xué)視閾下,我把“附帶學(xué)習(xí)”界定為“學(xué)習(xí)者在持續(xù)閱讀或?qū)懽鬟^程中通過查閱詞典來獲得所需要的信息,整個學(xué)習(xí)過程完全不受到干擾,通過查閱詞典,學(xué)習(xí)者習(xí)得新詞(包括詞語、義項、語法結(jié)構(gòu)等)”。相反,當(dāng)學(xué)習(xí)者暫停閱讀或?qū)懽?,決定對其中一些問題進(jìn)行深入探究,“有意學(xué)習(xí)”就開始了:以詞典使用為例,學(xué)習(xí)者可能出于興趣或其他原因中斷閱讀或?qū)懽鳎D(zhuǎn)而去翻閱一本詞典,獲得一些關(guān)于詞語的信息(如語法、義項或句法結(jié)構(gòu)等),那么,這就意味著他已經(jīng)開始有意學(xué)習(xí)了。假設(shè)閱讀者查閱的是傳統(tǒng)意義上的詞典,情況會怎樣呢?需要特別指出,我這里所提及的傳統(tǒng)意義上的詞典囊括了紙質(zhì)詞典、詞典應(yīng)用程序、在線詞典等。無論哪一種,閱讀者都得放下正在閱讀的文本,在外部的詞典資源中查閱信息。在可能獲取的信息中,大部分與當(dāng)前具體語境沒有關(guān)聯(lián),而查閱這些信息,不僅花費大量時間,還會影響閱讀進(jìn)程。因此,需要將詞典研發(fā)與數(shù)字化技術(shù)相結(jié)合。在進(jìn)一步探討這一話題前,有必要先簡短回顧一下詞典學(xué)發(fā)展的歷程。
我想從追溯詞典在歐洲的演變史來展開論述。早在公元前8世紀(jì)末,古希臘最重要的兩部史詩《伊利亞特》和《奧德賽》誕生。當(dāng)時的作品全部是手寫,300年后人們開始謄抄這些作品,在這個過程中,抄寫員創(chuàng)造了一些新詞,并且使用其他詞匯對新詞進(jìn)行闡釋,只不過這些詞在今天已經(jīng)很少或不再使用了。據(jù)我的理解,這個闡釋的過程類似中國古代的訓(xùn)詁學(xué)。再往后200年,學(xué)者們把這些詞語匯編入詞典,這便是歐洲詞典的起源,但這并不是人類編纂詞典的開端,因為我們知道早在4000年以前,詞典就以某種形式存在了。彼時,人們制作詞匯對照表,并在形式上做了兩個重要創(chuàng)新:一是增設(shè)條目或中心詞,通過豐富詞匯信息(包括詞頭、音標(biāo)、詞性、釋義、例證等),逐步構(gòu)建詞典的微觀結(jié)構(gòu);二是收集單詞,并單獨設(shè)立條目,我們稱之為詞典的宏觀結(jié)構(gòu)。這些創(chuàng)新無疑是一種進(jìn)步。早期制作詞匯表,首先需要確立詞語的標(biāo)準(zhǔn)形式。文本中出現(xiàn)的詞語有可能是基于標(biāo)準(zhǔn)形式的語法變體,這就需要編者能夠加以辨別,以標(biāo)準(zhǔn)形式作為詞語條目,這是詞典發(fā)展的一個重要體現(xiàn)。正如我們所見,按照歐洲的傳統(tǒng),詞典條目是完全按字母順序來編排的。但不得不說,正因為有了詞典,我們可以在任何情況下進(jìn)行查閱,這的確是件好事。但我們也要充分認(rèn)識到,查閱過程其實是一個復(fù)雜的認(rèn)知過程。從詞典使用者的角度看,他們需要明辨詞語的標(biāo)準(zhǔn)形式,且具備按照字母排序來查詢詞典的能力。在微觀結(jié)構(gòu)方面,尤其是印刷技術(shù)得以發(fā)明之后,詞語信息越來越豐富,這也就意味著編者需要思考如何在有限的印刷空間內(nèi)更好地呈現(xiàn)詞語的信息。由于印刷媒介的篇幅限制,詞典中出現(xiàn)了許多縮寫形式??傊?,學(xué)習(xí)者查閱的過程是比較復(fù)雜的,需要一些訓(xùn)練和具備一定的查閱能力。事實上,關(guān)于英語學(xué)習(xí)者詞典使用的爭議長期存在,山田茂(Shigeru Yamada)曾說:“詞典查檢不成功的因素有兩個:要么是詞典的原因,要么是用戶自身的原因?!保ㄞD(zhuǎn)引自Rundell 2015)26-27《麥克米倫高階英語詞典》主編邁克爾·倫德爾(Rundell 2015)則認(rèn)為問題應(yīng)歸于詞典,因為詞典本該科學(xué)設(shè)計,直觀呈現(xiàn)信息。換言之,如果在學(xué)習(xí)者查閱能力和詞典直觀呈現(xiàn)之間選擇一個影響因素,倫德爾傾向于把問題歸結(jié)于后者。當(dāng)然,如果是詞典質(zhì)量低劣或詞典印刷問題,則應(yīng)另當(dāng)別論?;跀?shù)字技術(shù)的不斷發(fā)展,可以開發(fā)出信息呈現(xiàn)更為直觀的詞典,這樣學(xué)習(xí)者可以輕松查閱,并實現(xiàn)“附帶學(xué)習(xí)”,這是本文討論的另一重要議題。
值得一提的是,編纂詞典是一種技能?!霸~典學(xué)”這個詞源自希臘語,意為“關(guān)于詞與描述”。進(jìn)入數(shù)據(jù)時代,語言數(shù)據(jù)不僅用于編纂詞典,還可以整合嵌入各類電子工具、寫作助手等。與傳統(tǒng)詞典編纂關(guān)注詞典文本本身有所不同,大數(shù)據(jù)時代的詞典編纂應(yīng)更加重視如何提高快捷有效地滿足用戶需求,這應(yīng)當(dāng)成為數(shù)字詞典研究的重點。今天,電子閱讀器、學(xué)習(xí)類應(yīng)用程序、寫作助手和其他學(xué)習(xí)工具基本都包含詞典。但由于編纂理念過于保守和傳統(tǒng),我個人認(rèn)為這種整合目前并不是很成功。下面以我的一次電子閱讀經(jīng)歷為例。2021年11月,我讀了一則故事,閱讀過程并不順暢,其間,我碰到mark一詞,并對其在上下文中的含義不甚理解。于是,我試圖借助電子閱讀器中的嵌入式詞典(integrated dictionary)來解決我的疑惑。我選中該單詞并點擊,頁面便出現(xiàn)了與mark相關(guān)的語言知識。瀏覽之后,發(fā)現(xiàn)所展示的信息并不能解決我的問題,我想查閱的是mark做動詞時的語義知識,嵌入式詞典卻給了我它作為名詞的語義(詳見圖1)。繼續(xù)點擊more,彈出一個很長的信息界面,我不斷滑動鼠標(biāo),嘗試查看全部內(nèi)容。顯而易見,在大量信息中找到切合當(dāng)下閱讀語境的詞義需要耗費一些時間,我想找mark作為動詞的信息,卻“被動”瀏覽了嵌入式詞典給出的6個義項,甚至還有一些額外的數(shù)據(jù)或信息。實際上,如果我只是想了解mark在某一具體語境中的詞義,上面這種情況就可算是信息或數(shù)據(jù)過載(information or data overload)了,因為有許多信息是無關(guān)緊要的,“附帶學(xué)習(xí)”也就很難實現(xiàn)。查閱單詞的過程擾亂了我的專注力,一度中斷了閱讀進(jìn)程。
圖1 電子閱讀器嵌入式詞典查閱過程展示
如上所示,在查閱了很多不相關(guān)的數(shù)據(jù)之后,我才找到真正所需的信息,其間花費了大量的時間。我的注意力從正在閱讀的文本轉(zhuǎn)移到了詞匯查閱上,閱讀中斷,這使得我之前所定義的“附帶學(xué)習(xí)”變得無法實現(xiàn)。某種程度而言,它只解決了我的部分問題——標(biāo)記詞類:我點擊mark的名詞用法,發(fā)現(xiàn)在這些被標(biāo)記的詞中,有些既不是名詞,也不是代詞或動詞。這表明,該標(biāo)記工具還需完善。標(biāo)記可以解決部分問題,但并不完全可靠。那么,怎樣才算是理想的解決方案呢?答案應(yīng)該是有這樣一個程序,它能夠檢測出文本中單詞的具體語義。遺憾的是,目前還沒有研發(fā)出這樣的程序,但我們正通過人工智能與詞典學(xué)相結(jié)合的方式尋找解決的方案。據(jù)我所知,已有歐洲的詞典公司在朝著這一方向努力,只是該項技術(shù)十分昂貴,它基于機(jī)器學(xué)習(xí)、語料庫、詞典數(shù)據(jù)庫等,顯示英語單詞在特定語境下的意義,識別率高達(dá)90%。當(dāng)然,該技術(shù)的應(yīng)用不僅取決于信息工程師,還取決于詞典編纂者。只有詞典編纂者提供高質(zhì)量的數(shù)據(jù)庫,這項技術(shù)才能快速發(fā)展。例如,目前如谷歌公司擁有巨大數(shù)據(jù)處理能力,為實現(xiàn)這一目標(biāo),其16個處理器能夠連續(xù)長時間同時工作,時間可以長達(dá)數(shù)周。而與我合作開展研究的一家詞典公司目前還負(fù)擔(dān)不起這一技術(shù)。眾所周知,新技術(shù)在誕生初期總是很昂貴、難以負(fù)擔(dān),但若干年后,技術(shù)會普及,我們就可以拿來使用,這意味著我們作為詞典編纂者必須未雨綢繆,要為未來的發(fā)展趨勢做好準(zhǔn)備。假設(shè)我們已經(jīng)擁有這項技術(shù),那么,在查詢中就會快速獲取所需的詞義,即mark作為“通過某一具體行動來慶?;蚣o(jì)念”解的義項,這一查詢結(jié)果對“附帶學(xué)習(xí)”來說就足夠了。如果我想從“附帶學(xué)習(xí)”轉(zhuǎn)為“有意學(xué)習(xí)”,就可以點擊more獲得更多信息。如果將來能夠根據(jù)概率(probability)統(tǒng)計來對不同義項進(jìn)行排列就更加有趣了。雖然目前沒有這項技術(shù),但至少在未來有實現(xiàn)這一技術(shù)的可能。
我們學(xué)習(xí)語言還面臨另外一個挑戰(zhàn)——如何處理“多詞語義單位”(multi-word units of meaning)。例如,隨著語料庫相關(guān)研究的不斷深入,與辛克萊(Sinclair)合作的詞典學(xué)家愈發(fā)地意識到,很多單詞在與其他詞的搭配組合時會產(chǎn)生新的語義,它們被稱作“擴(kuò)展的語義單位”(extended units of meaning)或“多詞語義單位”。對詞典學(xué)家而言,這一語言現(xiàn)象非常有趣。辛克萊建議將這些詞作為“中心詞”(headwords)使用,這在大多數(shù)詞典中仍然存在。以單詞part為例。假設(shè)你想知道文本中part的詞義,鼠標(biāo)選中并點擊part,嵌入式詞典會“打包”顯示take part這個詞組,同時彈出對等釋義詞participate。這種學(xué)習(xí)模式很有趣。你以為你的問題是要知道part的詞義,實際上,你的問題是take part的詞組意義。但是最開始查詢時并沒有意識到這一點,你點擊了part,得到的答案已然是take part。目前,這一技術(shù)已經(jīng)存在,但需要推廣。(詳見圖2)
圖2 電子閱讀器嵌入式詞典多詞語義單位查閱展示(1)
再舉一例。我曾與廣東外語外貿(mào)大學(xué)的黃芳老師合作開展過一項研究(Huang,Tarp 2021),涉及一款中國學(xué)習(xí)者常用的英語學(xué)習(xí)軟件“開言英語”(Kaiyan Open Language)。以set的查詢?yōu)槔c擊set,該學(xué)習(xí)軟件會彈出很長的詞條信息,屏幕上顯示出該詞有兩種不同的詞性,分別是動詞和名詞。繼續(xù)點擊屏幕上的“查看完整釋義”,會出現(xiàn)set作為形容詞的用法,可見set是一個復(fù)雜的英語單詞。然而,讀者希望看到的只是set在此語境下的釋義,滿屏的詞條信息不僅會影響讀者的閱讀體驗,還妨礙閱讀者的“附帶學(xué)習(xí)”。(如圖3所示)
圖3 電子閱讀器嵌入式詞典多詞語義單位查閱展示(2)
事實上,在set詞條的釋義內(nèi)容中,它作為名詞的含義“(物品的)一套,一組”,才是我需要的情境語義,其他信息均不相關(guān)。如何不顯示冗余的、不相關(guān)聯(lián)的信息是未來的研究方向。遇到以上情況,我認(rèn)為理想的詞典應(yīng)該是這樣的:點擊set,只出現(xiàn)“(物品的)一套,一組”這個釋義,自動屏蔽不相關(guān)聯(lián)的信息(如圖4所示)。大家可以看到,在釋義內(nèi)容左側(cè)還有一個“小喇叭”的圖標(biāo),如果讀者需要獲取該詞的讀音,點擊圖標(biāo)即可;在釋義內(nèi)容右側(cè)有一個“向右箭頭”(>)的圖標(biāo),點擊查詢更多詞條信息,這樣“附帶學(xué)習(xí)”就轉(zhuǎn)化成了“有意學(xué)習(xí)”。
圖4 電子閱讀器嵌入式詞典多詞語義單位的新設(shè)計理念
就這個例子而言,“附帶學(xué)習(xí)”的內(nèi)容包括set的發(fā)音和情境釋義,但不包括詞語條目、詞性、語法變體、非情景釋義等其他信息。這種釋義模式其實是受到漢語訓(xùn)詁學(xué)的釋義方法、荷馬史詩抄寫員所采取的釋義方法的啟發(fā),它們之間有相似之處。在閱讀過程中,讀者碰到生僻詞語,只希望在最短時間內(nèi)得到解釋。
一旦讀者想要獲得除釋義之外的其他信息(比如詞頭、詞性等),就意味著“附帶學(xué)習(xí)”開始向“有意學(xué)習(xí)”發(fā)生轉(zhuǎn)變。那么,問題在于如何才能讓計算機(jī)在最短時間內(nèi)給讀者提供當(dāng)下所需的釋義?首要的方法是數(shù)據(jù)過濾,主要分兩步:第一步,用戶界面加載從數(shù)據(jù)庫中提取出來的詞典數(shù)據(jù);第二步,以定量計量的方式呈現(xiàn)數(shù)據(jù),以滿足讀者“附帶學(xué)習(xí)”和“有意學(xué)習(xí)”過程中的特定需求。這里還涉及另一個重要的概念,即“人工輔助智能”(human-assisted intelligence,以下簡稱“人助智能”),這個概念既有趣又重要。眾所周知,利用人工智能(artificial intelligence)可以做很多事情,例如,它能夠判斷文本模式,這是人類僅靠雙眼觀察無法做到的。如果是要給出單詞在具體語境下的特定含義,人工智能就行不通了,但人類可以做到。此時,為了解決這一問題,可以引入“人助智能”,具體做法如下:語言專家點擊電子文本中想要查詢的詞匯單位,可以是單詞,也可以是詞組,然后彈出一個釋義框,緊接著,專家就能夠在其中標(biāo)記出正確的、符合語境的釋義,這整個操作流程被一個特定編寫的程序自動記錄下來。第二次有讀者需要查詢這個單詞或詞組時,用戶界面彈出的釋義框就只會顯示專家標(biāo)記之后的內(nèi)容,幫助讀者在具體語境中快速準(zhǔn)確地理解詞匯單位。整個操作過程只需要用手指觸碰屏幕即可,所需信息會自動呈現(xiàn)。通過這種方式,詞典釋義和語境的關(guān)系更加緊密,用戶界面出現(xiàn)的信息必須有助于上下文的理解,這也是普通電子詞典邁向智能詞典的第一步。這一方法十分高效,我們希望在未來,一個訓(xùn)練有素的“專家”每分鐘可以標(biāo)記2—3個詞匯單位。此外,這一特定程序的編寫很容易實現(xiàn)。從長期維護(hù)來看,還需要添加用戶反饋,這樣才能不斷提升學(xué)習(xí)類應(yīng)用軟件的質(zhì)量。
上述例子是我們目前在閱讀/學(xué)習(xí)類應(yīng)用軟件、互聯(lián)網(wǎng)以及數(shù)字技術(shù)方面的一些思考,希望未來能夠繼續(xù)發(fā)展。
帕特里克·漢克斯(Patrick Hanks 2013)399曾言,“原則上,可能的(語言)組合(possible combinations)從數(shù)量上來說可以是無限的,可行的(語言)組合(probable combinations)卻相對有限”。[3]邁克爾·倫德爾(Michael Rundell 2018)6也曾說過,“盡管語料庫分析能讓我們觀察大多數(shù)語言產(chǎn)出的內(nèi)在可預(yù)測性(inbuilt predictability),但學(xué)習(xí)者遠(yuǎn)不能夠?qū)Υ俗龀鲱A(yù)測”。[4]母語者可能較容易掌握本族語的語言組合,但是這對于非母語學(xué)習(xí)者而言就非常困難。針對這一問題,我們來看看寫作助手的相關(guān)情況。應(yīng)用軟件不同,技術(shù)和功能也會不同。有些寫作助手能夠在作者寫出第一個詞之后馬上提示可能出現(xiàn)的下一個單詞,甚至是整個句子。當(dāng)作者不知道應(yīng)該使用第二語言中的哪一個單詞時,寫作助手就會提供最有可能的對應(yīng)詞。這些技術(shù)的核心主要是依靠語境給出判斷。通過此類應(yīng)用,二語學(xué)習(xí)者在習(xí)得過程中也能實現(xiàn)“附帶學(xué)習(xí)”和“有意學(xué)習(xí)”。
一般而言,寫作助手是基于語言模型的,同時還會使用數(shù)據(jù)庫和詞典數(shù)據(jù)作為數(shù)據(jù)資源。無論是通過統(tǒng)計編程還是機(jī)器學(xué)習(xí)來處理自然語言,其結(jié)果都是基于語言模型。結(jié)合具體語境,語言模型為寫作者提供建議。這一項技術(shù)已然存在,當(dāng)然,它還有改進(jìn)完善的空間。下面以丹麥一家詞典公司研發(fā)的寫作系統(tǒng)(WriteAssitant)為例(檢索過程如圖5所示):假設(shè)我現(xiàn)在是一名西班牙人,正在用英語寫作,一時想不起某個英語單詞,只好用自己的母語西班牙語單詞cerrado來替代,輸入之后馬上出現(xiàn)了一組英語對等詞,而且是按照它們在具體語境中出現(xiàn)的概率來排序。這里我不討論概率是如何計算出來的,因為太過于復(fù)雜。在這一組對等詞中,只要我認(rèn)識其中一個,比如sealed,我就可以選擇使用。如果我仍然不確定選擇的單詞是否正確,我可以點擊sealed右側(cè)的“向右箭頭”(>)繼續(xù)查詢,出現(xiàn)了一些非常簡短的定義,而其中一個定義看起來非常有趣,繼續(xù)點擊,就可以看到完整定義。在這個過程中,我從“附帶學(xué)習(xí)”轉(zhuǎn)為“有意學(xué)習(xí)”。這項技術(shù)雖已經(jīng)研發(fā)出來,但也面臨著后臺的詞典數(shù)據(jù)庫不夠好這一問題,這也說明相關(guān)技術(shù)仍然沒有為迎接真正的數(shù)字辭書時代做好準(zhǔn)備。
圖5 WriteAssistant檢索界面
再舉一例,仍然是關(guān)于寫作的問題。比如,因為缺少明確的辨析規(guī)則,而且詞典中也沒有明確的界定,學(xué)習(xí)者常常難以區(qū)分-ic和-ical為詞綴結(jié)尾的形容詞之間的差異。翻開《牛津派生形態(tài)學(xué)手冊》(Oxford Handbook of Derivational Morphology),你會發(fā)現(xiàn)幾乎有1.2萬個英語詞干可以同時添加這兩個后綴。根據(jù)《朗文交際3000詞》(Longman Communication 3000),英語中以這些后綴結(jié)尾的形容詞占1%左右。大家可以參見我與廣東外語外貿(mào)大學(xué)詞典學(xué)研究中心馬立東老師共同撰寫的一篇文章(Ma,Tarp 2020)。我們發(fā)現(xiàn),以-ic和-ical為詞綴結(jié)尾的形容詞對(adjective pairs)總會給二語學(xué)習(xí)者帶來困擾,造成使用錯誤的情況。在有些情況下,兩個變體含義不同,詞頻不同。另外,在某些固定搭配或術(shù)語表達(dá)中,其中一個變體更為常見,另外一個變體則使用頻率低、甚至不被使用。以academic和academical為例。往前追溯200年,academical比academic更常見,但今天,人們幾乎不再使用academical。
從圖6可知,8年前有一門俄語課程《學(xué)術(shù)寫作》,英語譯成Academical Writing。2018年發(fā)表在《歐洲跨學(xué)科研究期刊》(European Journal of Multidisciplinary Studies)上的一篇文章,其標(biāo)題里面也用了Academical Writing。這就意味著,即使是學(xué)術(shù)界人士,如果他們的母語不是英語,也可能會錯誤使用這些形容詞對。這是一個非常棘手的難題。我們應(yīng)思考:如何處理這一問題?寫作助手又該如何應(yīng)對這個問題?
圖6 academic與academical使用情況歷時分析
事實上,有些以-ic和-ical為詞綴結(jié)尾的形容詞對,其含義并不相同。受一些詞典設(shè)計的啟發(fā),我們提出三種可能的解決辦法:一是增加用法比較說明,二是簡要解釋兩個形容詞的含義,三是增加固定搭配用法。如果是數(shù)據(jù)庫,可以在兩種形式后面附加單詞使用說明,包括此類形容詞對的使用特征。如果是彈出的查閱窗口,那么應(yīng)該默認(rèn)顯示詞匯辨析,如果辨析詳細(xì)具體,需要多頁顯示,則應(yīng)予以標(biāo)記,方便用戶查閱。整個查閱過程同樣包含了從“附帶學(xué)習(xí)”到“有意學(xué)習(xí)”的轉(zhuǎn)變。
對于所有以-ic或-ical詞綴結(jié)尾的形容詞對,我們都需要設(shè)置“X或Y”文本段:其一是為了提示讀者,兩個形容詞不是互換關(guān)系,只能二選一;其二是引起讀者關(guān)注,這兩個形容詞存在差異。比如,我先寫一段英文,在寫作過程中彈出了economic和economical這兩個單詞,我對它們的用法有一定的困惑,舉棋不定。為了進(jìn)一步了解二者的區(qū)別,我點擊單詞彈出框,出現(xiàn)了兩個簡短的定義(詳見圖7):當(dāng)然,如果想獲得更多信息,可以繼續(xù)點擊查看。以上操作需要一個前提條件,那就是提前準(zhǔn)備好單詞辨析的相關(guān)內(nèi)容,否則就無法通過寫作助手來幫助作者選擇正確的單詞。
圖7 economic和economical辨析程序設(shè)計示意圖
還有另外一種情況:詞義相同,單詞使用頻率卻明顯不同。針對這種情況,寫作助手可以提供三種用法說明,分別是“不用X,用Y”“很少使用X,用Y”和“已經(jīng)棄用X,用Y”。以上三種用法說明只在作者選擇使用X的情況下出現(xiàn),如果作者一開始就選擇使用Y,那么就不會彈出提示窗口。也就是說,該窗口只會在用戶輸入不推薦的形式之后才會被激活。接下來,我們看看具體的操作(詳見圖8)。比如,我現(xiàn)在輸入單詞specifical,單詞上方馬上彈出信息,表明specifical已經(jīng)過時了,可以用specific代替。如果我想了解更多關(guān)于specific的知識,點擊該單詞即可。
圖8 specific和specifical用法辨析設(shè)計示意圖
你可能并不知道specifical這個單詞的存在,但有些詞典,比如《柯林斯詞典》同時收錄了這兩個單詞,詞條信息中卻找不到類似“不用specifical,用specific”的提示信息。也有詞典,比如《韋氏詞典》,只收錄了其中一個單詞。綜上所述,對于二語學(xué)習(xí)者來說,詞匯辨析與選擇的確是一個復(fù)雜的問題,上文提及的解決方法有三大優(yōu)勢:直接推薦用法;推薦的原因直截了當(dāng);標(biāo)準(zhǔn)化的信息標(biāo)注方法也易被詞典編纂者所掌握。
在“附帶學(xué)習(xí)”場景下,寫作助手推薦的用詞必須穩(wěn)妥、合乎語境且簡單直接,避免冗余信息帶來的干擾。然而,“有意學(xué)習(xí)”強(qiáng)調(diào)輕松便捷地獲取附加信息,當(dāng)然,在這個過程中用戶也會受到不相關(guān)信息的干擾。目前,我們已經(jīng)擁有人工智能、人工輔助智能、高級編程等技術(shù),下一步是思考如何將它們充分應(yīng)用到詞典數(shù)據(jù)庫構(gòu)建和寫作助手的軟件開發(fā)中。
如果我們充分利用前沿科技,就能幫助用戶自動檢測擴(kuò)展語義單位,就能通過概率計算確定詞匯的語境意義,就能根據(jù)具體語境將所有對等詞優(yōu)化排序。除此之外,我們還能借鑒中國古代的訓(xùn)詁學(xué)思想,突破具體語境的限制,盡可能呈現(xiàn)出豐富的釋義內(nèi)容。新時代背景下,詞典學(xué)領(lǐng)域面臨著重大的技術(shù)突破,比如,“語境敏感型詞典”(contextaware dictionary),伴隨著它的出現(xiàn),詞典內(nèi)部逐漸會形成一個語境適應(yīng)選擇系統(tǒng)。然而,正如我所指出的,“語境敏感型詞典”的研發(fā)不僅需要信息工程師、程序員等提供先進(jìn)的技術(shù),還需要詞典編纂者不斷完善詞典數(shù)據(jù)庫設(shè)計和優(yōu)化用戶界面,方便目標(biāo)用戶快速獲取所需數(shù)據(jù)。這意味著公司股東、詞典編纂者、語言專家、教師、設(shè)計師、信息程序員等必須開展密切的跨學(xué)科合作。我認(rèn)為,這是未來詞典學(xué)發(fā)展的必然要求,因為大多數(shù)人都有查閱詞典的需求,通常情況下,他們都希望能夠通過詞典簡單快速地找到解決問題的答案,而詞典設(shè)計與研發(fā)也應(yīng)朝著這個目標(biāo)不斷努力。在數(shù)字詞典使用場景下,詞典的首要功能應(yīng)是滿足用戶“附帶學(xué)習(xí)”的需求。如果詞典用戶想獲取更多信息,“附帶學(xué)習(xí)”又可轉(zhuǎn)變成“有意學(xué)習(xí)”。這正好呼應(yīng)了達(dá)芬奇那句反復(fù)被引用的句子——“至繁歸于至簡”(Simplicity is the ultimate sophistication)。
附 注
[1]愛因斯坦的原話如下:“To raise new questions,new possibilities,to regard old problems from a new angle,requires creative imagination and marks real advance in science.”(轉(zhuǎn)引自 Tarp 2009)30
[2]第七屆學(xué)習(xí)詞典與二語教學(xué)國際研討會(福建泉州)。
[3]原文:“Although the number of possible combinations may in principle be limitless…the number of probable combinations…is rather limited.”(Hanks 2013:399)
[4]原文:“Although corpus analysis enables us to observe the inbuilt predictability of most language output,much of this is far from predictable to a learner or non-fluent user of a language.”(Rundell 2015)6