吳雙
摘要:語料庫對于大學(xué)本科日語寫作教學(xué)有著輔助性的作用。但日本開發(fā)的大型語料庫及國內(nèi)現(xiàn)有的日語學(xué)習(xí)語料庫對大學(xué)日語寫作的教與學(xué)缺乏針對性和可用性。教師可利用學(xué)生寫作素材及寫作教材教輔自制小型寫作語料庫,并引導(dǎo)學(xué)生在寫作任務(wù)的完成過程中加以合理利用。實驗證明,自制小型寫作語料庫能為學(xué)生提供更為真實的語言材料,能有效提高日語專業(yè)學(xué)生寫作過程中的詞法能力、句法能力、篇章能力及自我修改能力。
關(guān)鍵詞:自制語料庫;日語寫作;詞法;句法;篇章法
一、日語語料庫的現(xiàn)狀
與發(fā)展較為成熟的英語語料庫相比,日語語料庫的建設(shè)及相關(guān)研究始終相對滯后。日本方面開發(fā)的語料庫主要有:KOTONOHA「現(xiàn)代日本語書き言葉均衡コーパス」、JpWac-L2「學(xué)習(xí)者用例文コーパス」、EDR語料庫、京都大學(xué)語料庫、太陽語料庫、日本古典文學(xué)全文數(shù)據(jù)庫。而針對日語外國人學(xué)習(xí)者的語料庫有寺村秀夫主持建立的「外國人學(xué)習(xí)者の日本語誤用例の収集·整理と分析」和由日本國立國語研究所建立的「日本語學(xué)習(xí)者による日本語作文と、その母國語訳の対訳データベース。而中國日語學(xué)界開發(fā)的語料庫主要有中日對譯語料庫和中國日語學(xué)習(xí)者語料庫CLJC。近年來,語料庫被廣泛地運(yùn)用與外語教學(xué)理論與實踐中,其中,語料庫對外語寫作教學(xué)的幫助也取得了國內(nèi)外學(xué)者的共識。日本學(xué)者投野由紀(jì)夫、荻野網(wǎng)男、寺嶋弘道、美咲敦子、望月通子等也對日語語料庫在語言教育中的作用給予了充分的肯定,如投野(2003)提出語料庫在語言教育中的間接運(yùn)用法與直接運(yùn)用法,即將語料庫運(yùn)用于教材開發(fā)和學(xué)習(xí)者自主運(yùn)用語料庫進(jìn)行學(xué)習(xí)兩種方法。寺嶋發(fā)展了Tim Johns所倡導(dǎo)的“數(shù)據(jù)驅(qū)動學(xué)習(xí)法”,即以語料庫數(shù)據(jù)為學(xué)習(xí)動機(jī)驅(qū)動的學(xué)習(xí)方式,美咲(2008)認(rèn)為學(xué)習(xí)者若能在使用辭書和語法書的同時使用語料庫,那么即使指導(dǎo)者不在也能夠自己解決學(xué)習(xí)疑問。
但筆者認(rèn)為,現(xiàn)有的日語語料庫對中國本科日語專業(yè)學(xué)生寫作能力的培養(yǎng)在存在很大的缺陷,有必要創(chuàng)建專門針對日語寫作的語料庫,以達(dá)到輔助本科日語寫作教學(xué)的目的??v觀現(xiàn)有的日語語料庫,每一個語料庫的素材文本都過于單一,如青空文庫和新潮文庫里所有入選文本均為知名作家的文學(xué)作品,EDR語料庫和京都大學(xué)語料庫所有文本均為報紙雜志,國內(nèi)最大的中日對譯語料庫也基本只收錄了中日著名作家的知名作品,且偏向于小說與散文。這些語料庫所采集的文體類型單一,并非嚴(yán)格意義上的均衡語料庫。語料庫以大量真實的語言作為輸入材料的確有利于語言的產(chǎn)出,但“可理解性輸入”是一個很重要的習(xí)得條件?,F(xiàn)有的諸多日語語料庫中所收錄的文本都大大超出了我國日語初中級階段學(xué)習(xí)者可理解與可接收的范圍,很難想象日語基礎(chǔ)階段的學(xué)習(xí)者可以參考原版的日語小說、名家名作、報紙社論新聞評論等并將其詞句靈活運(yùn)用于自己的寫作中。而且現(xiàn)有的日語語料庫的確均是語篇的簡單疊加,缺乏明確的設(shè)計理念,存在選擇面過窄、類型單一、沒有經(jīng)過系統(tǒng)抽樣、缺乏均衡性的問題。結(jié)構(gòu)的不合理、文體的單一化、缺乏良好均衡性和代表性的語料庫的都大大限制了其對日語寫作教學(xué)的輔助作用。
基于以上分析,筆者主張教師可以自建小型日語作文語料庫,該語料庫專門為日語寫作教學(xué)量身定制,是教師以學(xué)生作文為語言材料構(gòu)件的學(xué)習(xí)者語料庫。
二、小型寫作語料庫的制作
(一)數(shù)據(jù)的收集
筆者收集了14至16年江西師范大學(xué)日語系三屆大二及大三學(xué)生的各類作文,包括作文課上學(xué)生所提交的各種體裁的作文、日記、專業(yè)四級考試作文、演講比賽稿等,然后對其進(jìn)行歸類整理。按照隨機(jī)分層抽樣和按比例收集文本的方法,可以確保所獲預(yù)料的平衡性和代表性。除了從學(xué)生的語言使用實例提取文本外,筆者還收集了大量中國和日本所出版的優(yōu)秀的寫作教材、閱讀教材如美文誦讀、精選晨讀等、學(xué)生獲獎作文優(yōu)秀作品集,尤其是日本母語使用者中的高中生大學(xué)生的寫作材料等作為補(bǔ)充。
(二)電腦配置。
數(shù)據(jù)庫的制作需要借助電腦軟件來完成。在相應(yīng)軟件安裝前需先實現(xiàn)以下電腦配置:1電腦系統(tǒng)設(shè)定為Windows? XP以上。在本次課題研究中,筆者使用的是Windows?7系統(tǒng)。2 CPU為Atom,或Celeron,或Core皆可。筆者使用的是Atom。3電腦內(nèi)存為1GB以上。4在語料庫的制作過程中,許多軟件的運(yùn)營都需要Java的支持,所以必須下載并安裝最新版的Java。
(三)文本格式轉(zhuǎn)換
筆者所收集的數(shù)據(jù)基本為WORD文本格式,而語料庫制作軟件無法識別該種格式文件,所以需要利用批量格式轉(zhuǎn)換軟件將文本轉(zhuǎn)換為所需要的TXT純文本格式。這種文本格式轉(zhuǎn)換軟件有很多,筆者使用的是日本「有限會社サイトー企畫」開發(fā)制作的文本文件的書寫和編輯軟件「秀丸エディタ」,。
(四)語料的語言處理
步驟(一)中所收集的數(shù)據(jù)都完整地存入語料庫中盡量不進(jìn)行刪除,以保持語言的完整性。但由于格式的不統(tǒng)一書寫的不規(guī)范會引發(fā)步驟(五)中賦碼軟件的解析錯誤,必須將每篇文本的標(biāo)點(diǎn)符號段落格式等進(jìn)行了統(tǒng)一,將輸入過程中的誤字、多字、少字等現(xiàn)象進(jìn)行了處理,清楚了文本中的多余雜質(zhì)和多余符號。
(五)語言的賦碼
首先給每篇文本加注篇頭,即標(biāo)注上文章名、寫作者、寫作者所在年級班級、文本字?jǐn)?shù)等相關(guān)信息。標(biāo)注的方法是將上述信息分別填入尖括號中并統(tǒng)一放置在文本的開頭或結(jié)尾處。其次,使用詞性賦碼軟件對文本進(jìn)行詞性賦碼。
(六)語料庫格式轉(zhuǎn)換
步驟(三)中用「秀丸」保存的文本格式的文件是不能直接用來制作語料庫的,必須通過「えだまめ」軟件(注:日本國立國語研究所開發(fā)制作的語料庫數(shù)據(jù)格式的轉(zhuǎn)換軟件)將文本格式的文件轉(zhuǎn)換成語料庫軟件可以接受的文件格式。
(七)語料的整合
此步驟所使用的是日本國立國語研究所開發(fā)制作的全文檢索軟件「ひまわり」。將上述步驟處理完畢的文本語料一一添加進(jìn)「ひまわり」,便可以通過關(guān)鍵詞對所有語料進(jìn)行全文檢索。這樣小型日語寫作語料庫就制作完成了。該語料庫是一開放性的語料庫,今后還可根據(jù)需要增加新的語料庫或刪除不使用的舊語料庫或建立新的子語料庫。
三、自制語料庫對日語寫作的輔助作用
筆者以江西師范大學(xué)外國語學(xué)院日語系2013級36位學(xué)生為實驗對象,分別以北京日研中心的中日對譯語料庫和筆者自制的小型語料庫為基礎(chǔ)進(jìn)行寫作教學(xué)和寫作訓(xùn)練,實驗結(jié)束后,進(jìn)行問卷調(diào)查和訪談式調(diào)查,內(nèi)容涉及對寫作課堂教學(xué)的滿意度、寫作的信心度、寫作過程中在詞法、句法、語篇、自我修改等方面對語料庫的使用情況等。結(jié)果顯示,學(xué)生對自建語料庫的滿意度要大于對傳統(tǒng)語料庫的滿意度,具體如下表所示。
(一)語料庫的實用性和針對性
傳統(tǒng)語料庫所收集的文本往往大于日語學(xué)習(xí)者尤其是中級日語學(xué)習(xí)者的可接受水平,而自制語料庫中的料語難易度適中,符合“i+1”的輸入原則。自建語料庫時可以實時將學(xué)生新提交的作文加入語料庫中,使得語料庫可以不斷更新 ,更具有開放性靈活性和時效性。這樣,學(xué)生亦可以參與語料庫的建設(shè),這將大大激發(fā)學(xué)生的學(xué)習(xí)熱情。
(二)提供真實語言材料
自建語料庫是教師利用自己學(xué)生的作文為對象自行建立的小型學(xué)習(xí)者語料庫,相比傳統(tǒng)語料庫,可以為學(xué)習(xí)者提供更多真實有效的寫作材料。教師在寫作課堂上可以對自建語料庫進(jìn)行示范性的檢索使用,在學(xué)生熟悉了語料庫的使用后,便可在課后按照寫作任務(wù)的內(nèi)容分語域自行收集語料。這樣可以慢慢培養(yǎng)學(xué)生收集信息的意識,掌握收集第一手資料的方法,對于今后畢業(yè)論文的撰寫也大有益處。
(三)提高詞法能力
“一個內(nèi)容廣泛的語料庫就是一座語言真實用法的金礦,而用KWIC(關(guān)鍵詞的語境共現(xiàn))來開發(fā)這座金礦就為詞匯學(xué)習(xí)提供了豐富的上下文。(Jones,2001)。學(xué)生對寫作過程中所需運(yùn)用詞匯的音、形、義及使用場合有任何疑問,都可通過自行檢索語料庫查找該詞語的使用頻率、習(xí)慣搭配、語域分布、共現(xiàn)語境、使用模式等。由于語料庫檢索出的目的語是與上下文共現(xiàn)在語境中的,這種語境共現(xiàn)能充分體現(xiàn)該詞的真實使用情況及近義詞之間的細(xì)微差異,故能取得查字典所不能達(dá)到的學(xué)習(xí)效果。字典中,さびしい一詞的漢字表記有“寂”與“淋”,很多學(xué)生困惑于兩個漢字的使用場合。通過引導(dǎo)學(xué)生使用語料庫搜索關(guān)鍵詞“寂しい”“淋しい”,“寂しい”的詞頻遠(yuǎn)遠(yuǎn)高于“淋しい”,“淋しい”的例句均屬于情感方面,而對風(fēng)景等客觀的情緒皆使用“寂しい”。這就警示了學(xué)生應(yīng)謹(jǐn)慎使用“淋しい”這一表記,如要表達(dá)“走在空寂無人的街道上(人のいないさびしい道を歩く)一義,應(yīng)選擇“寂しい”作為漢字表記。事實證明,依靠詞典單個地學(xué)習(xí)詞語使用是低效機(jī)械地,利用語料庫了解詞語的篇內(nèi)語境能更有效地提高寫作過程中學(xué)生對詞語提取的速度和準(zhǔn)確度。
(四)提高句法能力
通過自制寫作語料庫,學(xué)生亦可提高寫作句法能力。自制寫作語料庫將各種句法語法特征在真實的語境中呈現(xiàn)出來,與傳統(tǒng)的孤立的脫離語境的語法講解不同,可以為學(xué)生提供真實的句法使用案例。由于寫作語料庫中摒棄了會話體的文章,故這些句子都非常適用于寫作,且都在學(xué)生可理解可模仿可接受的范圍內(nèi)。在語法課和日語概況課上,教師在講述“する”與“なる”的對立性時往往提到“する”的主觀性及“なる”的客觀性。但實際上在某些非主觀性的動作表達(dá)時卻有使用“する”的情況。如語料庫中收錄了一篇講述母親懷念兒子的文章,里面有一句“交通事故で息子を死なせた”。顯然母親不可能主觀有意識地將兒子致死,此處無意識的表達(dá)卻使用了“する”而非“交通事故で息子に死なれた”中的“なる”表達(dá),其用意通過上下文的解讀我們可以得出:即母親將自己主動放在加害者的位置,對于本能加以阻止的事態(tài)卻沒有阻止,由此引發(fā)兒子交通事故的后悔心情。
(五)提高篇章能力
傳統(tǒng)的篇章教學(xué)往往是教師給學(xué)生提供兩三篇該體裁的典型范文,如議論文寫作時提出論點(diǎn)給出論據(jù)得出結(jié)論的三段式寫作,這樣八股式的教學(xué)方式極大束縛了學(xué)生的思維。但若將傳統(tǒng)語料庫作為輔助教學(xué)手段導(dǎo)入到語篇教學(xué)中,實際又收效甚微。目前許多語料庫中所選文章的體裁覆蓋面不全,多集中于散文和文學(xué)作品,并且由于受作家個人寫作風(fēng)格的影響,往往其文章又不具備該體裁類文章的普遍性的整體特點(diǎn),所以客觀上難以給學(xué)生提供參考。而專門針對寫作教學(xué)的小型自制語料庫所選文章基本覆蓋了寫作教學(xué)中所需要教授的全部體裁類文章,歸類清晰明確,便于學(xué)生查找。每種體裁基本都可以查找到二三十篇以上的文章,每篇文章都有其獨(dú)特的結(jié)構(gòu)與寫法,有助于拓寬學(xué)生僵化的思維,不至于千篇一律地寫出同一模式的八股文。寫作語料庫為語篇教學(xué)提供了一個平臺,豐富且有序的語篇資料給學(xué)生提供了足夠的空間去分析文章的體裁特征和修辭手段,加深學(xué)生對語篇分析的理解,大大提高學(xué)生搭建語篇的能力。
(六)自我修改
自建學(xué)生作文語料庫從語料來源的角度來說屬于學(xué)習(xí)者語料庫,而學(xué)習(xí)者語料庫一個很重要的功能就是寫作錯誤分析。學(xué)生可以以語料庫作為工具,利用語料庫檢索出于自己所寫詞句相似的語料進(jìn)行比對,從而判斷自己的表達(dá)是否正確和地道。同時,自建語料庫在建立過程中就對所有原始學(xué)習(xí)者語料的錯誤進(jìn)行了人工標(biāo)注,這樣完全標(biāo)注過錯誤的語料庫可以幫助學(xué)生發(fā)現(xiàn)自己未意識到的錯誤,警戒自己在寫作過程中犯同樣類似的錯誤。更為重要的是,在數(shù)據(jù)驅(qū)動學(xué)習(xí)中,讓學(xué)生自己去發(fā)現(xiàn)寫作中的失誤,自己發(fā)現(xiàn)問題并解決問題,可以大大提高學(xué)生的自主學(xué)習(xí)能力和學(xué)習(xí)動力。
四、結(jié)論
根據(jù)教學(xué)實踐及教學(xué)成果可以得出結(jié)論:教師自制的中國日語學(xué)習(xí)者寫作語料庫相比大型語料庫及其他學(xué)習(xí)者語料庫有更強(qiáng)的針對性、靈活性和實用性,能有效地改善學(xué)生寫作中所存在的素材單薄、立意淺顯、詞匯單調(diào)、句式混亂、篇章不連貫等各種問題,切實提高寫作者的寫作意愿,是今后大學(xué)日語寫作教學(xué)改革的一項有益嘗試。但寫作語料庫素材的選擇和甄別上如何訂立標(biāo)準(zhǔn)、如何在國內(nèi)高校進(jìn)行推廣,將是今后值得進(jìn)一步探討的問題。
參考文獻(xiàn):
[1]于康.語料庫的制作與日語研究[M].杭州:浙江工商大學(xué)出版社,2013年
[2]趙宏展.小型翻譯語料庫的DIY[J].北京:中國科技翻譯,2007,(5)
[3]毛文偉.日語自動詞性賦碼器的信度研究[J].上海: 外語電化教學(xué),2012,(5)
[4]張建華,閆騰達(dá).日本語學(xué)習(xí)者データベースの作成[J].北京:日本學(xué)研究,2008
[5]中川正弘.留學(xué)生の日本語作文データベース[J].広島:広島大學(xué)留學(xué)生センター紀(jì)要,1999(9)
[6]楊惠中.語料庫語言學(xué)導(dǎo)論[M].上海:上海外語教育出版社,2002年