牛士偉
(天津外國語大學(xué) 國際交流與合作處,天津 300204)
可讀性,又稱易讀性或易懂性,是指文本易于閱讀和理解的程度或性質(zhì) (李紹山,2000)??勺x性研究最早起源于美國,后應(yīng)用到國內(nèi)的英語教學(xué)中來。近年來,對外漢語教學(xué)在世界各地蓬勃發(fā)展,同時,對外漢語的研究也進入了前所未有的發(fā)展階段,越來越多的研究開始集中于對外漢語文本的可讀性上來,張寧志 (2000:88)以29部常用對外漢語教材的語料為研究對象,第一次比較系統(tǒng)地采用量化方法來衡量教材的難易度,結(jié)果發(fā)現(xiàn),句長和非常用詞數(shù)是影響閱讀難度的重要因素。之后相關(guān)研究都是在此基礎(chǔ)上發(fā)展而來,因此,總結(jié)以往的研究成果,對外漢語文本可讀性研究主要集中在三個方面:1.對外漢語文本可讀性公式的研究;2.對外漢語教材的可讀性研究;3.對外漢語讀物的可讀性研究。
可讀性研究的目的之一就是要得出衡量某種語言文本難易程度的可讀性公式??勺x性公式就是將所有影響閱讀難度的、可以量化的因素 (尤其是文本因素)綜合起來,制定成一個評價文本難易程度的公式 (王蕾,2005:8)。它“通??梢越o出數(shù)字以評價閱讀材料的難易度,并可以按其難易度的程度進行排序”,是一種“預(yù)測性的手段”(王蕾,2008)。英語可讀性公式的研究較早,很多公式至今仍被廣泛應(yīng)用。此外,美國相關(guān)機構(gòu)還制定出各種具有特殊目的的可讀性公式,應(yīng)用于保險條例、合同等文本的難度評價上。而在對外漢語研究領(lǐng)域中,盡管謝澤文(1994)就提出在新加坡華文教學(xué)領(lǐng)域中可以使用“可讀性公式”來研究文本難度的建議,后經(jīng)張寧志 (2000:88)對29部教材初步量化得出了一些影響文本可讀性的因素,但直至王蕾 (2005:2)才針對初中級日韓留學(xué)生的記敘性漢語文本建立了第一個可讀性公式。接著楊金余 (2008:27-28)以三部高級漢語精讀教材為研究對象,得出了一個適用于挑選高級精讀教材文本的語料難度的可讀性公式。另外,郭望皓 (2009:53)采用主觀評價與客觀測量相結(jié)合的方法得出了一個基于計算機自動實現(xiàn)的、面向?qū)W習(xí)漢語留學(xué)生的漢語文本語料難度的可讀性公式。最近,左虹、朱勇 (2014:263)同樣采用主觀評價和客觀測量相結(jié)合的方法得出了針對中級歐美留學(xué)生的漢語文本語料難度的可讀性公式。如表1所示,其中王蕾 (2005:2)、楊金余(2008:27-28)和左虹、朱勇 (2014:263)所得出的可讀性公式針對性較強,除楊金余 (2008:27-28)的可讀性公式?jīng)]有進行擬合優(yōu)度外,其他兩個公式解釋的總變異量基本一致 (80.3%Vs 79.5%),而郭望皓 (2009:53)的可讀性公式針對性較差,且在計算過程中,為方便計算機自動化識別還省略了一些不易自動化的變量,但其可讀性公式卻能解釋總變異量的90.6%。這些公式一方面對我們探討影響文本可讀性的因素有重要的理論意義,另一方面也為我們?nèi)绾翁暨x難度適當(dāng)?shù)奈谋酒鸬搅酥匾闹笇?dǎo)作用。
表1 對外漢語可讀性公式研究一覽表
對外漢語教材評估的一個重要標(biāo)準(zhǔn)就是“科學(xué)性”,而這種“科學(xué)性”體現(xiàn)在教材的編寫上就是內(nèi)容的循序漸進(許迎春,2008),即教材應(yīng)該按照語料的難易程度加以編排,能依照由淺入深、由易到難的過程。因此,我們要對影響教材可讀性的各種因素都有比較明確的認(rèn)識,制定出簡明、實用和有效的可讀性標(biāo)準(zhǔn),并將其運用到教材語料的選擇和編寫中來,那么什么才是影響教材語料可讀性的因素呢?不同研究有不同的結(jié)論:張寧志 (2000:88)認(rèn)為句子數(shù)、平均句長和非常用詞 (甲乙兩級以外的詞)是影響教材語料可讀性的重要變量。楊金余 (2008:27)認(rèn)為平均每百字丙級、丁級、超綱字?jǐn)?shù),平均每百字丙級、丁級、超綱詞數(shù),平均每百字固定詞組數(shù),平均句長和平均每百字丙級以上語法項目數(shù)是影響高級漢語精讀教材語料可讀性的重要變量。李燕、張英偉 (2010)對《博雅漢語—中級沖刺篇Ⅰ》的語料難度進行了定量分析,得出平均句長、每百字含非常用詞數(shù)和語言的修辭手法偏多是影響教材語料可讀性的重要變量。李娟 (2013:15)首次比較系統(tǒng)地提出了八個影響中級漢語精讀教材語料難度的變量,它們是平均每百字丙級、丁級、超綱字?jǐn)?shù),每篇課文的生詞量,平均每百字丙級、丁級、超綱詞數(shù),每冊課本實詞和虛詞的數(shù)量,每百字平均固定詞組 (包括固定格式)數(shù),平均句長,平均每百字丙級 (含丙級)以上的語法項目數(shù)和篇長。綜上所述,盡管不同研究有不同的結(jié)論,但大多數(shù)研究還是比較一致地認(rèn)為詞匯和句子是影響對外漢語教材語料可讀性的重要因素。
趙金銘強調(diào),要注重泛讀教材的編寫,要保證書面語教學(xué)質(zhì)量的提高,必須有大量的、適合各學(xué)習(xí)階段的泛讀教材 (郝俊茹,2013),因為“編寫適于學(xué)生自主閱讀的讀物是實現(xiàn)學(xué)生自主學(xué)習(xí)的重要環(huán)節(jié)” (朱勇、宋海燕,2013:22)。在讀物的可讀性方面,不同研究也有不同的結(jié)論:儲慧峰 (2011:48)以7套50本讀物為研究對象,從選材、難易度和練習(xí)三方面考察讀物的分級情況,在難易度方面,認(rèn)為語料的長度、平均每百字句數(shù)和生詞量與讀物的語料難度密切相關(guān)。朱勇、鄒沛辰 (2012)以《中文天天讀》2A和《初級漢語閱讀與寫作教程Ⅱ》兩本讀物為研究對象,認(rèn)為詞匯難度 (甲、乙、丙、丁及超綱詞比例)、句子長度 (每百字句子數(shù)和平均句長)、語篇 (篇長和平均每篇句子數(shù))和語義塊長度與讀物的語料難度密切相關(guān)。黃林芳 (2013:46-48)以《漢語分級閱讀》、《中文天天讀》和《實用漢語分級閱讀》3套讀物為研究對象,從選材、詞匯和難易度三方面考察讀物的分級情況,在難易度方面,認(rèn)為讀物的選材 (內(nèi)容)和詞匯 (生詞量、詞匯等級和詞匯重現(xiàn)率)與讀物的語料難度密切相關(guān),而篇長和體裁與讀物的語料難度無關(guān)。綜上所述,與影響教材語料難度的因素不同,影響讀物語料難度的因素除詞匯和句子外,很多研究還把篇長和選材等其他因素也考慮進來了。此外,由于讀物是學(xué)習(xí)者在沒有教師指導(dǎo)下的自主學(xué)習(xí),它的首要目的是吸引讀者的閱讀興趣,并使其從中獲取一些信息,因此,讀物較教材應(yīng)更強調(diào)其可讀性,除要控制其在語言層面上的難度,還應(yīng)使其在文本的易辨認(rèn)性方面如印刷品的形式上更方便讀者閱讀,更能吸引讀者的眼球 (朱勇、宋海燕,2010:23)。
總的來看,影響對外漢語文本可讀性的因素可分為文本因素、讀者因素和環(huán)境因素三大類,文本因素是指語言層面上的因素,如漢字、詞匯、句子、語法及篇章等變量;讀者因素又稱主觀因素,它包括讀者的興趣、愛好、閱讀習(xí)慣、對不同文本內(nèi)容的熟悉程度、本身具有的語言能力、認(rèn)知水平及閱讀動機等變量;環(huán)境因素主要指文本的物理屬性和閱讀環(huán)境,文本的物理屬性是指文本的字體、字號、字間距、行寬和行高等,而文本的閱讀環(huán)境是指閱讀時光線的強度和方向、有無噪音、閱讀時間是否受限等。因此,對外漢語文本可讀性公式應(yīng)該是通過量化并測定這三類因素來獲得,但由于讀者因素和環(huán)境因素是動態(tài)的,變化的,甚至是千差萬別的,變量數(shù)量繁多且不易量化,因此,目前可讀性公式的測定主要是在文本的語言層面上來探討各種變量,在處理讀者因素時,盡管有些研究已經(jīng)考慮到了讀者因素的影響,但在實際的研究過程中也僅限于考慮其宏觀層面上的變量,如國別、漢字圈與否 (王蕾,2005:2;左虹、朱勇,2014:264),在處理環(huán)境因素時,目前尚未有文本的物理屬性與可讀性關(guān)系方面的研究,而且在閱讀環(huán)境方面也僅限于閱讀的時間受限與否 (郭望皓,2009:19)。因此,如何盡可能多地量化并測定讀者因素和環(huán)境因素成為今后可讀性研究的重要課題。
目前,在對外漢語可讀性公式研究中,幾乎所有研究都是從字、詞、句、語法和篇章等語言層面上來探討可讀性公式的變量,但不同研究選用的變量不同,主要有以下問題:
首先,同一語言層面上的變量不同。在什么才是該語言層面上代表性變量的問題上,不同研究有不同的結(jié)論:如在漢字層面上,王蕾 (2005:18)選取的是總字?jǐn)?shù)、非重復(fù)字?jǐn)?shù)、非重復(fù)字均筆畫數(shù)和簡單字?jǐn)?shù) (甲級);郭望皓(2009:15-16)選取的是漢字筆畫數(shù)和字頻;楊金余(2008:10)選取的是丙級、丁級和超綱字?jǐn)?shù);左虹、朱勇(2014:265)選取的是漢字筆畫數(shù)、漢字部件數(shù)和甲級字?jǐn)?shù),同理,這種現(xiàn)象在其他語言層面上也屢見不鮮 (見表2)。
其次,相同變量的統(tǒng)計方法不一,如王蕾 (2005:18)和左虹、朱勇 (2014:265-266)都選取了虛詞數(shù)作為詞匯層面上的變量,但由于他們對虛詞的定義不同,參照劃分虛詞的標(biāo)準(zhǔn)不一,因此,即使是相同語料的文本,其統(tǒng)計結(jié)果也肯定不同。
表2 對外漢語可讀性公式研究變量選擇一覽表
再次,某些層面上的變量可以合并。根據(jù)變量表達和測量的內(nèi)容,有些變量可以合并,如在漢字和詞匯層面上,王蕾 (2005:20)選取的簡單字?jǐn)?shù)和簡單詞數(shù)與左虹、朱勇 (2014:265)選取的甲級字?jǐn)?shù)和甲級詞數(shù)概念相同,且統(tǒng)計方法一致,可以進行合并。王蕾 (2005:18)選取的總詞數(shù)和楊金余 (2008:13)選取的固定詞組數(shù)也是同一概念,因此也可以進行合并。另外,有些變量雖然測量的是兩個不同的方面,但他們互為此消彼長,也可以進行合并,如在詞匯層面上,王蕾 (2005:18)、左虹、朱勇(2014:265)選取的虛詞數(shù)和郭望皓 (2009:17)選取的實詞和虛詞比這兩個變量互為此消彼長的關(guān)系,因此也可以進行合并。
此外,有些研究的變量在歸屬上還有待商榷,王蕾(2005:18)將語法點難度歸為句子層面上的變量,而郭望皓 (2009:31)將篇長也歸為句子層面上的變量,這些都與其他研究的普遍認(rèn)識不同。
最后,由于目前只有4篇可讀性公式的文獻,加之研究對象與目的各不相同,因此可讀性公式的預(yù)測變量相對分散 (見表2),很難發(fā)現(xiàn)有規(guī)律性的東西。
英語可讀性公式的研究均以McCall&Crabbs(1925)從大量英語閱讀材料中提出的一組測試課文為標(biāo)準(zhǔn) (轉(zhuǎn)引自郭望皓,2009),這類標(biāo)準(zhǔn)被認(rèn)為是可讀性研究的基石,而目前對外漢語還沒有這類標(biāo)準(zhǔn),陳阿林 (2000)通過對兩種漢語閱讀難度模型的處理,他認(rèn)為應(yīng)該有一組公認(rèn)的漢語難度測試的標(biāo)準(zhǔn)文本集,而目前的情況是研究者根據(jù)事先選好的語料,在前人的基礎(chǔ)上從不同的語言層面上選取支持自己論據(jù)的變量,然后通過線性回歸的方法得出相應(yīng)的可讀性公式,但這樣做的前提是我們研究的語料是已經(jīng)標(biāo)準(zhǔn)化了的文本,我們是在此基礎(chǔ)上探討某一類可讀性公式的變量,而現(xiàn)實是我們還沒有形成統(tǒng)一的文本資料庫,因此,目前我們的研究是在模糊的前提下探討可讀性公式的變量,加之讀者和環(huán)境因素的影響,語言層面上變量選取的隨意性較大,因此多種因素下也就不太可能得出比較精確的可讀性公式,進而在語料難度的選擇與控制上也就更加模糊。
在教材和讀物的編寫過程中,無法避免地會遇到語料的分級問題。在語料難度的控制上,普遍存在的問題是由于沒有可供教材和讀物分級編寫的大綱,不同編者依據(jù)的標(biāo)準(zhǔn)不同,這就造成不同編者對初級、中級和高級語料難度的理解不同,反映到教材和讀物的編寫上就會出現(xiàn)相同級別的教材或讀物其語料難度卻不相同。
此外,由于教材和讀物的性質(zhì)不同,因此在可讀性問題上他們又各具特點:首先,在教材方面,楊子菁、嚴(yán)越(2006)發(fā)現(xiàn)生詞方面存在的三個問題是:無法體現(xiàn)以丙級詞匯為主的編寫要求、生詞各層級的分布比例不夠合理以及超綱詞的比例基本上超過了丁級詞。李娟 (2013:31-32)認(rèn)為漢字的等級和復(fù)現(xiàn)率,生詞的等級和數(shù)量,超綱詞以及語法項目的選擇和編排是目前中級漢語精讀教材語料難度存在的主要問題。劉弘、蔣內(nèi)利 (2015)通過對近十年來對外漢語教材研究的特點與趨勢分析發(fā)現(xiàn),教材中的詞匯編排問題是最受研究者關(guān)注的論題,相關(guān)論文數(shù)占到“教材微觀研究”論文中的25%以上,因此,詞匯問題是教材編寫中的最大問題。其次,在讀物方面,朱勇、宋海燕 (2010:27)從《中文天天讀》的編寫理念出發(fā),認(rèn)為語料難度涉及的因素非常復(fù)雜,而目前的研究還不充分,缺乏可讀性公式的基礎(chǔ)性研究,并且大綱的發(fā)布已過去十多年了,也有進一步修訂的需要。儲慧峰 (2011:12)發(fā)現(xiàn)讀物的分級難度與其編者的編寫說明并不一致。還有,即使是參照同樣的分級標(biāo)準(zhǔn),且編者的編寫說明也完全一致,不同讀物各自內(nèi)的分級情況也相去甚遠。黃林芳(2013:50-51)發(fā)現(xiàn)同詞級的不同讀物,其難度也不盡相同、詞匯控制不合理 (每篇文章的生詞量偏高、詞匯等級比例不合理以及詞匯重現(xiàn)率過低)、選材不合理等是當(dāng)前讀物編寫面臨的最大問題。
在語料庫建設(shè)方面,一方面我們要通過實地調(diào)查、掌握大量第一手資料以及運用新的語言模型和數(shù)學(xué)方法找到標(biāo)準(zhǔn)化的文本資料庫 (陳阿林,1999&2000;谷慶民,等,2004:36-37),這是進行可讀性研究的重要前提;另一方面,楊金余 (2008:12-14)曾以HSK試卷 (高級)中的閱讀理解為研究對象,以這種標(biāo)準(zhǔn)化了的語料為研究對象還屬首例,這對我們探討語料庫起到了重要的指導(dǎo)作用。
在可讀性公式的研究方面,如前所述,目前只有4篇可讀性公式的研究,在沒有語料庫的前提下,讀者和環(huán)境因素得不到控制,變量選擇的主觀性較大,因此得到的可讀性公式也很不確定,將來的研究還是要以可讀性公式作為基礎(chǔ)性研究,期望早日發(fā)現(xiàn)能夠代表各語言層面上的典型性變量;同時,我們也要嘗試運用基于語料庫的統(tǒng)計語言模型,將影響可讀性公式的讀者和環(huán)境因素一并考慮進來,這是進一步完善可讀性公式研究的方向 (郭望皓,2009:4)。
最后,語料庫的建設(shè)和可讀性公式的研究最終目的還是為對外漢語教材和讀物的編寫提供理論依據(jù)和技術(shù)支持,因此,教材和讀物的可讀性研究也不可停滯不前,我們應(yīng)在已有研究的基礎(chǔ)上謹(jǐn)慎地探討教材和讀物的可讀性因素,通過對可讀性研究的各個方面相互比較、互相印證,形成合力,共同促進對外漢語可讀性研究的發(fā)展。
陳阿林,張素.1999.中文閱讀難度模型及易讀性公式探索[J].計算機科學(xué)(11):42-44.
陳阿林.2000.神經(jīng)網(wǎng)絡(luò)漢語閱讀難度量化計算模型及結(jié)果比較[J].重慶師范學(xué)院學(xué)報(2):30-33.
儲慧峰.2011.對外漢語分級讀物考察[D].上海:華東師范大學(xué).
郭望皓.2009.對外漢語文本易讀性公式研究[D].上海:上海交通大學(xué).
谷慶民,馬海霞,張月明.2004.關(guān)于高等院校教材可讀性的定量研究[J].滄州師范專科學(xué)校學(xué)報(3):36-37.
黃林芳.2013.對外漢語分級讀物考察[D].湖南:湖南師范大學(xué).
郝俊茹.2013.中級漢語閱讀教材調(diào)查分析[D].北京:北京大學(xué).
劉弘,蔣內(nèi)利.2015.近十年對外漢語教材研究特點與趨勢分析[J].國際漢語教學(xué)研究(1):55-62.
李紹山.2000.易讀性研究概述[J].解放軍外國語學(xué)院學(xué)報(4):1-5.
李娟.2013.中級漢語精讀教材語料難度的定量分析[D].吉林:吉林大學(xué).
李燕,張英偉.2010.《博雅漢語》教材語料難度的定量分析——兼談影響教材語言難度的因素和題材的選擇[J].云南師范大學(xué)學(xué)報(對外漢語教學(xué)與研究版)(1):39-43.
王蕾.2005.初中級日韓留學(xué)生文本可讀性公式初探[D].北京:北京語言大學(xué).
王蕾.2008.可讀性公式的內(nèi)涵及研究范式——兼議對外漢語可讀性公式的研究任務(wù)[J].語言教學(xué)與研究(6):46-53.
謝澤文.1994.閱讀難度的測量[C].北京:北京語言學(xué)院.
許迎春.2008.對外漢語初級口語教材課文編寫評析[J].語言教學(xué)研究(1):101-102.
楊金余.2008.高級漢語精讀教材語言難度測定研究[D].北京:北京大學(xué).
楊子菁,嚴(yán)越.2006.中級漢語精讀教材中的詞匯選取與處理情況分析[C].北京:人民教育出版社.
張寧志.2000.漢語教材語料難度的定量分析[J].世界漢語教學(xué)(3):83-88.
左虹,朱勇.2014.中級歐美留學(xué)生漢語文本可讀性公式研究[J].世界漢語教學(xué)(2):263-276.
朱勇,宋海燕.2010.漢語讀物編寫的理念與實踐[J].海外華文教育(4):22-29.
朱勇,鄒沛辰.2012.《中文天天讀》易讀性研究[J].云南師范大學(xué)學(xué)報(對外漢語教學(xué)與研究版)(3):41-46.