胡俊杰,李飛,陳海龍(.通化師范學(xué)院 教育科學(xué)學(xué)院,吉林 通化 3400;.通化市校外教育指導(dǎo)中心,吉林 通化 3400)
中文句子閱讀過(guò)程中詞邊界確認(rèn)機(jī)制研究現(xiàn)狀及展望
胡俊杰1,李飛1,陳海龍2
(1.通化師范學(xué)院教育科學(xué)學(xué)院,吉林通化134002;2.通化市校外教育指導(dǎo)中心,吉林通化134001)
中文詞間沒(méi)有顯著的物理區(qū)分標(biāo)志,但在閱讀中讀者卻能夠快速理解句子含義并能區(qū)分出詞與詞之間的界限。針對(duì)中文語(yǔ)詞加工的這一特點(diǎn),學(xué)者們從中文語(yǔ)言最小意義單元的確認(rèn)、詞匯切分過(guò)程的眼動(dòng)特征、詞匯切分過(guò)程的加工模型等諸多角度進(jìn)行詞邊界確認(rèn)機(jī)制的探討。在系統(tǒng)梳理已有研究成果的基礎(chǔ)上,本文認(rèn)為歧義字段的切分機(jī)制、眼動(dòng)與ERP數(shù)據(jù)的共同采集及聯(lián)合分析是未來(lái)詞邊界研究的重要趨勢(shì)。
詞切分;中文閱讀;邊界確認(rèn);眼動(dòng)控制
與字母文字不同,中文詞與詞之間沒(méi)有顯著的物理區(qū)分標(biāo)志(如空格)。然而在閱讀中文文本時(shí),閱讀者卻能夠快速理解句子含義,區(qū)分出哪些字能夠組成一個(gè)詞。這種中文閱讀的切分機(jī)制具有跨語(yǔ)言的特異性。正是由于中文詞與詞之間無(wú)顯著物理區(qū)分標(biāo)志這一特點(diǎn),使得中文詞匯加工更加復(fù)雜。在這一問(wèn)題的研究中,不同領(lǐng)域的學(xué)者具有不同的研究視角。語(yǔ)言學(xué)領(lǐng)域的工作者探索在漢語(yǔ)詞之間加入空格情況的書(shū)寫(xiě)規(guī)范問(wèn)題,比如:馮志偉[1]、彭澤潤(rùn)[2]等人倡導(dǎo)實(shí)行漢語(yǔ)書(shū)面語(yǔ)的分詞連寫(xiě),并身體力行地進(jìn)行大量實(shí)踐。計(jì)算機(jī)和人工智能領(lǐng)域的專家們主要利用自動(dòng)分詞成果從事自然語(yǔ)言理解和處理研究,例如語(yǔ)義分析、知識(shí)工程、機(jī)器翻譯、專家系統(tǒng)和智能計(jì)算機(jī)等等,孫茂松[3]、喬維[4]等人在此領(lǐng)域試圖探索在計(jì)算機(jī)領(lǐng)域中切分歧義消解、未登錄詞處理和歧義語(yǔ)言資源建設(shè)的相關(guān)問(wèn)題。在心理學(xué)及認(rèn)知科學(xué)領(lǐng)域的研究者更加關(guān)注的確是中文閱讀者在理解句子和切分文本的過(guò)程中的認(rèn)知機(jī)制。在這一領(lǐng)域中試圖通過(guò)行為研究、眼動(dòng)分析等方式探索在句子閱讀過(guò)程中的認(rèn)知進(jìn)程。本文試圖通過(guò)中文語(yǔ)言最小意義單元的確認(rèn)、詞匯切分過(guò)程的眼動(dòng)特征、詞匯切分過(guò)程的加工模型等諸多角度進(jìn)行詞邊界確認(rèn)機(jī)制的探討,并對(duì)未來(lái)詞邊界研究的發(fā)展進(jìn)行展望。
(一)“詞”這一概念在中文閱讀中存在的心理學(xué)證據(jù)
英文詞與詞之間是存在空格的。在閱讀英文文本時(shí),空格可以為讀者提供明顯的視覺(jué)信息使其能夠在語(yǔ)言識(shí)別的早期能夠快速地確定詞與詞之間的界限。在英文閱讀的研究中發(fā)現(xiàn):讀者的首次注視傾向于落在詞的偏好注視位置 (詞的開(kāi)頭和詞中心之間的位置 preferred viewing location,PVL)而不是最佳注視位置 (詞的中心位置,optimal viewing position,OVP)[5]。因此絕大多數(shù)的研究者均認(rèn)為英文閱讀以詞為基本信息單元。那么在中文閱讀過(guò)程中是否是以“詞”為基本單位閱讀的呢?在古漢語(yǔ)中,字是基本的書(shū)寫(xiě)單位和意義單元。20世紀(jì)初期受西方文化影響,章士釗首先在1907年出版的《中等國(guó)文典》中首次提出“詞”的概念。之后王力、呂叔湘亦提出語(yǔ)言的最小獨(dú)立運(yùn)用單位是詞[6][7]。
這一觀點(diǎn)卻受到一些實(shí)驗(yàn)結(jié)果的質(zhì)疑。已有研究表明,英文材料閱讀中刪除空格會(huì)嚴(yán)重干擾被試正常的文字理解。然而在中文閱讀過(guò)程中插入空格卻并沒(méi)有促進(jìn)中文句子的識(shí)別效率[8][9]。Liu等人發(fā)現(xiàn)通過(guò)插入空格的方法考察空格對(duì)閱讀效率的影響,結(jié)果發(fā)現(xiàn)詞間空格干擾了被試對(duì)整個(gè)句子閱讀效率的影響[10]。Bai等人卻發(fā)現(xiàn),是否插入詞間空格對(duì)句子閱讀的眼動(dòng)指標(biāo)沒(méi)有影響,但插入錯(cuò)誤空格卻會(huì)阻礙被試閱讀[11]。Hsu和Huang使用難度較高且有歧義的實(shí)驗(yàn)材料進(jìn)行研究時(shí)發(fā)現(xiàn),空格對(duì)詞匯切分起到了促進(jìn)作用[12]。詞是否是中文閱讀的基本單位存在爭(zhēng)議。
為何同樣在中文閱讀中插入詞間空格,三位研究者得出的結(jié)論完全不同?首先難度較高、具有歧義的文本與簡(jiǎn)單文本相比更難確定詞的邊界。對(duì)于簡(jiǎn)單文本來(lái)說(shuō)詞切分過(guò)程可能是直通的,可以同時(shí)、自動(dòng)進(jìn)行。當(dāng)文本難度加大、具有歧義的情況下,自動(dòng)化同時(shí)加工則無(wú)法完成這種任務(wù),需要序列加工且需及時(shí)復(fù)查。因此對(duì)于難度大的歧義文本來(lái)說(shuō)空格可以極大地提高閱讀效率。其次,在Liu等人的研究中,每個(gè)句子僅包括7個(gè)字,卻被切分成了6個(gè)詞。這種切分標(biāo)準(zhǔn)極有可能與被試切分詞的標(biāo)準(zhǔn)不一致,因此在這種切分情況下詞間空格自然阻礙被試的閱讀效率。
(二)中文詞匯切分的不確定性
中文詞間沒(méi)有空格帶來(lái)的一個(gè)顯著的問(wèn)題便是每個(gè)人對(duì)何為一個(gè)詞的判斷標(biāo)準(zhǔn)不一致,在確定詞邊界時(shí)存在很大爭(zhēng)議。有研究者總結(jié)漢語(yǔ)詞切分的特點(diǎn),發(fā)現(xiàn)漢語(yǔ)閱讀者經(jīng)常將一些短語(yǔ)視為詞。他們經(jīng)常把虛詞和實(shí)詞連在一起,把虛詞做為詞綴,經(jīng)常把短語(yǔ)視為一個(gè)詞,界定的名詞性復(fù)合詞包含3個(gè)或者更多的詞素。這一點(diǎn)也為中文詞匯切分研究帶來(lái)了較大干擾。閆國(guó)利等人提出“主觀詞”這一概念,認(rèn)為讀者在閱讀時(shí)表征的語(yǔ)義單元便是主觀詞,它反映讀者對(duì)詞的主觀表征。研究發(fā)現(xiàn)與非詞相比,主觀詞表現(xiàn)出加工優(yōu)勢(shì)[13]。
“組塊”是人腦中短時(shí)記憶的最小單位[14]。Abney曾提出了英文句子加工中的“組塊”概念[15]。在中文閱讀中,“組塊”這一形式可能也成為中文詞匯切分不確定性的重要影響因素。徐中一等人認(rèn)為漢語(yǔ)組塊是一種符合一定語(yǔ)法功能的非遞歸短語(yǔ),每個(gè)組塊都有一個(gè)中心詞,并圍繞該中心詞展開(kāi),任何一種組塊內(nèi)部都不包含其他類型的組塊[16]。眾多研究者對(duì)中文組塊分類進(jìn)行研究,在計(jì)算機(jī)領(lǐng)域甚至提出了中文組塊分析的算法以及識(shí)別漢語(yǔ)組塊的模型,利用統(tǒng)計(jì)方法和規(guī)則方法獲得中文組塊[17]。心理意義上的組塊與計(jì)算機(jī)領(lǐng)域的組塊分析應(yīng)該存在顯著差異。這種組塊不是單純的詞,而是人閱讀的眼動(dòng)軌跡的語(yǔ)言投射。其閱讀長(zhǎng)度受人眼知覺(jué)廣度和認(rèn)知能力的雙重限制,且服從“短時(shí)記憶”規(guī)則。
眼動(dòng)有三種方式:注視(fixation)、眼跳(saccades)和追隨運(yùn)動(dòng)(pursuit movement)。這三種眼動(dòng)方式經(jīng)常交織在一起,起到選擇信息并將注視的刺激物呈現(xiàn)在視網(wǎng)膜的中央凹區(qū)域,形成清晰的圖像。在閱讀過(guò)程中考察眼動(dòng)指標(biāo)可以為研究提供更多的分析結(jié)果,有效地推測(cè)個(gè)體的認(rèn)知過(guò)程。在中文閱讀的詞切分研究中,研究者們主要考察了注視時(shí)間、眼跳幅度(距離)、注視位置、注視次數(shù)、回視次數(shù)、跳讀次數(shù)等眼動(dòng)數(shù)據(jù)來(lái)探討中文詞切分現(xiàn)象的機(jī)制。
(一)插入空格范式
拼音文字中詞與詞之間是存在空格的,以中文為主的字符文字之間一般來(lái)講是不存在空格的。如果我們將原本存在空格的文字之間的空格取消,或者將不存在空格的文字中的插入空格,文本的加工方式會(huì)發(fā)生什么樣的變化呢?這類研究最早是在拼音文字中進(jìn)行的。Rayner,Fischer和Pollatsek的研究發(fā)現(xiàn)英文文本中如果沒(méi)有空格,會(huì)使閱讀速度顯著下降[18]。破壞被試原有閱讀習(xí)慣對(duì)其閱讀產(chǎn)生的干擾,能夠推理出在正常情況下閱讀過(guò)程究竟如何進(jìn)行的結(jié)論。研究者發(fā)現(xiàn),英文文本中的詞間空格可以提高詞匯搜索效率,且可以幫助被試將注視點(diǎn)放在下一個(gè)單詞的最佳注視位置上。
中文詞與詞之間是不存在空格的。采用插入空格的研究范式白學(xué)軍等人發(fā)現(xiàn)詞間空格與無(wú)空格條件并無(wú)顯著差異,但是字間空格和錯(cuò)誤的插入空格條件均會(huì)干擾正常閱讀。研究者們從句子長(zhǎng)度、閱讀難度、詞判斷合理性等幾個(gè)方面來(lái)解釋這一現(xiàn)象(見(jiàn)前文)。另有研究表明對(duì)于歐美留學(xué)生,詞間空格可以促進(jìn)其閱讀加工,但日韓留學(xué)生、小學(xué)生、老年人來(lái)講,詞間空格的作用并未發(fā)現(xiàn)[19]。此類范式可以驗(yàn)證中文是以詞為基本單位進(jìn)行加工,并能夠考察不同類別被試在分詞能力上的差異,卻難以得出閱讀過(guò)程中詞匯切分究竟如何進(jìn)行的結(jié)論。
(二)PVL與落點(diǎn)位置
在閱讀研究中,有一個(gè)常用的眼動(dòng)指標(biāo)是首次注視位置。Rayner和Bertera發(fā)現(xiàn),英文閱讀過(guò)程中多數(shù)情況下注視點(diǎn)位置會(huì)落在詞中央偏左的位置上,這個(gè)位置被稱做偏好注視位置(preferred viewing location,PVL)[20]。中文閱讀研究與其存在差異,有研究發(fā)現(xiàn),當(dāng)中文詞匯有一個(gè)以上注視點(diǎn)時(shí)PVL多在詞頭位置上,但當(dāng)詞只有一個(gè)注視點(diǎn)時(shí)PVL多在中央。這一現(xiàn)象可以用副中央凹-中央凹效應(yīng)加以解釋。當(dāng)中文閱讀者將眼睛注視在詞匯中央時(shí),讀者可以用副中央窩進(jìn)行切分任務(wù),當(dāng)眼睛注視開(kāi)頭時(shí),他們則無(wú)法進(jìn)行切分[21]。
根據(jù)副中央凹-中央凹效應(yīng)與預(yù)視效應(yīng)的若干研究范式,研究者們?cè)噲D通過(guò)眼動(dòng)的落點(diǎn)位置探索中文詞匯的加工方式及影響因素。例如:Yan等人采用預(yù)視范式,操控邊界后N+1詞的頻率來(lái)觀察N+2詞的預(yù)視情況。結(jié)果發(fā)現(xiàn):N+1負(fù)載程度低時(shí),N+2存在預(yù)視效應(yīng);N+1為信息高負(fù)載詞時(shí),該效應(yīng)不存在。研究者認(rèn)為知覺(jué)空間的信息均能得到加工,知覺(jué)空間大小是可調(diào)的,它受到語(yǔ)義負(fù)載程度的影響。負(fù)載程度越低知覺(jué)空間越大,負(fù)載程度增高知覺(jué)空間會(huì)變小[22]。Li等人曾操縱靶子詞長(zhǎng)度來(lái)考察漢語(yǔ)閱讀中靶子詞長(zhǎng)度對(duì)選擇策略的影響 (2字詞,4字詞),結(jié)果發(fā)現(xiàn)與短詞相比,長(zhǎng)詞更容易將PVL右移[23]。Li等人采用隨動(dòng)邊界范式 (gaze-contingent boundary)發(fā)現(xiàn),當(dāng)眼跳目標(biāo)為一個(gè)詞、任務(wù)更復(fù)雜、眼跳位置更接近詞尾時(shí),眼跳的反應(yīng)時(shí)都會(huì)變得更短。研究者認(rèn)為,中文閱讀者能夠動(dòng)態(tài)調(diào)節(jié)眼跳位置以便觀測(cè)到全部信息[24]。該類研究考察了中文詞匯加工的知覺(jué)范圍及其負(fù)載程度,卻難以得出在此知覺(jué)范圍內(nèi)的具體加工步驟。
(三)詞邊界分析與加工進(jìn)程
消失文本技術(shù)是研究句子中詞匯加工能力的重要范式。消失文本范式(disappearing text paradigm)是控制句子閱讀中注視文字視覺(jué)呈現(xiàn)時(shí)間的研究范式,一般認(rèn)為,在英文閱讀過(guò)程中50-60ms視覺(jué)呈現(xiàn)后消失文本不會(huì)影響讀者獲取注視詞信息的提取過(guò)程[25]。中文消失文本閱讀研究發(fā)現(xiàn)其呈現(xiàn)時(shí)間更短。閆國(guó)利等人發(fā)現(xiàn)中文40ms后消失文本不會(huì)影響總閱讀時(shí)間[26][27]。其他研究者在這一范式下做了深入研究。劉志芳等人發(fā)現(xiàn),詞n-1消失嚴(yán)重影響了讀者閱讀進(jìn)程,但詞n+1消失條件卻不影響總閱讀時(shí)間,認(rèn)為中文閱讀存在認(rèn)知滯后效應(yīng)[28][29];單字消失與單詞消失條件下總閱讀時(shí)間差異并不顯著,認(rèn)為單字消失導(dǎo)致注視詞的信息不完整,閱讀應(yīng)以詞為基本單位進(jìn)行加工[30]。然而消失文本范式在中文閱讀中的應(yīng)用存在一個(gè)不得不考慮的問(wèn)題:中文詞匯間無(wú)空格,整詞消失條件下是否會(huì)為閱讀者提供有效的詞切分線索?Rayner等人的研究發(fā)現(xiàn),英文閱讀時(shí)詞n+1在60ms后消失會(huì)影響閱讀過(guò)程,但中文卻沒(méi)有發(fā)現(xiàn)這一現(xiàn)象[31]。是否與中文提供有效詞切分有關(guān),值得進(jìn)一步研究。
張智君等人在2012年曾經(jīng)采用隨動(dòng)顯示技術(shù)考察漢語(yǔ)閱讀中詞匯切分的位置。結(jié)果發(fā)現(xiàn)變換詞語(yǔ)n及其左側(cè)文本顏色條件下與控制條件相比眼動(dòng)數(shù)據(jù)無(wú)顯著差異;變換詞語(yǔ)n+1及其左側(cè)文本的顏色情境下的平均凝視時(shí)間與再注視興趣區(qū)都顯著低于控制條件,跳讀次數(shù)多于控制條件。張智君等人認(rèn)為讀者最先可以在一定程度上對(duì)詞n+1進(jìn)行加工,但這種預(yù)加工的效果并不徹底,如果促進(jìn)詞n+1的加工會(huì)使得加工效率增加。因此漢語(yǔ)閱讀中存在兩種詞切分現(xiàn)象,一種由加工詞n+1引起,一種由加工詞n引起。詞匯切分廣度范圍在0-2個(gè)之間[32]。吳俊等人采用“邊界”技術(shù)范式探索句子閱讀過(guò)程中詞匯加工的預(yù)視情況。實(shí)驗(yàn)使用特殊的三字詞,這些三字詞前兩個(gè)漢字亦可成詞。例如:“服務(wù)員”和“服務(wù)部”。邊界位置在前兩個(gè)字之后。當(dāng)注視點(diǎn)跨過(guò)這個(gè)看不見(jiàn)的邊界時(shí),邊界后的漢字會(huì)改變。結(jié)果發(fā)現(xiàn)三字詞預(yù)視條件下的注視時(shí)間顯著低于非預(yù)視條件;高頻、高預(yù)期雙字條件下的注視時(shí)間短于低頻、低預(yù)期條件下的雙字注視時(shí)間而三字條件下沒(méi)有顯著差異。因此吳俊等人認(rèn)為,注視時(shí)間應(yīng)該由“預(yù)加工時(shí)間”和“眼跳潛伏期”構(gòu)成,而“預(yù)加工時(shí)間”也可以分為“雙字詞搜索階段”和“三字詞搜索階段”兩個(gè)階段組成[33]。
(一)中文閱讀的并行分布式加工
構(gòu)建閱讀的加工模型,對(duì)于閱讀理論發(fā)展及現(xiàn)有研究結(jié)論的總結(jié)具有重要的意義。當(dāng)前閱讀加工模型大多是基于眼動(dòng)控制視角下的理論構(gòu)建,若根據(jù)“詞匯加工在眼動(dòng)控制過(guò)程中是否起到重要作用”這一標(biāo)準(zhǔn),我們可以將模型分為POC模型(primary culomotor control models)和認(rèn)知控制模型(cogniive control models)兩類。POC模型主要強(qiáng)調(diào)物理意義上的視覺(jué)線索(如詞的長(zhǎng)度、詞間空格等)或眼跳系統(tǒng)本身特點(diǎn)(如眼跳發(fā)動(dòng)的時(shí)間、眼跳的幅度等)對(duì)詞匯加工過(guò)程的影響。而認(rèn)知控制模型多強(qiáng)調(diào)詞匯與詞匯加工對(duì)基本眼動(dòng)時(shí)間的影響作用。中文由于其語(yǔ)言本身特征,在研究中多強(qiáng)調(diào)認(rèn)知控制在其加工中的作用。這類模型又可以分成兩類,強(qiáng)調(diào)注意資源的分配轉(zhuǎn)移和詞匯加工嚴(yán)格遵守序列程序的注意轉(zhuǎn)換理論(如:E-Z讀者模型)以及認(rèn)為注意資源一開(kāi)始就被分配至閱讀知覺(jué)廣度內(nèi)的所有詞上的并行分布式理論(如:SHIFT模型)。
有研究者試圖探索在中文閱讀中讀者究竟采用單向的、序列的注意轉(zhuǎn)換策略還是能夠同時(shí)加工知覺(jué)廣度內(nèi)所有詞匯的并行分布式的加工。Inhoff和Wu選擇4字組成的字段為閱讀材料,一種是在歧義條件下,即4字為交集型歧義字段(4個(gè)連續(xù)關(guān)鍵字能組成三個(gè)詞)。例如:“??茖W(xué)生”可以被切分為專科”、“科學(xué)”和“學(xué)生”;另一種是在控制條件下,4字只能組成兩個(gè)詞,中間2字為非詞。結(jié)果發(fā)現(xiàn),歧義條件下凝視時(shí)間和中間2字的注視時(shí)間均長(zhǎng)于控制條件,支持并行分布式假設(shè)[34]。Yan等人、Li等人的研究也支持知覺(jué)廣度內(nèi)所有詞均能得到加工的并行分布式假設(shè),并且提出知覺(jué)廣度的范圍取決于詞匯信息的負(fù)載程度、詞匯本身的難易程度等[24][25][26]。
(二)句子中詞匯識(shí)別的整體假設(shè)
Li等人試圖探討中文詞切分進(jìn)程中究竟采用前饋假設(shè)(feedforward hypothesis)
還是整體假設(shè)(holistic hypothesis)進(jìn)行加工[35]。前饋假設(shè)認(rèn)為中文詞的認(rèn)知過(guò)程只有自下而上的前饋,而沒(méi)有自上而下的反饋;整體假設(shè)認(rèn)為中文詞的視覺(jué)信息加工、字的識(shí)別和詞的識(shí)別等各單元之間存在相互作用。Li等人采用4字字串為實(shí)驗(yàn)材料,實(shí)驗(yàn)分四種不同條件:條件1為四字可以構(gòu)成一個(gè)詞(1詞條件);條件2為前兩個(gè)字組成一個(gè)詞,后兩個(gè)字組成另一個(gè)詞(2詞條件);條件3為前兩個(gè)字是四字詞的前半部分,但后兩個(gè)字卻與前文無(wú)關(guān)系半詞條件);條件4為四個(gè)字無(wú)法構(gòu)成任何詞(非詞條件)。要求被試短時(shí)間內(nèi)盡可能多的報(bào)告看到的字。結(jié)果發(fā)現(xiàn)被試往往能夠識(shí)別出1詞條件下的所有字,但是2詞條件下卻僅能識(shí)別出頭兩個(gè)字。Li等人認(rèn)為這種“邊界效應(yīng)”符合整體假設(shè)的推論,即中文識(shí)別是一個(gè)自下而上與自上而下交互的過(guò)程。在此基礎(chǔ)上他們提出了詞的切分和識(shí)別模型,并作出如下假設(shè):(1)詞的切分、識(shí)別是一個(gè)統(tǒng)一的過(guò)程,二者不可區(qū)分;(2)落在知覺(jué)范圍內(nèi)的字加工是并行的,識(shí)別效率受視覺(jué)注意的影響,離注視點(diǎn)越遠(yuǎn)越難識(shí)別;(3)詞的識(shí)別是串行的,詞匯識(shí)別過(guò)程中一次只能有一個(gè)詞匯勝出;(4)當(dāng)一個(gè)詞被識(shí)別出后,剛剛識(shí)別出的詞和字所對(duì)應(yīng)的單元被抑制,然后開(kāi)始下一輪的競(jìng)爭(zhēng)。
(三)模型修正
首先,我們認(rèn)可“詞切分、識(shí)別是個(gè)統(tǒng)一的過(guò)程,二者不可區(qū)分是一個(gè)自下而上加工與自下而上加工交互的過(guò)程”這一假設(shè),并贊同并行分布式理論提出的“知覺(jué)范圍內(nèi)字加工并行”假說(shuō)。識(shí)別效率確實(shí)可以受到視覺(jué)注意的影響,在此基礎(chǔ)上我們還認(rèn)為知覺(jué)范圍可以受詞長(zhǎng)、知覺(jué)負(fù)載程度等因素的影響。
其次,當(dāng)一個(gè)詞被識(shí)別后,剛剛識(shí)別的詞和字所對(duì)應(yīng)的單元真的會(huì)被抑制嗎?劉志芳等人的研究中n-1詞消失嚴(yán)重干擾了讀者的閱讀進(jìn)程,不論產(chǎn)生的原因是認(rèn)知滯后效應(yīng)還是視覺(jué)掩蔽,都說(shuō)明注視點(diǎn)在詞n上時(shí),詞n-1的信息仍然處于激活狀態(tài)。因此我們預(yù)測(cè),在詞n受到加工時(shí),n-1是做為最有力的預(yù)測(cè)依據(jù)出現(xiàn)在認(rèn)知加工平臺(tái)之上的。它可能為在其之后的詞的切分、詞義詞性的選擇提供依據(jù)。
另外,詞的識(shí)別過(guò)程一次一定只能有一個(gè)詞匯勝出,是串行加工嗎?在眾多漢語(yǔ)閱讀研究中均可發(fā)現(xiàn),閱讀的眼跳落點(diǎn)位置并非逐詞存在的,有時(shí)甚至可以跨越2詞。張智君等人也指出詞匯切分的廣度范圍在0-2詞之間。因此在知覺(jué)范圍內(nèi)讀者可以對(duì)多個(gè)詞進(jìn)行同時(shí)切分。之后在此基礎(chǔ)上讀者會(huì)對(duì)可能存在的切分形式提出假設(shè),并根據(jù)n-1詞的語(yǔ)義或語(yǔ)法特征對(duì)這種切分形式是否合理進(jìn)行驗(yàn)證。
中文詞切分現(xiàn)象的探索仍然存在許多尚未解決的問(wèn)題。本章節(jié)試圖將這些問(wèn)題進(jìn)行簡(jiǎn)要梳理,希望能為未來(lái)的研究提供一些思路。
(一)切分存在歧義情況下的切分方式及策略
如果中文閱讀者的確是采用“假設(shè)——考驗(yàn)”的方式利用n-1詞來(lái)驗(yàn)證詞n甚至詞n+1的切分是否正確,那么當(dāng)假設(shè)失敗的情況下閱讀者會(huì)采用怎樣的方式進(jìn)行再次加工呢?計(jì)算語(yǔ)言學(xué)中對(duì)計(jì)算機(jī)處理自動(dòng)切分中文文本問(wèn)題相當(dāng)感興趣。目前國(guó)內(nèi)在這一領(lǐng)域公認(rèn)的難點(diǎn)在于 “歧義切分字段”的處理。我們可以借助計(jì)算語(yǔ)言學(xué)中的歧義字段材料來(lái)考察何種材料容易令讀者產(chǎn)生假設(shè)失誤,面臨假設(shè)失誤時(shí)讀者會(huì)進(jìn)行怎樣的處理。計(jì)算語(yǔ)言學(xué)中還提出歧義切分字段一般分為兩大類,分別為交集型歧義切分字段與多義組合型歧義切分字段。一般來(lái)講,在字段S=a1……ai﹒b1……bj﹒c1……ck分別都構(gòu)成詞,則字段S稱為交集型歧義切分字段;在字段S= a1……ai﹒b1……bj中,如果a1……ai、b1……bj和S分別成詞,則字段S稱之為多義組合型歧義切分字段。在漢語(yǔ)自動(dòng)切詞過(guò)程中處理歧義切分字段時(shí)一般采用的方式是建立歧義字段庫(kù),在字庫(kù)的基礎(chǔ)上利用各種知識(shí)體系處理歧義字段的切分。比如交集型歧義切分字段一般會(huì)利用詞法知識(shí)進(jìn)行切分,而多義組合型歧義切分字段則一般會(huì)利用句法、語(yǔ)義、語(yǔ)用知識(shí)進(jìn)行切分[36]。因此我們還可以追問(wèn)讀者在處理切分歧義時(shí)采用的切分策略是否與計(jì)算機(jī)采用的策略一致呢?尤其是在歧義字段的切分過(guò)程中是按照詞法、句法等知識(shí)進(jìn)行切分還是按照n-1詞的語(yǔ)義特征進(jìn)行切分呢?
(二)詞匯切分的抑制機(jī)制
詞匯的切分與識(shí)別過(guò)程應(yīng)該不僅僅包括對(duì)相關(guān)信息的激活,還應(yīng)該包括對(duì)無(wú)關(guān)信息的抑制。抑制是一種對(duì)無(wú)關(guān)信息進(jìn)行主動(dòng)阻止和壓抑的認(rèn)知加工機(jī)制[37]。以往研究語(yǔ)言理解強(qiáng)調(diào)心理表征的建構(gòu),并用概念或信息的激活、擴(kuò)散來(lái)描述這種建構(gòu)過(guò)程。隨著抑制機(jī)制在一般認(rèn)知研究中越來(lái)越受到重視,人們也開(kāi)始審視其在語(yǔ)言理解中的作用。目前語(yǔ)言理解中的抑制研究涉及范圍較廣,既探討如詞匯、句法、語(yǔ)篇和修辭性語(yǔ)言等各種層次、形式的理解加工過(guò)程,也觸及抑制能力個(gè)體差異及其根源。中文詞匯的切分過(guò)程(尤其是歧義字段的切分)本身就是抑制無(wú)關(guān)信息、凸顯相關(guān)信息的過(guò)程。在這一過(guò)程中漢語(yǔ)詞匯切分的機(jī)制是怎如何抑制無(wú)關(guān)信息的呢?更深一步來(lái)說(shuō),這種抑制機(jī)制究竟位于詞匯加工與識(shí)別的哪一個(gè)階段?抑制機(jī)制的考察有助于我們對(duì)詞匯選擇與確認(rèn)過(guò)程的理解。
(三)詞匯切分在大腦中的加工模式
中文詞匯切分的現(xiàn)有研究成果大多集中于行為研究的實(shí)驗(yàn)范型之內(nèi)。詞匯切分時(shí)腦電成分與腦成像的變化也會(huì)成為未來(lái)研究關(guān)注的焦點(diǎn)。通過(guò)疊加平均而獲得的ERP腦電成分可以反映與特定感覺(jué)、運(yùn)動(dòng)或者認(rèn)知事件相關(guān)的神經(jīng)活動(dòng)。比如有研究發(fā)現(xiàn)N400是一個(gè)在單詞刺激出現(xiàn)后400ms出現(xiàn)的與語(yǔ)言加工有關(guān)的負(fù)電位腦波,它對(duì)語(yǔ)言輸入中的語(yǔ)義特征特別敏感[38];P600是刺激出現(xiàn)后600ms與句法加工密切相關(guān)的正電位腦波[39]。眼動(dòng)和ERP技術(shù)尤其各自研究的優(yōu)點(diǎn),同步采集兩類數(shù)據(jù)可以在一定程度上互補(bǔ)兩者的優(yōu)勢(shì)。眼動(dòng)研究很容易發(fā)現(xiàn)言語(yǔ)加工的先后順序及加工時(shí)程,但卻很難得出在這段時(shí)間內(nèi)大腦究竟完成哪些任務(wù);ERP卻可以得出在語(yǔ)言加工的相應(yīng)階段各個(gè)腦區(qū)的協(xié)同配合情況以及每個(gè)部分腦加工強(qiáng)度的負(fù)載情況。眾所周知,由于神經(jīng)反射弧的長(zhǎng)度決定了眼動(dòng)與ERP數(shù)據(jù)之間存在時(shí)間延遲,但現(xiàn)有技術(shù)可以解決句子中詞匯切分的眼動(dòng)、ERP數(shù)據(jù)間的這一問(wèn)題。因此考察中文句子閱讀過(guò)程中某個(gè)詞匯切分過(guò)程的眼-腦同時(shí)采集具有重要意義。
[1]馮志偉.漢語(yǔ)書(shū)面語(yǔ)的分詞連寫(xiě)[J].語(yǔ)文建設(shè),2001(3):15.
[2]彭澤潤(rùn).詞和詞式書(shū)寫(xiě)研究——中國(guó)語(yǔ)言規(guī)劃的新前景[M].長(zhǎng)沙:湖南人民出版社,2008.
[3]孫茂松.漢語(yǔ)自動(dòng)分詞研究評(píng)述[J].當(dāng)代語(yǔ)言學(xué),2001(1):22-32.
[4]喬維,孫茂松.漢語(yǔ)交集型歧義切分字段關(guān)于專業(yè)領(lǐng)域的統(tǒng)計(jì)特性[J].中國(guó)信息學(xué)報(bào).2008(4):11-18.
[5]Rayner K.Eye guidance in reading:Fixation locations within words[J].Perception,1979(8):21-30.
[6]王力.中國(guó)現(xiàn)代語(yǔ)法[M].北京:中華書(shū)局,1954.
[7]呂叔湘.語(yǔ)法學(xué)習(xí)[M].上海:復(fù)旦大學(xué)出版社,2006.
[8]Rayner K,Fischer M H&Pollatsek A.Unspaced text interferes with both word identification and eye movement control[J].Vision Research,1998(38):1129-1144.
[9]梁菲菲,白學(xué)軍.切分空間和切分方式對(duì)中文閱讀績(jī)效影響的眼動(dòng)研究[J].心理研究,2010(3):21-28.
[10]Liu I M,Yeh J S,Wang L H et al.Progressive reading.Journal of the Chinese word as units on reading efficiency[J].Chinese Journal of Psychology,1974,16:25-32.
[11]Bai X J,Liversedge S P,Zang C L et al.Reading spaced and unspaced Chinese text:Evidence from eye movements[J].Journal of Experimental Psychology:Human Perception and Performance,2008,34 (5):1277-1287.
[12]Hsu S H,Huang K C.Interword spacing in Chinese text layout[J].Perceptual and Motor Skills,2000,91:355-365.
[13]閆國(guó)利,張?zhí)m蘭,張霞等.漢語(yǔ)閱讀中的心理詞加工[J].心理與行為研究,2012,10(3):183-189.
[14]Miller G A.The magical number seven,Plus or minus two: some limits on our capacity for Processing information[J].Psychology Review,1956,101(2):343-352.
[15]Abney S.Parsing by chunks[M].In Berwick R C,Abney S P &Tenny CL,Principle-based parsing.Dordrecht:Kluwer Academic Publishers:257-258.
[16]徐中一,胡謙,劉磊.基于CRF的中文組塊分析[J].吉林大學(xué)學(xué)報(bào)(理學(xué)版),2007,45(3):417-420.
[17]李素建,劉群,白碩.統(tǒng)計(jì)和規(guī)則相結(jié)合的漢語(yǔ)組塊分析[J].計(jì)算機(jī)與發(fā)展,2002,39(4):385-391.
[18]Rayner K,Fischer M H&Pollatsek A.Unspaced text interferes with both word identification and eye movement control[J].Vision Research,1998,38:1129-1144.
[19]白學(xué)軍,張慢慢,臧傳麗等.詞邊界信息在中文詞匯學(xué)習(xí)與識(shí)別中的作用:眼動(dòng)研究的證據(jù)[J].心理科學(xué)進(jìn)展,2014,22(1):1-8.
[20]Rayner K&Bertera J H.Reading without a fovea[J].Science, 1979,206:468-469.
[21]Yan M,Kiegl R,Richter E et al.Flexible saccade-target selection in Chinese reading[J].The quarterly journal of experimental psychology,2010,63:705-725.
[22]Yan M,Kiegl R,Shu H et al.Parafoval load of word N+1 modulates preprocessing effectiveness of word N+2 in Chinese reading [J].Journal of experimental psychology:Human perception and performance,2010,36(6):1669-1676.
[23]Li X S,Liu P P&Rayner K.Eye movement guidance in Chinese reading:Is there a preferred viewing location?[J].Vision research, 2011,51:1146-1156.
[24]Li X S,Liu P P&Rayner K.Saccade target selection in Chinese reading[J].Psychon Bull&Review,2015,22:524-530.
[25]Rayner K,Inhoff A,Morrison R et al.Masking of foveal and parafoveal vision during eye fixations in reading[J].Journal of experimental psychology:Human perception and performance,1981,7:167-179.
[26]閆國(guó)利,王文靜,白學(xué)軍.消失文本條件下認(rèn)知控制的眼動(dòng)研究[J].心理學(xué)探新,2007,4:37-41.
[27]閆國(guó)利,姜茜,李興珊等.消失文本條件下詞的預(yù)測(cè)性效應(yīng)的眼動(dòng)研究[J].應(yīng)用心理學(xué),14:306-310.
[28]劉志芳,張智君,趙亞軍.漢語(yǔ)閱讀中眼跳目標(biāo)選擇單元以及詞匯加工方式:來(lái)自消失文本的實(shí)驗(yàn)證據(jù) [J].心理學(xué)報(bào),43(6): 608-618.
[29]劉志芳,石以萍,張智君等.中文閱讀中的認(rèn)知滯后效應(yīng)[J].心理學(xué)探新,2012,32(1):22-26.
[30]劉志芳,劉妮娜,仝文.字、詞識(shí)別加工在中文閱讀眼動(dòng)控制中的作用[J].心理與行為研究,2014,12(2):182-187.
[31]Rayner K,Liversedge S P&White S J.Eyemovements when reading disappearing text:the importance of the word to the right of fixation[J].Vision Research,2006,46:310-323.
[32]張智君,劉志芳,趙亞軍等.漢語(yǔ)閱讀過(guò)程中詞切分的位置:一項(xiàng)基于眼動(dòng)隨動(dòng)顯示技術(shù)的研究 [J].心理學(xué)報(bào),2012,44(1): 51-62.
[33]吳俊,莫雷,冷英.中文詞匯切分對(duì)眼動(dòng)數(shù)據(jù)的影響[J].心理學(xué)探新,2008,28(2):41-48.
[34]Inhoff A,Wu C.The role of interword spaces in the processing of English compound words[J].Language and Cognitive Processes, 2005,20:291-316.
[35]Li X S,Rayner K&Cave K R.On the segmentation of Chinese words durning reading[J].Cognitive Psychology,2009,58:525-552.
[36]王彩榮,王凱麗,黃玉基.歧義字段的歸類及切分算法[J].微處理機(jī),2005,3:33-39.
[37]楊小虎.語(yǔ)言理解中的抑制機(jī)制研究綜述[J].當(dāng)代語(yǔ)言學(xué), 2005,7(4):327-337.
[38]Kutas M,Hillyard S A.Reading senseless sentences:Brain potentials reflect semantic incongruity[J].Science,1980,207:203-205.
[39]Osterhout L,Holcomb P J.Event-related brain potentials elicited by syntactic anomaly[J].Journal of Memory and Language, 1992,31:785-806.
(責(zé)任編輯:章永林)
B842
A
1008—7974(2016)03—0040—04
10.13877/j.cnki.cn22-1284.2016.05.008
2015-11-11
心理學(xué)視角下漢語(yǔ)詞切分現(xiàn)象理論探究;通化師范學(xué)院社會(huì)科學(xué)科研項(xiàng)目(2014001)
胡俊杰,黑龍江齊齊哈爾人,碩士。