劉群
(襄樊學(xué)院 文學(xué)院,湖北 襄陽 441053)
基于有限狀態(tài)轉(zhuǎn)移網(wǎng)絡(luò)的詞語重疊形式生成和識別
劉群
(襄樊學(xué)院 文學(xué)院,湖北 襄陽 441053)
有限狀態(tài)轉(zhuǎn)移網(wǎng)絡(luò)是語言形式化表達(dá)手段之一。通過對詞語重疊音節(jié)數(shù)目的限制、語義內(nèi)涵的限制、典型形式的限制,確定有限狀態(tài)轉(zhuǎn)移網(wǎng)絡(luò)可接受的詞語重疊的范圍,運用有限狀態(tài)轉(zhuǎn)移網(wǎng)絡(luò)再現(xiàn)了漢語詞語重疊的生成過程和生成模式,以此說明靜態(tài)的語法規(guī)則或語法結(jié)果是可計算的。
漢語;語言形式化;有限狀態(tài)轉(zhuǎn)移網(wǎng)絡(luò);詞語重疊
詞語重疊是漢語普遍的語言現(xiàn)象。漢語是缺少形態(tài)變化的語言,這也就使得詞語重疊究竟是不是形態(tài)變化的爭議成為可能。有人將詞語重疊界定為漢語重要的語法手段,并且是可以直接感知的顯性語法手段。也有人將之歸為構(gòu)形法的一類。構(gòu)詞法和構(gòu)形法是詞的結(jié)構(gòu)分析中兩種既互相對立又互為補充的方法。由兩個或兩個以上語素組合成新詞的規(guī)則即是構(gòu)詞法。這樣的結(jié)論幾乎是蓋棺定論的。但是,漢語究竟有沒有構(gòu)形法?《馬氏文通》、《新著國語文法》、《中國文法要略》等漢語語法著作,都不承認(rèn)漢語有構(gòu)形法?!稘h語語法論》則認(rèn)為漢語有構(gòu)形法。作者后來還根據(jù)詞和形態(tài)標(biāo)記的依存關(guān)系將形態(tài)區(qū)分為內(nèi)部形態(tài)和外部形態(tài)。重疊則是構(gòu)形法的內(nèi)部形態(tài)。當(dāng)然,形態(tài)是否有內(nèi)部和外部之分?這是語言學(xué)理論尚待解決的問題,我們且不必深入探討。但是,漢語的確有一些詞語具備明顯的形態(tài)變化的特點。形態(tài)變化的結(jié)果不是產(chǎn)生新詞,而是呈現(xiàn)一個詞的不同的語法形式,并由此附加上一定的語法意義?!罢Z法手段之說”、“構(gòu)形法之說”,實際上都殊途同歸地承認(rèn)重疊是詞語的形式方面的變化。
有限狀態(tài)轉(zhuǎn)移網(wǎng)絡(luò)是語言形式化表達(dá)手段之一。我們可以借助這樣的方式對漢語詞語重疊現(xiàn)象加以類似于自然科學(xué)的描述和解釋。
從詞類角度看,名詞、量詞、動詞、形容詞的可重疊性已是公認(rèn)的事實。鑒于有限狀態(tài)轉(zhuǎn)移網(wǎng)絡(luò)的“有限性”,有必要細(xì)化有限狀態(tài)轉(zhuǎn)移網(wǎng)絡(luò)可接受的漢語詞語重疊的范圍。
(一)重疊的音節(jié)數(shù)目限制
形態(tài)手段的使用常常受詞語音節(jié)數(shù)目多少的影響。[1]如英語形容詞的級。單音節(jié)形容詞級的變化以形態(tài)手段體現(xiàn),即單音節(jié)形容詞后直接加后綴er和est表示比較級和最高級,如short—shorter—shortest。多音節(jié)形容詞級的變化以詞匯手段體現(xiàn),即多音節(jié)形容詞前直接加單詞more和most表示比較級和最高級,如interesting—more interesting—most interesting。同樣,漢語的重疊也受音節(jié)數(shù)目的影響和限制。
1.名詞和量詞重疊只限于單音節(jié),雙音節(jié)的或多音節(jié)的則不可重疊。
月——月月 年——年年 個——個個 條——條條
窗戶——窗戶窗戶 窗戶——窗窗戶戶
2.形容詞和動詞重疊可以是單音節(jié)的,也可以是雙音節(jié)的。
動詞重疊:摸——摸摸 想——想想 打掃——打掃打掃 晃悠——晃晃悠悠
形容詞重疊:高——高高 小——小小 簡單——簡簡單單 筆直——筆直筆直
漢語詞語重疊最多的音節(jié)數(shù)目是4個,那么重疊的基本音節(jié)數(shù)只能是1個或2個,形式上可以用A代表一個音節(jié),A、B代表2個不同的音節(jié)。
(二)重疊的語義內(nèi)涵限制
語義內(nèi)涵一般有語法層面的、詞匯層面的、篇章層面的。詞語重疊的語義是指向語法層面的。不同語言詞語重疊的語法意義是不一樣的。馬來語名詞重疊表復(fù)數(shù),俄語動詞重疊表未完成體,印地語形容詞重疊表程度高。就漢語而言,通過重復(fù)整個詞(A或者AB)或詞的一部分(A或者B)的方式獲取的是某種抽象的、概括的、附加的語法意義,即以結(jié)構(gòu)形式變異獲義。那么,這里就有兩個限制性的條件:重疊即詞語外在形式的變化是獲取新義的前提,通過形式變化獲取的新義是一般性的一類意義。如此一來,至少可以排除兩類重疊并非本文討論的重疊。
一是疊音式的單純詞,如猩猩、姥姥、亭亭、翩翩;二是重疊式的合成詞,如星星、寶寶、哥哥、剛剛、僅僅、常常。兩者都是兩個相同的字組合成詞的方式。所不同的是,疊音式單純詞的兩個音節(jié)表示一個語素,單個音節(jié)沒有語義值,即AA式?jīng)]有原形A,不存在A(原形)→AA。所以,AA式就不能以結(jié)構(gòu)形式的變異獲取抽象的語法意義,其意義只能是詞匯層面的詞匯意義。
重疊式合成詞的單個音節(jié)有語義值,兩個音節(jié)是兩個語素,即AA式有原形A,存在A(原形)→AA。這一類詞的語義形式比較復(fù)雜。以“哥—哥哥”為代表的親屬稱呼,以“寶—寶寶”為代表的親昵愛稱和以“星—星星”為代表的一般指物名詞,其A式和AA式的語義差異并不明顯。也有人認(rèn)為A式是口語語體,AA式是書面語語體。筆者認(rèn)為這樣的分別很牽強。
例1:——這是誰呀?——這是我哥。
例2:——這是誰呀?——這是我哥哥。
例1、例2的語義完全相同。生硬地分出口語語體和書面語語體反而不合適。
以“剛剛”為代表的副詞,其A式和AA式是兩個不同的詞。有時,A義=AA義;有時,A義≠AA義。如“常、常常”都表示行為、動作的次數(shù)頻繁。
例3:他常遲到=他常常遲到。
但是,否定式多用“不?!保儆谩安怀3!?。[2]
例4:他不常來了。
例5:他不常常來了。
和疊音式單純詞重疊式合成詞不同的是,名詞、量詞、動詞、形容詞是以結(jié)構(gòu)變異獲義,獲取的是一類抽象的語法意義。
1.名詞、量詞重疊的語法意義。
名詞、量詞重疊后表“每一”。如天天=每一天、朵朵=每一朵。石毓智稱之為周遍性表達(dá)。[1]79徐通鏘指出,周遍性的事物被認(rèn)為是有定的。所以,周遍性一般由兩個義項組成:既定的范圍和每一個成員。
2.動詞重疊的語法意義。
(1)動詞重疊后呈現(xiàn)的是動作行為發(fā)生或進(jìn)行的方式,相當(dāng)于印歐語系的語法范疇“體”。具體而言,主要是試行體、短時體、完成體。[3]
看(原形)——看看(短時體)——看一看(短時體)——看了看(完成體)——看了一看(完成體)
研究(原形)——研究研究(試行體)
(2)動詞重疊后表示動作的隨意性、反復(fù)性或延續(xù)性。
說笑——說說笑笑(隨意性) 來往——來來往往(反復(fù)性) 踉蹌——踉踉蹌蹌(延續(xù)性)
3.形容詞重疊的語法意義。
(1)形容詞重疊后表事物程度的加深或減弱。
干凈——干干凈凈(程度的加深) 大——大大(程度的加深或減弱)
筆直——筆直筆直(程度的加深)
(2)形容詞重疊后表貶義,主要用于口語。
糊涂——糊里糊涂 古怪——古里古怪
(三)重疊的典型型和非典型型
從典型范疇(prototype—based category)的角度出發(fā),以重疊的外在形式作為參照標(biāo)準(zhǔn),重疊有典型和非典型之分。典型的重疊模式是A、B或AB自身重疊,如AA、ABB、ABAB。非典型的重疊模式是A、B或AB的重疊需借助其他形式,這里的其他形式一般是指某一個具體的漢字。所以非典型重疊也可稱作嵌字式重疊,如A了A、A里AB。需要說明的是,被嵌的漢字沒有實在的語義值,或者表示空靈的語法義,如“了”“著”;或者語義值為零,如“里”。以此為準(zhǔn),名詞、量詞、動詞、形容詞的典型重疊形式和非典型重疊形式可以總結(jié)為:
表1 典型重疊和非典型重疊
狀態(tài)轉(zhuǎn)移網(wǎng)絡(luò)的其字符串或符號串是字母表上的字符組成的長度有限的序列。[4]嚴(yán)格地講,字母表的符號應(yīng)該是作用性質(zhì)相同的記號單位。如0—9是數(shù)字符號,A—Z是大寫字母符號。顯然{A、B、AB、了、一、著、里}不是一類符號,更不能構(gòu)成字母表∑。所以,經(jīng)過取舍,狀態(tài)轉(zhuǎn)移網(wǎng)絡(luò)只能描述典型的重疊形式。
那么,同時符合以上3個條件的重疊形式就是有限狀態(tài)轉(zhuǎn)移網(wǎng)絡(luò)可接受的形式,即有限狀態(tài)轉(zhuǎn)移網(wǎng)絡(luò)描述對象={單音節(jié)A或雙音節(jié)AB}∩{結(jié)構(gòu)形式變異獲義}∩{典型重疊}=AA、ABAB、AABB、ABB、AAB。
有限狀態(tài)轉(zhuǎn)移網(wǎng)絡(luò)(FSTN,F(xiàn)inite State Transition Network)是一個有向圖。所以,有限狀態(tài)轉(zhuǎn)移網(wǎng)絡(luò)也叫圖計算。完整的有限狀態(tài)轉(zhuǎn)移網(wǎng)絡(luò)由結(jié)點、單圈、雙圈、有方向的弧線、轉(zhuǎn)移條件(有條件或無條件)的標(biāo)記構(gòu)成。其中,結(jié)點代表轉(zhuǎn)移狀態(tài),單圈代表非終止?fàn)顟B(tài),雙圈代表終止?fàn)顟B(tài),有方向的弧線是不同狀態(tài)的連接線,弧線上的字符即轉(zhuǎn)移條件的標(biāo)記。若是無條件轉(zhuǎn)移,則統(tǒng)一標(biāo)注為ε(空字符)。
q0是起始狀態(tài),q1是中間狀態(tài),q2是終止?fàn)顟B(tài)。狀態(tài)轉(zhuǎn)移過程是:狀態(tài)q0到狀態(tài)q1的條件是當(dāng)前字符為A,狀態(tài)q1到狀態(tài)q1的條件是當(dāng)前字符為A,狀態(tài)q1到狀態(tài)q2的條件是當(dāng)前字符為B,狀態(tài)q2到狀態(tài)q2的條件是當(dāng)前字符為B,狀態(tài)q2到狀態(tài)q1的條件是當(dāng)前字符為空。需要注意的是:狀態(tài)q0到狀態(tài)q1是空集,即不存在形式A;狀態(tài)q2到狀態(tài)q1是空計算,即從狀態(tài)q2到狀態(tài)q1是無條件的。
按照以上有限狀態(tài)轉(zhuǎn)移網(wǎng)絡(luò)的運行規(guī)律和運行過程,漢語詞語重疊形式的生成過程可以表示如下:
表2 有限狀態(tài)轉(zhuǎn)移網(wǎng)絡(luò)識別重疊形式的過程
表3 重疊式的狀態(tài)轉(zhuǎn)移表
表2所示有限狀態(tài)轉(zhuǎn)移網(wǎng)絡(luò)也可用狀態(tài)轉(zhuǎn)移表(state transition table)的形式表示。
有限狀態(tài)轉(zhuǎn)移網(wǎng)絡(luò)好比有限狀態(tài)自動機(jī),動態(tài)地計算出語言成分的生成過程和生成模式,和靜態(tài)描寫、闡釋語法成分的分析方法相互補充,既印證了語法實體存活的可能性,也說明語法規(guī)則或語法結(jié)果是可計算的(computable)。但是,對語言的形式化處理也就意味著簡單化,畢竟自然語言的意義和形式不是絕對的一一對應(yīng)關(guān)系,因此,形式的手段和它所要替代的自然語言之間有時很難達(dá)成一致。比如嵌字式重疊,所嵌字的字形、意義、位置缺少應(yīng)有的穩(wěn)固性,導(dǎo)致有限狀態(tài)轉(zhuǎn)移網(wǎng)絡(luò)無法識別其生成過程。當(dāng)然,這也為我們的研究提出了新的課題。
[1] 石毓智.語法化的動因和機(jī)制[M].北京:北京大學(xué)出版社,2005:109.
[2] 呂叔湘.現(xiàn)代漢語八百詞[M].北京:商務(wù)印書館,1984:92.
[3] 張 靜.語言語用語法[M].河南:文心出版社,1994:1078.
[4] 俞士汶.計算語言學(xué)概論[M].北京:商務(wù)印書館,2007:27.
Generation and Recognition of Word Repetition Based on FSTN
LIU Qun
(College of Chinese Language and Literature,Xiangfan University,Xiangyang 441053,China)
Finite State Transition Network(FSTN)is one of the methods on language expression in forms.It indicates that the static rules or results of the grammar are countable according to the limitation of the repetition syllable’s numbers,the connotation of the meanings,the typical forms,and to make sure the acceptable scope of the repetition of the words in the Finite State Transition Network,and representation the process and the model of the generation of the repetition of Chinese words through the Finite State Transition Network.
Chinese;Language formalization;Finite State Transition Network(FSTN);Word repetition
H109.4
A
1009-2854(2011)10-0071-04
2011-09-18
劉 群(1972—),女,湖北襄陽人,襄樊學(xué)院文學(xué)院副教授,主要研究方向:現(xiàn)代漢語,對外漢語教學(xué)。
(責(zé)任編輯:倪向陽)