藍巖真 朱虹雨
摘 要:韓語復句通常由多類型“節(jié)”構成,各類句式結構相對復雜,各節(jié)之間存在不同層次與包含聯(lián)系,因此連接復句在進行自動處理識別時通常需要依次分解為單句方能實現(xiàn)句子結構的全面解析。文章主要探討了以語言知識為基礎的韓語復句自動識別對策,旨在有效解決復句處理識別問題。
關鍵詞:語言知識;韓語復句;自動識別;對策
中圖分類號:H55文獻標識碼:A收稿日期:2017-12-06文章編號:2095-624X(2018)01-0063-01
從韓語語法角度出發(fā),含有單一主謂賓關系的句子被定義為單句,含有超過兩組以上單句的句子被稱作復句,但是在自動處理技術實際實施過程中,計算機通常難以準確識別出句子當中的主謂賓關聯(lián)和數(shù)量,導致韓語復句自動處理充滿挑戰(zhàn)。從語言知識角度出發(fā),韓語主要依靠豐富的詞尾、助詞等體系達成語法表達效果,致使韓語復句自動識別需要面臨“同型異質”等語句歧義現(xiàn)象,影響自動識別結果的準確性。
1.韓語復句語言特點
充分掌握韓語復句的語言特點是準確解構韓語復句的重要前提,為此必須從復句關系判別標準、潛在復句關系標記入手,深入解析復句的構成表現(xiàn)、連接詞尾等內容,并結合各類復句的特征整理自動識別程序構建思路。例如:“??? ?? ???./恩熙不是傻瓜。”該條韓語從語法成分角度出發(fā),均隸屬補語從句類型,因此難以通過單純的復句關系對其進行準確標記。而有些連語會存在明顯的邏輯先后聯(lián)系,在自動處理時必須注意連語銜接部分的準確應用。比如:“?? ? ?? ?? ??./樸永哲一回來,會議就開始了?!边@句話隸屬邏輯語義關系范疇,具有時間連貫語義特性,其功能與復句關系標記等同。
2.語料來源與解構分析
本文所采用的各類語料多源于韓國新聞語篇等主流媒體的相關報道,如《東亞日報》等,解析語句約為50萬,主要采用U-Tagger詞法分析器進行詞義標注。在對復句進行判定時,主要根據(jù)句子的構成表現(xiàn)、句末存在終止性停頓、由若干小句構成等特點進行復句識別和處理。經(jīng)相關數(shù)據(jù)資料分析統(tǒng)計發(fā)現(xiàn),從結構角度出發(fā),韓語復句可通過分析句式層級、分句包含數(shù)量等方式,降低復句自動處理復雜度,采用“化繁為簡、對癥處理”的模式將復雜復句解構為簡單的相對應分句,予以分層級和針對性處理,提高復句自動識別的有效性和準確性。
3.個案解析
例如,“?? ?? ??? ?? ??.”分別采用有道、必應、谷歌、人工等語言自動識別軟件對例句進行處理,處理結果如下。有道:“下雨帶雨衣?!北貞骸叭ハ掠?,帶上雨衣?!惫雀瑁骸跋掠炅耍晕矣杏暌?。”人工:“下雨了,把雨衣帶上吧?!备鶕?jù)上述實踐結果可知,雖然必應和谷歌均識別出了復句結構,但是在語義處理方面存在明顯缺陷,而有道雖然語義識別效果良好,但未能準確判斷出復句結構。這是因為在韓語復句軟件自動處理過程中,通常需要將句子拆解為若干個短語片段,再通過類比思路將各片段譯為目標短語,最后將各個短語連接成句,通過語序調整得到譯文。經(jīng)過語料和案例分析后發(fā)現(xiàn),復句語義和結構識別失誤與連接詞尾的缺省翻譯關聯(lián)密切。
4.程序設計思路與實施效果
經(jīng)上述復句解構和語義解析后可知,在進行韓語復句程序編寫時,必須重點關注句子語義、結構和邏輯思路,從而進行正確的解構翻譯?;驹O計流程如下:首先,必須實施句子預判處理工作。譬如,對于單句,可在語言自動識別軟件直接輸入后進行翻譯;對于復句,則需進一步判斷句子的層級結構和語義邏輯。其次,在連接詞尾處理方面,必須將句式中的各個連接詞尾重新設置為相應的終結詞尾,并以連接詞尾的形式出現(xiàn)在譯句中。最后,根據(jù)中文單句翻譯結果和相應的邏輯順序整合成全新的復句。實踐表明,采用此種方法能夠有效提高韓語復句自動識別技術的翻譯質量,在有道和必應在線軟件應用中改進效果更加明顯。
綜上所述,本文以韓語復句特點為切入點,對相關語言知識的理論基礎進行了初步分析,并重點探討了基于語言知識的韓語復句自動識別對策,通過句子解構、語義解析、邏輯判斷等方式,提高韓語復句自動識別的準確性。
參考文獻:
[1]黃丙剛.韓語因果復句在漢語中的對應研究[J].東北亞外語研究,2016(3):49-54.
[2]劉 洋,畢玉德,李 健.基于句法知識的復句解構對韓漢復句機器翻譯改進芻議[J].洛陽師范學院學報,2017(2):49-54.