国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

漢語句法分析的綜述

2016-02-04 16:21:48楊紅星
山西青年 2016年23期
關鍵詞:句法長春句式

楊紅星 谷 欣

長春理工大學文學院,吉林 長春 130022

?

漢語句法分析的綜述

楊紅星*谷 欣*

長春理工大學文學院,吉林 長春 130022

句法分析是研究自然語言處理時的基礎問題,了解句法的概念和研究方式,對深入句法分析有非常好的幫助作用。根據(jù)不同的語境分析,同一個句子都會產(chǎn)生不同的含義。早在1947年就已經(jīng)有句法分析系統(tǒng)問世,盡管這一系統(tǒng)最終還是以失敗告終,但對句法分析的腳步卻從未有過停止。本文就是針對這一現(xiàn)象提點,提出討論議題。并通過分析概念,解釋現(xiàn)狀,解決問題的幾個步驟對漢語的句法進行綜合性的分析。希望通過分析得出的結(jié)論,可以幫助這一領域的發(fā)展。

漢語句法;計算機分析;應用;綜述

近年來,計算機領域開始進行漢語句法的研究,用于常規(guī)的翻譯和解釋,并希望通過該類的技術突破,達到人機對話和智能搜索情報的效果。漢語的句法分析是解決所有自然語言處理時,所遇到的最基礎的問題,計算機想要生成智能化的反應,就需要一個完善的句法結(jié)構,去分析解決漢語的翻譯、解釋、人機對話等實際問題。

一、概述

句法分析是在計算機系統(tǒng)的基礎上進行發(fā)展的,常見的句法分析應用有:計算機的翻譯、文字的注釋、一對一的問答系統(tǒng)、信息的自然摘錄以及自動搜索等。如果對句法分析這一詞不了解,那么一定知道文法分析,這是該定義不同的兩個說法。句法分析說白了就是在一定規(guī)則的語法中,進行句子以及句法單位的自動識別,并按照規(guī)定輸出識別。

常見的漢語理解是分幾個步驟的,一般都會包含待翻譯文章的輸入、文章詞句的切分、詞語屬性分析標注、生成目的標注等。長期以來句法的分析都是各個國家所研究的課題,也是公認的一個難題。句法分析的機器理念出自于20世紀的50年代,大概是在60年代時有了相應的成果。

二、句法分析的難點

(一)語句歧義。漢語言文化博大精深,很多詞都有多種意思,即便是一個很簡單的語句,都有可能有很多種的結(jié)果,所以句子語法的分析非常重要。

(二)漢語的搜索量太大。語法的分析是一個極其復雜的過程,一般完成一個語法的分析需要很多的數(shù)據(jù)支持,根據(jù)不同的語句長度也會有不同的數(shù)據(jù)要求。

三、句法的機構淺析

不同的漢語句法結(jié)構,會有不同的句法計算方式,所以先要了解句法的機構。短語結(jié)構語法和依存關系語法是現(xiàn)在常見的兩種語法關系,當然還有其他的句法體系,在此只做簡單的介紹,并不展開分析。

短語結(jié)構語法擁有不同的層級,他們之間都是闡述了語法、語言和自動機之間的關系。短語結(jié)構語法呈現(xiàn)一個樹分類關系,句法根據(jù)一定的規(guī)則進行轉(zhuǎn)換分析。每一個詞的轉(zhuǎn)換都是需要按照設定的樹值規(guī)則進行目的性的轉(zhuǎn)換。

依存語法(從屬關系語法),該項理論的提出是由法國的語言家——思尼耶爾提出的,在思尼耶爾提出的概念中,依存的語法句式結(jié)構表示的一個依存的關系,并不是一個句法樹。每一個依存都是由句子中的支配詞和從屬詞構成,沒有規(guī)定每一個語句的定義,也沒有明確的規(guī)則來對依存的關系進行進一步的確定標記。依存語法相較于短語結(jié)構更加的自由,所以其在近年來受到越來越多的專家學者的青睞,發(fā)展也較為迅速。

除了以上介紹的兩種句法體系外,國內(nèi)外都開展了對句法分析的研究。不論是國外的美國鏈語法、范疇語法等,還是國內(nèi)的HNC理論都是目前行業(yè)內(nèi)常用的語法,只是由于設定區(qū)域的不同,所以使用有一定的局限性。國外的兩種語法體系是由美國的CMU計算機學院提出的,國內(nèi)的HNC理論則是由黃曾陽教授提出的。

四、自動句法分析的方法

計算機的句法分析系統(tǒng)自提出建議以來,已經(jīng)擁有了50年的歷史的,有關自動的句法分析也更新?lián)Q代了很多,本文講述的是有關目前國內(nèi)外常見的三類分析方式,他們分別是:基于概率統(tǒng)計的方式、淺層句式分析的方式以及基于基礎規(guī)則的方式

(一)早期的句式分析方式

在漢語句式分析的早期發(fā)展階段基本是依靠基于基礎規(guī)則的方式來進行的,基于基礎規(guī)則采用的是無歧義的規(guī)則形式以及解釋歧義的行為特征。其是以漢語的語言學為基礎理論,并通過此計算法來強調(diào)語言學家對語言的現(xiàn)象認識的過程。

早期的句式分析基于基礎規(guī)則的方法,在進行操作時需要的規(guī)則較多,在實際的應用過程中步驟較為繁瑣,并不智能化。并且它的獲取是完全依靠知識工程師的經(jīng)驗,具有相對絕對性,并不能保證工程師的句式分析完全符合規(guī)則。另外基于基礎規(guī)則的句式分析方式的開發(fā)成本也比較的大,在應用過程中的效率利用率較低。

(二)90年代句式計算方式

隨著經(jīng)濟的發(fā)展,對計算機語言資料庫的計算方式也逐步的進行更新,基于基礎規(guī)則的句式計算也逐漸的開始被新型的計算方式所替代——基于統(tǒng)計的方法。相比較早期的句式分析,這一類的句式分析更加的便捷,計算方式也比較簡易?;诮y(tǒng)計的方法是在打規(guī)模的語句資料庫中獲取準確的記過。在統(tǒng)計句式的模型中,形式簡潔明朗、參數(shù)空間利用率高,工作分析的效率也較之前的有很多的提高。但是在對文章中的上下文分析上,基于統(tǒng)計的句式分析方法還是存在著不足。所以還需要在這基礎上,針對性的增加結(jié)構信息的概率模型以及基于歷史的模型等等。

(三)目前常用的句法分析方式

在有了基于統(tǒng)計和基于基礎規(guī)則的方式后,又推出了淺層句法的分析。淺層句法的分析師將任務進行分類,一般是由兩個子任務構成的,分別是句塊的識別以及句塊之間的依附關系。通過解決這兩個子問題,然后再進行問題的合并。從而完成目的性的句法分析任務。

淺層句法的分析是在基于基礎規(guī)則以及基于統(tǒng)計的基礎上進行的更新,并通過簡化句式的步驟,進行句法分析的優(yōu)化工作。

五、總結(jié)

目前漢語句法分析是中文信息處理的重要領域部分,早在1947年就已經(jīng)有句法分析系統(tǒng)問世,盡管這一系統(tǒng)最終還是以失敗告終,但對句法分析的腳步卻從未有過停止。國內(nèi)外的諸多學者專家都對其進行了研究,并得出了一些符合現(xiàn)代的句法分析的方式。句法分析的難點是在句子的歧義以及漢語的搜索量太大,針對這樣的難點分析,得出了目前常用的兩種漢語句式分析的方式,分別是短語結(jié)構語法和依存語法(從屬關系語法)。當然在漢語句法分析領域目前還有很多的不足,相信隨著國內(nèi)計算機技術的更新,這一類的技術也會得到騰飛的發(fā)展,我們也拭目以待以后更多人機對話和智能搜索情報的功能出現(xiàn),以此來便捷我們的生活。

[1]鄭偉發(fā).漢語句法分析研究綜述[J].信息技術,2012,07:72-74+78.

[2]袁里馳.基于統(tǒng)計的句法分析方法[J].中南大學學報(自然科學版),2014,08:2669-2675.

楊紅星(1974-),男,河南沁陽人,長春理工大學文學院,副教授,碩士生導師,研究方向:漢語應用寫作;谷欣(1993-),女,吉林榆樹人,長春理工大學文學院,研究生,研究方向:漢語應用寫作。

TP

A

猜你喜歡
句法長春句式
句法與句意(外一篇)
中華詩詞(2021年3期)2021-12-31 08:07:22
述謂結(jié)構與英語句法配置
初夏
句法二題
中華詩詞(2018年3期)2018-08-01 06:40:40
印語長春
詩詞聯(lián)句句法梳理
中華詩詞(2018年11期)2018-03-26 06:41:32
基本句式走秀場
例析wh-ever句式中的常見考點
走進長春凈月潭
特殊句式
乐清市| 馆陶县| 永州市| 南岸区| 元江| 林州市| 淮阳县| 图片| 五家渠市| 黎平县| 昌乐县| 皮山县| 桃源县| 柯坪县| 安庆市| 竹溪县| 三穗县| 德昌县| 册亨县| 青海省| 石家庄市| 湖州市| 莱芜市| 杭锦后旗| 赣榆县| 满洲里市| 广河县| 湘潭县| 嘉善县| 巴楚县| 微山县| 怀远县| 西吉县| 宣城市| 福海县| 铁岭县| 大冶市| 城固县| 泸定县| 波密县| 玉林市|