国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

HNC 理論關(guān)系句研究及其機(jī)器翻譯改進(jìn)

2019-11-30 09:38楊政
現(xiàn)代計(jì)算機(jī) 2019年27期
關(guān)鍵詞:省略雙向語(yǔ)義

楊政

(信息工程大學(xué)洛陽(yáng)校區(qū),洛陽(yáng) 471003)

0 引言

自然界萬(wàn)事萬(wàn)物永遠(yuǎn)不是孤立存在的,千絲萬(wàn)縷的關(guān)系將事物聯(lián)結(jié)起來。但是自然語(yǔ)言對(duì)于兩個(gè)事物間關(guān)系的描述有多種類別。概念層次網(wǎng)絡(luò)理論(Hierarchical Network of Concepts,HNC)是關(guān)于自然語(yǔ)言理解的理論體系,其目標(biāo)是以概念聯(lián)想脈絡(luò)為主線,建立一種模擬大腦語(yǔ)言感知過程的自然語(yǔ)言表述模式和計(jì)算機(jī)理解處理模式,使計(jì)算機(jī)獲得消解模糊的能力[1]。從人類大腦對(duì)語(yǔ)言的感知理解出發(fā),HNC 總結(jié)了自然語(yǔ)言對(duì)萬(wàn)事萬(wàn)物進(jìn)行總體表述的六個(gè)基本角度,也是一切事物發(fā)生、發(fā)展和消亡的六個(gè)基本環(huán)節(jié),即作用、過程、轉(zhuǎn)移、效應(yīng)、關(guān)系和狀態(tài),稱為作用效應(yīng)鏈。

在HNC 的語(yǔ)義網(wǎng)絡(luò)中,關(guān)系一級(jí)節(jié)點(diǎn)下有七個(gè)二級(jí)節(jié)點(diǎn),是對(duì)關(guān)系七個(gè)側(cè)面的描寫,分別是結(jié)合與分離、依存于排斥、支持與反對(duì)、主宰與從屬、使用與舍棄、擁有與失去以及適應(yīng)與干擾。這些二級(jí)節(jié)點(diǎn)作為關(guān)系概念,完成對(duì)關(guān)系類別的劃分和描述,其純凈性是越來越弱的,前兩個(gè)是純凈的關(guān)系概念,而其后的關(guān)系概念都是與其他的基元概念有交叉關(guān)聯(lián)性的,例如支持與反對(duì)是與反應(yīng)關(guān)聯(lián)的。

HNC 研究是通過以概念聯(lián)想脈絡(luò)為主線,建立一種模擬大腦語(yǔ)言感知過程的自然語(yǔ)言表述模式和計(jì)算機(jī)理解處理模式[1]。HNC 通過建立自然語(yǔ)言概念體系模式以及自然語(yǔ)言語(yǔ)義塊和語(yǔ)句的表示模式等,使計(jì)算機(jī)可以模擬人類感知語(yǔ)言的過程。HNC 從語(yǔ)言表述的抽象概念出發(fā)設(shè)計(jì)行車了三大語(yǔ)義網(wǎng)絡(luò),分別是基本概念、基元概念以及邏輯概念[2]。

基本概念是對(duì)萬(wàn)事萬(wàn)物基本特性的描述,例如時(shí)間、空間、質(zhì)、量、度等。基元概念是自然語(yǔ)言對(duì)自然中萬(wàn)事萬(wàn)物進(jìn)行表述的角度,根據(jù)作用效應(yīng)鏈的六個(gè)環(huán)節(jié)描述,這六個(gè)環(huán)節(jié)是作用、過程、轉(zhuǎn)移、效應(yīng)、關(guān)系、狀態(tài)。其中關(guān)系處于第五個(gè)環(huán)節(jié)。邏輯概念則是各類語(yǔ)義塊的標(biāo)識(shí)和說明符。

本文從HNC 理論出發(fā),分析自然語(yǔ)言對(duì)具有雙向特征基元概念為關(guān)系形成的關(guān)系句進(jìn)行分析,從雙向關(guān)系句以及擴(kuò)展雙向關(guān)系句兩個(gè)側(cè)面。隨后提出算法改進(jìn)這兩類關(guān)系句的機(jī)器翻譯,并進(jìn)行實(shí)驗(yàn)驗(yàn)證。

1 以具有雙向特征基元概念為關(guān)系的關(guān)系句分析

HNC 關(guān)系句就是對(duì)關(guān)系的描述。在對(duì)關(guān)系進(jìn)行描述時(shí),除了關(guān)系本身,還需要表述關(guān)系的雙方,在關(guān)系句表示式中用RB1 和RB2 表示。通過關(guān)系雙方參與度和主動(dòng)權(quán)的不同,關(guān)系句分為單向關(guān)系句、雙向關(guān)系句、擴(kuò)展單向關(guān)系句以及擴(kuò)展雙向關(guān)系句。其中,單向關(guān)系句和雙向關(guān)系句可統(tǒng)稱為基本關(guān)系句,兩類則可以統(tǒng)稱為擴(kuò)展關(guān)系句。

雖然基本關(guān)系句可分為單向關(guān)系句和雙向關(guān)系句,但是對(duì)于關(guān)系一級(jí)節(jié)點(diǎn)下的七個(gè)二級(jí)節(jié)點(diǎn)來說,有的基元概念基本上只存在單向關(guān)系句,例如45 使用與舍棄、46 擁有與失去。同樣,有的基元概念基本只存在雙向關(guān)系句,例如41 結(jié)合與分離、42 依存與排斥。而43 支持與反對(duì)、44 主宰與從屬和47 適應(yīng)與干擾則是兼有單向關(guān)系和雙向關(guān)系特性。因此,在對(duì)以具有雙向特征基元概念為關(guān)系形成的關(guān)系句中,本文只分析41、42、43、44 和47 形成的雙向關(guān)系句和擴(kuò)展雙向關(guān)系句。

1.1 雙向關(guān)系句

雙向關(guān)系句的語(yǔ)句表達(dá)式為:RmJ=RB+R。其中,m 取值為關(guān)系一級(jí)節(jié)點(diǎn)下的二級(jí)節(jié)點(diǎn)編碼,由于本文主要分析具有雙向特征基元概念為關(guān)系形成的關(guān)系句,因此m 取值為不包括5、6。RB 是指關(guān)系雙方,包括RB1 和RB2,R 指的是關(guān)系本身。在雙向關(guān)系句中,關(guān)系雙方RB 內(nèi)的RB1 和RB2 間一般有語(yǔ)義塊組合標(biāo)識(shí)符,如“和、同、與”等。

例如:西藏和平解放以來,很多著名的宗教界人士同中國(guó)共產(chǎn)黨政府合作。(R34J)

句中,RB1 是很多著名的宗教界人士,RB2 是中國(guó)共產(chǎn)黨政府,RB1 和RB2 都屬于pp 類概念,RB 內(nèi)部的語(yǔ)義標(biāo)識(shí)符為“同”。在這一句中,關(guān)系雙方之間不僅有明確的標(biāo)識(shí)符,還具有一定的對(duì)仗性。

例如:挪威奧斯陸大學(xué)人權(quán)研究所和越南胡志明政治學(xué)院人權(quán)研究中心合作。(R34J)

句中,RB1 挪威奧斯陸大學(xué)人權(quán)研究所和RB2 越南胡志明政治學(xué)院人權(quán)研究中心就具有比較好的對(duì)仗性,其RB 內(nèi)部語(yǔ)義標(biāo)志符為“和”字。但是,關(guān)系雙方之間也可能不顯含標(biāo)識(shí)符,而是隱含的。

例如:甲乙雙方共同協(xié)商。(R74J)

在該句中,RB1 和RB2 由一個(gè)詞語(yǔ)來表達(dá),這樣的關(guān)系雙方就被隱藏在一個(gè)詞語(yǔ)“甲乙雙方”中,不會(huì)顯含標(biāo)識(shí)符。

除此之外,雙向關(guān)系句還有一個(gè)特征,即在出現(xiàn)語(yǔ)義標(biāo)志符時(shí),特征語(yǔ)義塊R 的上裝常常分離,放于語(yǔ)義標(biāo)志符的前面。

例如:2010 年以來,中國(guó)即將與聯(lián)合國(guó)兒童基金會(huì)駐華代表處開展合作。(R34J)

句中,RB 內(nèi)部的語(yǔ)義標(biāo)志符“與”前的“繼續(xù)”,就是特征語(yǔ)義塊“繼續(xù)開展合作”的上裝,被分離到語(yǔ)義標(biāo)志符之前。

例如:中國(guó)市場(chǎng)的很多做法還不能與國(guó)際市場(chǎng)接軌。(R4J)

句中,特征語(yǔ)義塊R 的上裝“還不能”就被分離到RB 內(nèi)部的語(yǔ)義標(biāo)志符“與”之前。R 應(yīng)當(dāng)是“還不能接軌”。

1.2 擴(kuò)展雙向關(guān)系句

在以具有雙向特征基元概念為關(guān)系形成的關(guān)系句中,除了雙向關(guān)系句,還有擴(kuò)展雙向關(guān)系句。擴(kuò)展雙向關(guān)系句比基本關(guān)系句多了關(guān)系雙方的共同表現(xiàn)RC,RC 一定塊擴(kuò)。擴(kuò)展雙向關(guān)系句的句類表示式為:Rm0J=RB+R+RC。以上一節(jié)的幾個(gè)句子為例,其加上關(guān)系雙方的共同表現(xiàn)RC 的擴(kuò)展雙向關(guān)系句如下,其中加下劃線的部分是RC。

西藏和平解放以來,很多著名的宗教界人士同中國(guó)共產(chǎn)黨政府合作共事,參政議政。(R304J)

挪威奧斯陸大學(xué)人權(quán)研究所和越南胡志明政治學(xué)院人權(quán)研究中心合作,翻譯出版了人權(quán)著作。(R304J)

甲乙雙方共同協(xié)商決定停車費(fèi)的收取標(biāo)準(zhǔn)。(R704J)

2010 年以來,中國(guó)即將與聯(lián)合國(guó)兒童基金會(huì)駐華代表處開展合作,舉辦《兒童權(quán)利公約》宣傳、培訓(xùn)活動(dòng)。(R304J)

由于RC 是關(guān)系雙方的共同表現(xiàn)并且一定塊擴(kuò),所以RC 的格式是!31J 省略格式,省略的JK1 就是擴(kuò)展關(guān)系句中的RB1 和RB2。

例如:中國(guó)與外國(guó)企業(yè)合作生產(chǎn)了MD-82、MD-90等大型客機(jī)。(R304J)

句中,中國(guó)與外國(guó)企業(yè)是關(guān)系雙方RB,關(guān)系雙方的共同表現(xiàn)RC 是生產(chǎn)了MD-82、MD-90 等大型客機(jī),RC 塊擴(kuò)且省略了JK1,就是RB。

除此之外,關(guān)系句的關(guān)系雙方RB1 和RB2 基本都是pp 類的概念,并且大部分關(guān)系雙方都不含C。

例如:1987 年,中國(guó)同聯(lián)合國(guó)合作在北京召開了“世界裁軍運(yùn)動(dòng)”區(qū)域討論會(huì)。(R304J)

在擴(kuò)展雙向關(guān)系句中還有一個(gè)特殊現(xiàn)象,由于特征語(yǔ)義塊R 之后的關(guān)系雙方的共同表現(xiàn)RC,并且RC是!31J 的省略格式,省略了JK1,因此R 之后一般直接跟RC 的E,從而形成了動(dòng)詞連見的情況。

例如:中國(guó)和日本于1986 至1992 年合作調(diào)查黑潮出現(xiàn)的情況。(R304J)

在這句中,特征語(yǔ)義塊R“合作”和RC 的E 即“調(diào)查”形成的動(dòng)詞連見。但是這樣的兩個(gè)動(dòng)詞不屬于同一層次的動(dòng)詞,它們是廣義上的因果關(guān)系,因此前面的動(dòng)詞是Ep,而后面的動(dòng)詞是Er。

2 機(jī)器翻譯改進(jìn)方法及實(shí)驗(yàn)

本文從雙語(yǔ)語(yǔ)料庫(kù)中選取了25 條雙向關(guān)系句和40 條擴(kuò)展雙向關(guān)系句,對(duì)國(guó)內(nèi)評(píng)估較高的在線機(jī)器翻譯網(wǎng)站的漢譯英進(jìn)行了測(cè)評(píng),根據(jù)測(cè)評(píng)的結(jié)果對(duì)兩種句類的翻譯進(jìn)行改進(jìn),主要從改動(dòng)翻譯的原文輸入入手,再將輸出修改為符合語(yǔ)法規(guī)范的句子。改進(jìn)算法如下:

算法 擴(kuò)展雙向關(guān)系句翻譯

(1)定位該句語(yǔ)義標(biāo)志符R 的位置,Rm0J=RB+R+RC;

(2)定位RB 內(nèi)部的語(yǔ)義標(biāo)志符,若有則將RB1和RB2 分開,若沒有顯含語(yǔ)義標(biāo)志符則直接翻譯;

(3)補(bǔ)充RC 省略的E,翻譯RC;

(4)將(2)和(4)連接。

改進(jìn)后的翻譯結(jié)果統(tǒng)計(jì)顯示,25 條雙向關(guān)系句改進(jìn)前的正確率為88%,改進(jìn)后為92%,40 條擴(kuò)展雙向關(guān)系句改進(jìn)前的正確率為70%,改進(jìn)后為82.5%。幾個(gè)典型例句舉例如下:

①1987 年,中國(guó)作為東道主同聯(lián)合國(guó)合作在北京召開了“世界裁軍運(yùn)動(dòng)”區(qū)域討論會(huì)。

原譯:In 1987, China hosted a regional seminar on the "World Disarmament Movement" in Beijing as a host country in cooperation with the United Nations.

改進(jìn):In 1987, China in cooperation with the United Nations, hosted the Regional Symposium on World Disarmament Campaign in Beijing.

②幾名教練還分頭同隊(duì)員們談心。

原譯:Several coaches also talked with the players.

改進(jìn):Several coaches also spoke to the players separately.

③中國(guó)政府還同有關(guān)國(guó)際組織密切合作,組織有關(guān)人員出國(guó)考察學(xué)習(xí)。

原譯:The Chinese government has also worked closely with relevant international organizations to organize relevant personnel to study abroad.

改進(jìn):Chinese government has in close cooperation with related international organizations, sent people abroad to study.

從改進(jìn)結(jié)果看,由于雙向關(guān)系句多是簡(jiǎn)單句,因此原譯文正確率就相對(duì)較高,改進(jìn)效果不明顯,而擴(kuò)展雙向關(guān)系句由于涉及到省略格式的RC,因此改進(jìn)效果較好。

3 結(jié)語(yǔ)

本文以具有雙向特征基元概念為關(guān)系的關(guān)系句為內(nèi)容,分析了雙向關(guān)系句和擴(kuò)展雙向關(guān)系句,并根據(jù)分析要點(diǎn)和機(jī)器翻譯測(cè)評(píng)結(jié)果,對(duì)這兩類句式的機(jī)器翻譯進(jìn)行改進(jìn)。實(shí)驗(yàn)結(jié)果顯示,在對(duì)這兩類句式進(jìn)行分析后在分部分進(jìn)行翻譯的效果,比直接進(jìn)行翻譯的效果要好,并且對(duì)更為復(fù)雜的擴(kuò)展雙向關(guān)系句翻譯提升效果更為明顯。

猜你喜歡
省略雙向語(yǔ)義
真實(shí)場(chǎng)景水下語(yǔ)義分割方法及數(shù)據(jù)集
基于雙向特征融合的交通標(biāo)志識(shí)別
降低寄遞成本需雙向發(fā)力
“省略”講解與訓(xùn)練
關(guān)于單、雙向板梁板用鋼量的對(duì)比分析
完善刑事證據(jù)雙向開示制度的思考
“吃+NP”的語(yǔ)義生成機(jī)制研究
中間的省略
漢語(yǔ)依憑介詞的語(yǔ)義范疇
省略
阳原县| 宣城市| 仲巴县| 宕昌县| 江川县| 富锦市| 阳西县| 高平市| 仁寿县| 潼关县| 黄石市| 贡觉县| 绥德县| 临西县| 锡林浩特市| 什邡市| 连州市| 丹阳市| 无锡市| 二连浩特市| 土默特左旗| 杭州市| 沙田区| 淅川县| 湾仔区| 大渡口区| 于都县| 乐亭县| 长宁县| 诸暨市| 都匀市| 富川| 济阳县| 邵阳市| 文山县| 乌兰浩特市| 开平市| 通城县| 义乌市| 黄骅市| 海原县|