畢玉德
(中國(guó)人民解放軍外國(guó)語學(xué)院,河南 洛陽 471003)
自然語言處理的應(yīng)用目標(biāo)是使人與計(jì)算機(jī)之間用自然語言進(jìn)行交流。具體說,是建立各種處理自然語言的計(jì)算機(jī)應(yīng)用軟件系統(tǒng),例如,機(jī)器翻譯、自然語言理解、語音自動(dòng)識(shí)別與合成、文字自動(dòng)識(shí)別、計(jì)算機(jī)輔助教學(xué)、信息檢索、文本自動(dòng)分類、自動(dòng)文摘,文本信息提取、互聯(lián)網(wǎng)上的智能搜索,以及各種電子詞典和術(shù)語數(shù)據(jù)庫。
朝鮮語是中、朝、韓三國(guó)使用的跨境語言,在中國(guó)和朝鮮稱作朝鮮語,在韓國(guó)稱作韓國(guó)語。三者在語音、詞匯和語法方面都存在一定的差異。對(duì)于朝鮮語的自然語言處理,中、朝、韓三國(guó)都分別進(jìn)行了研究,但進(jìn)度不一。筆者根據(jù)相關(guān)研究資料總結(jié)了韓國(guó)、朝鮮及中國(guó)在朝鮮語自然語言處理基礎(chǔ)研究和應(yīng)用研究方面的成果,以及韓國(guó)各大重要自然語言處理實(shí)驗(yàn)室的研究成果和重要課題;總結(jié)了朝鮮自然語言處理研究方面的基礎(chǔ)語言學(xué)理論探索;最后總結(jié)我國(guó)在朝鮮語自然語言處理領(lǐng)域所取得的一些進(jìn)展,并結(jié)合韓國(guó)、朝鮮所取得的研究成果,展望了我國(guó)朝鮮語自然語言處理研究的發(fā)展前景。
多年來韓國(guó)自然語言處理發(fā)展的特點(diǎn)是,進(jìn)行了一些基礎(chǔ)理論研究,應(yīng)用型研究和實(shí)用系統(tǒng)開發(fā)投入相對(duì)較多,也取得了一些成果。研究力量比較集中的領(lǐng)域有: 文本信息檢索、文獻(xiàn)自動(dòng)分類、自動(dòng)文摘、語音自動(dòng)識(shí)別與合成、機(jī)器翻譯,還有文本信息提取和過濾。另外,語言資源的建設(shè)和基于語料庫的語言分析方法也受到了格外關(guān)注,取得了比較快的進(jìn)展[1]。
在面向自然語言處理應(yīng)用的語言學(xué)研究方面,韓國(guó)方面的研究主要集中在形態(tài)素分析、詞性標(biāo)注、句法分析和語義分析等方面。形態(tài)素分析的研究起步較早,高麗大學(xué)自然語言處理研究實(shí)驗(yàn)室[2]通過構(gòu)建詞綴詞典和制定詞綴規(guī)則體制來進(jìn)行形態(tài)素分析,構(gòu)建了韓國(guó)語形態(tài)分析模型。隨著網(wǎng)絡(luò)的發(fā)展,開發(fā)了服務(wù)于網(wǎng)絡(luò)搜索引擎的形態(tài)素分析器和加權(quán)模塊,實(shí)現(xiàn)了網(wǎng)絡(luò)環(huán)境下的形態(tài)素分析。延世大學(xué)開發(fā)了國(guó)語形態(tài)素分析器和詞性標(biāo)注器[3]。梨花女子大學(xué)開發(fā)了形態(tài)素分析器MACH1.0,它的分析速度是一般形態(tài)素分析器的10倍以上[4]。另外,釜山大學(xué)和浦項(xiàng)工業(yè)大學(xué)等許多機(jī)構(gòu)和學(xué)者都進(jìn)行過相關(guān)研究。
句法分析方面,韓國(guó)主要在基本句識(shí)別、組塊識(shí)別、依存分析、短語結(jié)構(gòu)分析等方面進(jìn)行了大量研究,早期的研究都是以句子為單位,組塊識(shí)別和短語結(jié)構(gòu)分析是近年來關(guān)注的焦點(diǎn),韓國(guó)語名詞組塊的研究以基本名詞短語的相關(guān)研究為主。
語義分析方面,韓國(guó)主要在詞匯消歧、語義角色標(biāo)注、命名實(shí)體識(shí)別、傾向性分析等方面開展研究,對(duì)語義的分析往往要借助于語義詞典和概念詞典,其中高麗大學(xué)自然語言處理研究實(shí)驗(yàn)室構(gòu)建了韓國(guó)語K -概念網(wǎng)絡(luò),這是一個(gè)面向韓國(guó)語信息處理提出來的語義和概念體系,該理論建立了一個(gè)計(jì)算機(jī)可操作的符號(hào)體系。
自1998年起,韓國(guó)文化觀光部同國(guó)立國(guó)語研究院及相關(guān)學(xué)界自1998年起推進(jìn)的韓國(guó)語信息化項(xiàng)目——《21世紀(jì)世宗計(jì)劃》是《韓國(guó)語信息化中長(zhǎng)期計(jì)劃》的環(huán)節(jié)之一,其主要目的是奠定語言信息文化的基礎(chǔ)并構(gòu)建相關(guān)資源,建設(shè)以韓國(guó)語言和文字為基礎(chǔ)的信息化社會(huì),提升自身在國(guó)家間信息化競(jìng)爭(zhēng)中的主導(dǎo)權(quán),自主體現(xiàn)韓國(guó)語的先進(jìn)信息文化。該計(jì)劃分為韓國(guó)語信息基礎(chǔ)構(gòu)建和信息化環(huán)境建設(shè)兩個(gè)部分。其中韓國(guó)語信息基礎(chǔ)構(gòu)建項(xiàng)目分為基礎(chǔ)語料庫資源建設(shè)、特殊語料庫資源建設(shè)、電子詞典開發(fā)、民族語言信息化、專業(yè)術(shù)語標(biāo)準(zhǔn)化等內(nèi)容;韓國(guó)語信息化環(huán)境建設(shè)分為非標(biāo)準(zhǔn)化文字登入、信息化人才培養(yǎng)、字庫開發(fā)普及等內(nèi)容。經(jīng)過10年的建設(shè),基本達(dá)到了預(yù)期目標(biāo),大大夯實(shí)了韓國(guó)語言信息化的基礎(chǔ),為進(jìn)一步的深化研究創(chuàng)造了良好條件[5]。
另外,隨著本體研究的升溫,很多單位開始了這方面的研究,其中韓國(guó)科學(xué)技術(shù)院(KAIST)專業(yè)術(shù)語語言工學(xué)研究中心(KORTERM,目前該機(jī)構(gòu)更名為“語義Web技術(shù)研究中心”)在構(gòu)建大規(guī)模通用雙語詞典和專業(yè)領(lǐng)域術(shù)語雙語詞典的基礎(chǔ)上,構(gòu)建了韓—日—中多語種概念詞網(wǎng)(CoreNet)[6];蔚山大學(xué)自然語言處理研究室[7]、釜山大學(xué)韓國(guó)語信息處理研究室[8]等多家單位正在構(gòu)建韓國(guó)語詞網(wǎng)。目前浦項(xiàng)工業(yè)大學(xué)KLE實(shí)驗(yàn)室[9]、語義網(wǎng)絡(luò)研究中心和KAIST聯(lián)手展開的“國(guó)家信息本體結(jié)構(gòu)技術(shù)發(fā)展計(jì)劃”是目前有關(guān)本體研究的重要在研項(xiàng)目。
根據(jù)學(xué)生思維發(fā)展特點(diǎn),初中生邏輯推理能力相對(duì)較弱,教師可以設(shè)計(jì)真實(shí)具體的教學(xué)情境,提高學(xué)生參與學(xué)習(xí)的興趣,鍛煉學(xué)生通過比較歸納、綜合分析等思維能力,使學(xué)生將所學(xué)知識(shí)運(yùn)用于日常情境中。教師要提高學(xué)生主體地位,多設(shè)置開放性問題,以便更好地了解學(xué)生思維過程,在因材施教的同時(shí)也能鍛煉學(xué)生發(fā)散思維。初中學(xué)生的年齡特點(diǎn)決定了他們的科學(xué)思維仍然較弱。因此,在平時(shí)教學(xué)過程中,教師要考慮到學(xué)生思維發(fā)展的特點(diǎn),既要為學(xué)生發(fā)展演繹推理、批判性等較高水平的思維能力做準(zhǔn)備,也要基于客觀條件保持學(xué)生學(xué)習(xí)自信。
在韓國(guó)語信息處理技術(shù)的支撐下,各種應(yīng)用性研究和實(shí)用系統(tǒng)開發(fā)得到了迅速的發(fā)展。
機(jī)器翻譯方面,韓國(guó)在該領(lǐng)域的研究始于20世紀(jì)80年代,最初的研究集中在韓日機(jī)器翻譯方向。20世紀(jì)80年代中期,首爾大學(xué)開發(fā)出了韓英機(jī)器翻譯系統(tǒng)KEMTS(Korean-English Machine Translation System),從此,韓英機(jī)器翻譯就成為了韓國(guó)語信息處理領(lǐng)域的主要研究方向。1988年開始,韓國(guó)系統(tǒng)工學(xué)研究所和韓國(guó)科學(xué)技術(shù)院人工智能研究中心聯(lián)合開發(fā)了MATES/EK(Machine-Aided Translation Environment for English-to-Korean)系統(tǒng),該系統(tǒng)采用了間接轉(zhuǎn)化的方法作為系統(tǒng)構(gòu)建的主要方法,于1992年完成[10]。此外,1991年韓國(guó)科學(xué)技術(shù)院電子系與日本NEC共同開發(fā)了英韓以及日韓機(jī)器翻譯系統(tǒng)。與此同時(shí),首爾大學(xué)計(jì)算機(jī)系也與IBM展開合作,共同開發(fā)了英韓機(jī)器翻譯系統(tǒng),該系統(tǒng)的測(cè)試版于1991年完成。目前很多韓國(guó)研究機(jī)構(gòu)都在進(jìn)行相關(guān)方面的研究。此后,韓國(guó)知識(shí)產(chǎn)權(quán)局(KIPO)推出了比較成熟的專利文獻(xiàn)機(jī)器翻譯工具K-PION(韓國(guó)專利信息在線服務(wù)系統(tǒng))[11],韓國(guó)電子通信研究所(ETRI)的評(píng)估結(jié)果顯示,該工具的整體準(zhǔn)確率達(dá)到了80%以上。目前,韓國(guó)在該領(lǐng)域的研究和開發(fā)主要有ETRI投資研發(fā)的韓英中日多國(guó)語自動(dòng)翻譯系統(tǒng)[12]和浦項(xiàng)工業(yè)大學(xué)研制的韓中/中韓機(jī)器翻譯系統(tǒng)。
韓國(guó)語信息處理領(lǐng)域的另外一個(gè)熱點(diǎn)就是語音識(shí)別,其關(guān)注點(diǎn)主要集中在連續(xù)語音識(shí)別、電話語音識(shí)別、雜音處理技術(shù)及核心詞摘取技術(shù)等方面。韓國(guó)科學(xué)技術(shù)院語音處理實(shí)驗(yàn)室[13]研制的語音識(shí)別系統(tǒng)對(duì)韓國(guó)語語音的識(shí)別率達(dá)到96.7%,但單詞的規(guī)模限制在3 064以內(nèi)。由Sensory公司研制的IC RSC-164系統(tǒng)是韓國(guó)國(guó)內(nèi)識(shí)別率最高的語音識(shí)別系統(tǒng),該系統(tǒng)可以用于識(shí)別非特定話者的語音或特定話者的語音、合成語音及音樂等方面[14]。目前高麗大學(xué)自然語言處理實(shí)驗(yàn)室也在進(jìn)行語音識(shí)別方面的相關(guān)研究,旨在開發(fā)出適用于移動(dòng)環(huán)境的韓國(guó)語語音技術(shù)。
文字識(shí)別同樣也備受研究者的關(guān)注。韓國(guó)文字的識(shí)別困難主要可以概括為以下四個(gè)方面: (1)多種文字混用;(2)字形相似;(3)字體、筆跡繁多;(4)分詞本身難度較大。韓國(guó)科學(xué)技術(shù)院人工智能研究室針對(duì)如何提高文字識(shí)別系統(tǒng)的準(zhǔn)確率問題,提出了結(jié)合上下文信息進(jìn)行文字識(shí)別的可能性篩選方法,并構(gòu)建了以N-gram為基礎(chǔ)的語言模型。通過實(shí)驗(yàn),得出了可供選擇的拆分語素越多、識(shí)別率越高的結(jié)論。另外,針對(duì)印刷體的文字識(shí)別系統(tǒng)OCR已經(jīng)投入市場(chǎng),但市場(chǎng)滿意度偏低。目前屬于離線識(shí)別體系的文字識(shí)別系統(tǒng)正在研制中。
由于眾所周知的原因,我們很難獲取朝鮮在自然語言處理研究方面的第一手資料。筆者的資料主要源于在中國(guó)召開的中朝韓三國(guó)“Korean計(jì)算機(jī)處理國(guó)際學(xué)術(shù)會(huì)議”論文集(1994~2004年)[15]以及韓國(guó)學(xué)者的一些介紹。朝鮮的主要研究機(jī)構(gòu)有朝鮮社會(huì)科學(xué)院(KCC)、平壤計(jì)算機(jī)中心[16]、金日成綜合大學(xué)等單位。
1984年金日成訪問歐洲之后,朝鮮才開始重視語言信息處理技術(shù)。1988年,朝鮮啟動(dòng)科學(xué)技術(shù)研發(fā)3年計(jì)劃,開始向信息科學(xué)和信息產(chǎn)業(yè)領(lǐng)域注入資金并推動(dòng)相關(guān)建設(shè)。目前語言信息處理已經(jīng)成為朝鮮的“朝陽產(chǎn)業(yè)”,非常受政府重視。朝文信息處理的目標(biāo)是在信息化時(shí)代的大背景下實(shí)現(xiàn)朝鮮語的計(jì)算機(jī)處理。
基礎(chǔ)研究方面,朝鮮對(duì)于自然語言處理(計(jì)算語言學(xué))的研究主要集中在面向自然語言處理的語言學(xué)研究方面,研究?jī)?nèi)容主要包括朝文文字的構(gòu)成特點(diǎn)和形態(tài)特征、句法結(jié)構(gòu)特點(diǎn)和構(gòu)造規(guī)則及語義表達(dá)形式等,同時(shí)也對(duì)機(jī)器翻譯、信息檢索等技術(shù)有所涉及[17-18]。
語言資源的建設(shè)方面主要在語料庫建設(shè)方面有一定的進(jìn)展。近年來朝鮮的語料庫語言學(xué)發(fā)展迅速,并且依據(jù)相關(guān)理論知識(shí)構(gòu)建了生語料庫、標(biāo)記語料庫,進(jìn)而通過語料庫獲得形態(tài)知識(shí)、詞性知識(shí)、句法知識(shí)和語義知識(shí)。此外,朝鮮也在積極建設(shè)各種機(jī)器詞典,逐步完善基礎(chǔ)資源建設(shè)[19]。
應(yīng)用研究方面,在文字處理和人工智能的軟件技術(shù)上具有一定的水平,在智能檢索、自然語言處理系統(tǒng)、醫(yī)療信息系統(tǒng)的開發(fā)等方面成績(jī)突出。1994年朝鮮開發(fā)的“昌德文字處理器”與韓國(guó)的訓(xùn)民正音文字處理器相比毫不遜色,其開發(fā)的多語種文字編輯器可用于朝鮮語、英語、俄語和葡萄牙語的編輯。在2000年朝鮮電腦中心峰會(huì)上,朝鮮計(jì)算機(jī)中心開發(fā)的語音識(shí)別系統(tǒng)已具有很高的準(zhǔn)確率。朝鮮科學(xué)院開發(fā)了“鷹”朝鮮文字自動(dòng)識(shí)別系統(tǒng)和“彩虹”計(jì)算機(jī)輔助朝英翻譯系統(tǒng);平壤信息中心開發(fā)了“檀君”朝鮮語預(yù)處理系統(tǒng)、識(shí)別率高達(dá)95%的“Insik”朝鮮語自動(dòng)識(shí)別系統(tǒng)以及“Tamjing”朝日機(jī)器翻譯系統(tǒng)[20-21]。
為推動(dòng)我國(guó)朝鮮語信息處理技術(shù)的發(fā)展,我國(guó)一直致力于朝鮮語信息技術(shù)標(biāo)準(zhǔn)化的研究工作。1977年,國(guó)務(wù)院決定成立東三省朝鮮語文工作協(xié)調(diào)小組(三協(xié)),統(tǒng)一管理中國(guó)朝鮮語文工作,在“三協(xié)”的指導(dǎo)下,我國(guó)制定了朝鮮語規(guī)范統(tǒng)一方案,這為朝鮮語計(jì)算機(jī)輸入標(biāo)準(zhǔn)化提供了保障。1989年,延邊電子信息中心設(shè)計(jì)完成了國(guó)家標(biāo)準(zhǔn)《信息交換用朝鮮文字編碼字符集》的編寫任務(wù)。此外,中國(guó)朝鮮語信息學(xué)會(huì)還同朝鮮及韓國(guó)相關(guān)機(jī)構(gòu)合作完成了《基于ISO2382標(biāo)準(zhǔn)的英朝韓日信息技術(shù)術(shù)語詞典》[22]的編纂。朝鮮語作為一種跨境語言,中國(guó)朝鮮語、朝鮮的朝鮮語、韓國(guó)的韓國(guó)語三者之間編碼各不相同,韓國(guó)在2011年6月提出三套輸入編碼方案,朝鮮在2009年也發(fā)布了朝鮮語數(shù)字鍵盤布局標(biāo)準(zhǔn),與韓國(guó)提出三種方案差異也很大。針對(duì)朝鮮、韓國(guó)制定的兩個(gè)標(biāo)準(zhǔn)4種布局方案,經(jīng)我國(guó)朝鮮文信息技術(shù)專家分析后認(rèn)為,無論是從朝鮮語正音正字法原則,還是從朝鮮語基本語素角度看,4種方案均存在較大缺陷。目前,我國(guó)正根據(jù)國(guó)內(nèi)朝鮮語正音正字法及相關(guān)朝鮮語言文字規(guī)范制定科學(xué)合理的朝鮮文信息技術(shù)標(biāo)準(zhǔn)。
語言資源主要指語料庫和語言知識(shí)庫。關(guān)于語言資源建設(shè)的基礎(chǔ)研究包括語料的標(biāo)注、語料的分析和處理,以及用于語言資源建設(shè)的各種字表、詞表和規(guī)范、標(biāo)準(zhǔn)。
語料庫方面,延邊大學(xué)朝鮮韓國(guó)學(xué)院在教育部重點(diǎn)項(xiàng)目支持下完成了“中國(guó)朝鮮語語料庫”的建設(shè),該語料庫依據(jù)通用性、描述性、實(shí)用性和抽樣性等4個(gè)原則,分別構(gòu)建了3個(gè)庫,即文本語料庫,平行語料庫和病句、中介語語料庫。在語料庫加工和規(guī)范方面,首先進(jìn)行了總體規(guī)劃,制定了統(tǒng)一的數(shù)據(jù)格式和編碼標(biāo)準(zhǔn),并根據(jù)中國(guó)朝鮮語的特點(diǎn)開發(fā)了詞性自動(dòng)標(biāo)注系統(tǒng),實(shí)現(xiàn)了文本語料庫的詞性標(biāo)注加工。同時(shí),還借助中國(guó)朝鮮族的地域優(yōu)勢(shì),初步構(gòu)建了“中—朝—韓”三國(guó)的語料庫資源共享機(jī)制,集成了朝鮮、韓國(guó)語料庫及相關(guān)工具??傮w來看,該語料庫設(shè)計(jì)規(guī)范,標(biāo)準(zhǔn)統(tǒng)一,建設(shè)規(guī)模超過了預(yù)定目標(biāo),是我國(guó)第一個(gè)朝鮮語語料庫。
筆者所在單位朝鮮語信息處理研究團(tuán)隊(duì)長(zhǎng)期以來依靠語言學(xué)優(yōu)勢(shì),在國(guó)家社科基金、國(guó)家自然科學(xué)基金以及本系統(tǒng)基金項(xiàng)目的支持下,面向語言信息處理,深入挖掘語言內(nèi)在規(guī)律,經(jīng)過3個(gè)階段的努力設(shè)計(jì)完成了“朝鮮語動(dòng)詞句法語義層次框架”,并構(gòu)建了規(guī)模達(dá)5 000個(gè)朝鮮語形態(tài)動(dòng)詞(19 200余條句法語義項(xiàng))的“現(xiàn)代朝鮮語動(dòng)詞句法語義信息詞典”。該框架以動(dòng)詞為核心整合了句法、語義等信息,實(shí)現(xiàn)了句法語義信息的一體化描寫[23-24]。目前以此框架理論為基礎(chǔ)的語義角色標(biāo)注[25]、朝漢機(jī)器(輔助)翻譯研究正在有計(jì)劃地展開。另外,還在韓國(guó)科學(xué)技術(shù)院術(shù)語工學(xué)研究中心與北京大學(xué)計(jì)算語言學(xué)研究所共同研究的國(guó)際合作項(xiàng)目“英中韓三國(guó)語詞匯語義網(wǎng)的構(gòu)建”基礎(chǔ)上,充分考慮到構(gòu)建多語種詞匯語義網(wǎng)的難度,利用CCD(中文概念詞典)以及英韓、漢韓等雙語詞典資源,采用半自動(dòng)方式構(gòu)建了“基于WordNet的英中韓多語種詞匯語義網(wǎng)”[26]。在第一次匹配基礎(chǔ)上,通過專家干預(yù)方式實(shí)現(xiàn)了中英韓多語種詞匯語義網(wǎng)中韓語名詞概念的精確匹配,匹配度達(dá)到了95.6%,共計(jì)填充了121 032個(gè)韓語詞語。該語義網(wǎng)的構(gòu)建可以大大提高多語種信息檢索、文本分類及翻譯的精確度。
東北大學(xué)自然語言處理實(shí)驗(yàn)室[27]針對(duì)朝鮮語信息處理做了不少研究,具體有: 中韓多國(guó)語機(jī)器翻譯系統(tǒng)(與韓國(guó)浦項(xiàng)工業(yè)大學(xué)合作,1995~2000年)、漢韓機(jī)器翻譯系統(tǒng)(科學(xué)技術(shù)部,國(guó)家外字[2000]0016)、中英韓多國(guó)語機(jī)譯系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)等。2008年筆者所在朝鮮語信息處理研究團(tuán)隊(duì)在完成大規(guī)模朝漢雙語詞典的基礎(chǔ)上,基于實(shí)例、片段翻譯以及翻譯記憶技術(shù)開發(fā)了面向領(lǐng)域的朝漢輔助翻譯系統(tǒng)。
這些年來,我國(guó)在朝鮮語自然語言處理研究方面還屬于發(fā)展階段,相關(guān)研究相對(duì)于韓國(guó)乃至朝鮮還比較滯后。目前朝鮮語語言資源建設(shè)方面還沒有統(tǒng)一的規(guī)劃和布局,沒有相關(guān)的系列標(biāo)準(zhǔn),使得各家的資源很難融合,這就限制了相關(guān)研究的進(jìn)一步深化。目前就朝鮮語信息處理領(lǐng)域來說,韓國(guó)的許多研究都要比中國(guó)領(lǐng)先,從知識(shí)產(chǎn)權(quán)及奪取信息優(yōu)勢(shì)的角度來看,中國(guó)對(duì)于朝鮮語信息化的建設(shè)還未給予足夠的重視,其研究深度和廣度還遠(yuǎn)遠(yuǎn)不夠,并且從事相關(guān)研究的科研人員還不是太多。從自主創(chuàng)新的角度來看,掌握相關(guān)信息技術(shù)的自主知識(shí)產(chǎn)權(quán)不僅符合我們國(guó)家未來的政治軍事戰(zhàn)略,并且利用這些技術(shù)可以有效地推動(dòng)相關(guān)的產(chǎn)業(yè)發(fā)展,進(jìn)而創(chuàng)造出巨大的商業(yè)利益。因此,我們有必要加大對(duì)這方面的投入,大力推進(jìn)我國(guó)朝鮮語信息處理建設(shè),爭(zhēng)取用最短的時(shí)間達(dá)到并趕超世界水平。
[1] 韓國(guó)語言工學(xué)學(xué)會(huì).韓文及韓國(guó)語信息處理學(xué)術(shù)會(huì)議論文集[C],1988-2010.
[2] 韓國(guó)高麗大學(xué)自然語言處理實(shí)驗(yàn)室[EB/OL].http://nlp.korea.ac.kr.
[3] 延世大學(xué)自然語言處理研究室[EB/OL].http://nlp.yu.ac.kr.
[4] 梨花女子大學(xué)人工智能實(shí)驗(yàn)室[EB/OL].http://ai.ewha.ac.kr
[5] 韓國(guó)21世紀(jì)世宗計(jì)劃[EB/OL].http://www.sejong.or.kr.
[6] 韓國(guó)科學(xué)技術(shù)院(KAIST)語義網(wǎng)研究中心[EB/OL].http://semanticweb.kaist.ac.kr/home/index.php/Home.
[7] 韓國(guó)蔚山大學(xué)自然語言處理研究室[EB/OL].http://nlplab.ulsan.ac.kr.
[8] 韓國(guó)釜山大學(xué)韓國(guó)語信息處理研究室[EB/OL].http://klpl.re.pusan.ac.kr/default.asp.
[9] 韓國(guó)浦項(xiàng)工業(yè)大學(xué)知識(shí)與語言工程實(shí)驗(yàn)室[EB/OL].http://kle.postech.ac.kr.
[10] 韓國(guó)系統(tǒng)工學(xué)研究所.英漢漢英文本自動(dòng)翻譯技術(shù)開發(fā)[C].韓國(guó)信息通信部,1996.
[11] 韓國(guó)專利信息在線服務(wù)系統(tǒng)[DB/OL].http://k-pion.kipo.go.kr.
[12] 自動(dòng)翻譯技術(shù)研究[DB/OL]. www.etri.re.kr/etri/res/res_0102020202.etri.
[13] 韓國(guó)科學(xué)技術(shù)院語音處理實(shí)驗(yàn)室[EB/OL].http://vilab.kaist.ac.kr.
[14] 語音識(shí)別IC(韓國(guó)電子通訊技術(shù)情報(bào))[EB/OL].http://www.ktechno.co.kr/semicon/sensory.html.
[15] 中國(guó)朝鮮語信息學(xué)會(huì),朝鮮技術(shù)聯(lián)盟,韓國(guó)語信息學(xué)會(huì).KOREAN計(jì)算機(jī)處理國(guó)際學(xué)術(shù)會(huì)議論文集[C],1994-2004.
[16] 朝鮮計(jì)算機(jī)中心[EB/OL].http://jamiwon.tistory.com/134.
[17] 權(quán)鐘成.朝鮮語信息處理[M] .朝鮮平壤: 科學(xué)百科詞典綜合出版社,1994.
[18] 裴光熙,樸榮鈞.計(jì)算機(jī)語言自動(dòng)翻譯[M].朝鮮平壤: 科學(xué)百科詞典出版社,2003.
[19] 朝鮮金日成大學(xué)語言信息學(xué)研究團(tuán)隊(duì).信息時(shí)代與語言學(xué)[J],2001.
[20] 金炳善.北朝鮮的國(guó)語信息化[DB/OL]. http://www.hangeulmuseum.org/sub/future/unification/info_north01.jsp.
[21] 樸贊謨.北朝鮮尖端技術(shù)動(dòng)向[DB/OL].http://www.kps.or.kr/~pht/8-9/990907.html.
[22] 中國(guó)朝鮮語信息學(xué)會(huì),朝鮮教育省計(jì)算機(jī)教育中心,韓國(guó)語信息學(xué)會(huì).基于ISO2382標(biāo)準(zhǔn)的英朝韓日信息技術(shù)術(shù)語詞典[Z],2002.
[23] 畢玉德,閻艷萍.知識(shí)表示中的句法語義一體化描寫[J].民族語文,2010,(4): 13-19.
[24] 畢玉德.面向語言信息處理的朝鮮語知識(shí)庫研究[J].中文信息學(xué)報(bào),2005, 19(03): 28-33.
[25] 畢玉德,陳潔,呂春燕.朝鮮語句子語義角色標(biāo)注研究[C]//孫茂松,陳群秀.中國(guó)計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009),2009: 217-222.
[26] 畢玉德,閻艷萍.一種基于WordNet的多語種詞匯語義網(wǎng)半自動(dòng)構(gòu)建方法[J].解放軍外國(guó)語學(xué)院學(xué)報(bào),2008,31(5):55-59.
[27] 東北大學(xué)自然語言處理實(shí)驗(yàn)室[EB/OL].http://www.nlplab.com/groups/MT.htm.