祁琪 張克亮
摘要:現(xiàn)代術(shù)語學(xué)的奠基人維斯特(E. Wüster)在其專著《普通術(shù)語學(xué)和術(shù)語詞典編纂學(xué)導(dǎo)論》(Einführung in die Allgemeine Terminologie und Terminologische Lexikographie)[1]中定義“術(shù)語是一個(gè)專業(yè)領(lǐng)域的概念指稱系統(tǒng),它包括了所有的專業(yè)表達(dá),這些表達(dá)是一般的、常見的”。傳統(tǒng)的術(shù)語學(xué)研究局限于對(duì)詞匯的研究,然而隨著計(jì)算機(jī)技術(shù)的發(fā)展,對(duì)術(shù)語的抽取和標(biāo)注更多地來自真實(shí)文本,特別是更加依賴于知識(shí)庫的構(gòu)建。本研究重點(diǎn)在于以越南為例構(gòu)建南海領(lǐng)域漢英本體知識(shí)庫,對(duì)領(lǐng)域相關(guān)術(shù)語及術(shù)語間的關(guān)系進(jìn)行描述,以實(shí)現(xiàn)對(duì)南海領(lǐng)域知識(shí)的系統(tǒng)組織,更好地服務(wù)領(lǐng)域術(shù)語研究和基于知識(shí)本體的術(shù)語翻譯。
關(guān)鍵詞:術(shù)語,知識(shí)本體,知識(shí)庫構(gòu)建,南海領(lǐng)域
中圖分類號(hào):H059;H083文獻(xiàn)標(biāo)識(shí)碼:ADOI:10.3969/j.issn.1673-8578.2018.04.004
Abstract: E. Wüster, the founder of modern terminology, expounded comprehensively the basic theories of terminology in his treatise Einführung in die Allgemeine Terminologie und Terminologische Lexikographie. The traditional study of terminology was confined to the study of lexicons,but as the development of computer technologies, the extraction and annotation of terms are more and more depended on the real texts, especially the knowledge base. An ontology knowledge base on South China Sea was built to describe the related terms and the relations between terms in this filed, which could work for the study of terminology and terminology translation in this field.
Keywords: terminology, knowledge ontology, construction of knowledge base, South China Sea
引言
術(shù)語學(xué)是一門更新速度很快的綜合學(xué)科,其研究范圍逐漸超越了語言學(xué)范疇,更多地轉(zhuǎn)向術(shù)語的社會(huì)功能、術(shù)語與科技結(jié)合、術(shù)語的形式與內(nèi)涵分析、術(shù)語翻譯等跨學(xué)科問題。隨著計(jì)算機(jī)技術(shù)的發(fā)展,術(shù)語的應(yīng)用范圍也從純語言學(xué)研究拓展到機(jī)器翻譯、信息檢索、數(shù)據(jù)挖掘等領(lǐng)域。
對(duì)術(shù)語進(jìn)行抽取和標(biāo)注首先需要構(gòu)建語料庫。語料庫的構(gòu)建主要有4種方法:1)基于聚類方法的知識(shí)庫構(gòu)建;2)基于可拓知識(shí)表示的知識(shí)庫構(gòu)建;3)基于神經(jīng)網(wǎng)絡(luò)的知識(shí)庫構(gòu)建;4)基于本體的知識(shí)庫構(gòu)建。其中以本體與術(shù)語學(xué)的結(jié)合最為密切。本體是一種共享的概念定義集,能夠描述語義層面概念及概念間的關(guān)系,以最大程度地實(shí)現(xiàn)知識(shí)共享與重用。對(duì)于術(shù)語研究而言,通過本體知識(shí)庫能夠描述各術(shù)語的屬性信息及術(shù)語間關(guān)系,將某一領(lǐng)域的術(shù)語系統(tǒng)合理地整合起來。
本研究將構(gòu)建以越南為樣本的南海領(lǐng)域漢英本體知識(shí)庫,對(duì)南海領(lǐng)域相關(guān)術(shù)語及術(shù)語間的關(guān)系進(jìn)行描述,以實(shí)現(xiàn)對(duì)南海領(lǐng)域知識(shí)的系統(tǒng)組織,更好地服務(wù)領(lǐng)域術(shù)語研究和基于知識(shí)本體的術(shù)語翻譯。
一 本體基本概述
1. 相關(guān)概念
“本體”的概念起源于哲學(xué)領(lǐng)域,人工智能專家將其引入計(jì)算機(jī)科學(xué)。人工智能領(lǐng)域中最早給本體下定義的是Neches等人,他們認(rèn)為本體定義了組成相關(guān)領(lǐng)域詞匯的基本術(shù)語及關(guān)系,并利用這些術(shù)語和關(guān)系來定義詞匯外延的規(guī)則[2]。之后,Studer[3]等人在Neches、Gruber[4]等人的研究之上提出“本體是共享概念模型的明確的形式化規(guī)范說明”,這個(gè)定義較為全面地包含了本體的四大特征——概念模型、明確、形式化和共享,是目前被廣泛接受的一個(gè)定義。
2. 主要技術(shù)方法
本體構(gòu)建是一項(xiàng)龐大的工程,研究人員需要合適的本體編輯工具來高效地完成開發(fā)任務(wù)。借助這些本體編輯工具,研究人員可以把精力集中在本體的內(nèi)容組織上,而不必考慮本體描述語言和描述方式等細(xì)節(jié)問題,極大地方便了本體的構(gòu)建[5]。
目前已廣泛使用的本體編輯工具有Protégé、Ontolingua、WebOnto、KAON(已推出KAON2)、OntoEdit以及 WebODE等。本研究選用Protégé作為編輯工具。Protégé是由美國斯坦福大學(xué)醫(yī)學(xué)院開發(fā)的本體編輯工具,由Java語言編寫,集本體編輯和知識(shí)庫編輯為一體,支持中文輸入法,支持多種應(yīng)用插件,如可視化插件、本體整合插件、語言轉(zhuǎn)換等[6]。
為了使本體構(gòu)建方法更加科學(xué)合理,不少研究者從實(shí)踐出發(fā)提出了有益于構(gòu)建本體的標(biāo)準(zhǔn),最具影響力的是Gruber提出的5條標(biāo)準(zhǔn):明確性、一致性、可擴(kuò)展性、最小編碼偏好和最小承諾[4]?;谏鲜龅臉?biāo)準(zhǔn),研究者提出了多種構(gòu)建本體的方法,其中比較著名的有KACTUS法、七步法、“骨架法”、TOVE法及MethOntology方法等。
二 南海領(lǐng)域本體知識(shí)庫設(shè)計(jì)
1. 南海領(lǐng)域知識(shí)來源
在設(shè)計(jì)本體知識(shí)庫的類和屬性時(shí)主要參考了李偉剛[7-8]構(gòu)建的航空領(lǐng)域本體知識(shí)庫和陳欣[9]構(gòu)建的英漢軍事本體知識(shí)庫,前者對(duì)航空領(lǐng)域中飛機(jī)、航空機(jī)構(gòu)和組織等知識(shí)進(jìn)行了詳細(xì)的描述,后者描述了飛機(jī)、艦船、軍事基地和軍事情報(bào)等方面的英漢雙語知識(shí)。
南海領(lǐng)域本體知識(shí)庫的設(shè)計(jì)以越南為例進(jìn)行說明,關(guān)于越南國情的資料一方面來源于專業(yè)書籍,如《東南亞研究叢書:東南亞概論》[10]《東南亞國家軍事地理》[11]《越南概論》[12]《越南:歷史 國情 前瞻》[13]等,這些書籍對(duì)越南及東南亞其他國家的政治、經(jīng)濟(jì)、地理、軍事等方面的知識(shí)進(jìn)行了大致的梳理;另一方面資料來源于互聯(lián)網(wǎng),通過維基百科、百度百科、互動(dòng)百科等網(wǎng)站進(jìn)一步獲取關(guān)于越南島嶼島礁、港口、海上軍事實(shí)力等方面的詳細(xì)信息。術(shù)語對(duì)應(yīng)的英文翻譯參照了《英漢軍事大詞典》[14]《英漢軍事術(shù)語大詞典》[15]《英漢漢英詞典》[16]及Wikipedia的相關(guān)信息。
2. 定義類及類的層級(jí)結(jié)構(gòu)
通過合理地定義類,建立類之間清晰的層次關(guān)系,使類之間的語義關(guān)系更加明確,從而可以準(zhǔn)確定位領(lǐng)域概念框架中各個(gè)概念的位置,為概念進(jìn)行語義限定和語義擴(kuò)展奠定基礎(chǔ)。本研究以“南海軍情”(military situation of South China Sea)作為根節(jié)點(diǎn),根節(jié)點(diǎn)下添加“越南軍情”(military situation of Vietnam)節(jié)點(diǎn),其下分為“地理環(huán)境”(geographic condition)、“國力資源”(national resources)和“國家安全環(huán)境”(national security)3個(gè)大類。
第一大類“地理環(huán)境”(geographic condition)分為“地形地貌”(geomorphology)和“國家戰(zhàn)略空間”(strategic geography)2個(gè)小類。地形地貌包括“陸地環(huán)境”(terrestrial condition)、“大陸水系”(river system)和“海洋環(huán)境”(oceanography),“陸地環(huán)境”(terrestrial condition)又細(xì)分為“山地”(mountain)、“平原”(plain)和“高原”(plateau),“大陸水系”主要描述的是“河流”(river),海洋環(huán)境則包括“島嶼島礁”(island)和“海岸線”(coastline)。其中,“島嶼島礁”類下添加了“爭(zhēng)議島礁”(controversial island)這一小類,包含越南占領(lǐng)我國的29個(gè)南海島礁的具體信息?!皣覒?zhàn)略空間”主要包括“行政區(qū)劃分”(administrative region)及“人員兵員”(personnel& troop)情況。
本體編輯工具Protégé5.2.0自帶的插件Jambalaya能夠?qū)⒈倔w知識(shí)庫中的層級(jí)結(jié)構(gòu)可視化。圖1和圖2即為Jambalaya展示的“地理環(huán)境”大類的層級(jí)結(jié)構(gòu)圖。
第二大類“國力資源”(national resources)分為“經(jīng)濟(jì)布局”(economic distribution)、“戰(zhàn)略資源”(strategic resources)、“重要經(jīng)濟(jì)行業(yè)”(economic industry)和“交通運(yùn)輸”(transportation)4個(gè)類?!皯?zhàn)略資源”包括“煤”(coal)、“鋼鐵”(steel)、“石油”(petroleum)和“天然氣”(natural gas)3個(gè)方面;“重要經(jīng)濟(jì)行業(yè)”下分為“農(nóng)業(yè)”(agriculture)和“工業(yè)”(industry),“農(nóng)業(yè)”細(xì)分為“經(jīng)濟(jì)作物”(industrial crop)和“糧食作物”(gain crop);“交通運(yùn)輸”分為“公路運(yùn)輸”(road transport)、“鐵路運(yùn)輸”(railway transport)、“航空運(yùn)輸”(air transport)和“水路運(yùn)輸”(waterway transport)?!皣Y源”類的層級(jí)結(jié)構(gòu)可以由圖3來表示。
第三大類“國家安全環(huán)境”(national security)包含“外部安全環(huán)境”(external security environment)、“內(nèi)部安全環(huán)境”(internal security environment)和“軍事力量”(military power)3個(gè)子類,其中以“軍事力量”內(nèi)容最為豐富,包括“國防政策”(national defense policy)、“國防戰(zhàn)略”(national defense strategy)、“軍事戰(zhàn)略”(military strategy)和“國防體制”
(defense system)4個(gè)方面?!皣荔w制”下分為“國防與安全委員會(huì)”(national defense and security council,NDSC)、“國防部”(ministry of defense)和“武裝力量”(armed forces)3個(gè)部分。“國防部”分為“總部局”和“直屬單位”兩部分,這兩部分之下還有細(xì)分。
“武裝力量”(armed forces)包括“正規(guī)軍”(regular army)、“地方部隊(duì)”(local forces)、“民兵自衛(wèi)隊(duì)”(selfdefense unit)和“預(yù)備役部隊(duì)”(reserve service)4個(gè)子類, “正規(guī)軍”分為“陸軍”(army)、“海軍”(navy)、“空軍”(air force)和“防空軍”(air defense force)3個(gè)兵種,在越南本體知識(shí)庫分別對(duì)這3個(gè)兵種的“編制”(establishment)、“裝備”(equipment)和“部署情況”(deployment)進(jìn)行了詳細(xì)的分類?!罢?guī)軍”子類的層級(jí)結(jié)構(gòu)分別如圖4 所示。
正規(guī)軍中“海軍”這一類下分為“海軍編制”(establishment of navy)、“海軍裝備”(equipment of navy)和“海軍部署情況”(deployment of navy)3個(gè)類,其中,“海軍部署情況”下分為“海軍基地”(navy base)和“海區(qū)”(sea area)2個(gè)類,“海軍裝備”下分為“導(dǎo)彈艇”(missile boat)、“巡邏艇”(patrol boat)、“護(hù)衛(wèi)艦”(frigate)、“登陸艦”(landing ship)等16個(gè)類。
“陸軍”類同樣分為編制、裝備和部署情況3個(gè)方面,“陸軍裝備”(equipment of army)下細(xì)分為“主戰(zhàn)坦克”(battle tank)、“地空導(dǎo)彈”(surfacetoair missile)、“反坦克導(dǎo)彈”(antitank missile)等13個(gè)類, “陸軍部署情況”(deployment of army)下分為“司令部”(headquarters)、“軍區(qū)”(military region)、“集團(tuán)軍”(army group)和“師級(jí)單位”(division)4個(gè)小類。
越南空軍和防空軍的信息合并在類“空軍和防空軍”(air force& air defense force)中,包括“空軍裝備”(equipment of army)、“空軍編制”(establishment of air force)和“空軍部署情況”(deployment of air force)3個(gè)方面?!翱哲娋幹啤敝蟹譃椤翱哲妼W(xué)?!保╝ir force academy)、“航空師”(air division)、“飛行團(tuán)”(air division)、“訓(xùn)飛團(tuán)”(fly training division)等7個(gè)小類?!翱哲姴渴鹎闆r”中主要是關(guān)于“空軍基地”(air base)的知識(shí)?!翱哲娧b備”則細(xì)分為“戰(zhàn)斗機(jī)”(fighter)、“直升機(jī)”(helicopter)、“教練機(jī)”(trainer aircraft)、“巡邏機(jī)”(patrol aircraft)和“無人機(jī)”(drone)等12個(gè)小類。
目前在“越南軍情”節(jié)點(diǎn)下,“地理環(huán)境”類共分為29個(gè)類,“國力資源”下共有22個(gè)類,“國家安全環(huán)境”中包括96個(gè)小類。
3. 屬性的設(shè)計(jì)
為了更全面、準(zhǔn)確地描述領(lǐng)域本體知識(shí),還需要定義類的屬性,將隱性的語義知識(shí)顯性地表現(xiàn)出來。類的屬性包括對(duì)象屬性和數(shù)據(jù)屬性兩方面。
(1)對(duì)象屬性(Object property)
對(duì)象屬性是指從文獻(xiàn)中歸納出的概念之間的關(guān)系。對(duì)于每種對(duì)象屬性,需要設(shè)置它們的定義域和值域,屬性間可以設(shè)置互逆(inverse)的關(guān)系,對(duì)于意義相近的兩個(gè)對(duì)象屬性,可以采用“owl: equivalentProperty”將兩者等同起來。
南海領(lǐng)域本體知識(shí)庫中有一部分是關(guān)于地理、經(jīng)濟(jì)和政治方面的知識(shí),這方面知識(shí)以描述性為主,彼此關(guān)聯(lián)較少,因此對(duì)象屬性偏少。在“國家安全環(huán)境”中的軍事部分涉及陸軍、海軍、空軍和防空軍的編制、部署和裝備,類之間的聯(lián)系相對(duì)較多。本研究從專業(yè)文獻(xiàn)中總結(jié)出對(duì)象屬性共25個(gè),選取部分對(duì)象屬性具體說明如下:
“下轄”(have jurisdiction over)用來說明軍隊(duì)編制中上級(jí)單位所管轄的下級(jí)單位,以及行政區(qū)劃中各省份中的主要城市,同時(shí),與“下轄”意義相近的“管轄”(govern),可以采用“owl: equivalentProperty”將兩者等同起來。
“隸屬”(be subordinated to)是“下轄”的逆屬性,用來表示下級(jí)單位所隸屬的上級(jí)單位,城市所位于的省。
“產(chǎn)自”(be made in),在“戰(zhàn)略資源”類中說明作物及戰(zhàn)略資源的產(chǎn)地,其逆屬性為“生產(chǎn)”(produce);“流經(jīng)”(flow through),用于描述水系河流經(jīng)過的省份和城市。
“位于”(be located in),等同于“坐落/在/處于”(be situated in),用來說明省的首府所在,或表示軍區(qū)或海區(qū)的司令部所在的城市或基地。
“經(jīng)過”(go through),用來描述鐵路和公路途經(jīng)的省份或城市。
“負(fù)責(zé)”(be responsible for),說明陸軍軍區(qū)負(fù)責(zé)的區(qū)域。
“裝備”(be equipped with),用來說明部隊(duì)配備了哪些武器,“服役于”(be served in)是“裝備”的逆屬性,用來說明武器具體配置到哪些單位。
(2)數(shù)據(jù)屬性(Datatype property)
數(shù)據(jù)屬性指概念的具體參數(shù)。上文通過定義類的對(duì)象屬性,將領(lǐng)域內(nèi)隱含的語義信息顯性地表現(xiàn)出來,但僅有類之間的語義關(guān)系無法完整描述類本身的特性,還需要定義類的數(shù)據(jù)屬性。根據(jù)已有的文獻(xiàn)資料,從中總結(jié)出61個(gè)數(shù)據(jù)屬性,基本上能夠描寫越南各方面的知識(shí)。下面選取部分?jǐn)?shù)據(jù)屬性進(jìn)行說明:
“地理位置”(location),用來描繪山川、河流、島嶼等自然地理事物的自然地理位置,即坐標(biāo)信息,以及城市、港口等人造地理事物的相對(duì)地理位置,比如富國島位于越南南部泰國灣尖端,海防港的地理坐標(biāo)是北緯20°52
SymbolbB@ 13
SymbolrB@ ,東經(jīng)106°39
SymbolrB@ 20
SymbolrB@ 。
“水深”(depth),主要描述河流、港口和海軍基地的平均水深,對(duì)于海岸線的水深,還細(xì)分有近岸水深、距岸1000米水深等數(shù)據(jù)屬性。比如,太平河水深為5~15米。
“人口”(population),用于說明城市和一些有居民的島嶼上的常住人口數(shù)。比如,富國島的人口是7萬。
“流域面積”(drainage area),描述河流地表水的集水面積,一般流域面積越大的地區(qū),河流的水量越豐富。例如,湄公河的流域面積是4900平方公里。
“水域面積”(water area),用以描述海軍基地內(nèi)港口表面的集水面積。比如,芽莊港的水域面積是50平方公里。
“海拔”(altitude),說明高原、山地等地形高出海平面的垂直距離。比如,番西邦的海拔是3143米。
“容機(jī)量”(capacity),用來描述機(jī)場(chǎng)容納飛機(jī)的最大值。比如,新山一機(jī)場(chǎng)的容機(jī)量是150架。
“舷號(hào)”(side number),描述船只和艦艇上標(biāo)注在兩舷水線以上的編號(hào)。比如,越南“獵豹”導(dǎo)彈護(hù)衛(wèi)艦的舷號(hào)是HQ011。
在定義數(shù)據(jù)屬性時(shí),還需要為數(shù)據(jù)屬性選擇合適的數(shù)據(jù)類型。在Protégé 3.5中,提供了6種數(shù)據(jù)類型,分別是boolean(布爾型)、int(整數(shù)型)、float(單精度浮點(diǎn)型)、string(字符型)、date(時(shí)間型)和date Time(日期時(shí)間型)。為數(shù)據(jù)屬性選擇數(shù)據(jù)類型的目的是限定數(shù)據(jù)函數(shù)的類型,對(duì)屬性值的格式進(jìn)行規(guī)范,避免在輸入時(shí)出錯(cuò)。
三 領(lǐng)域本體知識(shí)庫構(gòu)建及編碼實(shí)現(xiàn)
1. 類和類的層級(jí)結(jié)構(gòu)的創(chuàng)建
在完成了對(duì)本體中類的層級(jí)結(jié)構(gòu)的設(shè)計(jì)以及屬性的設(shè)計(jì)之后,要對(duì)本體知識(shí)庫進(jìn)行編碼實(shí)現(xiàn),主要步驟是創(chuàng)建類、添加子類、創(chuàng)建屬性并為類添加實(shí)例。在Protégé 3.5的圖形界面中,利用OWL Classes選項(xiàng)卡來創(chuàng)建類及其子類。
類的創(chuàng)建界面主要分為四個(gè)部分:第一部分“For Class”(類),用來顯示類的表達(dá)式,即為本體知識(shí)庫的URL加上類名;第二部分是“Annotations”(注釋),包括對(duì)類的描述、解釋說明等信息;第三部分是“Asserted conditions”(斷言),包括類的父類的說明,以及對(duì)類的約束條件(分為充分必要條件和必要條件);第四部分是“Disjoins”(不相交),表示類之間的相互獨(dú)立,相互不影響。
2. 屬性的創(chuàng)建
在Protégé 3.5中,Property的選項(xiàng)卡下包含對(duì)象屬性(Object)、數(shù)據(jù)屬性(Datatype)、注釋屬性(Annotation)和全部屬性(All)四個(gè)小窗口,需要分別在Object和Datatype小窗口中為已設(shè)計(jì)好的類創(chuàng)建對(duì)象屬性和數(shù)據(jù)屬性,創(chuàng)建方法與類的創(chuàng)建方法類似。
3. 添加實(shí)例
在定義了本體中的類和屬性之后,就建立了領(lǐng)域本體的知識(shí)描述體系,接下來通過為類添加實(shí)例,并為其屬性賦值加以約束,完善領(lǐng)域本體知識(shí)庫的構(gòu)建。
在Protégé 3.5的界面下,通過“Individuals”(實(shí)例)選項(xiàng)卡添加實(shí)例及其屬性值。圖5為添加實(shí)例的界面。
以添加“軍區(qū)”類中的實(shí)例“第一軍區(qū)”為例,之前創(chuàng)建屬性的時(shí)候,已經(jīng)為“軍區(qū)”類設(shè)計(jì)了“負(fù)責(zé)內(nèi)容”等數(shù)據(jù)屬性,以及對(duì)象屬性“下轄”“負(fù)責(zé)”和“司令部位于”,輸入屬性內(nèi)容時(shí)需與已設(shè)定的屬性數(shù)據(jù)類型相符。在對(duì)實(shí)例進(jìn)行描述的時(shí)候,還可通過“rdfs: comment”為實(shí)例添加詳細(xì)注釋,以及通過“owl: sameAs”添加實(shí)例的別名,比如“紅河”在越南又被稱為“珥河”,可以通過“owl: sameAs”將表示同一概念的不同表述等價(jià)起來。
4. 本體的形式化
設(shè)計(jì)了領(lǐng)域本體的基本框架之后,需要借助本體構(gòu)建工具Protégé 3.5和本體描述語言O(shè)WL DL對(duì)領(lǐng)域本體知識(shí)進(jìn)行形式化的描述,將領(lǐng)域本體保存為owl格式的文件,后續(xù)研究可通過調(diào)用owl文件對(duì)領(lǐng)域本體知識(shí)庫進(jìn)行處理。
5. 一致性檢查
本體構(gòu)建是一個(gè)逐步完善、精益求精的過程,對(duì)本體的評(píng)價(jià)包括衡量本體的正確性、一致性和可擴(kuò)展性。作為一項(xiàng)重要衡量指標(biāo),一致性檢查旨在考察類和類之間的邏輯關(guān)系設(shè)計(jì)是否正確。
Protégé 3.5自帶有推理機(jī)(Reasoning)Pellet 1.5.2,可用于本體的一致性檢查。Pellet 1.5.2的功能有Check consistency(檢查一致性)、Classify taxonomy(分類檢查)和Computing inferred types(計(jì)算推導(dǎo)類型)等。常利用Check consistency和Classify taxonomy對(duì)本體的一致性進(jìn)行檢查,結(jié)果窗口中被標(biāo)紅的類說明在創(chuàng)建時(shí)存在邏輯錯(cuò)誤,需要找出這些錯(cuò)誤來保證整個(gè)本體的一致性。
四 結(jié)語
本研究主要圍繞面向術(shù)語翻譯的南海領(lǐng)域漢英本體知識(shí)庫的設(shè)計(jì)及構(gòu)建。首先對(duì)本體相關(guān)概念進(jìn)行綜述,然后依據(jù)已獲取的南海領(lǐng)域資料,選擇本體編輯工具Protégé 3.5及半自動(dòng)構(gòu)建方式對(duì)南海領(lǐng)域本體知識(shí)庫中的類、類的層級(jí)結(jié)構(gòu)和屬性進(jìn)行詳細(xì)的設(shè)計(jì),構(gòu)建以越南為例的南海領(lǐng)域本體知識(shí)庫并編碼實(shí)現(xiàn),創(chuàng)建類的屬性,為類添加具體實(shí)例。之后對(duì)本體知識(shí)進(jìn)行形式化的描述,將其轉(zhuǎn)化為計(jì)算機(jī)可以處理的信息,并在構(gòu)建過程中對(duì)本體知識(shí)庫進(jìn)行一致性檢查,確保本體知識(shí)庫邏輯正確、結(jié)構(gòu)清晰。
目前南海領(lǐng)域本體知識(shí)庫已初具規(guī)模,盡可能充分地描述南海領(lǐng)域相關(guān)術(shù)語及術(shù)語間的關(guān)系,能夠在一定程度上滿足該領(lǐng)域的信息查詢要求,同時(shí)為領(lǐng)域術(shù)語研究及基于本體知識(shí)庫的術(shù)語翻譯打下基礎(chǔ)。
參考文獻(xiàn)
[1] Wüster E. Einführung in die Allgemeine Terminologielehre und Terminologische Lexikographie[M]. Wien/New York:Springer, 1979.
[2] Neches R, Fikes R E, Finin T, et al. Enabling technology for knowledge sharing[J]. AI magazine, 1991, 12(3): 36.
[3] Studer R, Benjamins V R, Fensel D. Knowledge engineering: principles and methods [J]. Data & knowledge engineering, 1998, 25(1): 161-197.
[4] Gruber T R. Toward principles for the design of ontologies used for knowledge sharing [J]. International journal of humancomputer studies, 1995, 43(5): 907-928.
[5] 劉宇松.本體構(gòu)建方法和工具研究[J].現(xiàn)代情報(bào),2009,29(9):21.
[6] 杜文華,董慧.本體建設(shè)工具比較研究[J].情報(bào)雜志,2005(2):11-14.
[7] 李偉剛,張克亮,王慧蘭.基于航空領(lǐng)域本體知識(shí)庫的語義檢索研究 [J].中國計(jì)算語言學(xué)研究前沿進(jìn)展(2009-2011),2011:419-424.
[8] 李偉剛.基于本體知識(shí)庫和FAQ的多策略問答系統(tǒng)研究[D].洛陽:解放軍外國語學(xué)院,2013.
[9] 陳欣.基于軍事領(lǐng)域本體的跨語言知識(shí)查詢研究與系統(tǒng)實(shí)現(xiàn)[D].洛陽:解放軍外國語學(xué)院,2011.
[10] 祁廣謀,鐘智翔.東南亞概論[M].廣州:世界圖書出版社,2013.
[11] 鐘智翔,陳揚(yáng).東南亞國家軍事地理[M].北京:軍事誼文出版社,2009.
[12] 蘭強(qiáng),徐方宇,李華杰.越南概論[M].北京:世界圖書出版公司,2012.
[13] 古小松.越南:歷史 國情 前瞻[M].北京:中國社會(huì)科學(xué)出版社,2016.
[14] 李公昭.英漢軍事大詞典[M].上海:上海外語教育出版社,2006.
[15] 潘永樑.英漢軍事術(shù)語大詞典[M].北京:外文出版社,2007.
[16] 呂微,汪川.英漢漢英詞典[M].北京:商務(wù)印書館,2009.