張霖 張宇航
摘 要:控制閥產(chǎn)品選型設(shè)計對自動化系統(tǒng)有重要影響,檢索是實現(xiàn)選型設(shè)計自動化的有效手段。傳統(tǒng)的檢索是基于精確本體的,不能完成精確語義信息挖掘,提出一種基于粗糙本體的控制閥產(chǎn)品檢索方法,支持控制閥產(chǎn)品的智能選型。首先,建立控制閥本體庫,將其擴(kuò)成生成粗糙本體;其次,對查詢語句進(jìn)行自然語言處理,提取關(guān)鍵字并利用本體和粗糙本體庫上下位擴(kuò)展檢索實例的算法進(jìn)行語義擴(kuò)展;最后,基于布爾模型表示的文檔,結(jié)合語義擴(kuò)展后的關(guān)鍵字進(jìn)行文檔和查詢的匹配實現(xiàn)了一種基于粗糙本體的控制閥產(chǎn)品檢索原型系統(tǒng),驗證了提出的檢索方法的有效性。
關(guān)鍵詞:粗糙本體;語義擴(kuò)展;查詢匹配;檢索
一、簡介
控制閥是自動化系統(tǒng)的重要組成部分,合理的選擇控制閥對于自動化系統(tǒng)極其重要。然而,產(chǎn)品選型設(shè)計往往關(guān)聯(lián)著需求方與供給方不同企業(yè),其來自需求方的應(yīng)用需求同來自供給方的產(chǎn)品屬性之間往往存在著巨大的“語義鴻溝”,造成自動化選型的困難性[1]。
檢索是實現(xiàn)選型設(shè)計自動化的有效手段。然而,傳統(tǒng)的基于關(guān)鍵字檢索方法僅僅考慮到了語法層次的問題,即檢索條件在數(shù)據(jù)庫中是否能夠得到匹配,完全摒棄了檢索條件的概念特征;從知識表示的角度來看,關(guān)鍵詞的檢索僅僅考慮了數(shù)據(jù)匹配,而沒有考慮數(shù)據(jù)本身的結(jié)構(gòu)特征,勢必?zé)o法支持復(fù)雜的檢索需求,因而難以應(yīng)用于控制閥產(chǎn)品的自動化選型中[2,3]。本體具有“概念化、形式化、明確性、共享性”[4]的優(yōu)良特性,基于它的檢索方法能夠有效地捕捉用戶的檢索意圖,合理組織底層數(shù)據(jù),因而受到廣大學(xué)者的積極關(guān)注[5-7]。然而,精確本體不能很好挖掘隱藏的語義信息,導(dǎo)致檢索的全度和精度不理想。
針對這些問題,本體提出了一種基于粗糙本體的控制閥產(chǎn)品檢索方法,通過引進(jìn)粗糙集到本體中,粗糙本體的概念是S.Ishizu提出的,使本體能夠表達(dá)不精確的信息,能夠解決不精確信息影響檢索結(jié)果的問題。本文包括:粗糙本體庫的構(gòu)建,查詢語句的自然語言處理及基于本體和粗糙本體庫上下位語義擴(kuò)展,基于語義擴(kuò)展后的關(guān)鍵字和文檔的查詢匹配。
語義信息檢索是一種基于概念和概念之間關(guān)系的匹配機(jī)制,語義信息檢索的重點和難點是找到不同概念之間的映射關(guān)系,于是本文用本體和粗糙本體來實現(xiàn)檢索。
對比用精確本體進(jìn)行語義擴(kuò)展,粗糙本體能客服精確本體中信息不完整的問題,粗糙本體是用粗糙集理論對精確本體的擴(kuò)展。粗糙本體的實現(xiàn)難點是知識的表征以及粗糙本體的定義問題。
二、控制閥本體庫和粗糙本體庫
基于粗糙本體的檢索方法利用本體“概念化、形式化、明確性、共享性”的特點,可以有效地分析用戶的檢索意圖,合理組織底層數(shù)據(jù),實現(xiàn)高效的產(chǎn)品檢索工作。文章中的控制閥本體源于我們先前的工作通過計算將滿足設(shè)定閾值的詞加入查詢,本體模型基于NIST的CPM而擴(kuò)建。粗糙本體用粗糙集理論對精確本體的擴(kuò)展,它不僅可以通過精確概念得到粗糙概念,而且繼承了精確本體的可擴(kuò)展性,因此用它來表示粗糙概念。
粗糙本體定義
粗糙本體表達(dá)為O=
表征:將粗糙本體引入語義信息檢索的前提條件就是知識表征。
一個代表性的OWL表征的粗糙本體模型:
粗糙本體是基于粗糙集對精確本體的擴(kuò)展,因此具有本體庫的可擴(kuò)展性[11]。用OWL編碼的粗糙本體,粗糙度的描述需要增加到對象關(guān)聯(lián)中,也就是上近似擴(kuò)展和下近似擴(kuò)展。表達(dá)OWL粗糙本體分成幾步:(1)定義粗糙類;(2)定義子類;(3)定義粗糙概念上近似擴(kuò)展和下近似擴(kuò)展;(4)定義精確類的函數(shù)范圍。分詞后提取得到的關(guān)鍵字在本體樹找到對應(yīng)的位置,同時也在粗糙本體樹中找到相應(yīng)的位置,然后同時進(jìn)行語義擴(kuò)展,找到精確本體中的上位詞及相對具體的下位詞。(作者單位:北方民族大學(xué)計算機(jī)科學(xué)與工程學(xué)院)
創(chuàng)新項目:北方民族大學(xué)研究生處創(chuàng)新項目(YCX1563)
參考文獻(xiàn):
[1] 白靜.產(chǎn)品智能選型設(shè)計方法及應(yīng)用研究.博士后論文.2011:1-6
[2] Mousavi SM, Jolai F, and Tavakkli-Moghaddam R. A Fuzzy Stochastic Multi-Attribute Group Decision-Making Approach for Selection Problems[J]. Group Decision and Ngotiation. 2013.22(2):207-233.
[3] Tavana M, Khalili-Damghani K, and Sadi-Nezhad S. A fuzzy group data envelopment analysis model for hightechnology project selection: A case study at NASA[J]:Computers & Industrial Engineering.2013.66(1):10-23
[4] 王繼東,張瑜,李娜.基于本體的語義檢索技術(shù)研究實現(xiàn).計算機(jī)技術(shù)與發(fā)展.2009.10.