国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于語義的監(jiān)控系統(tǒng)的應(yīng)用研究

2010-10-17 07:47邱澤國唐季華
關(guān)鍵詞:詞表腳本調(diào)用

邱澤國,唐季華

(哈爾濱商業(yè)大學(xué)計算機學(xué)院,哈爾濱150076)

基于漢語主題詞表和各學(xué)科或?qū)I(yè)主題詞表,建立一個以主題詞為骨架、輔以全面的自由詞面的自由詞,并標(biāo)示出包括所有主題詞和自由詞之間的用、代、屬、分、參關(guān)系,可形成內(nèi)容比較完善的后控詞表[1].它不僅可以適應(yīng)用戶輸入的非規(guī)范化用詞,提高查全率和檢索效率,通過詞間概念等級關(guān)系和族性關(guān)系,方便地進行上、下位詞的檢索從而實現(xiàn)擴檢和縮檢,還可在一定程度上實現(xiàn)語義關(guān)聯(lián)檢索,充分發(fā)揮主題詞檢索的優(yōu)越性.但是,建立后控詞表是一項技術(shù)難度和工作量都比較大的工作,而且隨著時間的推移,新詞不斷呈現(xiàn),詞表如何自動更新,即詞表自學(xué)習(xí)功能也一直是一個難題.

目前,后控制詞表中的參照關(guān)系,主要是依據(jù)漢語主題詞表或各學(xué)科專業(yè)的主題詞表中收錄的“參”關(guān)系設(shè)置的[2].此種設(shè)置方式有兩大不足:一是收入的參照關(guān)系有限,二是詞間的參照關(guān)系過于嚴(yán)密,無論是主題詞之間或是主題詞與自由詞之間,被參照的詞往往還是不夠“自由”,帶有比較重的書面色彩[3].這就給概念的相關(guān)檢索和參照檢索帶來一定難度.

1 整體結(jié)構(gòu)

為了滿足安全和訪問要求等相關(guān)需求,必須在每個生產(chǎn)主機的產(chǎn)品用戶下部署UserAgent,用于對產(chǎn)品進程的直接操作,這樣不用考慮提供主機系統(tǒng)用戶/密碼等;

同時在生產(chǎn)環(huán)境中獨立部署服務(wù)器(獨立的物理主機),并在其上部署通訊中間件和運維服務(wù)進程等;

服務(wù)器上不部署DB,需要存取的數(shù)據(jù)記錄為數(shù)據(jù)文件方式,同時考慮到平臺支持,應(yīng)該可做快速移植;

需要的所有配置信息(操作主機配置、操作員用戶/密碼、任務(wù)計劃定義等)都可以存放到其中的配置數(shù)據(jù)文件中;

UserAgent,服務(wù)Server和終端Terminal都通過通訊中間件相互連通,見圖1.

圖1 整體結(jié)構(gòu)示意圖

UserAgent和服務(wù)都必須要求可以7×24小時運行,同時自身非常穩(wěn)定,另外UserAgent因為被直接部署在生產(chǎn)主機上為此必須十分穩(wěn)定且資源消耗小和平穩(wěn);

在Windows平臺下,UserAgent應(yīng)該是以Service方式運行的,并可隨機器一道啟動;

在UNIX平臺下,UserAgent應(yīng)該是以DAEMON方式運行的,并可隨機器一道啟動.

2 軟件設(shè)計與實現(xiàn)

由于UserAgent可直接訪問當(dāng)前用戶下的資源,所以為了方便開發(fā)和管理維護,在UserAgent上需要開發(fā)一系列可靠簡易的調(diào)用接口,建議做法是:

Shell腳本調(diào)用接口,定義Shell腳本的名稱和調(diào)用要求,并要求Shell腳本將輸出結(jié)果或信息反饋到某確定文本(結(jié)果日志)中,調(diào)用者UserAgent可以在Shell腳本調(diào)用結(jié)束后,通過讀取結(jié)果信息日志文本獲得最可靠的結(jié)果回應(yīng)[4].

回應(yīng)結(jié)果的解讀必須是嚴(yán)格可靠的,為此需要設(shè)定嚴(yán)謹(jǐn)?shù)南⒏袷?這樣可以保證解析的結(jié)果信息準(zhǔn)確可信.而對結(jié)果的實際解析可以不由UserAgent負(fù)責(zé),可以回應(yīng)給服務(wù)的模塊來完成.

UserAgent的開發(fā)必須完全統(tǒng)一,即在不同平臺或主機下,只能有一種UserAgent的實現(xiàn),盡量不要開發(fā)不同個性功能的Useragent實現(xiàn),這樣才能很好保證其可靠和穩(wěn)定性,同時也能大大簡化開發(fā)工作量,為此UserAgent不能過于關(guān)心功能的差異性細(xì)節(jié)[5],見圖2.

為此在功能設(shè)計方面我們可以借鑒Ant的思路,在服務(wù)模塊規(guī)劃和定義Target,每個Target包含若干需要順序執(zhí)行的Task,而每個Task需要定義如下信息:UserAgent的標(biāo)識,即AgentID或請求功能號;任務(wù)參數(shù),可能需要的請求參數(shù);每個任務(wù)調(diào)用都有返回結(jié)果,為了統(tǒng)一調(diào)用接口,建議各種任務(wù)的請求參數(shù)和返回結(jié)果都使用固定字段.

圖2 軟件設(shè)計與實現(xiàn)示意圖

這樣在服務(wù)模塊里,任何操作就是一個Target,而執(zhí)行Target時就是順序執(zhí)行其下的一系列事先定義好的Task,每個Task都有請求和應(yīng)答,如果在一個Target的執(zhí)行過程中,任何一個Task失敗,那么整個Target就失敗.

3 目標(biāo)任務(wù)調(diào)用模式

對于每個被調(diào)用Task,其UserAgent都會轉(zhuǎn)化為一個實際的Shell腳本的運行,由于執(zhí)行Shell腳本存在時間周期等待的可能,而等待時間也會有很多差異,為此如果采用請求/應(yīng)答的完全同步模式可能不夠穩(wěn)定,所以可以考慮將一個任務(wù)的完成過程分為兩步驟來進行:

第一階段為任務(wù)發(fā)起準(zhǔn)備,由服務(wù)發(fā)送任務(wù)準(zhǔn)備執(zhí)行指令(一般需要設(shè)定一個惟一的任務(wù)流水號,便于未來做跟蹤和檢查)給某UserAgent,UserAgent收到后,做執(zhí)行Shell腳本前的準(zhǔn)備和檢查工作,如果可以執(zhí)行就應(yīng)答給服務(wù)為準(zhǔn)備就緒,如果有問題則應(yīng)答準(zhǔn)備失敗;這個應(yīng)答由于檢查和準(zhǔn)備工作很少,所以可以快速給予回應(yīng);服務(wù)受到相應(yīng)應(yīng)答后就可以作出該任務(wù)的執(zhí)行狀態(tài)更新或相關(guān)工作;

第二階段為任務(wù)執(zhí)行和結(jié)果匯報,由UserAgent在準(zhǔn)備完成后可迅速開始進行Shell腳本的執(zhí)行,待腳本執(zhí)行完成后,同時對執(zhí)行結(jié)果收集好后,獲得當(dāng)前該執(zhí)行任務(wù)的反饋結(jié)果信息,就把該信息發(fā)服務(wù)(返回信息里必須包含當(dāng)前任務(wù)的唯一流水號),服務(wù)通過該回饋信息可以迅速更新對應(yīng)任務(wù)狀態(tài),這樣可以驅(qū)動任務(wù)所在目標(biāo)流程的后續(xù)任務(wù)驅(qū)動;

通過這種兩階段異步模式,可以使目標(biāo)流程和各個任務(wù)的執(zhí)行情況得到迅速跟蹤,并且可以避免請求/應(yīng)答方式下長時間等待,為此還需要UserAgent提供一些相關(guān)的任務(wù)查詢接口,如按任務(wù)流水號查詢某任務(wù)的執(zhí)行狀態(tài)或情況.任務(wù)流水號可以由UserAgentID+任務(wù)標(biāo)識+日期+時間值等來全局惟一表示,而且該號可以用于其他用途.

另外對于一個任務(wù),其對象狀態(tài)大致可以為:初始Init、執(zhí)行中Running、執(zhí)行成功Success、失敗Failure;如圖3所示.

圖3 目標(biāo)任務(wù)調(diào)用模式示意圖

在任務(wù)對象執(zhí)行管理的基礎(chǔ)上,目標(biāo)流程的定義管理就相對清晰了.一般可嚴(yán)格要求,任何流程都是沒有分支的,就象以前用Ant腳本編寫的Target一樣,而且不允許服務(wù)同時執(zhí)行多個目標(biāo)流程,這樣便于我們隔離錯誤和問題,防止出現(xiàn)不可預(yù)估的情況.

本實驗選用Protégé3.0作為本體建模工具,Protégé3.0是由斯坦福大學(xué)的Stanford Medical Informatics開發(fā)的一個開放源碼的本體編輯器[6],它是用Java編寫的.其界面風(fēng)格與普通Windows應(yīng)用程序風(fēng)格一致,易學(xué)易用[3].在Protégé3.0編輯器中,本體結(jié)構(gòu)以樹形的層次目錄結(jié)構(gòu)顯示,用戶可以通過點擊相應(yīng)項來編輯或增加類、子類、屬性、實例等本體元素,另外,用戶可以不用考慮具體的本體描述語言,而在概念層次上設(shè)計領(lǐng)域本體模型.

在構(gòu)建本體和組織存儲實例數(shù)據(jù)之后,就需要在應(yīng)用程序中對其進行解析和應(yīng)用.在本體數(shù)據(jù)讀取、語義推理和信息檢索時,ISearch系統(tǒng)主要采用了惠普實驗室開發(fā)提供的Jena 2.1API接口方法.

Jena是一種用來構(gòu)建語義萬維網(wǎng)應(yīng)用的Java框架,它提供了有關(guān)操作RDF、RDFS和OWL的接口方法以及基于規(guī)則的推理引擎編程環(huán)境,而且Jena還是一個開源項目,目前由惠普語義網(wǎng)絡(luò)實驗室負(fù)責(zé)開發(fā),在Jena框架中主要提供了以下的一些Java包、接口和方法.

?RDF應(yīng)用編程接口;

?提供讀寫各種語法形式的RDF文件,包括RDF/XML、N3等格式;

?提供操作OWL文件的應(yīng)用編程接口;

?提供基于內(nèi)存和持久存儲兩種方式;

?提供了一種RDF實例數(shù)據(jù)查詢語言——RDQL;

在ISearch系統(tǒng)中主要使用了Jena中的如下兩個包中的方法:

?com.hp.hpl.jena.rd f.model——其中提供了大量有關(guān)創(chuàng)建和操作RDF圖的方法;

?com.hp.hpl.jena.vocabulary——其中包含了在RDF和OWL規(guī)范中,所定義的Resource對象和Property對象,如RDF類和OWL類等[5].

為了實現(xiàn)系統(tǒng)中表示層和邏輯處理層之間的分離,在設(shè)計人機界面時,ISearch系統(tǒng)采用Velocity模板語言.

Velocity是一個基于Java的模板引擎(temp late engine).它允許任何人可以通過簡單的使用模板語言(temp late language)來引用在Java代碼中所定義的對象實例.當(dāng)Velocity應(yīng)用于Web開發(fā)時,界面設(shè)計人員可以和Java程序開發(fā)人員同步開發(fā)一個遵循MVC架構(gòu)的Web站點,也就是說,頁面設(shè)計人員可以只關(guān)注頁面的顯示效果,而由Java程序開發(fā)人員關(guān)注業(yè)務(wù)邏輯編碼.Velocity真正的做到了系統(tǒng)控制層和人機交互界面的分離,這種分層的設(shè)計模式有利于web站點的長期維護.

?采用Servlet、HTML、JavaScript、Applet、XML實現(xiàn)界面表示層功能.

?采用Session Bean實現(xiàn)業(yè)務(wù)邏輯層功能.

?利用應(yīng)用服務(wù)器的JDBC(Java Database Connectivity)驅(qū)動實現(xiàn)數(shù)據(jù)訪問層功能.

?采用JMS(Java Messaging service)實現(xiàn)消息服務(wù).

4 結(jié) 語

根據(jù)用戶檢索需求的特點并結(jié)合了語義網(wǎng)的相關(guān)知識,提出了一種基于特定問題的概念關(guān)聯(lián)檢索思路,目前從技術(shù)上實現(xiàn)起來主要有以下難點:

相關(guān)領(lǐng)域本體的構(gòu)建.本體是共享概念模型的明確的形式化規(guī)范說明,而領(lǐng)域本體的目標(biāo)是捕獲相關(guān)的領(lǐng)域的知識,提供對該領(lǐng)域知識的共同理解,確定該領(lǐng)域內(nèi)共同認(rèn)可的詞匯,并從不同層次的形式化模式上給出這些詞匯(術(shù)語)和詞匯之間相互關(guān)系的明確定義.而構(gòu)建具有良好的概念層次結(jié)構(gòu)和對邏輯推理的支持,能在基于語義的檢索中有廣泛應(yīng)用的領(lǐng)域本體是一個復(fù)雜的工程,檢索領(lǐng)域目前應(yīng)用較多的還是比較初級的詞表等形式.

擴展參照檢索的算法.由于參照的是一個主題模式而不是幾個相關(guān)的詞,因此對模式的匹配需要有新的策略,而模式本身的復(fù)雜的概念體系也要求檢索過程必須采取一定的策略,如關(guān)聯(lián)層級限制,來保證輸出結(jié)果集的精練.

結(jié)果排序.由于不再是基于關(guān)鍵詞的匹配,其輸出結(jié)果需要按照語義相關(guān)度來排序.文中目前提供的排序方式還只是一種基于位置的簡單處理,很難從語義層面體現(xiàn)相關(guān)性的重要程度.

概念檢索主要包含了兩個方面的內(nèi)容,即同義擴展檢索和相關(guān)概念聯(lián)想.因此,相關(guān)概念的關(guān)聯(lián)和參照檢索是概念檢索的重要研究內(nèi)容.基于問題的語義關(guān)聯(lián)的擴展參照檢索,實際上是一種概念關(guān)聯(lián)檢索.要構(gòu)建出實用的概念關(guān)聯(lián)檢索系統(tǒng),還必須進一步結(jié)合語義網(wǎng)、本體論以及AI領(lǐng)域的NLP等語義層面的表示及推理技術(shù)

[1]HANAN U.Information Filtering:Overview of Issues,Research and Systems[J].User Modeling and User-Adapted Interaction 2001,11:203-259.

[2]COHENW.Fast effective rule induction[C]//Machine Learning:Proceedings of the Twelfth International Conference,Lake Taho,California,Mongan Kanfmann,1995:115-123.

[3]QUINLAN JR.Induction of decision trees[J].Machine Learning,1986,(1):81-106.

[4]于 玲,吳鐵軍.集成學(xué)習(xí):Boosting算法綜述[J].模式識別與人工智能,2004,17(1):52-59.

[5]王海川,張麗明.一種新的Adaboost訓(xùn)練算法[J].復(fù)旦學(xué)報:自然科學(xué)版,2004,43(1):27-32.

[6]黃萱菁.基于向量空間模型的文本過濾系統(tǒng)[J].軟件學(xué)報,2002,13(4):15.

[7]郭 聳,洪炳镕,陳鳳東.基于嵌入式Linux和Web服務(wù)器的網(wǎng)絡(luò)視頻監(jiān)控系統(tǒng)[J].哈爾濱商業(yè)大學(xué)學(xué)報:自然科學(xué)版,2005,21(6):736-738.

猜你喜歡
詞表腳本調(diào)用
酒駕
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會項目名稱漢英對照詞表
安奇奇與小cool 龍(第二回)
核電項目物項調(diào)用管理的應(yīng)用研究
LabWindows/CVI下基于ActiveX技術(shù)的Excel調(diào)用
快樂假期
小編的新年愿望
基于系統(tǒng)調(diào)用的惡意軟件檢測技術(shù)研究
敘詞表與其他詞表的互操作標(biāo)準(zhǔn)
利用RFC技術(shù)實現(xiàn)SAP系統(tǒng)接口通信
龙泉市| 永登县| 靖宇县| 台山市| 辉南县| 龙里县| 涟水县| 陇南市| 平邑县| 黔南| 阜平县| 息烽县| 天气| 安丘市| 乐东| 柳河县| 望奎县| 黄山市| 恩施市| 白玉县| 万源市| 惠东县| 永城市| 岑溪市| 定南县| 巴林左旗| 靖宇县| 青海省| 瑞金市| 育儿| 渑池县| 墨江| 漳州市| 六枝特区| 东明县| 木里| 新干县| 榕江县| 宁河县| 大余县| 张北县|