曹秀峰 王燕
摘要:網(wǎng)格環(huán)境下的對數(shù)據(jù)的查詢越來越成為一個關(guān)注的熱點。該文介紹了OGSA-DQP的功能和體系結(jié)構(gòu),并詳細介紹了OGSA-DQP分布式數(shù)據(jù)資源查詢過程,并實現(xiàn)了在不同地理位置上的數(shù)據(jù)資源的查詢訪問。
關(guān)鍵詞:網(wǎng)格;OGSA-DQP;數(shù)據(jù)資源;查詢
中圖分類號:TP311文獻標識碼:A文章編號:1009-3044(2012)09-1973-03
Distributed Query of Data Resource and Application Based on OGSA-DQP
CAO Xiu-feng1, WANG Yan2
(1. Department of Electronic Information Engineering, Bijie Vocational and Technical College, Bijie 551700, China; 2. School of Maths and Computer Science, Bijie University, Bijie 551700, China)
Abstract: Grid environment for data query has increasingly become a focus of attention. This paper describes the OGSA-DQP function and architecture, and details of the OGSA-DQP distributed query process data resources, and realized in different geographic locations of data resources on the query access.
Key words: grid; OGSA-DQP; data resource; query
網(wǎng)格數(shù)據(jù)查詢是網(wǎng)格應用的一個核心問題,隨著網(wǎng)絡信息化與數(shù)據(jù)庫技術(shù)得發(fā)展,如何實現(xiàn)訪問分布在不同地理位置上數(shù)據(jù)資源,已達到相互獲得和使用數(shù)據(jù)資源的目的,以最大化的利用網(wǎng)絡。而開放網(wǎng)格服務架構(gòu)分布式處理器(Open Grid Services Architecture-Distributed Query Processing,簡稱為OGSA-DQP)[1-2],由英國兩所高等大學曼徹斯特大學和紐卡斯爾大學聯(lián)合研制開發(fā)完成的,在開始是OGSA-DAI的一個組成部分。
在分布式數(shù)據(jù)源訪問與集成中間件(OGSA-DAI)的基礎上,OGSA-DQP能對分布式數(shù)據(jù)資源進行查詢和多重數(shù)據(jù)資源的集成訪問支持的中間件,并進一步提高了對數(shù)據(jù)查詢功能的優(yōu)化和評估。
1 OGSA-DQP功能和體系結(jié)構(gòu)
1.1功能
OGSA-DQP是一個基于OGSA-DAI[3]服務的高吞吐量的分布式數(shù)據(jù)流引擎,或者說是在OGSA-DAI數(shù)據(jù)源上,實現(xiàn)基于服務的查詢處理器,并進行分布式查詢的中間件。網(wǎng)格環(huán)境下,它能夠在OGSA-DAI數(shù)據(jù)服務和其它Web服務上執(zhí)行并行查詢。其功能如下:
1)通過優(yōu)化查詢來對專門、繁重、復雜的資源和配置利用來實現(xiàn)決策的自動化。
2)對數(shù)據(jù)庫中元數(shù)據(jù)的網(wǎng)格數(shù)據(jù)庫和與一致性訪問的交互是使用已形成的標準網(wǎng)格數(shù)據(jù)庫服務來提供的。
3)對于較復雜的密集型數(shù)據(jù)請求,吸取并行數(shù)據(jù)庫的技術(shù)來為其提供潛在的并行機制,因此,可以在不同的主機上執(zhí)行高效地并行查詢的各個組成部分。
4)可以進行公開的查詢在對支持網(wǎng)格上可用的Web服務和網(wǎng)格數(shù)據(jù)庫服務,并對合成數(shù)據(jù)的訪問進行高效率的分析。
5)為達到有效評估分布式查詢的目的,可使用OGSA(開放網(wǎng)格服務體系結(jié)構(gòu)研究)的工具來動態(tài)獲得必要的資源。
1.2層次化體系結(jié)構(gòu)
開放網(wǎng)格服務架構(gòu)分布式處理器使用分布式數(shù)據(jù)源訪問與集成中間件體系結(jié)構(gòu)提供的服務來訪問異種數(shù)據(jù)資源,它有一個層次化的結(jié)構(gòu),采用分布式數(shù)據(jù)源訪問與集成中間件框架提供網(wǎng)格數(shù)據(jù)庫服務來統(tǒng)一訪問異種數(shù)據(jù)源。如圖1所示。
在分布式數(shù)據(jù)源訪問與集成中間件的基礎上,OGSA-DQP擴展了其兩個重要服務來實現(xiàn)它的功能:
1)網(wǎng)格查詢評估服務(Grid Query Evaluation Service,簡稱為GQES):也稱為查詢評估服務,該組件被協(xié)調(diào)器服務使用以執(zhí)行由計劃制定器,編譯器和優(yōu)化器生成的查詢計劃。對協(xié)調(diào)器分配的查詢計劃通過每個評估服務來執(zhí)行評估。一組參與查詢的評估服務形成一棵樹,樹的每個葉子都是一個評估服務,它們與網(wǎng)格數(shù)據(jù)服務交互。數(shù)據(jù)就從這些葉子通過樹流向它們的目的地。
圖1 OGSA-DQP層次化體系結(jié)構(gòu)
2)網(wǎng)格分布式查詢服務(Grid Distributed Query Services,簡稱為GDQS):也稱為DQP協(xié)調(diào)器,它是一個接口,主要功能是與客戶端進行交互。DQP協(xié)調(diào)器獲得了元數(shù)據(jù)和計算的資源信息是在創(chuàng)建一個新的協(xié)調(diào)器時,通過協(xié)調(diào)器來分割、編譯、優(yōu)化計算的資源信息和元數(shù)據(jù),并在網(wǎng)格內(nèi)的多個執(zhí)行節(jié)點上制定分布式查詢的執(zhí)行計劃。
2 OGSA-DQP查詢執(zhí)行過程
查詢流程如圖2所示。
圖2 OGSA-DQP查詢過程
1)一個DQP Coordinator包含兩種類型的OGSA-DAI數(shù)據(jù)源:DQP Factory數(shù)據(jù)源和DQP數(shù)據(jù)源。起初,一個已安裝的協(xié)調(diào)器服務只顯示一個Factory數(shù)據(jù)源,然后,這個數(shù)據(jù)源被用來創(chuàng)建DQP數(shù)據(jù)源,DQP數(shù)據(jù)源被客戶用來執(zhí)行查詢。
在初始的第一步中,是在用戶與OGSA-DQP交互,通過使用一個配置好的DQP Factory數(shù)據(jù)源,用戶來創(chuàng)建一個設定的DQP數(shù)據(jù)源。通過發(fā)送OGSA-DAI請求,用戶使用DQPFactory數(shù)據(jù)源與調(diào)用DQPFactory行為進行交互。為了動態(tài)的配置一個DQP數(shù)據(jù)源,DQPFactory行為與DQP Factory數(shù)據(jù)源進行交互。在一個XML文檔中記錄著參數(shù)的形式來表示DQPFactory行為。并在這個文檔精確地指明了如何設定已配置的DQP數(shù)據(jù)源。數(shù)據(jù)庫和查詢評估服務是兩個配置參數(shù),已創(chuàng)建的數(shù)據(jù)源可利用這些查詢評估服務。一個DQP數(shù)據(jù)源被創(chuàng)建和初始化就是交互的結(jié)果,同時,其動態(tài)配置的DQP數(shù)據(jù)源在DQP協(xié)調(diào)器顯示,OGSA-DAI自動為DQP數(shù)據(jù)源指派一個資源ID。
2)在DQP數(shù)據(jù)源初始化的過程中,通過DQP聯(lián)系封裝數(shù)據(jù)庫的OGSA-DAI數(shù)據(jù)源引入數(shù)據(jù)庫。
3)用戶接收在步驟1中所提交的請求的包含資源ID結(jié)果,在接下來的交互過程是,用戶與被創(chuàng)建的DQP數(shù)據(jù)源交互,并用這個資源ID來識別該數(shù)據(jù)源。
4)用戶提交一個包含用SQL或者SQL的子集來描述查詢請求,DQP查詢活動執(zhí)行查詢請求。解析、優(yōu)化查詢、并制定查詢計劃由DQP數(shù)據(jù)源完成。許多個部分被包含在一個被創(chuàng)建的查詢計劃中。其中,每個部分指定一個單獨的查詢評估服務的角色。
5)查詢的各個部分被發(fā)送到相應的查詢評估服務中。
6)通過與OGSA-DAI數(shù)據(jù)源交互一些查詢評估服務可以直接獲取數(shù)據(jù)。
7)在查詢的執(zhí)行過程中,其余的查詢評估服務可以彼此交互以實現(xiàn)它們的角色。
8-9)所得到結(jié)果從查詢評估服務傳送回DQP協(xié)調(diào)器上,并最終將結(jié)果反饋給用戶。
3數(shù)據(jù)資源查詢結(jié)果
3.1創(chuàng)建DQP數(shù)據(jù)服務資源
在不同位置的服務器上,分別創(chuàng)建IP:192.168.120.60數(shù)據(jù)庫服務器和IP:192.168.120.198服務器數(shù)據(jù)庫,并在IP:192.168.120.2的客戶端創(chuàng)建以上兩個數(shù)據(jù)庫服務器的DQP數(shù)據(jù)服務資源,如圖3所示:
圖3 DQP數(shù)據(jù)服務資源
3.2查詢結(jié)果
把兩個來自服務器端的IP:192.168.120.198數(shù)據(jù)庫和IP:192.168.120.60數(shù)據(jù)庫的數(shù)據(jù)資源,通過采用并行的查詢方式,在IP:192.168.120.2的客戶端實現(xiàn)與查詢語句相同的實驗結(jié)果全部顯示出來,其生成查詢結(jié)果如圖4所示。
圖4并行查詢結(jié)果
4結(jié)論
OGSA-DQP主要通過查詢評估服務和DQP協(xié)調(diào)器兩個服務來實現(xiàn)其在不同地理位置上的查詢數(shù)據(jù)資源的功能,當然用戶也可以編寫自己的端口來實現(xiàn)。隨著網(wǎng)格技術(shù)的發(fā)展,通過與OGSA-DAI系統(tǒng)的相互整合,OGSA-DQP系統(tǒng)的功能將更加強大,必然能適應網(wǎng)格技術(shù)的高速發(fā)展。
參考文獻:
[1]戰(zhàn)曉蘇,張少華.網(wǎng)格計算[M].北京:清華大學出版社,2005
[2] Lynden S J,Mukherjee A,Hume A C,et al.The Design and Implementation of OGSA-DQP:A Service-Based Distributed Query Processor[J].Future Generation Comp. Syst, 2009,25(3):224-236.
[3]劉建新,閻保.OGSA-DAI體系結(jié)構(gòu)及其關(guān)鍵技術(shù)研究[J].計算機應用,2004(11):81-83,87.