国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于可信Web服務(wù)的信息查詢技術(shù)的研究

2012-04-29 00:44:03錢宏彭敦陸
電腦知識與技術(shù) 2012年2期
關(guān)鍵詞:WEB服務(wù)

錢宏 彭敦陸

摘要:隨著Internet的普及,利用WEB服務(wù)進(jìn)行各類信息的查詢已經(jīng)成為人們工作、生活、娛樂中必不可少的一部分了。越來越多的個人、企業(yè)、學(xué)校等利用萬維網(wǎng)發(fā)布形形色色的信息,與此同時也有越來越多的個人、企業(yè)用戶在網(wǎng)絡(luò)中查詢信息,基于可信WEB服務(wù)的信息查詢技術(shù)可以幫助我們安全、快捷、方便的查找到所需的資料。

關(guān)鍵詞:Web服務(wù);可信;信息查詢

中圖分類號:TP312文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2012)02-0249-03

Research on Information Technology of Trust WEB Service

QIAN Hong1,2, PENG Dun-lu1

(1. School of Optical-Electrical and Computer Engineering , University of Shanghai for Science and Technology, Shanghai 200093, Chi? na; 2. Shanghai Zhonghua College of Vocational Technology , Shanghai 201404, China)

Abstract: With the popularity of the internet, using web service for various information–searching has become an indispensable part in peoples working, daily life, and even in their entertainment. And more and more individuals, companies and schools release all kinds of in? formation through internet. At the same time, more internet users are looking for information on line. The trust web services information technology will help people search information securely, fast and conveniently.

Key words: web service; incredible; information search

在Internet網(wǎng)絡(luò)中,對Web站點(diǎn)中的信息進(jìn)行查詢是非常頻繁的操作,但面對海量的網(wǎng)絡(luò)信息我們的查詢存在著很多安全隱患和查詢效率低下的煩惱。導(dǎo)致查詢效率低下的原因主要有兩個:一是Internet網(wǎng)絡(luò)中的信息浩瀚無邊且與日俱增,Web信息沒有統(tǒng)一的模式結(jié)構(gòu)。二是Internet網(wǎng)絡(luò)中目前還沒有非常完善的查詢技術(shù)來有效的幫助用戶查詢符合用戶需求的信息。查詢效率的高低與查詢算法設(shè)計的好壞是密切相關(guān)的。本文主要討論:可信Web服務(wù),Web服務(wù)的安全性和Web查詢技術(shù)。

1可信Web服務(wù)

由于互聯(lián)網(wǎng)的開放性和不完善性,目前的互聯(lián)網(wǎng)中存在著很多不安全的因素,而Web服務(wù)的靈活性在一定程度上也潛在著安全缺陷,所以確保Web服務(wù)的安全性是一個非常重要的問題,這就要求能夠采取各種有效措施來抵御各種攻擊。應(yīng)用安全模型、安全機(jī)制等可以確保Web服務(wù)的完整性、私密性和安全性。

1.1 Web服務(wù)的安全通信

Web服務(wù)是采用SOAP協(xié)議標(biāo)準(zhǔn)來交換消息的,提高Web服務(wù)的可信性也就是提高SOAP消息的可信度。我們可以對SOAP消息的傳送的三步驟:信息序列化?傳送?反序列化進(jìn)行改進(jìn):

1)服務(wù)請求者向服務(wù)提供者發(fā)送ClientHello消息;

2)服務(wù)提供者對收到ClientHello消息進(jìn)行簽名,再發(fā)送給服務(wù)請求者;

3)服務(wù)請求者對服務(wù)提供者進(jìn)行身份認(rèn)證,若通過,則生成會話密鑰和進(jìn)一步的請求,對請求消息進(jìn)行安全處理,并連同自己的證書一起發(fā)送給服務(wù)提供者。

4)服務(wù)提供者收到請求消息后,首先對服務(wù)請求者進(jìn)行驗(yàn)證,若通過,則建立會話,完成對請求消息的后續(xù)處理,并對處理結(jié)果進(jìn)行MAC計算;

5)服務(wù)請求者收到響應(yīng)消息后,進(jìn)行簽名、加密等處理,并使用會話密鑰對處理結(jié)果進(jìn)行MAC計算;

6)服務(wù)提供者收到上一步的請求消息后,驗(yàn)證會話的有效性,若通過,則驗(yàn)證MAC的有效性,并對請求消息進(jìn)行后續(xù)處理,否則,若會話標(biāo)識符無效或MAC驗(yàn)證無效,則向服務(wù)請求者發(fā)出錯誤消息。

這一會話過程是有時間限制的,若會話未超時,則重復(fù)步驟5、6,否則重復(fù)步驟1~6。若通信發(fā)生較嚴(yán)重的錯誤時,則會導(dǎo)致會話終止,通信失敗,發(fā)送錯誤信息。

1.2 Web服務(wù)的安全機(jī)制

1.2.1加密機(jī)制

目前用于網(wǎng)絡(luò)通信安全的密碼技術(shù)主要有對稱加密、非對稱加密。

對稱加密:發(fā)送者和接收者都使用相同的密鑰對數(shù)據(jù)進(jìn)行加密和解密,一般用于加密大量數(shù)據(jù)。對稱密鑰技術(shù)的常用算法有DES、IDEA、RC2、RC4、SKIPJACK。對稱加密算法的加密處理簡單,加密解密速度快。但密鑰管理困難。

非對稱加密:發(fā)送者和接收者使用不同的密鑰對數(shù)據(jù)進(jìn)行加密和解密。非對稱密鑰技術(shù)的典型算法有RSA、DSA。非對稱加密算法解決了密鑰管理的困難,密鑰是事先分配的無需在通信過程中傳輸,所以安全性很高,且具有很高的加密強(qiáng)度,但非對稱加密系統(tǒng)的加密和解密速度慢。

1.2.2安全認(rèn)證機(jī)制

為了確保信息的安全、真實(shí)、可靠,我們必須有一種機(jī)制來驗(yàn)證信息傳遞中各方的真實(shí)身份,安全認(rèn)證包括安全管理、加密處理、PKI和認(rèn)證管理等問題。目前常用的安全認(rèn)證機(jī)制有:數(shù)字摘要、數(shù)字時間戳、數(shù)字簽名、數(shù)字證書等。1.2.3訪問控制策略

訪問控制是維護(hù)網(wǎng)絡(luò)系統(tǒng)安全、保護(hù)網(wǎng)絡(luò)資源的最重要的核心策略之一,有效的訪問控制可以保證網(wǎng)絡(luò)資源不被非法使用和非法訪問。目前常用的訪問控制策略有:入網(wǎng)訪問控制、操作權(quán)限控制、目錄安全控制。

2信息查詢技術(shù)

信息查詢一般都是借助搜索引擎頁面來實(shí)現(xiàn),即輸入關(guān)鍵詞利用搜索引擎在索引數(shù)據(jù)庫中進(jìn)行相關(guān)信息的查找,并將結(jié)果返回給用戶。除了根據(jù)需要選擇不同的搜索引擎之外,我們可以根據(jù)不同的查詢需求采用不同的查詢技術(shù)來提高查詢效率。

2.1盲目查詢

盲目查詢又叫做無信息查詢,即按照預(yù)定的控制策略實(shí)行查詢,在查詢過程中獲取的中間信息不用來改進(jìn)控制策略。盲目查詢方法有寬度優(yōu)先、深度優(yōu)先、代價優(yōu)先、混合、向前、向后、雙向等等。

2.2啟發(fā)式查詢

把求解問題的具體領(lǐng)域的知識加入查詢算法中,控制整個查詢過程,以提高算法效率的查詢方法叫做啟發(fā)式查詢。啟發(fā)式查詢過程中最重要的事件就是尋找和決定要擴(kuò)展的下一個節(jié)點(diǎn),用來估算節(jié)點(diǎn)希望程度的量度,叫做估價函數(shù)。一個節(jié)點(diǎn)的“希望度”在狀態(tài)空間問題中,可以估算目標(biāo)節(jié)點(diǎn)到此節(jié)點(diǎn)的距離或者解答路徑包括被估價過的節(jié)點(diǎn),并計算全條路徑的長度或難度。每個不同的衡量標(biāo)準(zhǔn)只能考慮該問題中這個節(jié)點(diǎn)的某些決定性特性,所以我們可以對給定節(jié)點(diǎn)與目標(biāo)節(jié)點(diǎn)進(jìn)行比較,以決定相關(guān)特性。

2.3多元搜索查詢技術(shù)

網(wǎng)絡(luò)中信息的種類繁復(fù),單一的搜索工具根本無法滿足用戶的需求。多元搜索引擎是一種集合式的搜索引擎,它可以將多個搜索引擎集成在一起,并提供一個統(tǒng)一的檢索界面,且能將一個檢索提問同時發(fā)送給多個搜索引擎,達(dá)到同時檢索多個數(shù)據(jù)庫,再經(jīng)過聚合、去除重復(fù)項(xiàng)之后輸出檢索結(jié)果。多元搜索引擎可以大大節(jié)省檢索時間。多元搜索引擎適合查詢一些較模糊的提問,或就某一課題的網(wǎng)絡(luò)資源進(jìn)行快速調(diào)查、摸底、綜覽。

2.4常用的查詢算法

實(shí)現(xiàn)搜索引擎最關(guān)鍵的就是搜索算法的實(shí)現(xiàn),PageRank和HITS都是典型的網(wǎng)絡(luò)搜索查詢算法,我們可以把這兩種算法應(yīng)用到可信Web服務(wù)的查詢技術(shù)中來。

2.4.1 PageRank算法

PageRank算法主要基于重要性平均分配的思想進(jìn)行設(shè)計的。

假定Nu是頁面u的出度,Rank(u)是u的重要性。PageRank假設(shè)u通過指向v的直接鏈接將一部分重要性(量化為Rank(u)/Nu)傳遞給了v頁面。同樣,v頁面的重要性是所有直接鏈接到v的頁面累積起來的。(Ranki(u)÷Nu)

注:Bv代表直接對v鏈接的所有頁面的集合。

基于這個思想,通過迭代算法,我們可以得到所有頁面的重要性。

2.4.2 HITS算法

HITS(Hyperlink-Induced Topic Search,超鏈接誘導(dǎo)的主題搜索)算法是Kleinberg在90年代末提出的基于鏈接分析的網(wǎng)頁排名算法。

HITS算法的基本思想:HITS由用戶的檢索主題得到一個初始結(jié)果,構(gòu)成一個算法的根集。設(shè)置非負(fù)權(quán)威權(quán)重ap和非負(fù)中心權(quán)重h與數(shù)據(jù)庫基本集中的每一個頁面p相關(guān),將所有的a和h值都初始化為相同的常數(shù)。權(quán)重規(guī)范處理,維護(hù)所有權(quán)重的平方和為1。權(quán)威與中心的權(quán)重可按如下公式更新:

第一個公式表明,如果一個頁面被很多好的中心所指向,則其權(quán)威權(quán)重應(yīng)當(dāng)增加(即,它為所有指向它的頁面的當(dāng)前中心權(quán)重之和)。第二個公式表明,如果一個頁面指向許多好的權(quán)威頁面,則其中心權(quán)重應(yīng)當(dāng)增加(即,它為該頁面指向的所有頁面的權(quán)威權(quán)重之和)。

我們用{1,2,…,n}對頁面編號,定義它們的鄰接矩陣A為n×n矩陣,如果頁面i鏈接到頁面就j,則A(i,j)為1,否則為0。類似地,定義權(quán)威權(quán)重向量a=(a1,a2,…,an),和中心權(quán)重向量h=(h1,h2,…h(huán)n)??傻?/p>

h=A·a a=AT·h

注:AT是A的轉(zhuǎn)置矩陣。對兩公式展開k次,就有h=A·a=AATh=(AAT)h=(AAT)2h=…=(AAT)kh a=AT·h=ATAa=(ATA)a=(ATA)2a=…=(ATA)

根據(jù)線性代數(shù),當(dāng)規(guī)范化后,這兩個迭代序列分別收斂于主本真向量AAT和ATA,這就證明了權(quán)威和中心權(quán)重是所收集的鏈接頁面的固有特征,并且不受初始權(quán)重設(shè)置的影響。而在實(shí)際應(yīng)用中HITS算法的查詢也具有非常好的搜索結(jié)果。

2.4.3查詢算法的改進(jìn)

PageRank算法和HITS算法雖然都是鏈接分析算法,但都存在著不足。PageRank算法會忽略了網(wǎng)頁的內(nèi)容,他的authority值只是相對于某個檢索主題的權(quán)重,而HITS算法存在著“主題漂移”的現(xiàn)象。下面對兩種算法進(jìn)行改進(jìn),以便解決他們的不足。

首先利用HITS的方法構(gòu)造出算法的基本集,用戶的查詢請求來了之后,我們首先用一個現(xiàn)有的商業(yè)搜索引擎進(jìn)行查詢,從得到的查詢結(jié)果中取出一定量的信息作為算法的根集,將該根集進(jìn)行擴(kuò)充,將根集中的所有頁面的出度和入度網(wǎng)頁都補(bǔ)充進(jìn)來,形成新的基本集。然后再利用PageRank算法。

PageRank算法原先是對萬維網(wǎng)的整體分析,可以對用戶的要求進(jìn)行快速的響應(yīng)。而HITS算法是對萬維網(wǎng)的部分進(jìn)行分析,依賴于用戶查詢,實(shí)時性差。改進(jìn)后的算法主要是通過把HITS生成查詢基本集的方法應(yīng)用到PageRank算法中,這樣就彌補(bǔ)了PageR? ank算法中頁面內(nèi)容無關(guān)性的缺點(diǎn)。新算法中引用了PageRank算法中的排序機(jī)制,也笑容削弱了HITS算法中的“主題漂移”的缺點(diǎn)。

3結(jié)束語

利用Internet進(jìn)行信息查詢已經(jīng)成為人們生活、工作、娛樂中必不可少的一部分。目前我們用得比較多的還是關(guān)鍵詞查詢,隨著XML語言的廣泛應(yīng)用和Web搜索技術(shù)的發(fā)展,專業(yè)、快捷、有效的查詢技術(shù)將越來越被人們所研究和使用。

參考文獻(xiàn):

[1] Papazoglou M P.Web Services Principles and Technology[M].北京:機(jī)械工業(yè)出版社,2010.

[2] Han Jiawei,Kamber M.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社.2007

[3]孟小峰.Web數(shù)據(jù)管理研究綜述[J].計算機(jī)研究與發(fā)展,2001(4).

[4]顧寧,劉家茂,柴曉路.Web Services原理與研發(fā)實(shí)踐[M].北京:機(jī)械工業(yè)出版社,2006.

猜你喜歡
WEB服務(wù)
現(xiàn)代SOA架構(gòu)差旅報銷系統(tǒng)的設(shè)計與實(shí)現(xiàn)分析
基于3G技術(shù)的智能水表WEB服務(wù)系統(tǒng)的研究
基于Web服務(wù)的SPSS與.NET系統(tǒng)集成開發(fā)
軟件(2016年4期)2017-01-20 09:28:12
基于線性回歸的航班延誤預(yù)測研究與系統(tǒng)開發(fā)
基于Proteus的嵌入式以太網(wǎng)Web服務(wù)虛擬實(shí)驗(yàn)的設(shè)計與實(shí)現(xiàn)
智慧校園一卡通與圖書館系統(tǒng)對接探究
軟件(2016年5期)2016-08-30 18:28:31
教學(xué)工作量管理系統(tǒng)的設(shè)計與實(shí)現(xiàn)
一種基于SOA的web異構(gòu)數(shù)據(jù)集成方法研究
基于Agent的自演化Web服務(wù)機(jī)制研究
基于ARM平臺的嵌入式Web服務(wù)器設(shè)計
英吉沙县| 涪陵区| 乌什县| 敦煌市| 宁阳县| 都安| 延津县| 呼图壁县| 上杭县| 大关县| 海兴县| 寿宁县| 东莞市| 巴青县| 云南省| 尖扎县| 邛崃市| 郸城县| 临朐县| 含山县| 图们市| 肇源县| 西吉县| 西畴县| 石台县| 泸西县| 友谊县| 普宁市| 兴隆县| 永春县| 凤山县| 融水| 象山县| 巴中市| 方山县| 宁陵县| 黎平县| 修文县| 江安县| 莱阳市| 旌德县|