王興菲,萬健, 3,陳璐,殷昱煜,俞立峰
?
基于受限玻爾茲曼機(jī)的Web服務(wù)質(zhì)量預(yù)測方法
王興菲1, 2,萬健1, 2, 3,陳璐1, 2,殷昱煜1, 2,俞立峰4
(1. 杭州電子科技大學(xué)計(jì)算機(jī)學(xué)院,浙江 杭州,310018;2. 復(fù)雜系統(tǒng)建模與仿真教育部重點(diǎn)實(shí)驗(yàn)室,浙江 杭州,310018;3. 浙江科技學(xué)院 信息與電子工程學(xué)院,浙江 杭州,310023;4. 杭州核新同花順網(wǎng)絡(luò)信息股份有限公司,浙江 杭州,310023)
針對協(xié)同過濾算法無法有效處理數(shù)據(jù)稀疏的問題,提出1種基于受限玻爾茲曼機(jī)的Web服務(wù)質(zhì)量(QoS)預(yù)測方法;第1階段使用受限玻爾茲曼機(jī)模型對所有缺失的QoS值進(jìn)行預(yù)測,并對原始的QoS矩陣進(jìn)行填充;在第2階段基于該QoS矩陣進(jìn)行全局鄰居篩選,同時(shí)將受限玻爾茲曼機(jī)引入到用戶近鄰的協(xié)同過濾模型中,以預(yù)測目標(biāo)QoS值。研究結(jié)果表明:該方法能提高QoS預(yù)測精確度,在一定程度上降低數(shù)據(jù)稀疏對預(yù)測的影響。
Web服務(wù);服務(wù)質(zhì)量預(yù)測;協(xié)同過濾;受限玻爾茲曼機(jī)
Web服務(wù)分為功能性屬性和非功能需屬性,其中,服務(wù)質(zhì)量(quality of service,QoS)通常用來描述非功能屬性[1]?;赒oS的Web服務(wù)預(yù)測是服務(wù)推薦的重要基礎(chǔ)[2]。隨著互聯(lián)網(wǎng)技術(shù)不斷發(fā)展,功能相似的Web 服務(wù)數(shù)量大量增加,如何提高QoS預(yù)測精度進(jìn)行有效的Web服務(wù)推薦是服務(wù)推薦領(lǐng)域的熱點(diǎn)問題。目前,協(xié)同過濾由于具有簡易性而受到了廣泛關(guān)注[3]。在服務(wù)推薦領(lǐng)域,許多研究者開始將協(xié)同過濾應(yīng)用于QoS預(yù)測[2],并取得了較好的效果。傳統(tǒng)協(xié)同過濾算法主要分為基于近鄰和基于模型2類[4]。基于近鄰的協(xié)同過濾算法具有很好的可解釋性以及較高的預(yù)測精確度,但無法有效處理數(shù)據(jù)稀疏情況[5]。由于數(shù)據(jù)稀疏,基于近鄰的協(xié)同過濾算法無法準(zhǔn)確地獲取相似鄰居進(jìn)而無法進(jìn)行精確預(yù)測,因此,人們提出基于模型的協(xié)同過濾。目前,基于模型的協(xié)同過濾算法包括奇異值分解(singular value decomposition, SVD)模型[6]以及基于受限玻爾茲曼機(jī)(restricted Boltzmann machine, RBM)的無向圖模型[7]。奇異值分解模型通過降低矩陣維度進(jìn)行模型學(xué)習(xí),對稀疏問題并不敏感。近年來,RBM模型因其具有有效的特征提取能力和泛化能力以及較強(qiáng)的可靠性,在推薦系統(tǒng)領(lǐng)域受到較大的關(guān)注。在數(shù)據(jù)稀疏情況下,RBM能根據(jù)歷史行為提取有效的目標(biāo)特征進(jìn)行預(yù)測。但是,RBM需要從全局進(jìn)行訓(xùn)練,在預(yù)測中易產(chǎn)生局部最優(yōu)而影響預(yù)測精度?;诮彽膮f(xié)同過濾雖是從局部中學(xué)習(xí),但數(shù)據(jù)稀疏會導(dǎo)致其無法獲得準(zhǔn)確的局部信息來進(jìn)行精確預(yù)測。本文作者將兩者融合,提出一種基于受限玻爾茲曼機(jī)的Web服務(wù)QoS預(yù)測算法;通過訓(xùn)練基于RBM的協(xié)同過濾模型提取目標(biāo)近鄰的特征,將目標(biāo)特征用于第1階段預(yù)測,利用這些預(yù)測結(jié)果填充用戶服務(wù)矩陣以降低數(shù)據(jù)稀疏的影響;在第2階段,利用重新形成的用戶服務(wù)矩陣進(jìn)行全局篩選,并使用基于RBM與用戶近鄰融合的協(xié)同過濾模型預(yù)測得到最終QoS結(jié)果。
基于受限玻爾茲曼機(jī)的Web服務(wù)QoS預(yù)測算法框架如圖1所示。由圖1可知:在第1階段,該方法使用基于RBM的協(xié)同過濾模型進(jìn)行預(yù)測,并將其結(jié)果填充于用戶服務(wù)矩陣,緩解了數(shù)據(jù)稀疏問題。在第2階段,通過重新形成的用戶服務(wù)矩陣進(jìn)行全局篩選,使用基于RBM與用戶近鄰融合的協(xié)同過濾模型進(jìn)行預(yù)測,最終得到QoS預(yù)測結(jié)果。
RBM是一種無監(jiān)督的、具有2層結(jié)構(gòu)、對稱連接且無自反饋的隨機(jī)神經(jīng)網(wǎng)絡(luò)模型。該網(wǎng)絡(luò)模型可以視為1個(gè)無向圖,由一些可見單元(對應(yīng)可見變量,即訓(xùn)練數(shù)據(jù)集項(xiàng)目數(shù))和一些隱藏單元(對應(yīng)隱藏變量,可視為特征提取器)構(gòu)成。只有可見單元和隱藏單元之間才會存在邊,可見單元之間以及隱藏單元之間都不會有邊連接。RBM模型是一種基于能量的模型,能量最小化時(shí)網(wǎng)絡(luò)達(dá)到理想狀態(tài),而網(wǎng)絡(luò)的訓(xùn)練就是最小化其能量函數(shù)。
圖1 基于受限玻爾茲曼機(jī)的Web服務(wù)QoS預(yù)測框架圖
基于受限波爾茲曼機(jī)模型的協(xié)同過濾模型如圖2所示。該模型將可見單元轉(zhuǎn)化為1個(gè)維的0?1向量單元。其中,表示評分范圍,將用戶評分所在的分量置為1,其余分量置為0。其次,對于沒有評分的數(shù)據(jù)用單元表示,且這類單元不與隱藏單元連接,可將其視為分量全為0的向量單元。
圖2 基于受限波爾茲曼機(jī)的協(xié)同過濾模型圖
本研究中,由于用戶服務(wù)矩陣中的QoS值為浮點(diǎn)數(shù),考慮到RBM需要的為整數(shù),由QoS值四舍五入得到。在本文采用的數(shù)據(jù)集中,范圍為[0, 1, …, 20]。
該模型的能量函數(shù)為
由于RBM層間全連接,層內(nèi)無連接,可見單元和隱藏單元之間是獨(dú)立的特殊結(jié)構(gòu)。當(dāng)給定可見單元時(shí),各個(gè)隱藏單元的激活概率之間是相互獨(dú)立的;反之,當(dāng)給定隱藏單元時(shí),各個(gè)可見單元的激活概率之間也是相互獨(dú)立的,且RBM結(jié)構(gòu)是對稱的,因此,根據(jù)得到的可見單元和隱藏單元可以分別得到第個(gè)隱藏單元和第個(gè)可見單元的激活概率:
HINTON[8]提出了基于對比散度的快速學(xué)習(xí)算法(contrastive divergence,簡稱CD算法)。有了以上條件概率,就可以直接使用CD算法訓(xùn)練RBM,其中各參數(shù)的更新準(zhǔn)則如下:
模型訓(xùn)練好后,若用戶調(diào)用服務(wù)的QoS值已知,則該用戶調(diào)用服務(wù)的QoS值為的概率可直接通過公式求出。根據(jù)RBM預(yù)測當(dāng)前用戶調(diào)用服務(wù)的QoS值為
在第2階段預(yù)測中,首先利用填充后的QoS矩陣全局篩選相似鄰居,然后通過基于RBM與用戶近鄰的協(xié)同過濾模型預(yù)測最終QoS結(jié)果。
1.3.1 相似度計(jì)算
1.3.2 全局篩選
全局篩選相似鄰居流程圖如圖3所示。傳統(tǒng)的協(xié)同過濾算法僅僅使用有調(diào)用目標(biāo)服務(wù)記錄的用戶作為相似鄰居,忽略了具有較高相似度但有未調(diào)用目標(biāo)服務(wù)記錄的用戶以及具有相同網(wǎng)絡(luò)位置的用戶,導(dǎo)致基于近鄰協(xié)同過濾算法在數(shù)據(jù)稀疏的情況下篩選鄰居不準(zhǔn)確。為了提高篩選準(zhǔn)確率,本文作者在相似度的基礎(chǔ)上利用網(wǎng)絡(luò)位置信息與RBM預(yù)測結(jié)果進(jìn)行進(jìn)一步篩選。
網(wǎng)絡(luò)位置信息包括自主網(wǎng)絡(luò)系統(tǒng)(autonomous system, AS)與國家。將具有相同AS的用戶聚類為1組,稱為AS用戶組;再將具有相同國家的用戶聚類為1組,稱為國家用戶組。在基于相似度篩選的基礎(chǔ)上,將處于同一AS或是同一國家的用戶視為相似 鄰居。
通過第1階段預(yù)測,QoS矩陣得到了填充,緩解了由于數(shù)據(jù)稀疏性而無法得到準(zhǔn)確近鄰的問題。在第2階段預(yù)測中,利用通過填充后的QoS矩陣進(jìn)行全局篩選,充分考慮了具有較高相似度但有未調(diào)用目標(biāo)服務(wù)記錄的用戶。
最后,通過加入網(wǎng)絡(luò)位置信息的全局篩選結(jié)果得到最終的相似鄰居集合(),()包括原始未調(diào)用目標(biāo)服務(wù)記錄的用戶1()以及原始有調(diào)用目標(biāo)服務(wù)記錄的用戶集合2()。
1.3.3 基于受限玻爾茲曼機(jī)與用戶近鄰的QoS預(yù)測方法
由于QoS值屬于離散分布,而RBM需要從全局進(jìn)行訓(xùn)練,在預(yù)測中易產(chǎn)生局部最優(yōu)?;诮彽膮f(xié)同過濾雖是從局部中學(xué)習(xí),但因?yàn)閿?shù)據(jù)稀疏而無法獲得準(zhǔn)確的局部信息,為此,本文作者提出基于RBM與用戶近鄰的QoS預(yù)測方法,并構(gòu)建基于RBM的Web服務(wù)QoS預(yù)測模型。
首先基于用戶近鄰的協(xié)同過濾算法,根據(jù)TopK算法選擇與目標(biāo)用戶最為相似的用戶鄰居集合,記為N()。其次,通過該目標(biāo)用戶的相似鄰居集合對目標(biāo)服務(wù)的歷史行為預(yù)測目標(biāo)用戶對目標(biāo)服務(wù)的行為?;谟脩艚彽膮f(xié)同過濾算法表達(dá)式為
在基于用戶近鄰協(xié)同過濾算法的基礎(chǔ)上,構(gòu)建基于RBM的Web服務(wù)QoS預(yù)測模型:
最后,將所得模型命名為基于受限玻爾茲曼機(jī)的Web服務(wù)QoS預(yù)測模型(RBMCF)。
實(shí)驗(yàn)采用WSDream公開數(shù)據(jù)集[9]。該數(shù)據(jù)集包括5 825個(gè)服務(wù)和339個(gè)用戶,以及2個(gè)服務(wù)質(zhì)量屬性即響應(yīng)時(shí)間和吞吐量。本文使用其中的響應(yīng)時(shí)間數(shù)據(jù)集,該數(shù)據(jù)集被廣泛用于QoS預(yù)測準(zhǔn)確度評估,因此,基于該數(shù)據(jù)集的實(shí)驗(yàn)是可信且可靠的。
實(shí)驗(yàn)采用平均絕對誤差MAE,即計(jì)算預(yù)測值與實(shí)際值的平均誤差來評估系統(tǒng)的推薦質(zhì)量,MAE越小,則預(yù)測的準(zhǔn)確率越高。MAE的計(jì)算公式如下:
同時(shí)使用歸一化平均絕對誤差NMAE來進(jìn)一步衡量算法的預(yù)測準(zhǔn)確度。歸一化平均絕對誤差的計(jì)算公式如下:
式中:t為測試集;為測試集中待預(yù)測服務(wù)質(zhì)量的個(gè)數(shù);(,)為測試集中待預(yù)測服務(wù)質(zhì)量的(用戶,服務(wù))對。平均絕對誤差和歸一化平均絕對誤差越小,表示預(yù)測準(zhǔn)確度越高。
在真實(shí)環(huán)境下,用戶服務(wù)矩陣是非常稀疏的,用戶通常只調(diào)用少部分服務(wù),不同用戶之間重合的服務(wù)調(diào)用更稀少。為了模擬真實(shí)環(huán)境,本文作者從原始WSDream數(shù)據(jù)集中抽取部分?jǐn)?shù)據(jù)作為訓(xùn)練集,其余則為測試集。本文選取4個(gè)不同稀疏度的訓(xùn)練集進(jìn)行實(shí)驗(yàn),稀疏度分別為5%,10%,15%和20%,其余全部作為測試集。對4個(gè)不同稀疏度的訓(xùn)練集進(jìn)行10次實(shí)驗(yàn)并取平均結(jié)果作為最終結(jié)果。
為了更好地評估本文提出算法的性能,本文實(shí)現(xiàn)下述幾個(gè)常見的服務(wù)質(zhì)量值預(yù)測算法,并在該實(shí)驗(yàn)集上進(jìn)行了大量比較實(shí)驗(yàn)。
1) UserMean。該方法通過求每個(gè)用戶的平均QoS值對缺失值進(jìn)行預(yù)測。
2) RBM[7]。該方法是利用RBM的算法對缺失值進(jìn)行預(yù)測。
3) ItemMean。該方法通過求每個(gè)Web服務(wù)的平均QoS值對缺失值進(jìn)行預(yù)測。
4) UPCC[10]。該方法基于用戶協(xié)同過濾算法,使用皮爾遜相似度計(jì)算用戶間的相似度。
5) IPCC[11]。該方法采用基于物品的協(xié)同過濾算法,使用皮爾遜相似度計(jì)算物品間的相似度。
6) WSRec[9]。該方法對UPCC和IPCC的預(yù)測結(jié)果進(jìn)行線性組合,將線性組合后的值作為預(yù)測結(jié)果。
7) LFM[6]。該方法通過對用戶服務(wù)矩陣進(jìn)行降維分解,發(fā)現(xiàn)用戶與服務(wù)之間的隱含特征,根據(jù)隱含特征信息來進(jìn)行預(yù)測。
8) NLBR[12]。該方法利用網(wǎng)絡(luò)位置信息結(jié)合矩陣分解發(fā)現(xiàn)隱含特征,并進(jìn)行預(yù)測。
表1所示為不同訓(xùn)練矩陣密度下不同模型的預(yù)測性能比較。表1中,MAE為平均絕對誤差,NMAE為歸一化平均絕對誤差,為訓(xùn)練矩陣的數(shù)據(jù)稀疏度。從表1可以看出:本文提出的預(yù)測方法RBMCF的預(yù)測準(zhǔn)確度比其他方法的高;另外,在不同數(shù)據(jù)稀疏度下,算法的性能差異不明顯,特別是在數(shù)據(jù)稀疏性高的情況下,RBMCF模型的預(yù)測準(zhǔn)確度仍舊較高,這說明RBMCF能夠較好地應(yīng)對數(shù)據(jù)稀疏性問題。
參數(shù)u表示協(xié)同過濾算法中基于相似度為用戶選擇的相似鄰居數(shù)量,其中相似度是基于歷史數(shù)據(jù)并使用平均歐式距離計(jì)算得到的。平均歐式距離越大,表示用戶之間的相似度越小。圖4所示為不同數(shù)據(jù)稀疏度下,u對預(yù)測準(zhǔn)確度的影響。數(shù)據(jù)稀疏度越高,意味著可用信息越少。
表1 不同訓(xùn)練矩陣密度情況下不同模型的預(yù)測性能比較
d/%:(a) 5;(b) 10;(c) 15;(d) 20
從圖4可以看出:在初始階段,隨著u逐漸增大,MAE迅速減小。這是因?yàn)殡S著相似鄰居數(shù)量增多,選中目標(biāo)用戶真正的相似鄰居的可能性變大,同時(shí),由于本文利用全局信息進(jìn)行相似鄰居篩選,會添加那些因稀疏而被過濾的用戶(這些用戶和目標(biāo)用戶表現(xiàn)出很強(qiáng)的相似性,卻因?yàn)闆]有公用調(diào)用記錄而被過濾),同時(shí)排除那些因?yàn)榕既辉虺蔀橄嗨凄従拥挠脩?這些用戶和目標(biāo)用戶并沒有表現(xiàn)出很強(qiáng)的相似性,僅僅因?yàn)樾枰獫M足相似鄰居數(shù)量而成為目標(biāo)用戶的相似鄰居),因此,相似鄰居的可靠性增強(qiáng)。由此可見,通過使用全局過濾可以提高篩選鄰居準(zhǔn)確度進(jìn)而提高模型的預(yù)測精確度。
另一方面,當(dāng)u增大到一定程度后,MAE趨向于平緩,這是由于參數(shù)取較大值后,相似度的定義變得寬松,很多相似性不強(qiáng)的用戶也被篩選為目標(biāo)用戶的相似用戶,影響了預(yù)測精確度。
目前,已有大量基于近鄰的協(xié)同過濾方法被成功應(yīng)用于實(shí)際系統(tǒng)中[13?14]。WU等[15]提出了1種基于新型相似度計(jì)算方法的協(xié)同過濾算法。該方法采用比例值作為新的相似度度量方法,提高了預(yù)測準(zhǔn)確度且計(jì)算時(shí)間更短。TANG等[16]提出了利用位置信息的協(xié)同過濾算法并將其應(yīng)用于服務(wù)推薦,使得篩選鄰居更加準(zhǔn)確。
基于近鄰的協(xié)同過濾算法的難點(diǎn)之一是數(shù)據(jù)稀疏問題[5]。由于數(shù)據(jù)稀疏,基于近鄰的協(xié)同過濾算法無法準(zhǔn)確獲取相似鄰居進(jìn)而無法進(jìn)行精確預(yù)測。近年來,已有研究者提出了解決基于近鄰協(xié)同過濾算法數(shù)據(jù)稀疏問題的方法。WU等[17]提出了1種利用時(shí)間感知的基于近鄰的協(xié)同過濾方法,在高稀疏度情況下有較高的精確度。但基于近鄰的方法難以處理大數(shù)據(jù)量,有研究者提出基于模型的協(xié)同過濾方法,主要有SVD模型[18]、外觀模型[19]以及基于RBM的協(xié)同過濾方法[7]。YU等[20]提出1種結(jié)合了相似鄰居的隱語義(latent matrix factorization, LFM)模型,提高了服務(wù)推薦的精確性。外觀模型是1種概率隱空間模型,使用偏好因子的1個(gè)凸組合來對用戶偏好進(jìn)行建模[19]。
RBM的快速學(xué)習(xí)算法即對比散度(contrastive divergence, CD)算法[8]具有強(qiáng)大的非監(jiān)督學(xué)習(xí)能力,引起了研究者的密切關(guān)注。RBM成功地應(yīng)用于解決協(xié)同過濾、圖像特征提取等機(jī)器學(xué)習(xí)問題[21]。近年來,RBM在推薦系統(tǒng)中也得到了應(yīng)用[22]。實(shí)踐表明,RBM是一種有效的特征提取方法[23],能有效地應(yīng)對數(shù)據(jù)稀疏情況;將RBM用于初始化前饋神經(jīng)網(wǎng)絡(luò)可明顯提高泛化能力,多個(gè)RBM堆疊組成的深度置信網(wǎng)絡(luò)能提取更抽象的特征[24]。SALAKHUTDINOV等[7]提出了基于RBM模型的協(xié)同過濾算法,其對傳統(tǒng)的受限玻爾茲曼機(jī)進(jìn)行改造以處理協(xié)同過濾問題:首先,將可見單元轉(zhuǎn)化為1個(gè)維的0?1向量單元;其次,對于沒有評分的數(shù)據(jù)用缺失單元表示,且這類單元不與隱藏單元連接。GEORGIEV等[25]提出了1個(gè)基于實(shí)值的RBM模型并改進(jìn)了模型的訓(xùn)練過程,使RBM的可見單元可以直接表示為實(shí)值,模型的訓(xùn)練和預(yù)測也得到簡化。由于基于近鄰的方法與基于模型的方法各有優(yōu)缺點(diǎn),KOREN等[26]提出將矩陣分解與近鄰方法相結(jié)合,并取得了較好的預(yù)測結(jié)果。然而,這些基于近鄰的協(xié)同過濾方法忽略了具有較高相似度但有未調(diào)用目標(biāo)服務(wù)記錄的用戶,因此,無法準(zhǔn)確地篩選相似鄰居。同時(shí),RBM在應(yīng)用中易產(chǎn)生局部最優(yōu)導(dǎo)致無法得到精確的預(yù)測結(jié)果。
1) 本文提出了1種基于受限玻爾茲曼機(jī)的Web服務(wù)QoS預(yù)測算法;通過引入受限玻爾茲曼機(jī)降低數(shù)據(jù)稀疏對預(yù)測結(jié)果的影響,并結(jié)合基于用戶的協(xié)同過濾算法得到最終QoS預(yù)測結(jié)果。
2) 本文算法的QoS預(yù)測算法結(jié)果優(yōu)于已有的協(xié)同過濾模型所得結(jié)果。
[1] LIU Yutu, NGU A H, ZENG Liangzhao. QoS computation and policing in dynamic web service selection[C]// Proceedings of the 13th International World Wide Web Conference on Alternate Track Papers & Posters. New York, USA: ACM, 2004: 66?73.
[2] ZHENG Zibin, MA Hao, LYU M R, et al. QoS-aware web service recommendation by collaborative filtering[J]. IEEE Transactions on Services Computing, 2011, 4(2): 140?152.
[3] LANGSETH H, NIELSEN T D. Scalable learning of probabilistic latent models for collaborative filtering[J]. Decision Support Systems, 2015, 74: 1?11.
[4] BREESE J S, HECKERMAN D, KADIE C. Empirical analysis of predictive algorithms for collaborative filtering[J]. Uncertainty in Artificial Intelligence, 1998, 98(7): 43?52.
[5] MIHA Gr?ar, DUNJA Mladeni?, BLA? Fortuna, et al. Data sparsity issues in the collaborative filtering framework[C]// International Workshop on Knowledge Discovery on the Web. Berlin, Germany: Springer, 2005: 58?76.
[6] KOREN Y, BELL R, VOLINSKY C. Matrix factorization techniques for recommender systems[J]. Computer, 2009, 42(8): 30?37.
[7] SALAKHUTDINOV R, MNIH A, HINTON G. Restricted Boltzmann machines for collaborative filtering[C]// International Conference on Machine Learning. New York, USA: ACM, 2007: 791?798.
[8] HINTON G E. Training products of experts by minimizing contrastive divergence[J]. Neural Computation, 2002, 14(8): 1771?1800.
[9] ZHENG Zibin, MA Hao, LYU M R, et al. WSRec: a collaborative filtering based web service recommender system[C]// International Conference on Web Services. Washington D C, USA: IEEE Computer Society, 2009: 437?444.
[10] RESNICK P, IACOVOU N, SUCHAK M, et al. GroupLens: an open architecture for collaborative filtering of netnews[C]// ACM Conference on Computer Supported Cooperative Work. New York, USA: ACM, 1994: 175?186.
[11] SARWAR B, KARYPIS G, KONSTAN J, et al. Item-based collaborative filtering recommendation algorithms[C]// International Conference on World Wide Web. New York, USA: ACM, 2001: 285?295.
[12] ZHOU Li, SONG Zhibo, ZHAI Suichu, et al. Predicting web service QoS via combining matrix factorization with network location[J]. International Journal of u- and e-Service, Science and Technology, 2014, 7(3): 303?318.
[13] HERLOCKER J L, KONSTAN J A, BORCHERS A, et al. An algorithmic framework for performing collaborative filtering[C]// Proceedings of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. New York, USA: ACM, 1999: 230?237.
[14] LINDEN G, SMITH B, YORK J. Amazon.com recommendations: item-to-item collaborative filtering[J]. IEEE Internet Computing, 2003, 7(1): 76?80.
[15] WU Xiaokun, CHENG Bo, CHEN Junliang. Collaborative filtering service recommendation based on a novel similarity computation method[J]. IEEE Transactions on Services Computing, 2017, 10(3): 352?365.
[16] TANG Mingdong, JIANG Yechun, LIU Jianxun, et al. Location-aware collaborative filtering for QoS-based service recommendation[C]// IEEE, International Conference on Web Services.Washington D C, USA: IEEE Computer Society, 2012: 202?209.
[17] WU Chen, QIU Weiwei, WANG Xinyu, et al. Time-aware and sparsity-tolerant QoS prediction based on collaborative filtering[C]// IEEE International Conference on Web Services (ICWS). Washington D C, USA: IEEE Computer Society, 2016: 637?640.
[18] ZHANG Sheng, WANG Weihong, FORD J, et al. Using singular value decomposition approximation for collaborative filtering[C]// Seventh IEEE International Conference on E-Commerce Technology. Washington D C, USA: IEEE Computer Society, 2005: 257?264.
[19] HOFMANN T, PUZICHA J. Latent class models for collaborative filtering[C]//Proceedings of the Sixteenth International Joint Conference on Artificial Intelligence. San Francisco, USA: Morgan Kaufmann Publishers, 1999: 688?693.
[20] YU Dongjin, LIU Yu, XU Yueshen, et al. Personalized QoS prediction for web services using latent factor models[C]//IEEE International Conference on Services Computing. Washington D C, USA: IEEE Computer Society, 2014: 107?114.
[21] MIDHUN, M. E, NAIR, et al. Deep model for classification of hyperspectral image using restricted Boltzmann machine[C]//Proceedings of the 2014 International Conference on Interdisciplinary Advances in Applied Computing. New York, USA: ACM, 2014: 1?7.
[22] HINTON G E. A practical guide to training restricted Boltzmann machines[M]. Berlin, Germany: Springer, 2012: 599?619.
[23] TRAMEL E W, MANOEL A, CALTAGIRONE F, et al. Inferring sparsity: compressed sensing using generalized restricted Boltzmann machines[C]// IEEE Information Theory Workshop (ITW). Washington D C, USA: IEEE, 2016: 265?269.
[24] POLANIA L, BARNER F, KENNETH E, et al. Exploiting restricted Boltzmann machines and deep belief networks in compressed sensing[J]. IEEE Transactions on Signal Processing, 2017, 65(17): 4538?4550.
[25] GEORGIEV K, NAKOV P. A non-IID framework for collaborative filtering with restricted Boltzmann machines[C]// Proceedings of the 30th International Conference on Machine Learning. New York, USA: ACM, 2013: 1148?1156.
[26] KOREN Y. Factorization meets the neighborhood: a multifaceted collaborative filtering model[C]// International Conference on Knowledge Discovery and Data Mining. New York, USA: ACM, 2008: 426?434.
(編輯 伍錦花)
Web service QoS prediction based on restricted Boltzmann machines
WANG Xingfei1, 2, WAN Jian1, 2, 3, CHEN Lu1, 2, YIN Yuyu1, 2, YU Lifeng4
(1. School of Computer, Hangzhou Dianzi University, Hangzhou 310018, China; 2. Key Laboratory of Complex Systems Modeling and Simulation of Ministry of Education,Hangzhou 310018, China; 3. School of Information and Electronic Engineering,Zhejiang University of Science and Technology, Hangzhou 310023, China; 4. Hithink RoyalFlush Information Network Co. Ltd., Hangzhou 310023, China)
Considering that collaborative filtering algorithm can not cope with data sparseness effectively, an approach for Web service QoS prediction based on restricted Boltzmann machine was proposed. In the first phase, restricted Boltzmann machine was used to predict all the missing QoS values and fill the original QoS matrix. In the second phase, global filtering was performed based on the filled QoS matrix to obtain the neighbors. Then restricted Boltzmann machine was integrated into user-based collaborative filtering model to predict target QoS values. The results show that the proposed method can improve the accuracy of QoS prediction and reduce the effect of data sparsity on prediction to a certain extent.
Web service; QoS prediction; collaborative filtering; restricted Boltzmann machine
10.11817/j.issn.1672-7207.2018.11.015
TP312
A
1672?7207(2018)11?2745?08
2017?12?11;
2018?01?28
國家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2017YFB1400601);浙江省自然科學(xué)基金資助項(xiàng)目(LY12F02003);國家自然科學(xué)基金資助項(xiàng)目(61100043) (Project(2017YFB1400601) supported by the National Key R&D Program of China; Project(LY12F02003) supported by the Natural Science Foundation of Zhejiang Province; Project(61100043) supported by the National Natural Science Foundation of China)
殷昱煜,博士,碩士生導(dǎo)師,從事服務(wù)計(jì)算、業(yè)務(wù)流程管理、形式化方法研究;E-mail: yinyuyu@hdu.edu.cn