董學(xué)文,劉昊哲,喬慧,鄭佳偉
(西安電子科技大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,陜西 西安 710071)
自2004 年服務(wù)計(jì)算的概念被正式提出以來,服務(wù)計(jì)算和云計(jì)算一直在高速發(fā)展。越來越多的服務(wù)信息需要在互聯(lián)網(wǎng)上發(fā)布,并推薦給適合的用戶使用。在這個(gè)過程中,服務(wù)發(fā)布系統(tǒng)是核心和關(guān)鍵。
本文解決的問題主要針對(duì)冷啟動(dòng)用戶(即新進(jìn)入系統(tǒng)缺乏用戶行為特征的用戶)的區(qū)塊鏈服務(wù)發(fā)布和推薦。因?yàn)樾掠脩羧狈τ脩籼卣?,所以無法準(zhǔn)確地用常用的協(xié)同過濾(CF,collaborative filtering)等算法進(jìn)行推薦。
如圖1 所示,傳統(tǒng)的服務(wù)發(fā)布系統(tǒng)由以下3 個(gè)角色組成:服務(wù)請(qǐng)求者、服務(wù)提供者和服務(wù)管理中心。該系統(tǒng)的基本模型為:首先服務(wù)請(qǐng)求者向服務(wù)發(fā)布系統(tǒng)發(fā)出服務(wù)請(qǐng)求,服務(wù)管理中心在接收到服務(wù)請(qǐng)求之后發(fā)布其服務(wù);然后有多個(gè)服務(wù)提供者競爭;最后服務(wù)請(qǐng)求者選擇服務(wù)提供者來滿足其請(qǐng)求。
圖1 傳統(tǒng)服務(wù)發(fā)布系統(tǒng)
但是,這種模型存在嚴(yán)重不足。首先,這種傳統(tǒng)的服務(wù)發(fā)布系統(tǒng)容易受到分布式拒絕服務(wù)(DDoS,distributed denial of service)攻擊、遠(yuǎn)程劫持和惡作劇攻擊,使某些服務(wù)發(fā)布功能無法使用。其次,大多數(shù)服務(wù)發(fā)布系統(tǒng)都運(yùn)行在集中式服務(wù)器上,極易受到攻擊,同時(shí)可能導(dǎo)致單點(diǎn)故障。再次,用戶的敏感信息(例如姓名、電子郵件地址和電話號(hào)碼)和任務(wù)解決方案保存在服務(wù)管理中心的數(shù)據(jù)庫中,這存在數(shù)據(jù)丟失或篡改的風(fēng)險(xiǎn)。最后,對(duì)于這種服務(wù)發(fā)布系統(tǒng),傳統(tǒng)信任模型的弱點(diǎn)仍然是不可避免的挑戰(zhàn)。
當(dāng)前,已經(jīng)有一些工作試圖解決這些問題。例如,分布式體系結(jié)構(gòu)用于確保傳統(tǒng)服務(wù)發(fā)布系統(tǒng)的正常運(yùn)行,同時(shí),采用加密等方法來保護(hù)用戶隱私與數(shù)據(jù)隱私,并提出了評(píng)分機(jī)制,以確保服務(wù)提供者和服務(wù)請(qǐng)求者之間相互信任,最大限度地避免作弊。
但是,這些問題很難被同時(shí)解決,而且這種傳統(tǒng)的三角形結(jié)構(gòu)在信任方面也不可避免地存在弱點(diǎn)。因此,本文提出一種基于區(qū)塊鏈的分布式服務(wù)發(fā)布系統(tǒng)框架,以盡可能解決上述問題,使服務(wù)發(fā)布系統(tǒng)更加安全、可靠、公平。與傳統(tǒng)的服務(wù)發(fā)布系統(tǒng)架構(gòu)不同,本文提出的模型中,服務(wù)提供者將可以提供的服務(wù)發(fā)布到互聯(lián)網(wǎng)上,然后服務(wù)管理中心向服務(wù)請(qǐng)求者推薦以進(jìn)行瀏覽和選擇,最后服務(wù)請(qǐng)求者與服務(wù)提供者進(jìn)行交易。同時(shí),還應(yīng)注意在各種服務(wù)中如何準(zhǔn)確有效地推薦服務(wù)請(qǐng)求者所需要的服務(wù)。協(xié)同過濾算法是一種廣泛應(yīng)用的推薦算法,利用某興趣相投、擁有共同經(jīng)驗(yàn)之群體的喜好來推薦用戶感興趣的信息,個(gè)人通過合作的機(jī)制給予信息相當(dāng)程度的回應(yīng)(如評(píng)分)并被記錄下來以達(dá)到過濾的目的,進(jìn)而幫助別人篩選信息,回應(yīng)不一定局限于特別感興趣的信息,特別不感興趣的信息的記錄也相當(dāng)重要[1]。傳統(tǒng)的CF 模型側(cè)重于單域用戶偏好預(yù)測,存在數(shù)據(jù)稀疏的問題。實(shí)際場景中經(jīng)常存在多個(gè)項(xiàng)目領(lǐng)域,并且不同域中的用戶偏好是相關(guān)的,例如喜歡幽默書的用戶通常偏愛喜劇電影。因此,跨域協(xié)同過濾(CDCF,cross-domain collaborative filtering)被提出以通過多域評(píng)估來豐富目標(biāo)領(lǐng)域的知識(shí),并且這已成為一個(gè)新興的研究主題。由于數(shù)據(jù)極為稀少,因此在一個(gè)區(qū)域內(nèi)向冷啟動(dòng)用戶提供可靠的推薦結(jié)果仍然具有挑戰(zhàn)性。但是,大多數(shù)CDCF 模型,例如CBT(code book transfer)[2]、RMGM(rating-matrix generative model)[3]和TCF(transfer by collective factorization)[4],都是為了減輕單域數(shù)據(jù)問題而設(shè)計(jì)的,未能充分討論如何有效地實(shí)現(xiàn)冷啟動(dòng)用戶的精準(zhǔn)推薦。
此外,還有一個(gè)問題亟待解決。一個(gè)不太喜歡參與某一項(xiàng)目領(lǐng)域的用戶可能參與另一個(gè)項(xiàng)目領(lǐng)域[5],例如電影和音樂代表著不同的領(lǐng)域。因此,本文專注于為冷啟動(dòng)用戶提供跨域推薦,并根據(jù)其中的項(xiàng)目類型級(jí)別對(duì)域進(jìn)行分類。例如,科幻電影和喜劇電影屬于同一領(lǐng)域。在本文的問題設(shè)置中,冷啟動(dòng)用戶僅在輔助域中評(píng)分,這與以前的大多數(shù)工作不同。在不考慮冷啟動(dòng)用戶的情況下,假設(shè)輔助域中的數(shù)據(jù)相對(duì)于目標(biāo)域中的數(shù)據(jù)[6]更小,多個(gè)域中共同出現(xiàn)的用戶稱為鏈接用戶。鏈接用戶是模型跨領(lǐng)域的知識(shí)橋梁。向目標(biāo)域中的冷啟動(dòng)用戶進(jìn)行推薦是一項(xiàng)艱巨的任務(wù)。首先,不同項(xiàng)目域的評(píng)分矩陣存在稀疏情況,因此如何更好地建模用戶在不同域中的獨(dú)特特征變得非常重要。其次,在目標(biāo)域中沒有冷啟動(dòng)用戶的評(píng)分?jǐn)?shù)據(jù),并且在不同域中用戶的評(píng)分行為或偏好設(shè)置是相關(guān)但不同的。因此,應(yīng)該轉(zhuǎn)讓哪些知識(shí)以及如何跨域轉(zhuǎn)讓知識(shí)仍然是一個(gè)需要解決的問題。
隨著網(wǎng)絡(luò)和移動(dòng)設(shè)備的爆炸性增長,網(wǎng)頁和服務(wù)發(fā)布的組合研究已成為一種新興趨勢(shì)。研究人員已經(jīng)提出了一些服務(wù)架構(gòu)和推薦技術(shù)。
面向服務(wù)的體系結(jié)構(gòu)(SOA,service-oriented architecture)具有比傳統(tǒng)體系結(jié)構(gòu)更多的功能,如可重用性、可組合性、分布式部署和其他功能,因此在業(yè)界得到了廣泛認(rèn)可。近年來,面向服務(wù)的體系結(jié)構(gòu)已經(jīng)被討論了很多次,但是尚未確定最合適的方法。Anurag 等[7]為了解決面向服務(wù)的體系結(jié)構(gòu)中的服務(wù)識(shí)別問題,包括自下而上和自上而下的功能,提出了一種“中間相遇”方法模型。Zisman 等[8]提出了基于統(tǒng)一建模語言(UML,unified modeling language)的服務(wù)發(fā)現(xiàn)框架,它是面向服務(wù)的體系結(jié)構(gòu)中最可靠的服務(wù)識(shí)別機(jī)制之一。Cheng 等[9]提出了一種面向SOA 的安全體系結(jié)構(gòu)設(shè)計(jì)。Hasselbring 等[10]指出,微服務(wù)架構(gòu)提供了可以彼此獨(dú)立部署和擴(kuò)展的小型服務(wù),并且可以使用不同的中間件堆棧來實(shí)現(xiàn)它們。微服務(wù)架構(gòu)旨在克服單片架構(gòu)的缺點(diǎn),在單片架構(gòu)中,所有應(yīng)用程序邏輯和數(shù)據(jù)都在可部署單元中進(jìn)行管理。Sill[11]在物聯(lián)網(wǎng)的背景下提出了一種微服務(wù)架構(gòu)的新范式,同時(shí)指出了采用微服務(wù)架構(gòu)的優(yōu)勢(shì)。
推薦技術(shù)方面,為了更準(zhǔn)確、更有效地?cái)M合觀察到的等級(jí),研究人員提出了大量的單域?qū)?、次矩陣分解模型[12-13]。Razzaque 等[14]認(rèn)為,鄰域模型可以有效地檢測局部關(guān)系,而潛在特征模型通??梢杂行У毓烙?jì)整體結(jié)構(gòu)。Wang 等[15]則利用這2 種方法,將用戶相似度納入矩陣分解過程。TagiCoFi[16]旨在提高傳統(tǒng)矩陣分解(MF,matrix factorization)模型[17-19]的性能,可以看作MF 模型的總結(jié)[20],其中每個(gè)域都有其自己的用戶因子矩陣,但它依賴于標(biāo)簽信息,另外也未考慮冷啟動(dòng)用戶。
對(duì)于冷啟動(dòng)問題,目前已有基于標(biāo)記和審查的跨域分解模型[21-24]。文獻(xiàn)[25-26]嘗試使用多層感知機(jī)(MLP,multilayer perceptron)和轉(zhuǎn)換矩陣來映射跨域用戶特征向量,但它們考慮了所有鏈接用戶,導(dǎo)致計(jì)算量較大,并且特征提取效果不佳。Wang 等[15]提出了一種針對(duì)目標(biāo)域中冷啟動(dòng)用戶的跨域潛在特征映射(CDLFM,cross-domain latent feature mapping)模型,該模型在矩陣分解過程中考慮了用戶相似性。但是,它僅包含一個(gè)輔助域,由于相似度的計(jì)算成本高而需花費(fèi)更多時(shí)間,并且由于考慮每個(gè)冷啟動(dòng)用戶的個(gè)性化功能而增加了模型的復(fù)雜性。本文以一種更易于解釋的方式綜合多個(gè)域中映射的潛在特征。
國內(nèi)區(qū)塊鏈技術(shù)的應(yīng)用研究方面,何蒲等[27]對(duì)區(qū)塊鏈技術(shù)的應(yīng)用前景進(jìn)行了總體性概述,對(duì)相關(guān)應(yīng)用問題進(jìn)行了深入探討。王妙娟[28]和張小華[29]論述了區(qū)塊鏈技術(shù)在物流快遞中的應(yīng)用場景。許濤[30]從教育的維度,討論了在教育領(lǐng)域應(yīng)用區(qū)塊鏈技術(shù)的可能性與現(xiàn)狀。王凱正[31]就眾籌模式存在的第三方支付信任問題,設(shè)計(jì)了基于區(qū)塊鏈技術(shù)的眾籌平臺(tái)。王博等[32]以區(qū)塊鏈技術(shù)為基礎(chǔ),提出智慧平臺(tái)建設(shè),利用智能合約將智慧城市各個(gè)部分進(jìn)行整合,并結(jié)合大數(shù)據(jù)技術(shù),有效解決了成本、開放度、靈活性等問題。韓爽等[33]針對(duì)傳統(tǒng)交易平臺(tái)不能保證資產(chǎn)安全性的問題,提出了利用區(qū)塊鏈技術(shù)實(shí)施新型數(shù)字資產(chǎn)安全交易的方案。
本節(jié)描述基于區(qū)塊鏈的服務(wù)發(fā)布系統(tǒng)模型及其工作流程。
本文所提的服務(wù)發(fā)布系統(tǒng)模型主要包含以下4種角色:服務(wù)請(qǐng)求者、服務(wù)提供者、服務(wù)管理中心以及區(qū)塊鏈,具體如圖2 所示。
圖2 服務(wù)發(fā)布系統(tǒng)模型
服務(wù)請(qǐng)求者將服務(wù)請(qǐng)求信息發(fā)送給服務(wù)管理中心,服務(wù)管理中心將這些信息存儲(chǔ)在區(qū)塊鏈上,并等待服務(wù)提供者接受服務(wù)請(qǐng)求信息,服務(wù)允許請(qǐng)求者和服務(wù)提供者瀏覽區(qū)塊鏈上所有已發(fā)布的服務(wù)請(qǐng)求。
區(qū)塊結(jié)構(gòu)如圖3 所示。區(qū)塊結(jié)構(gòu)中,首先是一個(gè)與其他塊區(qū)分的唯一編碼格式,稱為區(qū)塊格式。下一個(gè)字段是區(qū)塊的大小,其表示該字段之后區(qū)塊的大小。區(qū)塊頭在區(qū)塊大小之后,存儲(chǔ)了區(qū)塊的頭信息,主要由版本號(hào)、上一個(gè)區(qū)塊的哈希值、本區(qū)塊體的哈希值(Merkel 根),以及時(shí)間戳、難度目標(biāo)、Nonce 等信息組成。其對(duì)區(qū)塊網(wǎng)絡(luò)中保持不變性起到至關(guān)重要的作用。當(dāng)攻擊者想要修改區(qū)塊頭時(shí),攻擊者應(yīng)該能夠從創(chuàng)世塊開始修改所有區(qū)塊頭,以偽造該區(qū)塊的記錄。但是,區(qū)塊頭包含上一個(gè)區(qū)塊的哈希,即sha-256 哈希,此哈希值的作用是不更改上一個(gè)區(qū)塊頭就無法更改當(dāng)前區(qū)塊頭,這樣可以最大限度地保證鏈上各區(qū)塊的完整性,有助于確保網(wǎng)絡(luò)的更高級(jí)別的安全性。在惡意活動(dòng)的情況下,區(qū)塊不匹配將警告系統(tǒng)可觸發(fā)數(shù)據(jù)取證可疑事件。
區(qū)塊頭之后是區(qū)塊信息字段,存儲(chǔ)服務(wù)管理中心的節(jié)點(diǎn)簽名、服務(wù)提供者的信息、服務(wù)請(qǐng)求者的信息以及服務(wù)相關(guān)狀態(tài)的信息和服務(wù)進(jìn)度情況。
服務(wù)發(fā)布系統(tǒng)交互過程如圖4 所示。首先,服務(wù)請(qǐng)求者和服務(wù)提供者由服務(wù)管理中心進(jìn)行注冊(cè)和統(tǒng)一管理。每個(gè)提供者都具有代表其服務(wù)質(zhì)量的評(píng)分。該分?jǐn)?shù)的初始值是此類服務(wù)的所有提供者的平均分?jǐn)?shù)。服務(wù)請(qǐng)求者根據(jù)其提供的服務(wù)質(zhì)量進(jìn)行評(píng)價(jià),使服務(wù)質(zhì)量評(píng)分增加或減少。系統(tǒng)會(huì)將與該服務(wù)提供者過往評(píng)分相差較大的數(shù)據(jù)作為惡意數(shù)據(jù)剔除,并將其余有效數(shù)據(jù)計(jì)算平均分,作為該服務(wù)提供者的正式評(píng)分。服務(wù)發(fā)布系統(tǒng)會(huì)將每個(gè)服務(wù)提供者和請(qǐng)求者的用戶信息存儲(chǔ)在數(shù)據(jù)庫中,以便隨時(shí)查閱。
圖3 區(qū)塊結(jié)構(gòu)
本文所提的服務(wù)發(fā)布系統(tǒng)中,要求服務(wù)提供者將他們可以提供的服務(wù)信息上傳到服務(wù)管理中心,并在數(shù)據(jù)庫中存儲(chǔ)信息。服務(wù)請(qǐng)求者創(chuàng)建賬戶后,服務(wù)管理中心將根據(jù)請(qǐng)求者的個(gè)人偏好向其推薦服務(wù)。同時(shí),服務(wù)請(qǐng)求者可以查看任何服務(wù)提供者的服務(wù)評(píng)估,并決定是否向其發(fā)布請(qǐng)求。
圖4 服務(wù)發(fā)布系統(tǒng)交互過程
服務(wù)提供者接受請(qǐng)求后,服務(wù)管理中心將服務(wù)內(nèi)容、服務(wù)提供者的詳細(xì)信息、服務(wù)傭金和其他相關(guān)內(nèi)容通知服務(wù)請(qǐng)求者。當(dāng)服務(wù)請(qǐng)求者確認(rèn)信息并同意時(shí),服務(wù)管理中心正式創(chuàng)建服務(wù)合同并將其上傳到區(qū)塊鏈。在服務(wù)合同生效期間,服務(wù)提供者將定期上傳當(dāng)前服務(wù)的最新進(jìn)度,以確保服務(wù)請(qǐng)求者可以隨時(shí)檢查請(qǐng)求進(jìn)度。服務(wù)提供者終止服務(wù)時(shí),將最后一次上傳服務(wù)進(jìn)度,服務(wù)管理中心將結(jié)果反饋給服務(wù)請(qǐng)求者。服務(wù)請(qǐng)求者確認(rèn)服務(wù)的完成,并支付相應(yīng)的傭金。同時(shí),服務(wù)提供者應(yīng)根據(jù)服務(wù)的相關(guān)條件進(jìn)行升級(jí),以影響其當(dāng)前得分的變化。最后,服務(wù)提供者收到傭金,服務(wù)合同正式終止。從服務(wù)請(qǐng)求者創(chuàng)建請(qǐng)求直到服務(wù)提供者收到傭金的過程中,服務(wù)管理中心都會(huì)在區(qū)塊鏈上記錄每個(gè)合同的更改,以防篡改。整個(gè)事務(wù)結(jié)束后,事務(wù)的備份將存儲(chǔ)在數(shù)據(jù)庫中。
本節(jié)詳細(xì)介紹解決冷啟動(dòng)問題的具體推薦過程。本文的模型中有3 個(gè)域,包括2 個(gè)輔助域和一個(gè)目標(biāo)域。輔助域中的評(píng)分矩陣為和。Rs表示對(duì)2 個(gè)輔助域中的數(shù)據(jù)進(jìn)行篩選后形成的一個(gè)矩陣,即可以作為一個(gè)新的輔助域。目標(biāo)域中的評(píng)分矩陣為,其中,?表示缺失的評(píng)分值,Uc和Pc分別表示聚類級(jí)矩陣Rc經(jīng)過分解后,得到的輔助域中用戶和產(chǎn)品的潛在特征。Ut和Pt分別表示目標(biāo)域中用戶和產(chǎn)品的集合。參考Wang 等[15]對(duì)2 個(gè)域情況下冷啟動(dòng)用戶的跨域推薦的定義,本文定義了3個(gè)域的情況下冷啟動(dòng)用戶的跨域推薦,具體定義參考文獻(xiàn)[15,34]。
本文的TADCDR(two auxiliary domains-base cross-domain recommendation)模型的工作流程如圖5 所示,主要包括3 個(gè)階段:潛在特征模型建立、潛在特征映射以及個(gè)性化的跨域推薦。在潛在特征模型的建立過程中,采用K-means 聚類算法建立用戶和產(chǎn)品之間的聚類級(jí)矩陣Rc。同時(shí),本文考慮目標(biāo)域中的用戶評(píng)分行為的相似性,以獲得目標(biāo)域內(nèi)用戶和項(xiàng)目的潛在特征。然后,在潛在特征映射過程中,為每個(gè)冷啟動(dòng)用戶訓(xùn)練一個(gè)基于MLP 的潛在特征映射函數(shù)。最后,根據(jù)冷啟動(dòng)用戶的偏好為他們提供個(gè)性化的跨域推薦。
3.4.1 潛在特征模型
TADCDR模型工作流程的第一步旨在獲得輔助域和目標(biāo)域中實(shí)體的潛在特征(即用戶或產(chǎn)品)。本節(jié)主要介紹對(duì)輔助域數(shù)據(jù)的處理和對(duì)目標(biāo)域數(shù)據(jù)的處理。
圖5 TADCDR 模型的工作流程
1) 對(duì)輔助域數(shù)據(jù)的處理
①采用偏置矩陣分解,將評(píng)分矩陣R映射到低維度的潛在空間P∈?n×l和Q∈?m×l,其中R=PQT。
② 將K-means聚類算法應(yīng)用于用戶潛在空間P和項(xiàng)目潛在空間Q,使用戶和項(xiàng)目分類到不同的聚類中。
某類用戶對(duì)某類項(xiàng)目的聚類級(jí)評(píng)分矩陣可表示為
2) 對(duì)目標(biāo)域數(shù)據(jù)的處理
首先,對(duì)目標(biāo)域的用戶?項(xiàng)目評(píng)分矩陣進(jìn)行分解,并將用戶之間評(píng)分行為的相似度整合到傳統(tǒng)的矩陣分解過程中。
所述用戶評(píng)分行為相似度的計(jì)算包含3 個(gè)方面:基于共同評(píng)分的相似度、基于不感興趣猜測的相似度以及基于評(píng)分偏好值的相似度。
基于共同評(píng)分的相似度的計(jì)算式為
3.4.2 潛在特征映射
本節(jié)主要介紹知識(shí)遷移的過程。在這個(gè)過程中,系統(tǒng)可以通過訓(xùn)練輔助域和目標(biāo)域的評(píng)分?jǐn)?shù)據(jù)來獲得一個(gè)特征映射函數(shù)以處理潛在特征匹配問題。使用MLP 方法作為映射函數(shù)具有以下優(yōu)點(diǎn)。首先,MLP 可以很容易地捕獲input-output 結(jié)構(gòu),因?yàn)橛成浜瘮?shù)的輸入和輸出都是K維向量。其次,作為一個(gè)非線性變換,MLP 比線性映射函數(shù)更靈活。下面,本文將詳細(xì)描述一個(gè)基于MLP 的潛在特征映射模型。
對(duì)于冷啟動(dòng)用戶,他們只能從輔助域獲得其潛在的特征,而且所獲得的潛在特征不能直接用于個(gè)性化且準(zhǔn)確的推薦。然而,同一用戶在不同領(lǐng)域的潛在特征可能是高度相關(guān)的。所以,本文采用MLP方法來獲得映射函數(shù)Fu以及用戶u在輔助域中的潛在特征向量,通過計(jì)算得到其在目標(biāo)域中的映射特征向量;冷啟動(dòng)用戶對(duì)目標(biāo)域中全體項(xiàng)目Pt的評(píng)分預(yù)測為
3.4.3 個(gè)性化跨域推薦
如果沒有給定目標(biāo)域中某個(gè)用戶或者產(chǎn)品的足夠信息,系統(tǒng)就無法估計(jì)該用戶或者產(chǎn)品的潛在特征以進(jìn)行推薦。通過對(duì)其在輔助域的潛在特征的學(xué)習(xí),以及輔助域與目標(biāo)域之間的映射函數(shù),便可以得到其在目標(biāo)域的相應(yīng)仿射潛在特征。例如,對(duì)于目標(biāo)域中的用戶ui,可以推導(dǎo)出它對(duì)應(yīng)的仿射特征向量為
本節(jié)在所建立的原型系統(tǒng)中,對(duì)所提的服務(wù)發(fā)布框架和推薦方案進(jìn)行性能測試。
本節(jié)研究本文所提模型在真實(shí)的評(píng)分?jǐn)?shù)據(jù)集上的效果,并與其他相關(guān)的跨域推薦模型進(jìn)行比較。具體如下。
CCBMF-PT[22]:一種具有個(gè)性化閾值的聚類級(jí)矩陣分解模型。
EMCDR[23]:一個(gè)跨域推薦嵌入和映射框架。EMCDR 是面向冷啟動(dòng)用戶的最新跨域推薦方法之一。
CDLFM[13]:一種考慮用戶評(píng)分行為的跨域潛在特征映射模型。
4.1.1 實(shí)驗(yàn)設(shè)置
本文從Amazon 平臺(tái)上的評(píng)分?jǐn)?shù)據(jù)中提取了3 個(gè)真實(shí)的數(shù)據(jù)集用于性能評(píng)估,包括多個(gè)目標(biāo)域,如圖書、電影和音樂。首先,過濾很少評(píng)分的錨用戶和產(chǎn)品。為了更好地評(píng)估實(shí)驗(yàn)性能,在每個(gè)數(shù)據(jù)集中隨機(jī)選擇了300 個(gè)用戶的評(píng)分作為訓(xùn)練數(shù)據(jù),剩下的200 個(gè)用戶進(jìn)行測試。潛在特征的維度K分別設(shè)置為5、10、20。
4.1.2 實(shí)驗(yàn)結(jié)果
本文比較了不同模型在不同參數(shù)配置下的性能,調(diào)整了不同模型的參數(shù),并基于多個(gè)參數(shù)設(shè)置的最優(yōu)組合報(bào)告了最佳的實(shí)驗(yàn)結(jié)果。本文以MAE(mean absolute error)為評(píng)價(jià)指標(biāo)。
MAE 是平均絕對(duì)誤差,是所有單個(gè)觀測值與算術(shù)平均值的偏差的絕對(duì)值的平均。平均絕對(duì)誤差可以避免誤差相互抵消的問題,因此可以準(zhǔn)確反映實(shí)際預(yù)測誤差的大小。其計(jì)算式為
其中,TE表示測試集,|TE|表示測試集中評(píng)分的數(shù)量,分別表示用戶u對(duì)產(chǎn)品i的真實(shí)評(píng)分和預(yù)估評(píng)分。MAE 值越小,評(píng)分預(yù)測準(zhǔn)確度越高。
所有對(duì)比模型在不同參數(shù)配置下的MAE 性能如表1 所示。分別以圖書、電影、音樂為目標(biāo)域,MAE 的性能如圖6 所示。從實(shí)驗(yàn)結(jié)果可以看出,在所有推薦模型中,最優(yōu)的是本文所提TADCDR模型。與EMCDR 模型相比,CDLFM 模型具有更好的性能,這表明考慮用戶相似性的方法可以獲得有意義的知識(shí)。TADCDR 模型優(yōu)于CDLFM 模型,這意味著從中學(xué)習(xí)的潛在特征可以提高性能,從類似用戶中學(xué)習(xí)的映射函數(shù)更加合理。與現(xiàn)有模型相比,本文的TADCDR 模型對(duì)高級(jí)跨域潛在特征映射更有效。
表1 不同參數(shù)配置下模型的MAE 值
服務(wù)管理中心會(huì)在頁面上顯示所有已發(fā)布的服務(wù)以及針對(duì)冷啟動(dòng)服務(wù)請(qǐng)求者的個(gè)性化推薦結(jié)果。同時(shí),服務(wù)請(qǐng)求者可以查詢現(xiàn)有服務(wù)的服務(wù)調(diào)用。請(qǐng)求者可以通過服務(wù)被調(diào)用的次數(shù)和提供的服務(wù)的質(zhì)量來大致了解服務(wù)提供者的可靠性,以便提出新的服務(wù)請(qǐng)求或直接選擇現(xiàn)有服務(wù)。
此外,區(qū)塊鏈功能測試如下:圖7 顯示了存儲(chǔ)在單個(gè)塊中的內(nèi)容,包括區(qū)塊提示信息、區(qū)塊哈希塊號(hào)、數(shù)據(jù)和其他詳細(xì)信息。
本文針對(duì)所提系統(tǒng)進(jìn)行了壓力測試,主要針對(duì)系統(tǒng)服務(wù)發(fā)布能力的高并發(fā)性和吞吐量進(jìn)行測試,并采用JMeter 線程組來模擬高并發(fā)情況下的服務(wù)吞吐量性能,實(shí)驗(yàn)結(jié)果如表2 所示。
圖6 不同參數(shù)配置下的MAE 性能
圖7 單個(gè)區(qū)塊信息
根據(jù)實(shí)驗(yàn)結(jié)果分析,系統(tǒng)的并發(fā)線程數(shù)可以達(dá)到1 100。當(dāng)并發(fā)線程數(shù)達(dá)到1 150 和1 200 時(shí),系統(tǒng)的異常率顯著增加,吞吐量顯著下降。
本文在傳統(tǒng)服務(wù)發(fā)布架構(gòu)的基礎(chǔ)上,結(jié)合微服務(wù)架構(gòu),提出了一種具有松耦合、強(qiáng)大的容錯(cuò)能力和服務(wù)子域部署的服務(wù)發(fā)布架構(gòu),引入了區(qū)塊鏈結(jié)構(gòu),可以更好地保證服務(wù)請(qǐng)求者和服務(wù)提供者的信息和財(cái)產(chǎn)安全。在向服務(wù)請(qǐng)求者提供服務(wù)建議方面,本文提出了一種TADCDR 模型,以便為冷啟動(dòng)用戶提供更有效和個(gè)性化的跨域推薦。實(shí)驗(yàn)結(jié)果表明,本文所提的針對(duì)冷啟動(dòng)用戶的個(gè)性化跨域推薦模型優(yōu)于其他推薦方法。此外,本文對(duì)服務(wù)發(fā)布系統(tǒng)進(jìn)行了壓力測試,結(jié)果表明該系統(tǒng)可以為用戶提供穩(wěn)定、可靠、高效和開放的服務(wù)能力。
表2 系統(tǒng)性能