国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

融合云環(huán)境用戶情境興趣的移動(dòng)SNS信任推薦模型

2018-03-27 03:41:25蘇妍嫄張亞明劉海鷗
關(guān)鍵詞:信任度信任矩陣

宓 翠,陳 晶,蘇妍嫄,張亞明,劉海鷗

(燕山大學(xué) 經(jīng)濟(jì)管理學(xué)院,互聯(lián)網(wǎng)+與產(chǎn)業(yè)發(fā)展研究中心,河北 秦皇島 066004)

1 引 言

在當(dāng)前的“數(shù)字爆炸時(shí)代”,每18個(gè)月產(chǎn)生的數(shù)字信息相當(dāng)于過去幾千年數(shù)據(jù)量的總和.世界最大的在線影片租賃服務(wù)商N(yùn)etflix一直致力于不斷改進(jìn)和完善其個(gè)性化推薦服務(wù),分別于2006、2009年推出兩個(gè)“百萬美元計(jì)劃”以提高其推薦引擎的性能,當(dāng)前Netflix又推出了基于海量數(shù)據(jù)進(jìn)行挖掘的個(gè)性化推薦系統(tǒng),主要用于解決海量數(shù)據(jù)環(huán)境下個(gè)性化推薦所面臨的復(fù)雜信息處理與即時(shí)個(gè)性化服務(wù)問題.然而,海量數(shù)據(jù)環(huán)境下移動(dòng)社會(huì)化推薦對(duì)位置的敏感性、緊急性、便攜性決定了移動(dòng)SNS推薦系統(tǒng)須滿足一些特殊要求:對(duì)用戶興趣變化反應(yīng)快、能處理短期興趣、能處理變化很大的項(xiàng)目屬性、社交屬性、情境敏感等,使傳統(tǒng)CF推薦技術(shù)不能直接平移到移動(dòng)SNS中,由此也導(dǎo)致移動(dòng)推薦的情境信息過載、數(shù)據(jù)稀疏、推薦系統(tǒng)脆弱性與可擴(kuò)展性、推薦結(jié)果多樣性與精確性兩難困境等問題遠(yuǎn)遠(yuǎn)沒有得到解決,難以滿足云計(jì)算服務(wù)時(shí)代大規(guī)模、高質(zhì)量和實(shí)時(shí)性的移動(dòng)SNS用戶個(gè)性化服務(wù)需求.

因此,本文在研究中引入云環(huán)境用戶情境興趣信息參量,基于情境興趣與信任關(guān)系雙重視角,提出融合云環(huán)境用戶情境興趣的移動(dòng)SNS信任推薦模型,深入探討由于海量數(shù)據(jù)信息環(huán)境導(dǎo)致的數(shù)據(jù)稀疏與推薦精度下降的問題,顯著改善傳統(tǒng)移動(dòng)推薦的實(shí)時(shí)性和服務(wù)質(zhì)量,提高大規(guī)模社交網(wǎng)絡(luò)個(gè)性化挖掘的深度、規(guī)模性和質(zhì)量,從而為用戶提供更為精準(zhǔn)的個(gè)性化服務(wù),為移動(dòng)社交網(wǎng)絡(luò)提供商和廣大用戶創(chuàng)造價(jià)值,因此具有重要的理論意義與實(shí)際應(yīng)用價(jià)值.

2 相關(guān)工作

云計(jì)算與大數(shù)據(jù)時(shí)代的來臨以及數(shù)據(jù)密集型科學(xué)研究范式的興起使“數(shù)據(jù)稀疏性”問題備受關(guān)注[1].由于融合了社會(huì)化網(wǎng)絡(luò)和個(gè)性化用戶偏好信息,社會(huì)化信任推薦有效提升了傳統(tǒng)推薦的精確度、冷啟動(dòng)、稀疏性與穩(wěn)定性等[2].如國(guó)外學(xué)者Kant Vibhor(2013)[3]在研究推薦系統(tǒng)的數(shù)據(jù)稀疏性問題時(shí),將用戶間的信任關(guān)系引入到協(xié)同過濾推薦模型的構(gòu)建中,以此來提高推薦的精度;學(xué)者Sohn Jongsoo(2015)[4]對(duì)原先基于內(nèi)容的CF推薦模型進(jìn)行優(yōu)化,有效緩解了推薦系統(tǒng)數(shù)據(jù)庫(kù)的冷啟動(dòng)問題;我國(guó)學(xué)者孟祥武(2014、2015)[5-6]對(duì)社會(huì)網(wǎng)絡(luò)推薦研究進(jìn)行了系統(tǒng)述評(píng),提出了一種融合項(xiàng)目特征和移動(dòng)用戶信任關(guān)系、基于位置的社交網(wǎng)絡(luò)推薦算法;張富國(guó)(2014)[7]基于社交網(wǎng)絡(luò)視角出發(fā),對(duì)近幾年關(guān)于社交網(wǎng)絡(luò)信任方面研究個(gè)性化推薦的相關(guān)文獻(xiàn)進(jìn)行了比較分析,最后對(duì)研究面臨難點(diǎn)問題和今后的發(fā)展趨勢(shì)進(jìn)行了展望;劉英南(2015)[8]在研究過程中構(gòu)建了動(dòng)態(tài)信任傳遞模型,以此解決協(xié)同過濾稀疏性引起的“冷啟動(dòng)”、“新用戶”、“新資源”等問題;為了有效解決用戶信任關(guān)系難以獲取的問題,于美琪(2017)[9]提出了基于項(xiàng)目評(píng)分與用戶信任關(guān)系的CF推薦算法,通過評(píng)分用戶間的相互信任關(guān)系來挖掘用戶的社會(huì)關(guān)系與偏好關(guān)系,以此來進(jìn)行CF推薦.

通過對(duì)上述文獻(xiàn)的分析發(fā)現(xiàn),當(dāng)前已有部分學(xué)者基于社交網(wǎng)絡(luò)信任來緩解數(shù)據(jù)稀疏性導(dǎo)致的推薦精度下降問題,也取得了一定的成果.但移動(dòng)社交網(wǎng)絡(luò)環(huán)境下,如何綜合挖掘移動(dòng)SNS用戶在位置、時(shí)間、業(yè)務(wù)需求要素,基于不同資源對(duì)象和情境興趣來進(jìn)行社會(huì)化推薦的研究還較為稀少,綜合考慮用戶歷史興趣、情境信息、信任關(guān)系緩解移動(dòng)SNS推薦數(shù)據(jù)稀疏性問題的研究更是鮮有涉及.此外,當(dāng)前關(guān)于社交網(wǎng)絡(luò)分析方面的研究,大多限于幾十到幾百個(gè)節(jié)點(diǎn),即其所處理的網(wǎng)絡(luò)規(guī)模較小,因此在大規(guī)模復(fù)雜社交網(wǎng)絡(luò),傳統(tǒng)處理方法的效果不佳,對(duì)于當(dāng)前海量數(shù)據(jù)而言,難以滿足其大規(guī)模網(wǎng)絡(luò)計(jì)算的需求.云計(jì)算處理技術(shù)實(shí)現(xiàn)了移動(dòng)推薦系統(tǒng)與大規(guī)模海量數(shù)據(jù)源的集成,充分利用其跨平臺(tái)、并行處理、高擴(kuò)展性等優(yōu)勢(shì),可以顯著增強(qiáng)個(gè)性化推薦系統(tǒng)海量數(shù)據(jù)挖掘的實(shí)時(shí)性,增強(qiáng)系統(tǒng)的可拓展性與可靠性.如張亞明[10]提出的面向云環(huán)境的并行推薦方法,顯著提高了推薦算法在海量數(shù)據(jù)規(guī)模下的執(zhí)行效率.鑒于此,本文提出基于云環(huán)境用戶情境興趣與信任關(guān)系的移動(dòng)SNS信任推薦模型,通過融合情境興趣相似度與用戶間的信任關(guān)系,緩解協(xié)同過濾算法的數(shù)據(jù)稀疏性,同時(shí)采用MapReduce技術(shù)解決大規(guī)模復(fù)雜社會(huì)網(wǎng)推薦并行挖掘的難題.

3 模型描述

本節(jié)對(duì)融合用戶情境興趣的移動(dòng)SNS信任推薦模型進(jìn)行細(xì)致描述.在本文構(gòu)建的移動(dòng)SNS推薦模型中,假設(shè)存在移動(dòng)SNS用戶組M、參與評(píng)價(jià)的項(xiàng)目組S、移動(dòng)SNS用戶面臨的外在情境信息Context,在諸多的移動(dòng)SNS用戶間還存在相互的信任關(guān)系,本文設(shè)為TU;本文研究的目標(biāo)用戶設(shè)為ui,且ui∈U;對(duì)于ui未評(píng)分的項(xiàng)目集合,本文設(shè)為Sj;在研究過程中,通過CF推薦方法預(yù)測(cè)ui對(duì)Sj的評(píng)分,然后按照Top-N規(guī)則,將排名靠前的項(xiàng)目推薦給ui.總體來講,本文模型具體描述如下.

3.1 用戶—項(xiàng)目評(píng)分矩陣

首先,構(gòu)建推薦模型的移動(dòng)SNS用戶——項(xiàng)目評(píng)分矩陣.設(shè)推薦系統(tǒng)中移動(dòng)SNS用戶的數(shù)量為M(其中M=‖U‖),則移動(dòng)SNS用戶的集合記為U={u1,u2,…,uM};移動(dòng)用戶面向的項(xiàng)目集合采用S={s1,s2,…,sN}表示,其中N為項(xiàng)目的數(shù)量,即N=‖S‖.用戶在使用完系統(tǒng)中存在的諸多項(xiàng)目之后,將結(jié)合自身的切實(shí)經(jīng)歷與用戶體驗(yàn)對(duì)其進(jìn)行評(píng)分,我們采用公式(1)來表示移動(dòng)SNS用戶——項(xiàng)目評(píng)分矩陣,本文記為RSM×N.

(1)

其中,用戶ui對(duì)項(xiàng)目Si的評(píng)分本節(jié)通過rsuisi來表示;式(1)中矩陣RSM×N的每一行都為用戶ui對(duì)評(píng)價(jià)項(xiàng)目S的具體評(píng)分,即ui的項(xiàng)目評(píng)分向量,記為RSui=(rsuis1,rsuis2,…,rsuMsN);矩陣RSM×N中的每一列是所有用戶u對(duì)某一個(gè)項(xiàng)目Si的評(píng)分,記為RSuj=(rsu1sj,rsu2sj,…,rsuMsj).

3.2 移動(dòng)SNS用戶情境表示

鑒于本文的推薦模型中涉及到了用戶的情境信息,因此需精煉表述移動(dòng)SNS用戶所面臨的具體情境.根據(jù)移動(dòng)SNS用戶所面臨的位置、溫度、時(shí)間等多種不同情境構(gòu)成要素,本文使用向量計(jì)算公式來表示n種不同類型的情境信息,記為Contexty=(C1,C2,…,Cn).其中Ck(k=1,2,…,n)表示一種具體類型的情境,則兩個(gè)不同的情境可使用向量Contextx和Contexty表示,這兩個(gè)情境間的相似度記為:Sim(Contextx,Contexty),表示情境Contextx和Contexty在k類情境背景下比較的相似程度.鑒于移動(dòng)SNS用戶是在一定情境下對(duì)項(xiàng)目進(jìn)行評(píng)分,且該情境信息將對(duì)用戶評(píng)分產(chǎn)生影響,因此在評(píng)分過程中引入了移動(dòng)SNS用戶的情境信息,由此來對(duì)傳統(tǒng)CF的用戶—項(xiàng)目評(píng)分矩陣進(jìn)行擴(kuò)充,形成用戶—項(xiàng)目—情境評(píng)分矩陣,即將情境信息Contextk融入到原先移動(dòng)SNS用戶的每一個(gè)項(xiàng)目評(píng)分rsuisi中去,實(shí)現(xiàn)融合情境興趣的移動(dòng)SNS信任推薦.

3.3 用戶—信任矩陣

在推薦模型中引入移動(dòng)SNS用戶間的信任關(guān)系首先需要建立信任網(wǎng)絡(luò)、用戶、信任矩陣.這里的信任網(wǎng)絡(luò)是一個(gè)以移動(dòng)SNS用戶實(shí)體為節(jié)點(diǎn)、以各用戶實(shí)體間存在的信任關(guān)系(分為直接信任和間接信任)為邊而所構(gòu)成的一個(gè)網(wǎng)絡(luò)系統(tǒng).這里提到的直接信任是授信用戶通過直接的信息交互過程而獲得了對(duì)受信用戶的信任關(guān)系,而間接信任則需要通過信任傳遞(如與受信用戶有直接信任關(guān)系的其他用戶)而獲得的信任關(guān)系.在移動(dòng)SNS有人網(wǎng)絡(luò)中,各個(gè)節(jié)點(diǎn)間的直接或間接信任關(guān)系通過他們的連線(邊)來表示,邊的權(quán)重就代表節(jié)點(diǎn)間的信任度.公式(2)就為信任網(wǎng)絡(luò)中的移動(dòng)SNS用戶—信任矩陣TUM×N.

(2)

其中,tuui,uj表示用戶ui對(duì)uj的信任度,tuui,uj的取值范圍為[0,1]區(qū)間的實(shí)數(shù).當(dāng)tuui,uj=1時(shí),此時(shí)表明用戶ui對(duì)用戶uj是完全信任的;而當(dāng)tuui,uj取值為0時(shí),則表示另外一種極端情況,即用戶ui對(duì)用戶uj是一種完全不信任的關(guān)系.

4 模型建立

4.1 構(gòu)建情境相似度矩陣

本文融合情境興趣的移動(dòng)SNS信任推薦建模步驟如下:

Step1.首先,獲取移動(dòng)SNS用戶—項(xiàng)目評(píng)分矩陣及評(píng)分時(shí)用戶所處的情境.在建立云環(huán)境用戶情境興趣的信任推薦模型時(shí),先要建立移動(dòng)SNS用戶-項(xiàng)目評(píng)分矩陣RSM×N,即用戶User對(duì)項(xiàng)目Item的評(píng)分矩陣,其計(jì)算公式為:

(3)

Step2.計(jì)算目標(biāo)用戶與其他用戶的相似度sim(ui,uj).本文在計(jì)算時(shí)采用Pearson相關(guān)系數(shù)度量公式,由此計(jì)算目標(biāo)用戶ui和用戶uj的相似度,如式(4)所示.

sim(ui,uj)=

(4)

需要指出的是,USui,sj的大小十分重要,若ui和uj共同評(píng)分過的項(xiàng)目集合USui,sj的模越大,說明目標(biāo)用戶ui和uj之間的相似度越高.換言之,倘若sim(ui,uj)=sim(ui,uk),但|USui,sj|>|USui,sk|,則目標(biāo)用戶ui和用戶uk的相似度要低于目標(biāo)用戶ui和uj的相似度.鑒于傳統(tǒng)的Pearson度量公式(4)在計(jì)算目標(biāo)用戶ui和用戶uk的相似性時(shí)未能考慮這方面因素的影響,本文借鑒Zhang YM[11]提出的情境化信息推薦機(jī)制,引入|USui,sj|來對(duì)式(4)進(jìn)行修正,如式(5)所示:

(5)

Step3.根據(jù)情境修正相似性度量公式.當(dāng)目標(biāo)用戶的情境信息與己評(píng)分用戶的評(píng)分情境相似度Simi(ItemContext,ItemRatingContext)較大時(shí),該已評(píng)分用戶就獲得了較高的推薦權(quán)值.記為k=Sim(ItemContext,ItemRatingContext),本文參考相似性度量公式對(duì)本文式(5)進(jìn)行修正,由此得出式(6):

sim"(u1,uj)=c×sim′(ui,uj)+(1-c)×k×sim′(ui,uj)

(6)

其中,式(6)中的c為可調(diào)系數(shù),其大小隸屬于[0,1]區(qū)間.可以看出,當(dāng)c=1時(shí),式(6)的計(jì)算結(jié)果相當(dāng)于沒有考慮用戶的情境因素,即還是傳統(tǒng)的CF推薦算法.

4.2 構(gòu)建用戶信任度矩陣

在移動(dòng)社交網(wǎng)絡(luò)信任網(wǎng)絡(luò)中,鑒于許多SNS用戶間可能不存在或者存在不明顯的潛在信任關(guān)系,由此會(huì)使得推薦的信任度矩陣非常稀疏,導(dǎo)致信任度計(jì)算的困難.因此,在計(jì)算移動(dòng)SNS用戶間信任度的過程中,引入用戶間信任關(guān)系所具有的傳遞特征,即根據(jù)信任傳遞規(guī)則來描述移動(dòng)SNS用戶的間接信任關(guān)系,計(jì)算得出信任度,以此進(jìn)行CF推薦.

Step1.計(jì)算直接信任度dt(a,b).在移動(dòng)SNS信任關(guān)系網(wǎng)絡(luò)中,查看是否有直線連接節(jié)點(diǎn)a與b,存在則直接信任值dt(a,b)=權(quán)值w(a,b);不存在則直接信任值dt(a,b)=0.權(quán)值w(a,b)的計(jì)算公式為:

(7)

其中,i為待評(píng)價(jià)等級(jí)的目標(biāo)物品,a為目標(biāo)用戶,α為給定閾值,ta,b為目標(biāo)用戶a對(duì)用戶b的信任值;rb,i為用戶b對(duì)物品i的評(píng)價(jià)等級(jí);RT為信任值ta,u大于或等于α且對(duì)物品i進(jìn)行過評(píng)價(jià)的用戶集.

Step2.計(jì)算推薦信任度ct(a,b).在移動(dòng)SNS信任關(guān)系網(wǎng)絡(luò)中尋找下述路徑:起點(diǎn)為a、終點(diǎn)是b的路徑,其子路徑a′b′為相連的點(diǎn),且對(duì)于與a′相連的任何點(diǎn)(非b′)x存在邊a′x,a′b′的權(quán)值W(a′b′)>W(a′,x),據(jù)此計(jì)算推薦信任度,如式(8):

(8)

Step3.計(jì)算a與b的信任度Trust(a,b):Trust(a,b)=α×dt(a,b)+(1-α)×ct(a,b).α為[0,1]的參數(shù),代表dt占Trust的比重.選擇信任網(wǎng)絡(luò)中與a點(diǎn)直接信任度最大的點(diǎn)x,其推薦信任值更為可信;按照信任傳遞規(guī)則尋找與x直接信任值最大的點(diǎn)y,反復(fù)直至找到b點(diǎn).

4.3 融合情境與信任度矩陣

在融合用戶情境興趣的過程中,本文將傳統(tǒng)CF與信任推薦相融合的推薦思想,將情境興趣相似度矩陣與移動(dòng)SNS用戶信任度矩陣進(jìn)行融合,由此計(jì)算信任度與情境興趣相似度相融合的一個(gè)綜合取值,最終進(jìn)行協(xié)同過濾推薦.本文情境興趣矩陣與信任度關(guān)系矩陣融合的公式為式(9):

Weight=

其中,ui和uj間的相似度采用Sim(i,j)表示,ui和uj的信任度記為Trust(i,j),Weight為合并后的綜合值.

4.4 產(chǎn)生推薦

本文采用中心加權(quán)的計(jì)算方法,將推薦的權(quán)值Weight(i,j)替換為融合移動(dòng)SNS用戶情境相似度與用戶間信任度的一個(gè)復(fù)合值來進(jìn)行推薦,計(jì)算方法如式(10)所示.

(10)

4.5 Mapreduce化的云計(jì)算并行推薦

為了提高大規(guī)模復(fù)雜社交網(wǎng)絡(luò)環(huán)境下的推薦性能,本節(jié)在Hadoop云環(huán)境實(shí)現(xiàn)模型的MapReduce化并行推薦,具體分為以下四個(gè)MapReduce處理過程.

4.5.1 Mapreduce化的向量生成過程

Step1.根據(jù)輸入的信任信息向量,由此生成輸出結(jié)果,最后表達(dá)為(Long,String)鍵值對(duì)的形式.

Step2.根據(jù)MapReduce中的Map函數(shù)進(jìn)行數(shù)據(jù)處理,將輸入信息轉(zhuǎn)化為用戶ID、項(xiàng)目ID及對(duì)應(yīng)的偏好值,生成全新的鍵值對(duì):(用戶ID,項(xiàng)目ID,用戶偏好).

Step3.通過全局搜索獲取所有信息映射項(xiàng)目Hadoop集合.

Step4.根據(jù)MapReduce的Reduce函數(shù)構(gòu)建偏好值向量,基于此生成(用戶ID,用戶向量)形式的鍵值對(duì).

4.5.2 Mapreduce化的共生矩陣計(jì)算過程

Step1.將上一個(gè)MapReduce輸出值(用戶ID,用戶向量)作為MapReduce處理的輸入.

Step2.按照Map函數(shù)的運(yùn)算規(guī)則,計(jì)算共生矩陣所包含的各元素的對(duì)應(yīng)值.

Step3.根據(jù)上一步驟找出每個(gè)項(xiàng)目ID與其他所有項(xiàng)目Hadoop同時(shí)出現(xiàn)的鍵值對(duì).

Step4.按照MapReduce的Reduce函數(shù),計(jì)算dt(a,b)3給出的鍵值對(duì)的共生向量.

4.5.3 Mapreduce化的矩陣融合過程

Step1.Mapl函數(shù)以共生矩陣鍵值對(duì)(項(xiàng)目ID,共生向量)為函數(shù)輸入,將其轉(zhuǎn)化為存儲(chǔ)共生向量和偏好值向量的數(shù)據(jù)結(jié)構(gòu),最后生成鍵值對(duì)的形式,作為下一步驟的輸出.

Step2.Map2函數(shù)以偏好值向量鍵值對(duì)(用戶ID,用戶向量)為輸入,按照Hadoop函數(shù)生成如下形式的鍵值對(duì):(項(xiàng)目ID,用戶ID,偏好值).

Step3.按照全局搜索策略,計(jì)算得出每個(gè)項(xiàng)目ID的共生向量以及偏好值向量.

Step4.按照Reduce函數(shù),計(jì)算移動(dòng)SNS用戶對(duì)每個(gè)項(xiàng)目的預(yù)測(cè)評(píng)分,最后以(用戶ID,R)的形式輸出.

4.5.4 Mapreduce化的推薦產(chǎn)生過程

Step1.本次Map函數(shù)的輸入為上一個(gè)MapReduce的輸出(用戶ID,R).

Step2.根據(jù)全局搜索策略,計(jì)算并輸出用戶對(duì)每個(gè)待選項(xiàng)目的預(yù)測(cè)評(píng)分值.

Step3.將Reduce函數(shù)所有的預(yù)測(cè)評(píng)分值進(jìn)行排序,給出最后的Top-N推薦結(jié)果.

5 實(shí)驗(yàn)結(jié)果及分析

分布式Hadoop云環(huán)境可提高大規(guī)模社交網(wǎng)絡(luò)環(huán)境下的并行處理性能.因此,本文將實(shí)驗(yàn)環(huán)境配置在一個(gè)使用9臺(tái)服務(wù)器搭建的Hadoop計(jì)算機(jī)集群上,其中一臺(tái)為NameNode,其余為DataNode.9臺(tái)服務(wù)器硬件配置為:Lenovo服務(wù)器一臺(tái),其中內(nèi)存為4G,硬盤1T,CPU主頻2.8G.其他8臺(tái)服務(wù)器采用了普通PC機(jī),內(nèi)存2G,硬盤320G,CPU主頻2.6G.其中,Hadoop云環(huán)境的NameNode為L(zhǎng)enovo服務(wù)器,命名為Hadoop;將其余8臺(tái)PC機(jī)作為Hadoop的DataNode,具體命名為hadoop1-hadoop8.

5.1 數(shù)據(jù)集

本文實(shí)驗(yàn)抓取了移動(dòng)應(yīng)用商城類網(wǎng)站上最常被下載的移動(dòng)SNS服務(wù),以此作為本文推薦系統(tǒng)的“項(xiàng)目”數(shù)據(jù)集.鑒于云環(huán)境用戶情境興趣的移動(dòng)SNS信任推薦模型中涉及到移動(dòng)SNS信任關(guān)系,本文以河北省高校5所在校大學(xué)生為研究對(duì)象,這些大學(xué)生可在該類網(wǎng)站上進(jìn)行一些信息共享操作,如分享項(xiàng)目評(píng)分及購(gòu)后評(píng)價(jià)等;同時(shí),用戶還可將其他同學(xué)加入到個(gè)人的信任列表中,建立自己的“社交網(wǎng)絡(luò)”.據(jù)此,可根據(jù)本文模型可計(jì)算大學(xué)生用戶間的信任關(guān)系(信任度取值范圍為[0,1]).鑒于本文研究涉及顯式的情境相關(guān)移動(dòng)用戶評(píng)分,進(jìn)一步邀請(qǐng)被調(diào)查者將相關(guān)調(diào)查信息發(fā)送給5位好友用戶,邀請(qǐng)其對(duì)上述移動(dòng)SNS服務(wù)中可能感興趣或者不感興趣的移動(dòng)SNS服務(wù)項(xiàng)目進(jìn)行評(píng)分:測(cè)試用戶除對(duì)移動(dòng)SNS網(wǎng)絡(luò)服務(wù)進(jìn)行打分外(打分取值為1-5,其中1表示非常不喜歡,5表示非常喜歡),還需給出其對(duì)相關(guān)移動(dòng)網(wǎng)絡(luò)服務(wù)評(píng)分的特定“時(shí)間”情境信息,如評(píng)分時(shí)為清晨、上午、中午、下午、傍晚或者夜里.最后獲得了253位用戶對(duì)上百種移動(dòng)SNS應(yīng)用服務(wù)的評(píng)分?jǐn)?shù)據(jù)集,其中不含情境信息的評(píng)分記錄4074條,含有情境相關(guān)信息的評(píng)論2467條;此外,該數(shù)據(jù)集還包含用戶間信任關(guān)系信息,列出了存在直接信任關(guān)系的用戶ID,將此作為實(shí)驗(yàn)測(cè)試部分的數(shù)據(jù)集.

5.2 評(píng)價(jià)標(biāo)準(zhǔn)

本文實(shí)驗(yàn)評(píng)價(jià)標(biāo)準(zhǔn)主要包括兩個(gè)方面,首先測(cè)試云環(huán)境下基于Hadoop的并行挖掘有無提升模型計(jì)算的性能,其次是測(cè)試模型對(duì)數(shù)據(jù)稀疏性導(dǎo)致推薦精度下降的緩解情況.

作為并行計(jì)算測(cè)試的評(píng)價(jià)指標(biāo),加速比主要用來對(duì)比單機(jī)與并行計(jì)算兩種不同環(huán)境下特定算法運(yùn)行所耗費(fèi)的時(shí)長(zhǎng),其計(jì)算方法為單機(jī)運(yùn)行時(shí)間與并行運(yùn)行時(shí)間的比值,具體公式表示為:S=T(1)/T(N).其中,T(1)為算法在單機(jī)環(huán)境下的運(yùn)行時(shí)間,T(N)為多機(jī)并行處理的時(shí)間,兩者的比值結(jié)果即為加速比.此外,為了對(duì)比Hadoop云環(huán)境下不同數(shù)目節(jié)點(diǎn)對(duì)并行計(jì)算結(jié)果的影響,還引入了相對(duì)加速比指標(biāo)進(jìn)行對(duì)比:S相對(duì)=T(單DataNode)/T(多DataNode).其中,S相對(duì)表示相對(duì)加速比,單DataNode集群運(yùn)行的時(shí)間表示為T(單DataNode),多DataNode集群運(yùn)行時(shí)間為T(多DataNode).

(11)

其中,測(cè)試實(shí)驗(yàn)執(zhí)行次數(shù)使用n表示,算法計(jì)算得出的用戶預(yù)測(cè)評(píng)級(jí)使用pi表示.而P(u)@N則表示推薦列表中與用戶u符合的用戶需求項(xiàng)目數(shù)與N的比值,計(jì)算公式為:P(u)@N=(releventitemsintopnitemsforu)/N.

5.3 實(shí)驗(yàn)結(jié)果分析

5.3.1 并行推薦技術(shù)的性能比較

在測(cè)試推薦模型不同節(jié)點(diǎn)的加速比時(shí),首先對(duì)選定的測(cè)試數(shù)據(jù)集進(jìn)行數(shù)據(jù)分配,按照數(shù)據(jù)量大小定義為數(shù)據(jù)集D1、D2、D3、D4,其包含的數(shù)據(jù)分別為1000、2000、3000和4000條用戶評(píng)分的數(shù)據(jù)集.在此基礎(chǔ)上,本文測(cè)試Hadoop云環(huán)境下上述數(shù)據(jù)集的并行運(yùn)行時(shí)間,Hadoop運(yùn)行的節(jié)點(diǎn)數(shù)量分別選擇2、4、6、8四種不同的情況,記錄下各數(shù)據(jù)集在不同節(jié)點(diǎn)下的運(yùn)行時(shí)間,具體如圖1所示.

圖1 Hadoop云環(huán)境下算法并行推薦的加速比效果圖Fig.1 SpeedupofparallelalgorithminHadoopenvironment圖2 Hadoop云環(huán)境下并行推薦的擴(kuò)展比效果圖Fig.2 SpreadratioofparallelalgorithminHadoopenvironment

根據(jù)圖1的測(cè)試結(jié)果可以看出,當(dāng)測(cè)試數(shù)據(jù)集為D1時(shí),本文推薦模型在Hadoop環(huán)境下運(yùn)行的加速比會(huì)隨著節(jié)點(diǎn)數(shù)的增加而呈現(xiàn)出先降后升的變化;而當(dāng)測(cè)試數(shù)據(jù)集為D2-D4時(shí),加速比在同數(shù)量節(jié)點(diǎn)情況下隨數(shù)據(jù)量的增長(zhǎng)而加快,在相同數(shù)據(jù)量的情況下會(huì)隨節(jié)點(diǎn)數(shù)的增加而上升.根據(jù)圖2的擴(kuò)展比測(cè)試結(jié)果可以看出,D1數(shù)據(jù)集測(cè)試出的擴(kuò)展比曲線下降趨勢(shì)非常明顯,而D2-D4數(shù)據(jù)集測(cè)試時(shí)的擴(kuò)展比雖然也呈現(xiàn)出下降趨勢(shì),但隨節(jié)點(diǎn)數(shù)的增加而呈現(xiàn)出較為平穩(wěn)的下降趨勢(shì).從圖2的對(duì)比結(jié)果還可以看出,在小數(shù)據(jù)量如D1的測(cè)試情況下,推薦模型在Hadoop環(huán)境下的運(yùn)行效率較低,沒有很好的體現(xiàn)并行計(jì)算的優(yōu)勢(shì),究其原因,主要是Hadoop環(huán)境下推薦系統(tǒng)的作業(yè)啟動(dòng)時(shí)間以及交互時(shí)間較長(zhǎng),而真正用于并行計(jì)算的時(shí)間則相對(duì)較短,因此綜合在一起的最終運(yùn)行時(shí)間較長(zhǎng),很難體現(xiàn)Hadoop集群并行計(jì)算的優(yōu)勢(shì).但隨著測(cè)試數(shù)據(jù)量的增加,Hadoop環(huán)境下推薦系統(tǒng)啟動(dòng)與交互的時(shí)間比例會(huì)逐步縮小,而更多的比例則主要用于系統(tǒng)的并行計(jì)算.因此,測(cè)試數(shù)據(jù)集越大,算法并行計(jì)算的速度優(yōu)勢(shì)就越明顯,并行處理的效率也越趨向于穩(wěn)定.

5.3.2 推薦性能比較

為了對(duì)體現(xiàn)本文推薦模型性能方面的優(yōu)越性,本文選擇與傳統(tǒng)協(xié)同過濾、傳統(tǒng)的情境上下文預(yù)過濾方法進(jìn)行對(duì)比,三類推薦方法的MAE、Coverage以及P(u)@N比較具體如圖3與圖4所示.

圖3 三類方法的MAE與Coverage比較Fig.3 ComparisonofMAEandCoverageofthreealgorithms圖4 三類方法的P(u)@N比較Fig.4 ComparisonofP(u)@Nofthreealgorithms

從圖3可以看出,實(shí)驗(yàn)條件下傳統(tǒng)CF推薦方法沒有使MAE減小,而傳統(tǒng)的情境上下文預(yù)過濾方法以及本文模型的MAE相比于傳統(tǒng)CF有所降低,表明引入情境的推薦取得了更優(yōu)效果.而在數(shù)據(jù)稀疏情況下,傳統(tǒng)情境上下文預(yù)過濾方法的MAE較高,這是因?yàn)榧尤肷舷挛那榫澈蟮挠脩簟u(píng)價(jià)矩陣被進(jìn)一步稀釋,使得推薦算法在啟動(dòng)階段很難找到相似用戶,由此導(dǎo)致精準(zhǔn)度的下降.本文模型更好地將興趣相似度與社交網(wǎng)絡(luò)信任度融入到推薦過程中,改善了由于數(shù)據(jù)稀疏而導(dǎo)致的最近鄰居搜索難題,因此在啟動(dòng)時(shí)比傳統(tǒng)CF以及傳統(tǒng)的情境上下文預(yù)過濾的推薦性能更優(yōu).此外,本文模型的Coverage指標(biāo)也高于傳統(tǒng)CF與傳統(tǒng)情境上下文過濾方法,這是因?yàn)榍榫撑d趣相似度與信任關(guān)系相互融合的推薦模型在選擇移動(dòng)SNS用戶最近鄰居的過程中,根據(jù)移動(dòng)SNS用戶間的動(dòng)態(tài)信任關(guān)系對(duì)最近鄰居進(jìn)行了篩選,由此選擇出了可信的相似用戶;而在計(jì)算評(píng)分階段,又進(jìn)一步對(duì)用戶情境相似性與用戶信任關(guān)系進(jìn)行了加權(quán)計(jì)算,因此在很大程度上加強(qiáng)了推薦結(jié)果與目標(biāo)用戶情境的相似性.由此可見,情境興趣相似度與信任度融合的推薦模型在一定程度上擴(kuò)大了最近鄰居的選取范圍,即增大了對(duì)鄰居用戶的覆蓋率,有助于提升社會(huì)化推薦的精度.而圖4對(duì)三種算法P(u)@N的比較也進(jìn)一步表明,在不同最近鄰居數(shù)目的情況下,本文模型與傳統(tǒng)CF以及傳統(tǒng)的上下文過濾推薦算法相比具有更高的P(u)@N準(zhǔn)確率,因此獲得了更高的推薦質(zhì)量與精度.

6 結(jié) 論

針對(duì)移動(dòng)SNS推薦存在的數(shù)據(jù)稀疏問題,在CF推薦過程中系統(tǒng)引入了用戶情境興趣與SNS信任關(guān)系,提出融合云環(huán)境用戶情境興趣的移動(dòng)SNS信任推薦模型.本文貢獻(xiàn)主要包括以下兩方面:

①在傳統(tǒng)協(xié)同過濾推薦模型中融入移動(dòng)SNS用戶情境興趣與SNS信任關(guān)系,基于此構(gòu)建了融合情境興趣的移動(dòng)SNS信任推薦模型,較好地將情境相似度與信任度融入到協(xié)同過濾推薦過程中,實(shí)驗(yàn)結(jié)果表明,模型獲得了更高的準(zhǔn)確率和更低的誤差值,有效緩解了數(shù)據(jù)稀疏問題.

②提出面向云環(huán)境的移動(dòng)SNS推薦并行處理方法,基于并行加速比與相對(duì)加速比的評(píng)價(jià)結(jié)果顯示,本文方法有效提高了協(xié)同過濾在海量數(shù)據(jù)規(guī)模下的執(zhí)行效率,系統(tǒng)的可擴(kuò)展性有所提升.本文后續(xù)研究將探討稀疏信任信息環(huán)境下的移動(dòng)SNS推薦問題,同時(shí)考慮云環(huán)境用戶不同情境語義關(guān)聯(lián)關(guān)系,引入具有語義關(guān)系的情境標(biāo)簽對(duì)云環(huán)境用戶進(jìn)行信任聚類,由此提高移動(dòng)SNS推薦系統(tǒng)的準(zhǔn)確率.

[1] Bobadilla J,Ortega F,Hernando A,et al.A collaborative filtering approach to mitigate the new user cold start problem[J].Knowledge-Based Systems,2012,26(1):225-238.

[2] Chen Chien Chin,Wan Yu-hao,Chung Mengchieh,et al.An effective recommendation method for cold start new users using trust and distrust networks[J].Information Science,2013,224(3):19-36.

[3] Kant Vibhor,Bharadwaj Kamal K.Fuzzy computational models of trust and distrust for enhanced recommendations[J].International Journal of Intelligent Systems,2013,28(4):332-365.

[4] Sohn Jong-Soo,Bae Un-Bong,Chung In-Jeong.Contents recommendation method using social network analysis[J].Wireless Personal Communications,2015,73(4):1529-1546.

[5] Hu Xun,Meng Xiang-wu,Zhang Yu-jie,et al.Recommendation Algorithm combing item features and trust relationship of mobile users[J].Journal of Software,2014,25(8):1817-1830.

[6] Liu Shu-dong,Meng Xiang-wu.Recommender systems in location-based social networks[J].Chinese Journal of Computers,2015,38(2):322-336.

[7] Zhang Fu-guo.Survey of online social network based personalized recommendation[J].Journal of Chinese Computers Systems,2014,35(7):1470-1476.

[8] Liu Ying-nan,Xie Jin-kui,Zhang Jia-li,et al.Recommendation algorithm based on trust in social network[J].Journal of Chinese Computers Systems,2015,36(6):1165-1170.

[9] Yu Mei-qi,Kuang Li,Wo Bin,et al.APP recommendation combing item features and social network[J].Journal of Chinese Computers Systems,2017,38(2):310-313.

[10] Zhang Y M.Recommending approach for network community marketing based on user interest map in cloud environment[J].Journal of Intelligence,2013,31(3):184-188.

[11] Zhang Ya-ming.A contextualized collaborative filtering recommendation model for mobile information service in cloud environment[J].Journal of the China Society for Scientific and Technical Information,2012,33(5):508-519.

[12] Ren Xing-yi,Song Mei-na,Song Jun-de.Context-aware point-of-interest recommendation in location-based social networks[J].Chinese Journal of Computers,2017,40(4):824-841.

附中文參考文獻(xiàn):

[5] 胡 勛,孟祥武,張玉潔,等.一種融合項(xiàng)目特征和移動(dòng)用戶信任關(guān)系的推薦算法[J].軟件學(xué)報(bào),2014,25(8):1817-1830.

[6] 劉樹棟,孟祥武.基于位置的社會(huì)化網(wǎng)絡(luò)推薦系統(tǒng)[J].計(jì)算機(jī)學(xué)報(bào),2015,38(2):322-336.

[7] 張富國(guó).基于社交網(wǎng)絡(luò)的個(gè)性化推薦技術(shù)[J].小型微型計(jì)算機(jī)系統(tǒng),2014,35(7):1470-1476.

[8] 劉英南,謝瑾奎,張家利,等.社交網(wǎng)絡(luò)中基于信任的推薦算法[J].小型微型計(jì)算機(jī)系統(tǒng),2015,36(6):1165-1170.

[9] 于美琪,鄺 礫,咼 斌,等.融合社會(huì)網(wǎng)絡(luò)和項(xiàng)目特征的移動(dòng)應(yīng)用推薦[J].小型微型計(jì)算機(jī)系統(tǒng),2017,38(2):310-313.

[11] 張亞明.面向云環(huán)境的移動(dòng)信息服務(wù)情景化協(xié)同過濾推薦[J].情報(bào)學(xué)報(bào),2012,33(5):508-519.

[12] 任星怡,宋美娜,宋俊德.基于位置社交網(wǎng)絡(luò)的上下文感知的興趣點(diǎn)推薦[J].計(jì)算機(jī)學(xué)報(bào),2017,40(4):824-841.

猜你喜歡
信任度信任矩陣
表示信任
全球民調(diào):中國(guó)民眾對(duì)政府信任度最高
嚶嚶嚶,人與人的信任在哪里……
桃之夭夭B(2017年2期)2017-02-24 17:32:43
從生到死有多遠(yuǎn)
初等行變換與初等列變換并用求逆矩陣
矩陣
南都周刊(2015年4期)2015-09-10 07:22:44
矩陣
南都周刊(2015年3期)2015-09-10 07:22:44
矩陣
南都周刊(2015年1期)2015-09-10 07:22:44
基于信任度評(píng)估的移動(dòng)自組織網(wǎng)絡(luò)路由協(xié)議
信任
泸溪县| 休宁县| 宜都市| 安乡县| 柏乡县| 弥渡县| 大安市| 永仁县| 尼勒克县| 汝城县| 彭阳县| 满洲里市| 崇义县| 固始县| 屏边| 象山县| 鲁山县| 湖北省| 茂名市| 宜阳县| 渑池县| 西充县| 漠河县| 临海市| 军事| 榆林市| 吉首市| 花莲市| 天台县| 溆浦县| 泽库县| 祁门县| 嵩明县| 安国市| 神农架林区| 集贤县| 方城县| 崇阳县| 浦城县| 渑池县| 饶河县|