国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于云計(jì)算的PageRank算法之研究

2015-08-08 07:14趙妍
電腦知識(shí)與技術(shù) 2015年15期
關(guān)鍵詞:云計(jì)算研究

趙妍

摘要:云計(jì)算在目前的發(fā)展中,已經(jīng)成為了網(wǎng)絡(luò)時(shí)代的新寵兒,其在很多方面都推動(dòng)了網(wǎng)絡(luò)時(shí)代的進(jìn)步和發(fā)展。相對(duì)而言,云計(jì)算在具體的操作中,會(huì)利用諸多的算法來(lái)完成計(jì)算和整理工作。在云計(jì)算當(dāng)中,PageRank算法是比較常用的一種算法,該算法結(jié)合了以往算法的一些優(yōu)勢(shì)和研究成果,并且在運(yùn)用過程中,表現(xiàn)出了較多的便利性,是云計(jì)算不可或缺的組成部分。目前,關(guān)于PageRank算法的研究不斷的深入,更多的是對(duì)其進(jìn)行優(yōu)化處理,以此來(lái)確保云計(jì)算的發(fā)展是不斷前進(jìn)的。日后,應(yīng)將PageRank算法與其他算法共同研究,聯(lián)合優(yōu)化,促使云計(jì)算在各方面的表現(xiàn)更加突出。

關(guān)鍵詞:云計(jì)算;PageRank算法;研究

中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)15-0210-02

隨著網(wǎng)絡(luò)信息技術(shù)的發(fā)展,用戶可以便捷的獲得各種信息,但是也面臨著如何從大量的網(wǎng)絡(luò)信息中獲得有用信息的問題。目前,用戶數(shù)量的激增,給網(wǎng)絡(luò)信息技術(shù)提出的新的挑戰(zhàn),雖然云計(jì)算在該方面適當(dāng)?shù)木徑饬诵畔⒎矫娴膲毫?,但終究沒有從根本上解決問題。我們?cè)诰唧w的工作中,還是要從算法方面著手。PageRank算法作為云計(jì)算的重要組成部分,其產(chǎn)生的影響是絕對(duì)性的,而且在很多方面都表現(xiàn)出了較大的積極意義。隨著時(shí)間的推移,PageRank算法的固有成果已經(jīng)不能滿足用戶的需求,必須在固有成果的基礎(chǔ)上,對(duì)其進(jìn)行一定的優(yōu)化,并加深研究,才能推動(dòng)云計(jì)算的更大發(fā)展。在此,本文主要就基于云計(jì)算的PageRank算法展開研究。

1 算與PageRank算法

云計(jì)算是在近幾年才興起的一種技術(shù),雖然總體上表現(xiàn)出了非常突出的成績(jī),但仍有很多方面是有待考究的,優(yōu)化空間非常大,未來(lái)的拓展范圍也不小。網(wǎng)絡(luò)技術(shù)的發(fā)展永遠(yuǎn)是以速度著稱的,當(dāng)下的網(wǎng)絡(luò)基本上已經(jīng)很健全了,可仍然無(wú)法滿足廣大用戶的需求,證明用戶的需求速度遠(yuǎn)遠(yuǎn)比云計(jì)算的發(fā)展速度更快。為此,如果想在將來(lái)取得更大的成果,就必須對(duì)云計(jì)算的核心開展研究——算法。從概念上來(lái)分析,算法是一個(gè)比較廣義的詞匯,其既包括了各種技術(shù),也包括了計(jì)算方法,還包括了各種模式和公式等等。在此,本文對(duì)云計(jì)算與PageRank算法進(jìn)行論述。

1.1計(jì)算

作為網(wǎng)絡(luò)信息技術(shù)的一種集中體現(xiàn),云計(jì)算的含義是非常廣泛的。簡(jiǎn)單來(lái)講,我們所指的云計(jì)算,是基于互聯(lián)網(wǎng)的相關(guān)服務(wù)的增加、使用和交付模式,通常涉及通過互聯(lián)網(wǎng)來(lái)提供動(dòng)態(tài)易擴(kuò)展且經(jīng)常是虛擬化的資源。云計(jì)算能夠給用戶帶來(lái)更多的體驗(yàn)和幫助,相比一般的網(wǎng)絡(luò)技術(shù)而言,云計(jì)算的“人性化”更加突出。目前,云計(jì)算被簡(jiǎn)稱為“云”,“云”是網(wǎng)絡(luò)、互聯(lián)網(wǎng)的一種比喻性質(zhì)的說(shuō)法。從特點(diǎn)上來(lái)分析,云計(jì)算在使用的過程中,能夠促使用戶體驗(yàn)每秒10萬(wàn)億次的運(yùn)算能力,該能力的使用領(lǐng)域非常廣泛,甚至可以模擬核爆炸、預(yù)測(cè)氣候變化、預(yù)測(cè)市場(chǎng)發(fā)展趨勢(shì)等等。例如,現(xiàn)階段的天氣預(yù)報(bào)軟件,相對(duì)過去而言,能夠在不同時(shí)間段預(yù)測(cè)出不同的天氣情況和溫度,并且提供的指示也在增多,這些都是云計(jì)算的功勞。

1.2 PageRank算法

云計(jì)算在使用過程中,算法的決定性作用是不容忽視的。PageRank算法是目前云計(jì)算的主流算法之一,該算法是谷歌專有的一種算法。PageRank算法的主要作用在于,衡量特定網(wǎng)頁(yè)相對(duì)于搜索引擎中的其他網(wǎng)頁(yè)而言的重要程度,并且在客觀上實(shí)現(xiàn)了將鏈接價(jià)值概念作為排名因素。PageRank算法在使用過程中,非常的簡(jiǎn)便、快捷,其在很多方面都具有較大的積極意義。PageRank算法在使用過程中,比較突出的一項(xiàng)成績(jī)?cè)谟?,該算法能夠讓鏈接?lái)進(jìn)行相應(yīng)的“投票”。簡(jiǎn)單來(lái)講,一個(gè)頁(yè)面的“具體得票數(shù)”,主要是由所有鏈向它的頁(yè)面的重要性所決定的。在日常的用戶瀏覽過程中,到一個(gè)頁(yè)面的超鏈接以后,就相當(dāng)是投了該頁(yè)面的一票。在實(shí)際的工作中,一個(gè)頁(yè)面的PageRank,主要是由所有鏈向它的頁(yè)面的重要性來(lái)決定的,并且會(huì)經(jīng)過算法來(lái)得到。所以,我們?cè)谶\(yùn)用PageRank算法后,無(wú)論是云計(jì)算的數(shù)據(jù)方面,還是云計(jì)算的信息方面,都能夠得到更高的工作水平,在很大程度上解決了計(jì)算復(fù)雜和信息量大帶來(lái)的影響。

2 傳統(tǒng)PageRank算法的問題

PageRank算法在云計(jì)算的使用過程中,的確表現(xiàn)出了較大的積極意義,但并不意味著該算法就是完美無(wú)缺的。相反的,長(zhǎng)久的應(yīng)用后,發(fā)現(xiàn)PageRank算法還是存在一定問題的,一方面是因?yàn)橛脩粜枨蟮奶嵘?,另一方面是因?yàn)樗惴ū旧頉]有優(yōu)化處理,所以才出現(xiàn)了一定的問題。傳統(tǒng)的PageRank算法服務(wù)了相當(dāng)長(zhǎng)的一段時(shí)間,以現(xiàn)代的觀點(diǎn)來(lái)看,傳統(tǒng)的PageRank算法,主要是表現(xiàn)出以下幾點(diǎn)問題:第一,對(duì)于海量的網(wǎng)頁(yè)而言,傳統(tǒng)的PageRank算法會(huì)花費(fèi)大量的時(shí)間,這就導(dǎo)致云計(jì)算的速度在減慢,并且得到的結(jié)果并不是特別的權(quán)威,長(zhǎng)此以往將會(huì)失去用戶的信任和支持。第二,計(jì)算PageRank的過程中,只要求在合理的誤差范圍內(nèi)即可。但傳統(tǒng)的PageRank算法并沒有考慮到這一點(diǎn),具體的數(shù)值計(jì)算是不斷的精確化,即便是已經(jīng)達(dá)到了精度較高的標(biāo)準(zhǔn),依然會(huì)持續(xù)的精確計(jì)算,導(dǎo)致云計(jì)算陷入了一種惡性循環(huán),這對(duì)用戶而言,并不是最好的選擇。

3 基于云計(jì)算的PageRank算法改進(jìn)

云計(jì)算與PageRank算法是密不可分的關(guān)系,二者在很多時(shí)候都是相互促進(jìn)的,并且表現(xiàn)出了相互依偎的特點(diǎn)?;谠朴?jì)算的PageRank算法,與傳統(tǒng)PageRank算法有很大的不同,其在日常的使用當(dāng)中,一方面充分發(fā)揮出算法的積極作用,另一方面會(huì)照顧到云計(jì)算的各項(xiàng)條件和要求,以此來(lái)確保日常的使用符合用戶的需求。值得注意的是,我們?cè)趯?duì)基于云計(jì)算的PageRank算法實(shí)施改進(jìn)時(shí),必須考慮到多方面的因素,不能單純的在理論上有所改進(jìn),還要考慮到實(shí)際情況以及后續(xù)的發(fā)展。在此,本文主要對(duì)基于云計(jì)算的PageRank算法改進(jìn)進(jìn)行論述。

3.1改進(jìn)算法的基本思想

為了能夠更好的改進(jìn)PageRank算法,通過對(duì)計(jì)算跨度為2的公式進(jìn)行遞推,最終得到了以下公式:PRk+2=(1-d)I+dATPRk+1=(1-d)I+d(1-d)AT+(dAT)2PRk。對(duì)PageRank算法實(shí)施改進(jìn),并不是一件容易的事情,其要考慮到的影響因素較多,結(jié)合以往的工作經(jīng)驗(yàn)和當(dāng)下的工作標(biāo)準(zhǔn),我們?cè)赑ageRank算法的改進(jìn)思想上,主要是從以下幾點(diǎn)出發(fā)的:第一,利用Mapreduce框架得到 AT。第二,通過AT計(jì)算( AT)2。第三,計(jì)算Pagerank值。此步驟中,把公式分為兩個(gè)部分。如果Map函數(shù)輸入的是AT,計(jì)算( 1-d) I+ d( 1-d) AT,那么每個(gè)目標(biāo)節(jié)點(diǎn)key所對(duì)應(yīng)的value為( 1-d) I + d( 1-d) AT;如果Map函數(shù)輸入的是( AT)2,計(jì)算( dAT)2PRk,那么每個(gè)目標(biāo)節(jié)點(diǎn)key所對(duì)應(yīng)的value為( dAT)2PRk??蚣軐?duì)Map函數(shù)的輸出結(jié)果進(jìn)行處理,是每個(gè)目標(biāo)節(jié)點(diǎn)key對(duì)應(yīng)的所有value形成一個(gè)list,作為reduce函數(shù)的輸入。Reduce函數(shù)對(duì)每個(gè)目標(biāo)節(jié)點(diǎn)key所對(duì)應(yīng)的value list進(jìn)行相加就可以得到新的 Pagerank向量 PRk+2。由此可見,按照以上思想來(lái)改進(jìn)PageRank算法,基本上還是可行的,并且在部分工作中,已經(jīng)得到了結(jié)果。

3.2性能分析

基于云計(jì)算的PageRank算法在得到改進(jìn)后,并不能直接的應(yīng)用,即便是思想正確、成果穩(wěn)定,也不能投入,而是要對(duì)性能展開分析,了解其是否能夠滿足用戶和云計(jì)算的需求。經(jīng)過大量的討論和分析,認(rèn)為PageRank算法在改進(jìn)后,性能分析主要是集中在以下幾項(xiàng)工作。第一,對(duì)于PageRank算法改進(jìn)后,應(yīng)經(jīng)過三個(gè)階段的Mapreduce過程分析。一般而言,在第一階段的時(shí)候需經(jīng)過1次的分析;在第二階段的時(shí)候,需經(jīng)過1次的分析;在第三階段的時(shí)候,需經(jīng)過50次的分析,一共是52次。第二,對(duì)具體的執(zhí)行時(shí)間進(jìn)行分析。從得到的結(jié)果來(lái)看,傳統(tǒng)的PageRank算法僅僅是計(jì)算AT,但是在對(duì)PageRank算法改進(jìn)后,還會(huì)計(jì)算(AT)2,這樣一來(lái),在具體的執(zhí)行時(shí)間上,就節(jié)省了大概50%的時(shí)間。這是我們非常想要看到的結(jié)果。第三,通過運(yùn)用改進(jìn)后的PageRank算法,云計(jì)算在速度和效果上更加突出,滿足了更多用戶的實(shí)際需求,并且在客觀上和主觀上都有所改變。

4 總結(jié)

本文就基于云計(jì)算的PageRank算法展開研究,從現(xiàn)階段得到的結(jié)果來(lái)看,運(yùn)用改進(jìn)后的PageRank算法,是比較適合云計(jì)算研究和拓展的,并且改進(jìn)后的PageRank算法,也將云計(jì)算作為一個(gè)跳板,獲得了更大的成功,在很多方面實(shí)現(xiàn)了健全和發(fā)展,告別了傳統(tǒng)PageRank算法的很多問題,未來(lái)的研究空間還是很大的。

參考文獻(xiàn):

[1]甘櫪元.基于云計(jì)算的數(shù)據(jù)挖掘算法的研究[J].電子技術(shù)與軟件工程,2015(7):195.

[2]陳建峽,李志鵬.基于移動(dòng)終端的博客搜索引擎系統(tǒng)研究與應(yīng)用[J].湖北工業(yè)大學(xué)學(xué)報(bào),2015(2):89-94.

[3]張愷.一種改進(jìn)的基于云計(jì)算的PageRank算法[J].佛山科學(xué)技術(shù)學(xué)院學(xué)報(bào)(自然科學(xué)版),2015(2):66-70.

[4]萬(wàn)年紅.基于云模型的協(xié)同過濾推薦算法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2015(5):140-146.

[5]賀元香,史寶明,楊生舉,吳萬(wàn)琴.基于用戶行為模型的網(wǎng)頁(yè)排序算法[J].蘭州文理學(xué)院學(xué)報(bào)(自然科學(xué)版),2015(3):63-67+111.

[6]譚鶴毅.基于云計(jì)算環(huán)境下的密文搜索算法研究[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2015(2):21-22.

[7]孫艷秋,王甜宇,曹文聰.基于云計(jì)算的醫(yī)療大數(shù)據(jù)的挖掘研究[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2015(2):11,13.

[8]穆瑞輝.基于云計(jì)算的虛擬機(jī)在線遷移算法[J].安陽(yáng)工學(xué)院學(xué)報(bào),2015(2):49-51.

猜你喜歡
云計(jì)算研究
FMS與YBT相關(guān)性的實(shí)證研究
2020年國(guó)內(nèi)翻譯研究述評(píng)
遼代千人邑研究述論
視錯(cuò)覺在平面設(shè)計(jì)中的應(yīng)用與研究
EMA伺服控制系統(tǒng)研究
新版C-NCAP側(cè)面碰撞假人損傷研究
志愿服務(wù)與“互聯(lián)網(wǎng)+”結(jié)合模式探究
云計(jì)算與虛擬化
基于云計(jì)算的移動(dòng)學(xué)習(xí)平臺(tái)的設(shè)計(jì)
實(shí)驗(yàn)云:理論教學(xué)與實(shí)驗(yàn)教學(xué)深度融合的助推器