陳斌 東一舟 毛明榮
摘 要:對(duì)成組調(diào)度技術(shù)在云計(jì)算中的應(yīng)用效果展開了研究,該效果體現(xiàn)在其性能和耗費(fèi)代價(jià)的綜合指標(biāo)上。文章對(duì)該模式的研究是通過虛擬化以分析基于任務(wù)遷移和需求控制的成組調(diào)度性能和綜合代價(jià)為手段,以基于Amazon彈性云計(jì)算架構(gòu)(EC2)為實(shí)驗(yàn)背景進(jìn)行效率評(píng)估實(shí)驗(yàn)以獲取支撐數(shù)據(jù)。結(jié)果顯示,該調(diào)度策略可以有效地部署于云環(huán)境,并且該云平臺(tái)可以被真實(shí)的高性能計(jì)算環(huán)境或其它高性能領(lǐng)域所應(yīng)用,具有較高的性能代價(jià)比。
關(guān)鍵詞:云計(jì)算;成組調(diào)度;高性能計(jì)算;虛擬機(jī)
中圖分類號(hào):TP39 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2095-1302(2016)05-00-05
0 引 言
云計(jì)算指的是計(jì)算資源作為公共事業(yè)的一種模型,就像水和電力一樣,用戶可以按照其所需而獲取計(jì)算資源?;A(chǔ)設(shè)施即服務(wù)(IaaS)和網(wǎng)格計(jì)算這樣的既有模型不同,它對(duì)于提供給用戶的軟件或服務(wù)的類型沒有任何限制。事實(shí)上,云提供了有效的應(yīng)用基于已有的或定制的任何軟件的能力。
云計(jì)算的重要性在于為小公司或組織在沒有先前投資的情況下提供接入計(jì)算基礎(chǔ)設(shè)施的機(jī)會(huì)。因此,所需要的資金投入總額可以被縮減為最小化的投入代價(jià)并減小了運(yùn)行風(fēng)險(xiǎn)。
云計(jì)算可以被運(yùn)用到高性能計(jì)算上這一結(jié)論已被證實(shí)。小的機(jī)構(gòu)和個(gè)體科研組織現(xiàn)在可以接入大型計(jì)算資源,不僅可以通過帶有限制的網(wǎng)格,還可以通過提供了虛擬無限資源為基礎(chǔ)平臺(tái)的云集群,這些集群在維護(hù)上只需要原有的部分代價(jià),并且通過使用即付費(fèi)的模式來運(yùn)作。
任何分布式系統(tǒng)的核心都在于它的任務(wù)調(diào)度器,其作用在于向服務(wù)器或者虛擬機(jī)分配任務(wù)。通常,調(diào)度器的調(diào)度策略目標(biāo)是達(dá)到更快的響應(yīng)時(shí)間和更低的故障率,這是通過最小化冗余延遲來實(shí)現(xiàn)的[1]。
在我們的模型中,調(diào)度器必須以趨于最小時(shí)間花費(fèi)的虛擬機(jī)目標(biāo)策略來獲得最佳的代價(jià)效率比。該建模系統(tǒng)實(shí)現(xiàn)了一個(gè)稱為成組調(diào)度的并行任務(wù)調(diào)度的特殊實(shí)例,該實(shí)例中的任務(wù)必須同時(shí)執(zhí)行及被調(diào)度,以滿足其持續(xù)互相通信的要求。這就需要在任務(wù)和虛擬機(jī)之間建立一張點(diǎn)對(duì)點(diǎn)映射圖[2],并且要避免由來源于另一個(gè)非運(yùn)行任務(wù)作為任務(wù)輸入等待條件所可能帶來的瓶頸問題及其引起的死鎖。
在分布式和集群系統(tǒng)領(lǐng)域,近些年成組調(diào)度已經(jīng)被廣泛研究。Karatza在其文獻(xiàn)中提到了對(duì)適應(yīng)性先來先服務(wù)(AFCFS)以及最大優(yōu)先級(jí)任務(wù)先服務(wù)(LJFS)的性能研究[3]。與此同時(shí)他還研究了成組調(diào)度在輸入輸出調(diào)度和處理器失敗情況下的應(yīng)用研究[4]。Papazachos和Karatza研究了該成組調(diào)度在兩個(gè)不同集群系統(tǒng)中的應(yīng)用情況。先前提到的公共應(yīng)用成組調(diào)度都是設(shè)計(jì)于預(yù)先安排好服務(wù)器總數(shù)量及單機(jī)范圍任務(wù)大小的靜態(tài)系統(tǒng)。
使用虛擬計(jì)算機(jī)作為處理單元的網(wǎng)格模型系統(tǒng)的彈性被Nie和Xu等人研究[5]。其發(fā)表的研究聚焦于沒有執(zhí)行期限的非并行任務(wù)和目標(biāo)與當(dāng)維持最小化失敗率時(shí)的最大化利用率。
云計(jì)算平臺(tái)的調(diào)度策略在之前已經(jīng)被研究。Assuncao等人對(duì)通過云完成的擴(kuò)展私有集群進(jìn)行了研究[6]。Sotomayor等人使用模糊虛擬機(jī)管理架構(gòu)對(duì)在并行任務(wù)批量調(diào)度虛擬機(jī)利用率問題上進(jìn)行了研究。在這些模式中,任務(wù)并不需要交互操作,并且可以被獨(dú)立的調(diào)度執(zhí)行[7]。
我們研究了在動(dòng)態(tài)提供虛擬機(jī)的分布式云計(jì)算系統(tǒng)中應(yīng)用成組調(diào)度策略的方法和效用。我們利用了兩個(gè)任務(wù)調(diào)度算法即之前提到的AFCFS和LJFS,并且控制虛擬多樣化工作和多重任務(wù)規(guī)模的范圍。評(píng)估結(jié)果同時(shí)對(duì)性能和代價(jià)效率調(diào)度算法有效。然而,我們先前的工作沒有考慮任務(wù)的遷移以提高響應(yīng)時(shí)間和減小任務(wù)分離,同樣沒有考慮到高負(fù)荷工作的適應(yīng)算法,應(yīng)用可能引起很多等不到執(zhí)行機(jī)會(huì)的任務(wù)。在該新研究中,我們的模型中整合了遷移機(jī)制和需求控制系統(tǒng),并且比較了這些方法的有效性,這些方法有著較好的綜合性能和代價(jià)效率。之前的研究并沒有考慮到成組調(diào)度在基于云計(jì)算架構(gòu)的復(fù)雜模型中的應(yīng)用。
1 系統(tǒng)及工作模式
虛擬建模開發(fā)包括動(dòng)態(tài)虛擬機(jī)集群及其虛擬機(jī)調(diào)度器(DVM)。當(dāng)系統(tǒng)初始化時(shí),無需進(jìn)行虛擬機(jī)租約的確定,虛擬機(jī)數(shù)量可以動(dòng)態(tài)增加和縮減。
在虛擬機(jī)調(diào)度器有能力進(jìn)行分布式并行任務(wù)調(diào)度的情況下每一個(gè)虛擬機(jī)將實(shí)現(xiàn)其自己的等待隊(duì)列。虛擬機(jī)調(diào)度器同樣有一個(gè)任務(wù)隊(duì)列,它們既不能按照虛擬機(jī)不均勻到達(dá)時(shí)間進(jìn)行調(diào)度也不能按照系統(tǒng)負(fù)載來進(jìn)行調(diào)度。出于簡單的目的,虛擬機(jī)調(diào)度器本身并不包括在虛擬機(jī)總數(shù)中。同樣,任務(wù)遷移和需求控制機(jī)制由虛擬機(jī)控制器進(jìn)行管理。
虛擬機(jī)間通信可以認(rèn)為是自由競爭關(guān)系,然而任何潛在的通信都包含了任務(wù)執(zhí)行時(shí)間。所以,我們必須要考慮到當(dāng)任務(wù)調(diào)度器隊(duì)列存在任務(wù)調(diào)度延誤的情況。
除此之外,虛擬機(jī)被考慮在包括相同EC2的實(shí)例類中,并且因此具有完全相同的特性。雖然虛擬機(jī)可能具有不同的處理性能,就像非虛擬系統(tǒng)一樣,研究表明,除卻輸入輸出可能產(chǎn)生的影響,虛擬機(jī)可以提供近似相同的性能[8]。由于在我們的研究中沒有考慮到輸入輸出情況,假設(shè)任何包括任務(wù)執(zhí)行時(shí)間在內(nèi)的影響性能的臨時(shí)原因都是隱含被屏蔽的。
成組調(diào)度需要任務(wù)并行運(yùn)作[9],因此每一個(gè)任務(wù)需要一系列等價(jià)于為執(zhí)行需要而并行化的空閑虛擬機(jī)。在我們的模型中,并行化的程度是隨機(jī)的,其符合離散均勻分布并可以歸納為以下兩類:
(1)低并行化任務(wù):任務(wù)的數(shù)量以q為概率維持在1至16個(gè)之間。
(2)高并行化任務(wù):任務(wù)的數(shù)量以1-q為概率維持在17至32個(gè)之間。
q是決定了任務(wù)總數(shù)的任務(wù)數(shù)量并發(fā)系數(shù),該系數(shù)可以屬于第一類或第二類。
因此平均任務(wù)數(shù)量(AJS)可以按照式(1)計(jì)算得出:
這里,E代表的是離散均勻分布等量范圍值。任務(wù)同時(shí)到達(dá)時(shí)間的意思是以1/λ為平均值的指數(shù)分布并且平均服務(wù)時(shí)間是以1/μ為平均值的指數(shù)分布。服務(wù)時(shí)間和任務(wù)數(shù)量之間沒有關(guān)系,因此,一個(gè)低并行度任務(wù)可以擁有一個(gè)較長的服務(wù)時(shí)間。最終研究顯示,成組調(diào)度的上下文切換需要較高代價(jià),故任務(wù)并不會(huì)常以搶占的方式執(zhí)行完成[10]。該系統(tǒng)的控制模型如圖1所示。
圖1 系統(tǒng)模型
2 調(diào)度遷移和需求控制策略
2.1 任務(wù)分發(fā)
圖1所示的系統(tǒng)入口點(diǎn)是虛擬機(jī)調(diào)度器。任務(wù)并行化程度小于或等于時(shí)可用立即分發(fā)虛擬機(jī)。對(duì)于虛擬機(jī)任務(wù)的分布,虛擬機(jī)調(diào)度器應(yīng)用最短隊(duì)列優(yōu)先算法,該算法向虛擬機(jī)分發(fā)任務(wù)按照最短隊(duì)列原則進(jìn)行。
2.2 任務(wù)調(diào)度
模型應(yīng)用了兩個(gè)常用的成組調(diào)度算法。不管是AFCFS還是LJFS都在集群計(jì)算領(lǐng)域有著一定程度的研究。服務(wù)調(diào)度原則如下:
(1)適應(yīng)性先來先服務(wù):AFCFS試圖調(diào)度那些在其各自隊(duì)列之前的任務(wù),當(dāng)每一次虛擬機(jī)變?yōu)榭臻e時(shí),如果沒有這個(gè)任務(wù)的存在,AFCFS將試圖以最快降低隊(duì)列長度的方式來調(diào)度任務(wù)。因?yàn)檫@種AFCFS調(diào)度方式趨于針對(duì)較小任務(wù),這些任務(wù)更易于調(diào)度但會(huì)增加最大任務(wù)的等待時(shí)間。
(2)最大優(yōu)先級(jí)任務(wù)先服務(wù): LJFS調(diào)度方式提供了針對(duì)大任務(wù)的更優(yōu)先的調(diào)度策略。在每一個(gè)調(diào)度周期內(nèi),LJFS都將嘗試調(diào)度分布于空閑虛擬機(jī)中的最大優(yōu)先級(jí)任務(wù)。該方法通過授權(quán)方式在很大程度上增加了大任務(wù)的響應(yīng)時(shí)間。同樣,由于大任務(wù)在調(diào)度過程中經(jīng)常將大量虛擬機(jī)資源空余出來,相對(duì)于AFCFS,較小的任務(wù)在等待時(shí)間上將被縮減。
2.3 任務(wù)遷移
成組調(diào)度中有一個(gè)共性問題,即通常當(dāng)?shù)却蝿?wù)被調(diào)出隊(duì)列的過程中處理器總會(huì)處于空閑狀態(tài)[11]。為了避免出現(xiàn)這種時(shí)間碎片,遷移的實(shí)施是必須的。遷移的處理包括了從虛擬機(jī)隊(duì)列中的繁忙虛擬機(jī)中向可用空閑虛擬機(jī)上遷移切換任務(wù)。雖然該處理方式解決了前面提到的碎片問題,但其本身也給系統(tǒng)帶來了大量的開銷[12]。
本文設(shè)計(jì)的系統(tǒng)在考慮了應(yīng)用任務(wù)遷移安全性的前提下減少了系統(tǒng)開銷。具體做法是:只有在系統(tǒng)不能通過正常途徑進(jìn)行任務(wù)調(diào)度的情況下才允許任務(wù)遷移。當(dāng)這種情況發(fā)生時(shí),遷移系統(tǒng)嘗試查找是否在任務(wù)隊(duì)列中有適合于在當(dāng)前空閑虛擬機(jī)中運(yùn)行的任務(wù)。如果存在這樣的任務(wù),系統(tǒng)將使用以下兩種策略中的一種來對(duì)任務(wù)進(jìn)行遷移,具體選擇哪種依賴于虛擬機(jī)的配置。這兩種策略如下:
(1)首位適應(yīng):在合適的任務(wù)隊(duì)列中,直接選擇排在首位的任務(wù)。該方法實(shí)現(xiàn)簡單,帶來的平均開銷少。
(2)最佳適應(yīng):選擇最適合的任務(wù),該任務(wù)對(duì)于空閑的虛擬機(jī)來說,具有最高等級(jí)的并行化適應(yīng)性。該方法由于需要執(zhí)行最佳任務(wù)適應(yīng)算法,從而將帶來較多的額外開銷。
為了高效達(dá)到該遷移任務(wù)的目的,我們還引入了一個(gè)遷移監(jiān)控機(jī)制用于減少總的遷移次數(shù),該監(jiān)控可以確保任務(wù)調(diào)度只發(fā)生在適配任務(wù)數(shù)小于指定數(shù)量的情況下。
當(dāng)遷移處理結(jié)束后,遷移的任務(wù)將被調(diào)度到執(zhí)行狀態(tài),并立刻在下一個(gè)時(shí)鐘周期被執(zhí)行。該處理方式可防止對(duì)同一任務(wù)的多次重復(fù)遷移,避免對(duì)系統(tǒng)產(chǎn)生更多負(fù)載開銷。
2.4 需求控制
我們的系統(tǒng)中還設(shè)計(jì)有一個(gè)包含了隊(duì)列優(yōu)先權(quán)的專用子系統(tǒng),該子系統(tǒng)的實(shí)現(xiàn)目的在于進(jìn)行需求控制。當(dāng)該隊(duì)列包含了“需求控制”任務(wù)時(shí),常規(guī)的任務(wù)調(diào)度和遷移會(huì)被暫停。當(dāng)系統(tǒng)的膨脹系數(shù)Xfactor達(dá)到了設(shè)置的需求門限,則該任務(wù)會(huì)自動(dòng)觸發(fā)。膨脹系數(shù)的計(jì)算方法見式(2):
這里,IWTj和ej是實(shí)例等待時(shí)間,該時(shí)間的長短取決于各個(gè)實(shí)際執(zhí)行任務(wù)j本身的運(yùn)行時(shí)間。
對(duì)膨脹系數(shù)的選擇在整個(gè)任務(wù)控制處理中起到了非常重要的作用。另外,在我們的模型中有需求的任務(wù)可能會(huì)發(fā)生遷移,并沒有被上面提及的監(jiān)控系統(tǒng)所綁定,因此需求控制系統(tǒng)也可能導(dǎo)致在所設(shè)置的膨脹系數(shù)滿足的情況下形成任務(wù)遷移潮。
3 虛擬機(jī)控制策略
云向用戶提供了其對(duì)計(jì)算資源按照實(shí)際請(qǐng)求虛擬機(jī)數(shù)量進(jìn)行增容或減容的能力。該過程包括了一個(gè)延遲,該延遲由虛擬機(jī)管理者創(chuàng)建和設(shè)置新的虛擬機(jī)所需時(shí)間而產(chǎn)生。在每次請(qǐng)求中該延遲通常小于十分鐘。在我們的虛擬模型中,該延遲是按照均值為0.1而設(shè)計(jì)的,滿足U(0,0.4)的持續(xù)均勻分布的隨機(jī)數(shù)。
3.1 虛擬機(jī)供給機(jī)制
一個(gè)復(fù)雜的子系統(tǒng)被實(shí)現(xiàn)用于從系統(tǒng)中添加和去除虛擬機(jī)。遇到以下條件之一時(shí)將發(fā)生虛擬機(jī)租借的情況:
(1)虛擬機(jī)不足。當(dāng)一個(gè)任務(wù)包含了多個(gè)子任務(wù),其總數(shù)超過了可用虛擬機(jī)數(shù)目,將會(huì)發(fā)生這種情況。該任務(wù)被排列在虛擬機(jī)管理器中直到新的虛擬機(jī)可以供給。
(2)虛擬機(jī)過載。在每一次分發(fā)中,系統(tǒng)都會(huì)檢查虛擬機(jī)等待隊(duì)列的狀態(tài),計(jì)算平均負(fù)載因子的公式見式(3)。
這里,Jk是虛擬機(jī)k中的當(dāng)前等待任務(wù)數(shù),Pk是系統(tǒng)當(dāng)前已租借虛擬機(jī)數(shù)。
(3)
ALF總體而言要優(yōu)于之前定義的負(fù)載門限,系統(tǒng)提供了一個(gè)虛擬機(jī)控制器能力等價(jià)于達(dá)到任務(wù)數(shù)的新虛擬機(jī),其任務(wù)隊(duì)列將處于等待狀態(tài)直到新虛擬機(jī)可用為止。
出現(xiàn)上述兩種情況的任一種,系統(tǒng)都不會(huì)去嘗試申請(qǐng)租借更多的虛擬機(jī)。同樣,當(dāng)每一個(gè)提供的租借虛擬機(jī)被暫停,在第十個(gè)周期到達(dá)后將會(huì)由系統(tǒng)為新的虛擬機(jī)進(jìn)行填補(bǔ)。
3.2 虛擬機(jī)釋放機(jī)制
在當(dāng)前環(huán)境下,當(dāng)系統(tǒng)不再需要使用某些虛擬機(jī)時(shí),可能會(huì)進(jìn)行虛擬機(jī)的釋放。該操作由于會(huì)影響系統(tǒng)的整體開銷,所以特別重要。如何評(píng)價(jià)一個(gè)虛擬機(jī)是否滿足可釋放條件取決于以下三點(diǎn):
(1)虛擬機(jī)是空閑的并且其等待隊(duì)列也是空的;
(2)虛擬機(jī)管理器隊(duì)列中沒有等待重新調(diào)度的任務(wù);
(3)沒有正處于計(jì)劃遷移激活態(tài)的任務(wù)。
若以上三點(diǎn)標(biāo)準(zhǔn)同時(shí)滿足,我們就認(rèn)為該虛擬機(jī)處于可釋放狀態(tài)。
4 性能與代價(jià)評(píng)估
該研究既集中于系統(tǒng)性能的評(píng)估,也關(guān)注代價(jià)的評(píng)估。
4.1 性能評(píng)價(jià)指標(biāo)
以下指標(biāo)都在性能評(píng)價(jià)中使用:
(1)響應(yīng)時(shí)間RTk:表示了任務(wù)k的請(qǐng)求在到達(dá)與反饋之間的間隔時(shí)間。它的平均值可以定義如下:
這里N代表任務(wù)的總數(shù)。
(2)響應(yīng)遲緩比Sk:其定義為Sk=RTk/ek,該指標(biāo)顯示了一個(gè)任務(wù)相對(duì)于其服務(wù)時(shí)間ek的延誤容忍比度。由于該指標(biāo)可以很容易被作為分母的數(shù)值很小的服務(wù)時(shí)間所影響,所以我們使用下述限制指標(biāo):
我們的實(shí)驗(yàn)里λ被設(shè)置為10-3。
(3)遷移總數(shù)目migtot:由于上述原因,我們使用有明確影響的遷移總數(shù)量以對(duì)系統(tǒng)綜合性能的虛擬化進(jìn)行評(píng)估。
4.2 代價(jià)評(píng)估
由于云的運(yùn)作是有代價(jià)關(guān)聯(lián)的,所以系統(tǒng)必須在響應(yīng)時(shí)間和所需代價(jià)之間維持一個(gè)較好的平衡。因此,我們需要整合代價(jià)性能效率的指標(biāo),即虛擬機(jī)完全租賃時(shí)間(LT)和平均響應(yīng)時(shí)間(RT)。
CPE=DLT+DRT
這里,DLT是LT和兩個(gè)虛擬實(shí)驗(yàn)的相關(guān)差異,DRT是響應(yīng)時(shí)間之間的相關(guān)差異。我們必須注意到,最佳適配先服務(wù)作為基礎(chǔ)較最大任務(wù)先服務(wù)策略在CPE數(shù)據(jù)上具有負(fù)向效果,所以顯示出最佳適配先服務(wù)作為基礎(chǔ)較最大優(yōu)先級(jí)任務(wù)先服務(wù)策略的優(yōu)越性。圖2所示是在相同到達(dá)率情況下不同響應(yīng)時(shí)間和不同響應(yīng)延遲比的性能指標(biāo)圖。圖3所示是相同到達(dá)率情況下的任務(wù)遷移數(shù)指標(biāo)。
(a)同到達(dá)率情況下不同響應(yīng)時(shí)間的性能指標(biāo)
(b) 同到達(dá)率情況下不同響應(yīng)延遲比的性能指標(biāo)
圖2 相同到達(dá)率情況下不同響應(yīng)時(shí)間和
不同響應(yīng)延遲比的性能指標(biāo)
圖3 相同到達(dá)率情況下的任務(wù)遷移數(shù)指標(biāo)
4.3 仿真參數(shù)
上面描述的模型是通過非連續(xù)模擬事件實(shí)現(xiàn)的。這里表征的每一個(gè)結(jié)果都是由平均差異實(shí)例對(duì)每一個(gè)到達(dá)率(λ)的調(diào)度算法,遷移算法以及每一個(gè)任務(wù)大小的協(xié)同虛擬化實(shí)驗(yàn)所反饋的結(jié)果。每一個(gè)仿真運(yùn)行都將在完成100 000個(gè)任務(wù)后自動(dòng)終結(jié)。
三個(gè)不同任務(wù)規(guī)模的協(xié)同實(shí)現(xiàn)如下:
(1)p=0.25,其中平均任務(wù)數(shù)量為22.5;
(2)p=0.5,其中平均任務(wù)數(shù)量為16.3;
(3)p=0.75,其中平均任務(wù)數(shù)量為12.8。
這些值被選擇以研究任務(wù)規(guī)模對(duì)系統(tǒng)性能的影響。
對(duì)λ值的簡單選擇并不能滿足系統(tǒng)復(fù)合結(jié)構(gòu)的要求。通過實(shí)證研究我們選擇了可以使系統(tǒng)有能力進(jìn)行動(dòng)態(tài)租借和釋放虛擬機(jī)的值。對(duì)每一個(gè)任務(wù)規(guī)模協(xié)同分布到達(dá)率,我們給出如下參數(shù)的結(jié)論:
(1)p=0.25,到達(dá)率λ=[1.75,2.0,2.25,2.5];
(2)p=0.5,到達(dá)率λ=[2,2.25,2.5,2.75];
(3)p=0.75,到達(dá)率λ=[2.5,3.0,3.5,4.0]。
同樣前面描述過,由于膨脹系數(shù)在需求控制中起到了一個(gè)很重要的作用,我們對(duì)以下兩個(gè)分離值進(jìn)行了測試:
(1)Xfactor=10
(2)Xfactor=20
對(duì)于每一個(gè)平均值,都以95%的可信區(qū)間進(jìn)行評(píng)估。所有可信區(qū)間的半寬都小于其各自值的5%。
4.4 結(jié)果
該結(jié)果由預(yù)測性能和代價(jià)在兩個(gè)不同配置的調(diào)度算法下的差異而生成。由于該模型由離散事件模擬,所以響應(yīng)時(shí)間由理論時(shí)間片計(jì)算獲得。
圖2描述了上述性能指標(biāo)(包括RT和BSLD)以及p=[0.25,0.50,0.75]等各種情況下的狀態(tài)。每一張圖都顯示了最佳適配先服務(wù)與最大優(yōu)先級(jí)任務(wù)先服務(wù)對(duì)任務(wù)到達(dá)率、響應(yīng)時(shí)間、響應(yīng)延遲比以及膨脹系數(shù)之間協(xié)同的作用效果。圖3顯示了每一個(gè)實(shí)驗(yàn)中的遷移任務(wù)數(shù)量,由此完成對(duì)遷移的評(píng)估。最終,表1顯示了在所有參數(shù)情況下的性能與代價(jià)效率數(shù)據(jù)。
(1)響應(yīng)時(shí)間:很明顯,遷移系統(tǒng)與需求控制系統(tǒng)一同有效的工作可將響應(yīng)時(shí)間維持在低水平上并保持較低或中等的到達(dá)率。在p=0.25和Xfactor=20的高到達(dá)率情況下,這里在響應(yīng)時(shí)間上存在著顯著差異。在同樣情況下,最近任務(wù)先服務(wù)與最佳適配機(jī)制相結(jié)合提供了最適度的結(jié)果。
正如我們?cè)趫D3中看到的在相應(yīng)配置的情況下,p=0.25,Xfactor=20相對(duì)于Xfactor=10來說允許更少的遷移發(fā)生,從響應(yīng)時(shí)間的角度來看,具有更低的到達(dá)率。相比之下,當(dāng)?shù)竭_(dá)率提高時(shí),不僅同等級(jí)膨脹系數(shù)下的性能差異微小,同時(shí)遷移數(shù)量與Xfactor=10相當(dāng)。一方面p=0.5和p=0.75,Xfactor=20能夠使平均響應(yīng)時(shí)間維持在一個(gè)較好的水平上,與Xfactor=10相比可以提供上限為40%的遷移。因此可以得出結(jié)論:即當(dāng)處理中低等級(jí)并行化任務(wù)時(shí),更大的膨脹系數(shù)是可取的,而對(duì)于處理高級(jí)別并發(fā)任務(wù)時(shí),特別是針對(duì)較大到達(dá)率的情況下,較小的膨脹系數(shù)則是更優(yōu)的選擇。
(2)響應(yīng)遲緩比:這是一個(gè)很容易受到較短服務(wù)時(shí)間影響的指標(biāo),雖然我們的指標(biāo)進(jìn)行了界限設(shè)定,但其依然可以隨時(shí)間變化。
在圖2中,綁定響應(yīng)延遲比指標(biāo)對(duì)于p=0.75和p=0.5及一些異常值的情況下顯示了一個(gè)持續(xù)穩(wěn)定的行為結(jié)果。這些結(jié)果顯示,響應(yīng)延遲發(fā)生在遷移算法和需求控制介于中低等級(jí)的并發(fā)任務(wù)規(guī)模的協(xié)同程度處于可控制水平的情況下。對(duì)于p=0.25,相對(duì)結(jié)果顯示在響應(yīng)延遲比上則會(huì)與預(yù)期結(jié)果有較大的不一致。這可以歸于遷移和需求控制方法在時(shí)間上以短服務(wù)時(shí)間劃分任務(wù)以至在等待隊(duì)列里以相對(duì)于期望的立即影響的響應(yīng)延遲比需要更長的周期。
(3)代價(jià)與性能效率:在我們之前的工作中,是沒有包括遷移和需求控制的,因此得到的結(jié)論是對(duì)于所有任務(wù)在較高到達(dá)率情況下,最大優(yōu)先級(jí)任務(wù)先服務(wù)與適應(yīng)性先來先服務(wù)相比有著更高的代價(jià)效率。表1顯示了這些在遷移和需求控制起作用的情況下基本消失的差異。不同的任務(wù)規(guī)模效應(yīng)和擴(kuò)展因素看起來有著較小的影響,同時(shí),當(dāng)使用負(fù)值對(duì)適應(yīng)性先來先服務(wù)進(jìn)行描述的話,差異實(shí)際可以忽略不計(jì)。
表1 代價(jià)和性能效率表
λ 先來先服務(wù)(10) 最佳適應(yīng)先服務(wù)(10) 先來先服務(wù)(20) 最佳適應(yīng)先服務(wù)(20)
p=0.25
1.75 -0.016 32 0.012 79 -0.058 01 -0.051 02
2.50 -0.056 49 -0.029 13 0.015 14 -0.029 27
3.25 -0.061 12 -0.033 13 -0.137 15 -0.203 18
4.00 -0.041 45 -0.042 13 -0.025 31 -0.051 99
p=0.50
1.75 -0.012 07 -0.002 80 0.004 13 -0.038 12
2.50 -0.041 32 0.008 77 -0.042 32 -0.045 41
3.25 -0.057 69 0.007 49 -0.018 32 -0.076 81
4.00 -0.061 42 -0.021 93 -0.121 47 -0.048 02
p=0.75
1.75 -0.031 58 -0.033 11 -0.006 91 -0.031 85
2.50 -0.048 15 -0.021 88 -0.051 01 -0.079 03
3.25 -0.021 10 -0.018 98 -0.066 13 -0.035 73
4.00 -0.027 41 -0.047 26 -0.088 01 -0.075 15
5 結(jié) 語
本研究將任務(wù)遷移和需求控制兩個(gè)重要的概念整合入模型中。結(jié)果模型被通過多負(fù)載多任務(wù)規(guī)模的成組調(diào)度,遷移和需求控制集成的虛擬器進(jìn)行測試。多種指標(biāo)都被應(yīng)用以對(duì)滿配置情況下的性能和系統(tǒng)代價(jià)進(jìn)行評(píng)估。
遷移和需求控制的應(yīng)用對(duì)實(shí)驗(yàn)?zāi)P陀泻苌羁痰挠绊?。雖然遷移平衡了響應(yīng)時(shí)間的差異,它們的總數(shù)量在系統(tǒng)性能問題上扮演了一個(gè)非常重要的角色,同時(shí)它們提供了一個(gè)新的比較基準(zhǔn)。另外膨脹系數(shù)的差異提供了更好的調(diào)整機(jī)制以在不同的環(huán)境下獲得更好的結(jié)果。
在將來,我們希望對(duì)新的工作負(fù)載模型進(jìn)行測試,以與云計(jì)算更好地進(jìn)行適配。同樣對(duì)該機(jī)制在系統(tǒng)中各式各樣的應(yīng)用,如果任何屬于實(shí)時(shí)云系統(tǒng)的結(jié)論被提出,性能因素都應(yīng)該進(jìn)行深入的研究。
參考文獻(xiàn)
[1] Z. C. Papazachos,H. D. Karatza.The impact of task service time variability on gang scheduling performance in a two-cluster system.Simul[J].Modell.Pract.Theory, 2009,17(7):1276-1289.
[2] Y. Zhang, H. Franke, J. Moreira,et al.An integrated approach to parallel scheduling using gang-scheduling, backfilling, and migration[J]. Dept. of Electr. & Comput. Eng.,State Univ.of New Jersey,Piscataway,NJ, USA.IEEE Transactions on Parallel and Distributed Systems,2003, 14(3):236-247.
[3] Y.Wiseman,D.G.Feitelson.Paired gang scheduling[J].IEEE Trans. Parallel Distrib. Syst.,2003,14(6):581-592.
[4] A. M. Law.Simulation Modeling and Analysis[Z].4th ed. McGraw-Hill Higher Education, 2007.
[5] D. G. Feitelson.Metrics for parallel job scheduling and their convergence[Z].in Revis. Pap. from the 7th Int. Worksh. on Job Sched. Strateg. for Parallel Process., ser. JSSPP 01. London, UK: Springer-Verlag, 2001:188-206.
[6] M. Guazzone, C. Anglano, M. Canonico.Energy-Efficient Resource Management for Cloud Computing Infrastructures[Z].presented at the Cloud Computing Technology and Science (CloudCom),IEEE 3rd Int. Conf., 2011:424-431.
[7] F.R.Dogar,P.Steenkiste,K.Papagiannaki.Catnap: Exploiting high bandwidth wireless interfaces to save energy for mobile devices[Z].in Proc.ACM MobiSys10,San Francisco, California, 2010:107-122.
[8] N. Vallina-Rodriguez,J.Crowcroft.ErdOS: achieving energy savings in mobile OS[Z].in Proceedings of the sixth international workshop on MobiArch, ser. MobiArch 11. New York, NY, USA: ACM, 2011:37-42.
[9] 劉亮,向碧群,桂曉菁.基于云計(jì)算的多污染區(qū)域綜合檢測系統(tǒng)設(shè)計(jì)[J].計(jì)算機(jī)測量與控制,2012,20(8):2089-2091.
[10] 張瀟丹,李俊.一種基于云服務(wù)模式的網(wǎng)絡(luò)測量與分析架構(gòu)[J]. 計(jì)算機(jī)應(yīng)用研究,2012,29(2):725-729.
[11] G. Wang,T.S.E. Ng.The Impact of Virtualization on Network Performance of Amazon EC2 Data Center[Z].Proceedings of IEEE INFOCOM, 2010:1-9.
[12] V. Chang, G. Wills, D. De Roure.A Review of Cloud Business Models and Sustainability[Z].IEEE 3rd International Conference on Cloud Computing, 2010: 43-50.