楊 耘,劉 曉,王福田
(1.安徽大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,安徽 合肥230601; 2.斯威本科技大學(xué) 軟件和電子工程學(xué)院,澳大利亞 墨爾本 3122;3.迪肯大學(xué) 信息技術(shù)學(xué)院,澳大利亞 墨爾本 3125)
1994年,工作流管理聯(lián)盟(workflow management coalition,簡(jiǎn)稱WfMC)給出了工作流及工作流管理系統(tǒng)參考模型的定義[1].定義工作流是一個(gè)能夠整體或部分自動(dòng)化執(zhí)行的業(yè)務(wù)流程,根據(jù)業(yè)務(wù)流程的規(guī)則,文本、信息或者是任務(wù)能夠在不同用戶之間傳遞或執(zhí)行[2].工作流管理系統(tǒng)參考模型有工作流執(zhí)行服務(wù)(workflow enactment service)、過程定義工具(process definition tools)、工作流客戶端應(yīng)用程序(workflow client applications)、應(yīng)用程序調(diào)用(invoked applications)、其他工作流執(zhí)行服務(wù)(other workflow enactment services)以及管理和監(jiān)控工具(administration and monitoring tools)6個(gè)基本功能組件和系統(tǒng)接口,保障數(shù)據(jù)在工作流系統(tǒng)中的正常執(zhí)行[1].工作流管理規(guī)范了業(yè)務(wù)的操作流程,提高了工作效率.許多企業(yè)和科研部門都開發(fā)了相應(yīng)的工作流系統(tǒng),如早期以P2P結(jié)構(gòu)的Triana、Serendipity、SwinDeW以及隨后以grid范式開發(fā)的Kepler、SwinDeW-G等[3].
隨著云計(jì)算的快速發(fā)展,大量的工作流系統(tǒng)把云計(jì)算環(huán)境看作是一個(gè)無限的計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)資源池,相關(guān)研究人員開發(fā)了基于云計(jì)算環(huán)境的云工作流系統(tǒng).例如:Hadoop中開發(fā)了WfMS(workflow management system)的核心功能,可以處理大規(guī)模的工作流應(yīng)用程序[4];亞馬遜的SWF(shock wave flash)是托管在AWS(Amazon web services)上的工作流處理程序[5];Microsoft的基于.NET framework的Windows Workflow Foundation[6];IBM(international business machines corporation)的基于云的智能業(yè)務(wù)流程管理軟件IBM_BPM[7];SwinDeW-C是一個(gè)部署在SwinCloud上的一個(gè)P2P的云工作流系統(tǒng)[8];SwinFlow-Cloud是一個(gè)部署在亞馬遜云上的基于客戶端云架構(gòu)的云工作流系統(tǒng)[9].
這些云工作流系統(tǒng)利用云計(jì)算提供的海量的、廉價(jià)的計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)資源,根據(jù)業(yè)務(wù)的工作量,動(dòng)態(tài)地從云計(jì)算服務(wù)提供商那里申請(qǐng)所需的軟件和硬件資源,而無須自己搭建和維護(hù)龐大的基礎(chǔ)設(shè)施和軟件平臺(tái)[10].云工作流系統(tǒng)的這種資源管理模式,大大降低了企業(yè)和政府處理大規(guī)模業(yè)務(wù)流程的資金門檻和技術(shù)門檻,為工作流實(shí)例的運(yùn)行提供了理想的系統(tǒng)運(yùn)行環(huán)境[11].例如,天氣預(yù)報(bào)、地震模型、天體物理等計(jì)算密集型的科學(xué)應(yīng)用,股票交易、銀行交易、電子商務(wù)等實(shí)例密集型的電子商務(wù)應(yīng)用.這些流程在構(gòu)建階段,可以按照工作流的規(guī)范對(duì)流程結(jié)構(gòu)、功能性需求、非功能性需求等進(jìn)行建模,在執(zhí)行階段可以使用云計(jì)算環(huán)境的可擴(kuò)展資源來完成流程的計(jì)算和處理.
雖然云工作流系統(tǒng)具有很多優(yōu)勢(shì),但是很多學(xué)者和企業(yè)內(nèi)人士都認(rèn)為云計(jì)算環(huán)境中的應(yīng)用性能管理是一個(gè)很大的難題[12-13],主要原因是云工作流系統(tǒng)的服務(wù)質(zhì)量(quality of service,簡(jiǎn)稱QoS)常常不能滿足用戶的需求.在實(shí)際應(yīng)用中,由于這些工作流應(yīng)用程序大多數(shù)都有時(shí)間約束,而云計(jì)算環(huán)境的底層基礎(chǔ)設(shè)施具有分布式和動(dòng)態(tài)特性,使得工作流實(shí)例很難保證在規(guī)定的時(shí)間內(nèi)完成,這會(huì)降低用戶對(duì)云工作流系統(tǒng)的滿意度以及工作流輸出結(jié)果的有用性,甚至是導(dǎo)致經(jīng)濟(jì)上的損失.因此,需要及時(shí)發(fā)現(xiàn)工作流實(shí)例在執(zhí)行過程中的時(shí)間延誤即時(shí)序異常情況,并盡可能減少其對(duì)最終結(jié)果的影響,提高云工作流系統(tǒng)的QoS.
文獻(xiàn)[14]給出工作流QoS的主要維度包括時(shí)間、成本、保真度、可靠性和安全性.具體來說,時(shí)間是性能的基本度量,它指的是在工作流系統(tǒng)中完成工作流實(shí)例執(zhí)行所需的總時(shí)間.文獻(xiàn)[15]提出一個(gè)通用的時(shí)間驗(yàn)證框架,它為工作流實(shí)例的執(zhí)行提供一個(gè)全生命周期的時(shí)間QoS支持.該框架主要由4個(gè)基本模塊組成:時(shí)序約束設(shè)置[16]、時(shí)序檢測(cè)點(diǎn)選擇[17]、時(shí)序驗(yàn)證[18]和時(shí)序異常處理[19].由于時(shí)序檢測(cè)點(diǎn)的選擇是基于時(shí)序驗(yàn)證的,有時(shí)把二者合在一起統(tǒng)稱為時(shí)序檢測(cè)點(diǎn)選擇.時(shí)序約束設(shè)置主要是在工作流構(gòu)建階段設(shè)定工作流的局部時(shí)間約束和最終完成時(shí)間[16].時(shí)序檢測(cè)點(diǎn)選擇是根據(jù)時(shí)序約束,選擇工作流活動(dòng)的子集作為時(shí)序一致性的檢測(cè)點(diǎn),對(duì)該時(shí)刻的工作流時(shí)序狀態(tài)進(jìn)行判斷[20].在工作流執(zhí)行過程中,如果工作流的活動(dòng)沒有在規(guī)定的時(shí)間內(nèi)完成,則被認(rèn)為發(fā)生了時(shí)間延誤也被稱為時(shí)序異常[21].如果不及時(shí)對(duì)時(shí)序異常進(jìn)行處理,可能會(huì)導(dǎo)致整個(gè)工作流實(shí)例不能在規(guī)定的時(shí)間內(nèi)完成.時(shí)序異常處理則是通過云工作流系統(tǒng)的各種恢復(fù)處理策略,使工作流實(shí)例最終能夠在規(guī)定的時(shí)間內(nèi)完成.論文從不同的角度對(duì)計(jì)算密集型的科學(xué)工作流和實(shí)例密集型的商務(wù)工作流的時(shí)序一致性建模,時(shí)序一致性監(jiān)測(cè)和時(shí)序異常處理策略進(jìn)行討論和概述.
工作流時(shí)序一致性建模是用數(shù)學(xué)模型來定義工作流執(zhí)行過程中的時(shí)序一致性,是時(shí)間驗(yàn)證框架的基礎(chǔ),為后期的時(shí)序檢測(cè)點(diǎn)的選擇提供理論依據(jù).當(dāng)前流行的兩種時(shí)序一致性度量標(biāo)準(zhǔn)是響應(yīng)時(shí)間和吞吐量[22-26].響應(yīng)時(shí)間度量的是活動(dòng)從提交到最終完成所持續(xù)的時(shí)間量,吞吐量度量的是單位時(shí)間內(nèi)完成的活動(dòng)的工作量.
科學(xué)工作流是一個(gè)單一的工作流實(shí)例,該實(shí)例包含若干個(gè)計(jì)算密集型或者是數(shù)據(jù)密集型的工作流活動(dòng),每個(gè)活動(dòng)通常需要運(yùn)行數(shù)分鐘甚至數(shù)小時(shí).因此,要保證科學(xué)工作流最終能按時(shí)完成,每個(gè)工作流活動(dòng)的運(yùn)行時(shí)間都需要進(jìn)行監(jiān)測(cè).為了更好地描述工作流時(shí)序一致性模型,文獻(xiàn)[27]給出了關(guān)于工作流和工作流活動(dòng)時(shí)間屬性的一些注釋.假設(shè)工作流中的第i個(gè)活動(dòng)是ai,則該活動(dòng)的實(shí)際運(yùn)行時(shí)間、期望運(yùn)行時(shí)間、均值運(yùn)行時(shí)間、最小運(yùn)行時(shí)間、最大運(yùn)行時(shí)間分別記為:R(ai)、E(ai)、M(ai)、d(ai)和D(ai).假設(shè)同類活動(dòng)的運(yùn)行時(shí)間滿足正態(tài)分布N(μi,σi2),其中:期望是μi,標(biāo)準(zhǔn)差是σi.文獻(xiàn)[27]證明,該理論在其他分布模型中也適用,并對(duì)性能沒有實(shí)質(zhì)影響.假設(shè)SW表示科學(xué)工作流實(shí)例,U(SW)表示科學(xué)工作流實(shí)例的上界時(shí)間約束.基于響應(yīng)時(shí)間的科學(xué)工作流時(shí)序一致性模型被描述如下:若科學(xué)工作流實(shí)例SW包含了活動(dòng)al到活動(dòng)an,在活動(dòng)ap(l
(1)
則稱為絕對(duì)一致.
如果
(2)
則稱為絕對(duì)不一致.
如果
(3)
則稱為α%一致.
在上述公式中,R(al,ap)表示活動(dòng)al到ap的實(shí)際運(yùn)行時(shí)間開銷,λα(-3≤λα≤3)表示后續(xù)活動(dòng)若以μ+λασ為執(zhí)行時(shí)間,則工作流的按時(shí)完成率為α%.
λα和α%之間的關(guān)系可由公式
計(jì)算得到.因此,根據(jù)該模型,可以定義基于響應(yīng)時(shí)間的科學(xué)工作流的絕對(duì)一致、絕對(duì)不一致和α%一致狀態(tài).
商務(wù)工作流由大量的、并發(fā)的工作流實(shí)例構(gòu)成,每個(gè)工作流實(shí)例包含數(shù)個(gè)或者是幾十個(gè)活動(dòng),這些活動(dòng)的運(yùn)行時(shí)間通常很短或者較短.因此,在商務(wù)工作流的運(yùn)行過程中,需要監(jiān)測(cè)商務(wù)工作流的整體完成情況.文獻(xiàn)[28]用單位時(shí)間內(nèi)完成的工作流活動(dòng)的數(shù)量來計(jì)算吞吐量,這種定義并不能準(zhǔn)確反映出實(shí)例密集型工作流的完成情況.每個(gè)運(yùn)行時(shí)間不同的活動(dòng),對(duì)整個(gè)工作流運(yùn)行時(shí)間的貢獻(xiàn)是不同的.文獻(xiàn)[27]以活動(dòng)運(yùn)行時(shí)間對(duì)整個(gè)工作流運(yùn)行時(shí)間的貢獻(xiàn)作為吞吐量的計(jì)算方式,該方式可以準(zhǔn)確計(jì)算出工作流當(dāng)前完成的情況.
假設(shè)W(BW)表示商務(wù)工作流的總工作量,RTHai表示商務(wù)工作流中第ai個(gè)活動(dòng)完成時(shí)的運(yùn)行吞吐量.基于吞吐量的商務(wù)工作流時(shí)序一致性模型被描述如下:在第ai個(gè)活動(dòng)的完成時(shí)刻,如果
(4)
則處于絕對(duì)時(shí)序一致狀態(tài).
如果
(5)
則處于絕對(duì)時(shí)序不一致狀態(tài).
如果
(6)
則處于α%一致狀態(tài).
通過上面的定義,云工作流系統(tǒng)可以根據(jù)用戶對(duì)服務(wù)質(zhì)量的要求以及所采用的時(shí)序異常處理的能力,對(duì)時(shí)序一致性狀態(tài)進(jìn)行自由的劃分,該模式更加符合商業(yè)計(jì)算環(huán)境.例如,用戶希望工作流實(shí)例有90%的按時(shí)完成率,系統(tǒng)根據(jù)工作流的時(shí)序一致性模型,可以算出所需的云計(jì)算資源量,從而實(shí)現(xiàn)資源的按需提供.
在文獻(xiàn)[27]中,作者把基于響應(yīng)時(shí)間和基于吞吐量的時(shí)序一致模型總結(jié)為都是基于概率的時(shí)序一致性模型.如圖1所示,根據(jù)正態(tài)分布“3σ”準(zhǔn)則可知99.73%的活動(dòng)的運(yùn)行時(shí)間都在(0.13%, 99.87%)范圍內(nèi).圖1的左邊即絕對(duì)不一致(absolute inconsistency,簡(jiǎn)稱AI)部分,表示工作流出現(xiàn)嚴(yán)重的時(shí)序違背;圖1的右邊即絕對(duì)一致(absolute consistency,簡(jiǎn)稱AC)部分,表示工作流處于良好的時(shí)序一致狀態(tài).在工作流運(yùn)行的任意時(shí)刻,都可根據(jù)工作流的時(shí)序約束計(jì)算出當(dāng)前工作流的時(shí)序一致狀態(tài)α%.假設(shè)用戶和服務(wù)提供者之間協(xié)商的最低可接受的時(shí)序一致性狀態(tài)為θ%,根據(jù)α%與θ%的比較,即可判斷出當(dāng)前工作流的時(shí)序一致狀態(tài)是否滿足用戶的要求.
圖1 基于概率的時(shí)序一致性模型
時(shí)序檢測(cè)點(diǎn)的選擇是在工作流運(yùn)行過程中選擇活動(dòng)的子集作為時(shí)序檢測(cè)點(diǎn),在時(shí)序檢測(cè)點(diǎn)上對(duì)工作流的時(shí)序異常狀態(tài)進(jìn)行評(píng)估、處理,最終保證工作流能按時(shí)完成.因此,時(shí)序檢測(cè)點(diǎn)的數(shù)量還影響后續(xù)時(shí)序異常處理的次數(shù)和工作流的按時(shí)完成率.選擇過多的時(shí)序檢測(cè)點(diǎn),還可能增加后期時(shí)序異常處理的開銷[29].時(shí)序檢測(cè)點(diǎn)的選擇策略有很多種方法,例如:文獻(xiàn)[17]提出了時(shí)序檢測(cè)點(diǎn)選擇的評(píng)價(jià)標(biāo)準(zhǔn)——充分必要性,“充分性”即只有發(fā)生了時(shí)序異常的活動(dòng)點(diǎn)才會(huì)被選擇為檢測(cè)點(diǎn),“必要性”即沒有遺漏任何發(fā)生了時(shí)序異常檢測(cè)點(diǎn),而“充分必要”是時(shí)序檢測(cè)點(diǎn)選擇策略理論上的最優(yōu)標(biāo)準(zhǔn),最大限度地保證了工作流的時(shí)序異常得到及時(shí)處理;文獻(xiàn)[22]將用戶根據(jù)經(jīng)驗(yàn)選擇的活動(dòng)作為時(shí)序檢測(cè)點(diǎn);文獻(xiàn)[30]把工作流的每個(gè)活動(dòng)選擇為一個(gè)時(shí)序檢測(cè)點(diǎn);文獻(xiàn)[31]選擇活動(dòng)運(yùn)行時(shí)間大于平均運(yùn)行時(shí)間的活動(dòng)為時(shí)序檢測(cè)點(diǎn).該節(jié)針對(duì)基于響應(yīng)時(shí)間的科學(xué)工作流時(shí)序檢測(cè)點(diǎn)選擇策略和基于吞吐量的商務(wù)工作流時(shí)序檢測(cè)點(diǎn)選擇策略分別進(jìn)行概述.
文獻(xiàn)[19]提出一種基于概率時(shí)間冗余的科學(xué)工作流充要時(shí)序檢測(cè)點(diǎn)選擇策略,該策略利用基于響應(yīng)時(shí)間的時(shí)序一致性模型,實(shí)現(xiàn)對(duì)科學(xué)工作流中的時(shí)序檢測(cè)點(diǎn)選擇.該策略中的概率時(shí)間冗余的定義被描述為:活動(dòng)ap是活動(dòng)ai和活動(dòng)aj(i
PTR(U(ai,aj),ap)=u(ai,aj)-[R(ai,ap)+θ(ap+1,aj)],
(7)
其中
根據(jù)概率事件冗余的定義,最小概率時(shí)間冗余的定義可描述為:假設(shè)U1,U2,…,UN是N個(gè)包含ap的上界約束,則最小概率時(shí)間冗余可被表示為
MPTR(ap)=min{PTR(Us,ap)|s=1,2,…,N].
該定義可以使工作流運(yùn)行過程中的時(shí)序異常被盡早檢測(cè)到.根據(jù)該定義,則有在活動(dòng)點(diǎn)ap,如果不等式
R(ap)>θ(ap)+MPTR(ap-1)
成立,則至少有一個(gè)時(shí)序約束是異常的.因此,活動(dòng)點(diǎn)ap被選擇為一個(gè)時(shí)序檢測(cè)點(diǎn),同時(shí)該策略選擇的檢測(cè)點(diǎn)滿足充要條件.
文獻(xiàn)[27]提出一種基于吞吐量的商務(wù)工作流充要時(shí)序檢測(cè)點(diǎn)選擇策略,該策略的核心思想是,在商務(wù)工作流的執(zhí)行過程中,如果在某個(gè)活動(dòng)點(diǎn)上,當(dāng)前的完成率低于目標(biāo)按時(shí)完成率,則該活動(dòng)點(diǎn)被選擇為時(shí)序檢測(cè)點(diǎn).這里,假設(shè)THConsai表示商務(wù)工作流中第ai個(gè)活動(dòng)完成時(shí)的約束吞吐量,則具體的定義被描述為:在活動(dòng)點(diǎn)ap,如果不等式
RTHai 成立,則該活動(dòng)點(diǎn)ap被選擇為一個(gè)時(shí)序檢測(cè)點(diǎn).由于該策略是沿著商務(wù)工作流的運(yùn)行過程在每個(gè)活動(dòng)完成點(diǎn)上進(jìn)行檢測(cè)的,因此該策略選擇的檢測(cè)點(diǎn)也滿足充要條件. 上述不等式本質(zhì)上反應(yīng)的是商務(wù)工作流當(dāng)前的運(yùn)行情況,根據(jù)該運(yùn)行情況,可以計(jì)算出商務(wù)工作流當(dāng)前的按時(shí)完成率.假設(shè)用戶和服務(wù)提供者協(xié)商的商務(wù)工作流的按時(shí)完成率為θ%,根據(jù)上面給出的基于吞吐量的商務(wù)工作流時(shí)序一致模型,可以計(jì)算出當(dāng)前時(shí)刻商務(wù)工作流的成功率α%,如果不等式α%<θ%成立,則表明當(dāng)前時(shí)刻的按時(shí)完成率低于目標(biāo)值,即商務(wù)工作流有超時(shí)的風(fēng)險(xiǎn),該活動(dòng)點(diǎn)應(yīng)被選擇為一個(gè)時(shí)序檢測(cè)點(diǎn). 時(shí)序異常處理是針對(duì)工作流實(shí)例在運(yùn)行過程中檢測(cè)到的時(shí)序不一致情況進(jìn)行分析,并采取相應(yīng)的時(shí)序異常處理策略,最終保證工作流實(shí)例按時(shí)完成.文獻(xiàn)[32]把工作流的時(shí)序異常處理策略分為3大類:無操作、回滾和補(bǔ)償.其中,無操作對(duì)工作流運(yùn)行過程中監(jiān)測(cè)到的時(shí)序異常不做任何處理,認(rèn)為工作流系統(tǒng)具有自恢復(fù)能力,這種方式被認(rèn)為是有風(fēng)險(xiǎn)的.回滾策略是重新運(yùn)行工作流的部分活動(dòng),減少活動(dòng)的運(yùn)行時(shí)間,該策略并不能消除工作流的總體延遲時(shí)間.補(bǔ)償是一種較為合理的工作流異常處理策略,常用的補(bǔ)償策略有加資源和重調(diào)度[33].具體來說,加資源是在云環(huán)境中申請(qǐng)新的資源,而重調(diào)度是對(duì)工作流的后續(xù)活動(dòng)重新生成一個(gè)新的調(diào)度計(jì)劃.文獻(xiàn)[21]提出了一種考慮自恢復(fù)的科學(xué)工作流的時(shí)序異常處理策略.文獻(xiàn)[34]提出了一種針對(duì)商務(wù)工作流的異常處理策略.還有一些基于蟻群算法ACO(ant colony optimization)和粒子群算法PSO(particle swarm optimization)等算法的時(shí)序異常處理策略[35-36]. 文獻(xiàn)[19]提出一種基于遺傳算法的局部重調(diào)度的科學(xué)工作流時(shí)序異常處理策略.該策略的核心思想是在時(shí)序異常處理點(diǎn)上,計(jì)算工作流之前活動(dòng)的最大概率時(shí)間赤字和后續(xù)每個(gè)活動(dòng)所能彌補(bǔ)的時(shí)間量,利用基于遺傳算法的局部重調(diào)度策略對(duì)后續(xù)的工作流活動(dòng)重新生成運(yùn)行序列,使后續(xù)活動(dòng)的運(yùn)行可以彌補(bǔ)之前活動(dòng)運(yùn)行過程中產(chǎn)生的時(shí)間赤字,從而使工作流最終能按時(shí)完成. 在活動(dòng)點(diǎn)ap,概率時(shí)間赤字被定義為 PTR(U(ai,aj),ap)=u(ai,aj)-[R(ai,ap)+θ(ap+1,aj)], (8) 則最大概率時(shí)間赤字為 MPTR(ap)=min{PTR(Us,ap)|s=1,2,…,N}, (9) 因此,每個(gè)活動(dòng)所能恢復(fù)的時(shí)間赤字為 (10) 計(jì)算出每個(gè)活動(dòng)所能恢復(fù)的時(shí)間赤字之后,調(diào)用基于遺傳算法的局部重調(diào)度策略,即可實(shí)現(xiàn)對(duì)工作流時(shí)序異常的處理.該策略主要是通過限定子代的數(shù)量,來降低算法的時(shí)間復(fù)雜性,使算法在多項(xiàng)式時(shí)間內(nèi)計(jì)算出工作流活動(dòng)的重調(diào)度序列.同時(shí)文中還給出了該策略有效性和可行性的相關(guān)證明. 由于商務(wù)工作流中包含大量的活動(dòng),而每個(gè)活動(dòng)的運(yùn)行時(shí)間又不相等,這導(dǎo)致按照時(shí)序一致性模型進(jìn)行檢測(cè)時(shí),會(huì)發(fā)現(xiàn)很多時(shí)刻商務(wù)工作流都會(huì)有時(shí)序異常發(fā)生.其中有大量的時(shí)間赤字都非常小,可以認(rèn)為后續(xù)活動(dòng)的時(shí)間冗余可以自動(dòng)補(bǔ)償這部分時(shí)間赤字[35-36].基于此思想,作者提出一種考慮自我恢復(fù)的基于閾值的時(shí)序異常處理策略.該策略的思想是,在每個(gè)時(shí)序檢測(cè)點(diǎn),對(duì)商務(wù)工作流的時(shí)間赤字進(jìn)行判斷,當(dāng)時(shí)間赤字足夠大時(shí),即在活動(dòng)ai的完成時(shí)刻,當(dāng)商務(wù)工作流的時(shí)間赤字大于3*σi時(shí),則啟動(dòng)時(shí)序異常處理.在時(shí)序異常處理時(shí),根據(jù)每臺(tái)服務(wù)器所能恢復(fù)的最大時(shí)間赤字,采用閾值的方式來計(jì)算添加服務(wù)器資源的數(shù)量.閾值的定義為 (11) 其中:Mmax(a)表示商務(wù)工作流活動(dòng)中運(yùn)行時(shí)間最大的一類活動(dòng)的均值運(yùn)行時(shí)間,即Mmax(a)=max[M(ai),M(aj),…,M(an)],S(TH)表示服務(wù)器單位時(shí)間內(nèi)完成的吞吐量. 添加服務(wù)器數(shù)量的計(jì)算公式為 THConsai-RTHai≤n*THThres. (12) 滿足不等式的最小整數(shù)n即為添加服務(wù)器的數(shù)量.該策略可以在花費(fèi)小代價(jià)的情況下,使商務(wù)工作流的服務(wù)質(zhì)量達(dá)到用戶的需求. 該文針對(duì)云工作流的時(shí)間延誤處理策略從時(shí)序一致性建模、時(shí)序檢測(cè)點(diǎn)選擇策略和時(shí)序異常處理策略3個(gè)方面分析,并把云工作流分為計(jì)算密集型的科學(xué)工作流和實(shí)例密集型的商務(wù)工作流兩大類來進(jìn)行歸納總結(jié).最后,結(jié)合當(dāng)前的研究趨勢(shì),探討了云工作流時(shí)間延誤處理領(lǐng)域未來的研究方向. 盡管在云環(huán)境下針對(duì)提高科學(xué)工作流和商務(wù)工作流的服務(wù)質(zhì)量,已經(jīng)提出了不少方法,但是隨著云計(jì)算、邊緣計(jì)算以及大數(shù)據(jù)的發(fā)展,云工作流的服務(wù)質(zhì)量依然是一個(gè)需要研究的熱點(diǎn)課題.作者認(rèn)為未來的研究方向有以下幾點(diǎn): (1) 提高云工作流時(shí)間延誤處理策略的魯棒性.即使在云計(jì)算環(huán)境差異非常大的情況下,依然能保證云工作流系統(tǒng)的服務(wù)質(zhì)量達(dá)到用戶的需求. (2) 研究通用云工作流時(shí)間延誤處理框架.目前,科學(xué)工作流和商務(wù)工作流的時(shí)間延誤處理策略是從不同角度進(jìn)行處理的.可以考慮設(shè)計(jì)一種通用的云工作流時(shí)間延誤處理框架,能適用于科學(xué)工作流和商務(wù)工作流兩種不同的模型. (3) 研究復(fù)雜云工作流模型的時(shí)間延誤處理策略.針對(duì)更加復(fù)雜的云工作流,例如物流工作流,在分析時(shí)既要考慮整體時(shí)間延誤的處理,又要分析單個(gè)實(shí)例的時(shí)間延誤情況.這需要設(shè)計(jì)更加復(fù)雜的云工作流時(shí)間延誤處理策略. (4) 研究基于深度學(xué)習(xí)的智能云工作流時(shí)間延誤處理策略.目前,深度學(xué)習(xí)理論的高速發(fā)展,使一些領(lǐng)域的研究取得了突破性的進(jìn)展,例如在計(jì)算機(jī)視覺領(lǐng)域.因此,可以考慮借助于當(dāng)前深度學(xué)習(xí)的研究成果,設(shè)計(jì)智能的云工作流時(shí)間延誤處理策略.3 時(shí)序異常處理策略
3.1 基于重調(diào)度的科學(xué)工作流時(shí)序異常處理策略
3.2 基于加資源的商務(wù)工作流時(shí)序異常處理策略
4 結(jié)束語(yǔ)