席永濤 李奇原 劉杰
摘要:大數(shù)據(jù)處理和分析技術(shù)能夠指導(dǎo)企業(yè)進(jìn)行快速、正確的決策,將在企業(yè)業(yè)務(wù)流程中發(fā)揮重要的作用。為了支持企業(yè)開發(fā)數(shù)據(jù)密集型應(yīng)用,并將其集成到已有的業(yè)務(wù)流程中,需要基于Hadoop平臺(tái)的數(shù)據(jù)密集型工作流系統(tǒng),其中的核心技術(shù)之一是面向Hadoop的工作流建模。該文基于BPEL語言定義了Hadoop工作流建模語言,使得該工作流建模語言支持豐富的流程控制語義,并通過模型轉(zhuǎn)化為BPEL流程,可以運(yùn)行于成熟的BPEL引擎中,實(shí)現(xiàn)可靠高效的工作流調(diào)度。該文還詳述了Hadoop工作流到BPEL在語義模型、部署模型、執(zhí)行模型等三個(gè)層次的轉(zhuǎn)換。最后,通過一個(gè)日志分析工作流案例展示了方法的可用性。