摘 要:
港口物流是一種高度以人為中心、復(fù)雜靈活的業(yè)務(wù)流程?,F(xiàn)有研究對(duì)其進(jìn)行流程挖掘時(shí),存在自動(dòng)發(fā)現(xiàn)流程模型質(zhì)量低的問題,同時(shí)缺少對(duì)于流程偏差進(jìn)行系統(tǒng)化根因分析的支持,這造成港口流程偏差分析能力較弱。針對(duì)這一問題,提出一種面向流程偏差根因分析的港口物流流程挖掘方法。該方法基于事件日志進(jìn)行港口物流活動(dòng)統(tǒng)計(jì)實(shí)現(xiàn)流程績(jī)效分析,使用Split Miner和Inductive Miner發(fā)現(xiàn)實(shí)際流程模型,并使用對(duì)齊方法識(shí)別流程偏差,接著結(jié)合分類決策樹和?;鶊D對(duì)流程偏差進(jìn)行根因分析。通過在某大型港口物流提貨流程進(jìn)行實(shí)際應(yīng)用,結(jié)果表明,應(yīng)用該方法能發(fā)現(xiàn)實(shí)際執(zhí)行流程的更多細(xì)節(jié)來為流程偏差根因分析提供支持,并可以對(duì)流程偏差進(jìn)行系統(tǒng)化的根因分析。該方法強(qiáng)化了港口物流流程偏差分析能力,進(jìn)而降低了港口物流管理風(fēng)險(xiǎn)。
關(guān)鍵詞:流程挖掘;流程發(fā)現(xiàn);一致性檢查;根因分析;港口物流
中圖分類號(hào):TP399 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1001-3695(2024)09-018-2690-09
doi:10.19734/j.issn.1001-3695.2023.12.0622
Port logistics process mining method and application towards root cause analytics of process deviations
Cai Min1, Wang Xuetao1, Song Rongjia1, Liu Cong2, Luo Xinggang1, Huang Lei3
(1.Experimental Center of Data Science & Intelligent Decision Making, School of Management, Hangzhou Dianzi University, Hangzhou 310018, China; 2.School of Computer Science & Technology, Shandong University of Technology, Zibo Shandong 255000, China; 3.School of Economics & Management, Beijing Jiaotong University, Beijing 100044, China)
Abstract:
Port logistics is a highly human-centered, complex and flexible business process. Existing research on process mining has the problem of automatically discovering low quality process models, and lacks support for systematic root cause analysis of process deviations, which results in a weak ability to analyze process deviations in ports. To address this issue, this paper proposed a process mining method framework for root cause analysis of process deviation in port logistics. The method was based on event logs for port logistics activity statistics, used Split Miner and Inductive Miner to discover the actual process model, used the alignment method to identify the process deviation, combined the classification decision tree and Sankey diagram to conduct root cause analysis on process deviations. Through the practical application in a large port logistics pick-up process, the results show that the method can discover more details of the actual execution process to provide support for the root cause analysis of process deviation, and carry out a systematic root cause analysis of process deviation. The method strengthens the capability of analyzing process deviations in port logistics, which in turn reduces the risk of port logistics management.
Key words:process mining; process discovery; conformance checking; root cause analysis; port logistics
0 引言
港口物流是經(jīng)濟(jì)全球化的重要組成部分,這對(duì)物流流程的高效、安全運(yùn)行提出了更高要求[1]。隨著信息技術(shù)的快速發(fā)展,港口企業(yè)根據(jù)業(yè)務(wù)需求,依靠港口業(yè)務(wù)中的一線員工、管理者和領(lǐng)域?qū)<遥_發(fā)出了對(duì)應(yīng)的港口物流信息管理系統(tǒng),用于支持港口物流的運(yùn)營(yíng)[2]。雖然港口物流通常有著一套標(biāo)準(zhǔn)的執(zhí)行流程,但實(shí)際港口物流面臨著業(yè)務(wù)流程靈活、業(yè)務(wù)類型繁多和客戶需求多樣等問題[3],這使得港口物流信息系統(tǒng)需要具備一定的靈活性來應(yīng)對(duì)各種情況,然而信息系統(tǒng)中的標(biāo)準(zhǔn)流程往往和實(shí)際執(zhí)行流程之間存在偏差,這些偏差會(huì)帶來一系列管理風(fēng)險(xiǎn)[4]。例如,據(jù)中華人民共和國(guó)海事局發(fā)布的事故案例顯示,2021年1月4日,出港船O輪與進(jìn)港船A輪在航行時(shí)因違反信息系統(tǒng)中的出入港標(biāo)準(zhǔn)流程而發(fā)生碰撞,事故造成直接經(jīng)濟(jì)損失355萬人民幣,而引航員違規(guī)下達(dá)操作指令是造成這一流程偏差的原因之一[5]。目前,港口物流中流程偏差發(fā)生的原因很難人工發(fā)現(xiàn)并進(jìn)行分析,如何有效地分析港口流程偏差發(fā)生的原因以降低港口的管理風(fēng)險(xiǎn)已經(jīng)成為從業(yè)者關(guān)注的焦點(diǎn)[6,7]。
流程挖掘技術(shù)可以從事件日志中獲取流程知識(shí),能夠發(fā)現(xiàn)實(shí)際執(zhí)行流程、識(shí)別流程中的瓶頸和偏差、預(yù)測(cè)和檢查一致性問題,為發(fā)現(xiàn)和改進(jìn)各種應(yīng)用領(lǐng)域中的流程提供了新的手段[8]。
近年來,一些研究將流程挖掘技術(shù)應(yīng)用在港口物流領(lǐng)域,這些研究主要涉及對(duì)港口物流流程進(jìn)行流程發(fā)現(xiàn)、績(jī)效分析和一致性檢查。例如:Veenstra等人[9]使用Heuristic Miner算法發(fā)現(xiàn)船舶實(shí)際到港流程,并選擇績(jī)效指標(biāo)進(jìn)行績(jī)效分析,改進(jìn)了到港流程中的績(jī)效瓶頸;Zerbino等人[10]使用Fuzzy Miner算法發(fā)現(xiàn)港口實(shí)際貨運(yùn)出口流程,分析影響港口貨運(yùn)出口時(shí)間性能的因素;Wang等人[11]考慮到港口物流的復(fù)雜性和靈活性會(huì)導(dǎo)致流程存在各種問題,提出了一種典型的港口物流流程挖掘方法。該方法分四個(gè)階段:第一階段從物流信息系統(tǒng)中進(jìn)行事件日志提取和預(yù)處理;第二階段從事件日志中自動(dòng)發(fā)現(xiàn)流程模型來分析實(shí)際物流流程,該階段使用Fuzzy Miner、Heuristic Miner算法;第三階段對(duì)事件日志進(jìn)行物流流程績(jī)效分析來揭示流程瓶頸及其影響因素;第四階段使用基于軌跡重放的一致性檢查方法來詳細(xì)診斷出實(shí)際物流流程和標(biāo)準(zhǔn)流程之間的偏差。
以上研究表明流程挖掘?qū)Ω劭谖锪髁鞒虄?yōu)化有很好的適用性,但已有研究在港口物流流程偏差根因分析方面仍然存在顯著不足。一方面,港口物流結(jié)構(gòu)松散和動(dòng)態(tài)的性質(zhì)使得港口物流流程數(shù)據(jù)具有高復(fù)雜性,已有研究在挖掘流程模型時(shí),使用的Fuzzy Miner、Heuristic Miner算法會(huì)將低頻但關(guān)鍵的路徑作為噪聲過濾掉,發(fā)現(xiàn)低質(zhì)量的流程模型[12],而這些低頻路徑會(huì)影響人們對(duì)實(shí)際流程問題的發(fā)現(xiàn)和根因分析[13]。因此有必要在不丟失關(guān)鍵細(xì)節(jié)的情況下發(fā)現(xiàn)高質(zhì)量的流程模型,能夠更準(zhǔn)確地分析港口物流流程中存在的問題。另一方面,港口物流活動(dòng)受多種因素影響,對(duì)流程中的異常需要根據(jù)其原因采取對(duì)應(yīng)的處理方式[14]。已有方法雖然能夠檢測(cè)出港口物流中實(shí)際流程和標(biāo)準(zhǔn)流程之間的偏差,但并不能系統(tǒng)化地分析出復(fù)雜流程偏差發(fā)生的原因。因此有必要對(duì)港口物流中的偏差流程進(jìn)行系統(tǒng)化的根因分析,根據(jù)原因制定能有效降低流程風(fēng)險(xiǎn)的優(yōu)化方案。
雖然目前的港口物流信息系統(tǒng)無法反映實(shí)際港口物流流程的多樣性、復(fù)雜性和靈活性,但信息系統(tǒng)中海量的數(shù)據(jù)積累,為本文基于數(shù)據(jù)層面分析港口物流流程提供了研究基礎(chǔ)。因此,為了解決上述問題,本文提出一套數(shù)據(jù)驅(qū)動(dòng)的面向流程偏差根因分析的港口物流流程挖掘方法,實(shí)現(xiàn)對(duì)港口物流流程偏差進(jìn)行系統(tǒng)化的根因分析,以支持港方企業(yè)可以根據(jù)流程偏差原因制定能夠有效降低流程風(fēng)險(xiǎn)的優(yōu)化方案。
本文主要貢獻(xiàn)為:
a)提出了一套面向流程偏差根因分析的港口物流流程挖掘方法。該方法可以通過港口物流流程績(jī)效分析和港口物流流程模型自動(dòng)發(fā)現(xiàn),為流程偏差根因分析提供支持,并在港口物流流程一致性分析診斷出流程偏差后,通過港口物流流程偏差根因分析對(duì)具體流程偏差進(jìn)行系統(tǒng)化的根因分析,進(jìn)而提出改進(jìn)港口物流流程的建議。
b)在港口物流流程模型自動(dòng)發(fā)現(xiàn)階段,為了更準(zhǔn)確地支持港口物流實(shí)際流程問題的發(fā)現(xiàn)和根因分析,提出使用Split Miner[13]和Inductive Miner[15]算法以挖掘出高質(zhì)量的港口物流流程模型,便于分析實(shí)際流程執(zhí)行細(xì)節(jié)。
c)在港口物流流程偏差根因分析階段,綜合考慮分類決策樹和?;鶊D分析的特點(diǎn),提出使用分類決策樹分析港口物流流程中部分屬性值和流程偏差的關(guān)系,并使用?;鶊D分析港口物流流程在任意屬性值間的轉(zhuǎn)換趨勢(shì),用于獲得使用決策樹進(jìn)行分析的隱藏見解,進(jìn)行流程偏差根因分析。
d)將本文方法應(yīng)用到國(guó)內(nèi)某大型港口,并與現(xiàn)有方法進(jìn)行對(duì)比,驗(yàn)證了本文方法的有效性和科學(xué)性。
1 相關(guān)研究
1.1 流程挖掘相關(guān)算法研究
流程挖掘已有大量研究,并且產(chǎn)生了許多算法,當(dāng)前針對(duì)流程挖掘算法的研究主要分為流程模型發(fā)現(xiàn)、流程模型改進(jìn)和流程知識(shí)挖掘。本文主要關(guān)注其中的流程模型發(fā)現(xiàn)算法和流程模型改進(jìn)算法。
流程模型發(fā)現(xiàn)是指在沒有任何先驗(yàn)信息的情況下,從記錄流程行為的事件日志中生成實(shí)際的流程模型[16]。已有研究提出了多種用于流程發(fā)現(xiàn)的算法,如Split Miner、 Inductive Miner、 Heuristic Miner[17]和Fuzzy Miner[18]。當(dāng)事件日志記錄的流程行為結(jié)構(gòu)簡(jiǎn)單時(shí),Heuristic Miner 和Fuzzy Miner能夠輸出簡(jiǎn)單且準(zhǔn)確的流程模型;然而隨著數(shù)據(jù)復(fù)雜性的增加,這些算法生成的模型質(zhì)量會(huì)迅速惡化[19,20]。為了避免丟失信息,同時(shí)保留可解釋的結(jié)構(gòu),改進(jìn)的流程發(fā)現(xiàn)算法Split Miner和Inductive Miner可以更好地處理蘊(yùn)涵復(fù)雜流程的事件日志,能夠發(fā)現(xiàn)低復(fù)雜度、高擬合度和高精確度的流程模型[12,20]。
流程模型改進(jìn)需要輸入事件日志和標(biāo)準(zhǔn)流程模型,目標(biāo)是指出事件日志和標(biāo)準(zhǔn)模型不一致的地方并進(jìn)行模型優(yōu)化[8,21]。Rozinat等人[22]提出基于軌跡重放的一致性檢查方法,流程模型表示為Petri網(wǎng),事件日志中的軌跡在模型上重放,根據(jù)重放過程中缺失和剩余的token計(jì)算一致性,但沒考慮最優(yōu)對(duì)齊。文獻(xiàn)[23]提出基于對(duì)齊的一致性檢查方法,日志中的每個(gè)軌跡都映射到盡可能接近觀察到的模型行為,檢查結(jié)果顯示了跳過和插入的事件,可以在事件級(jí)別觀察流程偏差,這種方式比缺失和剩余的token更容易解釋。對(duì)齊通常被視為標(biāo)準(zhǔn)的一致性檢查技術(shù),但在大型事件日志上計(jì)算對(duì)齊是比較耗時(shí)的[8],現(xiàn)有研究已經(jīng)提出了更高效的一致性檢查方法,如沈曉林等人[24]將流程模型轉(zhuǎn)換為流程樹模型并將流程樹分解為子樹,利用分布式平臺(tái)Spark計(jì)算最優(yōu)對(duì)齊。
1.2 流程問題根因分析方法研究
在流程挖掘領(lǐng)域已有許多研究致力于尋找流程問題的根本原因。Suriadi等人[25]將事件日志轉(zhuǎn)換為適合分類分析形式的數(shù)據(jù),然后使用數(shù)據(jù)挖掘中的決策樹方法來發(fā)現(xiàn)影響流程實(shí)例類別的關(guān)鍵屬性;Ferreira等人[26]將事件日志轉(zhuǎn)換為邏輯表示,然后根據(jù)流程時(shí)間對(duì)流程實(shí)例進(jìn)行分類并用決策樹提取規(guī)則,產(chǎn)生的規(guī)則用于解釋流程實(shí)例延遲的原因;Bozorgi等人[27]使用動(dòng)作規(guī)則挖掘技術(shù)來識(shí)別在某些條件下與結(jié)果同時(shí)出現(xiàn)的處理,然后使用提升樹來發(fā)現(xiàn)在調(diào)整混雜變量后處理對(duì)結(jié)果的影響;Qafari等人[28]通過尋找對(duì)問題貢獻(xiàn)最大的一組特征和特征值對(duì)來確定有因果影響的特征,然后建立結(jié)構(gòu)方程模型,并在模型上對(duì)特征集進(jìn)行因果推理。
在以上根因分析方法中,分類決策樹能夠從事件日志中提取知識(shí)并以決策規(guī)則(if-then)的形式來匹配流程部分屬性和類別之間的關(guān)系,是一種可解釋性較強(qiáng)的分析工具[29]。經(jīng)典的決策樹算法包括ID3、CART、C4.5和C5.0,其中C5.0具有更高的識(shí)別關(guān)鍵分類變量能力和預(yù)測(cè)準(zhǔn)確性,并呈現(xiàn)適當(dāng)?shù)臎Q策規(guī)則。使用決策樹分析具體有以下優(yōu)點(diǎn):a)決策樹易于理解和解釋,通過解釋后人們有能力理解決策所表達(dá)的意義,同時(shí),可以進(jìn)行可視化分析,容易提取規(guī)則;b)決策樹對(duì)于數(shù)據(jù)的準(zhǔn)備比較簡(jiǎn)單,并可同時(shí)處理連續(xù)型和離散型的數(shù)據(jù);c)運(yùn)算速度相對(duì)比較快,在相對(duì)短的時(shí)間內(nèi)能對(duì)大型數(shù)據(jù)源作出可行且效果良好的結(jié)果;d)可以對(duì)有許多屬性的數(shù)據(jù)集構(gòu)造決策樹,且冗余的屬性不會(huì)影響決策樹的準(zhǔn)確性。
機(jī)器學(xué)習(xí)技術(shù)通過描述性特征來解釋目標(biāo)特征,無論模型的準(zhǔn)確性如何,總會(huì)有不精確分析的風(fēng)險(xiǎn)[30]。而且僅根據(jù)分類器的發(fā)現(xiàn)來判斷特征之間的因果關(guān)系,可能會(huì)陷入將相關(guān)性視為因果關(guān)系的陷阱[28]。
綜上所述,本文通過對(duì)流程挖掘相關(guān)算法(流程發(fā)現(xiàn)、一致性檢查)和流程問題根因分析方法的比較分析發(fā)現(xiàn),考慮到港口物流流程數(shù)據(jù)的復(fù)雜性,改進(jìn)的流程發(fā)現(xiàn)算法(Split Miner、Inductive Miner)可用于挖掘高質(zhì)量的港口物流流程模型,發(fā)現(xiàn)更多流程細(xì)節(jié)來支持流程偏差根因分析;分類決策樹具有可解釋性強(qiáng)等優(yōu)點(diǎn),可用于進(jìn)行流程偏差根因分析,但該方法仍存在一些缺陷。這些發(fā)現(xiàn)進(jìn)一步明確了相關(guān)方法對(duì)解決本文研究問題的適用性與缺陷,為后續(xù)構(gòu)建面向流程偏差根因分析的港口物流流程挖掘方法提供了理論基礎(chǔ)。
2 面向流程偏差根因分析的港口物流流程挖掘方法
本章針對(duì)引言部分提到的已有研究在港口物流流程偏差根因分析方面的不足,基于相關(guān)方法,為解決本文研究問題的適用性與缺陷提出了一種面向流程偏差根因分析的港口物流流程挖掘方法(圖1)。該方法分為數(shù)據(jù)提取和預(yù)處理、港口物流流程績(jī)效分析、港口物流流程模型自動(dòng)發(fā)現(xiàn)、港口物流流程一致性分析和港口物流流程偏差根因分析五個(gè)階段,其步驟將在2.1~2.5節(jié)中進(jìn)行介紹。
2.1 數(shù)據(jù)提取和預(yù)處理
由于大多數(shù)港口物流信息系統(tǒng)的關(guān)注點(diǎn)往往在于實(shí)現(xiàn)物流流程的自動(dòng)化,不是標(biāo)準(zhǔn)的工作流系統(tǒng),通常沒有現(xiàn)成的事件日志。本階段進(jìn)行以下操作獲取有效的事件日志:
a)物流活動(dòng)識(shí)別。信息系統(tǒng)中,一個(gè)完整流程中多個(gè)物流活動(dòng)的實(shí)際執(zhí)行信息會(huì)保存在多個(gè)表中,可以根據(jù)表之間的字段依賴關(guān)系將流程中的物流活動(dòng)識(shí)別出來。
b)物流屬性選擇。除了基本的活動(dòng)名稱、時(shí)間戳等信息外,也可以根據(jù)分析目的選取其他流程屬性,如貨物類型、活動(dòng)執(zhí)行人等,為進(jìn)行流程偏差根因分析提供支持。
c)數(shù)據(jù)清洗。提取數(shù)據(jù)并處理成事件日志后,需要清洗事件日志以滿足挖掘算法要求,例如,剔除不完整的流程實(shí)例,填補(bǔ)和修改缺失值和異常值,剔除明顯錯(cuò)誤的記錄等。
2.2 港口物流流程績(jī)效分析
本階段的主要目的是發(fā)現(xiàn)實(shí)際港口物流流程中影響物流績(jī)效的因素,并在后續(xù)流程偏差根因分析中考慮將這些因素轉(zhuǎn)換為實(shí)例屬性,并探究其對(duì)流程偏差的影響。
績(jī)效分析包括流程瓶頸識(shí)別和性能比較等,進(jìn)行績(jī)效分析有助于分析物流流程的流程偏差等異常和持續(xù)優(yōu)化業(yè)務(wù)流程[31]。港口物流的動(dòng)態(tài)性會(huì)導(dǎo)致物流績(jī)效受多種因素影響,物流活動(dòng)分析可以找出各種因素對(duì)物流績(jī)效的實(shí)際影響[11,32]。本階段通過以下步驟對(duì)物流流程進(jìn)行績(jī)效分析:
a)根據(jù)應(yīng)用場(chǎng)景中的問題背景選擇物流績(jī)效指標(biāo);
b)統(tǒng)計(jì)事件日志中的相關(guān)物流活動(dòng)進(jìn)行績(jī)效指標(biāo)計(jì)算,分析影響物流績(jī)效的因素,并討論這些因素對(duì)流程偏差可能產(chǎn)生的影響。
2.3 港口物流流程模型自動(dòng)發(fā)現(xiàn)
本階段的主要目的是發(fā)現(xiàn)事件日志中蘊(yùn)涵的港口物流流程,通過獲得不同抽象級(jí)別的流程模型,分析實(shí)際港口流程中物流活動(dòng)的執(zhí)行細(xì)節(jié),為流程偏差根因分析提供支持。
流程發(fā)現(xiàn)經(jīng)常從事件日志中生成控制流模型,可用于分析實(shí)際流程中物流活動(dòng)的執(zhí)行順序。港口物流流程數(shù)據(jù)具有高復(fù)雜性,已有研究使用的流程發(fā)現(xiàn)算法會(huì)挖掘出低質(zhì)量的流程模型,從而影響實(shí)際港口物流流程問題的發(fā)現(xiàn)和根因分析。為了解決這一問題,本文通過對(duì)流程發(fā)現(xiàn)算法的對(duì)比分析,提出可以結(jié)合Split Miner和Inductive Miner來挖掘出高質(zhì)量的港口物流流程模型。因?yàn)?,Split Miner能夠:a)處理根據(jù)事件日志生成的直接跟隨圖中相鄰節(jié)點(diǎn)之間的并發(fā)性、沖突和因果關(guān)系,保證發(fā)現(xiàn)無死鎖的流程模型;b)從復(fù)雜事件日志中過濾掉無效路徑,快速發(fā)現(xiàn)復(fù)雜性低的控制流模型,同時(shí)最大化地平衡流程模型的擬合度和精確度。Inductive Miner能夠處理復(fù)雜的事件日志,對(duì)事件日志中的不完全性、噪聲和低頻路徑具有魯棒性,生成的直接跟隨圖模型具有高可解釋性。港口物流流程模型自動(dòng)發(fā)現(xiàn)具體步驟如下:
a)先用Split Miner從整個(gè)事件日志中發(fā)現(xiàn)簡(jiǎn)單可靠的流程模型,初步分析實(shí)際港口物流流程主要路徑的結(jié)構(gòu)特點(diǎn);
b)針對(duì)上一步發(fā)現(xiàn)的流程模型中的復(fù)雜子流程,用Inductive Miner從事件日志中發(fā)現(xiàn)直接跟隨圖,詳細(xì)分析實(shí)際港口物流流程的路徑信息。
2.4 港口物流流程一致性分析
本階段的主要目的是分析實(shí)際港口物流流程和標(biāo)準(zhǔn)流程之間的業(yè)務(wù)一致性和具體流程偏差,并對(duì)主要流程偏差進(jìn)行討論。
流程一致性分析旨在全面檢測(cè)出實(shí)際流程和標(biāo)準(zhǔn)流程之間不一致的地方。一致性分析需要輸入事件日志和標(biāo)準(zhǔn)流程模型,選擇度量指標(biāo)(例如擬合度)來量化二者之間的業(yè)務(wù)一致性,并分析存在的流程偏差。本階段使用基于對(duì)齊的一致性檢查方法[23]分析實(shí)際港口物流流程和標(biāo)準(zhǔn)流程之間的業(yè)務(wù)一致性。對(duì)齊將事件日志與標(biāo)準(zhǔn)模型的執(zhí)行流程連接起來(表1),表1第一行表示事件日志中某一實(shí)例中事件的執(zhí)行流程或>>,第二行表示標(biāo)準(zhǔn)模型執(zhí)行流程或>>,表中的每一列就是對(duì)齊的一個(gè)移動(dòng),分為以下三種:
a)同步移動(dòng),實(shí)例軌跡中的事件和模型流程中的事件一致,如(a, a),表示實(shí)例和模型流程以相同的方式執(zhí)行。
b)日志移動(dòng),實(shí)例軌跡的一個(gè)事件表明一個(gè)活動(dòng)應(yīng)該被執(zhí)行,但依據(jù)模型該活動(dòng)不能被執(zhí)行,如(b, >>),表示實(shí)例和模型之間存在偏差。
c)模型移動(dòng),一個(gè)活動(dòng)依據(jù)模型應(yīng)該被執(zhí)行,但實(shí)例軌跡中沒有相應(yīng)的事件,如(>>, c),也表示實(shí)例和模型之間存在偏差,模型中的活動(dòng)被跳過。
表1所示只是一種可能的對(duì)齊,對(duì)于相同的實(shí)例軌跡和模型流程,可能存在很多對(duì)齊。一致性檢查是基于最優(yōu)對(duì)齊,即盡可能以最少的偏差將實(shí)例軌跡和模型流程連接起來的對(duì)齊。該方法可以針對(duì)每個(gè)實(shí)例提供詳細(xì)的診斷,指出某個(gè)特定的活動(dòng)經(jīng)常被跳過,能在事件級(jí)別分析具體流程偏差。
2.5 港口物流流程偏差根因分析
本階段的主要目的是分析港口物流流程發(fā)生某偏差的根本原因,為相關(guān)部門根據(jù)原因制定針對(duì)性的優(yōu)化方案提供支持。
一些流程偏差的發(fā)生可能是多種因素的結(jié)果,需要對(duì)其進(jìn)行系統(tǒng)化的根因分析。港口物流活動(dòng)受多種因素影響,已有研究并不能系統(tǒng)化地分析出復(fù)雜流程偏差發(fā)生的根本原因。為了解決這一問題,本文通過對(duì)根因分析方法的對(duì)比分析,提出分類決策樹可以用于港口物流流程偏差根因分析,因?yàn)闆Q策樹具有可解釋性強(qiáng)等優(yōu)點(diǎn),已被廣泛應(yīng)用于從事件日志中提取部分屬性值和類別的組合規(guī)則來分析異常流程的原因。但僅發(fā)現(xiàn)部分屬性值和類別的關(guān)系進(jìn)行根因分析存在不精確分析的風(fēng)險(xiǎn)[30]。而桑基圖可用于分析復(fù)雜的多步驟流程,因?yàn)樯;鶊D能夠可視化流程在任意屬性值上的數(shù)據(jù)流向,顯示流程從一種屬性值轉(zhuǎn)換到另一種屬性值的可能性和可變性[33]。在進(jìn)行港口物流流程偏差根因分析時(shí),為了確保根因分析結(jié)果的可靠性和完整性,提出用?;鶊D進(jìn)一步分析流程實(shí)例在任意屬性值間的轉(zhuǎn)換趨勢(shì),用于獲得使用決策樹進(jìn)行分析的隱藏見解。港口物流流程偏差根因分析的具體步驟如下:
a)流程偏差數(shù)據(jù)準(zhǔn)備。確定所要分析的流程偏差,從事件日志中根據(jù)對(duì)應(yīng)流程活動(dòng)發(fā)生的時(shí)間戳大小對(duì)流程實(shí)例進(jìn)行分類(正常/偏差),并提取可能影響這一流程偏差的屬性,整合類別數(shù)據(jù)和屬性數(shù)據(jù)形成流程偏差數(shù)據(jù)。
b)用C5.0算法挖掘流程偏差數(shù)據(jù)的分類決策樹模型,用于提取流程實(shí)例部分屬性值和類別之間的規(guī)則。
c)繪制流程偏差數(shù)據(jù)的?;鶊D,用于分析流程實(shí)例在任意屬性值間的轉(zhuǎn)換趨勢(shì)。
d)結(jié)合步驟b)c)的分析結(jié)果,確定流程偏差的影響屬性及影響機(jī)制,在此基礎(chǔ)上與港口物流管理人員進(jìn)行探討,系統(tǒng)化地分析流程偏差發(fā)生的根本原因。
3 案例分析
本文以國(guó)內(nèi)某大型港口為例進(jìn)行方法驗(yàn)證和案例分析。該港口的物流信息系統(tǒng)自2009上線以來,保持24 h不間斷運(yùn)行,記錄了港口進(jìn)出口業(yè)務(wù)流程中各物流活動(dòng)的發(fā)生時(shí)間、貨物屬性等豐富數(shù)據(jù),平均每秒鐘都會(huì)產(chǎn)生一條新數(shù)據(jù)。這些累積的海量數(shù)據(jù),是應(yīng)用本文方法進(jìn)行流程偏差根因分析的重要基礎(chǔ)。
在該港口的整個(gè)物流流程中,貨物裝卸服務(wù)是其核心業(yè)務(wù),主要是指貨物通過大船卸到港口和客戶通過車、卡、駁的方式進(jìn)行提貨,將貨物運(yùn)出港口,其中實(shí)際提貨流程涉及到的人員廣、活動(dòng)多、憑證單據(jù)復(fù)雜,流程具有復(fù)雜靈活的特點(diǎn)。相關(guān)研究指出,該港口的實(shí)際提貨流程和港口物流信息系統(tǒng)中的標(biāo)準(zhǔn)流程經(jīng)常出現(xiàn)偏差。例如,部分流程實(shí)例在沒有確保所有單據(jù)計(jì)費(fèi)流程終止的條件下,就進(jìn)行出庫(kù)單完單,這存在管理風(fēng)險(xiǎn)[2,6]。因此,本文以該港口的提貨流程進(jìn)行方法驗(yàn)證和案例分析。
表2提供了該港口提貨流程涉及到的活動(dòng)(從簽訂長(zhǎng)期/單船合開始,到出庫(kù)單完單結(jié)束),圖2是提貨流程的標(biāo)準(zhǔn)模型。
3.1 提貨流程數(shù)據(jù)提取和預(yù)處理
提貨流程中涉及到的物流活動(dòng)信息存在于該港口物流信息系統(tǒng)的各種物流單據(jù)中(如出庫(kù)單、地磅單等),這些單據(jù)中都有出庫(kù)單號(hào)這一字段,可以根據(jù)出庫(kù)單號(hào)從這些單據(jù)中識(shí)別出流程活動(dòng),并以出庫(kù)單號(hào)作為流程的實(shí)例編號(hào)。在這一階段,選擇的活動(dòng)屬性除了活動(dòng)標(biāo)識(shí)和時(shí)間戳外,還包括貨物類型、貨名、貿(mào)易方式、執(zhí)行人、支付方式和客戶。由于港口數(shù)據(jù)保密,對(duì)部分活動(dòng)屬性值進(jìn)行匿名化。為了分析的可靠性,需要剔除不完整流程實(shí)例和填補(bǔ)缺失值,最終事件日志有1 622個(gè)流程實(shí)例。表3展示了事件日志片段。
3.2 提貨流程績(jī)效分析
在這一階段,使用Disco對(duì)提貨流程進(jìn)行績(jī)效分析。港口物流作為一項(xiàng)勞動(dòng)密集型任務(wù),港口資源的預(yù)測(cè)不佳或規(guī)劃不當(dāng)會(huì)對(duì)港口物流流程造成影響[34]?;诖?,本文案例選擇提貨流程中不同時(shí)間的事件發(fā)生個(gè)數(shù)、不同貨類的流程實(shí)例持續(xù)時(shí)間作為績(jī)效指標(biāo)進(jìn)行分析。
1)不同時(shí)間的事件發(fā)生個(gè)數(shù)
提貨流程具有靈活性,不同時(shí)間事件發(fā)生個(gè)數(shù)可能會(huì)有所不同,分析事件發(fā)生個(gè)數(shù)隨時(shí)間的變化規(guī)律有助于幫助港口提前進(jìn)行相應(yīng)的資源調(diào)整。圖3展示了不同時(shí)間的事件發(fā)生個(gè)數(shù)。
圖3表明在日志時(shí)間線(橫軸)同事件數(shù)量(縱軸)建立的空間矩陣中會(huì)規(guī)律性地出現(xiàn)頂峰,例如有幾處頂峰分別發(fā)生在2022-10-25、2022-11-28、2022-12-27,由此可推測(cè)每月月末是流程事件發(fā)生的高峰期??紤]到整個(gè)提貨流程需要人工確認(rèn)各種文件以保障流程的有序進(jìn)行,在每月月末,業(yè)務(wù)量的加大會(huì)增加執(zhí)行人的作業(yè)壓力,可能出現(xiàn)因辦單不及時(shí)造成流程擁擠和流程偏差等問題。
2)不同貨類的流程實(shí)例持續(xù)時(shí)間
實(shí)際提貨流程中不同流程實(shí)例的持續(xù)時(shí)間有較大差異,且由于簽訂合同或付費(fèi)活動(dòng)的持續(xù)時(shí)間不太具有參考價(jià)值,所以選擇T2~T14這一子流程的持續(xù)時(shí)間進(jìn)行分析。該子流程所有實(shí)例的平均持續(xù)時(shí)間為64天,由于貨類對(duì)貨物的存儲(chǔ)期和裝卸效率有很大影響,研究了該指標(biāo)超過64天的實(shí)例的主要貨類分布,結(jié)果如表4所示。
表4表明貨類1和4的實(shí)例持續(xù)時(shí)間超過平均時(shí)間的相對(duì)比率較低,說明這些貨類的實(shí)例持續(xù)時(shí)間普遍較短,而貨類2和3的實(shí)例在港口停留時(shí)間較長(zhǎng)。這一現(xiàn)象也可能與流程偏差有關(guān),需要后續(xù)進(jìn)行流程偏差根因分析才能進(jìn)一步洞察。
3.3 提貨流程模型自動(dòng)發(fā)現(xiàn)
在這一階段,分別對(duì)實(shí)際提貨流程的主要模型和復(fù)雜子流程的詳細(xì)模型進(jìn)行自動(dòng)發(fā)現(xiàn),分析實(shí)際提貨流程中的物流活動(dòng)執(zhí)行細(xì)節(jié),為后續(xù)流程偏差根因分析提供支持。
a) 首先用ProM中的Discover BPMN model with Split Miner插件發(fā)現(xiàn)主要的控制流模型(圖4說明:為了顯示的緊湊性,對(duì)模型布局進(jìn)行了調(diào)整)。可以發(fā)現(xiàn),實(shí)際提貨流程中的物流活動(dòng)執(zhí)行路徑基本符合標(biāo)準(zhǔn)模型,但T1~T14的子流程存在分支和自循環(huán)路徑。這些路徑增加了流程的復(fù)雜性。
b) 進(jìn)一步用ProM中的Mine with Directly Follows visual Miner插件詳細(xì)分析T1~T14的子流程,圖5是發(fā)現(xiàn)的直接跟隨圖(設(shè)置顯示80%的路徑),其中,綠色和紅色圓圈分別代表流程開始和結(jié)束(參見電子版),每個(gè)節(jié)點(diǎn)代表流程中的一種活動(dòng),邊代表活動(dòng)間的路徑關(guān)系,數(shù)字代表活動(dòng)或路徑的發(fā)生次數(shù)??梢园l(fā)現(xiàn),不同活動(dòng)及活動(dòng)之間的路徑執(zhí)行次數(shù)存在差異,也存在一些低頻路徑不符合標(biāo)準(zhǔn)模型的情況。這些信息反映了實(shí)際提貨流程的靈活性,對(duì)其進(jìn)行分析有助于更好地了解實(shí)際流程執(zhí)行情況。
結(jié)合圖4、5,本文對(duì)實(shí)際提貨流程中的物流活動(dòng)執(zhí)行情況進(jìn)行以下分析:
a)實(shí)際提貨流程主要起始于“T1→T2”這一分支。圖4表明實(shí)際流程主要起始于“T1簽訂長(zhǎng)期合同”或“T2錄入理貨手冊(cè)”,且后續(xù)整個(gè)提貨流程基本符合標(biāo)準(zhǔn)模型;圖5進(jìn)一步表明有1 474個(gè)實(shí)例起始于T1,只有27個(gè)實(shí)例起始于“T1-1簽訂單船合同”。對(duì)于共享同一長(zhǎng)期合同的實(shí)例,會(huì)在開始時(shí)直接使用已有的合同,否則需要到港后重新簽訂,簽訂合同是流程起始環(huán)節(jié),不及時(shí)簽訂合同可能會(huì)影響后續(xù)提貨流程,造成流程擁擠。
b)“T3理貨手冊(cè)綁定合同”未能正常進(jìn)行。圖4表明流程實(shí)例存在跳過T3的情況;圖5進(jìn)一步表明只有122個(gè)實(shí)例進(jìn)行T3。結(jié)合提貨流程實(shí)際場(chǎng)景得知,進(jìn)行該活動(dòng)是為了“T7核發(fā)出單”時(shí)使用合同信息,不進(jìn)行T3不影響T4~T6,港口為了方便通常允許在T7前綁定合同到出庫(kù)單,這反映了實(shí)際提貨流程的靈活性。
c)實(shí)際提貨流程主要執(zhí)行“T13→T14→T15”這一分支。圖4表明“T8辦理地磅單”至“T14補(bǔ)全理貨單”之間的活動(dòng)會(huì)多次有序執(zhí)行;圖5進(jìn)一步表明一個(gè)流程實(shí)例平均需要8次過地磅活動(dòng),其主要執(zhí)行順序?yàn)椤癟8→T9→T10→T11→T12→T13→T14”,同時(shí)也存在分支和自循環(huán)的情況。與港口物流管理人員討論得知,出庫(kù)單經(jīng)過核發(fā)后,一般會(huì)分單為多個(gè)地磅單通過車、卡、駁的方式同時(shí)進(jìn)行提貨作業(yè),但每個(gè)地磅單的作業(yè)順序是固定的,這期間生成的多個(gè)理貨單需要多次進(jìn)行T14。
上述分析了實(shí)際提貨流程在符合標(biāo)準(zhǔn)流程模型下的物流活動(dòng)執(zhí)行情況。此外,實(shí)際提貨流程模型(圖5)中的一些其他路徑,如“T4→T8”“T5→T8”“T6→T1-1→T7”等,表明實(shí)際流程存在偏離標(biāo)準(zhǔn)模型的情況,后續(xù)需要進(jìn)行全面的流程一致性分析。
3.4 提貨流程一致性分析
在這一階段,使用ProM中的Replay a Log on Petri Net for Conformance Analysis插件分析實(shí)際提貨流程和標(biāo)準(zhǔn)流程之間的業(yè)務(wù)一致性和具體流程偏差,該插件需要輸入提貨流程事件日志和標(biāo)準(zhǔn)模型(圖2),結(jié)果顯示二者間的擬合度為0.808 5(圖6),這表明大部分流程實(shí)例與標(biāo)準(zhǔn)模型還是匹配的,但仍有小部分偏差。
根據(jù)一致性分析的結(jié)果,對(duì)存在的主要流程偏差進(jìn)行分析。由于3.3節(jié)已經(jīng)分析了活動(dòng)T3的相關(guān)偏差,本節(jié)不再對(duì)其進(jìn)行探討。提貨流程中的主要流程偏差如圖7所示,圖7(a)~(c)分別代表三處流程偏差,每張圖中,活動(dòng)編號(hào)代表流程偏差發(fā)生的位置,左邊的數(shù)字代表發(fā)生日志移動(dòng)(提貨流程實(shí)例表明活動(dòng)被執(zhí)行,但依據(jù)標(biāo)準(zhǔn)模型該活動(dòng)不能被執(zhí)行)的數(shù)量,右邊的數(shù)字代表發(fā)生模型移動(dòng)(提貨活動(dòng)依據(jù)標(biāo)準(zhǔn)模型應(yīng)該被執(zhí)行,但提貨流程實(shí)例中沒有相應(yīng)的事件)的數(shù)量。這些信息可以針對(duì)每個(gè)提貨流程實(shí)例提供詳細(xì)的流程診斷,能夠分析具體提貨活動(dòng)的流程偏差,具體分析如下:
a)圖7(a)表明T1-1發(fā)生113次模型移動(dòng),即提貨流程事件日志的軌跡中“T1-1簽訂單船合同”被跳過113次。通過調(diào)研得知,單船合同需要每次到港后簽訂且需要很長(zhǎng)時(shí)間,導(dǎo)致合同不能及時(shí)簽訂,實(shí)例在等待簽訂合同期間會(huì)選擇執(zhí)行后續(xù)與合同無關(guān)的活動(dòng)。
b)圖7(b)表明T17發(fā)生297次模型移動(dòng),即提貨流程事件日志的軌跡中“T17出庫(kù)單完單”被跳過297次。T17是流程結(jié)束環(huán)節(jié),不進(jìn)行該活動(dòng)會(huì)影響信息系統(tǒng)中流程實(shí)例執(zhí)行的完整性。通過檢查港口物流信息系統(tǒng)得知,T17雖然作為流程規(guī)定的結(jié)束,但是不影響客戶進(jìn)行實(shí)際提貨作業(yè),而且系統(tǒng)也沒有控制必須去執(zhí)行這個(gè)活動(dòng)。
c)圖7(c)表明T6、T7分別發(fā)生278、250次模型移動(dòng),即提貨流程事件日志的軌跡中“T6財(cái)務(wù)確認(rèn)”被跳過278次,“T7核發(fā)出庫(kù)單”被跳過250次。與港口管理人員探討后得知,這可能與流程實(shí)例先執(zhí)行“T8辦理地磅單”,后執(zhí)行“T7核發(fā)出庫(kù)單”有關(guān),而地磅單是通過對(duì)出庫(kù)單的結(jié)存進(jìn)行消減才能辦理的,出庫(kù)單未經(jīng)核發(fā)不能作為憑證辦理地磅單,否則會(huì)加大后面的工作量,從而降低流程的效率并增加流程的管理風(fēng)險(xiǎn)??紤]到會(huì)有多種因素造成這一現(xiàn)象,本案例將在3.5節(jié)中對(duì)這一偏差進(jìn)行系統(tǒng)化的根因分析。
3.5 提貨流程偏差根因分析
3.4節(jié)c)中反映出實(shí)際提貨流程中有相當(dāng)一部分流程實(shí)例存在先辦理地磅單后核發(fā)出庫(kù)單這一流程偏差,本階段對(duì)該流程偏差進(jìn)行系統(tǒng)化的根因分析。
1)流程偏差數(shù)據(jù)準(zhǔn)備
首先,在事件日志中根據(jù)核發(fā)出庫(kù)單和辦理地磅單的時(shí)間戳大小對(duì)流程實(shí)例進(jìn)行分類(正常/偏差)。其次,通過與港口物流管理人員進(jìn)行探討,選擇可能影響這一流程偏差的屬性,如表3中已有的屬性:貨物類型、貿(mào)易方式、地磅單執(zhí)行人。另外結(jié)合3.2節(jié)a)中發(fā)現(xiàn)每月月末是流程事件的高峰期和3.4節(jié)a)中發(fā)現(xiàn)部分流程實(shí)例未能及時(shí)簽訂合同,這兩個(gè)因素也可能造成本節(jié)所要分析的流程偏差。因此,從事件日志中生成兩個(gè)新屬性:辦理地磅時(shí)期(上旬:每月1~10日、中旬:每月11~20日、下旬:每月21~31日)和流程實(shí)例在核發(fā)出庫(kù)單時(shí)是否已經(jīng)簽訂合同(已簽訂、未簽訂)。最后,整合類別數(shù)據(jù)和屬性數(shù)據(jù),得到流程實(shí)例偏差數(shù)據(jù)(表5)。
2)分類決策樹分析
使用IBM SPSS Modeler 18.0的C5.0算法挖掘流程偏差數(shù)據(jù)的決策樹模型,用于提取實(shí)例部分屬性和類別之間的規(guī)則??紤]到數(shù)據(jù)中類別為“偏差”和“正?!睂?shí)例數(shù)相差較大會(huì)影響決策樹分類,本文案例選擇了所有的449個(gè)類別為“偏差”實(shí)例,隨機(jī)抽取了600個(gè)類別為“正?!睂?shí)例,最終決策樹模型(圖8)具有較高的精確度(79.89%),表明流程的屬性值組合與類別有關(guān)。其描述的屬性值和類別之間的關(guān)系可以轉(zhuǎn)換為一系列規(guī)則(表6)。
3)?;鶊D分析
使用可視化工具RAW Graphs 2.0繪制流程偏差數(shù)據(jù)的?;鶊D,用于分析提貨流程實(shí)例在任意屬性值間的轉(zhuǎn)換趨勢(shì)。本文案例分析了流程實(shí)例在貨物類型、是否簽訂合同、地磅單執(zhí)行人、實(shí)例類別間的?;鶊D(圖9)。其中?;鶊D由節(jié)點(diǎn)和路徑組成,數(shù)據(jù)由左邊節(jié)點(diǎn)流向右邊節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)和路徑的寬度分別表示經(jīng)過節(jié)點(diǎn)和路徑流量的大小。
圖9(a)左部路徑的寬度表明相比于其他貨物類型的實(shí)例,貨類1和4的實(shí)例有更大比例在核發(fā)出庫(kù)單時(shí)尚未簽訂合同;中間節(jié)點(diǎn)的寬度及右部路徑的寬度表明大部分實(shí)例在核發(fā)出庫(kù)單時(shí)已經(jīng)簽訂合同,未簽訂合同的實(shí)例比已簽訂合同的實(shí)例有更大比例出現(xiàn)流程偏差。
圖9(b)左部路徑的寬度表明相比于其他貨物類型的實(shí)例,貨類1和4的實(shí)例有更大比例經(jīng)由執(zhí)行人2和4辦理地磅單;右部路徑的寬度表明經(jīng)由執(zhí)行人2和4的實(shí)例比其他執(zhí)行人的實(shí)例有更大比例出現(xiàn)流程偏差。
4)確定原因
決策樹發(fā)現(xiàn)辦理地磅單時(shí)期、貨物類型和地磅單執(zhí)行人的部分屬性值組合與實(shí)例發(fā)生偏差有關(guān)系,但并不清楚這些屬性值間的轉(zhuǎn)換關(guān)系。結(jié)合?;鶊D的結(jié)果作進(jìn)一步分析,?;鶊D表明流程實(shí)例在“貨物類型→是否簽訂合同→實(shí)例類別”和“貨物類型→地磅單執(zhí)行人→實(shí)例類別”的轉(zhuǎn)換過程中,不同屬性值間的轉(zhuǎn)換趨勢(shì)有所不同。
因此,可以確定辦理地磅單時(shí)期、貨物類型、地磅單執(zhí)行人和是否簽訂合同這些屬性及影響機(jī)制會(huì)造成流程實(shí)例出現(xiàn)“T7核發(fā)出庫(kù)單”和“T8辦理地磅單”執(zhí)行順序的偏差。結(jié)合決策樹和?;鶊D的結(jié)果,通過和港口物流管理人員探討,進(jìn)一步明確該流程偏差發(fā)生受以下因素的疊加影響:
a)每月下旬是各種流程事件的高峰期,核發(fā)出庫(kù)單需要一定時(shí)間,業(yè)務(wù)量的加大會(huì)造成不能及時(shí)核發(fā)出庫(kù)單,并產(chǎn)生流程擁擠;而貨物類型為貨類1和4的實(shí)例需要更短的物流周期,客戶想通過一次到崗就辦理所有業(yè)務(wù);并且地磅單執(zhí)行人2和4更容易在辦理地磅單時(shí)沒有嚴(yán)格審核是否已經(jīng)核發(fā)出庫(kù)單。大部分實(shí)例在以上情況下更容易出現(xiàn)T7和T8執(zhí)行順序的偏差。圖4和5也表明這種偏差主要發(fā)生在流程執(zhí)行T4或T5之后,就執(zhí)行T8。
b)簽訂單船合同需要每次到港后進(jìn)行且需要一定時(shí)間,而核發(fā)出庫(kù)單需要合同內(nèi)容,辦理地磅單則不需要,圖4和5也表明T1-1通常發(fā)生在T7之前,只有少量實(shí)例執(zhí)行“T1-1→T2”這一路徑。這導(dǎo)致有快速辦單需求(貨類1和4)的實(shí)例更可能出現(xiàn)未簽訂合同的情況,而實(shí)例未簽訂合同通常會(huì)造成T7和T8執(zhí)行順序的偏差。
c)有快速辦單需求(貨類1和4)的客戶和部分地磅單執(zhí)行人(執(zhí)行人2和4)業(yè)務(wù)往來比較頻繁,這部分執(zhí)行人更容易出現(xiàn)審核不嚴(yán)的情況,造成實(shí)例出現(xiàn)T7和T8執(zhí)行順序的偏差。
4 討論
4.1 案例討論
案例分析表明,本文方法能夠準(zhǔn)確發(fā)現(xiàn)港口物流提貨流程存在的問題,并能分析出發(fā)生流程偏差的根本原因。本章對(duì)從案例中獲得的見解進(jìn)行以下討論。
4.1.1 港口物流的擁擠問題
港口物流存在擁擠問題,一方面是由于港口資源配置不合理,無法滿足高峰需求,這符合已有研究[11,34];另一方面,通過自動(dòng)發(fā)現(xiàn)能夠還原更多流程行為的控制流模型,本文發(fā)現(xiàn)部分提貨流程設(shè)計(jì)不合理也會(huì)造成擁擠。
a)提貨流程績(jī)效分析發(fā)現(xiàn)每月下旬是各種流程活動(dòng)發(fā)生的高峰期,業(yè)務(wù)量加大會(huì)增加執(zhí)行人的作業(yè)壓力,導(dǎo)致因辦單不及時(shí)而產(chǎn)生提貨流程擁擠。為此,港口物流管理人員可以加強(qiáng)對(duì)港口業(yè)務(wù)量的實(shí)時(shí)監(jiān)控,在每月下旬的時(shí)候增加執(zhí)行人數(shù)量,減輕執(zhí)行人的作業(yè)壓力。
b)自動(dòng)發(fā)現(xiàn)的實(shí)際提貨流程模型表明有較少實(shí)例需要簽訂單船合同,且該活動(dòng)通常發(fā)生在“T7核發(fā)出庫(kù)單”之前,這是因?yàn)橹匦潞炗喓贤枰礁酆筮M(jìn)行,不及時(shí)簽訂合同通常無法進(jìn)行T7及后續(xù)流程,導(dǎo)致提貨流程擁擠。本文通過調(diào)研發(fā)現(xiàn)大部分合同都是根據(jù)模板生成的,可以通過智能手段提前傳遞合同信息,縮短到港后的合同簽訂時(shí)間。
通過進(jìn)行提貨流程偏差根因分析,本文發(fā)現(xiàn)以上造成流程擁擠的因素,也是部分實(shí)例先違規(guī)辦理地磅單,后核發(fā)出庫(kù)單的原因。
4.1.2 港口物流標(biāo)準(zhǔn)流程模型不能充分滿足客戶需求
港口物流高度以人為中心,客戶的需求和操作是多樣化的,單一的港口物流執(zhí)行順序不能滿足客戶的多樣化需求,會(huì)增加流程偏差的風(fēng)險(xiǎn)。如:
提貨流程偏差根因分析表明貨物類型為貨類1和4的實(shí)例需要快速通過港口,客戶通常會(huì)一次辦理所有業(yè)務(wù),這增加了辦單順序的不確定性。為此,港口業(yè)務(wù)部門可以對(duì)有快速辦單需求的貨類設(shè)立快速辦單通道,以滿足客戶的需求并實(shí)現(xiàn)對(duì)辦單順序的控制。
4.1.3 執(zhí)行人的違規(guī)操作問題
港口物流由多個(gè)物流活動(dòng)構(gòu)成,需要人工確認(rèn)各種文件以保障流程的有序進(jìn)行[34]。提貨流程偏差根因分析結(jié)果表明,執(zhí)行人的違規(guī)操作是提貨流程發(fā)生某些偏差的原因。如:
辦理地磅單執(zhí)行人存在沒有嚴(yán)格審核是否核發(fā)出庫(kù)單就辦理地磅單的違規(guī)操作,特別是部分執(zhí)行人(執(zhí)行人2和4)長(zhǎng)期違規(guī)辦理某些貨物類型(貨類1和4)的地磅單。為此,管理部門應(yīng)加強(qiáng)對(duì)執(zhí)行人的規(guī)范操作培訓(xùn)和檢查,并針對(duì)違規(guī)行為制定相應(yīng)的懲罰措施。
4.2 方法框架討論
為了強(qiáng)化港口物流流程中的流程偏差根因分析能力,本文從數(shù)據(jù)提取和預(yù)處理、績(jī)效分析、模型自動(dòng)發(fā)現(xiàn)、一致性分析和偏差根因分析五個(gè)階段進(jìn)行了面向流程偏差根因分析的港口物流流程挖掘方法框架研究。本文方法與現(xiàn)有方法的對(duì)比結(jié)果如下。
4.2.1 與現(xiàn)有方法發(fā)現(xiàn)的港口物流流程模型對(duì)比
Fuzzy Miner和Heuristic Miner是現(xiàn)有港口物流流程挖掘中常用的流程模型自動(dòng)發(fā)現(xiàn)方法。其中,F(xiàn)uzzy Miner用于研究港口物流的主要流程,Heuristic Miner用于研究港口物流的詳細(xì)流程信息。但這兩種分法都可能會(huì)將低頻但關(guān)鍵的路徑作為噪聲過濾掉,或產(chǎn)生不合理的模型。本文在港口物流流程模型自動(dòng)發(fā)現(xiàn)階段,首先使用Split Miner挖掘主要流程,然后使用Inductive Miner來挖掘復(fù)雜子流程的詳細(xì)流程信息。
1)Split Miner與Fuzzy Miner發(fā)現(xiàn)的模型對(duì)比
在挖掘本文案例提貨流程日志數(shù)據(jù)的主要流程模型時(shí),圖4是使用Split Miner的挖掘結(jié)果,圖10是使用Fuzzy Miner的挖掘結(jié)果。比較圖4和10可以發(fā)現(xiàn),圖4能夠快速、準(zhǔn)確地反映實(shí)際提貨流程的結(jié)構(gòu)特點(diǎn),并且在保持模型低復(fù)雜性的同時(shí)保留了流程中的相關(guān)活動(dòng)及路徑;圖10顯示的提貨流程比較混亂,不能快速分析出流程的結(jié)構(gòu)特點(diǎn),而且會(huì)把流程中的低頻活動(dòng)(活動(dòng)T1-1、T3、T4、T5、T6、T7和T15)及路徑聚合成新的活動(dòng)(在圖10用紅色圓圈標(biāo)出),從而無法使人們分析這些活動(dòng)的執(zhí)行信息。
2)Inductive Miner與Heuristic Miner發(fā)現(xiàn)的模型對(duì)比
在挖掘本文案例提貨流程中復(fù)雜子流程日志數(shù)據(jù)的詳細(xì)流程模型時(shí),圖5是使用Inductive Miner的挖掘結(jié)果。圖11是使用Heuristic Miner的挖掘結(jié)果,圖11中的每個(gè)方框代表提貨流程中的一種活動(dòng),邊代表活動(dòng)間的路徑關(guān)系,數(shù)字代表活動(dòng)或路徑的發(fā)生次數(shù),圖11中的信息雖然能在一定程度上顯示實(shí)際提貨流程的執(zhí)行細(xì)節(jié),但不能有效地表達(dá)低頻路徑和復(fù)雜流程部分。比較圖5和11可以發(fā)現(xiàn),圖5顯示了詳細(xì)的路徑信息,能夠很好地處理復(fù)雜流程部分,也能夠發(fā)現(xiàn)流程中的低頻路徑;圖11“T8→T9→T10→T11→T12→T13→T14”這一部分比較不合理(在圖11用紅色方框標(biāo)出),沒有像圖5那樣顯示出這些活動(dòng)的主要順序關(guān)系,而且圖11過濾掉了一些低頻路徑,例如“T4→T8”“T1-1→T2”和“T3→T4”(在圖11用紅色箭頭標(biāo)出)。案例分析表明,圖5中的這些低頻路徑為提貨流程中的偏差分析提供了支持。
以上對(duì)比顯示,在港口物流流程模型自動(dòng)發(fā)現(xiàn)階段,使用Split Miner和Inductive Miner算法從不同抽象級(jí)別來發(fā)現(xiàn)簡(jiǎn)潔、合理、還原更多流程行為的流程模型,能夠更準(zhǔn)確地發(fā)現(xiàn)實(shí)際流程執(zhí)行細(xì)節(jié),為后續(xù)流程偏差根因分析提供支持。
4.2.2 對(duì)比兩種方法進(jìn)行港口物流流程偏差根因分析的結(jié)果
Wang等人[11]提出了一套由流程發(fā)現(xiàn)、績(jī)效分析和一致性檢查相關(guān)技術(shù)構(gòu)成的方法,以獲得港口物流流程知識(shí),但該方法不能對(duì)港口物流流程偏差進(jìn)行根因分析,造成港口物流流程偏差分析能力較弱。本文對(duì)該方法進(jìn)行了延伸,加入港口物流流程偏差根因分析階段。首先,使用分類決策樹提取流程實(shí)例部分屬性值和類別之間的規(guī)則;考慮到僅使用決策樹存在不精確分析的風(fēng)險(xiǎn),使用?;鶊D進(jìn)一步分析流程實(shí)例在任意屬性值間的轉(zhuǎn)換趨勢(shì)。案例分析結(jié)果表明,這兩種方法成功發(fā)現(xiàn)了港口物流流程偏差的影響屬性及影響機(jī)制。以下是使用兩種方法的分析結(jié)果對(duì)比。
在對(duì)港口物流流程偏差進(jìn)行根因分析時(shí),圖8是使用分類決策樹分析的結(jié)果,圖9是使用?;鶊D分析的結(jié)果??梢园l(fā)現(xiàn):圖8顯示了流程實(shí)例類別與辦理地磅單時(shí)期、貨物類型和地磅單執(zhí)行人之間的規(guī)則,這些規(guī)則在一定程度上解釋了港口物流流程偏差的影響屬性及影響機(jī)制,但并不清楚流程實(shí)例在這些屬性值間的轉(zhuǎn)換關(guān)系;圖9則顯示了流程實(shí)例在貨物類型、是否簽訂合同、地磅單執(zhí)行人和流程實(shí)例類別間的轉(zhuǎn)換趨勢(shì)有所不同,進(jìn)一步明確了港口物流流程偏差的影響屬性及影響機(jī)制。
以上對(duì)比顯示,本文在港口物流流程偏差根因分析階段,結(jié)合決策樹和桑基圖進(jìn)行分析,這兩種方法的結(jié)果既有相同之處也有各自的發(fā)現(xiàn),在最后確定原因時(shí)結(jié)合二者的結(jié)果進(jìn)行分析,確保根因分析結(jié)果的可靠性和完整性。
綜上,與現(xiàn)有方法作對(duì)比,本文方法能發(fā)現(xiàn)實(shí)際執(zhí)行流程的更多細(xì)節(jié),為流程偏差根因分析提供支持,并可以對(duì)流程偏差進(jìn)行系統(tǒng)化的根因分析,強(qiáng)化了港口物流流程偏差分析能力,從而驗(yàn)證了本文方法的有效性和科學(xué)性。
5 結(jié)束語
本文提出了面向流程偏差根因分析的港口物流流程挖掘方法。該方法從港口物流信息系統(tǒng)中進(jìn)行事件日志提取和預(yù)處理,接著對(duì)事件日志進(jìn)行以下分析:首先,對(duì)事件日志中的港口物流活動(dòng)進(jìn)行流程績(jī)效分析,發(fā)現(xiàn)影響流程績(jī)效的因素并將其作為可能造成流程偏差的屬性;其次,使用Split Miner、Inductive Miner自動(dòng)發(fā)現(xiàn)實(shí)際流程模型,分析實(shí)際港口流程執(zhí)行細(xì)節(jié),為后續(xù)流程偏差根因分析提供支持;然后,通過基于對(duì)齊的一致性檢查方法,分析實(shí)際港口物流流程和標(biāo)準(zhǔn)流程之間的業(yè)務(wù)一致性和具體流程偏差;最后,基于分類決策樹和?;鶊D這兩種方法,對(duì)具體港口流程偏差進(jìn)行系統(tǒng)化的根因分析。通過在國(guó)內(nèi)某大型港口物流提貨流程上的實(shí)際應(yīng)用,發(fā)現(xiàn)了港口物流擁擠、港口物流標(biāo)準(zhǔn)流程模型不能充分滿足客戶需求和執(zhí)行人違規(guī)操作有關(guān)方面的問題是提貨流程發(fā)生流程偏差的根本原因,并提出了針對(duì)性的管理洞察,驗(yàn)證了本文方法的適應(yīng)性。
未來的工作可以從以下兩個(gè)方面進(jìn)行改進(jìn):首先,在數(shù)據(jù)提取和預(yù)處理階段,本文僅考慮了港口物流信息系統(tǒng)中與流程活動(dòng)相關(guān)的屬性,未來研究可以與其他來源的數(shù)據(jù)結(jié)合起來;其次,在港口物流流程一致性分析階段,由于研究數(shù)據(jù)規(guī)模并不是很大,本文所使用的基于對(duì)齊的一致性檢查方法未考慮在大型事件日志上的耗時(shí)問題,未來應(yīng)引進(jìn)更高效的一致性檢查方法。
參考文獻(xiàn):
[1]Hsu C T,Chou M T,Ding J F. Key factors for the success of smart ports during the post-pandemic era[J]. Ocean & Coastal Management,2023,233: 106455.
[2]王英. 港口物流中的流程知識(shí)挖掘研究和智能優(yōu)化設(shè)計(jì)[D]. 北京: 北京交通大學(xué),2014. (Wang Ying. Research on process mining in port logistics andintelligent design for the process improvement[D]. Beijing: Beijing Jiaotong University,2014.)
[3]Irannezhad E,Prato C G,Hickman M. An intelligent decision support system prototype for hinterland port logistics[J]. Decision Support Systems,2020,130: 113227.
[4]Zerbino P,Aloini D,Dulmin R,et al. Process-mining-enabled audit of information systems: methodology and an application[J]. Expert Systems with Applications,2018,110: 80-92.
[5]中華人民共和國(guó)海事局. 以案為鑒|引航安全不容忽視[EB/OL]. (2022-02-14) [2023-12-12]. https://www.msa.gov.cn/page/article.do?articleId=7812C350-4F25-4B18-8449-72A7EBD-57586. (Maritime Safety Administration of the People’s Republic of China. Learn from cases safety cannot be overlooked[EB/OL]. (2022-02-14) [2023-12-12]. https://www.msa.gov.cn/page/article.do?articleId=7812C350-4F25-4B18-8449-72A7EBD-57586.)
[6]孫迪. 散雜貨港口商務(wù)管理流程挖掘研究[D]. 北京: 北京交通大學(xué),2018. (Sun Di. Research on process mining in bulk and groceries port business management[D]. Beijing: Beijing Jiaotong University,2018.)
[7]Jia Xiaohui,Zhang Donghui. Prediction of maritime logistics service risks applying soft set based association rule: an early warning model[J]. Reliability Engineering & System Safety,2021,207: 107339.
[8]Van der Aalst W M P. Process mining: a 360 degree overview[M]. Berlin: Springer-Verlag,2022: 3-34.
[9]Veenstra A W,Harmelink R L A. Process mining ship arrivals in port: the case of the port of antwerp[J]. Maritime Economics & Logistics,2022,24(3): 584-601.
[10]Zerbino P,Aloini D,Dulmin R,et al. Towards analytics-enabled efficiency improvements in maritime transportation: a case study in a mediterranean port[J]. Sustainability,2019,11(16): 4473.
[11]Wang Ying,Caron F,Vanthienen J,et al. Acquiring logistics process intelligence: methodology and an application for a Chinese bulk port[J]. Expert Systems with Applications,Elsevier,2014,41(1): 195-209.
[12]Li Keyi,Marsic I,Sarcevic A,et al. Discovering interpretable medical process models: a case study in trauma resuscitation[J]. Journal of Biomedical Informatics,2023,140: 104344.
[13]Augusto A,Conforti R,Dumas M,et al. Split miner: automated discovery of accurate and simple business process models from event logs[J]. Knowledge and Information Systems,2019,59(2): 251-284.
[14]Sarkar B D,Shankar R,Kar A K. Severity analysis and risk profiling of port logistics barriers in the industry 4.0 era[J]. Benchmarking: An International Journal,2023,30(9): 3253-3280.
[15]Leemans S J,F(xiàn)ahland D,van der Aalst W M P. Scalable process discovery and conformance checking[J]. Software & Systems Modeling,2018,17: 599-631.
[16]劉聰,程龍. 流程挖掘: 技術(shù)與應(yīng)用概述[J]. 中國(guó)科技產(chǎn)業(yè),2021(7): 50-51. (Liu Cong,Cheng Long. Process mining: techno-logy and application overview[J]. Science & Technology Industry of China,2021(7): 50-51.)
[17]Weijters A,Van der Aalst W M P,De Medeiros A. Process mining with the heuristics miner-algorithm[J]. Technische Universiteit Eindhoven,2006,166: 1-34.
[18]Gyunther C W,Van der Aalst W M P. Fuzzy mining-adaptive process simplification based on multi-perspective metrics[C]// Proc of the 5th International Conference on Business Process Management. Berlin: Springer,2007: 328-343.
[19]朱銳,張志幸,莫啟,等. 支持復(fù)雜結(jié)構(gòu)的混成過程挖掘方法[J]. 計(jì)算機(jī)集成制造系統(tǒng),2018,24(7): 1653-1670. (Zhu Rui,Zhang Zhixing,Mo Qi,et al. Hybrid process mining method supporting complex structures[J]. Computer Integrated Manufacturing Systems,2018,24(7): 1653-1670.)
[20]Augusto A,Carmona J,Verbeek E. Advanced process discovery techniques[M]. Berlin: Springer,2022: 76-107.
[21]白少康,方賢文,錢陳婧. 基于數(shù)據(jù)影響的業(yè)務(wù)流程一致性檢查方法[J]. 計(jì)算機(jī)應(yīng)用研究,2024,41(2): 540-547. (Bai Shaokang,F(xiàn)ang Xianwen,Qian Chenjing. Business process conformance checking method based on data impact[J]. Application Research of Computers,2024,41(2): 540-547.)
[22]Rozinat A,Van der Aalst W M P. Conformance checking of processes based on monitoring real behavior[J]. Information Systems,2008,33(1): 64-95.
[23]van der Aalst W M P,Adriansyah A,van Dongen B. Replaying history on process models for conformance checking and performance analy-sis[J]. WIREs Data Mining and Knowledge Discovery,2012,2(2): 182-192.
[24]沈曉林,劉聰,李會(huì)玲,等. 基于流程模型分解的分布式合規(guī)性檢查方法[J/OL]. 計(jì)算機(jī)集成制造系統(tǒng). (2023-03-30). https://kns.cnki.net/kcms/detail/11.5946.TP.20230329.1714.003.html. (Shen Xiaolin,Liu Cong,Li Huiling,et al. Distributed conformance checking method based on process model decomposition[J/OL]. Computer Integrated Manufacturing Systems. (2023-03-30). https://kns.cnki.net/kcms/detail/11.5946.TP.20230329.1714.003.html.)
[25]Suriadi S,Ouyang Chun,Van der Aalst W M P,et al. Root cause analysis with enriched process logs[M]// La Rosa M,Soffer P. Business Process Management Workshops.Berlin:Springer,2013:174-186.
[26]Ferreira D R,Vasilyev E. Using logical decision trees to discover the cause of process delays from event logs[J]. Computers in Industry,2015,70: 194-207.
[27]Bozorgi Z D,Teinemaa I,Dumas M,et al. Process mining meets cau-sal machine learning: discovering causal rules from event logs[C]// Proc of the 2nd International Conference on Process Mining. Pisca-taway,NJ: IEEE Press,2020: 129-136.
[28]Qafari M S,van der Aalst W M P. Feature recommendation for structural equation model discovery in process mining[J/OL]. Progress in Artificial Intelligence. (2022-06-25). https://doi.org/10.1007/s13748-022-00282-6.
[29]Cai Min,Wu Miaohuan,Luo Xinggang,et al. Integrated framework of kansei engineering and kano model applied to service design[J]. International Journal of Human-Computer Interaction,2023,39(5): 1096-1110.
[30]Qafari M S,van der Aalst W M P. Case level counterfactual reasoning in process mining[M]// Nurcan S,Korthaus A. Intelligent Information Systems. Berlin: Springer,2021: 55-63.
[31]Mahabir R J,Pun K F. Revitalising project management office operations in an engineering-service contractor organisation: a key perfor-mance indicator based performance management approach[J]. Business Process Management Journal,2022,28(4): 936-959.
[32]Berberoglu Y,Kazancoglu Y,Sagnak M. Circularity assessment of logistics activities for green business performance management[J]. Business Strategy and the Environment,2023,32(7): 4734-4749.
[33]Otto E,Culakova E,Meng Sixu,et al. Overview of sankey flow diagrams: focusing on symptom trajectories in older adults with advanced cancer[J]. Journal of Geriatric Oncology,2022,13(5): 742-746.
[34]Sarkar B D,Shankar R,Kar A K. Port logistic issues and challenges in the industry 4.0 era for emerging economies: an India perspective[J]. Benchmarking: An International Journal,2023,30(1): 50-74.
收稿日期:2023-12-09;修回日期:2024-03-06 基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目(72371086,72171064,61902222);山東省泰山學(xué)者工程專項(xiàng)基金資助項(xiàng)目(tsqn201909109);山東省自然科學(xué)基金優(yōu)秀青年基金項(xiàng)目(ZR2021YQ45);山東省高等學(xué)校青創(chuàng)科技計(jì)劃創(chuàng)新團(tuán)隊(duì)項(xiàng)目(2021KJ031)
作者簡(jiǎn)介:蔡敏(1973—),女,浙江溫州人,副教授,博士,主要研究方向?yàn)槿艘蚺c工效學(xué)、數(shù)字化工程與管理;王學(xué)濤(1998—),男,河南周口人,碩士,主要研究方向?yàn)榱鞒掏诰颍凰稳菁危?992—),女(通信作者),遼寧沈陽人,講師,博士,主要研究方向?yàn)闃I(yè)務(wù)流程管理、數(shù)字/智化(rongjia.song@hdu.edu.cn);劉聰(1990—),男,山東淄博人,教授,博士,主要研究方向?yàn)榱鞒掏诰颉I(yè)務(wù)流程管理;雒興剛(1971—),男,新疆奇臺(tái)人,教授,博士,主要研究方向?yàn)楫a(chǎn)品/服務(wù)開發(fā)、運(yùn)作管理、質(zhì)量管理;黃磊(1965—),男,北京人,教授,博士,主要研究方向?yàn)槠髽I(yè)數(shù)字化、信息系統(tǒng).