国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

鋼鐵物流下的卡車排隊(duì)等待時間預(yù)測*

2021-01-19 11:00
關(guān)鍵詞:先驗(yàn)等待時間排隊(duì)

梁 爽 蔡 鵬

(華東師范大學(xué)數(shù)據(jù)科學(xué)與工程學(xué)院 上海 200062)

1 引言

由于缺乏合理的排隊(duì)規(guī)則,同時因?yàn)殇搹S業(yè)務(wù)流程邏輯復(fù)雜,原料運(yùn)輸車輛到達(dá)鋼廠停車場后,很難通過常規(guī)手段預(yù)估入廠排隊(duì)等待時間。準(zhǔn)確等待時間的缺少使得司機(jī)不得不隨時呆在車內(nèi)待命。這種情況既增加了物流成本,也降低了司機(jī)的滿意度。圖1展示了卡車排隊(duì)卸貨的業(yè)務(wù)流程。

卡車首先進(jìn)入停車場并按貨物品種取得排隊(duì)號。經(jīng)過一段時間等待該車被叫號并準(zhǔn)備入廠,入廠之后進(jìn)行卸貨工作,卸貨完成即可離開廠房。這個過程中,關(guān)鍵的時間信息被實(shí)時地記錄到鋼鐵物流信息平臺。我們的目標(biāo)就是預(yù)測卡車開始排隊(duì)至被叫號所花費(fèi)的時間(既車輛等待時間)。目前大多數(shù)鋼廠采用排隊(duì)號乘以固定時間這種依靠經(jīng)驗(yàn)、粗粒度的預(yù)測方法。這種方法忽視了廠內(nèi)卸貨能力、停車場內(nèi)車輛已等待時間等因素,預(yù)測結(jié)果對司機(jī)參考意義不大。

圖1 卡車排隊(duì)卸貨過程

鋼鐵物流場景下的等待時間預(yù)測與一般場景有一定區(qū)別。機(jī)場出租車等待時間預(yù)測[1]考慮機(jī)場乘客到達(dá)率、天氣情況、機(jī)場內(nèi)出租車數(shù)量等,銀行排隊(duì)等待時間預(yù)測[2]考慮排隊(duì)號,服務(wù)窗口數(shù)、業(yè)務(wù)類型等。這些場景穩(wěn)定且邏輯相對簡單。然而鋼鐵物流場景下幾十種原料運(yùn)輸車輛并行工作,車輛的等待時間受整個工廠狀況影響,并且廠內(nèi)工人數(shù)、機(jī)器數(shù)等變化大,廠區(qū)的工作效率也因這些因素動態(tài)變化,很不穩(wěn)定。

時間預(yù)測作為一個挑戰(zhàn)性的問題,已經(jīng)在很多應(yīng)用領(lǐng)域被廣泛地研究[3]。常用的高效時間預(yù)測模型主要有以下幾種:時空模型[4~5]、線性回歸模型[6],神經(jīng)網(wǎng)絡(luò)模型[7~9]、支持向量機(jī)模型[10~12]、卡爾曼 濾 波 模 型[11~12]、最 近 鄰 回 歸 模 型(K-Nearest Neighbors,KNN)[1,13]等。然而,由于缺少必要的數(shù)據(jù),很少有鋼鐵物流領(lǐng)域等待時間預(yù)測相關(guān)的研究。

但隨著鋼鐵物流信息平臺的建設(shè),平臺產(chǎn)生且不斷增加的數(shù)據(jù)給我們提供了開展研究的契機(jī)。我們?nèi)诤狭藦S內(nèi)外排隊(duì)信息、廠房卸貨信息等多個來源的數(shù)據(jù)建立了初始數(shù)據(jù)集。我們需要應(yīng)對兩個挑戰(zhàn):1)如何從眾多信息中生成有價值的特征;2)如何構(gòu)建適合鋼鐵物流這樣復(fù)雜場景的模型。

由于鋼鐵物流的復(fù)雜性,卡爾曼濾波模型很難構(gòu)建出其狀態(tài)方程及觀測方程,同時因?yàn)殇搹S效率的不穩(wěn)定,時空模型也不適合鋼鐵物流場景。本文提出一種基于長短期記憶網(wǎng)絡(luò)[14](Long Short-Term Memory,LSTM)與線性網(wǎng)絡(luò)(Linear Network)的組合模型,利用LSTM模型從歷史數(shù)據(jù)中充分獲取先驗(yàn)知識,再將先驗(yàn)知識與當(dāng)前車輛的實(shí)時信息結(jié)合后利用Linear模型進(jìn)行較為準(zhǔn)確的等待時間預(yù)測。在日照鋼鐵集團(tuán)真實(shí)生產(chǎn)環(huán)境下,我們使用Auto-sklearn[15]訓(xùn)練模型來模擬線性回歸、支持向量機(jī)等方法,并與LSTM-Linear模型對比。

2 鋼鐵物流數(shù)據(jù)分析

我們?nèi)诤狭藖碜跃﹦?chuàng)智匯鋼鐵物流信息平臺的三組真實(shí)數(shù)據(jù)用于卡車等待時間預(yù)測,包括廠外卡車排隊(duì)信息、廠內(nèi)卡車信息、廠房卸貨能力日志。

2.1 排隊(duì)數(shù)據(jù)

融合的數(shù)據(jù)集包括每一輛卡車所運(yùn)輸貨物的品種、排隊(duì)開始時間、叫號時間、入廠時間、出廠時間,車輛所屬公司、貨物重量、司機(jī)信息以及此刻廠房內(nèi)倉庫的卸貨能力等。通過融合的數(shù)據(jù)集中的時間信息,能夠清晰地掌握每輛車所處的狀態(tài)以及各個狀態(tài)下的車輛流量。

如圖2所示,我們統(tǒng)計(jì)了2019年7月至2019年10月這四個月來近八萬輛卡車的信息,近40種原料主要分為廢鋼、煤炭、焦炭3個品類??梢钥吹礁鱾€品種之間的特性差異明顯,四個月來有些品種只有幾十輛車,而有的多達(dá)近16000輛;從等待時間來說,有的排隊(duì)開始即被叫號,而有的等待近10小時。相對來說,3個品類下的品種之間特性更近似。因此下文的實(shí)驗(yàn)部分在這3個品類上進(jìn)行區(qū)分。

圖2 四個月來各原料品種平均等待時間及車輛數(shù)

2.2 特征生成

我們在融合的數(shù)據(jù)集中找到影響原料運(yùn)輸車輛等待時間的重要因素。表1展示了對一卡車最終生成的7維特征。

表1 由數(shù)據(jù)分析生成的特征

我們選擇一個月破碎廢鋼的數(shù)據(jù)為例進(jìn)行分析。對排隊(duì)等待時間影響最大是車輛在隊(duì)列中的排隊(duì)號。原料運(yùn)輸車輛絕大部分遵循先到先入廠的原則,顯然排隊(duì)號大的車輛應(yīng)當(dāng)?shù)却龝r間更長。如圖3(a),大體上排隊(duì)號與等待時間呈正相關(guān)關(guān)系。但從圖3(b)中,我們發(fā)現(xiàn)就算排隊(duì)號都為15,車輛的等待時間依舊差異很大,這也說明了還存在一些因素影響等待時間。同時將車輛按照等待時間從小到大排序,當(dāng)前車輛排隊(duì)號之前的車輛已等待時間越長,當(dāng)前車輛可能等待時間越短。從圖3(c)和圖3(d)可看出車輛等待時間與正處于叫號未入廠階段內(nèi)的車輛數(shù)及這些車輛已等待時間之間呈正相關(guān)關(guān)系。顯然,車輛數(shù)越多,等待時間理應(yīng)更長;同時從實(shí)際業(yè)務(wù)中了解到,車輛被叫號之后即應(yīng)入廠,如果沒有及時入廠,說明廠內(nèi)狀況并不適合車輛入廠,所以出現(xiàn)了圖3(d)中的情況,平均已等待時間越長,當(dāng)前車輛的等待時間可能越長。

圖3(e)展示了廠內(nèi)車輛數(shù)與等待時間的關(guān)系。絕大部分破碎廢鋼車輛排隊(duì)開始時廠內(nèi)同品種車輛數(shù)在5~45之間,一定程度看出等待時間相對穩(wěn)定(在廠車輛數(shù)在50以上的情況很少)。同時我們對工廠壓塊進(jìn)行分析,如圖3(f),車輛數(shù)與等待時間卻呈正相關(guān),這種情況也間接說明了鋼鐵物流的復(fù)雜性,不同品種之間既有車輛到達(dá)率、等待時間的差異,廠內(nèi)的工作模式上也存在一定區(qū)別。圖3(h)展示了距當(dāng)前車輛排隊(duì)開始時間最近的10輛同品種已出廠車輛平均在廠時間與當(dāng)前車輛等待時間的關(guān)系。鋼廠在一定時間范圍內(nèi)效率是相對穩(wěn)定的,最近已出廠車輛的在廠時間能夠很好反映最近一段時間內(nèi)廠內(nèi)的卸貨效率。結(jié)合圖3(g)、3(h),在日照鋼廠的實(shí)際工作環(huán)境下,我們可以根據(jù)最近出廠車輛在廠區(qū)所花費(fèi)時間近似了解到廠區(qū)的工作效率,推斷在廠內(nèi)的車輛還需多久完成卸貨工作,并以此預(yù)估仍在廠外等待的車輛需要多久可以入廠。

圖3 各個特征與等待時間關(guān)系

綜合以上分析,可以看出鋼鐵物流場景下的等待時間預(yù)測相對于一般場景更為復(fù)雜。首先由于缺少必要的數(shù)據(jù),很難對鋼廠完整狀況定量地表示,其次等待時間受到的影響因素較多,各個特征與等待時間之間也并不完全是線性的關(guān)系。我們在實(shí)際工作過程中通過反復(fù)地分析數(shù)據(jù),表1所示的7個特征明顯影響等待時間。同時,也在這精心選擇的7個特征基礎(chǔ)上,我們開展了下文模型構(gòu)建的工作。

3 等待時間預(yù)測模型構(gòu)建

本文提出的鋼鐵物流場景下的卡車等待時間預(yù)測模型由兩部分構(gòu)成:第一部分針對數(shù)據(jù)量較多(車輛數(shù)較多)的品種構(gòu)建LSTM-linear組合模型,利用LSTM模型,從歷史數(shù)據(jù)中獲得對現(xiàn)階段預(yù)測有幫助的先驗(yàn)知識,再利用線性模型,根據(jù)當(dāng)前車輛的實(shí)時信息結(jié)合先驗(yàn)知識來預(yù)測等待時間;第二部分針對數(shù)據(jù)量很少不足以建模的品種采用KNN回歸進(jìn)行預(yù)測。

下面從平臺現(xiàn)用方法的弊端、本文提出的等待時間預(yù)測模型兩方面進(jìn)行詳細(xì)說明。

3.1 信息平臺現(xiàn)用方法弊端

目前京創(chuàng)智匯鋼鐵物流信息平臺利用線性回歸(嶺回歸)模型實(shí)現(xiàn)等待時間預(yù)測功能。模型的輸入為101維,包括采用獨(dú)熱編碼的品種類別、排隊(duì)號、離當(dāng)前車輛排隊(duì)開始時間最近的同品種未叫號20輛車的已等待時間(不足補(bǔ)0)等。這種方法存在明顯弊端:1)嶺回歸模型本身是一個線性回歸模型,高達(dá)百維的輸入可能會降低輸入之中有效特征的重要性;2)所有品種糅合在一起,只用一個模型進(jìn)行預(yù)測。假設(shè)在很短的一段時間內(nèi)接連來了兩輛運(yùn)輸廢鋼的車輛,依據(jù)嶺回歸模型的輸入對兩輛車生成特征,它們的特征向量在排隊(duì)號的數(shù)值相差1,其余特征值區(qū)別很小。向量標(biāo)準(zhǔn)化后利用嶺回歸模型進(jìn)行預(yù)測(y為預(yù)測結(jié)果,f為標(biāo)準(zhǔn)化后向量,w,b分別為線性模型權(quán)重和偏置):

同時假設(shè)在很短的一段時間內(nèi)接連來了兩輛運(yùn)輸煤炭的車輛,抽取特征,兩個向量也只在排隊(duì)號的數(shù)值相差1,其余特征值區(qū)別很小,利用模型進(jìn)行預(yù)測:

計(jì)算這兩個品種車輛等待時間的差值(σ為標(biāo)準(zhǔn)化操作中排隊(duì)號列的標(biāo)準(zhǔn)差):

然而從圖2我們看出廢鋼、煤炭之間的等待時間差異是明顯的,只使用單一的嶺回歸模型在面對上述情形時顯然出現(xiàn)錯誤,不同品種車輛之間的等待時間差值不應(yīng)是近似的。

3.2 模型構(gòu)建

構(gòu)建單一模型存在一定弊端,所以我們考慮對各個品種單獨(dú)建模。然而,從圖2中看出有不少品種四個月來車輛數(shù)較少,數(shù)據(jù)量很難達(dá)到訓(xùn)練模型的要求。所以,對于數(shù)據(jù)量小于1000的品種我們采取KNN回歸的方法利用同品種車輛歷史等待時間來預(yù)測車輛的等待時間(KNN回歸計(jì)算基于表1所示的特征)。數(shù)據(jù)量較多的品種通過建立LSTM-Linear模型進(jìn)行預(yù)測。圖4展示了運(yùn)輸車輛的等待時間預(yù)測過程。

圖4 車輛等待時間預(yù)測過程

LSTM是一種能夠處理序列變化數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)。內(nèi)部門結(jié)構(gòu)的設(shè)計(jì)使其具備控制信息傳遞的能力。上一次計(jì)算得來的輸出傳遞給下一次的計(jì)算,攜帶了上一次的“記憶”之后,本次計(jì)算會在上一次計(jì)算的基礎(chǔ)上更好的預(yù)測,適合排隊(duì)這樣具有時序特點(diǎn)的場景。

在平臺現(xiàn)用方法中,忽略了一個重要信息:離當(dāng)前車輛排隊(duì)開始時間最近的那些同品種已被叫號車輛的等待時間。這些最新的準(zhǔn)確的等待時間對于當(dāng)前車輛的預(yù)測是已知的,同時能很好反映最近廠房內(nèi)外的狀況,利用這些時間能夠更好地預(yù)測當(dāng)前車輛的等待時間。我們使用LSTM模型處理這些時序數(shù)據(jù),輸入最近被叫號車輛的信息,輸出對當(dāng)前車輛的預(yù)測。但是,已有準(zhǔn)確等待時間的車輛與當(dāng)前車輛之間存在一段距離,排隊(duì)號即為距離的長度。如果單純地用LSTM進(jìn)行預(yù)測,排隊(duì)中車輛的預(yù)測結(jié)果勢必會近似。所以我們將已叫號車輛的信息與當(dāng)前車輛實(shí)時信息相關(guān)聯(lián),使用LSTM模型從已叫號車輛的信息中獲得對現(xiàn)階段預(yù)測有幫助的先驗(yàn)知識,再利用Linear模型根據(jù)實(shí)時的廠內(nèi)外信息輸出對當(dāng)前車輛的預(yù)測結(jié)果。

圖5 LSTM-Linear組合模型示意圖

經(jīng)過多次調(diào)試,圖5展示了最終LSTM-Linear模型的結(jié)構(gòu)。首先我們將距離當(dāng)前車輛排隊(duì)開始時間最近的5輛同品種已被叫號的車分別進(jìn)行特征工程,生成表1所示的7維向量。最重要的是將這些車的真實(shí)等待時間與其特征向量拼接,形成8維的向量,之后將這5個8維向量按排隊(duì)開始時間順序拼接作為LSTM模型的輸入。設(shè)置LSTM模型時間步長為5(與輸入五輛車的時間序列保持一致),神經(jīng)元個數(shù)為10的單層網(wǎng)絡(luò)。之后將LSTM最后一個時間步的輸出與3個神經(jīng)元全連接,我們希望這3個神經(jīng)元能夠從歷史數(shù)據(jù)中帶來先驗(yàn)知識,最終的效果也佐證了這個觀點(diǎn)。接下來,生成當(dāng)前車輛的7維特征向量,并將先驗(yàn)知識與當(dāng)前車輛的特征拼接成10維向量,全連接至1個神經(jīng)元輸出作為預(yù)測結(jié)果。使用LSTM-Linear模型,我們將歷史數(shù)據(jù)中的信息與實(shí)時信息緊密結(jié)合,有效提升了預(yù)測精度。

4 實(shí)驗(yàn)

4.1 評價指標(biāo)

為了確定預(yù)測結(jié)果的精度,我們利用三個指標(biāo)來對預(yù)測結(jié)果進(jìn)行評估:誤差在半小時以內(nèi)占比(Error Of Half An Hour,EOHH)、誤差在一小時以內(nèi)占比(Error Of An Hour,EOH)、誤差在兩小時以內(nèi)占比(Error Of Two Hours,EOTH)。以EOHH為例,公式如下(I為指示函數(shù),N為總樣本數(shù)),EOH、EOTH類似。

4.2 實(shí)驗(yàn)數(shù)據(jù)、方法及結(jié)果

利用滑動窗口的方式,實(shí)驗(yàn)訓(xùn)練集選用鋼鐵物流信息平臺2019年7月25至2019年8月24日近18000條數(shù)據(jù),測試集選用2019年8月25至2019年8月30日的3104條數(shù)據(jù)。為了證明本文所提出的等待時間預(yù)測模型的有效性,與平臺現(xiàn)用方法(ridge回歸),KNN回歸[1],以及利用Auto-sklearn[15]訓(xùn)練出的模型進(jìn)行比較。Auto-sklearn作為現(xiàn)在流行的自動化機(jī)器學(xué)習(xí)方法,能夠自動的進(jìn)行模型篩選、超參數(shù)調(diào)節(jié)等工作。其中回歸模塊包含梯度提升決策樹、隨機(jī)森林、支持向量機(jī)、高斯過程等多種高效的回歸模型。利用Auto-sklearn,我們近似地將一般用于等待時間預(yù)測方法應(yīng)用到鋼鐵物流場景下。因?yàn)閺U鋼、煤炭、焦炭三個品類特性區(qū)別明顯,因此實(shí)驗(yàn)結(jié)果依據(jù)三個評價指標(biāo)在三個品類上進(jìn)行區(qū)分。

圖6中結(jié)果表明本文方法的預(yù)測精度在各個品類、各個評價指標(biāo)上明顯優(yōu)于平臺現(xiàn)用方法和KNN回歸,只在少部分指標(biāo)上略低于Auto-sklearn的方法。四種方法在煤炭的預(yù)測上精度都較高,因?yàn)槊禾康牡却龝r間大多在兩個小時以下,同時煤炭等待時間的數(shù)值較穩(wěn)定,所以相對比較容易預(yù)測,參考意義最大的EOHH指標(biāo)本文方法相比平臺現(xiàn)用方法有12.8%的提升。廢鋼的平均等待時間為5個多小時,由于數(shù)值波動較大,各個方法EOHH指標(biāo)較低,因?yàn)榘胄r的誤差只占5小時平均等待時間的10%,對于模型預(yù)測難度較大。但本文方法在三個指標(biāo)上相比現(xiàn)用方法分別有33.3%、51.6%、61.2%提升;相比于KNN回歸有50%、62.1%、64.6%的提升;相比于Auto-sklearn預(yù)測精度分別有9%、11.9%、9.7%的優(yōu)勢。焦炭平均等待時間大概4個小時,但數(shù)值波動很大,各個方法預(yù)測精度差距不大,但相比于平臺現(xiàn)用方法,本文方法在三項(xiàng)指標(biāo)上依舊有18.5%、21.7%、13.5%的提升。

通過分析,平臺現(xiàn)用方法由于僅使用單一線性模型導(dǎo)致預(yù)測精度較低。Auto-sklearn訓(xùn)練過擬合嚴(yán)重,鋼廠本身也缺少嚴(yán)格的規(guī)則,過擬合導(dǎo)致模型泛化能力變?nèi)酢R?guī)則的缺少也導(dǎo)致KNN回歸效果較差。本文方法針對不同品種定制化模型,同時LSTM-Linear模型將歷史數(shù)據(jù)中先驗(yàn)知識與實(shí)時信息相結(jié)合,利用線性模型輸出,減少過擬合,預(yù)測精度更高。

4.3 特征重要性

為了評估表1中的特征對等待時間預(yù)測的重要程度,我們在破碎廢鋼上進(jìn)行了實(shí)驗(yàn)。訓(xùn)練集為2019年7月25至2019年8月24日的1924條數(shù)據(jù),測試集為2019年8月25日至2019年8月30日的225條數(shù)據(jù),測試集的統(tǒng)計(jì)量見表2。

圖6 各個品類評價指標(biāo)結(jié)果

表2 破碎廢鋼測試集數(shù)據(jù)量及統(tǒng)計(jì)量

從破碎廢鋼的統(tǒng)計(jì)量看出,等待時間的分布離散程度高,標(biāo)準(zhǔn)差大,側(cè)面反映了預(yù)測的難度。我們把LSTM模型的輸出稱為先驗(yàn)知識,將表1中的特征及先驗(yàn)知識依次加入Linear模型,并對測試集進(jìn)行三個指標(biāo)的評估。

很明顯排隊(duì)號對等待時間起到了很大的影響,排隊(duì)號大小很大程度上決定了等待時間長短??梢哉J(rèn)為排隊(duì)號確定了卡車等待的基準(zhǔn)時間,其余表示廠房工作狀況的特征影響基準(zhǔn)時間的浮動。如果廠房內(nèi)效率高,等待時間在基準(zhǔn)時間的基礎(chǔ)上也會有所減小。同時,在加入先驗(yàn)知識之后,模型預(yù)測的精度明顯提升,說明LSTM模型確實(shí)能夠從歷史數(shù)據(jù)中帶來先驗(yàn)知識幫助現(xiàn)階段的預(yù)測。

表3 特征重要性

5 結(jié)語

鋼鐵物流復(fù)雜的業(yè)務(wù)邏輯使得準(zhǔn)確預(yù)測卡車排隊(duì)等待時間變得困難,也因?yàn)殇撹F物流的特殊性使得卡車等待時間預(yù)測區(qū)別于一般場景下的等待時間預(yù)測。本文詳細(xì)描述了鋼鐵物流原料運(yùn)輸車輛的業(yè)務(wù)流程和數(shù)據(jù)分析過程,并提出了一種基于LSTM-Linear組合時間預(yù)測模型。利用LSTM模型從歷史數(shù)據(jù)中獲得先驗(yàn)知識,再結(jié)合卡車實(shí)時信息通過Linear模型進(jìn)行高精度的預(yù)測。在日照鋼鐵集團(tuán)真實(shí)的場景下,本文方法的預(yù)測精度相比平臺現(xiàn)用方法、KNN回歸、Auto-sklearn自動構(gòu)建的模型優(yōu)勢明顯。更加精準(zhǔn)的等待時間提升了司機(jī)的滿意度,也有效減少了物流成本。

在以后的研究中,隨著物流信息平臺進(jìn)一步完善,我們可以獲得更多有用的信息,同時通過合理地選擇歷史數(shù)據(jù)訓(xùn)練模型,從而進(jìn)一步提高預(yù)測精度。

猜你喜歡
先驗(yàn)等待時間排隊(duì)
康德定言命令的演繹是一種先驗(yàn)演繹嗎?——論純粹知性與實(shí)踐理性在先天原則證成方面之異同
基于暗通道先驗(yàn)的單幅圖像去霧算法研究與實(shí)現(xiàn)
怎樣排隊(duì)
先驗(yàn)想象力在范疇先驗(yàn)演繹中的定位研究
你承受不起讓每個客戶都滿意
巧排隊(duì)列
三角龍排隊(duì)
先驗(yàn)的風(fēng)
顧客等待心理的十條原則
顧客等待心理的十條原則
玉树县| 邢台市| 福鼎市| 桓台县| 合肥市| 襄汾县| 措美县| 安图县| 连平县| 怀来县| 黄石市| 兴和县| 柘荣县| 稻城县| 商洛市| 高邑县| 厦门市| 武汉市| 卫辉市| 沂南县| 海林市| 务川| 惠水县| 蓝山县| 兴山县| 郸城县| 六安市| 特克斯县| 积石山| 古蔺县| 安吉县| 莎车县| 雷山县| 永济市| 晴隆县| 行唐县| 建宁县| 天等县| 达孜县| 金昌市| 谢通门县|