劉亮,祁思遠
(天津工業(yè)大學,天津 300387)
為實現(xiàn)制造業(yè)企業(yè)的拉動式生產(chǎn),制造商需要對產(chǎn)品的用戶需求有一定的把握。傳統(tǒng)供應鏈情況下,由經(jīng)銷商對使用定量訂貨法或者是定期訂貨法對制造商發(fā)起訂單。由于需求的不確定性,制造商經(jīng)常面臨緊急插單等生產(chǎn)量激增的情況和產(chǎn)能過剩需要租用倉庫來存儲貨物的情況。為了解決這一問題,使用用戶畫像的方法對潛在客戶進行挖掘,然后用AnyLogic仿真軟件對該地區(qū)的用戶需求做出預測,建立面向需求的供應鏈模型并根據(jù)反饋情況對該模型進行調(diào)整,來擬合用戶的實際需求,實現(xiàn)制造業(yè)企業(yè)的拉動式生產(chǎn),為創(chuàng)造零庫存、JIT的生產(chǎn)模式提供幫助。
影響用戶的購買力及需求的因素有很多,本文為了通過引入客戶畫像的概念對購買行為數(shù)據(jù)進行特征構(gòu)建,提取出能夠描述用戶購買行為的典型用戶畫像。
該研究是為了實現(xiàn)制造業(yè)企業(yè)的拉動式生產(chǎn)而對供應鏈的下游的用戶使用用戶畫像的方法進行需求預測,從而使工廠可以按需生產(chǎn)來消除倉儲的造成的不必要的空間浪費,同時也可以避免經(jīng)銷商所面臨的缺貨造成的時間問題。研究的需求拉動式供應鏈流程如圖1所示。
圖1 需求拉動式供應鏈流程圖
機器學習算法進行用戶畫像一般使用的算法有邏輯回歸、神經(jīng)網(wǎng)絡(luò)、決策樹、支持向量機。決策樹作為常用的機器學習模型,主要基于樹的結(jié)構(gòu)進行決策。
由于Cart決策樹模型具有選擇更加科學且運行效率更高的優(yōu)點,我們選擇使用該模型進行定量分析,用以尋找有需求的潛在用戶。
首先,對該地區(qū)人群的重要用戶標簽進行采集,該地區(qū)用戶的需求與許多因素有著密切聯(lián)系。主觀因素有工作收入和消費觀念兩個方面,其中工作收入方面包括收入、存款、公司服務(wù),消費觀念包括恩格爾系數(shù)和貸款。恩格爾系數(shù)表示食物的消費所占家庭消費的比例,貧困家庭恩格爾系數(shù)達95%以上,溫飽家庭50%到59%,小康家庭40%到50%,富裕家庭30%到40%,最富裕家庭低于30%。恩格爾系數(shù)的大小決定該用戶的購買力的強弱??陀^因素有經(jīng)濟條件和廣告推銷兩個方面,經(jīng)濟條件指的是當?shù)氐慕?jīng)濟條件,是否存在合理的工作時間,社會保險是否得到保障。廣告推銷對于消費者是否愿意購買該產(chǎn)品有著巨大的影響。基于以上因素繪制如圖2所示的用戶標簽信息圖。
圖2 用戶標簽信息圖
根據(jù)上述問題描述,定義以下變量及參數(shù),方便模型的理解。
(1)定義變量:假設(shè)給定數(shù)據(jù)集=(,),(,),…,(x,x),其中∈R為維特征向量,∈是連續(xù)型隨機變量,這是一個標準的回歸問題的數(shù)據(jù)集。若把每個屬性視為坐標空間中的一個坐標軸,則個個屬性就構(gòu)成了一個維的特征空間,而每個維維特征向量就就對應了維維的特征空間中的一個數(shù)據(jù)點。
(2)定義參數(shù):我們主要考慮到了主觀因素,假設(shè)用戶數(shù)據(jù)集
該模型構(gòu)建主要有兩步。第一步,生成對用戶標簽進行分類的分類決策樹,屬性選擇標準為基尼指數(shù),目的是生成最大信息量的決策樹;第二步,對生成的決策樹進行剪枝操作,通過驗證數(shù)據(jù)集中的數(shù)據(jù)從而選擇出最優(yōu)的子樹。
CART決策樹作為分類樹時,特征屬性可以是連續(xù)類型也可以是離散類型,但標簽屬性必須是離散類型。劃分的目的是為了能夠讓數(shù)據(jù)變純,使決策樹輸出的結(jié)果更接近真實值。
Step1:CART決策樹使用“基尼指數(shù)”來選擇劃分屬性,數(shù)據(jù)集的純度可以用基尼值來度量:
直觀來說,Gini()反映了從數(shù)據(jù)集中隨機抽取兩個樣本,其類別標記不一致的概率。因此,Gini()越小,則數(shù)據(jù)的純度越純。
Step2:對每個屬性的每個可能取值,將數(shù)據(jù)集分為=和≠兩部分來計算基尼指數(shù),即:
Step3:決策樹分層主要通過基尼指數(shù)進行判斷,選擇基尼指數(shù)最小的屬性及其對應取值作為最優(yōu)劃分屬性和最優(yōu)劃分點;即:
Step4:重復以上步驟,直至滿足停止條件。
Step5:對輸出的決策樹進行剪枝,選擇交叉驗證結(jié)果好的子樹序列作為最優(yōu)決策數(shù)。實現(xiàn)決策樹的泛化。
Step6:輸出最優(yōu)決策樹。
首先在模型建立之前對用戶及供應鏈做出以下假設(shè):
(1)通過用戶畫像的方法從人群中篩選潛在用戶,潛在用戶沒有購買該產(chǎn)品。
(2)消費者的社交時間即非工作時間和消費者的廣告觀看率會影響購買欲。
(3)不考慮市場中同類型產(chǎn)品競爭的影響。
(4)零售商是消費者唯一購買產(chǎn)品的途徑,零售商初始庫存不為零。當零售商庫存低于最小庫存量時會向經(jīng)銷商發(fā)出訂貨申請。
(5)制造商每日所能生產(chǎn)的產(chǎn)品數(shù)量是固定值。
(6)制造商收到訂貨訂單后會檢查庫存,當庫存足夠時,產(chǎn)品從制造商向零售商運輸,該過程存在一定的延遲。
在AnyLogic仿真軟件中建立基于系統(tǒng)動力學的產(chǎn)品供應鏈仿真模型。通過用戶畫像篩選出來的潛在用戶會在一些客觀因素的影響下轉(zhuǎn)變?yōu)橄M者,其中比較重要的兩個因素是廣告和非工作時間進行的社交活動。該產(chǎn)品的用戶會在社交活動中影響潛在消費者,使其成為該產(chǎn)品的用戶。同時用戶在消耗完該產(chǎn)品后會繼續(xù)購買該產(chǎn)品。假設(shè)該產(chǎn)品的潛在用戶是5萬人,建立系統(tǒng)動力學模型如圖3所示。
圖3 系統(tǒng)動力學模型
該系統(tǒng)動力學模型的參數(shù)設(shè)置如表1所示。
在AnyLogic仿真軟件中分別添加三個單個智能體分別為:零售商(Retailer)、經(jīng)銷商(Wholesaler)、制造商(Factory)。在該供應鏈仿真模型如圖4所示。
由表1可知,處方3的基質(zhì)種類配伍較為理想,即油相為油酸聚乙二醇甘油酯,乳化劑為聚氧乙烯氫化蓖麻油,助乳化劑為二乙二醇單乙基醚,此時所得的自微乳外觀澄清、透明,滴入水相中呈現(xiàn)出微泛淡藍色乳光。
首先,在零售商中設(shè)置最大最小的庫存值,設(shè)置函數(shù)定期檢查庫存量,當庫存低于最小庫存值時,零售商會向上級經(jīng)銷商提出訂單,經(jīng)銷商會在一定的期限內(nèi)將產(chǎn)品送到零售商,當潛在消費者或使用者產(chǎn)生需求時,會從零售商處購買產(chǎn)品然后轉(zhuǎn)為使用者。
圖4 基于Agent供應鏈仿真模型
表1 系統(tǒng)動力 學模型參數(shù)設(shè)置
同理,在經(jīng)銷商中同樣也設(shè)置了最大最小庫存值,通過函數(shù)定期檢查庫存量,當庫存低于最小庫存量時,經(jīng)銷商會向制造商提出訂單,制造商檢查自己的庫存后會在一定的期限內(nèi)將產(chǎn)品送到經(jīng)銷商。制造商會每天定量生產(chǎn)產(chǎn)品,生產(chǎn)的產(chǎn)品會存入工廠的倉庫中,當沒有訂單或者庫存已滿時會停止生產(chǎn)。
運行建立好的模型,仿真結(jié)果如圖5所示。
由仿真結(jié)果分析可得:
(1)針對潛在消費者與使用者關(guān)系的分析。隨著時間的變換,可以看到潛在消費者逐漸減少,使用者逐漸增加并達到一個頂峰。經(jīng)過一段時間后,潛在消費者逐漸轉(zhuǎn)變?yōu)橛脩?,對該產(chǎn)品的需求從最初不穩(wěn)定轉(zhuǎn)變?yōu)榱朔€(wěn)定的需求。表示該市場的用戶需求已經(jīng)飽和,沒有繼續(xù)增加需求的空間。
在以定量訂貨為訂貨方法的供應鏈中訂貨的時機存在一定的滯后性。該模型可以對供應鏈中的各級需求做出預測,盡可能地減小所需的庫存量,為實現(xiàn)JIT生產(chǎn)提供幫助。
圖5 仿真結(jié)果
本文建立Cart決策樹模型對用戶畫像進行構(gòu)建,決策樹算法主要有ID3、CRT、C4.5以及C5.0。其中CRT算法是在ID3上進行優(yōu)化。其優(yōu)勢主要在于最優(yōu)屬性選擇更加科學且運行效率更高。然后,本文使用Python代碼分別計算離散屬性和連續(xù)屬性的基尼指數(shù),根據(jù)基尼指數(shù)選擇最佳劃分點,然后根據(jù)固定形式的字典生成決策樹。使用AnyLogic仿真軟件對供應鏈上下游進行仿真模擬,為建立面向用戶需求的供應鏈提供參考。本文中的方法有一定的可行性,在該案例中有較好的表現(xiàn)。
本文目前僅考慮一種產(chǎn)品和用戶之間的供需關(guān)系,該研究工作中還存在諸多不足之處,之后需要根據(jù)實際制造供應鏈系統(tǒng)中存在更為復雜的多對多供需關(guān)系來完善所構(gòu)建的供應鏈優(yōu)化模型。