国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于聯(lián)邦學(xué)習(xí)的電子商務(wù)企業(yè)物流服務(wù)商選擇研究

2023-03-12 06:55王志惠傅德謙臨沂大學(xué)信息科學(xué)與工程學(xué)院山東臨沂276000
物流科技 2023年5期
關(guān)鍵詞:服務(wù)商決策樹(shù)加密

王志惠,傅德謙(臨沂大學(xué) 信息科學(xué)與工程學(xué)院,山東 臨沂 276000)

0 引言

隨著電子商務(wù)的蓬勃發(fā)展和物流服務(wù)商的逐年增多,電商平臺(tái)對(duì)于物流服務(wù)商的選擇也逐漸有了更高的要求。據(jù)中華人民共和國(guó)國(guó)家郵政局統(tǒng)計(jì),2021 年,全國(guó)物流服務(wù)企業(yè)在中國(guó)交付累計(jì)完成量為1 083 億件,同比增長(zhǎng)了29.9%;交易規(guī)模達(dá)10 332.3 億元,同比增長(zhǎng)了17.5%;物流服務(wù)總體滿意度為76.8 分[1]。對(duì)于物流服務(wù)商的選擇,電商企業(yè)的訴求體現(xiàn)在成本低、貨物安全、易追蹤、速度快、服務(wù)質(zhì)量高等方面;消費(fèi)者希望速度快、服務(wù)好、貨物無(wú)破損。若物流服務(wù)商選擇不當(dāng),容易出現(xiàn)服務(wù)質(zhì)量差、運(yùn)輸費(fèi)用高、運(yùn)輸時(shí)間長(zhǎng)等情況,影響消費(fèi)者的購(gòu)物體驗(yàn)和后續(xù)的購(gòu)買行為,進(jìn)而制約電商企業(yè)的發(fā)展[2-3]。隨著訂單量的逐年大幅增加,這些需求表現(xiàn)得更為迫切。信息系統(tǒng)的應(yīng)用與普及可以極大節(jié)約電商企業(yè)與物流企業(yè)的信息共享成本,并有助于促進(jìn)其合作關(guān)系[4]。各企業(yè)應(yīng)充分利用大數(shù)據(jù)技術(shù)促進(jìn)企業(yè)間的信息共享,進(jìn)而提升物流服務(wù)質(zhì)量和效率。然而由于現(xiàn)代社會(huì)更加重視個(gè)人、企業(yè)數(shù)據(jù)的隱私保護(hù)問(wèn)題,國(guó)內(nèi)外的數(shù)據(jù)監(jiān)管法律也日趨嚴(yán)格[5]。例如2017 年6 月,中國(guó)提出的《中華人民共和國(guó)網(wǎng)絡(luò)安全法》針對(duì)數(shù)據(jù)收集與處理提出約束和要求;美國(guó)在2020 年1 月正式生效的《加利福尼亞州消費(fèi)者隱私法》(California Consumer Privacy Act,CCPA)[6]。針對(duì)此現(xiàn)象,宮曉曼[7]提出了一種在云計(jì)算環(huán)境中挖掘物流歷史數(shù)據(jù)尋找最優(yōu)物流服務(wù)商的方法;Cao K 等[8]將線下企業(yè)、電商平臺(tái)與物流服務(wù)商考慮為一個(gè)市場(chǎng),基于此開(kāi)發(fā)NE、Y、YT 三個(gè)理論模型,通過(guò)模型指導(dǎo)企業(yè)確定最優(yōu)物流服務(wù)商。在實(shí)際場(chǎng)景中,物流數(shù)據(jù)分散存儲(chǔ),具有隱私性強(qiáng)、多源異構(gòu)、可用性低等特征。因此,聯(lián)邦學(xué)習(xí)(Federated Learning,F(xiàn)L)是保護(hù)數(shù)據(jù)隱私的同時(shí)解決數(shù)據(jù)孤島問(wèn)題的有效方式[9]。聯(lián)邦學(xué)習(xí)是谷歌實(shí)驗(yàn)室提出來(lái)的一種用于保護(hù)數(shù)據(jù)隱私的機(jī)器學(xué)習(xí)框架[10]??蛻艨梢栽诒镜赜?xùn)練模型,在不違反數(shù)據(jù)隱私的情況下根據(jù)本地模型更新共同訓(xùn)練一個(gè)全局模型[11-12]。在對(duì)數(shù)據(jù)隱私要求高且存在數(shù)據(jù)孤島問(wèn)題的物流服務(wù)商選擇場(chǎng)景中,聯(lián)邦學(xué)習(xí)有著天然的適配性。

綜上所述,本文研究分布式環(huán)境下實(shí)現(xiàn)多源數(shù)據(jù)聯(lián)合建模選取最優(yōu)物流服務(wù)商的方法。本文主要工作如下:(1)構(gòu)建物流服務(wù)商選擇層次化架構(gòu),在保護(hù)數(shù)據(jù)隱私的前提下,實(shí)現(xiàn)聯(lián)邦學(xué)習(xí)模型的應(yīng)用;(2)針對(duì)物流數(shù)據(jù)差異化問(wèn)題提出了一種訓(xùn)練數(shù)據(jù)標(biāo)準(zhǔn)化處理方法;(3)利用差分隱私算法改進(jìn)Secureboost 算法,提高了模型訓(xùn)練效率;(4)采用生成模擬數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn),驗(yàn)證方法的安全性和可行性。

1 物流服務(wù)商選擇層次化架構(gòu)

為實(shí)現(xiàn)聯(lián)合多方物流數(shù)據(jù)進(jìn)行最優(yōu)物流服務(wù)商的選擇,本文設(shè)計(jì)了基于聯(lián)邦學(xué)習(xí)的物流服務(wù)商選擇層次化架構(gòu)。如圖1 所示,分別由數(shù)據(jù)準(zhǔn)備層、樣本數(shù)據(jù)對(duì)齊層、聯(lián)邦學(xué)習(xí)訓(xùn)練層、模型應(yīng)用層4 部分組成。

圖1 物流服務(wù)商選擇層次化架構(gòu)

1.1 數(shù)據(jù)準(zhǔn)備層

物流數(shù)據(jù)具有可用性低及標(biāo)準(zhǔn)化水平不高的特點(diǎn),為提高物流數(shù)據(jù)質(zhì)量和模型訓(xùn)練效率,數(shù)據(jù)準(zhǔn)備層可以為模型提供高質(zhì)量數(shù)據(jù)。因此,本文在數(shù)據(jù)準(zhǔn)備層采用數(shù)據(jù)清洗、數(shù)據(jù)分箱、特征篩選、訓(xùn)練數(shù)據(jù)標(biāo)準(zhǔn)化等操作處理訓(xùn)練數(shù)據(jù)。本文參照相關(guān)文獻(xiàn),在前人研究的指標(biāo)體系基礎(chǔ)上從歷史數(shù)據(jù)中篩選出具體指標(biāo)數(shù)據(jù)用作樣本數(shù)據(jù)。針對(duì)物流數(shù)據(jù)特征指標(biāo)衡量單位和標(biāo)準(zhǔn)不同造成數(shù)據(jù)差異化大的問(wèn)題,本文采用Simple Additive Weighting(SAW)方法根據(jù)參數(shù)的實(shí)際意義做訓(xùn)練數(shù)據(jù)標(biāo)準(zhǔn)化處理。其中,公式(1)對(duì)正向參數(shù)做標(biāo)準(zhǔn)化處理,公式(2)對(duì)反向參數(shù)做標(biāo)準(zhǔn)化處理。正向參數(shù)是指對(duì)用戶來(lái)說(shuō)越大越好的參數(shù),比如破損賠付數(shù)額;反向參數(shù)則是指對(duì)用戶來(lái)說(shuō)越小越好的參數(shù),比如首重與續(xù)重價(jià)格。其他參數(shù)則采用Z-score 標(biāo)準(zhǔn)化方法做訓(xùn)練數(shù)據(jù)標(biāo)準(zhǔn)化處理,采用把數(shù)據(jù)處理成符合標(biāo)準(zhǔn)正態(tài)分布的數(shù)據(jù)。其中是一列數(shù)據(jù)的均值,ρ是一列數(shù)據(jù)的標(biāo)準(zhǔn)差。

1.2 樣本數(shù)據(jù)對(duì)齊層

物流場(chǎng)景中數(shù)據(jù)分布式存儲(chǔ),物流供應(yīng)鏈包括電商企業(yè)、物流企業(yè)、倉(cāng)儲(chǔ)企業(yè)、運(yùn)輸企業(yè)等。樣本數(shù)據(jù)對(duì)齊層可以在各參與方建模前使用加密技術(shù)根據(jù)ID 對(duì)齊各方樣本數(shù)據(jù),提取出共有ID 的訓(xùn)練樣本數(shù)據(jù)。本文采用RSA 非對(duì)稱加密算法和哈希機(jī)制的方案來(lái)對(duì)齊各方共有數(shù)據(jù)。

1.3 聯(lián)邦學(xué)習(xí)訓(xùn)練層

在聯(lián)邦學(xué)習(xí)訓(xùn)練層采用加密模型參數(shù)傳輸方式聯(lián)合多方數(shù)據(jù)訓(xùn)練模型。本文采用安全聯(lián)邦決策樹(shù)模型訓(xùn)練出最優(yōu)劃分的決策樹(shù)模型,構(gòu)建物流服務(wù)商選擇樹(shù)。為保障用戶隱私和數(shù)據(jù)安全,引入可信第三方(政府、可信第三方企業(yè))利用隱私保護(hù)技術(shù)加解密并協(xié)調(diào)訓(xùn)練模型。

1.4 模型應(yīng)用層

訓(xùn)練完成的模型可以通過(guò)封裝接口用于電商企業(yè)的物流服務(wù)商選擇應(yīng)用中。模型應(yīng)用層為電商企業(yè)提供模型應(yīng)用接口,通過(guò)此層將符合用戶選取指標(biāo)要求的預(yù)測(cè)結(jié)果傳到用戶端,為電商企業(yè)提供最優(yōu)物流服務(wù)商。

2 物流服務(wù)商選擇模型與算法

2.1 模型整體架構(gòu)

本文設(shè)定的選擇模型整體架構(gòu)如圖2 所示,分別由m 個(gè)企業(yè)客戶端和1 個(gè)中心服務(wù)器組成。其中,客戶端由m 個(gè)物流供應(yīng)鏈上的企業(yè)組成,各企業(yè)間具有大致相同的物流訂單ID 索引。中心服務(wù)器是一個(gè)可信第三方(例如政府機(jī)構(gòu)、安全數(shù)據(jù)共享機(jī)構(gòu))。為提高訓(xùn)練過(guò)程中的通信效率,本文對(duì)安全聯(lián)邦決策樹(shù)做了分析和改進(jìn),采用了差分隱私的思想加密傳輸聚合梯度值。在建模任務(wù)中,參與聯(lián)合建模的企業(yè)方分為主動(dòng)方和被動(dòng)方。主動(dòng)方提供的用戶數(shù)據(jù)內(nèi)包含標(biāo)簽值,其擔(dān)任數(shù)據(jù)對(duì)齊的主要任務(wù)并主導(dǎo)服務(wù)器完成模型訓(xùn)練。被動(dòng)方僅提供用戶的樣本數(shù)據(jù),與主動(dòng)方協(xié)作完成模型訓(xùn)練任務(wù)。完整訓(xùn)練流程如下。

圖2 模型的整體架構(gòu)

步驟1:中心服務(wù)器生成密鑰對(duì),并將公鑰發(fā)送至各企業(yè)。其中,公鑰用于發(fā)送至各參與方加密傳輸梯度值,私鑰用于解密接收到的密文。

步驟2:各企業(yè)以RSA 非對(duì)稱加密算法和哈希機(jī)制的加密方案實(shí)現(xiàn)樣本對(duì)齊,提取各企業(yè)共同物流訂單ID 的樣本數(shù)據(jù)。

步驟3:各企業(yè)使用對(duì)齊后的本地?cái)?shù)據(jù)訓(xùn)練模型,以加密交換的方式計(jì)算各方本地模型的梯度與損失,實(shí)現(xiàn)模型的加密聯(lián)合訓(xùn)練。

步驟4:各企業(yè)將本地模型的梯度值和損失加密發(fā)送至中心服務(wù)器。

步驟5:中心服務(wù)器將密文解密獲得最終梯度信息,將梯度信息發(fā)送至各企業(yè)以更新本地模型參數(shù)。

2.2 物流服務(wù)商選擇算法

對(duì)各企業(yè)數(shù)據(jù)集X={x1,x2,…,xn}使用K 個(gè)回歸樹(shù)進(jìn)行決策樹(shù)模型的訓(xùn)練。為防止模型出現(xiàn)過(guò)擬合,引入正則項(xiàng)來(lái)控制模型的復(fù)雜度。則設(shè)定最優(yōu)決策樹(shù)算法目標(biāo)函數(shù)為損失函數(shù)與正則項(xiàng)之和,以最小化損失為模型訓(xùn)練目標(biāo)。當(dāng)目標(biāo)函數(shù)訓(xùn)練到第t 輪時(shí),前t-1 輪的模型結(jié)果和復(fù)雜度都已確定,則第t 輪的預(yù)測(cè)值可以表示為。可得第t 輪模型目標(biāo)函數(shù)為:

此時(shí)由主動(dòng)方計(jì)算出gi和hi,使用差分隱私的思想加密傳輸梯度信息到每個(gè)參與任務(wù)訓(xùn)練的被動(dòng)方。本文設(shè)定目標(biāo)函數(shù)的正則項(xiàng)函數(shù)為其中:O 表示復(fù)雜度參數(shù)、Ln表示樹(shù)的葉子節(jié)點(diǎn)數(shù)、Lw表示葉子節(jié)點(diǎn)的權(quán)重值、w 表示懲罰度參數(shù)。將正則項(xiàng)函數(shù)帶入目標(biāo)函數(shù)為:

其中:O、Lw、gi、hi都為已知數(shù),wj是未知數(shù),Ij表示可落在相同葉子節(jié)點(diǎn)j 的樣本空間。算法以此過(guò)程迭代出每棵決策樹(shù),完成決策樹(shù)構(gòu)建后,按照一元二次函數(shù)求最優(yōu)解的過(guò)程,采用公式(6)計(jì)算葉子節(jié)點(diǎn)j 的最優(yōu)權(quán)重w:

將最優(yōu)權(quán)重wj代回目標(biāo)函數(shù)可得:

決策樹(shù)的劃分優(yōu)略是由劃分增益Gain 得到的,單節(jié)點(diǎn)分裂過(guò)程計(jì)算公式如公式(8)所示:

設(shè)定樣本空間I 每次劃分為兩個(gè)不相交的左右節(jié)點(diǎn)的樣本空間IL和IR,即當(dāng)前節(jié)點(diǎn)的樣本空間表示為I=IL+IR。則構(gòu)建最優(yōu)決策樹(shù)需要最大化節(jié)點(diǎn)分裂前后間的差值,可得最優(yōu)劃分為:

其中采用差分隱私的加密方式實(shí)現(xiàn)企業(yè)間模型梯度信息的加密與傳輸。主動(dòng)方計(jì)算出gi和hi,將原梯度值與隨機(jī)浮點(diǎn)數(shù)的乘積傳輸?shù)奖粍?dòng)方。最后解密時(shí)只需除以加密時(shí)的隨機(jī)浮點(diǎn)數(shù)即可。同態(tài)加密方式密文為256 字節(jié),加密過(guò)程和傳輸過(guò)程需要消耗大量的資源成本。相比同態(tài)加密,差分隱私采用的浮點(diǎn)數(shù)僅占8 字節(jié),其計(jì)算和通信的效率有較大提升。

3 實(shí)驗(yàn)與分析

本文采用個(gè)人生成的模擬物流數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn),各物流供應(yīng)鏈企業(yè)數(shù)據(jù)集指標(biāo)詳細(xì)信息如表1 所示:

表1 物流供應(yīng)鏈企業(yè)數(shù)據(jù)集指標(biāo)

現(xiàn)假設(shè)某電商平臺(tái)與多家物流企業(yè)具有合作關(guān)系,并且每家物流企業(yè)又與不同倉(cāng)儲(chǔ)企業(yè)和運(yùn)輸企業(yè)具有合作關(guān)系。各企業(yè)數(shù)據(jù)存儲(chǔ)在本地且指標(biāo)眾多,為實(shí)現(xiàn)最優(yōu)物流服務(wù)商選擇模型的構(gòu)建,篩選出各企業(yè)的關(guān)鍵指標(biāo)。在對(duì)齊樣本中隨機(jī)抽選每個(gè)物流企業(yè)的各一條數(shù)據(jù),如表2 所示:

表2 物流服務(wù)商歷史數(shù)據(jù)

根據(jù)訓(xùn)練數(shù)據(jù)標(biāo)準(zhǔn)化處理的設(shè)定對(duì)歷史數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。標(biāo)準(zhǔn)化后的數(shù)據(jù)如表3 所示:

表3 標(biāo)準(zhǔn)化后的物流服務(wù)商歷史數(shù)據(jù)

本文仿真實(shí)驗(yàn)設(shè)置由三個(gè)分布式數(shù)據(jù)源,分別是物流企業(yè)C1、倉(cāng)儲(chǔ)企業(yè)C2、運(yùn)輸企業(yè)C3,數(shù)據(jù)集詳細(xì)情況如表1 所示。實(shí)驗(yàn)環(huán)境配置如下:系統(tǒng)使用CentOS 7.6.1810;CPU 為2 個(gè)4 核Intel(R)Core(TM)i5-9300HF CPU@2.40GHz;32G 內(nèi)存;Python 版本3.8。實(shí)驗(yàn)參數(shù)設(shè)置學(xué)習(xí)率為0.1,樹(shù)最大深度為10,最大桶數(shù)量為50,正則項(xiàng)系數(shù)為0.1。實(shí)驗(yàn)以AUC 值和KS 值作為模型評(píng)價(jià)指標(biāo),分別在訓(xùn)練集和驗(yàn)證集上做性能測(cè)試。實(shí)驗(yàn)以模型損失值和訓(xùn)練時(shí)間驗(yàn)證模型訓(xùn)練效率,采用差分隱私算法和同態(tài)加密算法對(duì)標(biāo)準(zhǔn)化處理后的數(shù)據(jù)進(jìn)行模型訓(xùn)練。對(duì)每次實(shí)驗(yàn)分別進(jìn)行5 次獨(dú)立的重復(fù)實(shí)驗(yàn)取平均實(shí)驗(yàn)結(jié)果,仿真實(shí)驗(yàn)結(jié)果如圖3 至圖6 所示。

圖3 模型AUC

圖4 模型KS

圖5 模型損失

圖6 模型訓(xùn)練時(shí)間

從實(shí)驗(yàn)結(jié)果可以看出,模型在迭代了10 輪次時(shí),在數(shù)據(jù)集上的AUC 值和KS 值接近1,表明模型準(zhǔn)確率較高,且具有較強(qiáng)的風(fēng)險(xiǎn)區(qū)分能力。同時(shí),模型在經(jīng)過(guò)25 輪迭代后,該算法總耗時(shí)292s,同態(tài)加密算法總體花費(fèi)438s,模型訓(xùn)練效率可以提升50%左右。實(shí)驗(yàn)結(jié)果表明了該方法可以在保護(hù)數(shù)據(jù)隱私的前提下快速提供科學(xué)決策。

4 總結(jié)

在電商活動(dòng)中,科學(xué)地選擇合適的物流服務(wù)商具有重要意義。本文針對(duì)分布式環(huán)境中如何通過(guò)歷史物流數(shù)據(jù)科學(xué)選取最優(yōu)物流服務(wù)商的問(wèn)題展開(kāi)研究。本文構(gòu)建了一種物流服務(wù)商選擇層次化架構(gòu),該架構(gòu)通過(guò)多環(huán)節(jié)實(shí)現(xiàn)模型應(yīng)用,為解決數(shù)據(jù)差異化問(wèn)題提出了一種訓(xùn)練數(shù)據(jù)標(biāo)準(zhǔn)化方法,同時(shí)引入差分隱私算法改進(jìn)訓(xùn)練模型,提高了模型的訓(xùn)練效率。最后,通過(guò)模擬數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn),驗(yàn)證了該方法的安全性和可行性。在未來(lái)工作中考慮完善指標(biāo)選擇體系,為最優(yōu)物流服務(wù)商的選擇提供更科學(xué)的決策方案。

猜你喜歡
服務(wù)商決策樹(shù)加密
航天衛(wèi)星領(lǐng)域?qū)I(yè)服務(wù)商
論IaaS云服務(wù)商的著作權(quán)侵權(quán)責(zé)任
一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹(shù)算法
一種基于熵的混沌加密小波變換水印算法
決策樹(shù)和隨機(jī)森林方法在管理決策中的應(yīng)用
基于決策樹(shù)的出租車乘客出行目的識(shí)別
認(rèn)證加密的研究進(jìn)展
基于肺癌CT的決策樹(shù)模型在肺癌診斷中的應(yīng)用
基于ECC加密的電子商務(wù)系統(tǒng)
期刊展示宣傳服務(wù)商
营口市| 西乌珠穆沁旗| 惠州市| 土默特右旗| 临朐县| 台前县| 牡丹江市| 利津县| 辽中县| 九龙坡区| 靖江市| 岳阳市| 彭阳县| 威海市| 江门市| 定结县| 多伦县| 奉贤区| 衡东县| 清远市| 宁陵县| 缙云县| 综艺| 岫岩| 三江| 普宁市| 东宁县| 内丘县| 巫山县| 武川县| 神农架林区| 英德市| 张北县| 孟州市| 探索| 外汇| 泰兴市| 鲁山县| 永川市| 深圳市| 增城市|