賴祥宇
(西南交通大學(xué)計(jì)算機(jī)與人工智能學(xué)院,成都 610031)
隨著云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)等新一代信息科學(xué)技術(shù)產(chǎn)業(yè)的創(chuàng)新發(fā)展,整個(gè)現(xiàn)代科技服務(wù)業(yè)的生態(tài)體系處于不斷進(jìn)化的過程中。由專業(yè)科技服務(wù)和綜合科技服務(wù)構(gòu)成科技服務(wù)解決方案也在現(xiàn)代產(chǎn)業(yè)中展現(xiàn)出愈發(fā)重要的地位[1]。綜合科技服務(wù)云平臺(tái)是國內(nèi)領(lǐng)先的科技服務(wù)平臺(tái),它顛覆了傳統(tǒng)供應(yīng)鏈的線性協(xié)作關(guān)系,為客戶提供極具創(chuàng)新型的科技服務(wù),能夠有效降低應(yīng)用企業(yè)的經(jīng)營成本、顯著提升企業(yè)的管理水平和決策分析能力,達(dá)到增加企業(yè)經(jīng)濟(jì)效益的目的。
在傳統(tǒng)的服務(wù)生產(chǎn)模式下,科技服務(wù)交易大多以單純?cè)紨?shù)據(jù)“粗加工”為主,數(shù)據(jù)挖掘預(yù)測(cè)、決策支持等服務(wù)的交易并未大規(guī)模展開,數(shù)據(jù)資源自身價(jià)值體現(xiàn)不明顯[2]。隨著基于資源池的服務(wù)交易技術(shù)的成熟和合作生產(chǎn)模式的形成,科技服務(wù)云平臺(tái)使以上問題進(jìn)行了改善,并且在利用資源池整合多個(gè)資源提供方的科技資源的基礎(chǔ)上,有效解決了從服務(wù)產(chǎn)品的篩選檢索、價(jià)格談判、簽約支付到實(shí)施驗(yàn)收、售后咨詢等整個(gè)流程上的效率和管理問題[3]。研究和建立科學(xué)的、符合實(shí)際的收益分配策略,無論是對(duì)于平臺(tái)還是資源提供方,都具有極為重要的現(xiàn)實(shí)意義。
對(duì)于合作生產(chǎn)模式下的收益分配問題,目前存在一些相關(guān)研究成果。如陳偉斌等人主要采用DELPHI法和AHP方法確定影響分配的指標(biāo)權(quán)重,創(chuàng)建了基于集值統(tǒng)計(jì)的收益分成率計(jì)算方法[4]。李軍主要在Shapley值模型的基礎(chǔ)上,綜合考慮了創(chuàng)新資源投入、創(chuàng)新創(chuàng)造收益和創(chuàng)新承擔(dān)風(fēng)險(xiǎn)等因素,使用AHP方法對(duì)模型進(jìn)行了改進(jìn)[5],優(yōu)化了協(xié)同創(chuàng)新聯(lián)盟的利益分配問題。孫紅霞等人引入三角模糊數(shù)將市場(chǎng)需求函數(shù)和企業(yè)單位成本模糊化,用模糊Shapley值在各局中人之間分配優(yōu)先聯(lián)盟在競(jìng)爭(zhēng)中取得的最優(yōu)模糊利潤[6]。金明華等人在各主體的合作程度、承擔(dān)風(fēng)險(xiǎn)以及技術(shù)創(chuàng)新能力等方面上進(jìn)行思考,運(yùn)用Delphi-AHP相結(jié)合方法,建立影響利益分配的指標(biāo)體系,通過改進(jìn)Shapley值法對(duì)產(chǎn)業(yè)鏈主體利益分配問題做出了解析[7],并證明了各主體在合作交易模式下取得更多的收益。
前人的研究成果主要具有以下特點(diǎn):一是現(xiàn)有模型絕大多數(shù)是在Shapley值模型的基礎(chǔ)上,采用AHP法進(jìn)行改進(jìn),更偏重于定性分析,效果難以滿足日益增長的企業(yè)需求;二是現(xiàn)有的研究對(duì)象主要是針對(duì)實(shí)體經(jīng)濟(jì)聯(lián)盟的,即使采用定量的分配研究方法仍可能存在人為主觀因素。綜上所述,本文開展了基于資源池的合作生產(chǎn)模式下的科技服務(wù)收益分配研究,以網(wǎng)絡(luò)平臺(tái)的資源交易數(shù)據(jù)為支撐,通過人工智能方式確定各成員的資源價(jià)值投入,并對(duì)Shapley值模型進(jìn)行改進(jìn),以實(shí)現(xiàn)對(duì)平臺(tái)資源供方收益的科學(xué)合理分配。
科技服務(wù)是云平臺(tái)的資源池中的各類科技資源在融合處理后所形成的一種高品質(zhì)服務(wù),因此各資源供方的資源價(jià)值投入是保證聯(lián)盟收益分配公平性的一個(gè)主要因素之一。各資源供方企業(yè)由于其投入資源的特質(zhì)因素和市場(chǎng)因素等方面的不同,導(dǎo)致了其對(duì)于用戶使用的價(jià)值也存在差異化,每個(gè)聯(lián)盟成員都有權(quán)利根據(jù)自身資源價(jià)值的投入來獲取對(duì)等的回報(bào)。
在綜合科技服務(wù)云平臺(tái)歷史運(yùn)行經(jīng)驗(yàn)的基礎(chǔ)上,考慮到各影響因素的使用頻率和相關(guān)變量的可獲得性,本文基于資源的視角,將各資源供方的資源價(jià)值投入作為其收益分配方案的主要影響因素,首先采用GA-BP神經(jīng)網(wǎng)絡(luò)對(duì)其投入的資源價(jià)值進(jìn)行評(píng)估,并在此基礎(chǔ)上展開進(jìn)一步研究。
BP神經(jīng)網(wǎng)絡(luò)算法是Rumelhart于1985年在誤差反向傳播理論的基礎(chǔ)上提出的學(xué)習(xí)算法,它構(gòu)建于多層前饋網(wǎng)絡(luò)的基礎(chǔ)上,由輸入層、輸出層和隱藏層組成,具備強(qiáng)大的數(shù)據(jù)識(shí)別能力和模擬能力,在解決非線性系統(tǒng)問題上具有明顯優(yōu)勢(shì)[8]。然而,隨著其應(yīng)用和普及的不斷深入,其自身存在的缺點(diǎn)也逐漸暴露,主要表現(xiàn)為學(xué)習(xí)過程中誤差收斂速度慢、容易陷入局部最優(yōu)等[9]。
遺傳算法(genetic algorithms,GA)是一種模擬生物在自然環(huán)境中的遺傳和進(jìn)化過程而形成的自適應(yīng)全局優(yōu)化概率搜索算法,它遵循優(yōu)勝劣汰、適者生存的原則,通過選擇、交叉、變異三個(gè)基本遺傳算子保留適應(yīng)能力強(qiáng)的最優(yōu)個(gè)體,從而在全局搜索下尋找到最優(yōu)解[10]。
由于BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值一般都設(shè)定為某個(gè)范圍內(nèi)的隨機(jī)值,該值選取的不當(dāng),往往是導(dǎo)致網(wǎng)絡(luò)學(xué)習(xí)時(shí)間過長、陷入局部最優(yōu)而非全局最優(yōu)的主要原因。而遺傳算法的全局尋優(yōu)能力正是很好地彌補(bǔ)了這點(diǎn),因此,將遺傳算法與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合,通過遺傳算法來優(yōu)化網(wǎng)絡(luò)隱藏層、輸出層閾值以及輸入層與隱藏層、隱藏層與輸出層連接權(quán)值,使得它們更加逼近全局最優(yōu)的初始值,可以得到更好的擬合效果。
本文以評(píng)估合作聯(lián)盟中各資源供方所提供的資源價(jià)值為目標(biāo),通過以下步驟建立基于GA-BP神經(jīng)網(wǎng)絡(luò)的價(jià)值評(píng)估模型[11-12]:
(1)根據(jù)相關(guān)文獻(xiàn)閱讀和專家咨詢,并結(jié)合平臺(tái)可獲得資源數(shù)據(jù)的方式,將影響資源價(jià)值的因素歸納為6類指標(biāo)[13-14],其具體描述如表1所示。
表1 資源價(jià)值影響指標(biāo)描述
續(xù)表1
將采集到的資源數(shù)據(jù)進(jìn)行清洗篩選,劃分訓(xùn)練集和測(cè)試集,并對(duì)輸入輸出指標(biāo)作歸一化處理。
(2)初始化BP神經(jīng)網(wǎng)絡(luò)的輸入層、輸出層、隱藏層節(jié)點(diǎn)個(gè)數(shù)、學(xué)習(xí)率、迭代次數(shù)以及訓(xùn)練目標(biāo)最小誤差等參數(shù),以確定網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)。
(3)定義遺傳算法所需參數(shù),包括種群個(gè)體數(shù)、代溝、最大遺傳代數(shù)、交叉概率、變異概率等。
(4)以二進(jìn)制編碼的形式初始化種群,將其作為BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值。
(5)將訓(xùn)練后網(wǎng)絡(luò)獲得的測(cè)試樣本的誤差作為適應(yīng)度函數(shù),適應(yīng)度越小的個(gè)體越為優(yōu)秀。
(6)在未達(dá)到最大遺傳代數(shù)前,根據(jù)優(yōu)勝劣汰的原則選擇適應(yīng)性更優(yōu)的個(gè)體進(jìn)行保留,并對(duì)這些個(gè)體進(jìn)行交叉、變異操作。
(7)將處理好的種群重新作為BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值展開訓(xùn)練,根據(jù)結(jié)果重新計(jì)算每個(gè)個(gè)體的適應(yīng)度。
(8)判斷最優(yōu)個(gè)體適應(yīng)度是否達(dá)到優(yōu)化終止條件或最大遺傳代數(shù),若未滿足,則返回步驟(6),否則繼續(xù)執(zhí)行下一步。
(9)將最終得到的最優(yōu)個(gè)體作為BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值,使用訓(xùn)練集訓(xùn)練神經(jīng)網(wǎng)絡(luò),直到達(dá)到預(yù)設(shè)的期望指標(biāo)。最后利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò),輸入測(cè)試集評(píng)估資源價(jià)值評(píng)估的準(zhǔn)確率。
由L.S.Shapley于1953年提出的Shapley值法是一種用于解決n人合作對(duì)策問題的方法模型。當(dāng)一個(gè)合作聯(lián)盟中的n個(gè)成員從事具有經(jīng)濟(jì)效益的活動(dòng)后都會(huì)獲得不同的利益,但是當(dāng)每個(gè)成員通過不同方式組成聯(lián)盟后獲得的利益要大于單獨(dú)工作的利益之和時(shí),Shapley值法可以對(duì)利益聯(lián)盟中各成員的利益分配按照成員對(duì)聯(lián)盟總目標(biāo)的貢獻(xiàn)程度進(jìn)行計(jì)算[15]。
設(shè)合作聯(lián)盟N={1,2,…,n},那么根據(jù)Shapley值法得到的合作聯(lián)盟收益分配策略可以表示為:
其中:?i(v)表示在合作聯(lián)盟N下第i個(gè)成員的分配所得,Si表示集合N中所有包含了成員i的子集,S即可看作其中一個(gè)包含了成員i的子聯(lián)盟,|s|表示子聯(lián)盟S中所包含的成員個(gè)數(shù),n代表合作聯(lián)盟N中的成員總數(shù),ω(|s|)所計(jì)算出來的是成員i的權(quán)重系數(shù),v(s)是子聯(lián)盟S所獲得的效益,v(si)是子聯(lián)盟S除去成員i后可獲得的收益,?(v)則是合作聯(lián)盟的總收益。
從公式中可以發(fā)現(xiàn),Shapley值法為強(qiáng)調(diào)收益分配的平等性而把合作聯(lián)盟中各參與成員的邊際成本都看作1/n,忽略了聯(lián)盟中各企業(yè)成員在資源價(jià)值投入等方面的加權(quán)因素。
在Shapley值法基本模型下,考慮的是每個(gè)聯(lián)盟成員在資源價(jià)值投入均等的理想條件下所獲得的收益分配為?i(v),也就是說各成員投入的資源價(jià)值比例為:L=1/n。假設(shè)在實(shí)際環(huán)境中各成員的資源價(jià)值投入比例為Li,則顯然有合作聯(lián)盟成員i在實(shí)際環(huán)境中的價(jià)值投入同理想條件下的差值?Li,我們將其稱為資源價(jià)值投入修正因子[16]:
假設(shè)通過基于GA-BP神經(jīng)網(wǎng)絡(luò)的資源價(jià)值評(píng)估模型獲得的各成員資源價(jià)值投入的總值為Ri(i=1,2,…,n),很容易得到:
具體的修正方案可以表述為:當(dāng)?Li≥0時(shí),表示該成員在實(shí)際合作聯(lián)盟中提供的資源價(jià)值比理想條件更高,應(yīng)當(dāng)給予其更多的收益分配,其實(shí)際應(yīng)當(dāng)所得為:
否則應(yīng)當(dāng)扣除其部分所得:
很顯然地有:
本文實(shí)驗(yàn)所采用數(shù)據(jù)來源于部分國內(nèi)較大的在線數(shù)據(jù)資源交易平臺(tái),采用爬蟲軟件采集了200余條涵蓋電商運(yùn)營、交通地理、金融服務(wù)、醫(yī)療衛(wèi)生、知識(shí)產(chǎn)權(quán)、房地產(chǎn)等行業(yè)的用于交易的資源信息數(shù)據(jù)。每條數(shù)據(jù)包含了10類信息:交易資源數(shù)據(jù)名稱、交易價(jià)格、用戶瀏覽量、用戶收藏量、用戶下載量、資源數(shù)據(jù)格式、資源數(shù)據(jù)量、資源數(shù)據(jù)大小、資源數(shù)據(jù)發(fā)布時(shí)間、資源數(shù)據(jù)來源平臺(tái)。對(duì)于采集到的數(shù)據(jù),若在某個(gè)關(guān)鍵字段缺失數(shù)值,則直接刪除;若數(shù)據(jù)大小單位為MB,則統(tǒng)一轉(zhuǎn)換為KB。同時(shí)還將CSV、SQL、PDF等格式信息統(tǒng)一用數(shù)值表示,將數(shù)據(jù)發(fā)布時(shí)間轉(zhuǎn)換為距今的天數(shù)。最后利用公式xi=(xixmin)/(xmax-xmin)將這些輸入輸出指標(biāo)歸一化到[0,1]范圍內(nèi)的數(shù),以加快網(wǎng)絡(luò)訓(xùn)練的收斂速度[17]。最終選取了200條可用實(shí)驗(yàn)數(shù)據(jù),將其中160條作為訓(xùn)練集,40條作為測(cè)試集。
BP神經(jīng)網(wǎng)絡(luò)的輸入層神經(jīng)元節(jié)點(diǎn)數(shù)即數(shù)據(jù)集中影響資源價(jià)值的輸入指標(biāo),這里設(shè)定為7。輸出層神經(jīng)元節(jié)點(diǎn)數(shù)為1,即資源數(shù)據(jù)的交易價(jià)格,用于評(píng)估資源價(jià)值。隱藏層只有一層,通過經(jīng)驗(yàn)公式和實(shí)驗(yàn)效果確定其神經(jīng)元節(jié)點(diǎn)數(shù)為9。設(shè)置網(wǎng)絡(luò)的訓(xùn)練次數(shù)為1 000,訓(xùn)練目標(biāo)為0.01,學(xué)習(xí)速率為0.1。用于優(yōu)化神經(jīng)網(wǎng)絡(luò)的遺傳算法初始種群數(shù)設(shè)定為40,最大遺傳代數(shù)為50,交叉概率設(shè)定為0.7,變異概率設(shè)定為0.01。
本文以MATLAB R2016a作為實(shí)驗(yàn)軟件,為了更好評(píng)估訓(xùn)練模型的適用性,根據(jù)預(yù)設(shè)的參數(shù)分別進(jìn)行了BP神經(jīng)網(wǎng)絡(luò)和GA-BP神經(jīng)網(wǎng)絡(luò)的構(gòu)建、訓(xùn)練和測(cè)試,并通過均方根誤差(RMSE)、平均絕對(duì)百分比誤差(MAPE)等指標(biāo)進(jìn)行比較。
結(jié)合表2和圖1可以發(fā)現(xiàn),運(yùn)用BP神經(jīng)網(wǎng)絡(luò)和GA-BP神經(jīng)網(wǎng)絡(luò)構(gòu)建的模型都能夠大致評(píng)估出資源價(jià)值及其走勢(shì)變化,表明了BP神經(jīng)網(wǎng)絡(luò)是一種可以用來評(píng)估資源價(jià)值投入的有效工具。兩種模型對(duì)比來看,BP神經(jīng)網(wǎng)絡(luò)的評(píng)估效果與實(shí)際值的差距更大,存在值得優(yōu)化的地方;而GA-BP神經(jīng)網(wǎng)絡(luò)得到的評(píng)估值和實(shí)際值更加接近,評(píng)估效果更好。
表2 部分測(cè)試集結(jié)果
圖1 兩種網(wǎng)絡(luò)的價(jià)值評(píng)估數(shù)值擬合圖
本文將評(píng)估值與實(shí)際值的差值矩陣的2-范數(shù)作為誤差標(biāo)準(zhǔn),由于計(jì)算的是歸一化的評(píng)估結(jié)果,因此顯示誤差值較小。由圖2可以看出,隨著遺傳算法的加入和遺傳代數(shù)的增加,評(píng)估結(jié)果的誤差呈現(xiàn)出階梯狀下降的趨勢(shì),在達(dá)到最大遺傳代數(shù)的停止條件時(shí),其最小誤差達(dá)到了0.2557,且仍存在繼續(xù)減小的趨勢(shì)。該結(jié)果證明了遺傳算法能夠有效優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的評(píng)估效果,且迭代次數(shù)越高,越容易逼近神經(jīng)網(wǎng)絡(luò)全局最優(yōu)的初始權(quán)值和閾值。除此之外,BP神經(jīng)網(wǎng)絡(luò)和GA-BP神經(jīng)網(wǎng)絡(luò)均方根誤差分別為250.2208和166.0310,平均絕對(duì)百分比誤差分別為1.3430和0.9209。很顯然這也再一次說明了遺傳算法的加入使得資源價(jià)值投入評(píng)估效果得到了顯著改善,訓(xùn)練得到的該網(wǎng)絡(luò)可以用于評(píng)估合作聯(lián)盟中各供方所提供的資源價(jià)值。
圖2 遺傳算法的進(jìn)化過程
表3 神經(jīng)網(wǎng)絡(luò)效果評(píng)價(jià)
目前綜合科技服務(wù)云平臺(tái)為用戶提供科技服務(wù)所使用的資源主要來源于由A、B、C三家企業(yè)所形成的合作聯(lián)盟,根據(jù)平臺(tái)資源池中收集的資源信息,通過上文中訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)評(píng)估其所提供的資源價(jià)值投入總量分別為:7.92萬、9.43萬、8.25萬。假設(shè)在平臺(tái)運(yùn)行的某段時(shí)間內(nèi),由A、B、C三家資源提供服務(wù)可獲得總收益v(A∪B∪C)=20萬元,而僅由企業(yè)A資源提供服務(wù)可獲得收益v(A)=4萬元,僅由企業(yè)B資源提供服務(wù)可獲得收益v(B)=7萬元,僅由企業(yè)C資源提供服務(wù)可獲得收益v(C)=5.5萬元,由企業(yè)A、B資源提供服務(wù)可獲得收益v(A∪B)=12.5萬元,由企業(yè)A、C資源提供服務(wù)可獲得收益v(A∪C)=10萬元,由企業(yè)B、C資源提供服務(wù)可獲得收益v(B∪C)=13.5萬元。
由Shapley值法基本模型對(duì)A、B、C的收益分配進(jìn)行計(jì)算,計(jì)算過程如下表所示。
表4 Shapley值法計(jì)算過程
將最后一行相加,即可得A分配收益?A(v)=5.167萬元。同理也可計(jì)算得?B(v)=8.417萬元,?C(v)=6.417萬元,將三者收益相加,忽略分?jǐn)?shù)轉(zhuǎn)小數(shù)時(shí)產(chǎn)生的誤差,顯然有?A(v)+?B(v)+?C(v)=v(A∪B∪C)=20。
上述分配結(jié)果僅考慮各成員對(duì)合作聯(lián)盟所產(chǎn)生的基本經(jīng)濟(jì)效益,具有一定的片面性。接下來根據(jù)各資源供方的資源價(jià)值總投入并結(jié)合前文所總結(jié)公式,得到各成員的資源價(jià)值投入修正因子:?LA=-0.024,?LB=0.035,?LC=-0.011,再進(jìn)一步計(jì)算可得:
顯然同樣有?A'(v)+?B'(v)+?C'(v)=20,證明該分配方案可行。
表5 兩種分配方案對(duì)比
上兩種方案對(duì)比可知,相較于Shapley值基本模型,引入修正因子的收益分配模型更加客觀地反映了各資源供方的資源價(jià)值投入情況,對(duì)企業(yè)A和C而言,他們因?yàn)橘Y源在價(jià)值貢獻(xiàn)方面的不足而受到了少量的分成扣除,而企業(yè)B因?yàn)槠涮峁┑母喔邇r(jià)值資源而得到相應(yīng)的價(jià)值投入獎(jiǎng)勵(lì)。總的來說,修正后的模型使得收益分配方案更加合理、客觀和公正,同時(shí)也激勵(lì)合作聯(lián)盟中的各資源供方向資源池中投入更多高價(jià)值資源,為綜合科技服務(wù)云平臺(tái)的服務(wù)質(zhì)量提升添加動(dòng)力。
基于資源池的科技服務(wù)收益分配問題是綜合科技服務(wù)云平臺(tái)在服務(wù)交易方面的關(guān)鍵問題,一個(gè)科學(xué)合理的收益分配方案既有利于加強(qiáng)資源提供合作聯(lián)盟的協(xié)同發(fā)展,也有利于平臺(tái)自身的穩(wěn)定運(yùn)營。本文在借鑒前人文獻(xiàn)中提供的研究方法基礎(chǔ)上,主要做出了以下創(chuàng)新研究:①基于資源的視角考慮了資源價(jià)值投入對(duì)于科技服務(wù)收益分配的影響,結(jié)合Shapley值法模型,選取可量化的評(píng)估指標(biāo)進(jìn)行了研究,打破了前人在模型改進(jìn)過程中存在的分配影響因素主觀化、難以量化的困境,為今后進(jìn)一步的收益分配研究提供了參考價(jià)值。②提供了一種基于科技資源的特質(zhì)因素和市場(chǎng)因素評(píng)估其價(jià)值的智能化方法,不僅為收益分配的調(diào)整方案提供了依據(jù),還可為網(wǎng)絡(luò)交易環(huán)境下的科技資源定價(jià)、高價(jià)值資源篩選提供了基礎(chǔ)。
同樣地,本文的研究也存在著一些不足:①受可獲取到的實(shí)驗(yàn)數(shù)據(jù)的限制,只選取了7個(gè)可能影響資源價(jià)值評(píng)估的指標(biāo),實(shí)際環(huán)境中仍存在其他影響因素可用于研究。②研究所采用的數(shù)據(jù)來源于多家在線數(shù)據(jù)交易平臺(tái),數(shù)據(jù)樣本依然較少,實(shí)驗(yàn)效果可能存在一定的誤差。
未來相關(guān)研究主要可以從下面兩方面來開展:一是深入優(yōu)化基于神經(jīng)網(wǎng)絡(luò)的資源價(jià)值評(píng)估方法,例如對(duì)遺傳算法中各參數(shù)的確定進(jìn)行改進(jìn),或是嘗試神經(jīng)網(wǎng)絡(luò)與模擬退火、蟻群算法等更多優(yōu)化算法結(jié)合的可行性;二是繼續(xù)從更多角度深入研究不同類型的因素對(duì)科技服務(wù)收益分配結(jié)果的影響,例如基于科技服務(wù)的反饋和基于資源供方的信用等,從而形成更為科學(xué)準(zhǔn)確的收益分配方案。