韋玉輝,唐 欣,許仲童,丁雪梅,吳開明
基于LSTM深度學(xué)習(xí)模型的羽絨材料價格預(yù)測研究
韋玉輝1,2,3,唐 欣1,許仲童1,丁雪梅*2,吳開明4
(1. 安徽工程大學(xué) 紡織服裝學(xué)院,安徽 蕪湖 241000;2. 東華大學(xué) 服裝與藝術(shù)設(shè)計學(xué)院,上海 200051;3. 應(yīng)急管理部 上海消防研究所,上海 200032;4. 安徽古麒絨材股份有限公司,安徽 蕪湖 241300)
為解決目前羽毛絨材料定價主要依據(jù)經(jīng)驗而缺乏理論支撐和預(yù)測精度較低的問題,本文提出利用長短期記憶網(wǎng)絡(luò)(LSTM)深度學(xué)習(xí)方法對羽毛絨材料價格進行自定義研究,以2015年-2020年6年的羽絨金網(wǎng)數(shù)據(jù)為依據(jù),對其構(gòu)建模型進行訓(xùn)練求解,并與線性自回歸移動平均(ARIMA)數(shù)理統(tǒng)計模型和最小二乘支持向量機(LS-SVM)淺層機器學(xué)習(xí)模型預(yù)測效果進行對比分析。結(jié)果表明:在長期預(yù)測中,預(yù)測精度從高到低依次為ARIMA 模型、LS-SVM 模型、LSTM深度學(xué)習(xí)預(yù)測模型;在短期預(yù)測中,預(yù)測精度從高到低依次為LSTM深度學(xué)習(xí)預(yù)測模型、LS-SVM 模型、ARIMA 模型。同時還發(fā)現(xiàn):無論長期短期預(yù)測中,不同種類的羽毛絨價格預(yù)測精度趨勢相同,即預(yù)測精度僅與資本屬性有關(guān),與資本所述類別無關(guān)。研究結(jié)論既可為羽毛絨企業(yè)進行羽毛絨材料準(zhǔn)確定價提供理論依據(jù),也為人工智能技術(shù)廣泛應(yīng)用于量化投資領(lǐng)域提供實踐經(jīng)驗。
羽毛絨材料;羽絨金網(wǎng);深度學(xué)習(xí);定價模型;預(yù)測評測
羽毛絨材料因其具有保暖、質(zhì)輕、手感蓬松等優(yōu)良性能,使其成為冬季御寒服裝或者寢具的首選絮填材料之一,故其需求具有明顯的季節(jié)性和易受氣候影響特征,導(dǎo)致其價格也存在明顯的非線性、季節(jié)波動等特點[1-3]。同時,我國每年填充羽毛絨材料年產(chǎn)量高達14萬噸左右,占世界填充羽毛絨材料總產(chǎn)量的60%-70%,是當(dāng)前世界上羽毛絨材料最大的原料生產(chǎn)國和出口國,且其產(chǎn)業(yè)屬于制約我國出口貿(mào)易經(jīng)濟的重要支柱產(chǎn)業(yè)之一[2,4,5]。而且,羽毛絨材料既是養(yǎng)殖農(nóng)戶的主要經(jīng)濟來源,也是紡織服裝的重要生產(chǎn)原料[1,3,6]。如果價格過低,影響?zhàn)B殖農(nóng)戶的經(jīng)濟收入,降低其飼養(yǎng)積極性,減少我國羽毛絨材料產(chǎn)量,影響世界羽毛絨材料市場的健康良性發(fā)展[1,3,5]。如果價格過高,導(dǎo)致下游紡織服裝生產(chǎn)企業(yè)的原料成本驟增,企業(yè)利潤下降,制品價格上漲,消費者權(quán)益受損[1,2]。因此,系統(tǒng)研究羽毛絨價格走勢,準(zhǔn)確預(yù)測其價格對養(yǎng)殖農(nóng)戶和羽毛絨材料生產(chǎn)或相關(guān)下游企業(yè)促進生產(chǎn)或降低庫存成本,提高產(chǎn)品競爭力均具有重要意義[1,3]。否則很容易出現(xiàn)因羽毛絨價格的大起大落波動引發(fā)對養(yǎng)殖農(nóng)戶和羽毛絨材料或者相關(guān)下游生產(chǎn)企業(yè)的負(fù)面影響,甚至出現(xiàn)惡意操縱羽毛絨材料市場價格的現(xiàn)象,制約其產(chǎn)業(yè)良性發(fā)展[1,6]。
然而,目前關(guān)于羽絨價格制定主要依據(jù)經(jīng)驗,存在價格制定缺乏理論支撐、預(yù)測精度較低、滯后等問題,故對其準(zhǔn)確合理定價開展研究顯得尤為重要[1,3]。此外,隨著人工智能技術(shù)、機器學(xué)習(xí)算法的不斷發(fā)展,利用其應(yīng)用于量化投資領(lǐng)域是近期研究熱點之一,尤其是通過挖掘時間序列長短期依賴關(guān)系的長短期記憶網(wǎng)絡(luò)(LSTM)深度學(xué)習(xí)模型在價格預(yù)測中極具優(yōu)勢[1,7,8]。另外,羽毛絨材料素有服裝材料“軟黃金”之稱,在一定程度上,也屬于投資期貨產(chǎn)品[1,9,10]。
因此,本文提出以LSTM深度學(xué)習(xí)方法為基礎(chǔ),通過對羽絨金網(wǎng)上發(fā)布的2015年-2020年6年間的每天羽絨材料價格數(shù)據(jù)的研究分析,探究其變化規(guī)律,并在其基礎(chǔ)上,構(gòu)建其價格預(yù)測模型。引入線性自回歸移動平均(ARIMA)數(shù)理統(tǒng)計模型和最小二乘支持向量機(LS-SVM)淺層機器學(xué)習(xí)模型作為參照,借助均方根誤差(Root Mean Squared Error, RMSE)、平均絕對誤差(Mean Absolute Error, MAE)、平均絕對百分比誤差(Mean Absolute Percentage Error, MAPE)、校正決定系數(shù)(Adjusted Coefficient of Determination, R2)對三種模型的預(yù)測精度進行定量評測及對比分析。
為提出一種適用于羽毛絨材料準(zhǔn)確定價的方法或預(yù)測模型,本研究以來自于羽毛絨材料價格的專業(yè)網(wǎng)站-羽絨金網(wǎng)上發(fā)布的2015年1月1日-2020年12月31日,6年間的羽毛絨每日的價格數(shù)據(jù)作為實驗數(shù)據(jù),分別采用數(shù)理統(tǒng)計方法、淺層機器學(xué)習(xí)方法和深度學(xué)習(xí)方法,構(gòu)建羽絨材料定價的線性自回歸移動平均(ARIMA)模型、支持向量機(SVM)模型和長短期記憶網(wǎng)絡(luò)(LSTM)模型,并利用SPSS21.和 Python深度學(xué)習(xí)軟件對模型進行求解分析。為進一步評測預(yù)測模型的長短期預(yù)測效果,提出分別采用30天(短期)和120天(長期)的羽絨價格數(shù)據(jù)作為短期、長期測試數(shù)據(jù),預(yù)測未來1天的羽毛絨材料價格,再利用均方根誤差(RMSE)、平均絕對誤差(MMAE)、平均絕對百分比誤差(M MAPE)、校正決定系數(shù)(R2)四個統(tǒng)計學(xué)評測指標(biāo)對所構(gòu)建模型的長短期預(yù)測效果進行綜合評測。以期拓展量化研究方法在實體經(jīng)濟應(yīng)用的科學(xué)性與合理性。
為準(zhǔn)確預(yù)測羽絨價格,本研究所用的實驗數(shù)據(jù)為羽毛絨材料價格的專業(yè)網(wǎng)站-羽絨金網(wǎng)上發(fā)布的2015年1月1日-2020年12月31日,6年間的不同品種(白鵝絨WGD、灰鵝絨GGD、白鴨絨WDD、灰鴨絨GDD)、不同含絨率(50%、60%、70%、80%、85%、90%、95%)的羽絨材料每日價格數(shù)據(jù),共10220條數(shù)據(jù)。其中,前95%的數(shù)據(jù)作為輸入的訓(xùn)練集數(shù)據(jù),剩下的數(shù)據(jù)作為驗證數(shù)據(jù)集。
此外,為消除因羽毛絨材料自身價格量綱差異導(dǎo)致的其預(yù)測精度下降和預(yù)測速度緩慢,故在建模過程中,所有數(shù)據(jù)均進行零-均值(Z-score)規(guī)范化處理,處理公式如下:
為準(zhǔn)確評測所建模型的預(yù)測效果,選取了常用的均方根誤差(Root Mean Squared Error, RMSE)、平均絕對誤差(Mean Absolute Error, MAE)、平均絕對百分比誤差(Weighed Mean Absolute Percentage Error, WMAPE)、校正決定系數(shù)(Adjusted Coefficient of Determination,R2)作為評價指標(biāo)。各指標(biāo)具體計算公式如下[8,11,12]:
首先,對2015年1月-2020年12月6年間,羽絨金網(wǎng)上公布的不同品種和含絨率的羽毛絨材料價格進行取對數(shù)處理和一階差分處理,并利用增廣迪基-富勒(Augment Dickey-Fuller,ADF)檢驗其數(shù)據(jù)是否符合模型的平穩(wěn)性要求;其次,結(jié)合2015年1月-2020年12月6年間的羽毛絨材料價格數(shù)據(jù),利用赤池信息量準(zhǔn)則(Akaike Information Criterion,AIC)和貝葉斯信息準(zhǔn)則(Bayesian Information Criterion,BIC)尋求ARIMA中的p,d,q最佳參數(shù)取值,即完成適合羽毛絨材料價格預(yù)測的模型的構(gòu)建;最后再利用所構(gòu)建模型,進行羽毛絨材料價格預(yù)測。具體模型如下[9-11]:
核函數(shù)選擇RBF 核函數(shù),具體表達式為:
首先,利用Hurst指數(shù)檢驗羽絨金網(wǎng)獲取的羽毛絨材料價格歷史數(shù)據(jù)其是否具有長時記憶特性;其次,依據(jù)權(quán)重和偏差值,將數(shù)據(jù)依次通過輸入層輸入到輸入門、遺忘門、輸出門,并分別借助sigmod 函數(shù)和tanh 函數(shù),完成其數(shù)據(jù)的剔除、保留、更新、輸出。具體計算過程及模型結(jié)構(gòu)如下[11-13]:
為衡量ARIMA模型、LS-SVM模型和LSTM模型對羽毛絨材料價格的長期預(yù)測效果,選用2021年1月1日-2021年4月30日120天的羽毛絨價格數(shù)據(jù)作為測試數(shù)據(jù)集,預(yù)測結(jié)果如表1所示。由表1可知,在長期預(yù)測中,三種模型中,ARIMA模的預(yù)測精度最高、LS-SVM模型居中,LSTM模型預(yù)測效果最差,但三種模型的預(yù)測精度差異不大。這是因為羽絨材料屬于季節(jié)性需求材料,易受環(huán)境溫度和市場流行趨勢等因素的影響,如果時間跨度太長會跨越不同季節(jié),而不同季節(jié)間的氣溫差距較大(同一季節(jié)相對穩(wěn)定),尤其是季節(jié)交換期,其氣溫變化較大,故LSTM模型的長期預(yù)測效果不佳。同時,流行具有稍縱即逝的特性,時間跨度太長也會進一步加劇羽毛絨價格產(chǎn)生較大波動,使得預(yù)測值滯后于實際波動值,LSTM模型的長期預(yù)測效果下降。這也在一定程度上說明僅僅憑借羽絨金網(wǎng)的歷史數(shù)據(jù)進行羽毛絨價格的預(yù)測,會導(dǎo)致羽絨價格預(yù)測精度較低,故應(yīng)考慮與其相關(guān)的需求與市場因素,才能提高其預(yù)測精度。同時,還發(fā)現(xiàn):三種模型中,不論何種模型,同一種模型,不同材質(zhì)的預(yù)測精度差異不大,整體趨勢基本相同。說明所構(gòu)建的模型不受預(yù)測對象自身特性(含絨率、品種)的影響,僅與預(yù)測對象本身的材料屬性有關(guān),與所述的種類無關(guān)。
表1 羽毛絨材料價格的長期預(yù)測效果
注:本表僅列出含絨率為90%的白鵝絨、白鴨絨、灰鵝絨、灰鴨絨的預(yù)測效果。
為衡量ARIMA模型、LS-SVM模型和LSTM模型對羽毛絨材料價格的短期預(yù)測效果,選用2021年5月1日-2021年5月30日30天的羽毛絨價格數(shù)據(jù)作為測試數(shù)據(jù)集,預(yù)測結(jié)果如表2所示。由表2可知,在短期預(yù)測中,預(yù)測精度從高到低均依次為LSTM模型、LS-SVM模型和ARIMA模。其中,ARIMA模型的預(yù)測效果最差,這是因為ARIMA模型屬于多元線性回歸的數(shù)理統(tǒng)計模型,其是以統(tǒng)計學(xué)為基礎(chǔ),只能捕獲時間序列中的線性特征,對數(shù)據(jù)中的非線性特征較難提取,故對于時間跨度較大帶來的數(shù)據(jù)隨機波動較大、非線變化明顯的預(yù)測精度較低;LS-SVM模型居中,這是因為LS-SVM模型屬于淺層機器學(xué)習(xí)模型,雖然能對羽毛絨價格數(shù)據(jù)的非線性規(guī)律進行有效捕捉,相對于ARIMA模型提升了預(yù)測精度,但其特征學(xué)習(xí)能力有限,故其預(yù)測能力受到一定制約,即精度提高不多;LSTM模型預(yù)測效果最佳,這是因為LSTM模型屬于深度學(xué)習(xí)模型,其具有更深層次的結(jié)構(gòu),且強調(diào)對特征的學(xué)習(xí),能較為準(zhǔn)確地描述輸入與輸出的復(fù)雜關(guān)聯(lián),故對時序數(shù)據(jù)的預(yù)測效果通常優(yōu)于數(shù)理統(tǒng)計模型及支持向量機模型。但目前預(yù)測僅依靠歷史數(shù)據(jù),未考慮需求的季節(jié)性和流行因素等市場情緒對其的影響,故其對羽毛絨材料價格預(yù)測精度仍有可以提升的空間。同時還發(fā)現(xiàn):不論何種羽毛絨材質(zhì),三種模型中,其短期預(yù)測精度趨勢相同(LSTM模型均呈現(xiàn)最佳的預(yù)測效果,LS-SVM模型居中,ARIMA模型的預(yù)測效果最差)。 這說明LSTM模型是最適合作為羽毛絨材料價格短期預(yù)測的模型。
表2 羽毛絨材料的短期預(yù)測效果
注:本表僅列出含絨率為90%的白鵝絨、白鴨絨、灰鵝絨、灰鴨絨的預(yù)測效果.
綜合比較表1和表2發(fā)現(xiàn),對于ARIMA 數(shù)理統(tǒng)計模型而言,長期預(yù)測精度優(yōu)于短期預(yù)測精度,這是因為統(tǒng)計模型的預(yù)測精度與樣本的數(shù)量有關(guān)。在長期場景中,預(yù)測樣本數(shù)據(jù)量較大,更符合統(tǒng)計規(guī)律,故其預(yù)測精度較佳。而短期場景中,預(yù)測樣本數(shù)據(jù)較少,精度較低。這說明ARIMA 預(yù)測模型適用于時間序列的長期預(yù)測和處理具有一定規(guī)律性的平穩(wěn)性數(shù)據(jù)場景。深度學(xué)習(xí)模型,在短期場景的預(yù)測效果明顯優(yōu)于長期場景,這說明在深度學(xué)習(xí)模型中,鄰近數(shù)據(jù)的參考度更大。傳統(tǒng)學(xué)習(xí)模型,在長短期場景中的預(yù)測效果差異不大,這說明期預(yù)測精度不受樣本數(shù)據(jù)的影響,但整體的預(yù)測精度均低于深度學(xué)習(xí)模型。同時,還發(fā)現(xiàn):不論長期短期預(yù)測中,三種模型,對不同材質(zhì)的預(yù)測精度趨勢相同,基本無差異,這說明預(yù)測模型的精度與預(yù)測對象的材質(zhì)屬性無關(guān),僅與預(yù)測對象的資本屬性有關(guān)。
為探求一種高效的適用于羽毛絨材料價格預(yù)測的最佳預(yù)測模型或方法,本文選取了目前金融投資預(yù)測領(lǐng)域較為常用的線性自回歸移動平均(ARIMA)數(shù)理統(tǒng)計模型、最小二乘支持向量機(LS-SVM)淺層機器學(xué)習(xí)模型和長短期記憶網(wǎng)絡(luò)(LSTM)深度學(xué)習(xí)模型,并以羽絨金網(wǎng)上公布的2015年-2020年6年間羽毛絨材料價格數(shù)據(jù)作為模型結(jié)構(gòu)設(shè)計數(shù)據(jù)集,以2021年1月1日-2021年4月30日,及2021年5月1日-2021年5月30日作為長短期測試集,進行預(yù)測模型的長短期預(yù)測效果的分析評價。結(jié)果表明:在長期預(yù)測中,ARIMA 模型表現(xiàn)出最理想的預(yù)測精度,LS-SVM 模型稍遜色于ARIMA模型,LSTM深度學(xué)習(xí)預(yù)測模型則預(yù)測效果最不理想;在短期預(yù)測中,LSTM深度學(xué)習(xí)預(yù)測模型明顯優(yōu)于線性自回歸移動平均(ARIMA)數(shù)理統(tǒng)計模型、最小二乘支持向量機(LS-SVM)淺層機器學(xué)習(xí)模型。說明在進行羽毛絨材料價格預(yù)測時,除需考慮歷史數(shù)據(jù)及其特性,還應(yīng)考慮與其相關(guān)的市場需求及流行因素。同時,還發(fā)現(xiàn),無論長期短期預(yù)測中,不同種類的羽毛絨價格預(yù)測精度趨勢相同(長期預(yù)測中,預(yù)測精度從高到低依次為ARIMA模型>LS-SVM模型>LSTM模型;短期預(yù)測中,預(yù)測精度從高到低依次為LSTM模型>LS-SVM模型>ARIMA模型)。說明預(yù)測模型的精度與預(yù)測對象的材質(zhì)屬性無關(guān),僅與預(yù)測對象的資本屬性有關(guān)。研究結(jié)論既拓寬了深度學(xué)習(xí)理論及其技術(shù)的實踐應(yīng)用領(lǐng)域,也為羽毛絨企業(yè)進行羽毛絨材料的準(zhǔn)確定價提供一定理論依據(jù)。
[1] 姚瀾. 我國羽絨企業(yè)出口營銷策略研究[D]. 蚌埠:安徽財經(jīng)大學(xué), 2017.
[2] 陳浩. 基于網(wǎng)絡(luò)銷售的國內(nèi)品牌女士羽絨服設(shè)計研究[D]. 上海:東華大學(xué), 2017.
[3] 李會改, 張振方, 程浩南, 等. 睡袋用木棉/羽絨/滌綸填充料配比的優(yōu)化分析[J]. 上海紡織科技, 2018, 46(09): 44-47.
[4] 胡美桂. 羽絨蓬松度檢測方法對比研究[J]. 針織工業(yè), 2018, (03): 75-77.
[5] 魯婕. 蕭山羽絨產(chǎn)業(yè)集群競爭力研究[D]. 杭州:浙江工業(yè)大學(xué), 2012.
[6] 張立杰, 朱新杰. 我國棉花價格長期走勢與短期預(yù)測--基于差分自回歸移動平均模型(ARIMA)的分析[J].價格理論與實踐, 2012, (06): 53-54.
[7] 張秀美, 孫永劍, 郭亮偉. 面向大批量定制的基于改進的LS-SVM服裝需求預(yù)測模型[J]. 紡織學(xué)報, 2010, 31(05): 141-145.
[8] 唐甜甜, 周偉. 面向深度學(xué)習(xí)的商品銷售額預(yù)測研究[J/OL]. 重慶理工大學(xué)學(xué)報(自然科學(xué)),1-7[2021-11-09]. http://kns.cnki.net/kcms/detail/50.1205.T.20210914.1808.012.html.
[9] 彭桐歆, 韓勇, 王程, 等. 基于混合深度學(xué)習(xí)模型的短時地鐵客流量預(yù)測[J/OL].計算機工程, 1-13[2021- 11-09]. https://doi.org/10.19678/j.i ssn.1000-3428.0061 309.
[10] 張蕾, 孫尚紅, 王月. 基于深度學(xué)習(xí)LSTM模型的匯率預(yù)測[J]. 統(tǒng)計與決策, 2021, 37(13): 158-162.
[11] 沈虹, 李旭, 潘琪. 基于深度學(xué)習(xí)長短期記憶神經(jīng)網(wǎng)絡(luò)的有色金屬期貨市場預(yù)測研究[J]. 南京理工大學(xué)學(xué)報, 2021, 45(03): 366-374.
[12] 洪小林. 基于LSTM+MIDAS深度學(xué)習(xí)模型的電力需求預(yù)測[J]. 能源與環(huán)保, 2021, 43(06): 229-235.
[13] 李國祥, 馬文斌, 夏國恩. 基于深度學(xué)習(xí)的物流需求預(yù)測模型研究[J]. 系統(tǒng)科學(xué)學(xué)報, 2021, 29(02): 85-89.
Study on the Price Prediction of Down Material based on Depth Learning Model of LSTM
WEI Yu-hui1,2,3, TANG Xin1, XU Zhong-tong1, DING Xue-mei2, WU Kai-ming4
(1. College of Textile and Clothing, Anhui Polytechnic University, Wuhu Anhui 241000, China; 2. College of Fashion and Design, Donghua University, Shanghai 200051, China; 3. Shanghai Fire Research Institute of MEM, Shanghai 200032, China; 4. Anhui Guqi Down Incorporated Company, Wuhu Anhui 241300, China)
In order to solve the problem of the forecast-pricing of down material based on experience, due to the lack of theoretical support and low precision of predictive ability, self-definition study of down material price was proposed by the depth learning method of long-term and short-term memory network (LSTM), and was trained and solved based on the data of 6 years from 2015 to 2020, the forecasting results were compared with the linear autoregressive moving average (ARIMA) mathematical statistical model and the Least square support vector machine (LS-SVM) shallow machine learning model, The results show that in the long-term prediction, the order of prediction precision from high to low was ARIMA model, LS-SVM model and LSTM depth learning prediction model; in the short-term prediction, the prediction accuracy from high to low was LSTM depth learning prediction model, LS-SVM model and ARIMA model. And the results showed that the forecast precision of different feather price had the same trend in both long-term and short-term prediction and the forecast precision was independent of capital category instead of capital attribute. The research not only provides theoretical basis for down material pricing, but also provides practical experience for AI technology to be widely used in quantitative investment.
down material; gold mesh of down; deep learning; pricing model; prediction and evaluation
丁雪梅(1969-),女,教授,博士生導(dǎo)師,研究方向:紡織品護理.
安徽省紡織工程技術(shù)研究中心和“紡織面料”安徽省高校重點實驗室2021年度聯(lián)合開放基金項目(2021AETKL20);安徽工程大學(xué)校級科研項目(Xjky03201908);消防應(yīng)急救援裝備應(yīng)急管理部重點實驗室開放課題(2020XFZB09);2021年省級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃項目(S202110363229);安徽省高等學(xué)校自然科學(xué)研究項目(KJ2020A0352);2022年安徽工程大學(xué)校大學(xué)生科研項目(2022DZ18);2022 年度安徽工程大學(xué)-鳩江區(qū)產(chǎn)業(yè)協(xié)同創(chuàng)新專項基金(2022cyxtb7).
TP391.9
A
2095-414X(2022)06-0054-05