国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

新能源汽車行業(yè)股票價(jià)格預(yù)測(cè)研究
——基于機(jī)器學(xué)習(xí)算法

2024-02-28 08:26陳夢(mèng)龍吳志鵬
關(guān)鍵詞:裝袋股票價(jià)格汽車行業(yè)

陳夢(mèng)龍,樊 騁,吳志鵬

(合肥經(jīng)濟(jì)學(xué)院 金融學(xué)院,安徽 合肥 230036)

一、問(wèn)題的提出

隨著全球氣候變化的加劇,減少碳排放已成為全球共同的責(zé)任。“雙碳”目標(biāo)的提出,為中國(guó)新能源汽車行業(yè)的發(fā)展提供了巨大的機(jī)遇,也帶來(lái)了挑戰(zhàn)。中國(guó)股票市場(chǎng)中新能源汽車行業(yè)及其相關(guān)上下游板塊也因此受到了廣泛的關(guān)注和追捧,成為了投資者追逐的熱點(diǎn)板塊之一。然而,新能源汽車行業(yè)的發(fā)展仍面臨著多種挑戰(zhàn),如技術(shù)瓶頸、市場(chǎng)需求不足等。如何降低新能源汽車行業(yè)股票的投資風(fēng)險(xiǎn)、提高投資收益,成為了一個(gè)重要的研究課題。經(jīng)驗(yàn)研究表明,新能源汽車行業(yè)股票價(jià)格受政策支持、技術(shù)創(chuàng)新、市場(chǎng)競(jìng)爭(zhēng)等多種因素影響,因此,新能源汽車股票價(jià)格波動(dòng)及其背后的驅(qū)動(dòng)因素成為學(xué)者以及投資者關(guān)注的焦點(diǎn)。

最早使用機(jī)器學(xué)習(xí)方法研究股價(jià)預(yù)測(cè)問(wèn)題可以追溯到White(1988)[1]使用神經(jīng)網(wǎng)絡(luò)分析IBM普通股票的日回報(bào)率的非線性規(guī)律;Kamijo和Tanigawa(1990)[2]應(yīng)用循環(huán)神經(jīng)網(wǎng)絡(luò)分析東京證券交易所上市公司的股票價(jià)格漲跌的模式,獲得較好的預(yù)測(cè)效果及識(shí)別效果;Saad等(1998)[3]發(fā)現(xiàn)時(shí)延神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和概率神經(jīng)網(wǎng)絡(luò)都是有效的股票走勢(shì)預(yù)測(cè)模型。其后,隨著機(jī)器學(xué)習(xí)模型的不斷開發(fā)以及股價(jià)預(yù)測(cè)方面技術(shù)分析手段的不斷推陳出新,大量文獻(xiàn)開始將二者結(jié)合,即以新的股價(jià)技術(shù)分析指標(biāo)作為特征變量訓(xùn)練新的機(jī)器學(xué)習(xí)模型。

但目前相關(guān)文獻(xiàn)并沒(méi)有直接使用機(jī)器學(xué)習(xí)模型研究A股新能源汽車股票價(jià)格預(yù)測(cè)問(wèn)題,大多數(shù)集中于將機(jī)器學(xué)習(xí)方法應(yīng)用于新能源相關(guān)領(lǐng)域,例如清潔能源行業(yè)、光伏行業(yè)股票的價(jià)格預(yù)測(cè),并通過(guò)模型預(yù)測(cè)誤差等模型評(píng)價(jià)指標(biāo)篩選出該類股票價(jià)格預(yù)測(cè)中的最優(yōu)模型。Jabeur等(2021)[4]通過(guò)考察綠色能源資源、全球環(huán)境指數(shù)(ESG)和新能源股票市場(chǎng),利用隨機(jī)森林和LightGBM等模型,對(duì)新能源股價(jià)及石油價(jià)格崩盤期進(jìn)行了探究;Sadorsky(2021)[5]使用隨機(jī)森林模型及技術(shù)指標(biāo)作為特征變量,分析了清潔能源交易基金的股價(jià)方向預(yù)測(cè);Sadorsky(2022)[6]使用基于決策樹的機(jī)器學(xué)習(xí)方法預(yù)測(cè)新能源股票價(jià)格的方向。相似研究還有Sadorsky(2022)[7]分析了清潔能源股票價(jià)格走向,使用了隨機(jī)森林、極端隨機(jī)樹、隨機(jī)梯度提升和支持向量機(jī)等機(jī)器學(xué)習(xí)方法,并發(fā)現(xiàn)這些方法的預(yù)測(cè)準(zhǔn)確率高于傳統(tǒng)模型機(jī)器學(xué)習(xí)方法進(jìn)行美國(guó)清潔能源股票價(jià)格預(yù)測(cè)。

以上文獻(xiàn)表明,在分析新能源及相關(guān)領(lǐng)域的股票市場(chǎng)時(shí),使用基于樹的機(jī)器學(xué)習(xí)方法預(yù)測(cè)股票價(jià)格,有更高的準(zhǔn)確性。此外,在眾多機(jī)器學(xué)習(xí)方法中,選擇何種機(jī)器學(xué)習(xí)方法對(duì)于股價(jià)預(yù)測(cè)也十分重要。Nti 等(2019)[8]使用隨機(jī)森林和長(zhǎng)短期記憶循環(huán)神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)30天后的加納證券交易所(GSE)多個(gè)領(lǐng)域的股票價(jià)格,結(jié)果發(fā)現(xiàn)這兩種方法都可以高精度地預(yù)測(cè)不同領(lǐng)域股票價(jià)格的未來(lái)走勢(shì);Ma等(2019)[9]通過(guò)對(duì)2013年至2017年上證指數(shù)的數(shù)據(jù)進(jìn)行模擬和比較,使用隨機(jī)森林和LSTM神經(jīng)網(wǎng)絡(luò)構(gòu)建的股票預(yù)測(cè)模型可以提高股票預(yù)測(cè)的準(zhǔn)確性,并且可以通過(guò)該模型構(gòu)建有效的交易策略;Polamuri等(2019)[10]使用美國(guó)標(biāo)普500指數(shù)中公司的歷史股票價(jià)格數(shù)據(jù)預(yù)測(cè)未來(lái)價(jià)格,對(duì)比多種機(jī)器學(xué)習(xí)模型發(fā)現(xiàn),基于決策樹和隨機(jī)森林的回歸模型是最好的算法;Illa等(2021)[11]使用了道-瓊斯指數(shù)從2000年到2016年的歷史數(shù)據(jù),發(fā)現(xiàn)將隨機(jī)森林與LSTM神經(jīng)網(wǎng)絡(luò)和情感分析技術(shù)結(jié)合的集成學(xué)習(xí)模型可以顯著提高預(yù)測(cè)的準(zhǔn)確性;Cosenza等(2021)[12]以全球5個(gè)地區(qū)的股市為研究對(duì)象,比較了普通最小二乘回歸、隨機(jī)森林和k近鄰三種模型的預(yù)測(cè)效果,結(jié)果發(fā)現(xiàn)前兩者的預(yù)測(cè)精度相近,均優(yōu)于k近鄰,并且變量選擇對(duì)隨機(jī)森林的預(yù)測(cè)性能沒(méi)有影響;Yin等(2023)[13]通過(guò)分析美國(guó)4家上市公司股價(jià),使用了隨機(jī)森林模型結(jié)合指數(shù)平滑方法和決策樹來(lái)優(yōu)化模型,結(jié)果發(fā)現(xiàn)隨機(jī)森林在中長(zhǎng)期股票趨勢(shì)預(yù)測(cè)中具有優(yōu)勢(shì),并且該種方法可以進(jìn)一步提高隨機(jī)森林模型的性能。

可以看出,近年的文獻(xiàn)在多個(gè)國(guó)家的多個(gè)股票市場(chǎng)的股價(jià)預(yù)測(cè)中,隨機(jī)森林都獲得了較高的預(yù)測(cè)精確度。同時(shí),這些文獻(xiàn)的常用方法都是盡可能加入足夠多的特征變量讓機(jī)器學(xué)習(xí)模型自行篩選,但并沒(méi)有關(guān)注特征變量之間進(jìn)行比較。本文在此基礎(chǔ)之上,使用隨機(jī)森林方法來(lái)研究新能源汽車行業(yè)股票價(jià)格預(yù)測(cè)問(wèn)題,并與簡(jiǎn)單回歸樹及裝袋法這兩種機(jī)器學(xué)習(xí)方法進(jìn)行對(duì)比。根據(jù)Basak 等(2019)[14]的對(duì)比,篩選7種最為常用的股票技術(shù)分析指標(biāo)作為特征變量。通過(guò)對(duì)比特征變量重要性,篩選出對(duì)股票價(jià)格預(yù)測(cè)最為重要的特征變量。

與既有研究相比,本文重點(diǎn)回答以下問(wèn)題:1.結(jié)合我國(guó)股票市場(chǎng)新能源汽車行業(yè)的特征,通過(guò)選擇多種影響因素有效地整合到機(jī)器學(xué)習(xí)模型中,以提高預(yù)測(cè)結(jié)果的可靠性,同時(shí)分析影響新能源汽車行業(yè)價(jià)格變動(dòng)的最重要的變量。2.基于機(jī)器學(xué)習(xí)算法的新能源汽車行業(yè)股票價(jià)格預(yù)測(cè)模型能否有效地捕捉市場(chǎng)中的價(jià)格波動(dòng),如何選擇合適的機(jī)器學(xué)習(xí)算法以提高預(yù)測(cè)準(zhǔn)確性。3.機(jī)器學(xué)習(xí)算法在預(yù)測(cè)新能源汽車行業(yè)股票價(jià)格過(guò)程中可能面臨的過(guò)擬合、數(shù)據(jù)不平衡等問(wèn)題如何解決?;卮鹕鲜鰡?wèn)題對(duì)于投資者來(lái)說(shuō)具有重要的實(shí)際意義,有助于降低投資風(fēng)險(xiǎn),提高投資收益。通過(guò)對(duì)基于機(jī)器學(xué)習(xí)算法的新能源汽車行業(yè)股票價(jià)格預(yù)測(cè)研究的深入探討,有望為投資者提供更加有效的投資策略和決策支持,也能為中國(guó)新能源汽車行業(yè)及股市的研究提供一定啟示。

二、模型說(shuō)明

(一)隨機(jī)森林模型

隨機(jī)森林模型(Random Forest)為Ho(1995)[15]首先提出的,這是一種基于決策樹的集成學(xué)習(xí)算法,能夠有效地處理回歸問(wèn)題。它通過(guò)組合多個(gè)決策樹來(lái)構(gòu)建一個(gè)強(qiáng)大的預(yù)測(cè)模型,每個(gè)決策樹都是在隨機(jī)選擇的樣本和特征上進(jìn)行訓(xùn)練,并用投票的方式來(lái)決定最終的預(yù)測(cè)結(jié)果。具體來(lái)說(shuō),隨機(jī)森林中的每個(gè)決策樹都是通過(guò)自助采樣和隨機(jī)特征選擇來(lái)構(gòu)建的。自助采樣意味著從原始數(shù)據(jù)集中有放回地抽取相同大小的樣本子集,用于訓(xùn)練每個(gè)決策樹。隨機(jī)特征選擇則意味著在每個(gè)節(jié)點(diǎn)處,從所有特征中隨機(jī)選擇一部分特征進(jìn)行分裂。假設(shè)有一個(gè)訓(xùn)練集,其中Xi是輸入特征向量,Yi是對(duì)應(yīng)的輸出標(biāo)簽。對(duì)于回歸問(wèn)題,隨機(jī)森林方法的思路是學(xué)習(xí)一個(gè)預(yù)測(cè)函數(shù)F(X),使得預(yù)測(cè)值F(Xi)盡可能接近真實(shí)值Yi。

隨機(jī)森林算法的步驟如下:首先,對(duì)于每棵樹Ti,從訓(xùn)練集D中有放回地隨機(jī)采樣n個(gè)樣本,得到一個(gè)樣本子集Di,然后隨機(jī)選擇k 個(gè)特征子集,用于訓(xùn)練決策樹;用Di和選定的特征子集來(lái)訓(xùn)練一棵決策樹Ti。其次,對(duì)于一個(gè)新的輸入向量X,通過(guò)計(jì)算所有樹的輸出的平均值得到最終預(yù)測(cè)值:

其中,T是決策樹的數(shù)量。為了衡量預(yù)測(cè)值與真實(shí)值之間的誤差,通常采用平方誤差損失函數(shù),即;而對(duì)于回歸問(wèn)題:令和,則可以通過(guò)最小化加權(quán)平方誤差(即殘差平方和)的準(zhǔn)則來(lái)選擇最佳的劃分變量j和最佳的劃分點(diǎn)s,具體公式如下:

其中,c1與c2分別為兩個(gè)區(qū)域內(nèi)部的均值。最佳的劃分變量j和最佳的劃分點(diǎn)s可以通過(guò)貪心算法進(jìn)行選取。而對(duì)于隨機(jī)森林的預(yù)測(cè)問(wèn)題,最終的預(yù)測(cè)結(jié)果是所有決策樹的預(yù)測(cè)結(jié)果的平均值,即:

其中,B表示決策樹的數(shù)目,fb(X)表示第b棵決策樹對(duì)于輸入樣本X的預(yù)測(cè)。隨機(jī)森林具有以下優(yōu)點(diǎn):第一,能夠處理高維數(shù)據(jù)和大量特征,不需要進(jìn)行特征選擇;第二,具有較高的準(zhǔn)確率和泛化能力;第三,能夠評(píng)估特征的重要性,提供特征選擇的依據(jù)。隨機(jī)森林回歸算法的基本思想是將數(shù)據(jù)集隨機(jī)劃分為多個(gè)子集,建立多棵決策樹并計(jì)算每顆決策樹的回歸效果,最終將這些決策樹的結(jié)果合并得到最終模型的預(yù)測(cè)結(jié)果。

(二)裝袋法

裝袋法最早由Breiman(1996)[16]提出,是一種基于集成學(xué)習(xí)的機(jī)器學(xué)習(xí)算法,其基本思想是通過(guò)對(duì)多個(gè)訓(xùn)練集進(jìn)行隨機(jī)采樣,從而得到多個(gè)子訓(xùn)練集,然后分別對(duì)這些子訓(xùn)練集進(jìn)行訓(xùn)練,最后將這些訓(xùn)練好的模型進(jìn)行組合,得到一個(gè)更加穩(wěn)定和準(zhǔn)確的模型。

假設(shè)一個(gè)包含N個(gè)樣本的訓(xùn)練集D,每個(gè)樣本的特征向量為Xi,標(biāo)簽為Yi。采用裝袋法訓(xùn)練一個(gè)大小為M的模型集合,其中每個(gè)模型用hm(X)表示。則裝袋法的預(yù)測(cè)結(jié)果為:

其中,Y表示最終的預(yù)測(cè)結(jié)果。

(三)決策樹

決策樹是最早由Stone 和Hunt(1963)[17]提出的一種基于樹結(jié)構(gòu)的機(jī)器學(xué)習(xí)算法,用于解決回歸問(wèn)題。它的基本思想是將數(shù)據(jù)集劃分為多個(gè)子集,每個(gè)子集對(duì)應(yīng)一個(gè)葉子節(jié)點(diǎn),并在每個(gè)葉子節(jié)點(diǎn)上預(yù)測(cè)一個(gè)數(shù)值。通過(guò)不斷地遞歸劃分?jǐn)?shù)據(jù)集,最終得到一個(gè)樹形結(jié)構(gòu),可以用于對(duì)新的數(shù)據(jù)進(jìn)行回歸預(yù)測(cè)。

假設(shè)有一個(gè)包含N個(gè)樣本的訓(xùn)練集D,每個(gè)樣本的特征向量為Xi,標(biāo)簽為Yi。使用決策樹建模,得到一個(gè)樹形結(jié)構(gòu),對(duì)于每個(gè)葉子節(jié)點(diǎn)k,它對(duì)應(yīng)的預(yù)測(cè)值為ck。則決策樹的預(yù)測(cè)結(jié)果為:

其中,Y表示對(duì)于輸入的特征向量X的預(yù)測(cè)值,k表示葉子節(jié)點(diǎn)的個(gè)數(shù),I(X∈Rk)表示X是否屬于葉子節(jié)點(diǎn)k所對(duì)應(yīng)的子集。

三、特征工程與數(shù)據(jù)來(lái)源

(一)特征工程

本文選擇相對(duì)強(qiáng)度指標(biāo)(Relative Strength Index,簡(jiǎn)稱RSI)、隨機(jī)震蕩指標(biāo)(Stochastic Oscillator,簡(jiǎn)稱%K值)、威廉指標(biāo)(William%R值)、移動(dòng)平均線收斂/發(fā)散指標(biāo)(簡(jiǎn)稱MACD)、收益率指標(biāo)、平衡成交量指標(biāo)(On Balance Volume,簡(jiǎn)稱OBV值)及換手率這7個(gè)指標(biāo)作為特征值進(jìn)行分析。

1.相對(duì)強(qiáng)度指標(biāo)(RSI)

相對(duì)強(qiáng)度指標(biāo)是一種用于衡量股票價(jià)格漲跌幅度的技術(shù)分析指標(biāo),RSI指標(biāo)的取值范圍為0 ~100,通常認(rèn)為當(dāng)RSI值超過(guò)70時(shí),股票處于超買狀態(tài);當(dāng)RSI值低于30時(shí),股票處于超賣狀態(tài)。RSI指標(biāo)可以用于股票價(jià)格的技術(shù)分析,幫助投資者判斷股票的買賣時(shí)機(jī)。

2.隨機(jī)震蕩指標(biāo)(%K)

隨機(jī)震蕩指標(biāo)(%K)是一種用于衡量股票價(jià)格相對(duì)高低水平的技術(shù)分析指標(biāo)。%K 的取值范圍為0 ~100,通常認(rèn)為當(dāng)%K值超過(guò)80時(shí),股票處于超買狀態(tài);當(dāng)%K值低于20時(shí),股票處于超賣狀態(tài)。隨機(jī)震蕩指標(biāo)可以用于股票價(jià)格的技術(shù)分析,幫助投資者判斷股票的買賣時(shí)機(jī)。

3.威廉指標(biāo)(William %R)

威廉指標(biāo)是一種技術(shù)分析工具,用于測(cè)量股票價(jià)格的超買和超賣情況。該指標(biāo)的取值范圍在0到-100之間,當(dāng)%R指標(biāo)的數(shù)值超過(guò)-20時(shí),表示股票處于超買狀態(tài);當(dāng)%R指標(biāo)的數(shù)值低于-80時(shí),表示股票處于超賣狀態(tài)。

4.移動(dòng)平均線收斂/發(fā)散指標(biāo)(MACD)

移動(dòng)平均線收斂/發(fā)散指標(biāo)是一種技術(shù)分析工具,用于測(cè)量股票價(jià)格的趨勢(shì)和動(dòng)量。該指標(biāo)的計(jì)算是基于兩個(gè)移動(dòng)平均線之間的差異,通常用于判斷股票價(jià)格的買入和賣出時(shí)機(jī)。MACD線的數(shù)值可以是正數(shù)或負(fù)數(shù),表示股票價(jià)格的上漲或下跌趨勢(shì)。當(dāng)MACD 線的數(shù)值大于0 時(shí),表示股票價(jià)格處于上漲趨勢(shì);當(dāng)MACD線的數(shù)值小于0時(shí),表示股票價(jià)格處于下跌趨勢(shì)。除了MACD線之外,還可以計(jì)算出MACD的信號(hào)線,用于判斷股票價(jià)格的買入和賣出時(shí)機(jī)。MACD的信號(hào)線通常采用9天的時(shí)間周期,當(dāng)MACD線向上突破信號(hào)線時(shí),表示股票價(jià)格處于買入時(shí)機(jī);當(dāng)MACD線向下突破信號(hào)線時(shí),表示股票價(jià)格處于賣出時(shí)機(jī)。

5.收益率(RATE)

收益率指標(biāo)用于衡量?jī)r(jià)格變化的速度和幅度。

6.平衡成交量(OBV)

平衡成交量指標(biāo)是一種技術(shù)分析工具,用于測(cè)量股票價(jià)格的漲跌動(dòng)量。OBV指標(biāo)的計(jì)算基于股票交易量的增減情況,可以用于判斷股票價(jià)格的趨勢(shì)和買賣時(shí)機(jī)。當(dāng)OBV指標(biāo)的數(shù)值持續(xù)上升時(shí),表示股票價(jià)格處于上漲趨勢(shì);當(dāng)OBV指標(biāo)的數(shù)值持續(xù)下降時(shí),表示股票價(jià)格處于下跌趨勢(shì)。OBV指標(biāo)也可以與股票價(jià)格進(jìn)行比較,如果股票價(jià)格上漲而OBV指標(biāo)下降,則可能預(yù)示著價(jià)格趨勢(shì)的反轉(zhuǎn)。

7.換手率

換手率是指某一特定時(shí)間段內(nèi),某個(gè)證券交易的股數(shù)與該證券流通股本的比率,通常用百分?jǐn)?shù)表示。換手率越高,表示該股票的流通性越好,市場(chǎng)交易越活躍。換手率可以反映出市場(chǎng)對(duì)該股票的熱度和投資者的情緒,是衡量股票市場(chǎng)活躍程度的重要指標(biāo)。

(二)數(shù)據(jù)來(lái)源及模型預(yù)測(cè)評(píng)價(jià)指標(biāo)

1.數(shù)據(jù)來(lái)源

本文選擇2016年7月20日至2023年4月28日上證A股新能源汽車指數(shù)日度數(shù)據(jù)作為研究樣本,新能源汽車股票數(shù)據(jù)來(lái)源于wind 數(shù)據(jù)庫(kù),特征變量數(shù)據(jù)來(lái)源于英為財(cái)情網(wǎng)站及手工計(jì)算,共得到1 648 個(gè)樣本值。為了消除量綱不一致問(wèn)題,已經(jīng)對(duì)特征變量經(jīng)過(guò)標(biāo)準(zhǔn)化計(jì)算。本文所有數(shù)據(jù)分析均在python3.7 中實(shí)現(xiàn)。

2.模型預(yù)測(cè)評(píng)價(jià)指標(biāo)

本文選取袋外均方誤差、測(cè)試誤差及擬合優(yōu)度三種方法對(duì)比衡量單棵決策樹、裝袋法及隨機(jī)森林三種模型預(yù)測(cè)效果,袋外均方誤差及測(cè)試誤差值越小,說(shuō)明預(yù)測(cè)效果越好;擬合優(yōu)度值越大,說(shuō)明預(yù)測(cè)效果越好。

四、實(shí)證分析和結(jié)果解釋

(一)隨機(jī)森林模型預(yù)測(cè)準(zhǔn)確性

本文檢驗(yàn)機(jī)器學(xué)習(xí)中的隨機(jī)森林算法來(lái)構(gòu)建新能源汽車行業(yè)股票價(jià)格預(yù)測(cè)模型的準(zhǔn)確性,圖1為隨機(jī)森林的預(yù)測(cè)值與實(shí)際值的散點(diǎn)圖,由圖可知,散點(diǎn)緊密地圍繞在45度線周圍,表明了隨機(jī)森林取得了較好的預(yù)測(cè)效果。進(jìn)一步分析回歸樹的棵數(shù)對(duì)預(yù)測(cè)誤差的影響,如圖2所示,可知在150棵樹之后,預(yù)測(cè)誤差降到比較低的水準(zhǔn),并隨著棵數(shù)增加保持平穩(wěn)。

圖1 隨機(jī)森林預(yù)測(cè)值和實(shí)際值的散點(diǎn)圖

圖2 回歸樹棵數(shù)對(duì)預(yù)測(cè)誤差的影響

(二)變量對(duì)于新能源汽車股票價(jià)格預(yù)測(cè)的重要程度

為了進(jìn)一步探究新能源汽車股票價(jià)格預(yù)測(cè)的關(guān)鍵因素,即研究新能源股的RSI值、%K值、William%R、MACD值、價(jià)格變動(dòng)率、OBV值、換手率對(duì)新能源汽車股票價(jià)格的預(yù)測(cè)何者更重要,本文進(jìn)一步分析這些變量的重要性,分析結(jié)果如表1所示。將其按照重要性排序,各特征的重要性如表1,柱狀圖展示如圖3。結(jié)果表明,最重要的三個(gè)特征為平衡成交量指標(biāo)、換手率指標(biāo)及移動(dòng)平均線收斂/發(fā)散指標(biāo),對(duì)股票價(jià)格預(yù)測(cè)的重要性分別為0.5196、0.2105和0.1059。平衡成交量之所以在預(yù)測(cè)新能源汽車行業(yè)股票價(jià)格時(shí)最為重要,一個(gè)較為合理的解釋是,新能源汽車行業(yè)需要大量資金投入研發(fā)、生產(chǎn)和銷售,資金流向?qū)善眱r(jià)格會(huì)產(chǎn)生較大影響,平衡成交量指標(biāo)可以反映市場(chǎng)資金的流入和流出情況,幫助投資者把握行業(yè)資金動(dòng)向。同時(shí),新能源汽車行業(yè)受到政策、技術(shù)和市場(chǎng)等多方面因素的影響,股票價(jià)格波動(dòng)較大,而該指標(biāo)通過(guò)分析成交量與股票價(jià)格的關(guān)系,能夠反映市場(chǎng)活躍程度,為投資者提供有關(guān)市場(chǎng)趨勢(shì)的信息,可以幫助投資者判斷市場(chǎng)的買賣力量,提前發(fā)現(xiàn)趨勢(shì)變化的信號(hào),從而作出及時(shí)的投資決策。

圖3 隨機(jī)森林變量重要性圖

進(jìn)一步分析這三個(gè)特征變量,并繪制偏依賴程度圖(Partial Dependence),用于展示特征變量與模型預(yù)測(cè)結(jié)果之間的關(guān)系。圖4 從左至右分別是OBV、換手率和MACD 的偏依賴程度圖??梢钥闯觯?dāng)OBV 指標(biāo)的值從較低水平開始增加時(shí),股價(jià)預(yù)測(cè)的重要性也隨之增加,這意味著在OBV指標(biāo)上升的情況下,市場(chǎng)對(duì)于新能源汽車股價(jià)的預(yù)測(cè)變得更加可靠和重要。OBV 指標(biāo)上升通常表示市場(chǎng)對(duì)該行業(yè)的買入興趣增加,投資者對(duì)于新能源汽車股價(jià)的預(yù)期也隨之提高。然而,當(dāng)OBV 指標(biāo)接近零值時(shí),股價(jià)預(yù)測(cè)的重要性達(dá)到最低點(diǎn)。這表明在OBV 指標(biāo)接近零值的情況下,市場(chǎng)對(duì)于新能源汽車股價(jià)的預(yù)測(cè)變得更加困難。因?yàn)镺BV 指標(biāo)接近零值時(shí),市場(chǎng)處于相對(duì)平衡狀態(tài),投資者對(duì)于新能源汽車行業(yè)的未來(lái)走勢(shì)持有較為謹(jǐn)慎的態(tài)度,導(dǎo)致股價(jià)預(yù)測(cè)的不確定性增加。但隨著OBV的進(jìn)一步增加,此特征變量對(duì)股價(jià)預(yù)測(cè)的重要性進(jìn)一步增加。

圖4 OBV、換手率及MACD偏依賴程度

換手率指標(biāo)從0開始增加時(shí),對(duì)股價(jià)預(yù)測(cè)的重要性也隨之增加。這意味著在低換手率水平下,新能源汽車股價(jià)受到換手率的積極影響,即換手率的增加會(huì)推動(dòng)股價(jià)上漲。然而,當(dāng)換手率超過(guò)約400%后,偏依賴程度開始下降,這表明在高換手率水平下,換手率的增加反而對(duì)新能源汽車股價(jià)的預(yù)測(cè)產(chǎn)生負(fù)面影響,即換手率的進(jìn)一步增加可能導(dǎo)致股價(jià)下跌。

MACD指標(biāo)的值從較低水平開始減少時(shí),對(duì)于新能源股價(jià)預(yù)測(cè)的重要性也隨之降低。意味著在MACD指標(biāo)下降的情況下,對(duì)于新能源汽車股價(jià)的預(yù)測(cè)變得不太可靠。由于投資者對(duì)于新能源汽車行業(yè)的興趣減弱,導(dǎo)致股價(jià)受到較小的關(guān)注和波動(dòng)。當(dāng)MACD 指標(biāo)接近零值時(shí),股價(jià)預(yù)測(cè)的重要性達(dá)到最低點(diǎn)。隨著MACD指標(biāo)進(jìn)一步上升,股價(jià)預(yù)測(cè)的重要性也開始增加,這意味著在MACD指標(biāo)上升的情況下,市場(chǎng)對(duì)于新能源汽車股價(jià)的預(yù)測(cè)變得更加可靠和重要。因?yàn)镸ACD指標(biāo)上升通常表示市場(chǎng)對(duì)該行業(yè)的買入興趣增加,投資者對(duì)于新能源汽車股價(jià)的預(yù)期也隨之提高。

(三)三種機(jī)器學(xué)習(xí)算法的對(duì)比分析

為了對(duì)比分析隨機(jī)森林算法與其他算法之間的優(yōu)劣,本文對(duì)比分析單棵決策樹、裝袋法與隨機(jī)森林法三種方法在模型擬合優(yōu)度及預(yù)測(cè)方面的表現(xiàn),使用袋外均方誤差用于衡量機(jī)器學(xué)習(xí)模型的泛化能力和預(yù)測(cè)準(zhǔn)確性。具體來(lái)說(shuō),袋外均方誤差越小,說(shuō)明模型的泛化能力越強(qiáng),對(duì)未知數(shù)據(jù)的預(yù)測(cè)準(zhǔn)確性越高。使用測(cè)試集的擬合優(yōu)度來(lái)衡量模型的擬合程度,擬合優(yōu)度越接近1,說(shuō)明模型的擬合程度越好,同時(shí)預(yù)測(cè)準(zhǔn)確性越高。

本文在python的scikit-learn模塊中初始化了三個(gè)模型,在單棵決策樹中,使用默認(rèn)參數(shù)對(duì)原數(shù)據(jù)建立了1棵樹。在裝袋法中建立了300棵樹,并對(duì)每棵樹的訓(xùn)練集進(jìn)行了隨機(jī)采樣。在隨機(jī)森林模型中,直接對(duì)原數(shù)據(jù)建立了300棵樹且不對(duì)其剪枝。進(jìn)一步對(duì)三個(gè)模型在訓(xùn)練集和測(cè)試集上的表現(xiàn)進(jìn)行了評(píng)估,具體指標(biāo)如表2所示。結(jié)果表明,在袋外均方誤差及測(cè)試集的擬合優(yōu)度方面,隨機(jī)森林模型的表現(xiàn)最佳,顯著高于單棵決策樹和裝袋法。該結(jié)論在圖5也能得到體現(xiàn),圖5為單棵決策樹、裝袋法及隨機(jī)森林三種機(jī)器學(xué)習(xí)方法的測(cè)試誤差之間的對(duì)比,橫軸為樹的棵數(shù),縱軸為測(cè)試誤差,可以看出隨機(jī)森林的測(cè)試誤差與裝袋法接近,且二者皆遠(yuǎn)小于單棵決策樹的測(cè)試誤差。在決策樹的數(shù)量超過(guò)200棵之后,隨機(jī)森林法的測(cè)試誤差略小于裝袋法。說(shuō)明在設(shè)置參數(shù)時(shí),適當(dāng)提高決策樹的數(shù)目可降低隨機(jī)森林方法的測(cè)試誤差,即提高隨機(jī)森林方法對(duì)新能源汽車股票價(jià)格的預(yù)測(cè)精度。同時(shí),測(cè)試誤差是在模型訓(xùn)練完成后,使用獨(dú)立的測(cè)試數(shù)據(jù)集來(lái)評(píng)估模型的性能。測(cè)試誤差越小,說(shuō)明模型的泛化能力越強(qiáng)。在隨機(jī)森林中,測(cè)試誤差通常比單一決策樹和裝袋法要小,因?yàn)殡S機(jī)森林綜合了多棵決策樹的結(jié)果,可以更好地避免過(guò)擬合。

表2 決策樹、裝袋法及隨機(jī)森林三種方法預(yù)測(cè)準(zhǔn)確度對(duì)比

圖5 單棵決策樹、裝袋法及隨機(jī)森林三種算法測(cè)試誤差對(duì)比

綜上所述,從袋外均方誤差、擬合優(yōu)度和測(cè)試誤差三個(gè)指標(biāo)的角度來(lái)看,隨機(jī)森林優(yōu)于單棵決策樹和裝袋法。因?yàn)殡S機(jī)森林綜合了多棵決策樹的結(jié)果,可以更好地?cái)M合數(shù)據(jù)、避免過(guò)擬合,并且具有更好的泛化能力。

(四)隨機(jī)森林模型的交叉驗(yàn)證誤差

為了全面展示和檢驗(yàn)隨機(jī)森林模型的實(shí)際預(yù)測(cè)性能及穩(wěn)健性,引入隨機(jī)森林模型的交叉驗(yàn)證誤差。該方法可以有效地評(píng)估模型的泛化能力,即其對(duì)未知數(shù)據(jù)的預(yù)測(cè)性能。圖6為隨機(jī)森林模型在不同最大特征數(shù)下的交叉驗(yàn)證誤差。當(dāng)最大特征數(shù)為4時(shí),交叉驗(yàn)證誤差達(dá)到最低點(diǎn),這意味著隨機(jī)森林模型在這個(gè)參數(shù)設(shè)置下表現(xiàn)最好,預(yù)測(cè)的準(zhǔn)確性最高。圖形先降低再上升,說(shuō)明在最大特征數(shù)小于4時(shí),增加特征數(shù)可以提高模型的預(yù)測(cè)能力,但當(dāng)最大特征數(shù)超過(guò)4后,繼續(xù)增加特征數(shù)反而會(huì)導(dǎo)致模型的預(yù)測(cè)能力下降,因?yàn)橐肓诉^(guò)多的噪聲或者不相關(guān)的信息,導(dǎo)致模型過(guò)擬合。對(duì)于新能源汽車股票價(jià)格預(yù)測(cè),通過(guò)設(shè)置最大特征數(shù)為4,可以幫助提高預(yù)測(cè)模型的準(zhǔn)確性、泛化能力和效率。這有助于提高預(yù)測(cè)結(jié)果的可靠性,并為投資者和決策者提供更準(zhǔn)確的股票價(jià)格預(yù)測(cè)信息。

圖6 隨機(jī)森林模型的交叉驗(yàn)證誤差

五、總結(jié)

隨著我國(guó)提出實(shí)現(xiàn)“雙碳”目標(biāo),大力發(fā)展新能源汽車行業(yè)已經(jīng)成為國(guó)家戰(zhàn)略,這為新能源汽車相關(guān)上市公司帶來(lái)巨大發(fā)展機(jī)遇。本文使用2016年7月20日至2023年4月28日上證A股新能源汽車指數(shù)日度數(shù)據(jù)作為研究樣本,采用機(jī)器學(xué)習(xí)中的隨機(jī)森林模型,通過(guò)選擇7個(gè)常用股票投資技術(shù)分析指標(biāo)作為特征變量,預(yù)測(cè)新能源汽車行業(yè)股票價(jià)格,并對(duì)指標(biāo)的特征重要性進(jìn)行對(duì)比,進(jìn)一步對(duì)比隨機(jī)森林模型與決策樹模型及裝袋法的模型預(yù)測(cè)能力。

(一)研究結(jié)論

第一,隨機(jī)震蕩指標(biāo)、換手率指標(biāo)和移動(dòng)平均線收斂/發(fā)散指標(biāo)對(duì)于預(yù)測(cè)新能源汽車行業(yè)股票價(jià)格是最為重要的三個(gè)指標(biāo)。進(jìn)一步分析發(fā)現(xiàn),這些指標(biāo)的偏依賴程度都與其取值呈非線性關(guān)系。這些結(jié)果可以為投資者提供關(guān)于預(yù)測(cè)股票價(jià)格最為重要的信息,從而更好地指導(dǎo)其投資決策。

第二,隨機(jī)森林模型在預(yù)測(cè)股票價(jià)格方面具有較高的準(zhǔn)確性和可靠性。首先,在袋外預(yù)測(cè)誤差、擬合優(yōu)度和測(cè)試誤差方面,隨機(jī)森林模型都表現(xiàn)出了優(yōu)異的性能。這些結(jié)果表明,隨機(jī)森林模型可以在新能源汽車行業(yè)板塊的投資決策中起到關(guān)鍵的作用。其次,相比于裝袋法與決策樹模型,隨機(jī)森林模型在預(yù)測(cè)股票價(jià)格方面具有較高的準(zhǔn)確性和可靠性。最后,對(duì)于新能源汽車股票價(jià)格預(yù)測(cè),經(jīng)過(guò)檢驗(yàn)隨機(jī)森林模型交叉驗(yàn)證誤差,當(dāng)設(shè)置最大特征數(shù)為4時(shí),可以幫助提高預(yù)測(cè)模型的準(zhǔn)確性。因?yàn)樵卺槍?duì)新能源汽車行業(yè)股價(jià)預(yù)測(cè)時(shí),選擇最大特征數(shù)為4時(shí)交叉驗(yàn)證誤差最好,且此時(shí)具有較好的模型的泛化能力。

(二)研究啟示及政策建議

第一,加大新能源汽車相關(guān)上市公司的政策支持力度。隨著國(guó)家對(duì)新能源汽車產(chǎn)業(yè)的戰(zhàn)略支持,相關(guān)上市公司獲得了巨大發(fā)展機(jī)遇。因此,國(guó)家應(yīng)繼續(xù)加大對(duì)新能源汽車產(chǎn)業(yè)的扶持力度,通過(guò)稅收優(yōu)惠、補(bǔ)貼、資金支持等多種政策手段,幫助新能源汽車企業(yè)獲得發(fā)展所需的資金支持,降低企業(yè)融資和運(yùn)營(yíng)成本。

第二,完善新能源汽車股票市場(chǎng)的監(jiān)管體系。本文研究發(fā)現(xiàn)隨機(jī)森林模型可以較好地預(yù)測(cè)新能源汽車股票價(jià)格,這說(shuō)明新能源汽車股票市場(chǎng)存在一定的規(guī)律性。為提高股票市場(chǎng)定價(jià)效率,防止股價(jià)過(guò)度波動(dòng),應(yīng)建立健全新能源汽車股票的監(jiān)管機(jī)制,避免市場(chǎng)操縱和內(nèi)幕交易問(wèn)題,維護(hù)市場(chǎng)秩序。加強(qiáng)新能源汽車行業(yè)的財(cái)政支持和稅收優(yōu)惠以鼓勵(lì)投資,推動(dòng)行業(yè)發(fā)展。

第三,加強(qiáng)新能源汽車股票投資決策能力建設(shè)。相關(guān)部門應(yīng)加強(qiáng)新能源汽車領(lǐng)域的數(shù)據(jù)監(jiān)測(cè)和模型建設(shè)工作,并向投資者廣泛宣傳相關(guān)投資分析方法,幫助投資者提高決策能力和水平。投資者在投資新能源汽車行業(yè)股票時(shí),應(yīng)當(dāng)關(guān)注隨機(jī)震蕩指標(biāo)和相對(duì)強(qiáng)度指標(biāo)等重要的指標(biāo),避免過(guò)度依賴MACD指標(biāo)等不重要的指標(biāo)。同時(shí)應(yīng)當(dāng)綜合考慮多種因素,避免過(guò)度依賴技術(shù)指標(biāo)或者其他單一因素,從而規(guī)避風(fēng)險(xiǎn)。

第四,堅(jiān)持長(zhǎng)期新能源汽車發(fā)展戰(zhàn)略,并加強(qiáng)新能源汽車行業(yè)監(jiān)管,消除市場(chǎng)風(fēng)險(xiǎn)。新能源汽車產(chǎn)業(yè)仍處于發(fā)展階段的初期,國(guó)家應(yīng)采取長(zhǎng)遠(yuǎn)和穩(wěn)定的政策,為企業(yè)提供一致和可預(yù)期的發(fā)展環(huán)境,促進(jìn)新能源汽車產(chǎn)業(yè)快速成長(zhǎng),助力國(guó)家實(shí)現(xiàn)“雙碳”目標(biāo)。針對(duì)新能源汽車行業(yè)股市風(fēng)險(xiǎn),政府要加強(qiáng)對(duì)新能源汽車行業(yè)的監(jiān)管,確保企業(yè)公開透明、誠(chéng)信經(jīng)營(yíng),避免不良企業(yè)的違規(guī)操作和市場(chǎng)扭曲,通過(guò)政策引導(dǎo)和財(cái)政支持,促進(jìn)新能源汽車行業(yè)的發(fā)展,包括技術(shù)創(chuàng)新、產(chǎn)業(yè)升級(jí)、市場(chǎng)擴(kuò)大等方面,從而提高新能源汽車行業(yè)的整體水平和競(jìng)爭(zhēng)力。同時(shí)針對(duì)新能源汽車行業(yè)的上市公司,政府應(yīng)積極考慮稅收優(yōu)惠、信貸扶持等,以鼓勵(lì)更多的投資者關(guān)注并投資新能源汽車行業(yè),推動(dòng)行業(yè)的快速發(fā)展。

(三)研究局限和今后研究方向

本文對(duì)新能源汽車行業(yè)股票價(jià)格預(yù)測(cè)準(zhǔn)確性和可靠性方面進(jìn)行了研究,但存在一定的局限性:一是本文所選取的特征值僅限于七種常見(jiàn)股票市場(chǎng)投資指標(biāo),未涵蓋更多可能影響股價(jià)的潛在因素,如宏觀經(jīng)濟(jì)環(huán)境、政策法規(guī)變化等。二是本文所采用的隨機(jī)森林模型雖然在預(yù)測(cè)表現(xiàn)上優(yōu)于其他機(jī)器學(xué)習(xí)方法,但在實(shí)際應(yīng)用中仍存在一定的局限性,例如對(duì)超大規(guī)模數(shù)據(jù)的處理效率較低。

未來(lái)的研究方向可從以下方面展開:一是可以考慮拓展特征值的選擇范圍,引入更多與新能源汽車行業(yè)相關(guān)的指標(biāo),如技術(shù)創(chuàng)新水平、行業(yè)政策支持度等,以提高預(yù)測(cè)模型的準(zhǔn)確性和全面性。二是可以進(jìn)一步優(yōu)化機(jī)器學(xué)習(xí)算法,提高其對(duì)大規(guī)模數(shù)據(jù)的處理能力和效率,以適應(yīng)現(xiàn)實(shí)應(yīng)用場(chǎng)景的需求,可以結(jié)合深度學(xué)習(xí)等前沿技術(shù),構(gòu)建更加復(fù)雜和精準(zhǔn)的預(yù)測(cè)模型,為新能源汽車行業(yè)的投資決策提供更可靠的參考依據(jù)。

猜你喜歡
裝袋股票價(jià)格汽車行業(yè)
基于GARCH族模型的重慶啤酒股票價(jià)格波動(dòng)研究
時(shí)代不等人,汽車行業(yè)在完成“雙碳”這件事上,責(zé)無(wú)旁貸
新型液動(dòng)食用菌裝袋機(jī)的設(shè)計(jì)要點(diǎn)與應(yīng)用*
汽車行業(yè)最熱最I(lǐng)N資訊,這里看個(gè)夠!
汽車行業(yè) 最熱最I(lǐng)N資訊,這里看個(gè)夠!
板栗的塑料薄膜袋貯藏技術(shù)
論股票價(jià)格準(zhǔn)確性的社會(huì)效益
我國(guó)股票價(jià)格指數(shù)與“克強(qiáng)指數(shù)”的關(guān)系研究
2015中國(guó)汽車行業(yè)發(fā)展趨勢(shì)
線上稱重器給食品裝袋帶來(lái)便捷