柳鵬 熊旺平 晏燕
摘? 要:中醫(yī)藥數(shù)據(jù)在許多領(lǐng)域中具有廣泛的應(yīng)用,但由于數(shù)據(jù)缺乏,導(dǎo)致中醫(yī)藥領(lǐng)域的發(fā)展受到限制。因此,文章提出了一種基于LSTM的中醫(yī)藥數(shù)據(jù)增強(qiáng)方法,以生成更多的中醫(yī)藥數(shù)據(jù),以提高中醫(yī)藥領(lǐng)域的應(yīng)用價(jià)值。研究從已有的中醫(yī)藥數(shù)據(jù)中構(gòu)建了一個(gè)基于LSTM的生成模型,并通過實(shí)驗(yàn)驗(yàn)證了該方法的有效性。實(shí)驗(yàn)結(jié)果表明,基于LSTM的中醫(yī)藥數(shù)據(jù)增強(qiáng)方法可以生成與真實(shí)數(shù)據(jù)相似的數(shù)據(jù),從而可以為中醫(yī)藥領(lǐng)域的研究和應(yīng)用提供更多的數(shù)據(jù)資源。
關(guān)鍵詞:中醫(yī)藥數(shù)據(jù)增強(qiáng);LSTM;生成模型;數(shù)據(jù)資源
中圖分類號(hào):TP18;TP391.1? 文獻(xiàn)標(biāo)識(shí)碼:A? 文章編號(hào):2096-4706(2023)19-0117-06
A Chinese Medicine Data Enhancement Method Based on LSTM
LIU Peng1, XIONG Wangping1, YAN Yan2
(1.College of Computer, Jiangxi University of Chinese Medicine, Nanchang? 330004, China;
2.Fengcheng People's Hospital of Jiangxi Province, Yichun? 331100, China)
Abstract: TCM data has a wide range of applications in many fields, but the lack of data has led to the development limitation of the TCM field. Therefore, this paper proposes a TCM data enhancement method based on LSTM to generate more TCM data in order to improve the application value in the field of TCM. In this research, a generation model based on LSTM is constructed from existing TCM data, and the effectiveness of the method is verified through experiments. The experimental results show that the TCM data enhancement method based on LSTM can generate data similar to the real data, and thus can provide more data resources for research and application in the field of TCM.
Keywords: Traditional Chinese Medicine data enhancement; LSTM; generative model; data resource
0? 引? 言
隨著科技的不斷發(fā)展,深度學(xué)習(xí)已經(jīng)成為一種熱門的研究方向。在醫(yī)學(xué)領(lǐng)域,深度學(xué)習(xí)已經(jīng)被廣泛應(yīng)用于醫(yī)療影像分析、疾病診斷和治療等方面。然而,在中醫(yī)藥領(lǐng)域,由于數(shù)據(jù)的質(zhì)量和數(shù)量限制,深度學(xué)習(xí)的應(yīng)用仍然面臨許多挑戰(zhàn)。
在中醫(yī)藥領(lǐng)域,數(shù)據(jù)增強(qiáng)[1]是一種解決數(shù)據(jù)不足問題的有效方法。數(shù)據(jù)增強(qiáng)可以通過對(duì)原始數(shù)據(jù)進(jìn)行多種方式的擴(kuò)充來生成新的數(shù)據(jù)集,從而提高模型的泛化能力和魯棒性[2]。本文探討了一種基于LSTM的中醫(yī)藥數(shù)據(jù)增強(qiáng)方法。
長短期記憶網(wǎng)絡(luò)(LSTM)是一種常用的循環(huán)神經(jīng)網(wǎng)絡(luò)[3],它能夠有效地處理序列數(shù)據(jù)。本文的方法是利用LSTM模型來生成新的中醫(yī)藥數(shù)據(jù),具體來說,是將已有的中醫(yī)藥數(shù)據(jù)作為輸入序列,通過訓(xùn)練LSTM模型來生成新的中醫(yī)藥數(shù)據(jù)。通過這種方法,可以有效地?cái)U(kuò)充原始數(shù)據(jù)集,從而提高模型的表現(xiàn)。
本文的主要貢獻(xiàn)如下:首先,本文提出了一種基于LSTM的中醫(yī)藥數(shù)據(jù)增強(qiáng)方法,可以有效地?cái)U(kuò)充中醫(yī)藥數(shù)據(jù)集;其次,對(duì)比了使用增強(qiáng)數(shù)據(jù)和不使用增強(qiáng)數(shù)據(jù)的模型性能,證明了數(shù)據(jù)增強(qiáng)的有效性;最后,還對(duì)LSTM模型進(jìn)行了深入的分析,探討了其在中醫(yī)藥數(shù)據(jù)增強(qiáng)中的應(yīng)用。
本文的組織結(jié)構(gòu)如下:第二部分介紹了相關(guān)工作,包括數(shù)據(jù)增強(qiáng)和LSTM模型;第三部分詳細(xì)描述了本文提出的基于LSTM的中醫(yī)藥數(shù)據(jù)增強(qiáng)方法;第四部分通過實(shí)驗(yàn)驗(yàn)證了本文的方法的有效性;最后,本文在第五部分進(jìn)行了總結(jié)和展望。
1? 相關(guān)工作
本文提出了一種基于LSTM的中醫(yī)藥數(shù)據(jù)增強(qiáng)方法。在相關(guān)工作部分,本文將介紹一些與本文相關(guān)的研究工作,包括數(shù)據(jù)增強(qiáng)和LSTM模型的應(yīng)用。
數(shù)據(jù)增強(qiáng)是一種常用的解決數(shù)據(jù)不足問題的方法。在圖像領(lǐng)域,數(shù)據(jù)增強(qiáng)的方法包括隨機(jī)旋轉(zhuǎn)、隨機(jī)縮放、隨機(jī)裁剪等[4]。在自然語言處理領(lǐng)域,數(shù)據(jù)增強(qiáng)的方法包括詞向量替換、句子重構(gòu)等[5]。在醫(yī)學(xué)領(lǐng)域,數(shù)據(jù)增強(qiáng)的方法包括對(duì)醫(yī)療影像進(jìn)行旋轉(zhuǎn)、鏡像等操作[6]。這些方法都可以有效地?cái)U(kuò)充數(shù)據(jù)集,提高模型的泛化能力和魯棒性。
LSTM是一種常用的循環(huán)神經(jīng)網(wǎng)絡(luò),它能夠有效地處理序列數(shù)據(jù)。在自然語言處理領(lǐng)域,LSTM模型已經(jīng)被廣泛應(yīng)用于語言模型、機(jī)器翻譯和情感分析等方面[7]。在醫(yī)學(xué)領(lǐng)域,LSTM模型也被用于疾病預(yù)測(cè)和藥物發(fā)現(xiàn)等任務(wù)中[8]。
在中醫(yī)藥領(lǐng)域,也有一些相關(guān)的研究工作。例如,劉金壘等人[9]通過挖掘中醫(yī)藥領(lǐng)域的知識(shí)圖譜,構(gòu)建了一個(gè)中醫(yī)藥知識(shí)圖譜庫,以幫助醫(yī)生和研究人員更好地理解中醫(yī)藥知識(shí)。此外,蘆霞[10]將深度學(xué)習(xí)應(yīng)用于中藥配方的研究,通過建立中藥配方的預(yù)測(cè)模型,來預(yù)測(cè)其功效和治療效果。
然而,在中醫(yī)藥數(shù)據(jù)增強(qiáng)方面,尚未有太多的研究。因此,本文提出的基于LSTM的中醫(yī)藥數(shù)據(jù)增強(qiáng)方法具有一定的創(chuàng)新性和實(shí)用性。通過擴(kuò)充中醫(yī)藥數(shù)據(jù)集,本文可以更好地應(yīng)用深度學(xué)習(xí)模型來解決中醫(yī)藥領(lǐng)域中的問題,為中醫(yī)藥研究和臨床實(shí)踐提供更好的支持。
2? LSTM模型的構(gòu)造
2.1? 數(shù)據(jù)集和數(shù)據(jù)預(yù)處理
在采集數(shù)據(jù)的過程中可能會(huì)出現(xiàn)錯(cuò)誤,這會(huì)使得部分?jǐn)?shù)據(jù)缺失。缺失數(shù)據(jù)會(huì)影響模型的預(yù)測(cè),因此必須對(duì)缺失數(shù)據(jù)進(jìn)行處理。本文采用上一個(gè)時(shí)間表和下一個(gè)時(shí)間表相同時(shí)間段的數(shù)據(jù)的均值來填補(bǔ)缺失值。
由于原始輸入數(shù)據(jù)的不同特征所用的評(píng)價(jià)指標(biāo)的量綱不同,會(huì)影響數(shù)據(jù)分析的最終結(jié)果。為了消除這種指標(biāo)間的量綱影響,將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化[11]。經(jīng)過標(biāo)準(zhǔn)化處理后,各指標(biāo)將處于同一數(shù)量級(jí)。同時(shí),標(biāo)準(zhǔn)化有助于提高神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度以及提高模型的精度。本文采用最大最小標(biāo)準(zhǔn)化方法(Min-Max Normalization)又稱離差標(biāo)準(zhǔn)化[12],將數(shù)據(jù)映射到[0,1]之間,轉(zhuǎn)換函數(shù)如式(1)所示:
其中xmin表示該血藥濃度特征數(shù)據(jù)中的最小值;xmax表示該特征數(shù)據(jù)的最大值;xn表示將要?dú)w一化的值; 表示經(jīng)過歸一化之后的值。
2.2? 長短期記憶網(wǎng)絡(luò)
本文中提出的基于LSTM的中醫(yī)藥數(shù)據(jù)增強(qiáng)方法,主要包括以下幾個(gè)步驟:數(shù)據(jù)預(yù)處理、LSTM模型構(gòu)造、數(shù)據(jù)增強(qiáng)和模型訓(xùn)練。
在LSTM模型構(gòu)造中,本文采用了經(jīng)典的LSTM結(jié)構(gòu),用于處理中醫(yī)藥序列數(shù)據(jù)。LSTM模型由多個(gè)LSTM層和一個(gè)全連接層組成,其中每個(gè)LSTM層包括多個(gè)LSTM單元。每個(gè)LSTM單元包含一個(gè)輸入門、一個(gè)遺忘門和一個(gè)輸出門,用于控制輸入數(shù)據(jù)的流動(dòng)和記憶數(shù)據(jù)的存儲(chǔ)。LSTM的內(nèi)部結(jié)構(gòu)模型如圖1所示。
式(2)中:Gt表示通過遺忘門后的信息,σ()表示sigmoid激活函數(shù),ωf表示遺忘門中輸入的特征向量的權(quán)重矩陣,[ht-1,xt]表示由兩個(gè)向量拼接成的新向量,xt表示當(dāng)前的輸入向量,ht-1表示上一次的輸出向量,bf表示遺忘門的偏置值。式(3)中:ωi表示輸入門中輸入的特征向量的權(quán)重矩陣,bi表示輸入門的偏置值。式(4)中? 表示需要更新的信息,Ct表示輸入門更新后的信息。式(5)表示t時(shí)刻的輸出,并作為歷史信息被保留。式(6)表示最終輸出的表達(dá)式,輸出整個(gè)LSTM模型的最終結(jié)果。
在模型的輸出層,本文采用了Softmax函數(shù),將模型輸出的結(jié)果轉(zhuǎn)化為概率分布。模型的損失函數(shù)采用交叉熵?fù)p失函數(shù)[13],用于衡量模型的預(yù)測(cè)結(jié)果與真實(shí)結(jié)果之間的差異。模型的訓(xùn)練使用反向傳播算法進(jìn)行優(yōu)化,更新模型的參數(shù)以最小化損失函數(shù)。
值得注意的是,為了防止模型過擬合,本文在模型中加入了dropout[14]和正則化[15]等技術(shù)。dropout技術(shù)可以隨機(jī)丟棄一部分神經(jīng)元,防止模型對(duì)某些特征的過度依賴。而正則化技術(shù)則可以限制模型的參數(shù)大小,防止模型過度復(fù)雜。
3? 實(shí)驗(yàn)結(jié)果與分析
3.1? 實(shí)驗(yàn)數(shù)據(jù)介紹
本文使用的數(shù)據(jù)是大承氣湯血藥濃度實(shí)驗(yàn)數(shù)據(jù)和UCI數(shù)據(jù)集中的Tetuan City power consumption和AirQualityUCI。大承氣湯血藥濃度數(shù)據(jù)來源于江西中醫(yī)藥大學(xué)中醫(yī)病因生物學(xué)重點(diǎn)實(shí)驗(yàn)室。
大承氣湯血藥濃度實(shí)驗(yàn)數(shù)據(jù)包含6組大的時(shí)間序列樣本,每組樣本包含12個(gè)時(shí)間點(diǎn),總共72條樣本。每個(gè)時(shí)間點(diǎn)有9個(gè)成分的血藥濃度,分別是柚皮苷、橙皮苷、新橙皮苷、蘆薈大黃素、和厚樸酚、厚樸酚、大黃酸、大黃素和大黃酚,大承氣湯血藥濃度的部分實(shí)驗(yàn)數(shù)據(jù)集如表1所示。
UCI數(shù)據(jù)選取Tetuan City power consumption (TCPC)和AirQualityUCI,樣本量分別為9 357和52 416條,UCI數(shù)據(jù)集的詳細(xì)描述見http://archive.ics.uci.edu/ml/。數(shù)據(jù)集的具體描述如表2所示。
3.2? 評(píng)價(jià)方法介紹
在本文中使用的評(píng)價(jià)指標(biāo)為:均方根誤差(RMSE),平均絕對(duì)誤差(MAE),均方對(duì)數(shù)誤差(MSLE)。各指標(biāo)的計(jì)算方法如式(7)~(9):
在上述的三個(gè)式子中:n表示所有訓(xùn)練樣本的數(shù)量,yl表示待預(yù)測(cè)數(shù)據(jù)的真實(shí)結(jié)果, 表示模型輸出的預(yù)測(cè)結(jié)果,RMSE,MAE和MSLE表示模型的預(yù)測(cè)結(jié)果與真實(shí)結(jié)果之間的誤差,誤差越小,模型的精度也越高。
3.3? 實(shí)驗(yàn)環(huán)境
本文所提出的LSTM數(shù)據(jù)增強(qiáng)模型是在Windows 10操作系統(tǒng)上進(jìn)行的實(shí)驗(yàn),設(shè)備的內(nèi)存為32 GB,處理器為Intel Core i7-9700K CPU @ 3.60 GHz 3.60 GHz,GPU為Nvidia GeForce GTX 1660 Ti 6GB GDDR6。本文使用的編程語言版本為Python 3.7.10,運(yùn)行框架及版本為TensorFlow 2.5.0和Keras 2.4.3。
3.4? 模型有效性
為了驗(yàn)證LSTM模型的有效性,本文將LSTM分別跟PLS,XGBoost和RNN進(jìn)行比較,結(jié)果通過評(píng)價(jià)指標(biāo)RMSE,MAE和MSLE來評(píng)估,RMSE,MAE和MSLE的值越小,模型的精度越高。實(shí)驗(yàn)結(jié)果如表3所示。
根據(jù)表3的實(shí)驗(yàn)結(jié)果可知,在預(yù)測(cè)三個(gè)數(shù)據(jù)集的四個(gè)模型中,LSTM的擬合效果最好,在三個(gè)數(shù)據(jù)集中的平均RMSE(12.49)、MAE(8.12)、MSLE(0.51)最小,而XGBoost模型的平均RMSE(15.87)、MAE(10.79)、MSLE(0.73)在三個(gè)數(shù)據(jù)集中的擬合結(jié)果最差。
大承氣湯實(shí)驗(yàn)數(shù)據(jù)屬于小樣本數(shù)據(jù),在實(shí)驗(yàn)中,LSTM的RMSE小于XGBoost、RNN和PLS。四個(gè)模型的RMSE分別為13.08、12.52、11.34和11.28。LSTM的MAE小于XGBoost、RNN和PLS。四個(gè)模型的MAE分別為8.89、7.23、7.46和6.73。LSTM的MSLE小于XGBoost、RNN和PLS。四個(gè)模型的MSLE分別為0.43、0.26、0.15和0.11。從結(jié)果來看,LSTM模型比PLS和XGBoost模型的預(yù)測(cè)效果好,說明LSTM也可以很好地處理小樣本數(shù)據(jù)。
在UCI數(shù)據(jù)中,AirQualityUCI數(shù)據(jù)集屬于中等數(shù)據(jù)量樣本,Tetuan City power consumption數(shù)據(jù)集屬于大數(shù)據(jù)量樣本。在各類數(shù)據(jù)量中,LSTM的效果都是最好的,在AirQualityUCI數(shù)據(jù)集中,RMSE分別為13.66、12.56、12.40和11.34,MAE分別為8.45、
8.88、8.51和7.98,MSLE分別為0.86、0.79、0.78和0.64。在Tetuan City power consumption數(shù)據(jù)集中,RMSE分別為20.88、21.66、17.09和14.84,MAE分別為15.02、16.48、11.26和10.64,MSLE分別為0.92、0.82、0.8和0.78。結(jié)果表明,LSTM無論在大承氣湯數(shù)據(jù)集中還是UCI數(shù)據(jù)集中,預(yù)測(cè)的準(zhǔn)確率都是最高的,在預(yù)測(cè)效果方面優(yōu)于其他模型。
為了更直觀地顯示實(shí)驗(yàn)結(jié)果,分別繪制圖表以體現(xiàn)均方根誤差(RMSE),平均絕對(duì)誤差(MAE),均方對(duì)數(shù)誤差(MSLE)的波動(dòng)情況。由于各個(gè)數(shù)據(jù)集的RMSE、MAE和MSLE的數(shù)量級(jí)不同,為了方便比較各數(shù)據(jù)集在不同方法上的RMSE、MAE和MSLE的波動(dòng)情況,將實(shí)驗(yàn)結(jié)果數(shù)據(jù)按照RMSE、MAE和MSLE分別繪制出圖2、圖3和圖4。
在本文中,從表2中可以知道,TCPC屬于大型數(shù)據(jù)集,AirQualityUCI屬于中型數(shù)據(jù)集,而DCQT屬于小型數(shù)據(jù)集。從實(shí)驗(yàn)結(jié)果來看,本文提到的方法在這三類數(shù)據(jù)上都有較好的表現(xiàn),而從圖2、圖3和圖4可以直觀地看出LSTM在各項(xiàng)指標(biāo)中效果相比XGBoost、RNN以及PLS都有明顯的提升。
3.5? 數(shù)據(jù)增強(qiáng)
本文的數(shù)據(jù)是時(shí)間序列的,訓(xùn)練模型的方式是通過輸入一行起始時(shí)間的血藥濃度數(shù)據(jù)來預(yù)測(cè)下一個(gè)時(shí)間點(diǎn)的血藥濃度數(shù)據(jù),直到完成12個(gè)時(shí)間點(diǎn)的預(yù)測(cè)。因此,本文實(shí)現(xiàn)數(shù)據(jù)增強(qiáng)的方法是將多個(gè)起始時(shí)間的數(shù)據(jù)批量輸入模型,起始時(shí)間的數(shù)據(jù)來自原始數(shù)據(jù)。為了避免數(shù)據(jù)過擬合,輸入的數(shù)據(jù)將添加一個(gè)噪音,噪音的范圍限制在原值的15%的大小,原始數(shù)據(jù)添加噪聲后變?yōu)橐粋€(gè)新的值。新的數(shù)據(jù)經(jīng)過模型處理后,可以獲得增強(qiáng)數(shù)據(jù)。
例如從大乘氣湯的數(shù)據(jù)集中隨機(jī)挑選5組數(shù)據(jù),在圖表中展示如圖5所示。
選取每組數(shù)據(jù)的第一行屬性值并添加隨機(jī)噪音,然后經(jīng)過LSTM模型處理后,可以得到新的增強(qiáng)數(shù)據(jù)。例如使用圖5中的5組數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng),如果模型對(duì)數(shù)據(jù)進(jìn)行6次預(yù)測(cè)(每次預(yù)測(cè)的數(shù)據(jù)添加的噪音是隨機(jī)的),可以得到6倍于原始數(shù)據(jù)的數(shù)據(jù)量,實(shí)驗(yàn)結(jié)果如圖6所示。
通過圖5和圖6的對(duì)比,可以看出模型生成的新樣本與原始樣本都處在一個(gè)相似的規(guī)律和范圍內(nèi)。說明模型能實(shí)現(xiàn)對(duì)原始數(shù)據(jù)的數(shù)據(jù)增強(qiáng)。
實(shí)驗(yàn)結(jié)果表明,LSTM模型可以有效地對(duì)中醫(yī)藥數(shù)據(jù)進(jìn)行增強(qiáng),并可以在不增加數(shù)據(jù)采集和標(biāo)注成本的情況下提高預(yù)測(cè)模型的精度。通過使用LSTM模型生成合成數(shù)據(jù),可以擴(kuò)展原始數(shù)據(jù)集的規(guī)模,并使預(yù)測(cè)模型更好地捕捉數(shù)據(jù)的特征。此外,與其他模型相比,LSTM在預(yù)測(cè)性能方面表現(xiàn)出更好的結(jié)果,特別是在處理序列數(shù)據(jù)的長期依賴關(guān)系方面。
4? 結(jié)? 論
本研究使用LSTM模型進(jìn)行中醫(yī)藥數(shù)據(jù)增強(qiáng),并通過與其他模型的對(duì)比,證明了該方法能夠有效提高預(yù)測(cè)模型的性能。結(jié)果表明,LSTM模型生成的合成數(shù)據(jù)可以增加數(shù)據(jù)集的規(guī)模,并提高模型的精度,同時(shí)避免了增加數(shù)據(jù)采集和標(biāo)注成本的問題。本文還將LSTM模型與其他模型進(jìn)行了比較,包括XGBoost、RNN和PLS,并在RMSE、MAE和MSLE等指標(biāo)上進(jìn)行了評(píng)估。實(shí)驗(yàn)結(jié)果表明,LSTM模型在預(yù)測(cè)中醫(yī)藥數(shù)據(jù)方面表現(xiàn)優(yōu)異。這表明,對(duì)于序列數(shù)據(jù)這種類型的預(yù)測(cè)任務(wù),LSTM模型可以更好地處理長期依賴關(guān)系,從而提高預(yù)測(cè)精度。
本文提出了一種有效的中醫(yī)藥數(shù)據(jù)增強(qiáng)方法,證明了LSTM模型在這種方法中的有效性。此外,通過與其他模型的對(duì)比,還證明了LSTM模型在序列數(shù)據(jù)預(yù)測(cè)任務(wù)中的優(yōu)越性。這些結(jié)果對(duì)于中醫(yī)藥數(shù)據(jù)的分析和預(yù)測(cè)具有實(shí)際意義,并對(duì)其他序列數(shù)據(jù)的分析和預(yù)測(cè)也具有參考價(jià)值。
參考文獻(xiàn):
[1] 宋輝,苑龍祥,郭雙權(quán).基于數(shù)據(jù)增強(qiáng)和特征注意力機(jī)制的灰狼優(yōu)化算法-優(yōu)化殘差神經(jīng)網(wǎng)絡(luò)變壓器故障診斷方法 [J/OL].現(xiàn)代電力:1-9(2023-02-27).https://www.cnki.net/KCMS/detail/detail.aspx?dbcode=CAPJ&dbname=CAPJLAST&filename=XDDL20230223002&v=MjQ0NjRaT3NOWXdrN3ZCQVM2amg0VEF6bHEyQTBmTFQ3UjdxZFpPWm5GQzNsVmIvQUlscz1QU25QWXJHNEhOTE1yWTFH.
[2] 曹鋼鋼,王幫海,宋雨.結(jié)合數(shù)據(jù)增強(qiáng)的跨模態(tài)行人重識(shí)別輕量網(wǎng)絡(luò) [J/OL].計(jì)算機(jī)工程與應(yīng)用:1-11(2023-02-16).http://kns.cnki.net/kcms/detail/11.2127.tp.20230214.1543.064.html.
[3] 宋剛,張?jiān)品?,包芳勛,?基于粒子群優(yōu)化LSTM的股票預(yù)測(cè)模型 [J].北京航空航天大學(xué)學(xué)報(bào),2019,45(12):2533-2542.
[4] 李陽,高軾奇.基于數(shù)據(jù)增強(qiáng)及注意力機(jī)制的肺結(jié)節(jié)檢測(cè)系統(tǒng) [J].北京郵電大學(xué)學(xué)報(bào),2022,45(4):25-30.
[5] 黃國棟,徐久珺,馬傳香.基于BERT-Encoder和數(shù)據(jù)增強(qiáng)的語法糾錯(cuò)模型 [J/OL].湖北大學(xué)學(xué)報(bào):自然科學(xué)版:1-7(2023-03-03).http://kns.cnki.net/kcms/detail/42.1212.N.20230302.
1647.004.html.
[6] 曾子明,張瑜.基于數(shù)據(jù)增強(qiáng)和多任務(wù)學(xué)習(xí)的突發(fā)公共衛(wèi)生事件謠言識(shí)別研究 [J/OL].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn):1-16(2023-02-10).http://kns.cnki.net/kcms/detail/10.1478.g2.20230208.
1132.001.html.
[7] 孔繁鈺,陳綱.基于改進(jìn)雙向LSTM的評(píng)教文本情感分析 [J].計(jì)算機(jī)工程與設(shè)計(jì),2022,43(12):3580-3587.
[8] 秦佳杰,陳聰,關(guān)靜,等.基于滯后效應(yīng)的多變量LSTM模型對(duì)兒童呼吸道疾病就診人數(shù)的預(yù)測(cè) [J].中華疾病控制雜志,2022,26(9):1057-1064+1116.
[9] 劉金壘,惠小珊,張振鵬,等.基于中醫(yī)診療指南的冠心病知識(shí)圖譜構(gòu)建 [J].中國實(shí)驗(yàn)方劑學(xué)雜志,2023,29(7):208-215.
[10] 蘆霞.基于神經(jīng)網(wǎng)絡(luò)的感冒中藥配方模型建立和性能考察 [D].南昌:華東交通大學(xué),2011.
[11] 董雪情,荊瀾濤,田瑞,等.基于LSTM模型的變壓器頂層油溫預(yù)測(cè)方法 [J].電力學(xué)報(bào),2023,38(1):38-45.
[12] WU T,LIU C C,HE C. Prediction of Regional Temperature Change Trend Based on LSTM Algorithm [C]//2020 IEEE 4th Information Technology, Networking, Electronic and Automation Control Conference (ITNEC). Chongqing:IEEE,2020,1:62-66.
[13] HUANG H H,WANG T Y,LIU J,et al. Predicting Urban Rail Traffic Passenger Flow Based on LSTM [C]//2019 IEEE 3rd Information Technology, Networking, Electronic and Automation Control Conference (ITNEC).Chengdu:IEEE,2019:616-620.
[14] 于家斌,尚方方,王小藝,等.基于遺傳算法改進(jìn)的一階滯后濾波和長短期記憶網(wǎng)絡(luò)的藍(lán)藻水華預(yù)測(cè)方法 [J].計(jì)算機(jī)應(yīng)用,2018,38(7):2119-2123+2135.
[15] AKITA R,YOSHIHARA A,MATSUBARA T,et al. Deep Learning for Stock Prediction Using Numerical and Textual Information [C]//2016 IEEE/ACIS 15th International Conference on Computer and Information Science (ICIS).Okayama:IEEE,2016:1-6.
作者簡(jiǎn)介:柳鵬(1995—),男,漢族,江西宜春人,碩士研究生在讀,研究方向:醫(yī)藥數(shù)據(jù)挖掘;熊旺平(1982—),男,漢族,江西豐城人,教授,博士,研究方向:數(shù)據(jù)挖掘;晏燕(1986—),女,漢族,江西豐城人,主管護(hù)師,碩士,研究方向:醫(yī)藥信息學(xué)。
收稿日期:2023-03-09
基金項(xiàng)目:國家自然科學(xué)基金(61762051);國家自然科學(xué)基金(82160955);國家自然科學(xué)基金(82274680)