文/祁晉東 肖偉 格桑羅布扎西
(西藏大學 西藏自治區(qū)拉薩市 850011)
藏醫(yī)學是祖國傳統(tǒng)醫(yī)學寶庫中的一顆璀璨明珠,它以自身獨特而系統(tǒng)的科學理論和診療方法對世界文明進步產生了積極影響。當前,在回歸自然的潮流下,藏醫(yī)藥逐漸得到人們的認可和推崇。由于目前藏醫(yī)藥研究方法多為經典的藥理學和化學方法,結合體內代謝研究困難巨大,研究深度和廣度明顯不足,所以藏藥方劑配伍規(guī)律一直是藏醫(yī)藥現(xiàn)代化研究的薄弱環(huán)節(jié)。所以在本研究中,結合BP算法率先采用DeepBelief Network對藏藥配伍規(guī)律進行研究,揭示了方劑中隱藏的內在規(guī)律,提高了研發(fā)效率。
藏藥配方與功效有著密切聯(lián)系,它是藏醫(yī)通過確定病證,根據組方原則和配伍配伍,選擇合適的藥材和相應的劑量組合而成。因此要全面研究藏藥方劑的配伍規(guī)律,必須將方劑中的藥材和劑量綜合考慮才有效果。本研究針對藏藥方劑數(shù)據的多維、非線性特征,提出采用BP和DBN兩種算法分別對藏藥配伍規(guī)律進行研究。藏藥方劑配方采用的是文字性語言表述,本研究要用數(shù)學方法研究配伍規(guī)律,就必須將配方與功效進行數(shù)值化處理。本研究中以藏藥診治文集中的藏藥方劑為研究對象,包括不同疾病的藏藥配方的藥材和劑量以及藥方的功效。由示例x和標記γ的集合構成訓練集。對收集的樣本數(shù)據整理分析后進行數(shù)據預處理和編碼,從而得出網絡的輸入輸出數(shù)據。藏藥方劑主要由配方藥材、劑量和功效組成,用xi={藥材1,藥材2,… … 劑量1,劑量2}表示藏藥方劑示例,如表1。用yi={功效1,功效2,功效3,… …}表示藏藥方劑標記,如表2。
將收集的示例集x和標記集γ分別進行編碼如表3和表4,x∪γ得到樣本數(shù)據。
本研究藏藥方劑的基本屬性特征值時輸入層,包括配方中的藥材和對應的劑量。方劑的功效指標是輸出層。由于每個方劑中藥材、功效數(shù)量不一樣,所以我們分別以藥材和功效最多的方劑為標準進行編碼,所以38味藥材和38個劑量二級制編碼后共380個神經元,13個功效二進制編碼后共117個神經元。
BP神經網絡的參數(shù)設置為精度0.001、學習率0.01、動量因子0.9、學習率增長比1.05、學習率下降比0.7。通過Kologorov定律和最終仿真結果確定隱層為3層,每層神經元個數(shù)是分別為300、200、150時模型效果最好。此時激活函數(shù)函數(shù)選擇對數(shù)S型函數(shù)和正切S型函數(shù)。
圖1:BP神經網絡結構
圖2:DBN深度置信網絡結構
根據樣本空間的數(shù)據,構建一個2個隱層的RBM神經網絡,輸入有380維,輸出有117維,隱層節(jié)點數(shù)分別為250和150,最后一層使用BP神經網絡進行微調。DBN深度置信網絡參數(shù)的設置為訓練的精度為0.001,RBM的學習率為0.01,RBM的權值和閾值為0.1,BP神經網絡的學習率為0.1,激活函數(shù)為對數(shù)S型函數(shù)。DBN訓練模型的過程主要分為預訓練和微調這兩個部分。
BP神經網絡結構如圖1所示,DBN深度置信網絡結構如圖2所示。
將藏藥方劑數(shù)值化后,用Matlab 2017a神經網絡工具箱分別構建BP和DBN深度置信網絡,對方劑、劑量、療效之間的聯(lián)系進行非線性映射,找出藏藥方劑配伍的規(guī)律并隱藏在網絡的權值和閾值中。
BP藏藥方劑功效預測如圖3所示,DBN藏藥方劑功效預測如圖4所示。
在預訓練過程中,采用逐層訓練的方法和對比散度算法,使用非監(jiān)督貪婪逐層方法獲取權值,從下到上分別訓練每一層RBM網絡,確保特征向量盡可能映射到不同特征空間時,都盡可能多地保留特征信息。然后根據BP神經網路進行微調,使整個網絡的參數(shù)達到最優(yōu)。
表1:藏藥方劑示例表
表2:藏藥方劑標記表
表3:編碼后的藏藥方劑示例表
表4:編碼后的藏藥方劑標記表
表5:BP神經網絡測試和預測效果
表6:DBN深度信念網絡測試和預測效果
以藏藥診治文集中的藏藥方劑為提取特征的對象,藥材和劑量作為輸入,藥效為輸出,分別采用BP神經網絡和DBN深度置信網絡進行學習。將100個學習樣本中90個用作訓練樣本,其中20個數(shù)據作為測試樣本,剩下的10個樣本做預測。K倍交叉驗證法評估模型,BP神經網絡和DBN深度信念網絡。其測試樣本準確率和預測樣本準確率如表5和表6。
圖3:BP藏藥方劑功效預測
圖4:DBN藏藥方劑功效預測
綜合表5和表6來看,傳統(tǒng)的BP神經網絡雖然可以學習藏藥方劑樣本的特征,但是預測的效果偏低,DBN深度置信網絡相比于傳統(tǒng)的BP神經網絡可以更好的學習方劑的特征,預測的準確度,平均達到83.88%。DBN深度置信網絡結構對于非線性高緯度特征的藏藥方劑數(shù)據具有良好的特征學習能力和預測能力,但是還達不到完全預測真實藏藥功效。
BP神經網絡和DBN深度置信網絡的訓練誤差下降比較如圖5所示,DBN的網絡參數(shù)由多層受限玻爾茲曼機訓練的,而BP神經網絡的網絡參數(shù)是隨機生成,因此DBN的初始誤差、訓練次數(shù)和誤差下降速率上明顯優(yōu)于BP神經網絡。
圖5:BP和DBN誤差下降圖
通過本研究,神經網絡可以學習藏藥方劑的特征,同時對配伍規(guī)律有一定的預測能力,證明了研究思路的可行性。由于收集到樣本數(shù)量和分布上的問題,影響了網絡對于方劑特征的提取,因此會對藏藥方劑療效的預測產生一定的影響。DBN是一種深度學習結構,隨著樣本數(shù)據量的增加,將會得到更高的準確率,在藏藥方劑配伍規(guī)律方面將會有更好的應用前景。
針對目前對藏藥配伍規(guī)律存在的問題,研究可以根據藏藥藥理改進DBN深度置信網絡結構或者構建一種新型的神經網絡群結構,降低非線性映射的維度,提高了算法的效率,從而更好的學習藏藥方劑的特征。另外藏藥方劑的配伍規(guī)律只能儲存在神經網絡結構中,不能通過具體的表達式來反映配伍規(guī)律和方劑間相生相克的作用,這也是需要進一步研究和改善的問題。