国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于信任模型的中醫(yī)藥方劑相似度計(jì)算方法

2021-11-17 07:09金濤偉冷榮偉
計(jì)算機(jī)仿真 2021年2期
關(guān)鍵詞:方劑證型信任度

金濤偉,冷榮偉,張 迪,劉 暢

(長(zhǎng)春中醫(yī)藥大學(xué),吉林 長(zhǎng)春 130117)

1 引言

中醫(yī)學(xué)方劑即傳承數(shù)千年中醫(yī)藥知識(shí)的主要知識(shí)來(lái)源,其已經(jīng)被收錄中醫(yī)藥圖書(shū)高達(dá)上萬(wàn)種,而方劑就是中醫(yī)藥領(lǐng)域內(nèi)最為關(guān)鍵的研究?jī)?nèi)容,面對(duì)海量的方劑數(shù)據(jù),要想得到所需求的信息,并非易事。信息技術(shù)的逐漸發(fā)展,使得人們能夠把各種中醫(yī)藥方劑放置在數(shù)據(jù)庫(kù)內(nèi)永久存儲(chǔ)。當(dāng)前已經(jīng)存在數(shù)十個(gè)中醫(yī)藥大學(xué)與研究所,構(gòu)建了不同規(guī)模的中醫(yī)藥信息數(shù)據(jù)庫(kù)。但由于中醫(yī)藥方劑數(shù)據(jù)內(nèi)會(huì)出現(xiàn)兩種方劑或多種方劑,并且這些方劑會(huì)出現(xiàn)十分相似的狀態(tài),例如一種方劑和另外一種方劑相比,缺少一味藥劑組成成分,其它的成分則完全相同,所以,這些方劑之間存在某種關(guān)聯(lián)或潛在關(guān)系。當(dāng)前,中醫(yī)藥方劑相似度模型,大致是通過(guò)功效與組成成分兩個(gè)方面進(jìn)行相似度的分析。但只通過(guò)這兩方面并不能有效且精確地獲得其相似度數(shù)值,過(guò)程也較為復(fù)雜。

因此,本文提出了一種基于信任模型的中醫(yī)藥方劑相似度的計(jì)算方法。

2 信任模型下中醫(yī)藥方劑相似度計(jì)算

信任模型實(shí)際上即依靠歷史記錄與其它評(píng)測(cè)信息對(duì)中醫(yī)藥方劑的信任值進(jìn)行計(jì)算處理,通過(guò)信任值計(jì)算,為方劑剔除冗余成分。信任反應(yīng)即一種方劑對(duì)另一種方劑的相似度綜合評(píng)價(jià),通過(guò)評(píng)價(jià)對(duì)方劑的將來(lái)提供可靠的預(yù)測(cè)。

2.1 直接信任計(jì)算

直接信任度即指方劑憑借自身的直接交互經(jīng)驗(yàn),而獲得的對(duì)其它方劑的信任程度。

1)滿意度評(píng)測(cè):在兩種方劑完成一次交互后,依靠方劑主成分評(píng)測(cè)方劑次成分提供的藥劑,通過(guò)s描述,s∈[0,1],其中,0代表完全不同,1代表完全相同,s的值越大,就代表相似度越高。

2)事務(wù)干擾因子:在中醫(yī)藥方劑內(nèi)的各種成分一般不會(huì)出現(xiàn)變化,而冗余[1]成分如果添加在主體方劑中,可能會(huì)導(dǎo)致方劑的治愈效果降低。所以,在計(jì)算方劑信任度時(shí)加入事務(wù)干擾因子,通過(guò)TF來(lái)表述事務(wù)的關(guān)鍵程度。如果TF值越大,就證明事務(wù)對(duì)方劑的信任值干擾越大,反之,該事務(wù)對(duì)方劑信任值的干擾就越小。TF∈(0,1],其距離通過(guò)主體方劑決定。

擬定方劑主成分i與方劑次成分j之間交互[2]的次數(shù)是m次,那么方劑主成分i對(duì)方劑次成分j的直接信任評(píng)測(cè)Evalij是

(1)

其中,s(i,j,m)代表方劑主成分i與方劑次成分j的第m次交互時(shí)相似度的評(píng)價(jià),TF(i,j,m)代表方劑主成分i與方劑次成分j的第m次交互內(nèi)事務(wù)的干擾因子。

3)時(shí)間衰減函數(shù):為了精確估算方劑內(nèi)主次成分的信任度,信任模型還需要考慮時(shí)間因素對(duì)信任值的干擾。距離目前時(shí)間相差不遠(yuǎn)的信任評(píng)測(cè)更能夠映射方劑主次成分的信任度[3],應(yīng)給予較高的權(quán)重,距離目前時(shí)間較遠(yuǎn)的信任評(píng)測(cè)對(duì)方劑主次成分信任度估算干擾較小,應(yīng)給予較低的權(quán)重。針對(duì)這一問(wèn)題,本文使用時(shí)間衰減函數(shù)對(duì)不同時(shí)間段內(nèi)方劑的主次成分進(jìn)行信任度的干擾估算。時(shí)間衰減函數(shù)[4]如下所示

(2)

其中,ρ代表調(diào)節(jié)因子,0<ρ<1,a>0,T代表方劑目前的時(shí)間區(qū)段,Tk代表最近一次交互開(kāi)始的時(shí)間區(qū)段,λ代表方劑每天劃分的時(shí)間區(qū)段數(shù),fk代表時(shí)間區(qū)段Tk里交互的時(shí)間衰減因子。

通過(guò)式(2)能夠看出,時(shí)間衰減函數(shù)f代表所有時(shí)間區(qū)段里都存在一種對(duì)應(yīng)的衰減因子,同時(shí)0

圖1 時(shí)間衰減因子變化圖

擬定方劑主成分i與次成分j在Tk個(gè)時(shí)間區(qū)段[5]里完成了n次交互,那么主成分i對(duì)次成分j的直接信任值TDij就是

TDij=Evalij×fk

(3)

其中,Evalij代表主成分i對(duì)次成分j的直接信任評(píng)測(cè),fk代表時(shí)間區(qū)段Tk的衰減因子。

2.2 推薦信任估算

推薦信任度TR就是,方劑憑借其它方劑的推薦信息而獲得的對(duì)某方劑的信任強(qiáng)度。推薦可信度RC就是方劑對(duì)另一種方劑所給予的評(píng)估信任程度。

評(píng)測(cè)相似度Simij,在中醫(yī)學(xué)方劑內(nèi),所有方劑的推薦可信度都是不同的,可信度高的方劑供給的推薦信息要比可信度低的推薦更為信賴。在進(jìn)行評(píng)估的時(shí)候,會(huì)更為愿意相信和自身信息相差無(wú)幾的方劑,所以需要給予較高的權(quán)重。評(píng)測(cè)相似度Simij是為了表示方劑主成分i與次成分j的評(píng)測(cè)相似度。如果Simij值較大,就證明主成分i和次成分j對(duì)剩余成分的看法越一致,就是主成分i與次成分j的相似度較高。本文利用余弦相似度函數(shù)對(duì)兩種成分之間的相似度進(jìn)行描述,描述的公式如下所示

(4)

其中,C(i,j)代表主成分i和次成分j的公共交互成分集合。

所以,主成分i對(duì)次成分j的推薦信任度TRij是

(5)

2.3 綜合信任估算

兩種方劑之間的綜合信任Tij就是通過(guò)期間的直接信任與推薦信任所組成的

Tij=αDTij+(1-α)RTij

(6)

認(rèn)定求信方劑和受信方劑之間的相似度代表期間的綜合信任權(quán)值,就是

α=BSij

(7)

在經(jīng)驗(yàn)豐富,非常信任自身評(píng)測(cè)時(shí),能夠挑選人為評(píng)定的方式。但通常來(lái)講,人為評(píng)定會(huì)存在較強(qiáng)的主觀意識(shí),合理性與科學(xué)性不足,因此就需要通過(guò)一些比較客觀的權(quán)重進(jìn)行側(cè)向評(píng)定。

當(dāng)前的方劑之間信任值進(jìn)行交互方劑的信任決策大致存在兩種:

1)依靠綜合信任值的距離挑選交互。

這種方式符合日常的交互習(xí)慣,通過(guò)挑選信任值最好的兩種方劑進(jìn)行交互,但這種方式存在缺點(diǎn):信任值較高的方劑總會(huì)被選中進(jìn)行交互,其它方劑交互的機(jī)會(huì)就會(huì)變少,沒(méi)有機(jī)會(huì)提升自身的信任值,新的方劑與存在交叉[8]交互歷史的方劑比較難出頭,信任度較高的方劑獲得中醫(yī)學(xué)方劑交互請(qǐng)求較多,壓力較大。

2)憑借綜合信任值收集隨機(jī)挑選交互。

如果存在n種備選方劑能夠挑選其進(jìn)行試用,其綜合信任值是Tij,那么某種方劑j被挑選進(jìn)行試用的幾率Pj能夠通過(guò)式(8)進(jìn)行估算

(8)

隨機(jī)交互方式在確保信任值較高方劑被選中幾率較大基礎(chǔ)下,有效地解決了第一種方式所產(chǎn)生的缺點(diǎn)[9],因此使用該方法進(jìn)行信任決策,確定方劑交互。

通過(guò)信任模型得到了方劑間存在的關(guān)聯(lián)結(jié)果與信任程度,使方劑相似度的計(jì)算更為便捷,但由于方劑的種類較多,并且每種方劑之間的組成成分也各不相同,因此需要通過(guò)一種分布形式得到計(jì)算方劑相似度的規(guī)范化因子。

2.4 方劑相似度計(jì)算

在得到方劑成分分布的情況下,方劑就能夠通過(guò)其相應(yīng)的主題分布進(jìn)行映射描述[10],估算兩種方劑的相似度能夠轉(zhuǎn)換為估算主題分布的相似度。一般狀態(tài)下,通常使用DKL來(lái)估算幾率分布的尺寸,DKL如下所示

(9)

式中,p與q分別為兩種幾率分布。因?yàn)镈KL并不是對(duì)稱的,就是DKL(p,q)≠DKL(q,p),因此使用DKL的對(duì)稱方式,其計(jì)算公式如下所示

Dr(p,q)=rDKL(p,rp+(1-r)q)+(1-r)

DKL(q,rq+(1-r)q)

(10)

式中,r代表控制參數(shù)。

在中醫(yī)藥領(lǐng)域內(nèi),中醫(yī)學(xué)方劑相似度計(jì)算里,把文檔、主體、詞項(xiàng)的三者關(guān)聯(lián)構(gòu)建轉(zhuǎn)換為方劑、證型、組成成分。所以在中醫(yī)學(xué)領(lǐng)域,LDA為在方劑和組成成分之間以幾率的形式構(gòu)建證型關(guān)聯(lián)[11],同時(shí)依靠方劑、證型幾率分布估算出方劑和方劑之間存在的相似度。在中醫(yī)學(xué)方劑內(nèi)所有方劑都是通過(guò)一些組成成分形成的,所以,能夠直接通過(guò)組成成分進(jìn)行相似度計(jì)算,不同于網(wǎng)絡(luò)文檔一樣需要對(duì)文檔進(jìn)行分詞處理。

在中醫(yī)證型模型內(nèi)基于LDA的大致方法流程如下所示:

步驟1:把數(shù)據(jù)放置在LDA主題模型內(nèi)進(jìn)行處理,處理流程如下:

1)憑借先驗(yàn)幾率P(di)挑選一種中藥方劑di。

2)憑借方劑證型的Dirichlet先驗(yàn)分布?內(nèi)取樣產(chǎn)生中醫(yī)學(xué)方劑di的證型分布θi,就是,證型分布θi,是通過(guò)超參數(shù)為?的Dirichlet分布產(chǎn)生的。

3)從證型的多項(xiàng)式分布θi內(nèi)采集樣本產(chǎn)生中醫(yī)學(xué)方劑di的第j種組成成分證型Tij。

4)憑借證型、組成成分Dirichlet先驗(yàn)分布b內(nèi)采集樣本產(chǎn)生證型Tij相應(yīng)的組成成分分布φi,即組成成分分布φi是通過(guò),超參數(shù)為b的Dirichlet分布產(chǎn)生的。

5)從組成成分的多項(xiàng)式分布φi內(nèi)采集樣本[12]的最后生成成分Cij。

步驟2:去除1)內(nèi)2)方劑相應(yīng)的證型分布θi,所有方劑通過(guò)相應(yīng)的證型分布描述,對(duì)證型分布數(shù)據(jù)進(jìn)行兩兩KL距離DKL(p,q)計(jì)算,計(jì)算出的值就是兩種方劑的相似度。

3 仿真證明

仿真環(huán)境為Intel Celeron Tulatin1GHz CPU和384MB S是D內(nèi)存的硬件環(huán)境和MATLAB6.1的軟件環(huán)境。

為了證明本文方法的實(shí)用性,擬定了兩組實(shí)驗(yàn):

1)樣本為五種已知相似度重復(fù)類型與相似度重復(fù)程度的中醫(yī)方劑,使用本方法進(jìn)行相似度計(jì)算,通過(guò)比較已知數(shù)據(jù)來(lái)確定本文方法的計(jì)算方式是否可行。實(shí)驗(yàn)結(jié)果如表1所示。

表1 本文算法的相似度計(jì)算結(jié)果

通過(guò)表1能夠看出,通過(guò)本文方法計(jì)算出的相似度結(jié)果,與實(shí)際的相似度計(jì)算結(jié)果相差不大,并且這些誤差較小,可忽略不計(jì),不會(huì)對(duì)實(shí)際方劑造成影響。

在此基礎(chǔ)上,對(duì)相似度計(jì)算時(shí)間進(jìn)行記錄,并與運(yùn)算目標(biāo)時(shí)間進(jìn)行了對(duì)比,記錄結(jié)果如圖2所示。

圖2 本文方法相似度計(jì)算時(shí)間記錄結(jié)果

如圖2所示,五種方劑相似度計(jì)算時(shí)間與運(yùn)算目標(biāo)時(shí)間吻合度較高,具有較高的實(shí)際應(yīng)用性。

2)為了定量評(píng)測(cè)相似重復(fù)記錄檢測(cè)效果對(duì)各種方劑相似度計(jì)算的干擾,建造實(shí)驗(yàn)數(shù)據(jù)生成器,通過(guò)1)內(nèi)的五種方劑,使用本文方法進(jìn)行相似重復(fù)記錄檢測(cè),憑借查準(zhǔn)率與查全率兩種閾值對(duì)檢測(cè)結(jié)果進(jìn)行評(píng)定。查準(zhǔn)率與查全率分別通過(guò)式(11)與(12)進(jìn)行計(jì)算。

(11)

(12)

式中:Z為檢測(cè)出的相似重復(fù)記錄總量;Q為相似重復(fù)記錄的總量;Y為系統(tǒng)中的相關(guān)信息的總量。

結(jié)果如圖3所示。

圖3 本文算法得到的檢測(cè)結(jié)果

通過(guò)圖3能夠看出,在查全率上,本文方法的指標(biāo)都能夠穩(wěn)定在0.700~1.000之間,這是因?yàn)楸疚姆椒ㄍㄟ^(guò)構(gòu)建信任模型來(lái)計(jì)算方劑之間的信任值,通過(guò)信任值確定方劑指標(biāo)間存在的誤差。而在查準(zhǔn)率指標(biāo)上,能夠看出,查準(zhǔn)率一直維持在1.000~0.900之間,因?yàn)榉絼?shù)量的增加,查準(zhǔn)率會(huì)出現(xiàn)輕微的浮動(dòng),但幅度基本都維持在90%以上不會(huì)對(duì)方劑造成嚴(yán)重的影響,證明本文方法能夠?qū)χ嗅t(yī)方劑進(jìn)行較為精確的搜索,不會(huì)出現(xiàn)遺漏和誤差較大的問(wèn)題,并且不會(huì)因?yàn)橹貜?fù)記錄檢測(cè)的效果干擾到方劑之間的相似度計(jì)算結(jié)果。

4 結(jié)束語(yǔ)

為了剔除中醫(yī)學(xué)方劑內(nèi)存在的冗余信息,本文提出了一種基于信任模型的中醫(yī)藥方劑相似度的計(jì)算方法,通過(guò)構(gòu)建信任模型計(jì)算方劑之間存在的關(guān)聯(lián),進(jìn)行相似度計(jì)算。但信任模型需要進(jìn)行多次迭代才能夠達(dá)到期望閾值,一旦計(jì)算量過(guò)大就會(huì)導(dǎo)致模型構(gòu)建時(shí)間增加,降低計(jì)算效率,因此下一步的研究即:優(yōu)化信任模型,使模型在構(gòu)造階段就能夠保持平穩(wěn)狀態(tài),減少計(jì)算量。

猜你喜歡
方劑證型信任度
中藥方劑,新冠肺炎患者的福音
何謂中醫(yī)“七方”
中醫(yī)有“七方”
全球民調(diào):中國(guó)民眾對(duì)政府信任度最高
探討?zhàn)囿w注射法聯(lián)合中藥馬齒莧方劑治療跖疣
嶺南地區(qū)冠心病中醫(yī)證型及證素分布的地域性特征研究
膝骨性關(guān)節(jié)炎的證候分析及辨證用藥研究進(jìn)展
不同證型慢性支氣管炎穴位貼敷的療效比較
178例新診斷2型糖尿病中醫(yī)證型及流行病學(xué)調(diào)查
2014,如何獲得信任