国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于近紅外光譜的安胎丸生產(chǎn)年份預(yù)測(cè)方法

2020-08-08 07:39:52鄭恩讓馬晉芳葛發(fā)歡肖環(huán)賢
光譜學(xué)與光譜分析 2020年8期
關(guān)鍵詞:安胎年份正確率

陳 蓓,鄭恩讓*,馬晉芳,葛發(fā)歡,肖環(huán)賢

1. 陜西科技大學(xué)電氣與控制工程學(xué)院,陜西 西安 710021 2. 廣州譜民信息科技有限公司,廣東 廣州 510006 3. 中山大學(xué)藥學(xué)院,廣東 廣州 510006 4. 江西保利制藥有限公司,江西 贛州 341900

引 言

安胎丸是經(jīng)典古方,由當(dāng)歸、 白芍、 白術(shù)、 川穹、 黃芩等五味藥材加工制成,具有安胎養(yǎng)血的功效[1]。隨著人們經(jīng)濟(jì)和生活水平的提高,需求日益增加。市售安胎丸由于藥品的原材料差異,并且隨著藥物生產(chǎn)和保存的時(shí)間、 儲(chǔ)存環(huán)境不同等都使藥效差別較大,會(huì)對(duì)患者帶來一定的損失,制劑的批間差異是其質(zhì)量考量的重要指標(biāo)。衛(wèi)生部藥品標(biāo)準(zhǔn)中采用薄層色譜法對(duì)其中三味藥材進(jìn)行定性鑒別,王雪麗等[2-3]主要采用高效液相色譜(HPLC)化學(xué)檢測(cè)方法對(duì)部分質(zhì)控成分的進(jìn)行定量檢測(cè),這些質(zhì)控方法不僅會(huì)損耗樣品,且檢測(cè)時(shí)間長(zhǎng),檢測(cè)成本高。中藥制劑成分多樣,發(fā)生反應(yīng)機(jī)制復(fù)雜,部分成分尚不明確,單一或者幾種成分含量測(cè)定具有片面性。近紅外光譜(near infrared spectroscopy,NIRS)是利用近紅外光對(duì)化學(xué)物質(zhì)中不同含氫基團(tuán)的吸收信息來進(jìn)行分析、 檢測(cè)的一種新型無損、 快速、 無污染的分析技術(shù)[4],可作為一種整體質(zhì)量評(píng)價(jià)的手段,在中醫(yī)藥質(zhì)控領(lǐng)域,主要應(yīng)用在品種鑒定、 產(chǎn)地鑒別、 品質(zhì)分級(jí)和定量分析等方面[5-6],對(duì)于藥品生產(chǎn)年份質(zhì)控方式的相關(guān)研究未見報(bào)道。

近紅外光譜通常包含大量的波長(zhǎng)變量,一定程度上還會(huì)引入噪聲,通過篩選特征波長(zhǎng)建立模型,可以降低模型的復(fù)雜程度,提高預(yù)測(cè)能力。常用的波長(zhǎng)提取方法有遺傳算法(GA)、 無信息變量消除法(UVE)、 連續(xù)投影算法(successive projection algorithm,SPA)等。王濤等[7]在預(yù)測(cè)胡楊葉含水量中建模對(duì)比,采用SPA波長(zhǎng)選擇算法預(yù)測(cè)精度和相關(guān)度都優(yōu)于GA;經(jīng)UVE篩選之后的波長(zhǎng)變量數(shù)目仍然過于龐大,不能達(dá)到最終的簡(jiǎn)化目標(biāo),SPA算法能大大減少建模所需變量的數(shù)目,比GA和UVE算法得到的變量數(shù)目更少,可提高建模的效率和速度。有研究利用SPA結(jié)合支持向量機(jī)(support vector machine,SVM)有效地對(duì)玉米的霉變程度進(jìn)行了判別,預(yù)測(cè)準(zhǔn)確率達(dá)到了91.11%,但文中SVM參數(shù)是憑經(jīng)驗(yàn)選取的合適參數(shù),并不能保證參數(shù)是最佳的。鑒于此,本文提出一種基于近紅外光譜技術(shù)的安胎丸生產(chǎn)年份預(yù)測(cè)方法,以某藥廠三年的105粒安胎丸為研究對(duì)象,實(shí)驗(yàn)采集其近紅外光譜,應(yīng)用SPA算法去除光譜冗余信息,優(yōu)選出樣本的特征波長(zhǎng),結(jié)合粒子群優(yōu)化(particle swarm optimization, PSO)算法對(duì)SVM分類模型進(jìn)行參數(shù)尋優(yōu),建立PSOSVM分類預(yù)測(cè)模型。通過該方法可以區(qū)分安胎丸生產(chǎn)的不同年份,對(duì)藥物的質(zhì)量評(píng)價(jià)提供一種方法。

1 實(shí)驗(yàn)部分

1.1 儀器

SupNIR1500近紅外光譜儀(聚光科技(杭州)有限公司),Matlab2018(美國(guó)MathWorks公司),Ultimate3000高效液相色譜儀(美國(guó)Thermo公司)。

1.2 樣本采集

從2013年—2015年安胎丸中隨機(jī)抽取樣品15個(gè)批次,批號(hào)為:130501,130502,130601,130602,130701,131101,131201,140401,140402,140501,140502,141103,151001,151002和151101,總共105丸樣品。

利用美國(guó)Thermo公司的Ultimate3000高效液相色譜儀,測(cè)定安胎丸中關(guān)鍵質(zhì)量控制成分的含量,列表統(tǒng)計(jì)如表1所示。

表1 安胎丸中關(guān)鍵質(zhì)控成分的含量測(cè)定統(tǒng)計(jì)表(mg·pill-1)Table 1 Statistical table for determination of key quality control indicator components in Antaipills (mg·pill-1)

利用聚光科技有限公司生產(chǎn)的SupNIR1500近紅外光譜儀采集安胎丸光譜,漫反射模式,波長(zhǎng)掃描范圍是1 000~1 799 nm。每丸樣品重復(fù)掃描三次,得到平均的光譜數(shù)據(jù)保存。105個(gè)樣品的光譜如圖1所示。從圖1可以看出來,近紅外光譜信息重疊嚴(yán)重,特別是2013年和2014年的光譜,很難從峰值位置直觀鑒別各樣品的特征信息。因此,必須采用合適的特征提取辦法,才能對(duì)安胎丸樣品進(jìn)行年份的鑒別。

圖1 105個(gè)安胎丸樣本的光譜圖Fig.1 The spectra of 105Antai pills samples

1.3 數(shù)據(jù)預(yù)處理

根據(jù)年份不同,對(duì)安胎丸樣品對(duì)應(yīng)的光譜數(shù)據(jù)進(jìn)行分類,可以將樣品分為三類,得到的具體分類表如表2。

表2 樣本根據(jù)年份分類表Table 2 The table of sample classification according to year

從表1中數(shù)據(jù)可以看出,生產(chǎn)年份不同,存放的時(shí)間不同,關(guān)鍵質(zhì)控指標(biāo)成分里的含量也不同,體現(xiàn)了生產(chǎn)年份與安胎丸的質(zhì)量有密切關(guān)系,進(jìn)一步說明按年份分類研究對(duì)藥物的質(zhì)量控制有一定的意義。

1.4 建模方法與模型評(píng)價(jià)

近紅外光譜測(cè)量得到的數(shù)據(jù)數(shù)量龐大,光譜波長(zhǎng)較多,相鄰波長(zhǎng)間存在較多的冗余信息和相關(guān)性,如果直接用全光譜建模,必然會(huì)使得建模的時(shí)間和模型的復(fù)雜度增加,模型的預(yù)測(cè)正確率和穩(wěn)定性降低。

具體的實(shí)驗(yàn)建模分析過程如圖2所示。先使用連續(xù)投影算法(SPA)對(duì)采集到的波長(zhǎng)進(jìn)行優(yōu)化,對(duì)輸入進(jìn)行降維,最大程度的消除干擾。得到降維后的光譜數(shù)據(jù)輸入到PSOSVM分類模型中,進(jìn)行分類預(yù)測(cè)。利用分類正確率作為模型的評(píng)價(jià)準(zhǔn)則,其定義為

圖2 實(shí)驗(yàn)數(shù)據(jù)處理流程圖Fig.2 The flow chart of processing experimental data

(1)

在式(1)中N為測(cè)試集樣本數(shù)量,Ni為識(shí)別第i類分類正確的樣本數(shù)量。

1.4.1 波長(zhǎng)優(yōu)化選擇算法SPA

連續(xù)投影算法[8](successive projection algorithm,SPA)屬于前向選擇變量算法,首先選擇一個(gè)波長(zhǎng)變量作為初始值,計(jì)算該變量在未選變量上的投影,將最大投影向量對(duì)應(yīng)的波長(zhǎng)作為新的待選變量,依次迭代,直到內(nèi)部交互驗(yàn)證均方根誤差(RMSECV)達(dá)到最小,選出最佳波長(zhǎng)變量數(shù)N及波長(zhǎng)變量集合Y。SPA算法實(shí)現(xiàn)步驟如下:

(1) 光譜矩陣Xn×p(其中n為樣本數(shù),p為待選波長(zhǎng)變量)標(biāo)準(zhǔn)化;

(2) 隨機(jī)選取初始迭代波長(zhǎng):從X中隨機(jī)選擇一個(gè)列向量Xj,記為列向量Xk(0),k(0)=1,2,3…,p;

(3)將光譜矩陣X中剩余的列向量記為S,S={j,1≤j≤p,j?k(0),k(1),…,k(n-1)};

(4) 分別計(jì)算xj對(duì)剩余列向量S的投影Pxj,

(2)

(5)定義k(n)=arg[max(‖Pxj‖,k∈s)]為N-1個(gè)投影值中的最大;

(6)將最大投影值對(duì)應(yīng)的波長(zhǎng)變量作為下次迭代的初始值:

xj=Pxj,j∈S

(7) 令i=i+1,如果i

(8) 將優(yōu)化降維后得到的所有波長(zhǎng)組合在一起,表示為集合Y:

Y={xk(n):n=1,2,…,N-1}

SPA算法可以從全部波段里提取出特征波長(zhǎng),能夠幾乎消除原始光譜矩陣中的冗余信息,將優(yōu)化降維后的特征波長(zhǎng)輸入到后面的建模中,能夠顯著增加模型正確率和運(yùn)算速度。

1.4.2 分類建模算法PSOSVM

支持向量機(jī)(support vector machine,SVM)是在統(tǒng)計(jì)學(xué)的VC維理論基礎(chǔ)上發(fā)展起來的機(jī)器學(xué)習(xí)方法,在1995年由Vapnik首先提出[9],具有理論完備、 分類準(zhǔn)確率高、 泛化性能好等優(yōu)點(diǎn),能夠解決小樣本、 非線性和高維數(shù)據(jù)劃分的問題,主要用于模式識(shí)別和非線性回歸,它的思想是建立一個(gè)分類超平面作為決策曲面,使正例和反例之間的隔離邊緣最大化。SVM引入核函數(shù)K(x,xi)巧妙地解決了非線性分類問題,SVM有很多不同的核函數(shù),由于徑向基RBF核函數(shù)能夠逼近任何非線性函數(shù),具有很好的學(xué)習(xí)能力,因此選擇RBF核函數(shù),表達(dá)式如式(3)

K(x,xi)=exp(-γ‖x-xi‖2),γ>0

(3)

但是,SVM模型中懲罰參數(shù)C和核函數(shù)參數(shù)γ的選取對(duì)分類的正確率影響很大。僅依賴于經(jīng)驗(yàn)值的試湊是不可行的。

粒子群優(yōu)化(particle swarm optimization,PSO)算法是計(jì)算智能領(lǐng)域基于群體智能的優(yōu)化算法之一,算法概念源于對(duì)人工生命和鳥群捕食行為的研究[10],采用仿生智能算法進(jìn)行參數(shù)尋優(yōu),不用遍歷所有參數(shù)組,目前已經(jīng)廣泛應(yīng)用于神經(jīng)網(wǎng)絡(luò)、 函數(shù)優(yōu)化等其他算法中。

PSOSVM算法的流程如圖3所示,將PSO算法用于支持向量機(jī)的參數(shù)優(yōu)化,可以降低優(yōu)化過程的計(jì)算代價(jià),提高分類的正確率[11]。

圖3 PSOSVM算法的流程圖Fig.3 Flow chart of the PSOSVM algorithm

2 結(jié)果與討論

2.1 優(yōu)選特征波長(zhǎng)

實(shí)驗(yàn)采集的近紅外光譜波長(zhǎng)掃描范圍1 000~1 799 nm,共有800個(gè)波長(zhǎng)變量,如果直接作為分類模型的輸入,輸入量過大,訓(xùn)練時(shí)間過長(zhǎng)。SPA通過最小化變量之間的共線性,實(shí)現(xiàn)了最優(yōu)波長(zhǎng)的選擇,通過SPA對(duì)近紅外光譜數(shù)據(jù)進(jìn)行降維。

針對(duì)上述105丸樣品,隨機(jī)選擇80個(gè)作為訓(xùn)練集,25個(gè)為測(cè)試集,數(shù)據(jù)隨機(jī)分布,符合建模要求。選取質(zhì)控成分中含量最高,且含量聚類與年份分類吻合的黃芩苷的含量為基準(zhǔn),根據(jù)測(cè)試集的內(nèi)部交叉驗(yàn)證均方根誤差值最小,由圖4可看出,提取最佳的特征波長(zhǎng)有11個(gè),分別是:{1 692,1 714,1 405,1 001,1 114,1 478,1 514,1 788,1 202,1 014,1 164} nm,其重要程度依次遞減。

圖4 優(yōu)選特征波長(zhǎng)分布圖Fig.4 The distribution map of preferred characteristic wavelength

2.2 分類模型分析對(duì)比

利用訓(xùn)練集80個(gè)樣本的光譜數(shù)據(jù)及年份分類,采用SPA-PSOSVM算法建立安胎丸生產(chǎn)年份鑒別的分析模型,以分類的正確率作為評(píng)價(jià)準(zhǔn)則。隨機(jī)給定SVM分類模型參數(shù),其中懲罰參數(shù)C=1和核函數(shù)參數(shù)γ=1,同時(shí)將建模結(jié)果與SVM和SPA-SVM兩種算法作對(duì)比,得到的測(cè)試集的分類結(jié)果對(duì)比如圖5—圖7所示。

圖5 基于SVM的測(cè)試集分類結(jié)果Fig.5 The graph of test classification result based on SVM

圖6 基于SPA-SVM的測(cè)試集分類結(jié)果Fig.6 The graph of test classification result based on SPA-SVM

圖7 基于SPA-PSOSVM的測(cè)試集分類結(jié)果Fig.7 The graph of test classification result based on SPA-PSOSVM

為更清楚地對(duì)比三種方法的效果,匯總仿真中部分變量、 參數(shù)和結(jié)果,如表3所示(其中黑體字表示本文所用方法)。

從表3對(duì)比可知,近紅外光譜數(shù)據(jù)通過三種方法分類建模測(cè)試,第一種方法,單一的SVM建模參與變量數(shù)目最多,正確率最低;第二種方法,全光譜數(shù)據(jù)經(jīng)過SPA降維后,變量數(shù)目從800個(gè)降到11個(gè),再利用SVM建模,正確率提高到92%,模型耗時(shí)大大縮短,體現(xiàn)了SPA算法可有效提高正確率和降低建模時(shí)間;第三種方法,即本方法,光譜經(jīng)SPA降維后,再通過PSO尋優(yōu),SVM分類算法的最佳懲罰參數(shù)C和核函數(shù)參數(shù)γ(BestC=16.406 4,γ=0.773 39),正確率達(dá)到了100%,由于尋優(yōu)過程消耗時(shí)間,模型耗時(shí)高于單一的SVM分類方法。綜合考慮,基于近紅外光譜結(jié)合SPA-PSOSVM建立安胎丸的年份分類預(yù)測(cè)模型正確率最高,性能較好(見圖7)。

表3 三種方法測(cè)試效果對(duì)比表Table 3 Table of testcomparison of three methods

3 結(jié) 論

對(duì)安胎丸近紅外光譜數(shù)據(jù)進(jìn)行SPA優(yōu)化降維,在全波段提取了11個(gè)特征波長(zhǎng),占全部波長(zhǎng)的1.375%,建立了PSOSVM分類模型,預(yù)測(cè)模型正確率達(dá)到了100%,表明SPA算法是一種比較有效的特征波長(zhǎng)提取辦法,建立的SPA-PSOSVM分類模型正確率明顯高于SVM和SPA-SVM,可以有效地用于安胎丸的生產(chǎn)年份分類預(yù)測(cè),為藥材原材料的優(yōu)選、 廠家生產(chǎn)工藝的革新和偽劣過期藥品的判別提供參考和依據(jù)。根據(jù)中藥的主要質(zhì)控成分含量隨存儲(chǔ)時(shí)間的變化特點(diǎn),本方法可為中藥的質(zhì)量評(píng)價(jià)提供一種快速無損的判定方式。

猜你喜歡
安胎年份正確率
特殊的一年
消癥安胎湯聯(lián)合西藥在早期復(fù)發(fā)性流產(chǎn)患者中的應(yīng)用效果
和胃安胎飲輔助治療妊娠劇吐的臨床觀察
門診分診服務(wù)態(tài)度與正確率對(duì)護(hù)患關(guān)系的影響
補(bǔ)腎安胎飲對(duì)腎虛型不明原因復(fù)發(fā)性流產(chǎn)患者的臨床療效
中成藥(2019年12期)2020-01-04 02:03:12
固腎安胎丸聯(lián)合低分子肝素干預(yù)復(fù)發(fā)性流產(chǎn)婦女血栓前狀態(tài)的療效
中成藥(2017年12期)2018-01-19 02:06:29
生意
品管圈活動(dòng)在提高介入手術(shù)安全核查正確率中的應(yīng)用
生意
什么是閏年?
陈巴尔虎旗| 涟水县| 巴林左旗| 怀远县| 繁昌县| 西青区| 龙里县| 鸡泽县| 寻乌县| 曲周县| 成武县| 靖州| 铅山县| 迭部县| 扎兰屯市| 金门县| 当雄县| 富平县| 伽师县| 图木舒克市| 莱阳市| 周宁县| 浮梁县| 法库县| 青冈县| 乐亭县| 喀什市| 兴安县| 安吉县| 富川| 济宁市| 荔波县| 汝城县| 怀柔区| 郎溪县| 盈江县| 汾阳市| 虹口区| 三门县| 廊坊市| 乐东|