王小亮,楊靜,梁亞偉,林芳
陜西省食品藥品檢驗(yàn)研究院,陜西 西安 710065
鹽酸氨溴索是臨床上廣泛應(yīng)用的祛痰藥物,具有療效肯定、毒副作用小的優(yōu)點(diǎn)。其作用機(jī)制是通過增加呼吸道漿液的分泌,同時(shí)抑制黏液的分泌并裂解黏蛋白中的多糖纖維,從而稀釋痰液促進(jìn)痰液排出[1-3]。目前的使用劑型包括:片劑(普通片、緩釋片、分散片、口崩片等),膠囊(普通膠囊、緩釋膠囊),口服液和氣霧劑等。其中,鹽酸氨溴索口服液避免了片劑和膠囊?guī)淼耐萄蕟栴},其應(yīng)用前景日益寬廣。
公開報(bào)道的鹽酸氨溴索近紅外鑒別方法主要集中在鹽酸氨溴索片劑的定量分析[4]、快速識(shí)別檢測(cè)[5]、注射用鹽酸氨溴索的近紅外一致性檢驗(yàn)?zāi)P徒⒌龋?],針對(duì)鹽酸氨溴索口服液的近紅外定性鑒別或定量分析還未見相關(guān)文獻(xiàn)。
本研究基于鹽酸氨溴索口服液樣本近紅外漫反射光譜,進(jìn)行其定量預(yù)測(cè)模型建模,實(shí)現(xiàn)了對(duì)鹽酸氨溴索口服液的快速檢驗(yàn)。
Matrix-F 近紅外光譜儀(德國(guó)Bruker 公司),配有1.5 m 長(zhǎng)固體光纖探頭;銦鎵砷(InGaAs)檢測(cè)器;OPUS5.5 光譜分析軟件(德國(guó)Bruker 公司);BP211D電子分析天平(德國(guó)賽多利斯公司);MATLAB R2010 商業(yè)數(shù)學(xué)軟件(美國(guó)MathWorks 公司)。
陜西省食品藥品檢驗(yàn)研究院國(guó)家評(píng)價(jià)性抽驗(yàn)樣品,包含22 個(gè)廠家共計(jì)123 批次鹽酸氨溴索口服液樣品,共兩種規(guī)格,分別為0.3 g/100 mL 和0.6 g/100 mL。
按照《中國(guó)藥典》2020 年版二部,采用高效液相色譜法測(cè)定鹽酸氨溴索口服液的含量,123 批樣品含量測(cè)定結(jié)果以mg/mL 表示,其中標(biāo)示含量為0.3 g/100 mL 的樣品有91 批,含量分布在2.87~3.12 mg/mL 范圍內(nèi);標(biāo)示含量為0.6 g/100 mL 的樣品有32 批,含量分布在5.77~6.20 mg/mL 范圍內(nèi),見圖1。
圖1 所有樣本的含量分布
在進(jìn)行含量預(yù)測(cè)模型建模時(shí),選取100 批次樣品為訓(xùn)練集,剩余的23 批次樣品為預(yù)測(cè)集,訓(xùn)練集和預(yù)測(cè)集樣品的前兩個(gè)主成分分布見圖2,訓(xùn)練集和預(yù)測(cè)集樣本均勻分布,均可以表征樣本的有效信息。
圖2 樣本的前兩個(gè)主成分分布圖
采用透反射測(cè)量方式,以固體光纖探頭配合1號(hào)液體附件直接測(cè)量采集樣品近紅外(NIR)圖譜。光譜掃描范圍為12 000~4 000 cm-1,分辨率8 cm-1,掃描次數(shù)64 次,每批樣品測(cè)定3 次,使用平均光譜建模。最終獲得的樣本光譜見圖3。
圖3 經(jīng)平均后的近紅外建模光譜
支持向量回歸算法是支持向量機(jī)在回歸問題上的應(yīng)用,支持向量機(jī)在近紅外快速檢驗(yàn)領(lǐng)域已經(jīng)得到了廣泛應(yīng)用,包括將其分類和回歸算法應(yīng)用于食品和藥品的產(chǎn)地鑒別、摻偽定性分析、含量預(yù)測(cè)等[7-10]。
采用絕對(duì)百分比均值誤差mAPE(mean absolute percentage error)和均方根誤差RMSE(root mean square error)對(duì)模型的預(yù)測(cè)性能進(jìn)行評(píng)價(jià),MAPE表征模型預(yù)測(cè)相對(duì)誤差的均值,RMSE 表征模型預(yù)測(cè)誤差的標(biāo)準(zhǔn)差,MAPE 和RMSE 越小,表征模型的預(yù)測(cè)精度越高。MAPE 和RMSE 計(jì)算方法如下:
式中,yk表示第k個(gè)樣本的真實(shí)值,表示第k個(gè)樣本的預(yù)測(cè)值,n為樣本數(shù)。
液體樣品選擇光譜范圍應(yīng)避開溶劑吸收峰,而純水的O-H 伸縮振動(dòng)在6 950 cm-1的一級(jí)倍頻和5 155 cm-1合頻吸收峰較強(qiáng),且譜帶較寬,而其中的活性成分的吸收較弱,建模時(shí)應(yīng)避開。同時(shí),應(yīng)避開邊緣效應(yīng),小于10 000 cm-1或大于4 250 cm-1一般不選。故最終選擇的光譜范圍為6 100~5 400 cm-1和8 200~7 400 cm-1。
光譜預(yù)處理可以有效剔除對(duì)建模精度提高無貢獻(xiàn)甚至降低建模精度的無用信息,不同光譜預(yù)處理方法對(duì)應(yīng)的模型預(yù)測(cè)精度對(duì)比見表1,多元散射校正預(yù)處理對(duì)應(yīng)的MAPE 值和RMSE 值均為四種預(yù)處理方法中的最優(yōu)值,因此,建模選用經(jīng)過多元散射校正后的光譜數(shù)據(jù)。
表1 不同光譜預(yù)處理方法對(duì)應(yīng)的模型預(yù)測(cè)精度
圖4 經(jīng)多元散射校正預(yù)處理后的樣本光譜
支持向量回歸中合適的核函數(shù)不但可以獲得更好的預(yù)測(cè)效果,還可以在一定程度上消除不平衡樣本的消極影響。常用的核函數(shù)包括線性核函數(shù)、徑向基核函數(shù)、多項(xiàng)式核函數(shù)和反曲核函數(shù)。選取不同核函數(shù)所建立的定量預(yù)測(cè)模型的預(yù)測(cè)精度見表2,采用徑向基核函數(shù)所建立的預(yù)測(cè)模型可以獲得最優(yōu)預(yù)測(cè)結(jié)果。
表2 不同核函數(shù)對(duì)應(yīng)的模型預(yù)測(cè)精度
回歸模型的參數(shù)選擇主要是對(duì)懲罰因子c 和核函數(shù)參數(shù)g 的優(yōu)化。采用蟻群算法進(jìn)行模型參數(shù)c和g 的優(yōu)化,設(shè)定初始蟻群規(guī)模為80,最大迭代代數(shù)為100,c 和g 的優(yōu)化區(qū)間為[0.001,10],最終獲得的RMSE 隨迭代代數(shù)的變化曲線見圖5,最優(yōu)的c 和g 分別為6.561 1 和1.100 4,對(duì)應(yīng)的RMSE為0.133 36。
圖5 回歸模型參數(shù)優(yōu)化結(jié)果
根據(jù)光譜預(yù)處理、核函數(shù)和參數(shù)c、g 的選擇結(jié)果,最終確定的定量預(yù)測(cè)模型建模參數(shù)選取見表3。
表3 定量預(yù)測(cè)模型建模參數(shù)
所建立的定量預(yù)測(cè)模型對(duì)訓(xùn)練集樣本的含量預(yù)測(cè)結(jié)果及相關(guān)性見圖6,最大絕對(duì)誤差為0.17 mg/mL,預(yù)測(cè)均方根誤差RMSE 為0.149 3 mg/mL,預(yù)測(cè)值和真實(shí)值的相關(guān)系數(shù)達(dá)到了0.996 5,說明預(yù)測(cè)值和真實(shí)值顯著相關(guān)。
圖6 訓(xùn)練集樣本含量預(yù)測(cè)結(jié)果及相關(guān)性:A.含量預(yù)測(cè);B.相關(guān)性
同樣,圖7 給出了預(yù)測(cè)集樣本的含量預(yù)測(cè)結(jié)果及相關(guān)性,最大絕對(duì)誤差為0.20 mg/mL,預(yù)測(cè)均方根誤差RMSE 為0.152 0 mg/mL,相關(guān)系數(shù)為0.994 7,詳細(xì)結(jié)果見表4。
表4 預(yù)測(cè)集樣本含量預(yù)測(cè)值與真實(shí)值
圖7 預(yù)測(cè)集樣本含量預(yù)測(cè)結(jié)果及相關(guān)性:A.含量預(yù)測(cè);B.相關(guān)性
本研究基于鹽酸氨溴索口服液樣本近紅外漫反射光譜,進(jìn)行其定量預(yù)測(cè)模型建模,實(shí)現(xiàn)了對(duì)鹽酸氨溴索口服液的快速檢驗(yàn)。選取多元散射校正預(yù)處理方法,核函數(shù)為徑向基核函數(shù)時(shí),所建立模型的預(yù)測(cè)精度最高。對(duì)訓(xùn)練集和預(yù)測(cè)集樣本的最大預(yù)測(cè)誤差分別為0.17 mg/mL 和0.20 mg/mL,相關(guān)系數(shù)分別為0.996 5 和0.994 7。所建立的定量模型建模方法,具有過程簡(jiǎn)單、預(yù)測(cè)準(zhǔn)確的特點(diǎn),拓展了近紅外快速檢驗(yàn)和定量預(yù)測(cè)的新途徑。