張坤峰,王 政,曹君杰,張志強,喬延江,5*,徐 冰*
( 1.北京中醫(yī)藥大學(xué) 中藥信息學(xué)系,北京 102400;2.北京市科委 中藥生產(chǎn)過程控制與質(zhì)量評價北京市重點 實驗室,北京 102400;3.教育部中藥制藥與新藥開發(fā)關(guān)鍵技術(shù)工程研究中心,北京 102400;4.北京康仁堂 藥業(yè)有限公司,北京 101301;5.中藥配方顆粒關(guān)鍵技術(shù)國家地方聯(lián)合工程研究中心,天津 301700)
中藥片劑、顆粒劑、膠囊劑、丸劑、散劑等口服固體制劑的成型過程多以粉末為原料,粉末的性質(zhì)對制劑工藝與成品質(zhì)量有很大影響[1]?;诜垠w學(xué)基本理論對中藥粉末的性質(zhì)進行評價和控制,對指導(dǎo)中藥制劑工藝設(shè)計和生產(chǎn)過程控制具有重要意義。本課題組前期通過物理指紋圖譜表征了中藥提取物粉末的物理性質(zhì)[2],并基于物性參數(shù)建立了中藥原輔料粉末物性數(shù)據(jù)庫iTCM[3],該數(shù)據(jù)庫目前收錄了91批輔料和73批中藥浸膏粉的性質(zhì)參數(shù)。Dai等[4]基于iTCM數(shù)據(jù)庫建立了粉體壓縮行為分類系統(tǒng),指導(dǎo)直接壓片處方設(shè)計。
國外藥用輔料數(shù)據(jù)庫,如NIPTE-FDA數(shù)據(jù)庫[5],除收錄粉末物料的物理性質(zhì)參數(shù)外,還采用近紅外(Near-infrared,NIR)、拉曼、中紅外光譜等手段表征材料理化和結(jié)構(gòu)信息,以及評價物料批間和批內(nèi)質(zhì)量的一致性。其中,近紅外光譜屬于分子振動光譜,產(chǎn)生于C—H、O—H、N—H、S—H等含氫基團非諧振動的倍頻和組合頻[6],具有操作簡便、分析速度快、不破壞樣品、不需要其他化學(xué)試劑、易于實現(xiàn)現(xiàn)場(At-line)和在線(On-line)分析的特點。目前,NIR在制藥領(lǐng)域應(yīng)用廣泛,如測定粉末混合均勻度、監(jiān)測物料水分和粒徑、監(jiān)測物料晶型的轉(zhuǎn)變等[7-9]。
本文采用便攜式近紅外光譜儀對多來源、多批次、代表性中藥口服固體制劑原輔料進行快速分析,建立了原輔料近紅外光譜數(shù)據(jù)集,并存儲至iTCM數(shù)據(jù)庫,擴展了iTCM數(shù)據(jù)庫物性參數(shù)類型?;贜IR光譜數(shù)據(jù),探討物料分類、物性預(yù)測的方法和可能性,可為中藥原輔料粉末質(zhì)量控制、制劑處方及工藝設(shè)計提供參考。
光譜采集采用便攜式近紅外光譜儀(NIR-S-G1型,譜鉅科技股份有限公司),配備ISC-NIRScan-GUI-VS-WPF軟件。該近紅外光譜儀采用微電子機械系統(tǒng)(Micro-electro-mechanical systems,MEMS)加工工藝,由微傳感器、信號處理及控制電路、通訊接口和電源等部件組成。數(shù)據(jù)分析采用The Unscrambler 9.7(CAMO公司)、SIMCA 13.0(Umetrics公司)、Matlab2016b(MathWorks公司)軟件。
共收集149批粉末樣品,包括79批中藥浸膏粉和70批藥用輔料。79批中藥浸膏粉由北京康仁堂藥業(yè)有限公司提供,藥用部位包括根及根莖、果實、種子、地上部分等。70批藥用輔料均為購買,供應(yīng)商和批號等信息可查看iTCM數(shù)據(jù)庫[3],包括填充劑、稀釋劑、崩解劑、黏合劑和潤滑劑等。
將待測粉末松散填裝于直徑2.7 cm,高2 cm圓柱形盒內(nèi),輕輕振搖使表面平整。手持NIR-S-G1型近紅外光譜儀,將掃描窗口貼近粉末樣品表面,采用漫反射方式采集光譜。NIR光譜掃描范圍為900~1 700 nm,以近紅外光譜儀內(nèi)置背景為參比,掃描次數(shù)為32次,可編程增益放大器(PGA Gain)設(shè)置為64,光學(xué)分辨率為10 nm。在同一個樣品表面的不同部位測量3次,取其平均光譜作為該樣品的原始光譜。測試后用洗耳球吹掃掃描窗口。在整個實驗過程中,環(huán)境相對濕度保持在14%~50%,近紅外光譜儀的系統(tǒng)溫度保持在28.0~40.0 ℃。
采集的近紅外光譜數(shù)據(jù)中除包含樣品自身理化性質(zhì)信息外,還包含了儀器噪聲和雜散光等無關(guān)信息。標準正態(tài)變量(Standard normal variate,SNV)變換和多元散射校正(Multiplicative scatter correction,MSC)可以用來消除顆粒分布不均及顆粒大小不同產(chǎn)生的散射影響。MSC與SNV線性相關(guān),兩種方法的處理結(jié)果相似[10],但MSC假定光散射與波長及樣品的濃度變化無關(guān),故對組分性質(zhì)變化較寬的樣品處理效果較差。樣品背景顏色和粉體密度差異等因素常導(dǎo)致NIR光譜出現(xiàn)明顯的位移或漂移,可采用求導(dǎo)的方法進行基線校正。NIR光譜分析中常用的基線校正方法有一階導(dǎo)數(shù)(1st derivative)和二階導(dǎo)數(shù)(2nd derivative)。一階導(dǎo)數(shù)可有效消除光譜平移對測量的影響,二階導(dǎo)數(shù)可消除光譜旋轉(zhuǎn)對測量的影響。信號平滑是消除噪聲的常用方法,常用的信號平滑方法有移動平均平滑法和Savitzky-Golay(SG)卷積平滑法[11]。本文在對原始NIR光譜數(shù)據(jù)進一步分析處理前,將嘗試采用不同的光譜預(yù)處理方法對NIR光譜進行預(yù)處理。
iTCM數(shù)據(jù)庫采用Visual Basic語言和SQL Server 2000數(shù)據(jù)庫管理系統(tǒng)。目前數(shù)據(jù)庫中存儲了相關(guān)物料的18個物理質(zhì)量屬性參數(shù),如表1所示。iTCM數(shù)據(jù)庫在線版本[12]提供檢索、查詢物料的名稱、來源、生產(chǎn)廠家、批號和物性參數(shù)等數(shù)據(jù)。
表1 iTCM數(shù)據(jù)庫中物料的物性參數(shù)Table 1 Material properties in iTCM database
按照“1.2”所述方法,采集149批原輔料粉末近紅外光譜數(shù)據(jù)。將采集的NIR光譜數(shù)據(jù)以及測量時的系統(tǒng)溫度、濕度、日期等信息,導(dǎo)入iTCM數(shù)據(jù)庫。70批藥用輔料和79批中藥浸膏粉的原始近紅外光譜分別如圖1A和圖1B所示。其最大吸收波長為1 317~1 327 nm。在最大吸收波長區(qū)域,與中藥浸膏粉相比,部分藥用輔料的NIR吸光強度偏大,如糊精、玉米淀粉、硬脂酸鎂等。原輔料原始近紅外光譜圖于1 300 ~1 500 nm處出現(xiàn)較強的吸收帶,該區(qū)間對應(yīng)O—H的一級倍頻和水分子的組合頻吸收峰[13]。藥用輔料在1 400~1 600 nm存在一個顯著的波動區(qū)間,中藥浸膏粉則在1 000~1 200 nm存在明顯的波動區(qū)間。
針對本文收集的70批藥用輔料,選擇其中13批微晶纖維素(Microcrystalline cellulose,MCC)、10批乳糖(Lactose)、8批乙基纖維素(Ethyl cellulose,EC)、6批交聯(lián)聚維酮(Polyvinylpolypyrrolidone,PVPP)和6批羥丙基甲基纖維素(Hydroxypropyl methylcellulose,HPMC),構(gòu)成5類化學(xué)性質(zhì)明確且可明顯區(qū)分的物料。采用主成分分析(Principal component analysis,PCA)方法將70批藥用輔料多變量NIR光譜數(shù)據(jù)降維,在主成分空間內(nèi)分別研究NIR光譜數(shù)據(jù)對上述5類物料的區(qū)分能力。在對NIR光譜進行PCA前,按照“1.3”方法對光譜進行預(yù)處理,并考慮多種預(yù)處理方法組合,如SG+1d、SNV+SG+1d等,如表2所示。SG平滑選用7點3 階數(shù)據(jù)平滑,由于SNV+SG+1d預(yù)處理光譜數(shù)據(jù)時,最前面和最后面6個波長點的數(shù)據(jù)為零或絕對值過大,所以將這12個波長點的數(shù)據(jù)去除。分別經(jīng)SNV+SG+1d和MSC+SG+1d預(yù)處理的近紅外光譜圖如圖2A和圖2B所示。為將NIR光譜數(shù)據(jù)與其他物性參數(shù)數(shù)據(jù)進行對比,按照“1.4”方法,整理70批藥用輔料物性參數(shù)數(shù)據(jù)集(70×18),并對其進行PCA分析。
表2 不同PCA模型潛變量空間內(nèi)5類輔料的類間和類內(nèi)馬氏距離的平均值Table 2 The average values of Mahalanobis distances between and within classes of the five categories of pharmaceutical excipients in the latent variable space of different PCA models
計算上述5類物料中心點之間及各類內(nèi)樣品之間馬氏距離的平均值,結(jié)果見表2。在計算樣品的馬氏距離時,選擇前3個主成分進行計算。各類內(nèi)的平均距離越小,各類間的平均距離越大,表明輔料各類之間區(qū)分越好。結(jié)果顯示,經(jīng)SNV+SG+1d預(yù)處理的光譜數(shù)據(jù)PCA得分圖的各類間平均距離最大,各類內(nèi)平均距離的平均值最小,說明其區(qū)分這5類物料的能力最好。
圖3A展示了對物性參數(shù)進行PCA分析所得前兩個主成分的得分圖。圖3B、圖3C和圖3D分別為基于原始NIR光譜數(shù)據(jù)、SNV+SG+1d預(yù)處理NIR光譜數(shù)據(jù)和MSC+SG+1d預(yù)處理NIR光譜數(shù)據(jù)進行PCA分析后,第一和第二主成分的得分圖。本文使用2維數(shù)據(jù)的95%置信橢圓可視化數(shù)據(jù)的聚集程度,求得PCA前兩個主成分得分值矩陣的每列均值及其協(xié)方差矩陣的特征值和特征向量,繼而求得95%置信橢圓的散點數(shù)據(jù),并用平滑的曲線連接[14]。從得分圖中各類輔料95%置信橢圓的重疊程度來看,物性參數(shù)和原始光譜數(shù)據(jù)PCA得分圖上5類物料的區(qū)分較差;圖3A得分圖可以將乳糖和其他4類物料區(qū)分,這與乳糖密度較大有關(guān)。而在SNV+SG+1d和MSC+SG+1d預(yù)處理的光譜數(shù)據(jù)PCA得分圖中,各類輔料的95%置信橢圓重疊少,僅HPMC和PVPP存在部分重疊,區(qū)分較好。結(jié)合馬氏距離和PCA得分圖95%置信橢圓重疊程度的結(jié)果可知,SNV+SG+1d預(yù)處理光譜數(shù)據(jù)區(qū)分這5類物料的能力最好。與iTCM數(shù)據(jù)庫中的物性參數(shù)相比,近紅外光譜數(shù)據(jù)由于同時包含了物料的部分物理性質(zhì)和化學(xué)性質(zhì)信息[6],所以在潛變量空間內(nèi)對不同類別的輔料的區(qū)分能力較強。同時,光譜數(shù)據(jù)經(jīng)預(yù)處理去除無關(guān)信息和噪聲后對這5類輔料的區(qū)分能力進一步提高。值得注意的是,當輔料的物理化學(xué)性質(zhì)較為相近時,不同類的輔料會聚集在一起較難區(qū)分,以圖3C為例(圖中用黑色圓圈標注輔料名稱),圈1為3批硬脂酸鎂,與圈2中的硬脂酸鈣較為接近;圈3為2批氫氧化鋁,與藍圈中的PVPP較為接近;圈4為3批交聯(lián)羧甲基纖維素鈉,與圈5內(nèi)的淀粉類和纖維素類的輔料不能明顯區(qū)分。
表3 不同光譜數(shù)據(jù)預(yù)處理方法所得PLS模型對物性參數(shù)的預(yù)測能力比較Table 3 Comparison of the predictive ability of PLS models obtained by different pretreated spectral data for material properties
在粉末直接壓片中,片劑質(zhì)量與處方物料物理性質(zhì)和壓片過程參數(shù)密切相關(guān)。Dai等[4]建立了基于物料物理性質(zhì)和壓片力預(yù)測片劑抗張強度和孔隙率的PLS模型。除蘋果酸(批號:A0369948)、磷酸氫鈣(批號:A0369948)和款冬花(批號:KD201709-1)外,本文原輔料研究對象與Dai等建模時所用的物料有67批相同?!?.2”和“2.3”的研究結(jié)果表明,NIR數(shù)據(jù)與粉末物料理化性質(zhì)有關(guān),因此本文進一步將物料NIR光譜數(shù)據(jù)與其其他物理性質(zhì)組合,探討在Dai等[4]建立的PLS模型輸入變量中添加NIR數(shù)據(jù)對直接壓片片劑質(zhì)量預(yù)測能力的影響。
可用于直接壓片片劑質(zhì)量預(yù)測的PLS模型的輸入變量和輸出變量如表4所示。其中,作為模型輸入的變量(自變量)包括粉末物料的物理性質(zhì)、NIR光譜數(shù)據(jù)和壓片力;模型輸出變量(因變量)為片劑機械性質(zhì),即抗張強度(Tensile strength,TS)和固相分數(shù)(Solid fraction,SF)。物料物理性質(zhì)包括18個物性參數(shù)和9個壓縮參數(shù),NIR數(shù)據(jù)為經(jīng)過SNV+SG+1d預(yù)處理的數(shù)據(jù)。
表4 PLS模型的輸入變量和輸出變量Table 4 Description of input and output variables for the PLS model
表5 不同輸入變量的PLS模型評價指標Table 5 Diagnostics of four PLS models with different input variables
圖4 變量投影重要性指標(VIP)Fig.4 VIP indexes for independent variables of the PLS model
模型4變量的變量投影重要性指標(Variable importance in projection,VIP)值如圖4所示,VIP值大于1的變量有壓片力(P),密度類參數(shù)(Dc、Dt、SFp),壓縮參數(shù)(Py、Kb、d、g),內(nèi)聚力指數(shù)Icd,吸濕性%H和SNV+SG+1d預(yù)處理光譜數(shù)據(jù)PCA的PC2和PC5得分值。這與Dai等的研究相似[4]。模型4中輸出變量抗張強度(TS)和固相分數(shù)(SF)的系數(shù)值如圖5A和圖5B所示,其中變量的系數(shù)越大對模型越重要。從圖中可以看出,PC5的得分值對片劑抗張強度的影響較大,而PC2的得分值對片劑的固相分數(shù)影響較大。
圖5 PLS模型抗張強度(TS)(A)和固相分數(shù)(SF)(B)值的系數(shù)圖Fig.5 The coefficient plot of TS values(A) and SF values(B) for PLS
本文采用NIR-S-G1型便攜式近紅外光譜儀,采集了149批中藥口服固體制劑原輔料樣品的NIR光譜,豐富了iTCM中藥物性數(shù)據(jù)庫的數(shù)據(jù)類型。基于NIR光譜,可實現(xiàn)已知類型藥用輔料的模式識別。通過多變量預(yù)測分析,發(fā)現(xiàn)NIR光譜對粉末粒徑、密度類參數(shù)和吸濕性的預(yù)測性較好。直接壓片片劑質(zhì)量預(yù)測時,將NIR光譜添加至模型輸入中,可提高模型的預(yù)測性能。上述研究證明,NIR光譜數(shù)據(jù)是iTCM數(shù)據(jù)庫物性參數(shù)數(shù)據(jù)的有益補充,物性參數(shù)與NIR光譜的結(jié)合能更全面地表征原輔料的性質(zhì)。一般來說,原輔料物性參數(shù)的分析較為復(fù)雜費時,且消耗樣品量較多。后期實驗將探究用NIR快速測定或代替某些物性參數(shù),降低物性表征所需的工作量和樣品量,提高模型應(yīng)用的可靠性。