国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)融合的生物毒素及生物調節(jié)劑快速識別研究

2020-10-22 02:28:00南迪娜劉衛(wèi)衛(wèi)傅文翔李寶強孔景臨
分析化學 2020年10期
關鍵詞:曼光譜毒素離子

南迪娜 劉衛(wèi)衛(wèi) 傅文翔 李寶強 孔景臨

(國民核生化災害防護國家重點實驗室, 北京 102205)

1 引 言

近年來,使用生物毒素(Biotoxin)制造恐怖活動的事件時有發(fā)生[1,2]。很多生物毒素外觀都是白色粉末,人眼難以分辨其與面粉、食鹽等常見白色物質的差異。隨著物流、人流快速大范圍流動,白色粉末更易被散布。海關安檢、口岸防控、重大活動安保、處置化學及生物恐怖活動等均迫切需要快速準確識別不明白色粉末的技術。然而,生物毒素來源廣泛、結構種類繁多、性質差異大,快速識別難度高。目前, 現(xiàn)場快速檢測主要是基于免疫學、核酸適配體等生物傳感方法[3~8],上述方法雖具有高通量、高靈敏、高特異的優(yōu)勢,但廣譜性不足,且存在一定的誤報,無法滿足現(xiàn)場對不明白色粉末快速高準確率識別的需求[9,10]。針對這些不足,近年來基于物理原理的廣譜檢測方法發(fā)展迅速。

離子遷移譜(Ion mobility spectrometry, IMS)、拉曼光譜(Raman spectroscopy)結合化學計量學方法在公共安全快速檢測領域應用廣泛[11~13]。其中, 以拉曼光譜結合協(xié)同區(qū)間偏最小二乘(Synergy interval partial least squares, SiPLS)、蟻群優(yōu)化偏最小二乘(Ant colony optimization partial least squares, ACO-PLS)和SiPLS-ACO等多元算法構建回歸模型可檢測玉米中真菌毒素玉米赤霉烯酮[14]; 空間偏移拉曼光譜(Spatially offset raman spectroscopy, SORS)結合自建模混合物分析(Self-modeling mixture analysis, SMA)方法可對包裝內不明白色粉末進行識別[15]; 還有研究將離子遷移譜和拉曼光譜譜圖的數(shù)據(jù)融合,結合主成分分析(Principal component analysis, PCA)和支持向量機(Support vector machine, SVM)算法鑒別毒品[16]。但對離子遷移譜和拉曼光譜數(shù)據(jù)融合快速識別生物毒素的研究目前鮮有報道,生物毒素的拉曼光譜、離子遷移譜數(shù)據(jù)庫還不完備,在此基礎上的譜圖模型和識別算法有待深入研究。本研究選取澳大利亞集團(The Australia Group, AG)清單[17]中包含的河豚毒素(Tetrodotoxin, TTX)等劇毒生物堿、芋螺毒素(Conotoxin, CTX)、生物調節(jié)劑(Biological modifiers)、《禁止化學武器公約》(Chemical Weapons Convention, CWC)附表[18]中的蓖麻毒素(Ricin)等多種結構類型多樣、分子量差異大的生物毒素進行數(shù)據(jù)融合快速識別研究。為提高識別難度、檢驗方法的有效性,還設計了組成相同僅氨基酸序列不同的同分異構多肽。在獲得上述白色粉末離子遷移譜和拉曼光譜的基礎上,將散射光譜中包含的分子中化學鍵的振動信息與離子遷移時間反映的分子質量、空間結構及帶電荷信息關聯(lián),增加表征化合物結構的維度,進行模式識別研究并實現(xiàn)了有效區(qū)分。

2 實驗部分

2.1 儀器與試劑

LabRAM HR Evolution顯微共焦拉曼光譜儀(日本HORIBA公司),配有532、633和785 nm等激光器; GA2200高分辨率電噴霧離子遷移譜儀(Electrospray ionization-ion mobility spectrometry,ESI-IMS)(美國Excellims公司); ALLIA-3高純氮氣發(fā)生器(法國FDGSi公司),產生的氮氣用作離子遷移譜的遷移氣體; MS105電子天平(瑞士Mettler Toledo公司),精確至0.01 mg。

HPLC級甲醇購自Sigma公司,實驗用純水為娃哈哈純凈水。分析物包括23種生物毒素、生物調節(jié)劑以及面粉、食鹽、蛋白粉3種常見白色粉末物質,詳細信息見表1。生物堿類樣品烏頭堿、次烏頭堿和河豚毒素均為標準品,購自Sigma公司。多肽類樣品包括8種芋螺毒素、6種緩激肽及其片段、P物質及其同分異構體均由上海吉爾生化有限公司采用Fmoc固相合成的方法制備,經液相色譜-質譜分析純度>95%。合成的多肽樣品的氨基酸序列及二硫鍵連接方式見表2。α-銀環(huán)蛇毒素(純度98%)購自廣州威佳科技有限公司。蛋白質類生物毒素樣品蓖麻毒素、蓖麻凝集素由本研究組從蓖麻籽中分離得到,蓖麻毒素B鏈拆分自蓖麻毒素,經基質輔助激光解吸電離飛行時間質譜(Matrix-assisted laser desorption/ionization time-of-flight mass spectrometry,MALDI-TOF-MS)分析為純品。面粉、食鹽購自當?shù)爻?。蛋白粉為牛血清白蛋?純度98%),購自北京百靈威科技有限公司。上述樣品外觀均為白色粉末。

表1 用于模式識別的生物毒素、生物調節(jié)劑及常見干擾物

表2 合成的多肽類樣品的結構

2.2 實驗方法

2.2.1 拉曼光譜實驗取微量白色粉末樣品置于載玻片上,在顯微鏡下調節(jié)載物臺選取采樣點。選擇放大倍數(shù)為50或100倍的物鏡、300 gr/mm(600 nm)的光柵刻線密度(中心波長),設置激光功率(滿值100 mW)為1%~100%,共焦孔徑為100~300 μm,采樣范圍為50~4000 cm-1。在532、633和785 nm中切換激光波長,設置積分時間1~180 s,積分累加次數(shù)為1~20次,根據(jù)譜圖的信噪比情況調節(jié)儀器參數(shù),采集優(yōu)化條件下的拉曼光譜并保存數(shù)據(jù)。

2.2.2 離子遷移譜實驗稱取適量樣品,分別用水或甲醇溶解, 配成濃溶液,再用50%~80%(V/V)甲醇-水逐級稀釋,配制成10~100 μg/mL的溶液。設置電離源電壓為2000 V,遷移管電壓為8000 V,進樣口和遷移管溫度為180℃,離子柵門的門極電壓為70 V,脈沖寬度為300 μs,遷移氣流速為1.38 L/min,排氣泵流速為1.26 L/min,進樣針流速為1.26 μL/min,譜圖采集時間為10 s,譜圖采集范圍為0~50 ms。各樣品進樣體積30 μL,正離子模式下分析。每個樣品采集20~25個IMS譜圖樣本。

2.2.3 數(shù)據(jù)預處理及融合分析使用Matlab R2019a進行數(shù)據(jù)分析。截取150~2000 cm-1范圍的拉曼譜圖,以1 cm-1間隔等距線性插值采樣得到11851維樣本數(shù)據(jù); 設置掃描窗口為50,以移動平均值方式掃描樣本中異常點數(shù)據(jù)并用最近點值替代; 設置窗口5,以高斯加權平均濾波3次的方式對光譜進行去噪; 設置歸一化后光譜的30步長導數(shù)閾值為910-4,以25為窗口掃描進行基線點選取后,通過分段三次Hermite插值多項式對光譜進行基線校正; 對光譜離差標準化處理,完成拉曼光譜樣本預處理過程。將0~50 ms全范圍離子遷移譜圖數(shù)據(jù)以0.005 ms等間隔線性插值采樣得到110001維樣本數(shù)據(jù), 然后進行數(shù)據(jù)融合。將0.025~50 ms范圍離子遷移譜圖數(shù)據(jù)以0.025 ms等間隔線性插值采樣后進行離差標準化處理,得到1×2000維樣本數(shù)據(jù)。

融合1×2000維離子遷移譜樣本數(shù)據(jù)和預處理后的1×1851維拉曼光譜樣本數(shù)據(jù),并以此作為總數(shù)據(jù)集樣本。采用主成分分析方法對譜圖數(shù)據(jù)進行降維壓縮,選擇覆蓋原始數(shù)據(jù)80%以上信息的主成分作為數(shù)據(jù)集樣本。各樣品分配70%譜圖為訓練集數(shù)據(jù),其余歸入測試集。利用訓練集數(shù)據(jù)訓練多分類模式識別模型,再用訓練好的模型對測試集數(shù)據(jù)進行識別歸類。

3 結果與討論

3.1 樣品的拉曼光譜

圖1 各樣品的拉曼光譜圖圖中橫坐標序號代表物為:1. 烏頭堿; 2. 次烏頭堿; 3. 河豚毒素; 4. 芋螺毒素α-Conotoxin GI; 5. 芋螺毒素α-Conotoxin MI; 6. 芋螺毒素α-Conotoxin SI; 7. 芋螺毒素Conopressin G; 8. 芋螺毒素Conopressin S; 9. 芋螺毒素Conopressin; 10. 芋螺毒素Contryphan; 11. 芋螺毒素Contryphan-Le; 12. α-銀環(huán)蛇毒素; 13. 緩激肽; 14. 緩激肽的同分異構體; 15. 緩激肽片段[des-Pro2]; 16. 緩激肽片段(1-8); 17. 緩激肽片段(1-7); 18. 緩激肽片段(1-7)的同分異構體; 19. P物質; 20. P物質的同分異構體; 21. 蓖麻毒素; 22. 蓖麻毒素B鏈; 23. 蓖麻凝集素; 24. 面粉; 25. 食鹽; 26. 牛血清白蛋白Fig.1 Raman spectra of different samplesThe compounds of the serial number of the abscissa in the figure are: 1. Aconitine; 2. Hypaconitine; 3. Tetrodotoxin; 4. α-Conotoxin GI; 5. α-Conotoxin MI; 6. α-Conotoxin SI; 7. Conopressin G; 8. Conopressin S; 9. Conopressin; 10. Contryphan; 11. Contryphan-Le; 12. α-Bungarotoxin; 13. Bradykinin; 14. Bradykinin′s isomer; 15. [des-Pro2]bradykinin; 16. Bradykinin(1-8); 17. Bradykinin(1-7); 18. Bradykinin(1-7)′s isomer; 19. Substance P; 20. Substance P′s isomer; 21. Ricin; 22. Ricin toxin B chain; 23. Ricinus communis agglutinin; 24. Flour; 25. Salt; 26. Bovine serum albumin.

3.2 樣品的離子遷移譜

各類樣品在100 μg/mL濃度時的離子遷移譜如圖2所示。 5~8 ms對應的強峰為甲醇-水溶劑峰,各樣品信號在8 ms后出現(xiàn)。當樣品濃度為10 μg/mL時,在采集譜圖過程中可以觀察到僅帶單電荷的樣品進樣后,譜圖很快達到穩(wěn)定狀態(tài),峰形基本保持不變; 而在電噴霧過程中可能帶上多個電荷的多肽類毒素或生物調節(jié)劑等,其譜圖在1 min左右趨于穩(wěn)定,這與氣相分子中多電荷體系的電荷競爭過程有關。當樣品濃度為100 μg/mL時,離子遷移譜信號明顯增強。與其它樣品相比,生物堿在相同濃度下信號強度高,這與其分子結構中堿性基團在正離子模式下極易帶正電荷有關,而多肽類樣品如芋螺毒素、生物調節(jié)劑等譜圖中出現(xiàn)不止一個信號峰,表明其分子中有多個可質子化的位點,這與此類多肽氨基酸組成特點相符。離子遷移譜中, 離子遷移時間與其分子量、帶電荷數(shù)量、分子碰撞截面積等結構特征相關[19],因此,同分異構體有可能因空間構型差異而被區(qū)分。由圖2可見,P物質、緩激肽等生物調節(jié)劑與其同分異構體的遷移時間不同,這在數(shù)據(jù)融合分析時為拉曼光譜僅靠分子中化學鍵振動特征不能區(qū)分的物質提供了多維信息。

圖2 各類樣品100 μg/mL濃度時的離子遷移譜圖圖中橫坐標序號代表物為: 01, 100%甲醇; 02, 80%(V/V)甲醇-水; 1~26物質名稱同表1Fig.2 Ion mobility spectrometry (IMS) of different samples at the concentration of 100 μg/mLCompounds of the serial number of the abscissa in the figure: 01, 100% methanol; 02, 80% (V/V)methanol-water and substances corresponding to the numbers from 1 to 26 are the same as in Fig.1

3.3 譜圖識別結果

單一譜圖分析和數(shù)據(jù)融合后,前2個主成分分布如圖3所示.雖然同類樣品因分子組成相似具有相似的拉曼光譜和相近的離子遷移時間,但拉曼光譜數(shù)據(jù)和離子遷移譜數(shù)據(jù)具有完全不同的主成分分布,兩者從不同的角度反映了樣品結構信息。由圖3C可見,數(shù)據(jù)融合后的主成分分布并不是單一譜圖數(shù)據(jù)的簡單疊加,數(shù)據(jù)融合具有使得樣本特征更加顯著的能力。

使用線性判別分析(Linear discriminant analysis,LDA)、二次判別分析(Quadratic discriminant analysis,QDA)、k近鄰(k-Nearest neighbor,KNN)、樸素貝葉斯(Naive bayesian,NB)模型、分類決策樹(Classification tree,CT)、Sigmoid核函數(shù)支持向量機(SVM)6種模式識別算法,分別對離子遷移譜、拉曼光譜單一譜圖以及二者融合后的測試集數(shù)據(jù)進行歸類后,識別結果見表3,重復10次發(fā)現(xiàn), 識別率結果穩(wěn)定不變。數(shù)據(jù)融合后,線性判別分析、k近鄰、支持向量機算法可有效識別生物毒素和非毒素樣品并區(qū)分多肽毒素、生物調節(jié)劑; 而二次判別分析、分類決策樹算法可能將蛋白質毒素誤判為生物堿、多肽毒素或生物調節(jié)劑; 二次判別分析、樸素貝葉斯模型則存在將非毒素樣品誤判為生物毒素的情況。與其它5種算法支持向量機模型相比,融合數(shù)據(jù)具有最高識別準確率(97.2%),并能區(qū)分同分異構體。

圖3 各類樣品譜圖數(shù)據(jù)集的主成分分布: (A) 拉曼光譜主成分分布; (B) 離子遷移譜主成分分布; (C) 拉曼光譜、離子遷移譜數(shù)據(jù)融合后主成分分布Fig.3 Principal component distribution of various sample spectral data sets: (A) Principal component distribution of Raman spectrum; (B) IMS; (C) Raman spectroscopy and IMS fusion data (C)

表3 6種模式識別方法對離子遷移譜、拉曼光譜及數(shù)據(jù)融合的識別準確率

為研究數(shù)據(jù)庫中數(shù)據(jù)量多少對模式識別算法識別能力的影響,分別分配數(shù)據(jù)集的50%、60%、70%、80%和90%數(shù)據(jù)作為訓練集訓練6種模式識別算法模型,對數(shù)據(jù)融合后的測試集進行識別。訓練集比例為70%及50%~90%時,融合數(shù)據(jù)測試集樣本的識別結果對比情況見圖4。

圖4 6種模式識別方法對融合數(shù)據(jù)的識別結果: (A) 測試集比例為70%時的識別準確率; (B) 測試集比例為50%~90%時的平均識別準確率及標準差Fig.4 Recognition results of fusion data by 6 pattern recognition algorithms: (A) Recognition effect diagram when the test set ratio is 70%; (B) Recognition effect diagram when the test set ratios are 50%-90%

由計算結果可知,訓練集分配比例越高,即數(shù)據(jù)庫中的數(shù)據(jù)越完備和充足,線性判別分析具有更好的識別能力; 數(shù)據(jù)庫不夠完備時,支持向量機模型識別結果的均值更高,標準差相對較低,表現(xiàn)出更穩(wěn)健的識別能力。6種模式識別算法中,判別分析算法通過計算比較多個判別函數(shù)值實現(xiàn)樣本的分類;k近鄰分類算法通過計算特征空間中最相似的樣本進行分類; 樸素貝葉斯模型通過找出輸出和輸入的聯(lián)合分布進行識別分類,算法直觀、計算量較小,沒有復雜的求導和矩陣運算,因此效率很高; 分類決策樹算法易對訓練集過擬合,導致泛化能力不強,這時需根據(jù)樣本特征設置節(jié)點參數(shù)進行改進; 支持向量機算法則通過求解樣本最大邊距超平面進行分類。本研究中同類樣品特征相似,二次判別分析、分類決策樹算法識別正確率相對較低,可能是訓練集樣本數(shù)不大時過擬合導致。支持向量機算法則依據(jù)Sigmoid核函數(shù)模擬的閾值判別規(guī)則,將樣本映射到合適的特征空間,具有較好的識別結果。綜合比較后,本研究以支持向量機模型進行實際場景中不明白色粉末的識別歸類。結果表明,此模型可將無毒樣品(如面粉、食鹽、蛋白粉等)與生物毒素明顯分類,且可將生物堿類毒素與多肽毒素區(qū)分開,表明本方法可用于不明白色粉末的快速篩查。

4 結 論

以多類具有潛在或現(xiàn)實威脅的生物毒素及生物調節(jié)劑等作為研究對象,建立了電噴霧離子遷移譜、拉曼光譜的實驗方法及數(shù)據(jù)融合識別生物毒素的模型。單獨采用拉曼光譜或離子遷移譜檢測此類毒物都容易出現(xiàn)低識別率的問題,兩種不同原理的檢測技術融合使用,采集的譜圖從不同維度反映樣品的空間結構、化學鍵組成、質荷比等特征,可明顯降低錯誤識別率。本方法在反化生恐怖活動、事故應急救援等公共安全領域具有廣闊的應用前景。

猜你喜歡
曼光譜毒素離子
What Makes You Tired
一類具有毒素的非均勻chemostat模型正解的存在性和唯一性
毒蘑菇中毒素的研究進展
在細節(jié)處生出智慧之花
小議離子的檢驗與共存
嚴苛標準方能清洗校園“毒素”
鋼渣對亞鐵離子和硫離子的吸附-解吸特性
鋁離子電池未來展望
電源技術(2015年5期)2015-08-22 11:17:54
BMSCs分化為NCs的拉曼光譜研究
便攜式薄層色譜-拉曼光譜聯(lián)用儀重大專項獲批
改则县| 开鲁县| 漳平市| 武穴市| 扎鲁特旗| 辛集市| 毕节市| 金乡县| 萝北县| 增城市| 手机| 肥东县| 揭西县| 玉树县| 泗阳县| 邓州市| 龙里县| 静宁县| 玛纳斯县| 赤城县| 东乡族自治县| 富川| 临夏市| 佛坪县| 平舆县| 秦皇岛市| 武清区| 罗山县| 石景山区| 万宁市| 泰兴市| 天柱县| 三台县| 德清县| 安康市| 珲春市| 资源县| 天柱县| 隆安县| 新蔡县| 铜陵市|