楊守志, 徐嘉陽(yáng), 劉宇寧, 楊婷婷, 謝文凱, 李劍君
(生物醫(yī)學(xué)信息工程教育部重點(diǎn)實(shí)驗(yàn)室 西安交通大學(xué) 生命科學(xué)與技術(shù)學(xué)院,陜西 西安 710049)
汞(Hg)是對(duì)人類(lèi)最具危害的重金屬之一,長(zhǎng)期生活在Hg2+含量超標(biāo)的環(huán)境中會(huì)引起腦組織損害、神經(jīng)衰弱綜合征以及嚴(yán)重的肝腎損傷等癥狀[1]。目前Hg2+檢測(cè)已有很多方法,常用的檢測(cè)方法主要有原子光譜法、電感耦合等離子體—質(zhì)譜法、直接測(cè)汞儀等[2],但是這些方法由于儀器和檢測(cè)費(fèi)用昂貴、分析周期長(zhǎng)等問(wèn)題,難以用于食品環(huán)境安全的快速監(jiān)測(cè)。近年來(lái),納米金顆粒(gold nanoparticles)因其性質(zhì)穩(wěn)定以及良好的光學(xué)性質(zhì)常常應(yīng)用于食品污染物的檢測(cè)中[3]。將納米金修飾到紙基上進(jìn)行快速便捷的比色傳感檢測(cè)就是目前較熱門(mén)的研究方向[4],如杜鵑等人基于基因(DNA)修飾的納米金探針研制了一種可檢測(cè)水溶液中Hg2+濃度的層析試紙條[5]。納米金除了具有良好的光學(xué)特性,還具有過(guò)氧化物酶的性質(zhì),在H2O2存在的情況下,可催化3,3′,5,5′—四甲基聯(lián)苯胺(3,3′,5,5′-tetramethylbenzidine,TMB)生成藍(lán)色產(chǎn)物,在652 nm處產(chǎn)生特定吸收峰[6]。據(jù)目前文獻(xiàn)報(bào)道,利用紙基比色反應(yīng)檢測(cè)Hg2+雖然快速,但只是“有”、“無(wú)”的定性分析,而無(wú)法利用顏色梯度變化等信息進(jìn)行定量檢測(cè)。
如何很好地解決這個(gè)問(wèn)題,機(jī)器學(xué)習(xí)中的支持向量機(jī)(support vector machine,SVM)可對(duì)圖片進(jìn)行模式識(shí)別、分類(lèi)以及回歸分析[7]。洪茜等人利用SVM分類(lèi)算法對(duì)于豬肉中四環(huán)素量進(jìn)行分類(lèi)分級(jí)[8],Wang H Q等人利用手機(jī)對(duì)比色結(jié)果進(jìn)行觀測(cè)[9]。
本文研究以上述納米金催化H2O2和TMB的比色反應(yīng)為原理,在修飾后的硫酸紙反應(yīng)基底上滴加Hg2+和H2O2溶液,對(duì)產(chǎn)生了比色反應(yīng)的試紙進(jìn)行圖像數(shù)據(jù)采集及預(yù)處理,利用SVM算法中的線性核函數(shù)對(duì)圖像數(shù)據(jù)進(jìn)行分類(lèi),從而對(duì)比色結(jié)果實(shí)現(xiàn)Hg2+低、中、高濃度等級(jí)評(píng)估。對(duì)相關(guān)參數(shù)進(jìn)行優(yōu)化后準(zhǔn)確率可達(dá)93.3 %。在此基礎(chǔ)上,開(kāi)發(fā)了手機(jī)App,對(duì)比色結(jié)果進(jìn)行實(shí)時(shí)拍照分析,其總體判別率也可達(dá)到91.1 %。為實(shí)現(xiàn)Hg2+濃度的等級(jí)評(píng)估提供了一種新型快速檢測(cè)的方法。
檸檬酸鈉(Na3C6H5O7·2H2O,Aladin試劑有限公司);氯金酸 (HAuCl4·4H2O,國(guó)藥集團(tuán)化學(xué)試劑有限公司);氯化汞(HgCl2);3,3′,5,5′—四甲基聯(lián)苯胺 (TMB);雙氧水(H2O2,ω=30 %);氫氧化鈉(NaOH,國(guó)藥集團(tuán)化學(xué)試劑有限公司);MILLI-Q超純水(電阻值為18.2 MΩ·cm);硫酸紙若干張(愛(ài)卡樂(lè),120 mg/m2)
紫外可見(jiàn)分光光度計(jì)UV3600(島津,日本);HH—1型數(shù)顯恒溫水浴鍋(常州朗越儀器制造有限公司);梅特勒—托利多B-S天平(梅特勒—托利多儀器上海有限公司);漩渦式混合器(海門(mén)市其林貝爾儀器制造有限公司);透射電子顯微鏡(日本電子光學(xué)公司)
1.3.1 納米金球的制備
利用改進(jìn)的檸檬酸鹽還原法[10],制得吸收峰約為520 nm的納米金球溶液。
1.3.2 紙基比色
按文獻(xiàn)所示方式[6],取TMB粉末溶于乙醇中稀釋,得到5×10-4mol/L的TMB溶液;將4 mL的5×10-4mol/L的TMB溶液、2.5 mL納米金球溶液、2 mL配置好的Britton-Robison(BR)緩沖溶液、0.5 mL超純水充分混合得到浸泡液。將1 cm×1 cm的硫酸紙置于浸泡液中浸泡10 min后,于60 ℃烘箱中烘烤10 min得到檢測(cè)試紙。將50 μL不同濃度的Hg2+待測(cè)液和50 μL H2O2檢測(cè)液滴加到檢測(cè)試紙上,觀測(cè)顏色變化。
選取濃度范圍分別為(0~1)×10-6mol/L,1×10-6~1×10-5mol/L 和1×10-5~1×10-4mol/L的Hg2+溶液進(jìn)行比色檢測(cè),90 s后用手機(jī)進(jìn)行圖像采集,采集過(guò)程如圖1所示。每個(gè)范圍各重復(fù)15次操作并采集數(shù)據(jù)。
圖1 智能手機(jī)采集圖像過(guò)程
如表 1所示,實(shí)驗(yàn)共獲得45張圖片,對(duì)應(yīng)高、中、低三類(lèi)不同濃度范圍的Hg2+濃度檢測(cè)物的樣本各15個(gè)。將采集數(shù)據(jù)的2/3作為訓(xùn)練樣本,1/3作為預(yù)測(cè)樣本進(jìn)行驗(yàn)證。具體選擇方式為從第三個(gè)數(shù)據(jù)開(kāi)始,每間隔2個(gè)數(shù)據(jù)抽取一個(gè)數(shù)據(jù)作為預(yù)測(cè)集,余下的數(shù)據(jù)作為訓(xùn)練集,其中Hg2+濃度為(0~1)×10-6mol/L是低濃度;1×10-6~1×10-5mol/L是中濃度;1×10-5~1×10-4mol/L是高濃度,每種濃度各含有15個(gè)樣本,其中訓(xùn)練樣本10個(gè),預(yù)測(cè)樣本5個(gè)。
表1 樣本中Hg2+含量統(tǒng)計(jì)結(jié)果
在采集到比色圖像之后,提取不同顏色特征組合作為分類(lèi)特征并作為輸入變量,建立SVM分類(lèi)模型,預(yù)測(cè)其正確率。
本文研究構(gòu)建了一個(gè)SVM分類(lèi)器,用于判別Hg2+的濃度類(lèi)別,將采用SVM中的C_SVC模型,選擇不同的核函數(shù)類(lèi)型,并選取合適的懲罰系數(shù)C和核函數(shù)參數(shù)g的值,以分類(lèi)結(jié)果的準(zhǔn)確率作為訓(xùn)練目標(biāo),得出最佳核函數(shù)類(lèi)型及合適的參數(shù),用6折交叉法進(jìn)行驗(yàn)證[11]。
上述圖像預(yù)處理的操作利用MATLAB R2019b實(shí)現(xiàn),提取特征值和建立模型的操作利用OpenCV 3.4.1實(shí)現(xiàn)[12]。
在最優(yōu)反應(yīng)條件下,取(400~2 000)nmol/L的系列濃度汞離子標(biāo)準(zhǔn)溶液與之反應(yīng),記錄反應(yīng)過(guò)程中652 nm處的紫外吸收光譜值。隨著Hg2+濃度的增加,顏色由無(wú)色變?yōu)樗{(lán)綠色,吸光度與Hg2+濃度呈正相關(guān)(如圖2所示),相關(guān)系數(shù)為0.993 1。
圖2 濃度為(400~2 000)nmol/L的Hg2+在652 nm處的吸光度
圖3 干擾性離子檢測(cè)結(jié)果
三個(gè)不同濃度等級(jí)Hg2+的紙基比色檢測(cè)的結(jié)果如圖4所示。
圖4 紙基比色檢測(cè)結(jié)果
將圖像RGB值矩陣數(shù)據(jù)作為所提取的特征信息,為實(shí)現(xiàn)對(duì)Hg2+的濃度等級(jí)判別,選取高、中、低濃度的Hg2+實(shí)驗(yàn)數(shù)據(jù)各15組。將圖片裁剪為40像素×40像素的大小,每組數(shù)據(jù)經(jīng)過(guò)預(yù)處理后RGB平均值如表 2所示。
表2 不同濃度等級(jí)Hg2+ 檢測(cè)樣本實(shí)驗(yàn)數(shù)據(jù)
選用各個(gè)濃度等級(jí)中序號(hào)為3,6,9,12,15號(hào)作為測(cè)試集,其余為訓(xùn)練集,即共有30組訓(xùn)練數(shù)據(jù)和15組測(cè)試數(shù)據(jù)。訓(xùn)練模型的過(guò)程中,采用6折交叉驗(yàn)證,在選取SVM的模型為C_SVM,且給定松弛系數(shù)ε=1×10-6的前提下,分別選用線性核函數(shù)、徑向基函數(shù)(radial basis function,RBF)核函數(shù)、Sigmoid核函數(shù)和多項(xiàng)式核函數(shù),懲罰系數(shù)C的取值范圍為2-10~210,核函數(shù)參數(shù)g的取值范圍為2-10~20,通過(guò)C和g的不同取值,找出準(zhǔn)確率最高時(shí)對(duì)應(yīng)的參數(shù),確定不同核函數(shù)對(duì)應(yīng)的最高準(zhǔn)確率及相應(yīng)的最優(yōu)參數(shù),如表3所示。
表3 不同核函數(shù)對(duì)應(yīng)的最高準(zhǔn)確率及相應(yīng)的最優(yōu)參數(shù)
可見(jiàn),線性核函數(shù)和多項(xiàng)式核函數(shù)的模型的預(yù)測(cè)準(zhǔn)確率均為93.3 %,明顯優(yōu)于其他核函數(shù)。由于取得最高準(zhǔn)確率時(shí),多項(xiàng)式核函數(shù)的階數(shù)degree為1,退化為線性核,故在本測(cè)試中,線性核和多項(xiàng)式核函數(shù)可以達(dá)到的準(zhǔn)確率相同。因此,最終確定選用SVM的模型及最優(yōu)參數(shù)為:用線性核函數(shù),且C=0.1,g=1。以最優(yōu)參數(shù)完成模型訓(xùn)練,對(duì)測(cè)試集進(jìn)行預(yù)測(cè),結(jié)果如表4所示。預(yù)測(cè)結(jié)果正確率總體較高,表明此模型取得了較好的訓(xùn)練結(jié)果。
表4 SVM 分類(lèi)實(shí)驗(yàn)統(tǒng)計(jì)結(jié)果
基于上述研究結(jié)果,利用Android Studio平臺(tái)開(kāi)發(fā)手機(jī)應(yīng)用(App)[13],軟件設(shè)計(jì)流程及界面如圖5和圖6所示。本應(yīng)用軟件提供歷史檢測(cè)記錄功能以方便用戶評(píng)估近期的Hg2+檢測(cè)情況,間接反映用戶近期Hg2+污染現(xiàn)狀。
圖5 手機(jī)App具體操作流程設(shè)計(jì)
圖6 手機(jī)App操作與結(jié)果顯示界面
使用該軟件對(duì)高、中、低三種濃度各15組進(jìn)行濃度判別,如圖7所示,判別準(zhǔn)確率分別為86.7 %,93.3 %和93.3 %,總體判別準(zhǔn)確率為91.1 %。
圖7 手機(jī)App判別Hg2+濃度的結(jié)果
本文將SVM算法應(yīng)用于Hg2+比色分析檢測(cè)的研究中,并開(kāi)發(fā)了相應(yīng)的手機(jī)App,對(duì)水體中的Hg2+的含量進(jìn)行低、中、高濃度等級(jí)評(píng)估。
本研究驗(yàn)證了Hg2+濃度和TMB氧化反應(yīng)的比色結(jié)果在650 nm處的紫外吸收光譜的吸收峰值呈良好的線性關(guān)系,相關(guān)系數(shù)(R2)為0.993 1。確定了SVM分類(lèi)器的核函數(shù)為線性核及最優(yōu)參數(shù)C=0.1,g=1,基于上述SVM分類(lèi)器,開(kāi)發(fā)了新型檢測(cè)手機(jī)App,用戶通過(guò)拍照上傳比色結(jié)果圖,就可以快速分析Hg2+的濃度等級(jí),識(shí)別準(zhǔn)確率可達(dá)91.1 %。本文研究結(jié)合產(chǎn)品便攜化的發(fā)展趨勢(shì)和機(jī)器學(xué)習(xí)研究熱點(diǎn),在Hg2+濃度判別研究領(lǐng)域?qū)崿F(xiàn)了較高的選擇特異性和判別準(zhǔn)確率,為實(shí)現(xiàn)快速簡(jiǎn)便地檢測(cè)食品內(nèi)含殘留物提供技術(shù)支持和思路,具備良好的社會(huì)意義和經(jīng)濟(jì)價(jià)值。