劉松生++袁浩均++劉強++周洪波++毛紅菊++任偉
摘 要: 液滴數(shù)字聚合酶鏈式反應(yīng)(ddPCR)作為第三代PCR技術(shù),可實現(xiàn)核酸分子絕對定量。然而,在數(shù)字PCR結(jié)果讀出過程中,對1 000萬量級的液滴進行統(tǒng)計費時費力而且容易出錯。針對此情況設(shè)計了液滴數(shù)字PCR芯片的自動掃描識別平臺,系統(tǒng)包括硬件移動平臺和軟件拍照、拼接和識別功能。軟件控制平移臺順序移動并控制攝像頭拍照,移動完成后把拍得的照片拼接成一張圖片,之后對圖片中的液滴進行識別。此平臺通過二維平移臺的精確定位掃描及圖像分割、識別算法,對熒光和非熒光液滴識別率達到99.6%以上。平臺已經(jīng)應(yīng)用到了實驗室中,對數(shù)字PCR芯片上的微液滴可實現(xiàn)一鍵識別,極大的減小了識別時間和錯誤率。
關(guān)鍵詞: ddPCR; 核酸分子定量; 自動掃描; 液滴識別
中圖分類號: TN911?34 文獻標(biāo)識碼: A 文章編號: 1004?373X(2017)18?0001?06
Research on automatic result readout platform of droplet digital PCR chip
LIU Songsheng1, 2, YUAN Haojun2, LIU Qiang1, 2, ZHOU Hongbo2, MAO Hongju2, REN Wei1
(1. International Center of Quantum and Molecular Structures, Shanghai University, Shanghai 201900, China;
2. Shanghai Institute of Microsystem and Information Technology, Chinese Academy of Sciences, Shanghai 200050, China)
Abstract: As the third generation PCR technique, the droplet digital PCR (ddPCR) can realize the absolute quantification for nucleic acid molecule, but in the process of PCR result readout, the statistics of ten?million magnitude droplets wastes time and manpower, and is easy to result in errors. Therefore, an automatic scanning and recognition platform of ddPCR chip was designed. The system includes the hardware mobile platform, and has the functions of software photographing, image splicing and droplet recognition. The sequential movement of the platform and photographing of camera are controlled by the software, and then the photographed pictures are spliced into a photograph to recognize droplets in it. The recognition rate of the platform for fluorescent and non?fluorescent droplets can reach up to above 99.6% by means of the accurate positioning and scanning, image segmentation and recognition algorithms of the 2D translation platform. This platform has been applied to the laboratory, can recognize the microdroplets produced by digital PCR chip with one key, shorten the recognition time and reduce the recognition error rate greatly.
Keywords: ddPCR; nucleic acid molecule quantification; automatic scanning; droplets recognition
0 引 言
數(shù)字PCR是一種高靈敏度的核酸定量檢測方法,它將起始待測模板分散到大量的液滴反應(yīng)器中,每個反應(yīng)器包含至少一個或多個拷貝的目標(biāo)DNA模板,模板在微滴反應(yīng)器中進行PCR擴增反應(yīng)后,對陰性陽性(分別在明場和熒光下觀測)反應(yīng)器的數(shù)量進行統(tǒng)計并算出它們相應(yīng)的比例,含有目標(biāo)DNA分子的微滴反應(yīng)器數(shù)量滿足泊松分布。根據(jù)泊松分布公式即可算出目標(biāo)DNA分子的初始拷貝數(shù)[1]。因此它是一種可以實現(xiàn)絕對定量的方法。液滴式數(shù)字PCR(Droplet digital PCR, ddPCR)是利用微流控芯片產(chǎn)生液滴并以液滴作為數(shù)字PCR的微反應(yīng)器的一種高效的數(shù)字PCR平臺方法[2]。每一個ddPCR芯片可產(chǎn)生上百萬個液滴,在實際對這些微單元的統(tǒng)計過程中,液滴的大小不一、液滴間有重疊、有的液滴沒有正確聚焦以及背景光等的影響,使得統(tǒng)計液滴也成為一個挑戰(zhàn)。對于明場下,一般的方法是估算液滴產(chǎn)生的速度,然后再乘以液滴產(chǎn)生時間算出液滴的總數(shù),這種方法的問題是液滴產(chǎn)生過程中速度不是恒定不變的,而且時間也不能很精確的把握;還有的方法是添加額外的檢測裝置,如在液滴產(chǎn)生通道旁添加電極檢測電容值得變化間接知道液滴數(shù)目[3],利用昂貴的高速CCD攝像頭對液滴進行計數(shù)[4?5]等,這些方法都極大地增加了成本。而在熒光下,目前還沒有一種快速、準確、可行的方法。一般的方法是在顯微鏡下人工進行計數(shù)液滴的亮點個數(shù),這種方法不僅費時費力而且很容易數(shù)錯。本文針對現(xiàn)有的ddPCR上述問題,設(shè)計了ddPCR芯片結(jié)果自動讀出平臺。平臺能對ddPCR結(jié)果芯片進行自動掃描拍照,并在掃描完成后對已掃描的芯片照片進行拼接,然后分別對明場和熒光照片進行液滴識別計數(shù),極大地節(jié)省了時間。endprint
1 ddPCR自動分析統(tǒng)計平臺設(shè)計與實現(xiàn)
采用二維顯微鏡平移臺移動系統(tǒng)、圖像采集系統(tǒng)和計算機軟件相結(jié)合的方法,對芯片進行掃描、拼接和識別。平臺主要包括5部分:二維平移臺、平移臺驅(qū)動控制、平移臺手動控制搖桿、圖像采集和計算機軟件,平臺結(jié)構(gòu)示意圖如圖1所示。
通過計算機控制二維平移臺的移動,經(jīng)過顯微鏡放大后的圖像經(jīng)圖像采集設(shè)備采集到計算機上,然后由計算機對圖像進行后續(xù)的圖像分析。為了不開啟軟件也能使用顯微鏡,增加了平移臺手動控制搖桿對平移臺進行控制。
1.1 硬件平臺
平移臺采用海德星科技(廈門)有限公司生產(chǎn)的HDS?MS?XY8060PO?I,移動精度可達±1.5 μm。驅(qū)動控制設(shè)備采用美國GALIL Motion Control Inc.生產(chǎn)的DMC2143控制器控制。它提供了功能強大的2字符命令集及終端編程調(diào)試工具軟件包,用戶可以非常方便地進行應(yīng)用編程。圖像采集用的CCD采用的是明美公司生產(chǎn)的MD30攝像頭。手動搖桿采用STM32單片機通過串口對平移臺進行控制,可以在不開啟計算機的時候控制平移臺的移動。
1.2 計算機軟件
軟件的界面如圖2所示。
軟件的主要功能有:平移臺控制功能,包括控制運動速度、單步步長、實時顯示位置、自動移動到芯片不同位置等;對攝像頭控制功能,圖中視頻顯示控制和相機參數(shù)區(qū)域,包括控制曝光時間、亮度、對比度、白平衡和拍照等,顯示標(biāo)尺、顯示用于芯片對準的十字架;自動掃描功能,通過設(shè)置對整個芯片自動掃描拍照,并在掃描后實現(xiàn)對掃描圖像的自動拼接,使其成為一張完整芯片的液滴圖像;液滴識別功能,通過對芯片圖像自動識別,計數(shù)并對每個液滴參數(shù)的測量。
2 圖像處理算法原理
2.1 拼接原理
由于平移臺的精確定位精度比較高,經(jīng)試驗使用直接拼接(即兩幅圖像之間沒有重疊的部分進行邊與邊直接連接)的效果比較理想。而對于光源的影響,經(jīng)過在自動掃描過程中保持曝光時間不變和后面的圖像處理這兩個過程能基本消除光源的影響。使用20倍顯微鏡拼接的3行5列圖如圖3所示。
2.2 圖像識別算法原理
液滴的識別的一個難點在于把液滴從背景和其他雜質(zhì)中分離出來,因為芯片的背景顏色和液滴的內(nèi)部反差小,而且芯片圖像中還有PDMS柱子、氣泡。并且算法還要適應(yīng)不同大小的液滴、顯微鏡下不同放大倍數(shù)下的液滴以及有可能沒有聚焦上的液滴。圖像處理過程包括濾波、圖像增強、圖像形態(tài)學(xué)操作等,圖4為本文中圖像處理的具體過程及油包水液滴圖像。
2.2.1 圖像的前期處理
將所拍的液滴圖像轉(zhuǎn)化為灰度圖像。由于顯微鏡點光源的影響,所以拍出來的照片邊緣的圖像會比較暗,使用直方圖均衡化可消除光源分布不均的影響[6],圖像的效果如圖5(a)所示。
由于圖像采集CCD自身會隨開機時間增加而溫度上升、顯微鏡光源及芯片不能完全水平等影響導(dǎo)致的圖像噪聲,這里使用高斯濾波的方式減少噪聲的影響,同時也為后面的圖像增強做必要的準備[7],如圖5(b)所示。液滴內(nèi)部和背景反差小,所以要識別液滴靠的就是液滴的邊緣,因此圖像邊緣增強就是一個重要的步驟。這里的增強原理如下:
[邊緣增強=源圖像+邊緣圖像] (1)
這里的邊緣圖像使用拉普拉斯掩膜銳化,它屬于二階導(dǎo)數(shù)邊緣算子。對于數(shù)字圖像,離散函數(shù)[f(x,y)]的拉普拉斯算子可表示為:
[?2fx,y=fx+1,y+fx-1,y+fx,y+1+fx,y-1-4f(x,y)] (2)
所以可用掩膜進行銳化。但是拉普拉斯算子對噪聲很敏感,因此前面的濾波是很必要的。同時為了消除圖像邊緣不完整液滴和光線的影響,適應(yīng)后面的自適應(yīng)二值化,在此把圖像向外鏡像擴展20像素值,其效果如圖5(c)所示。
2.2.2 液滴分割
經(jīng)過前期的圖像處理,圖像的照明不均勻、噪聲等得到了很大的改善。之后使用自適應(yīng)閾值分割,對圖像進行二值化分割的同時能進一步消除照明不均、突發(fā)噪聲等的影響。本文采用局部鄰域塊的均值,由于光源分布范圍比較不均勻,經(jīng)實驗這里取鄰域41×41的窗口即取當(dāng)前像素點的1 680鄰域像素的平均值作為當(dāng)前像素點的閾值T:
[T=i=11680Pi1 680] (3)
式中,[Pi]是當(dāng)前像素點的1 680鄰域像素。
之后圖像再變回邊緣擴展前的大小。經(jīng)過這一步能很好地分離出背景與液滴(見圖6(a)),接下來使用距離變換和分水嶺算法把液滴間、液滴與背景間、液滴與雜質(zhì)間的粘連分離開來[8]。
當(dāng)然,在進行距離變換前需要對二值圖像進行一些形態(tài)學(xué)操作(見圖6(b)),以避免分水嶺時出現(xiàn)過渡分割。分水嶺操作時采用局部極小值分水嶺:對距離變換所得的灰度圖(見圖6(c))片采局部極大值的方式把液滴、背景、雜質(zhì)等分別分離出來,把這個圖像矩陣作為分水嶺的標(biāo)記矩陣與液滴源圖像的灰度圖像進行分水嶺算法,之后對產(chǎn)生的分水嶺圖片邊界標(biāo)記為分水嶺脊線,用脊線取反在與二值圖像相與,即可分離出液滴(見圖6(d))。由于標(biāo)記多時分水嶺算法耗時會比較久,所以這里提出一種減少標(biāo)記的算法:即只對粘連的液滴就行分割。在進行灰度變換之前,把二值圖像中大于正常液滴面積的快提取出來,然后對這些比較大的面積進行距離變換和分水嶺算法分離出液滴,然后再和提取留下的圖像合并。
從圖中可以看出,一些使用形態(tài)學(xué)無法分離的粘連,使用距離變換與分水嶺結(jié)合可以很好的把它們分離出來(圖中灰色標(biāo)識)。
2.2.3 后期處理及識別
圖像形態(tài)學(xué)處理是圖像處理很常見的處理方式,二值圖像形態(tài)學(xué)預(yù)算是圖像形態(tài)學(xué)的基礎(chǔ),其基本運算有腐蝕、膨脹、開運算、閉運算、骨架抽取等。在液滴分割過程中,為了還原液滴原來的圖像大小需要把分離出來的二值液滴圖像進行縮放。一般的操作是進行腐蝕和膨脹運算,但是腐蝕和膨脹會把圖像結(jié)構(gòu)去除或把鄰近結(jié)構(gòu)合并。圖像細化是一種骨架抽取的辦法,它能在細化后保證結(jié)構(gòu)的連通性,并且保持物體的基本形狀[9]。為了保證膨脹后不粘連,采用細化的原理對圖像進行粗化操作。因為圖像細化會保證連通性,所以我們將圖像求反,執(zhí)行細化,將結(jié)果在求反即可實現(xiàn)粗化操作,其效果見圖7(a)。endprint
為了刪除液滴外的物體,需要把二值圖像中面積過大和過小的雜質(zhì)去除。本文使用的方法是尋找二值圖像的輪廓[10],然后對輪廓里的面積與液滴大小的面積進行比較,刪除過大和過小的物體見圖7(b)。
到此已經(jīng)基本完成了圖像的分割。實驗中為了保證速度,使用對圖像中每一個輪廓實行最小外接圓操作,然后對得到輪廓的外包絡(luò)圓進行判斷,同時滿足以下三個條件即為液滴:圓的半徑大小在液滴半徑大小范圍內(nèi);物體的白點有大于6個點在圓上;由于形態(tài)學(xué)處理中會把一些點去除,所以包絡(luò)圓里白點的個數(shù)大于[611]圓的面積。最終得到的識別圖如圖7(c)所示,并在列表中統(tǒng)計出每個液滴的圓心、半徑和內(nèi)部像素平均灰度值。從識別效果可以看出,去除邊緣顯示不全的液滴,此算法可以識別出絕大部分的液滴。經(jīng)統(tǒng)計識別出了386個液滴,只有一個液滴由于嚴重離焦和雜質(zhì)影響而沒有被識別出來(圖中紅色圓圈),識別率達到了99.74%,這其中也包括了7個沒有正確對焦的液滴。
2.2.4 后期統(tǒng)計
由于背景、雜質(zhì)及物體焦點等的影響,有時液滴的二值圖像會粘連了背景,導(dǎo)致不能滿足第2.2.3節(jié)中液滴識別的三個條件;同時,液滴背景、同液滴同樣大小的氣泡等原因,有可能不是液滴的物體被識別為液滴。因此后期統(tǒng)計中本文中加入了手動點擊圖片添加沒有識別到的液滴和去除錯誤識別出的液滴。其原理是根據(jù)區(qū)域生長算法的原理[11],根據(jù)所點擊的位置對二值圖像進行區(qū)域生長,然后用最小外接圓包絡(luò)生長出的區(qū)域。將沒有識別到的液滴直接添加到已識別出的液滴序列中;去除錯誤識別的液滴時依次查找已有識別出的液滴序列的圓心是否與此外接圓的圓心相同,相同時去除此圓。經(jīng)過后期的檢查識別率基本上能達到100%。進行統(tǒng)計時,統(tǒng)計液滴半徑、像素平均灰度的最大值、最小值、均值、標(biāo)準差等。為了能在熒光下區(qū)分出發(fā)熒光和不發(fā)熒光的液滴,使用K?means聚類算法根據(jù)液滴像素平均灰度值經(jīng)行分類。其原理為:對一直液滴像素平均灰度集[x1,x2,…,xn],其中每個觀測都是一個1維實矢量,k?平均聚類要把這n個觀測劃分大2個集合中(亮和暗),使得組內(nèi)平方和最小,即找到滿足下式的聚類Si:
[mini=02x∈six-μi2] (4)
式中[μi]是[si]中所有點的均值。
同時為了防止有些錯誤分類,在列表框中設(shè)置排序功能,可人工檢查分類結(jié)果。表1為圖4(b)的識別統(tǒng)計結(jié)果。
表1 識別統(tǒng)計結(jié)果
從表1可以看出,液滴半徑標(biāo)準差只有1.009,考慮到分割和個別液滴不清晰的影響,這個差別是很小的,說明液滴大小很均勻;從實驗圖直觀上也可以看出,聚類的亮點數(shù)和暗點數(shù)也基本符合。同時為了驗證此方法對熒光下識別液滴同樣有效,對熒光下的液滴做了同樣的識別和統(tǒng)計,如圖8和表2所示。
從統(tǒng)計結(jié)果可以看出識別出了348個液滴,其中發(fā)熒光的有10個,這與人工驗證完全吻合。對剔除了大的雜質(zhì)后液滴半徑標(biāo)準差只有1.187說明比較均一,但從最大值也可以看出有個別液滴偏離均值比較大,說明液滴形成還是不太穩(wěn)定。
3 ddPCR實驗
3.1 實驗芯片制備
本實驗利用經(jīng)典的T?通道方法產(chǎn)生液滴。液滴數(shù)字PCR的制備過程與微流控芯片一樣,經(jīng)光刻、曝光、顯影將掩模板的圖形轉(zhuǎn)移到基片上,然后澆注聚二甲基硅氧烷(PDMS),最后將基片和蓋片鍵合在一起,完成芯片的制作[12]。用于制備液滴的油相和水相在流體控制模塊驅(qū)動下從進樣口進入芯片微通道,并在流體表面張力和剪切力的共同作用下高速生成納升級油包水液滴[13]。液滴存儲區(qū)可以對液滴間的排列距離和堆積密度進行適當(dāng)?shù)恼{(diào)整,有利于在液滴PCR反應(yīng)之后將獨立的液滴分離出來,提高檢測精度。芯片制作見圖9。
3.2 芯片識別實驗
制得ddPCR芯片之后即可進行液滴產(chǎn)生試驗。這里采用負壓系統(tǒng)進行進樣。之后就可以在平臺上進行液滴識別試驗了。分別在明場和熒光下進行自動掃描液滴,之后進行拼接,然后識別統(tǒng)計。圖10是軟件分析的結(jié)果,其統(tǒng)計結(jié)果如表3所示。
識別過程中已經(jīng)把太小的液滴和雜質(zhì)排除掉了,從統(tǒng)計結(jié)果可以看到明場下的標(biāo)準差仍然達到了2.013,說明液滴生成過程中還有一些不穩(wěn)定的因素導(dǎo)致大小不一。經(jīng)過人工檢測,識別出的803個液滴中,只有一個是錯誤的,識別正確率為99.88%;當(dāng)然在熒光下,由于光源的原因、加之液滴大小本來就不十分均勻,導(dǎo)致液滴半徑偏差較大比較正常。其實熒光下秩序要知道熒光液滴的個數(shù)即可,同種識別出76個熒光液滴,經(jīng)人工識別也是76個,識別正確率為100%。分別在不同放大倍數(shù)的液滴、不同大小的液滴、不同液滴圖片大小的情況下進行實驗。因此只統(tǒng)計識別率,即統(tǒng)計正確分割出液滴的比例。識別統(tǒng)計如圖11所示,圖中的直線表示理想情況真實值與檢測值相等的情況。液滴在明場下的平均識別率達到了99.69%,這其中0.31%不能識別的液滴一般是不能正確對焦或被雜質(zhì)干擾較大的液滴。
同樣在熒光下,發(fā)熒光的液滴識出率達到了100%,因此只統(tǒng)計分類正確率,如圖12所示,圖中直線表示理想情況軟件聚類與人工分類相等的情況。由于CCD曝光時間差異、顯微鏡光線、人工甄別的主觀因素等的影響,導(dǎo)致在熒光下非熒光液滴較少時分類的結(jié)果與人工甄別結(jié)果相差較大,平均分類正確率達到90.5%,熒光個數(shù)較多時差異較大主要是液滴圖片曝光時間較大的原因。
圖12 人工分類與軟件聚類統(tǒng)計
4 結(jié) 語
本平臺實現(xiàn)自動定位掃描拍照并拼接成一個大的芯片圖片。同時為了提高識別率和修正錯誤識別,程序中有人工點擊圖片增加未識別的液滴或刪除所識別的液滴,明場識別率可達到99.69%且正確率可以達到100%,熒光下熒光液滴識別率約為100%且分類正確率可以達到87%以上。這可以極大的方便液滴數(shù)字PCR的實驗,降低了液滴數(shù)字PCR的出錯率,實現(xiàn)絕對定量。此平臺也可以擴展用于其他芯片的自動掃描拼接,用于其他如細胞、量子點等的掃描識別。
參考文獻
[1] HINDSON B J, NESS K D, MASQUELIER D A, et al. High?throughput droplet digital PCR system for absolute quantitation of DNA copy number [J]. Analytical chemistry, 2011, 83(22): 8604?8610.
[2] MAZUTIS L, ARAGHI A F, MILLER O J, et al. Droplet?based microfluidic systems for high?throughput single DNA molecule isothermal amplification and analysis [J]. Analytical chemistry, 2009, 81(12): 4813?4821.
[3] ERNST A, STREULE W, SCHMITT N, et al. A capacitive sensor for non?contact nanoliter droplet detection [J]. Sensors and actuators A: physical, 2009, 153(1): 57?63.
[4] VLADISAVLJEVI? G T, SHAHMOHAMADI H, DAS D B, et al. Glass capillary microfluidics for production of monodispersed poly (dl?lactic acid) and polycaprolactone microparticles: experiments and numerical simulations [J]. Journal of colloid and interface science, 2014, 418(10): 163?170.
[5] BARET J C, MILLER O J, TALY V, et al. Fluorescence?activated droplet sorting (FADS): efficient microfluidic cell sorting based on enzymatic activity [J]. Lab on a chip, 2009, 9(13): 1850?1858.
[6] Wikipedia. Histogram equalization [EB/OL]. [2016?07?12]. https://en.wikipedia.org/w/index.php?title=Histogram_equalization&oldid=724935223.
[7] LOPEZ?MOLINA C, DE BAETS B, BUSTINCE H, et al. Multiscale edge detection based on Gaussian smoothing and edge tracking [J]. Knowledge?based systems, 2013, 44: 101?111.
[8] PANG Quan, YANG Cuirong, FAN Yingle, et al. Overlapped cell image segmentation based on distance transform [C]// Proceedings of 2006 the 6th World Congress on Intelligent Control and Automation. [S.l.]: IEEE, 2006: 9858?9861.
[9] LAM L, LEE S W, SUEN C Y. Thinning methodologies: a comprehensive survey [J]. IEEE transactions on pattern analysis and machine intelligence, 1992, 14(9): 869?885.
[10] SUZUKI S, BE K. Topological structural analysis of digitized binary images by border following [J]. Computer vision, graphics, and image processing, 1985, 30(1): 32?46.
[11] ADAMS R, BISCHOF L. Seeded region growing [J]. IEEE transactions on pattern analysis and machine intelligence, 1994, 16(6): 641?647.
[12]金慶輝,莊貴生,劉菁,等.微流控分析芯片在線尿中蛋白及LDH同工酶檢測[J].光學(xué)精密工程,2005,13(2):151?157.
[13] SEEMANN R, BRINKMANN M, PFOHL T, et al. Droplet based microfluidics [J]. Reports on progress in physics, 2012, 75(1): 1?11.endprint