李華玲,王沛沛,李金凱,李彩虹,昌志剛,顧宵寰,孫新臣,曹遠東
1.南京醫(yī)科大學特種醫(yī)學系,江蘇南京210009;2.南京醫(yī)科大學第一附屬醫(yī)院放療科,江蘇南京210009
近年來隨著腫瘤放療的快速發(fā)展,接受腫瘤放療的人數(shù)逐漸上升。據(jù)估計,美國每年有470 000 名患者接受放療[1]。在腫瘤放療的整個過程中,危及器官(Organs‐at‐Risk, OAR)的準確勾畫是一個非常關(guān)鍵的環(huán)節(jié)[2‐3]。而醫(yī)生手動勾畫OAR 是一個十分耗時的過程,每一個患者都有數(shù)百張CT 圖像,而醫(yī)生需要對相關(guān)的CT圖像進行逐張勾畫。Walker等[4]和Teguh 等[5]經(jīng)過研究發(fā)現(xiàn)與手動勾畫OAR 相比,自動勾畫可節(jié)省大量的時間。手動勾畫OAR一般需要數(shù)小時而自動勾畫則僅需數(shù)分鐘乃至數(shù)秒即可完成。近年來,多種OAR自動勾畫技術(shù)被相繼開發(fā),其中包括基于圖譜的自動勾畫技術(shù)[6‐7]、基于機器學習的自動勾畫技術(shù)[8]和基于神經(jīng)網(wǎng)絡(luò)的自動勾畫技術(shù)[9‐10]。在自動勾畫技術(shù)提出的同時,自動勾畫技術(shù)的準確度也隨之得到了重視,并且逐漸成為學者們的研究熱點。已有不少學者對各種自動勾畫技術(shù)的準確性進行了評估[11‐14]。目前用于評估自動勾畫技術(shù)的常用方法有豪斯多夫距離(Hausdorff Distance, HD)和體積重疊方法。本研究主要目的是評估基于人工智能(Artificial Intelligence,AI)的自動勾畫軟件的準確度,并研究自動勾畫的幾何準確性是否受OAR 體積大小的影響。
選取來自南京醫(yī)科大學第一附屬醫(yī)院放療科2018年1月至11月的161例患者,其中頭頸部腫瘤40例、胸部腫瘤40例、腹部腫瘤41例、盆腔腫瘤40例。所有病例均使用CT 模擬定位機(德國Siemens)進行掃描,并將CT 圖像通過DICOM 傳至自動勾畫軟件工作站和醫(yī)生工作站。使用經(jīng)訓練的AccuContour自動勾畫軟件與手動勾畫方法對晶體、視神經(jīng)、眼球、垂體、腦干、腮腺、下頜骨、肺部、心臟、腎臟、肝臟、直腸、膀胱、股骨頭等部位進行勾畫。通過MIM Maestro 軟件計算獲得戴斯相似系數(shù)(Dice Similarity Coefficient,DSC)、Jaccard系數(shù)、HD及體積等參數(shù)。
AccuContour 自動勾畫軟件是由Manteia(中國)公司開發(fā)的一種基于深度學習的自動勾畫軟件。通過建立圖像分割模型,并以多種網(wǎng)絡(luò)結(jié)構(gòu)模型、多種loss 結(jié)構(gòu)融合進行訓練,進而對大量的數(shù)據(jù)進行學習,從而實現(xiàn)對目標圖像的自動分割和輪廓勾畫。
有經(jīng)驗的多位醫(yī)師在Elekta MONACO‐SimⅤ5.1 工作平臺上對頭頸部、胸部、腹部及盆腔腫瘤的OAR 在CT 圖像進行手動勾畫,其中每個部位均由同一位醫(yī)師進行勾畫。所勾畫的OAR 包括晶體、視神經(jīng)、眼球、垂體、腦干、腮腺、下頜骨、雙肺、心臟、雙腎、肝臟、直腸、膀胱、股骨頭等部位。勾畫時均參考RTOG OAR 勾畫指南,所涉及的OAR 勾畫范圍均一致。
目前用于評估自動勾畫技術(shù)的常用評估方法有HD 和體積重疊方法,而目前流行的重疊方法有DSC及Jaccard系數(shù)[15]。
(1)DSC 用于評價自動勾畫和手動勾畫之間的體積重疊性[5,16],其計算公式為:
其中,Va代表自動勾畫輪廓的體積,Vm代表手動勾畫輪廓的體積。DSC ∈[0,1],數(shù)值越高代表勾畫效果越好,0代表兩者沒有任何交集,1代表兩者完全重合。
(2)HD 是用于描述兩組點集之間相似程度,是兩個點集之間距離的一種定義形式,是一個點集中的點到另一個點集的最短距離的最大值。假如自動勾畫的集合A={a1,a2,…,ai},手動勾畫的集合M={m1,m2,…,mj},則兩集合的HD為:
H(A,M)越小,表示自動勾畫集合和手動勾畫集合的最短距離的最大值越小,兩個集合的交集越大,自動分割越準確。
(3)Jaccard 系數(shù)用于比較手動勾畫和自動勾畫二者之間的相似性與差異性,為自動勾畫集合A和手動勾畫集合M交集的大小與二者并集大小的比值,其公式可表示為:
Jaccard 系數(shù)值越大,表明自動勾畫與手動勾畫相似性度越高。
使用SPSS 23 軟件對數(shù)據(jù)進行統(tǒng)計學分析。總體的DSC、HD、Jaccard 系數(shù)為偏態(tài)分布,用中位數(shù)及四分位間距表示;各部位的DSC、HD、Jaccard 系數(shù)則用均數(shù)±標準差表示。對總體及各個部位的DSC、HD、Jaccard 系數(shù)與體積進行Spearman 相關(guān)分析;對晶體、視神經(jīng)、眼球、雙肺、雙腎等成對OAR 的DSC、HD、Jaccard 系數(shù)進行Wilcoxon 配對秩檢驗;對雙肺的體積進行Wilcoxon 配對秩檢驗。檢驗水準為0.05,P<0.05為差異有統(tǒng)計學意義。
總體的DSC 中位數(shù)為0.896,四分位數(shù)間距為0.125;總體的HD 的中位數(shù)為5.754 mm,四分位數(shù)間距為8.380 mm;總體的Jaccard系數(shù)的中位數(shù)為0.813,四分位數(shù)間距為0.193,具體分布情況如圖1所示。
圖1 DSC、Jaccard系數(shù)、HD的分布情況Fig.1 Distribution of Dice similarity coefficient(DSC),Jaccard coefficient,Hausdorff distance(HD)
圖2為自動勾畫與手動勾畫的比較,從圖中可以看出兩者重合性較好,但是可以看到在肝臟的自動勾畫中,自動勾畫軟件將積液誤認為肝臟組織(圖2c),自動勾畫算法在感興趣區(qū)消失層面效果有待提高。
各個部位的DSC 均數(shù)均大于0.7,其中晶體、視神經(jīng)、垂體的DSC 均數(shù)為0.7~0.8,其他部位均大于0.8。頭頸部的HD 均數(shù)均小于8 mm,胸部均小于22 mm,肝臟為34.563 mm,腹部其他OAR 均小于19 mm,盆腔均小于16 mm。頭頸部的Jaccard系數(shù)均數(shù)為0.557~0.880,其中最低的為右視神經(jīng),最高的為下頜骨,具體數(shù)值詳見表1??傮w的DSCall、HDall、Jaccardall系數(shù)與體積具有正相關(guān)性;其中,相關(guān)系數(shù)均大于0.7(rDSC=0.757,rJaccard=0.775,rHD=0.761;PDSC=0.000,PHD=0.000,PJaccard=0.000)。晶體、視神經(jīng)、眼球、垂體、腦干、腮腺、下頜骨、雙肺、膀胱、股骨頭等部位的DSC、Jaccard 系數(shù)與其體積具有相關(guān)性,其他部位則暫不能認為有相關(guān)性,如表2所示。尚不能認為各個部位的HD與體積有相關(guān)性。
雙肺之間的DSC、Jaccard 系數(shù)差異具有統(tǒng)計學意義(PDSC=0.000,PJaccard=0.000),且雙肺之間的體積差異也具有統(tǒng)計學意義(P=0.000)。左右晶體、左右視神經(jīng)、左右眼球、左右腮腺、左右顳頜關(guān)節(jié)、雙腎、左右股骨頭等部位的DSC、Jaccard 系數(shù)差異則不具有統(tǒng)計學意義,詳見表3。
AccuContour 自動勾畫軟件是基于深度學習的自動勾畫軟件,本研究顯示各個部分的DSC 均數(shù)均大于0.7,其中體積較大的部位的DSC 可達到0.9 以上,如雙肺、心臟。有學者認為DSC>0.7 則可認為自動勾畫和手動勾畫重疊性良好[17‐18]。頭頸部的Jaccard 系數(shù)均數(shù)為0.557~0.880,其中最低的為右視神經(jīng),最高的為下頜骨。頭頸部、胸部、盆腔的HD 均數(shù)分別小于8、22、16 mm;肝臟的HD均數(shù)為34.563 mm;腹部其他部位均小于19 mm。 由此可看出AccuContour 自動勾畫軟件的總體勾畫結(jié)果良好。但是經(jīng)過分析對比發(fā)現(xiàn),自動勾畫系統(tǒng)在頭頸部小體積器官、腹部及盆腔OAR的勾畫效果還有所欠缺,對于小體積的OAR,因為其僅在幾個CT 層面出現(xiàn),所以勾畫效果偏差較大。針對這個問題,已有學者研究針對于小體積OAR 自動勾畫的方法。例如Zhao 等[19]提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的自動勾畫方法用于小體積器官的勾畫。對于腹部及盆腔的OAR的自動勾畫,在某些情況下,自動勾畫系統(tǒng)會把其它組織誤認為當前所勾畫的OAR。例如在肝臟的自動勾畫中,自動勾畫系統(tǒng)會將積液誤認為是肝組織,其可能受到兩個因素的影響:(1)腹腔、盆腔病變的電子密度及CT 值與周圍正常組織相近;(2)呼吸運動及腸道蠕動使得腹部及盆腔中OAR的位置相對不固定,說明自動勾畫算法在感興趣區(qū)消失層面效果還是有所欠缺。
圖2 自動勾畫與手動勾畫的對比Fig.2 Comparison between automatic segmentations and manual segmentations
除了評價自動勾畫系統(tǒng)的準確性,本研究還探討了自動勾畫的幾何準確性是否受體積大小的影響。從結(jié)果顯示體積大小對自動勾畫的幾何準確性存在一定的影響,但是所研究的OAR自動勾畫中,仍有部分的OAR體積大小對自動勾畫的幾何準確性的影響不具有統(tǒng)計學意義,例如直腸、肝臟等。這說明還有其他因素影響自動勾畫的幾何準確性,例如感興趣區(qū)消失層面的識別、對電子密度相近器官的識別及區(qū)分等。
本研究也存在一定的局限性,主要是OAR 勾畫的誤差。具體分析,誤差主要來源于3 個方面:(1)RTOG 勾畫指南理解偏差,即醫(yī)師對OAR 勾畫范圍邊界的理解不一致,這受到醫(yī)生解剖學知識掌握情況的影響;(2)人為實踐操作的差異,即同一名醫(yī)師在不同時間或地點勾畫同一病例OAR 之間的偏差;(3)圖像質(zhì)量的影響,本研究所使用的圖像皆為CT圖像,在CT 圖像上某些解剖結(jié)構(gòu)難以清楚識別。有學者發(fā)現(xiàn)影響自動勾畫效果的不僅包括幾何準確性還包括劑量學上的準確性[11]。可進一步研究體積對自動勾畫的劑量準確是否有影響。
表2 DSC與Jaccard系數(shù)與體積的相關(guān)性分析Tab.2 Correlations between volume and DSC or Jaccard coefficient
表3 DSC、HD及Jaccard系數(shù)之間的Wilcoxon配對秩檢驗Tab.3 Wilcoxon pairing rank test on DSC,HD and Jaccard coefficient