陳飛,胡靜,戴春華,游濤,耿長冉,湯曉斌
1. 南京航空航天大學(xué) 核科學(xué)與技術(shù)系,江蘇 南京 210000;2. 江蘇大學(xué)附屬醫(yī)院 放療科,江蘇 鎮(zhèn)江 212000
宮頸癌是全球女性常見的惡性腫瘤,放射治療是宮頸癌的主要治療方式之一[1-2]。在目前精準(zhǔn)放療時(shí)代,腫瘤靶區(qū)及危及器官(Organs at Risk,OARs)勾畫的準(zhǔn)確性顯得尤為重要[3-4]。臨床上認(rèn)為手動(dòng)勾畫靶區(qū)及OARs是金標(biāo)準(zhǔn),但這是一個(gè)費(fèi)時(shí)費(fèi)力的過程。有研究表明宮頸癌患者的OARs勾畫時(shí)間約2 h,而且不同臨床醫(yī)師勾畫結(jié)果可能因?yàn)榻?jīng)驗(yàn)及理解不同而存在較大差異,這大大影響了患者放療的準(zhǔn)確性[4-6]。近年來,基于深度學(xué)習(xí)自動(dòng)勾畫的研究備受關(guān)注,并在前列腺癌、肺癌等部位取得很大進(jìn)展,降低了放療醫(yī)師工作負(fù)荷以及勾畫差異性[7-9]。深度學(xué)習(xí)算法模型已逐漸應(yīng)用于臨床,在實(shí)際使用過程中,常會(huì)發(fā)現(xiàn)通用的深度學(xué)習(xí)算法模型自動(dòng)勾畫效果不符合醫(yī)院的具體勾畫習(xí)慣而影響臨床的應(yīng)用[10]。
AccuLearning是由Manteia公司研發(fā)的一款深度學(xué)習(xí)自主訓(xùn)練平臺(tái),對各醫(yī)院提供自動(dòng)勾畫算法模型定制,從而加大深度學(xué)習(xí)模型的實(shí)用性,推薦訓(xùn)練最小病例數(shù)量30例。目前關(guān)于小樣本算法定制可行性的相關(guān)報(bào)道較少,本研究基于此,使用我院30例的宮頸癌患者數(shù)據(jù)在AccuLearning平臺(tái)中進(jìn)行算法模型訓(xùn)練,并對生成的算法模型進(jìn)行測試分析,討論其對于宮頸癌臨床靶區(qū)(Clinical Target Volume,CTV)及OARs算法定制的可行性,以期得到AccuLearning軟件算法定制應(yīng)用于臨床實(shí)踐的依據(jù)。
AccuLearning是基于深度學(xué)習(xí)進(jìn)行醫(yī)學(xué)影像分割的訓(xùn)練平臺(tái),能夠完成小樣本勾畫算法模型訓(xùn)練。在深度學(xué)習(xí)訓(xùn)練的過程中,通過數(shù)據(jù)驅(qū)動(dòng)來更新模型的參數(shù),從而實(shí)現(xiàn)自動(dòng)提取特征,能夠比傳統(tǒng)圖像處理算法達(dá)到更優(yōu)的效果。AccuLearning提供了從數(shù)據(jù)輸入到模型部署的完整流程,方便用戶可以在訓(xùn)練完成后直接在工作流程中使用,整體過程如下:數(shù)據(jù)集創(chuàng)建,模型訓(xùn)練,模型評估以及模型應(yīng)用。訓(xùn)練好的自動(dòng)勾畫算法模型能夠以加密過的二進(jìn)制文件導(dǎo)入到AccuContour軟件平臺(tái)上,AccuContour能夠結(jié)合新算法模型來執(zhí)行自動(dòng)勾畫功能,并輸出相應(yīng)的勾畫結(jié)構(gòu)。
AccuLearning采取的網(wǎng)絡(luò)模型為自適應(yīng)的網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)建策略,根據(jù)訓(xùn)練集中每個(gè)病例的體素間距和各個(gè)ROI的體積,自動(dòng)選取合適的采樣窗口大小,生成類似于2D-UNet結(jié)構(gòu)的自動(dòng)分割網(wǎng)絡(luò)。該網(wǎng)絡(luò)默認(rèn)包含5個(gè)最大池化層和5個(gè)上采樣層,基礎(chǔ)的卷積核通道數(shù)為32,尺寸為3×3,在每個(gè)卷積層后面都有批標(biāo)準(zhǔn)化層和線性整流函數(shù),在編碼器和解碼器之間以級(jí)聯(lián)的方式進(jìn)行躍層連接,將高分辨率的細(xì)節(jié)信息和深層次的圖像語義信息進(jìn)行結(jié)合,提升勾畫模型的效果。
選取2020年1月至10月江蘇大學(xué)附屬醫(yī)院收治的45例宮頸癌患者為研究對象,年齡37~79歲(中位值55歲),根治性放療患者18例,術(shù)后輔助性放療患者27例?;颊叨ㄎ痪捎醚雠P位真空墊固定,使用飛利浦大孔徑CT(Brilliance CT big bore)進(jìn)行掃描,掃描層厚3 mm,層間距3 mm。
將掃描獲取的45例CT圖像通過DICOM傳輸至Eclipse 13.6治療計(jì)劃系統(tǒng),由一名有經(jīng)驗(yàn)的放療醫(yī)師手動(dòng)勾畫CTV和OARs,其中OARs包括:骨髓、右側(cè)股骨頭、左側(cè)股骨頭、腸袋、直腸、膀胱,并定義為參考輪廓勾畫(Vreference,Vr)。各結(jié)構(gòu)勾畫原則如下:CTV勾畫參照RTOG宮頸癌臨床靶區(qū)勾畫標(biāo)準(zhǔn);骨髓勾畫包括髂骨、骶骨、恥骨、坐骨;兩側(cè)股骨頭包括股骨頭及股骨頸;腸袋勾畫包括從乙狀結(jié)腸往上至CTV上1.5 cm的腸管;直腸由肛管口勾畫至直腸乙狀結(jié)腸交界處;膀胱勾畫需包括膀胱外壁。所有勾畫輪廓均由兩位有著20年以上工作經(jīng)驗(yàn)的主任醫(yī)師審核并修改確認(rèn)。
隨機(jī)抽取30例患者作為訓(xùn)練集,將CT圖像及結(jié)構(gòu)文件導(dǎo)出,應(yīng)用AcceLearning軟件深度學(xué)習(xí)形成勾畫算法模型。訓(xùn)練好的算法模型手動(dòng)導(dǎo)入至AccuContour軟件平臺(tái),并將余下15例患者CT作為測試集傳至AccuContour平臺(tái),應(yīng)用訓(xùn)練好的算法模型對其相應(yīng)結(jié)構(gòu)進(jìn)行自動(dòng)勾畫,定義為自動(dòng)輪廓勾畫(Vautomatic,Va),勾畫完成后將結(jié)構(gòu)文件傳回Eclipse計(jì)劃系統(tǒng),獲取相關(guān)參數(shù)分析。
以醫(yī)師手動(dòng)勾畫的靶區(qū)及OARs輪廓作為金標(biāo)準(zhǔn),通過以下指標(biāo)評估自動(dòng)勾畫與手動(dòng)勾畫的吻合度,其中Va和Vr分別表示自動(dòng)勾畫和手工勾畫的結(jié)構(gòu)體積,Va∩Vr是自動(dòng)勾畫與手動(dòng)勾畫結(jié)構(gòu)重疊的體積。
1.4.1 相似性系數(shù)和敏感性指數(shù)
相似性系數(shù)(Dice Similarity Coefficient,DSC)和敏感性指數(shù)(Sensitive Index,SI)是形態(tài)學(xué)吻合度評價(jià)指標(biāo),可利用其評價(jià)自動(dòng)勾畫結(jié)構(gòu)與手動(dòng)勾畫的重合一致性,DSC和SI值介于0~1之間,當(dāng)DSC和SI趨近于1時(shí),代表兩者具有較好的重合性。DSC和SI的計(jì)算公式如式(1)~ (2)。
1.4.2 位置偏差
質(zhì)心偏差(Deviation of Centroid,DC)可通過記錄手動(dòng)勾畫與自動(dòng)勾畫的各結(jié)構(gòu)幾何中心在三維坐標(biāo)軸上的差異(△x,△y,△z)計(jì)算得到,其能較直觀地反映手動(dòng)勾畫與自動(dòng)勾畫結(jié)構(gòu)的位置關(guān)系。DC的計(jì)算公式如式(3)所示。
1.4.3 體積差異系數(shù)
體積差異系數(shù)(Deviation of Volume,DV)表示手動(dòng)勾畫與自動(dòng)勾畫的體積差異占手動(dòng)勾畫的比例,用于評價(jià)自動(dòng)勾畫的容積穩(wěn)定性,結(jié)果以其絕對值的百分比表示。DV的計(jì)算公式如式(4)所示。
采用箱式圖顯示了15例測試集各個(gè)勾畫輪廓三維方向的偏差(圖1)。CTV位置偏差有一例z方向異常較大的患者,高達(dá)1.03 cm(DSC=0.83),其余患者在x、y、z三個(gè)方向的誤差都分別小于1.3、3.6、3.8 mm;對于骨髓、右側(cè)股骨頭以及左側(cè)股骨頭,自動(dòng)勾畫和手動(dòng)勾畫的位置偏差均小于3 mm,偏移距離小于3 mm的掃描層厚;圖1中腸袋位置偏差在x、y方向偏差小于3 mm,z方向偏差較大,最大偏差達(dá)到8.7 mm;直腸位置偏差在x、y方向偏差小于2 mm,z方向偏差小于3.3 mm;膀胱位置偏差發(fā)現(xiàn)大多數(shù)患者位置偏差都小于5 mm,有一例患者在y、z方向偏差異常較大,△y=-0.9 cm、△z=-0.53 cm,而且此例患者膀胱DSC值僅為0.58。
圖1 自動(dòng)和手動(dòng)兩種勾畫方式在x、y、z方向的位置偏差
研究中發(fā)現(xiàn),測試集中有一例CTV以及一例膀胱自動(dòng)勾畫位置偏差數(shù)據(jù)較為異常,通過患者CT圖像(圖2)推斷:CTV數(shù)據(jù)異常者為45例患者中唯一1例宮頸癌陰道及外陰侵犯患者,其CTV結(jié)構(gòu)異于訓(xùn)練集中CTV;膀胱勾畫異常者是因?yàn)榇嘶颊咝羞^左側(cè)輸尿管吻合術(shù)加左側(cè)輸尿管支架置入術(shù),CT可見膀胱內(nèi)高密度顯影,干擾了膀胱的自動(dòng)勾畫,所以在其他評價(jià)指標(biāo)分析中,均排除了該異常數(shù)據(jù)。
圖2 CTV及膀胱數(shù)據(jù)異?;颊逤T圖
表1展示了各結(jié)構(gòu)自動(dòng)勾畫輪廓的評價(jià)參數(shù)。結(jié)果顯示:CTV的DSC達(dá)到了0.86,OARs中骨髓、雙側(cè)股骨頭的DSC均≥0.93,腸袋和直腸約0.90左右;CTV的SI值為0.87,其余結(jié)構(gòu)的SI值均≥0.90;CTV和腸袋DC均值在3~6 mm,其余的均小于3 mm;關(guān)于DV均值,最小的是骨髓3.86%,最大的是腸袋12.32%。
表1 各結(jié)構(gòu)自動(dòng)勾畫輪廓的評價(jià)參數(shù)[(±s),(最小值~最大值)]
表1 各結(jié)構(gòu)自動(dòng)勾畫輪廓的評價(jià)參數(shù)[(±s),(最小值~最大值)]
結(jié)構(gòu) 病例數(shù) DSC SI DC/ mm DV/%CTV 14 0.86±0.01 (0.85~0.88) 0.87±0.03 (0.80~0.90) 3.27±1.01 (1.97~4.53) 6.70±3.74 (2.72~13.75)骨髓 15 0.93±0.01 (0.91~0.94) 0.95±0.01 (0.93~0.97) 1.01±0.41 (0.33~1.79) 3.86±2.63 (0.04~7.50)右側(cè)股骨頭 15 0.94±0.02 (0.91~0.97) 0.97±0.01 (0.94~0.98) 1.67±0.98 (0.37~3.14) 6.19±5.01 (1.03~16.11)左側(cè)股骨頭 15 0.93±0.01 (0.91~0.94) 0.97±0.01 (0.96~0.98) 2.00±0.81 (0.91~3.37) 8.02±4.21 (4.47~16.59)腸袋 15 0.90±0.02 (0.87~0.93) 0.95±0.03 (0.87~0.97) 5.27±2.46 (1.97~9.12) 12.32±5.92 (3.40~18.54)直腸 15 0.89±0.02 (0.85~0.92) 0.92±0.02 (0.89~0.97) 2.05±1.03 (0.73~3.48) 6.26±6.33 (0.14~19.90)膀胱 14 0.93±0.03 (0.86~0.96) 0.90±0.06 (0.79~0.98) 2.30±2.06 (0.62~5.73) 7.29±4.63 (3.20~17.31)
圖3展示了本實(shí)驗(yàn)中CTV和OARs勾畫斷層效果圖,由圖3可看出自動(dòng)勾畫的結(jié)構(gòu)輪廓與臨床醫(yī)師勾畫的相似重合度高。表2總結(jié)了近幾年具有代表性的盆腔腫瘤深度學(xué)習(xí)自動(dòng)勾畫的數(shù)據(jù),并將其DSC值與本研究進(jìn)行了比較與分析[4,11-14],發(fā)現(xiàn)本實(shí)驗(yàn)DSC均值與其他文獻(xiàn)十分接近甚至優(yōu)于個(gè)別文獻(xiàn)中的結(jié)果。
表2 該研究DSC結(jié)果與其他文獻(xiàn)結(jié)果對比(均值)
圖3 各勾畫結(jié)構(gòu)CT斷層示例
已有研究表明,基于深度學(xué)習(xí)的自動(dòng)勾畫優(yōu)于基于圖譜庫的自動(dòng)勾畫[15-16]。隨著人工智能深度學(xué)習(xí)技術(shù)的發(fā)展,基于不同方式的深度學(xué)習(xí)自動(dòng)勾畫成為了放療領(lǐng)域的研究熱點(diǎn)[17-20]。盡管基于深度學(xué)習(xí)的自動(dòng)勾畫模型在放療領(lǐng)域取得了很大的成果,但由于高質(zhì)量醫(yī)療數(shù)據(jù)的稀缺性、私密性,以及不同數(shù)據(jù)源之間的標(biāo)準(zhǔn)不同的原因,導(dǎo)致通用模型無法持續(xù)應(yīng)對放療領(lǐng)域日益發(fā)展的自動(dòng)勾畫需求。Manteia公司提出深度學(xué)習(xí)和傳統(tǒng)算法結(jié)合的方法,應(yīng)用AccuLearning軟件進(jìn)行小樣本數(shù)據(jù)深度學(xué)習(xí)模型訓(xùn)練,生成的模型可導(dǎo)入AccuContour軟件進(jìn)行自動(dòng)勾畫,其中為了進(jìn)一步提高模型的輸出精度,AccuContour軟件在模型應(yīng)用部署時(shí)會(huì)結(jié)合傳統(tǒng)算法對部分勾畫輪廓使用后處理技術(shù),以及在部分傳統(tǒng)算法能達(dá)到高精度的器官上,直接采用傳統(tǒng)算法進(jìn)行勾畫,以達(dá)到最佳的勾畫精度。
研究結(jié)果顯示,宮頸癌臨床靶區(qū)及OARs的自動(dòng)勾畫與手動(dòng)勾畫有著較高的相似度。DSC是評價(jià)自動(dòng)勾畫精度的重要指標(biāo),而且Zou等[21]認(rèn)為DCS大于0.7表示自動(dòng)勾畫與手動(dòng)勾畫相似性較高。本研究各勾畫輪廓DSC均值都大于0.85,表現(xiàn)出較高的相似性。其中骨髓,兩側(cè)股骨頭以及膀胱的DCS值高達(dá)0.93左右,這可能是因?yàn)檫@些OARs邊界清晰且其與周圍組織對比度高,此外SI值為0.87~0.97,也表明較高的重合性。DC是通過質(zhì)心的偏差來衡量自動(dòng)勾畫輪廓偏移程度一項(xiàng)參數(shù),骨髓,兩側(cè)股骨頭,直腸以及膀胱的DC平均值均小于3 mm,不足CT掃描一層的厚度,體現(xiàn)了很好的輪廓重合性,與DSC以及SI結(jié)果相同。CTV以及腸袋的DV均值稍微大點(diǎn),CTV質(zhì)心偏移主要集中在y和z方向。回顧性分析CT圖像可知y方向的偏移可能是因?yàn)榛颊甙螂壮溆潭炔煌约澳c道位置的變化,導(dǎo)致了CTV前界的變化;z方向的偏移主要是因?yàn)槊坷颊呓Y(jié)構(gòu)性的差異,研究自動(dòng)勾畫輪廓發(fā)現(xiàn)靶區(qū)上界定位較差,這可能跟不同的患者主動(dòng)脈分叉位置不同有關(guān);而且此次實(shí)驗(yàn)定義腸袋上界為CTV上1.5 cm,因?yàn)镃TV上界的個(gè)體差異,從而導(dǎo)致腸袋上界的不確定,這也可能增加了腸袋z方向的質(zhì)心偏移。所有勾畫結(jié)構(gòu)中DV最大均值為12%左右,說明自動(dòng)勾畫體積與手動(dòng)勾畫差別小。這幾項(xiàng)評價(jià)參數(shù)都說明了小樣本自主訓(xùn)練算法模型的自動(dòng)勾畫具有很高的穩(wěn)定性,經(jīng)臨床醫(yī)師審核修改后可應(yīng)用于臨床。
為了更直觀地表現(xiàn)本研究自動(dòng)勾畫的效果,表2將本實(shí)驗(yàn)結(jié)果與其他文獻(xiàn)結(jié)果做了對比,由于各個(gè)文獻(xiàn)所選的OARs不是完全相同,因此只概括了與本研究具有相同輪廓的數(shù)據(jù)??赡芤驍?shù)據(jù)量、CT圖像質(zhì)量、輪廓勾畫原則等因素的影響,這樣比較不能說明該實(shí)驗(yàn)結(jié)果優(yōu)劣于其他實(shí)驗(yàn),但是可以發(fā)現(xiàn)小樣本數(shù)據(jù)訓(xùn)練算法模型的自動(dòng)勾畫效果是理想的,宮頸癌患者小樣本數(shù)據(jù)訓(xùn)練模型能被應(yīng)用于臨床,從而提高放療質(zhì)量以及效率。
此外在該實(shí)驗(yàn)中,測試集中出現(xiàn)了特異性較大的勾畫結(jié)構(gòu),這可能是因?yàn)樾颖居?xùn)練模型數(shù)據(jù)量較小,從而導(dǎo)致模型過擬合,泛化能力減弱,因此在數(shù)據(jù)收集過程中,應(yīng)盡量增加訓(xùn)練數(shù)據(jù)的多樣性,來提升深度學(xué)習(xí)模型的精度以及泛化性能。而且放療醫(yī)師在自動(dòng)勾畫完成后,仍需認(rèn)真檢查每個(gè)自動(dòng)勾畫輪廓,排除特例的存在,因人而異的去做必要的修改。
綜上所述,AccuLearning平臺(tái)的小樣本自主訓(xùn)練模型對于絕大部分宮頸癌臨床靶區(qū)以及OARs勾畫取得了滿意的效果,能較好地解決醫(yī)院勾畫習(xí)慣不同的問題,證明了宮頸癌小樣本訓(xùn)練模型定制的可行性,對于臨床應(yīng)用有著較大的價(jià)值。但是對于CTV,自動(dòng)勾畫輪廓仍有部分層面效果較差,因此在今后研究中,可考慮適當(dāng)增加樣本數(shù)量以及多樣性,通過對比模型中自動(dòng)勾畫與手動(dòng)勾畫的差異性,對深度學(xué)習(xí)網(wǎng)絡(luò)模型中引入一些標(biāo)簽,比如是否手術(shù),臨床分期等,進(jìn)一步提高AccuLearning平臺(tái)的小樣本訓(xùn)練模型精度。