宋思良 陳藺林 王澤乾 吳祎璠 程紫嫣
收稿日期:2023-08-10
DOI:10.19850/j.cnki.2096-4706.2024.06.016
摘? 要:總體代謝腫瘤體積(TMTV)是一種較為重要的獨立于其他指標(biāo)的預(yù)后指標(biāo),對患者的準(zhǔn)確治療具有十分重要的指導(dǎo)作用。準(zhǔn)確確定TMTV的分級是一項極具挑戰(zhàn)的任務(wù),為此文章提出基于圖像重建的代謝腫瘤總體積分級模型,其中包含兩個模塊:分割輔助多維特征學(xué)習(xí)模塊(SAMFL)和重建糾正模塊(RCM)。前者通過優(yōu)化和融合分割特征獲得更加精確的TMTV;后者采用圖像重建和偏差糾正的方法修正分割未能準(zhǔn)確識別的區(qū)域,從而進一步提高TMTV的準(zhǔn)確性。在芝加哥大學(xué)醫(yī)院的數(shù)據(jù)集上,該模型的準(zhǔn)確率達到71%。與其他方法相比,該模型在TMTV分級方面表現(xiàn)得更加出色。
關(guān)鍵詞:代謝腫瘤總體積;圖像重建;圖像分割;偏差糾正
中圖分類號:TP391.4? ? 文獻標(biāo)識碼:A? 文章編號:2096-4706(2024)06-0070-04
Total Metabolic Tumor Volume Grading Model Based on Image Reconstruction
SONG Siliang1, CHEN Linlin1, WANG Zeqian2, WU Yifan1, CHENG Ziyan1
(1.Lanzhou University of Finance and Economics, Lanzhou? 730020, China;
2.College of Modern Science and Technology, Taiyuan University of Technology, Taiyuan? 030024, China)
Abstract: Total metabolic tumor volume (TMTV) is an important prognostic indicator independent of other indicators, and it has important guiding role in the accurate treatment on patients. Accurately determining the grading of TMTV is a highly challenging task. Therefore, this paper proposes a total metabolic tumor volume grading model based on image reconstruction, which includes two modules: segmentation assisted multidimensional feature learning module (SAMFL) and reconstruction correction module (RCM). The former obtains more accurate TMTV by optimizing and fusing segmentation features, the latter uses image reconstruction and deviation correction methods to correct the areas that were not accurately recognized in segmentation, thereby further improving the accuracy of TMTV. On the dataset of the University of Chicago Hospital, the accuracy of the model reaches 71%. Compared with other methods, this model performs better in TMTV grading.
Keywords: total metabolic tumor volume; image reconstruction; image segmentation; deviation correction
0? 引? 言
目前,肺癌已經(jīng)成為全世界死亡率第一、發(fā)病率第二的癌癥。肺癌主要分為非小細胞肺癌和小細胞肺癌,其中非小細胞肺癌(NSCLC)較為常見,占比高達85%[1]。雖然近年來有關(guān)NSCLC的研究越來越多,但是NSCLC患者的預(yù)后和生存率還是普遍較低??傮w代謝腫瘤體積(TMTV)是通過全身PET/CT評估腫瘤代謝活性體積的度量標(biāo)準(zhǔn)。作為評估NSCLC代謝活性體積的指標(biāo),TMTV對患者的治療具有重要意義。此外,已經(jīng)證明TMTV在非小細胞肺癌(NSCLC)的預(yù)后評估方面具有有別于TNM分期、腫瘤標(biāo)準(zhǔn)化攝取值(SUV)和其他臨床預(yù)后指標(biāo)的重要價值[2]。
在NSCLC治療和診斷中,CT圖像指的是計算機斷層掃描,可以為放射科醫(yī)生提供準(zhǔn)確定位解剖結(jié)構(gòu)的信息。正電子發(fā)射斷層掃描(PET)是一種功能性核醫(yī)學(xué)用來觀察代謝過程的成像技術(shù),可以為放射科醫(yī)生提供患者全身代謝信息。PET可以顯示出患者全身脫氧葡萄糖(FDG)攝取的情況,可疑的病灶組織隨著FDG攝取的增加而代謝活躍。然而,PET成像的分辨率較低,很難確定腫瘤的邊界區(qū)域,其次正常結(jié)構(gòu)(心臟、膀胱)、棕色脂肪以及良性病變(炎癥),也可能導(dǎo)致不同程度的FDG攝取增加。將PET與CT相結(jié)合整合了PET的區(qū)域檢測和CT的解剖結(jié)構(gòu)定位,放射科醫(yī)生能夠根據(jù)PET/CT [3]的圖像信息給出初步的診斷結(jié)果。
在以往的研究中,腫瘤最大攝取值(SUVmax)是最常用的腫瘤代謝指標(biāo),但SUVmax僅代表腫瘤最增殖的區(qū)域,具有局限性和偏差,不能成為精確的診斷指標(biāo)。此外,目前還沒有統(tǒng)一的SUV值劃分標(biāo)準(zhǔn)。相關(guān)研究主要基于SUV≥41%、SUV≥4.0進行劃分[4]。相比于SUV,TMTV作為腫瘤代謝評估指標(biāo)更全面、更可靠。然而,計算TMTV需要對每個NSCLC病灶的多個感興趣區(qū)域(ROI)進行描述,通常需要手工繪制,不但耗時費力,而且還受操作人員主觀因素的影響。因此,有必要開發(fā)針對NSCLC的自動化TMTV計算方法。
1? 研究背景
在現(xiàn)有的研究中,TMTV自動化計算在醫(yī)學(xué)領(lǐng)域已較為成熟,主要采用直接預(yù)測和先分割[5]再預(yù)測兩種方式。采用直接預(yù)測方式時,患者全身信息復(fù)雜多變,難以獲得準(zhǔn)確的TMTV預(yù)測。采用先分割再預(yù)測的方式時,雖然分割為后面的預(yù)測排除了許多干擾,但是分割結(jié)果的性能阻礙了預(yù)測效果的提升。由此可以看出,傳統(tǒng)的方法難以對TMTV分級做出準(zhǔn)確的預(yù)測。有關(guān)NSCLC,文獻[6]開發(fā)并驗證一種新的TMTV風(fēng)險分級體系,該體系具有有別于TNM分期[7]和其他臨床預(yù)后因素的預(yù)后價值,表明該體系可用于優(yōu)化NSCLC預(yù)處理評估和完善患者的治療決策。該體系按照體積大小將TMTV分為四類,其截斷值分別為10.0 mL、53.4 mL和155.0 mL。當(dāng)前針對TMTV的自動化分級計算并沒一種合理的方式。
針對以上問題,提出基于圖像分割偏差糾正TMTV的自動化分級方法。分別分割腫瘤前景和背景可以獲得更加全面細致的信息。輸入2D的PET和CT的U-net [8]結(jié)構(gòu)可通過兩個并行的解碼層同時分割出腫瘤前景和背景,同時利用分割輔助多維度特征學(xué)習(xí)模塊(SAMFL)得到初始TMTV,然后再利用分割出來的前景和背景重建PET和CT,并以分割重建的圖像與原圖之間的偏差(即未能準(zhǔn)確分割的感興趣區(qū)域)作為參考來修改初始的TMTV,最后利用重建糾正模塊(RCM)修改初始TMTV,獲得更好的性能。
2? 實現(xiàn)方法
2.1? 方法簡述
對NSCLC患者的診斷和治療來說,TMTV是極其重要的預(yù)后指標(biāo)。令人遺憾的是,當(dāng)前獲得準(zhǔn)確TMTV分級的方式主要是由專業(yè)的放射科醫(yī)生進行手動勾畫和計算,極為煩瑣費時,而且在病患數(shù)量較大時還可能會出現(xiàn)漏診的情況。錯誤的TMTV分級將會對患者的健康造成一定的損害。
因此,本研究提出了基于圖像重建的代謝腫瘤總體積分級模型,具體的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。該模型主要包括兩大模塊:分割輔助多維度特征學(xué)習(xí)模塊(SAMFL)與重建糾正模塊(RCM)。首先采用基于U-net結(jié)構(gòu)的網(wǎng)絡(luò)模型分別對腫瘤的前景和背景進行分割。相比于多個單通道解碼層,單一的多通道解碼層會針對每一個通道得到更加細致、更加全面的解碼采樣效果。所以在SAMFL中,我們通過兩個并行的解碼層同時分割出腫瘤的前景和背景,利用高維特征和上采樣特征預(yù)測得到初始TMTV。重建的圖像中包含分割偏差信息,可用以糾正初始TMTV。由此,我們提出RCM,用它來預(yù)測得到最終的TMTV分級。
圖1? 網(wǎng)絡(luò)整體流程圖
2.2? 分割輔助多維度特征學(xué)習(xí)模塊
雖然研究顯示TMTV分級與腫瘤分割的性能密切相關(guān),但是要想得到精準(zhǔn)無誤的腫瘤分割是極為困難的。為此,本研究提出引入分割來輔助TMTV預(yù)測,即提出分割輔助多維度特征學(xué)習(xí)模塊(SAMFL),如圖2所示。SAMFL是本研究中的一個重要模塊,它主要是基于分割結(jié)果、解碼層特征以及編碼層的高維特征,由全連接層[9]綜合預(yù)測初始TMTV。SAMFL的具體流程如下:利用U-net網(wǎng)絡(luò)進行PET和CT的分割,得到腫瘤前景和背景;將每個維度的編碼層特征分別進行池化,得到多維度的編碼層特征;通過全連接層對多維度的編碼層特征進行調(diào)整優(yōu)化,得到融合后的編碼層特征;將融合后的編碼層特征、分割結(jié)果以及解碼層的高維特征進行融合得到一維特征,再利用一個全連接層輸出初始的TMTV。
圖2? 分割輔助多維度特征學(xué)習(xí)模塊
2.3? 重建糾正模塊
在醫(yī)學(xué)圖像領(lǐng)域,腫瘤分割通常難以達到醫(yī)生所勾畫的水平。根據(jù)圖像重建[10]的原理,我們在圖像重建中盡可能地還原原圖的信息。將這種思路運用到本研究中可以得知,通過原始圖像分割結(jié)果得到的重建圖像所包含的信息可以反映分割效果的偏差。并且在NSCLC領(lǐng)域,分割的效果與TMTV分級具有強相關(guān)性,所以重建圖像產(chǎn)生的偏差可以糾正原圖預(yù)測的TMTV。
根據(jù)這些原則,本研究提出重建糾正模塊(RCM),如圖3所示,對分割未能識別的區(qū)域進行修正,獲得更加準(zhǔn)確的TMTV預(yù)測效果。它利用分割結(jié)果重構(gòu)出PET和CT的圖像,對比原圖和重構(gòu)后的圖像,發(fā)現(xiàn)分割未能識別的區(qū)域作為偏差來糾正初始的TMTV。RCM的具體流程如下:通過分割得到腫瘤的前景和背景重建得到PET和CT;將重建后的PET和CT合成三維,通過3D特征提取網(wǎng)絡(luò)得到感興趣區(qū)域的偏差;將偏差加入初始的TMTV中,得到糾正后的TMTV。
圖3? 重建糾正模塊
2.4? 損失函數(shù)
SAMFL模塊中分割的監(jiān)督由交叉熵?fù)p失函數(shù)完成,初始TMTV值由均方損失函數(shù)進行監(jiān)督。在RCM模塊中,PET圖像和CT圖像的重建效果采用均方損失函數(shù)進行優(yōu)化,最終的TMTV分級使用二值交叉熵?fù)p失函數(shù)進行監(jiān)督。
3? 實驗測試
3.1? 數(shù)據(jù)集
在實驗中,選取2004年1月至2014年12月在芝加哥大學(xué)醫(yī)學(xué)院接受治療的480例NSCLC患者進行研究。其中TMTV小于10.0 mL的Ⅰ級患者有107位,TMTV從10.0 mL到53.4 mL的Ⅱ級患者有131位,TMTV從53.4 mL到155.0 mL的Ⅲ級患者有124位,TMTV大于155.0 mL的Ⅳ級患者有109位。為了提升模型的訓(xùn)練速度,我們將所有圖像的數(shù)據(jù)尺寸均放縮為128×128像素。
3.2? 實驗細節(jié)
采用PyTorch 1.13.0作為深度學(xué)習(xí)框架,數(shù)據(jù)預(yù)處理的代碼及其他代碼由Python 3.9完成。在分割輔助多維度特征學(xué)習(xí)部分,設(shè)置批次大小為110,訓(xùn)練60個周期。與此同時,優(yōu)化器采用AdamW [11],學(xué)習(xí)率初始值設(shè)置為0.001,使用余弦退火更新學(xué)習(xí)率。對于重建糾正部分,設(shè)置批次大小為30,訓(xùn)練80個周期。
實驗采用五折交叉驗證的方法,其中訓(xùn)練集、驗證集和測試集的比例為3.5:0.5:1,采用訓(xùn)練集訓(xùn)練,再使用驗證集調(diào)參,最后用測試集測試得到結(jié)果。
3.3? 對比實驗
分別使用SUV閾值法和深度學(xué)習(xí)的方法驗證本文模型的有效性。深度學(xué)習(xí)方法主要使用ResNet [12]和SENet [13]進行評估,如表1所示。
表1? 不同方法在數(shù)據(jù)集上的結(jié)果
方法 準(zhǔn)確率 精確率 召回率 F1-score
SUV≥41% 0.28 ± 0.04 0.71 ± 0.02 0.27 ± 0.04 0.36 ± 0.06
SUV≥4.0 0.66 ± 0.02 0.71 ± 0.01 0.66 ± 0.02 0.67 ± 0.01
ResNet18 0.63 ± 0.04 0.67 ± 0.02 0.63 ± 0.04 0.64 ± 0.04
SENet50 0.58 ± 0.04 0.64 ± 0.2 0.58 ± 0.04 0.59 ± 0.04
Ours 0.71 ± 0.02 0.72 ± 0.02 0.71 ± 0.02 0.71 ± 0.01
由實驗可以看出,SUV≥41%的效果遠不如其他方法,而SUV≥4.0的效果有明顯提升,這表明SUV對于TMTV的特異性很強,但其結(jié)果波動較大。盡管SUV在特定任務(wù)中呈現(xiàn)出不錯的性能,但其在通用性方面存在一定的局限性。此外,基于深度學(xué)習(xí)的基礎(chǔ)方法在TMTV預(yù)測方面的效果也較差,這是由于TMTV的波動范圍較大,在影像上又存在許多干擾因素,很難獲得較為精確的數(shù)值。從圖4中可以清晰地發(fā)現(xiàn),本文方法在各項指標(biāo)上均優(yōu)于其他方法。
圖4? 模型性能折線圖
3.4? 消融實驗
我們進行了兩組消融實驗,分別驗證分割輔助多維度特征學(xué)習(xí)模塊和重建糾正模塊對網(wǎng)絡(luò)的影響。利用分割得到腫瘤的前景和背景進行二值化,計算得到TMTV,如表2所示。
表2? 消融實驗在數(shù)據(jù)集上的結(jié)果
方法 準(zhǔn)確率 精確率 召回率 F1-score
分割 0.53 ± 0.02 0.55 ± 0.01 0.53 ± 0.02 0.53 ± 0.02
RAMM 0.67 ± 0.02 0.69 ± 0.02 0.67 ± 0.02 0.66 ± 0.02
RAMM + RCM 0.71 ± 0.01 0.72 ± 0.02 0.71 ± 0.01 0.71 ± 0.01
通過消融實驗,我們可以得出以下結(jié)論:本研究提出的兩種模塊在性能上都有不同程度的提升。其中,RAMM模塊主要是將編碼層下采樣的最后一層高維特征、網(wǎng)絡(luò)上采樣每一個特征層以及腫瘤分割結(jié)果進行池化,得到統(tǒng)一的一維向量,并與最終的預(yù)測結(jié)果拼接,從而進行初始的TMTV預(yù)測。這種方法充分利用了分割提供的信息,在大致預(yù)測判斷上取得了不錯的性能提升。相較于單一的分割方法,RAMM模塊能夠獲得更好的性能。另一方面,RCM模塊利用分割結(jié)果重建原始圖像,利用重建后PET圖像中未能準(zhǔn)確分割腫瘤區(qū)域所包含的偏差信息來糾正RAMM模塊對TMTV的預(yù)測。從實驗結(jié)果可以看出,RCM模塊取得了良好的性能。
4? 結(jié)? 論
在本研究中,我們提出一種基于圖像重建的代謝腫瘤總體積分級模型,用于對非小細胞肺癌患者的全身代謝腫瘤體積(TMTV)進行分級。該模型根據(jù)專業(yè)放射科醫(yī)生提出的TMTV分級策略進行患者全身代謝腫瘤體積分級。分割結(jié)果與TMTV具有強相關(guān)性,因此我們引入分割輔助多維度特征學(xué)習(xí)模塊。該模塊通過SAMFL分割網(wǎng)絡(luò)獲得腫瘤的前景和背景,以及初始的TMTV。分割的精細程度對獲得準(zhǔn)確的TMTV至關(guān)重要,我們在本研究中采用了U-net結(jié)構(gòu)的網(wǎng)絡(luò),后續(xù)研究中可以考慮采用更加健壯的分割網(wǎng)絡(luò)。
此外,我們還提出了分割重建模塊,通過分析分割重建的結(jié)果來糾正初始TMTV的偏差,從而得到TMTV的分級結(jié)果。后續(xù)的研究可以考慮融合更多有效信息來指導(dǎo)網(wǎng)絡(luò)的學(xué)習(xí)。
總體而言,本研究提出的方法為后續(xù)的TMTV研究提供一種思路。未來,該研究的成果還可以輔助放射科醫(yī)生進行診斷治療,為臨床實踐提供幫助。
參考文獻:
[1] CHHIKARA B S,PARANG K. Global Cancer Statistics 2022: The trends projection analysis [J/OL]. Chemical Biology Letters,2023,10(1)[2023-07-05].https://pubs.thesciencein.org/journal/index.php/cbl/article/view/451.
[2] ZHANG H,WROBLEWSKI K,APPELBAUM D,et al. Independent Prognostic Value of Whole-body Metabolic Tumor Burden from FDG-PET in Non-small Cell Lung Cancer [J].International Journal of Computer Assisted Radiology and Surgery,2013,8:181-191.
[3] 孫濤,韓善清,汪家旺.PET/CT成像原理、優(yōu)勢及臨床應(yīng)用 [J].中國醫(yī)學(xué)物理學(xué)雜志,2010,27(1):1581-1582+1587.
[4] HAJIRA I,GEORGE M N,DUNN J T,et al. Is There an Optimal Method for Measuring Baseline Metabolic Tumor Volume in Diffuse Large B Cell Lymphoma? [J]. Eur J Nucl Med Mol Imaging,2018,45(8):1463-1464.
[5] 鄭倩.醫(yī)學(xué)圖像分割方法研究及其應(yīng)用 [D].廣州:南方醫(yī)科大學(xué),2014.
[6] PU Y L,ZHANG J X,LIU H Y. Developing and Validating a Novel Metabolic Tumor Volume Risk Stratification System for Supplementing Non-small Cell Lung Cancer Staging [J].Eur J Nucl Med Mol Imaging,2018,45(12):2079-2092.
[7] 葉波,趙珩.第八版國際肺癌TNM分期修訂稿解讀 [J].中國肺癌雜志,2016,19(6):337-342.
[8] RONNEBERGER O,F(xiàn)ISCHER P,BROX T. U-Net: Convolutional Networks for Biomedical Image Segmentation [C]//Medical Image Computing and Computer-Assisted Intervention-MICCAI 2015.Munich:Springer,2015:234?241.
[9] 周飛燕,金林鵬,董軍.卷積神經(jīng)網(wǎng)絡(luò)研究綜述 [J].計算機學(xué)報,2017,40(6):1229-1251.
[10] 施俊,汪琳琳,王珊珊,等.深度學(xué)習(xí)在醫(yī)學(xué)影像中的應(yīng)用綜述 [J].中國圖象圖形學(xué)報,2020,25(10):1953-1981.
[11] LOSHCHILOV I,HUTTER F. Decoupled Weight Decay Regularization [J/OL].arXiv:1711.05101v3 [cs.LG].[2023-07-10].https://arxiv.org/abs/1711.05101.
[12] TARG S,ALMEIDA D,LYMAN K. Resnet in ResNet: Generalizing Residual Architectures [J/OL].arXiv:1603.08029v1 [cs.LG].[2023-06-20].https://arxiv.org/abs/1603.08029.
[13] CHABY G,SENET P,VANEAU M,et al. Dressings for Acute and Chronic Wounds: a Systematic Review [J].Arch Dermatol,2007,143(10):1297-1304.
作者簡介:宋思良(1999—),男,漢族,四川成都人,碩士研究生在讀,研究方向:醫(yī)學(xué)圖像處理。