馬明明,張耀峰,王祥鵬,張曉東,秦乃姍,王霄英
1.北京大學(xué)第一醫(yī)院醫(yī)學(xué)影像科,北京 100034;
2.北京賽邁特銳醫(yī)學(xué)科技有限公司,北京 100011
女性乳腺癌現(xiàn)已超過肺癌成為2020年全球發(fā)病率最高的癌癥,每年估計有230萬例新增病例,占所有癌癥病例的11.7%[1]。磁共振成像(magnetic resonance imaging,MRI)可用于乳腺癌高?;颊叩脑\斷、術(shù)前分期、化療效果監(jiān)測、乳腺假體植入物評估等[2]。乳腺M(fèi)RI背景實(shí)質(zhì)強(qiáng)化(background parenchymal enhancement,BPE)是乳腺動態(tài)對比增強(qiáng)MRI(dynamic contrast enhanced MRI,DCE-MRI)時正常乳腺纖維腺體組織(fibroglandular tissue,F(xiàn)GT)的強(qiáng)化區(qū)域,BPE水平與乳腺癌的發(fā)生密切相關(guān)[3],也可用于新輔助化療治療效果的預(yù)測[4]。為了實(shí)現(xiàn)BPE的標(biāo)準(zhǔn)化定量,在臨床工作中放射科醫(yī)師根據(jù)乳腺影像報告和數(shù)據(jù)系統(tǒng)(Breast Imaging Reporting and Data System,BIRADS)對BPE進(jìn)行分類[5],將BPE分為極小、輕度、中度、顯著4類。BPE的主觀視覺評估容易出現(xiàn)觀察者之間和觀察者內(nèi)的差異,因此需要更客觀、簡便的方法來評估BPE。
目前,深度學(xué)習(xí)技術(shù)已應(yīng)用于乳腺M(fèi)RI中FGT的分割[6]和強(qiáng)化體積的計算[7],但關(guān)于BPE分類的研究很少。北京大學(xué)第一醫(yī)院已經(jīng)完成了基于U-Net深度學(xué)習(xí)模型對乳腺DCE-MRI圖像中乳房和乳腺癌強(qiáng)化病灶的自動分割[8],本研究進(jìn)一步探討基于深度學(xué)習(xí)和閾值分割方法對BPE進(jìn)行自動分類的可行性,并將BPE分類結(jié)果自動接入到結(jié)構(gòu)化報告系統(tǒng)中,未來擬自動完成BPE的客觀定量,并將BPE定量應(yīng)用于乳腺癌化療效果預(yù)測的研究。
收集2010年1月1日—2018年10月30日于北京大學(xué)第一醫(yī)院接受乳腺DCE-MRI檢查的患者的影像學(xué)資料,共納入547例患者,患者均為女性,年齡22~82歲,平均年齡(52.3±11.6)歲。納入標(biāo)準(zhǔn):① 所有患者均使用相同的標(biāo)準(zhǔn)MRI掃描方案,圖像質(zhì)量合格;② 乳腺腫瘤標(biāo)本(活檢或手術(shù))病理學(xué)檢查結(jié)果為惡性;③ 患者未接受任何治療(包括手術(shù)、化療、放療等)。排除標(biāo)準(zhǔn):① 假體植入術(shù)后;② 乳腺內(nèi)極少FGT(幾乎全是脂肪);③ 雙側(cè)乳腺癌患者。由2名高年資放射科醫(yī)師(A和B)共同讀片,根據(jù)第5版BI-RADS對健側(cè)BPE進(jìn)行4分類并作為金標(biāo)準(zhǔn)。BPE分類標(biāo)準(zhǔn)如下[9]:① 極小,<25%FGT的強(qiáng)化;② 輕度,25%~50%FGT的強(qiáng)化;③ 中度,50%~75%FGT的強(qiáng)化;④ 顯著,>75%FGT的強(qiáng)化。
本研究經(jīng)過醫(yī)院倫理審查委員會的批準(zhǔn),研究工作按照北京大學(xué)第一醫(yī)院人工智能(artificial intelligence,AI)模型訓(xùn)練規(guī)范進(jìn)行。
根據(jù)北京大學(xué)第一醫(yī)院AI訓(xùn)練管理方法,首先定義研發(fā)乳腺M(fèi)RI圖像上BPE分類模型的用例。包括模型的ID、臨床問題、場景描述、模型在臨床工作中的調(diào)用流程、模型輸入及輸出數(shù)據(jù)結(jié)構(gòu)等。AI模型返回結(jié)果為BPE分類“極小、輕度、中度、顯著”。BPE分類模型預(yù)測結(jié)果返回到結(jié)構(gòu)化報告中的“背景強(qiáng)化”模塊(圖1)。
圖1 本研究簡要流程圖
采用美國GE公司的Signa Excite HD 1.5 T MRI掃描儀,使用4通道雙穴乳腺線圈行乳腺M(fèi)RI檢查。掃描序列包括軸位T1加權(quán)成像(T1-weighted imaging,T1WI)、壓脂T2加權(quán)成像(T2-weighted imaging,T2WI)、彌散加權(quán)成像(diffusion-weighted imaging,DWI)及DCE。其中DCE的參數(shù)如下:重復(fù)時間(repetition time,TR)為3.9 ms,回波時間(echo time,TE)為1.7 ms,層厚1.4 mm,層間距0 mm,視野36 cm×36 cm,矩陣320×320。靜脈注射釓對比劑0.2 mmol/kg,注射速率2 mL/s,隨后使用20 mL生理鹽水沖管。注射同時開始掃描,每個時相掃描時間為55 s,共掃描9個時相。
將DICOM圖像轉(zhuǎn)換為NiFTI格式。由1名高年資放射科醫(yī)師使用ITK-SNAP軟件標(biāo)注100個數(shù)據(jù)的FGT區(qū)域,訓(xùn)練分割模型。以本單位既往訓(xùn)練好的U-Net 3D模型分割乳房作為掩膜(mask)[11],進(jìn)一步訓(xùn)練FGT分割模型。使用547個數(shù)據(jù)進(jìn)行外部驗(yàn)證,分別為262個左側(cè)FGT和285個右側(cè)FGT(圖2)。以DCE-MRI第一期圖像為基線,使用上述模型分割得到基線FGT的體積。
圖2 訓(xùn)練乳腺FGT U-Net 3D分割模型的流程及主要參數(shù)
以增強(qiáng)掃描第三期圖像和基線圖像做減影,得到DCE-sub圖像。在DCE-sub圖像上對547個數(shù)據(jù)的BPE進(jìn)行閾值分割,取全圖中信號強(qiáng)度>50%區(qū)域?yàn)锽PE(圖3)。最后計算BPE體積與基線FGT體積的比值,公式:BPE比值=BPE體積/基線FGT體積×100%。根據(jù)BPE比值分為4類:極?。ǎ?5%);輕度(25%~50%);中度(50%~75%);顯著(>75%)。
圖3 典型病例1~4(4類BPE強(qiáng)化類型的乳腺癌)MRI圖像、FGT和BPE標(biāo)簽
對乳腺FGT分割效果的評價指標(biāo)為Dice相似性系數(shù)(Dice similarity coefficient,DSC)。對乳腺BPE分類結(jié)果的評價使用多分類混淆矩陣,計算其準(zhǔn)確度、F1評分和Kappa值。
FGT分割模型的平均DSC為0.902,模型預(yù)測FGT區(qū)域與高年資醫(yī)師標(biāo)注區(qū)域一致性高。
BPE分類的混淆矩陣和診斷效能見表1、2。
表1 BPE分類混淆矩陣
表2 BPE分類的診斷效能
乳腺M(fèi)RI增強(qiáng)檢查已被廣泛應(yīng)用于乳腺癌診斷、化療效果評估,其不僅提供了腫瘤的形態(tài)學(xué)信息,還可提供定量的功能信息。BPE是乳腺癌風(fēng)險和新輔助化療(neoadjuvant chemotherapy,NAC)效果評估的主要參數(shù)之一[3-4]。本研究使用U-Net 3D分割模型對乳腺M(fèi)RI中基線FGT區(qū)域進(jìn)行分割,并利用閾值分割技術(shù)得到增強(qiáng)后圖像中BPE區(qū)域,通過計算二者的體積之比來定量評估BPE的4分類。既往Ha等[10]已經(jīng)提出關(guān)于使用全卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)方法量化乳腺M(fèi)RI中FGT和BPE,但是BPE采用了手動標(biāo)注的方法,標(biāo)注工作量大,且測試集中FGT和BPE的準(zhǔn)確度分別為0.813和0.829。本研究與前人比較,相同之處是也使用了深度學(xué)習(xí)方法。不同之處有兩點(diǎn):第一,本研究中BPE為程序自動分割,操作簡便,并且結(jié)果優(yōu)于前人,F(xiàn)GT分割的DSC值達(dá)0.902,BPE分類準(zhǔn)確度達(dá)0.95;第二,本研究的結(jié)果可自動分類接入到結(jié)構(gòu)化報告中,對醫(yī)學(xué)影像工作流程優(yōu)化有益。
本研究提出的BPE自動分類方法整體準(zhǔn)確度較高,但是從混淆矩陣中可以看出BPE的4種類型的數(shù)據(jù)不均衡,這是由本組數(shù)據(jù)的性質(zhì)決定的。本組數(shù)據(jù)BPE自動分類結(jié)果提示中度強(qiáng)化類與人工分類差別較大,其錯誤分類發(fā)生在較輕強(qiáng)化類別中,大部分發(fā)生在相鄰類別的輕度分類。分析其可能原因有以下兩個方面。一方面,本研究以人工分類為參考標(biāo)準(zhǔn),且由2名醫(yī)師共同讀片,雖然分類的把握度較高,但仍可能存在主觀偏差。本研究中醫(yī)師通過在影像存儲與傳輸系統(tǒng)(picture archiving and communication system,PACS)工作站上連續(xù)翻動圖像獲取BPE的三維印象,對于輕度、輕-中度、中度之間的判定可能有一定誤差。另一方面,本研究中使用固定閾值分割BPE體積,研究結(jié)果表明大部分患者使用固定閾值是可行的,但可能個別患者需要使用有針對性的閾值方能準(zhǔn)確地分割BPE體積。上述誤差在臨床實(shí)際工作中是可以糾正的,我們的工作流程是DCE-MRI掃描完成后,程序自動對BPE進(jìn)行分類并輸入到結(jié)構(gòu)化報告中,醫(yī)師打開報告確認(rèn)BPE分類是否正確,基于目前的結(jié)果可知,僅極少數(shù)病例的BPE自動分類結(jié)果需要醫(yī)師修改,絕大多數(shù)病例的BPE自動分類結(jié)果不需要醫(yī)師修改,直接接受即可。這種流程既可以提高醫(yī)師的工作效率,又可以保證最終報告的準(zhǔn)確性。
本研究的局限性在于以下幾個方面。① 納入對象僅為乳腺癌初診患者,有研究[4]表明,通過定量評估NAC前后DCE-MRI中BPE的變化可反映NAC效果。因此,今后BPE相關(guān)研究應(yīng)同時納入NAC前后患者,為后續(xù)預(yù)測NAC效果做準(zhǔn)備。② 本研究以2名高年資放射科醫(yī)師共同對BPE實(shí)施的分類結(jié)果作為金標(biāo)準(zhǔn),而醫(yī)師評估的不一致性很常見[11]。為了使BPE分類標(biāo)準(zhǔn)更加可靠,將來需要對觀察者一致性進(jìn)行評估。③ 本研究排除了乳腺內(nèi)極少FGT的數(shù)據(jù),由于此類數(shù)據(jù)乳房內(nèi)幾乎無FGT,BPE計算可能不準(zhǔn)確。為了適用于復(fù)雜的臨床實(shí)際工作場景,后續(xù)研究應(yīng)針對不同F(xiàn)GT含量的患者進(jìn)行分層分析。④ 本研究選擇了一個固定閾值分割BPE,這是根據(jù)經(jīng)驗(yàn)選擇的,后續(xù)研究需要選用個性化的動態(tài)閾值進(jìn)行定量計算BPE。最后,所有研究是在同一機(jī)構(gòu)的磁共振設(shè)備進(jìn)行的,未來應(yīng)使用多中心的數(shù)據(jù)對模型進(jìn)行驗(yàn)證。
總之,基于U-Net深度學(xué)習(xí)模型和閾值分割技術(shù)對BPE進(jìn)行自動分類的準(zhǔn)確度高,有可能應(yīng)用于臨床實(shí)踐,也有可能用于探索BPE與NAC效果的相關(guān)性研究。