潘亞玲 陳橋然 王晗琦 陳彤彤 嚴福華 陸 勇
胸片成本低、輻射小,常用于心胸疾病篩查、術(shù)前評估及隨訪[1]。心胸比率(cardiothoracic ratio,CTR)是胸片衡量心臟大小的重要指標,成人CTR>0.5,視為心臟增大[2]。目前醫(yī)師主要借助筆尺或PACS 系統(tǒng)測量CTR,兩者均需手動操作,人工判定心臟增大。近年來,深度學(xué)習(xí)技術(shù)迅速發(fā)展,已在肺結(jié)節(jié)影像診斷領(lǐng)域取得顯著進展[3]。本研究旨在利用深度學(xué)習(xí)技術(shù)實現(xiàn)CTR 自動測量,評價自動測量與手動測量CTR 的相關(guān)性和一致性,比較自動測量、手動測量、肉眼觀察三種方法判定心臟增大所用時間和準確性差異。
回顧性分析本院2018 年1 月至6 月符合以下標準的健康體檢者。納入標準:①體檢行胸部X 線檢查;②年齡>18 歲。排除標準:①胸片存在明顯金屬偽影;②有肺葉/肺段切除手術(shù)史;③胸片顯示重度胸腔積液、完全性肺不張、彌漫性肺部嚴重滲出。1312例胸部X 線攝片納入研究。對全部數(shù)據(jù)脫敏并重新編號,標注肺野和心臟輪廓后,將其隨機分為訓(xùn)練數(shù)據(jù)集(881 例)、驗證數(shù)據(jù)集(221 例)和測試數(shù)據(jù)集(210 例)
X 線攝片采用美國飛利浦DR 機行吸氣后屏氣曝光,拍攝立位后前位胸片,拍攝距離180cm,投照電壓81kV, 管電流2.85mA,曝光時間<0.01 秒。
Mask R-CNN[4]深度卷積網(wǎng)絡(luò)是目前最高水平的實例分割算法,是在Faster R-CNN 深度卷積網(wǎng)絡(luò)的基礎(chǔ)上融合了全卷積網(wǎng)絡(luò)(fully convolutional networks, FCN) 和特征金字塔網(wǎng)絡(luò)(feature pyramid networks,F(xiàn)PN)思想的一種多任務(wù)深度神經(jīng)網(wǎng)絡(luò)。Mask R-CNN 有兩個階段,第1 階段,Mask R-CNN 的主干網(wǎng)絡(luò)(ResNet 101 和FPN)提取胸片的特征圖,利用區(qū)域建議網(wǎng)絡(luò)(region proposal network, RPN)生成目標的建議框,篩選建議框得到感興趣區(qū)(region of interest, ROI);第2 階段,利用卷積神經(jīng)網(wǎng)絡(luò)預(yù)測每個ROI 的類別、邊界,并行輸出邊界的二值掩膜,用以描述目標的像素級分割結(jié)果。通過訓(xùn)練數(shù)據(jù)集訓(xùn)練Mask R-CNN深度卷積網(wǎng)絡(luò)檢測、分割肺野和心臟,驗證數(shù)據(jù)集調(diào)整、優(yōu)化網(wǎng)絡(luò)參數(shù)?;诰W(wǎng)絡(luò)分割的肺野和心臟輪廓(圖1),分別確定肺野和心臟輪廓各點在胸片坐標系上的坐標值。心臟最大橫徑是胸廓中線分別至左、右心緣的最大距離之和,等于心臟輪廓在胸片坐標系中最大橫坐標值與最小橫坐標值之間的差值;胸廓最大橫徑是最大胸廓處的肋骨內(nèi)緣間距,等于肺野輪廓在胸片坐標系中所有同一橫坐標軸上的最大橫坐標值與最小橫坐標值之間差值中的最大值。計算心臟最大橫徑與胸廓最大橫徑之比得到CTR[5]。設(shè)定CTR>0.5 為心臟增大,CTR ≤0.5 為心臟大小正常。
對測試數(shù)據(jù)集胸片分別采用自動測量、肉眼觀察、手動測量三種方法判定心臟增大。測試Mask R-CNN深度卷積網(wǎng)絡(luò)分割肺野和心臟的準確性,并記錄自動測量所得CTR 值和心臟增大判定結(jié)果。2 名高年資放射診斷醫(yī)師在盲法狀態(tài)下于同一PACS 工作站,采用肉眼觀察法獨立判定心臟增大。若2 名醫(yī)師判定結(jié)果不一致,則以原先影像報告中的判定結(jié)果為準。間隔1 個月后,打亂胸片編號,2 名醫(yī)師再次于同一PACS 工作站雙盲手動測量CTR,以兩者CTR 均值判定心臟增大。使用秒表分別記錄自動測量、肉眼觀察、手動測量判定心臟增大的所用時間。
采用SPSS 22.0 軟件統(tǒng)計分析。計量資料用x±s表示。采用Pearson 相關(guān)與Bland-Altman 分析自動測量與手動測量CTR 的相關(guān)性和一致性。以手動測量為判定標準,計算自動測量、肉眼觀察判定心臟增大以及Mask R-CNN 深度卷積網(wǎng)絡(luò)分割肺野和心臟的靈敏度、特異度及準確度。采用Kappa 檢驗分別分析自動測量、肉眼觀察與手動測量判定心臟增大的一致性,κ=1 為完全一致,κ>0.75 為一致性較好,0.4 ≤κ ≤0.75 為一致性中等,κ<0.4 為一致性差。判定心臟增大所用時間兩兩比較采用LSD檢驗。以P<0.05 為差異有統(tǒng)計學(xué)意義。
測試胸片共210 例,除心臟增大外,伴隨肺內(nèi)、肺外其他征象的胸片分別有65 例和106 例。Mask R-CNN 深度卷積網(wǎng)絡(luò)基于測試胸片分割肺野和心臟的準確度均>98%, 其中分割心臟的特異度(88.99%)低于肺野(95.48%),見表1。
表1 胸片伴隨征象及Mask R-CNN 深度卷積網(wǎng)絡(luò)的分割效能
表2 自動測量、手動測量及肉眼觀察對心臟增大的判定結(jié)果和所用時間
表3 自動測量與肉眼觀察對心臟增大的判定效能
圖1 Mask R-CNN 深度卷積網(wǎng)絡(luò)對肺野(綠色)和心臟(黃色)的分割結(jié)果(A)CTR的測量徑線(B)a+b 為心臟最大橫徑,c 為胸廓最大橫徑,0.44 為CTR。
自動測量與手動測量CTR分別為0.514±0.080,0.506±0.078。Pearson 相關(guān)分析顯示自動測量與手動測量CTR 呈強相關(guān)性(r=0.976,P<0.001)。自動測量與手動測量CTR 的線性回歸方程為CTR(Y=0.016+0.955X,P<0.001)( 圖2A)。Bland-Altman 分析顯示自動測量與手動測量CTR 的差值均數(shù)為0.008,95%一致性界限為(-0.027,0.042),93.33%(196/210) 的點在一致性界限內(nèi)(圖2B)。
圖2 自動測量與手動測量CTR 的散點圖(A)和Bland-Altman圖(B)。
自動測量、手動測量及肉眼觀察對心臟增大的判定結(jié)果和所用時間(表2)。自動測量與手動測量判定心臟增大的一致性較好(κ=0.895,P<0.001),而肉眼觀察與手動測量判定心臟增大的一致性中等(κ=0.667,P<0.001)。自動測量、手動測量、肉眼觀察判定心臟增大所用時間分別為5.62 秒/例、9.81 秒/例、2.57 秒/例, 兩兩間比較差異均有統(tǒng)計學(xué)意義(P<0.001)。
以手動測量為心臟增大的判定標準,自動測量判定心臟增大的靈敏度、特異度及準確度分別為99.03%、90.65%、94.76%,均高于肉眼觀察法(85.44%、81.31%、83.33%),見表3。
本研究中,肺野和心臟分割是深度學(xué)習(xí)自動測量CTR 的前提。Mask R-CNN 深度卷積網(wǎng)絡(luò)可基于體檢胸片精準分割肺野和心臟,分割的準確度均大于98%,優(yōu)于研究報道的結(jié)果[6]。Mask R-CNN 深度卷積網(wǎng)絡(luò)分割心臟的特異度低于肺野,這可能與心臟上下界在胸片上顯示不確切有關(guān)。研究[6]提出僅分割肺野,測量兩肺野內(nèi)緣之間的最大距離作為心臟最大橫徑計算CTR,可以規(guī)避心臟分割效果不理想的情況。本研究結(jié)果顯示Mask R-CNN 深度卷積網(wǎng)絡(luò)自動測量與醫(yī)師借助PACS 系統(tǒng)手動測量CTR 具有強相關(guān)性(r=0.976,P<0.001)。 Bland-Altman分析顯示自動測量與手動測量CTR 的差值均數(shù)為0.008,約93.33%的點在一致性界限內(nèi),兩者測量CTR 的相差幅度很小,具有較好的一致性。因此,利用Mask R-CNN 深度卷積網(wǎng)絡(luò)分割肺野和心臟,能夠?qū)崿F(xiàn)體檢胸片CTR 的自動精確測量。
在實際臨床工作中,絕大多數(shù)醫(yī)師為節(jié)省讀片時間,一般僅憑肉眼觀察判定心臟增大。本研究以手動測量為心臟增大判定標準,發(fā)現(xiàn)肉眼觀察與手動測量判定心臟增大的一致性中等(κ=0.667),而自動測量與手動測量判定心臟增大的一致性較好(κ=0.895)。肉眼觀察判定心臟增大缺乏客觀性,而自動測量與手動測量CTR 判定心臟增大不受主觀因素影響,還能夠定量反映心臟增大的程度。研究[7]表明CTR>0.55 時先心病患者的死亡風(fēng)險是CTR <0.48 患者的8 倍。Chana 等[8]研究顯示CTR>0.5 預(yù)測左、右心室功能不全的靈敏度和特異度分別為73.9%和47.4%。Yotsueda 等[9]的多中心大樣本前瞻性隊列研究表明CTR 增大是血液透析患者死亡的獨立危險因素,會增加心血管疾病的發(fā)生風(fēng)險。盡管CTR 對預(yù)測心臟功能不全有一定局限性,但目前CTR 仍然是胸片診斷心臟增大、評估心血管疾病的重要指標。因此,相較于肉眼觀察,精確測量CTR 評價心臟大小對心臟病變篩查和預(yù)后評估更具臨床價值。
基于深度學(xué)習(xí)自動判定心臟增大的研究思路主要分為兩類:①用肺野或心臟的標注數(shù)據(jù)訓(xùn)練深度學(xué)習(xí)分割模型,基于分割結(jié)果測量相關(guān)參數(shù)如心胸面積比(cardiothoracic area ratio,CTAR)和CTR,間接判定心臟增大;②用正常和心臟增大的標注數(shù)據(jù)訓(xùn)練深度學(xué)習(xí)分類模型,直接判定心臟增大。Hasan 等[10]提出基于部分肺野和心臟的分割結(jié)果測量CTAR 判定心臟增大,但心臟與膈肌的分界在胸片上通常顯示不確切,容易造成標注的心臟下界出現(xiàn)誤差。理論上,相較于心臟和肺野面積,心臟和胸廓最大橫徑對分割精度的依賴性更低。因此,CTR 較CTAR 對深度學(xué)習(xí)模型分割肺野和心臟的容錯率更高。Dallal 等[11]采用圖割(graph-cut)算法分割肺野,通過Harris 角點算法在分割的肺野邊緣檢測與心臟邊界相關(guān)的角點來確定心臟邊界,該方法測量CTR 和CTAR 的平均誤差率分別為7.9%和26.4%。Cicero 等[12]通過語義分析法在影像報告中提取“心臟增大”關(guān)鍵詞,以關(guān)鍵詞作為分類標簽訓(xùn)練的GoogLeNet 模型,判定心臟增大的靈敏度和特異度分別為81%、80%。提取影像報告關(guān)鍵詞作為分類標簽較人工標注可以大幅度降低標注成本。然而,有些影像報告中心臟增大的判定結(jié)果是僅憑肉眼觀察獲得的。本研究結(jié)果顯示肉眼觀察判定心臟增大的準確度為83.33%。因此,影像報告中關(guān)鍵詞本身尚不夠精確,加之語義分析法提取關(guān)鍵詞存在一定誤差,可能會直接影響深度學(xué)習(xí)分類模型訓(xùn)練和測試結(jié)果的準確性。
本研究利用Mask R-CNN 深度卷積網(wǎng)絡(luò)分割肺野和心臟,基于分割結(jié)果測量CTR,自動判定心臟增大的準確度為94.76%,所用時間為5.62 秒/例,而醫(yī)師借助PACS 手動測量CTR 判定心臟增大所用時間為9.81 秒/例。因此,基于Mask R-CNN 深度卷積網(wǎng)絡(luò)自動測量CTR 能夠準確判定心臟增大,有效避免重復(fù)的手動操作,且所用時間短,適用于實時的臨床診斷環(huán)境。
本研究存在一定的局限性。Mask R-CNN 深度卷積網(wǎng)絡(luò)的訓(xùn)練和測試數(shù)據(jù)均為體檢胸片,因此可能不適于測量住院患者的胸片CTR。尤其當住院患者的胸片存在大面積胸腔積液、完全性肺不張、彌漫性肺部嚴重滲出時,會導(dǎo)致肺野或心臟的邊界非常模糊甚至肉眼難以分辨,給深度學(xué)習(xí)分割肺野和心臟帶來巨大挑戰(zhàn)。綜上所述,基于深度學(xué)習(xí)自動測量與手動測量CTR 具有強相關(guān)性和較好的一致性。利用深度學(xué)習(xí)技術(shù)自動測量CTR 可快速、準確地判定胸片心臟增大,為胸部X線體檢心臟病變篩查提供有效途徑。