田風選 常健博 陳亦豪 魏俊吉 馮銘 王任直 賀喜武
精確計算硬膜下血腫(SDH)和硬膜外血腫(EDH)體積具有重要臨床意義[1]。既往研究發(fā)現(xiàn),對于慢性硬膜下血腫,僅引流20%的出血即可有效幫助血腫吸收[2]。不同類型顱內(nèi)出血有多種測量和計算方法,傳統(tǒng)的手動分割方法系計算血腫體積的“金標準”,但該方法耗時費力;另一傳統(tǒng)的方法多田公式,即長×寬×高/2(A×B×C/2),雖適用于腦實質(zhì)出血、硬膜下血腫[3]和硬膜外血腫[4],但因硬膜下和硬膜外血腫形態(tài)并非均為對稱的新月形或紡錘形,特別是許多慢性硬膜下血腫呈逗號樣[5],故計算結(jié)果的準確性有待商榷。隨著深度學習等計算機技術的進步,越來越多的學者開始嘗試應用相關技術計算血腫體積,如Cho等[6]構(gòu)建涵蓋所有腦出血類型的血腫體積算法,準確度達80%、回歸度為82%;國內(nèi)常健博等[7]也發(fā)現(xiàn),與多田公式等傳統(tǒng)算法相比,卷積神經(jīng)網(wǎng)絡(CNN)與手動分割估算腦實質(zhì)出血血腫體積的一致性更高。但迄今未見一種專門針對硬膜下和硬膜外血腫的算法,基于此,本研究擬提出一種基于卷積神經(jīng)網(wǎng)絡的算法分割(以下簡稱算法分割),并與多田公式、手動分割進行對比,以期探索一種精準、便捷的硬膜下和硬膜外血腫體積測量方法。
1.資料來源 本研究所用影像學資料經(jīng)中國顱內(nèi)出血影像數(shù)據(jù)庫(CICHID)授權(quán)[8],該數(shù)據(jù)庫由中國醫(yī)學科學院北京協(xié)和醫(yī)院牽頭,于2019年成立,截至2020年6月,該數(shù)據(jù)庫共納入20余所醫(yī)療中心計5000余例腦出血患者的頭部CT影像資料。該數(shù)據(jù)庫中的顱內(nèi)出血主要以自發(fā)性腦實質(zhì)出血為主,同時還包括腦室出血、硬膜下血腫、硬膜外血腫、蛛網(wǎng)膜下腔出血等類型,本研究選擇硬膜下和硬膜外血腫的數(shù)據(jù)進行分析。
2.納入與排除標準 (1)選擇硬膜下和硬膜外血腫患者的頭部CT影像。(2)均為術前或未行手術治療時獲得。(3)均為標準的DICOM格式,掃描參數(shù)及機器品牌不限。(4)年齡>18歲。(5)排除存在雙側(cè)硬膜下或硬膜外血腫的患者。
3.一般資料 根據(jù)上述納入與排除標準,選擇2017年1月至2019年6月共129例患者計352張(包含10 208層圖片)CT影像,其中,硬膜下血腫患者有33例共104張CT掃描結(jié)果、硬膜外血腫患者96例共248張CT掃描結(jié)果。
1.血腫體積估算方法 本研究納入的352張CT影像均采用手動分割、算法分割、多田公式3種方法對血腫體積進行測量。(1)手動分割:采用Insight Toolkit SNAP開源軟件(ITK?SNAP,https://itk.org/)[9],在橫斷面CT平掃影像上沿血腫邊界進行勾畫,輸出血腫體積。手動分割時由一位研究員進行標注,由另一位研究員進行核實,標注邊界有爭議時與第三者討論后決定。(2)多田公式:A×B×C/2是在ITK?SNAP開源軟件輔助下,精確測量最大血腫面積層面最長徑(A),以及該層面與最長徑垂直的最長徑(B),同時以實際層厚乘以出血層面數(shù)(C)[10]。由兩位研究員分別獨立完成A、B、C的精確測量,取平均值納入最終統(tǒng)計。(3)算法分割:首先,為降低構(gòu)建算法分割結(jié)果的過擬合風險,提高魯棒性,對所納入病例的CT影像進行五折交叉驗證。即由計算機將CT影像隨機均分為5組,每次選擇4組作為訓練集,余1組作為驗證集,共進行5次訓練,匯總5次模型在各自驗證集的結(jié)果,以評估算法模型的性能。然后,將血腫手動分割數(shù)據(jù)作為卷積神經(jīng)網(wǎng)絡的輸入數(shù)據(jù),通過TensorFlow平臺(https://tensorflow.google.cn)搭建三維卷積神經(jīng)網(wǎng)絡[9]。網(wǎng)絡結(jié)構(gòu)為3D U?Net,選擇自適應矩估計(Adam)優(yōu)化器作為迭代過程中的優(yōu)化器,以權(quán)重交叉熵作為損失函數(shù)進行計算,以手動分割結(jié)果作為“金標準”,采用Dice相似性系數(shù)(DSC)作為分割精度標準進行訓練。訓練過程中實時檢查損失函數(shù)和驗證集上的分割精度,對收斂速度和趨勢進行判斷并調(diào)整網(wǎng)絡參數(shù),于訓練集獲得滿意模型,在驗證集獲得算法分割結(jié)果。
2.血腫形態(tài)及邊界對測量方法的影響 為進一步分析不同測量方法一致性檢驗存在差異的原因,本研究對不同測量方法的百分誤差在不同血腫形態(tài)(對稱與不對稱)、血腫邊界(模糊與清晰)中是否存在差異進行分析。其中,紡錘形血腫標記為對稱,凹透鏡形、逗號形等血腫標記為不對稱;由標注員憑借經(jīng)驗根據(jù)血腫邊界與腦組織之間CT值差距的大小判斷血腫邊界清晰或模糊。
3.統(tǒng)計分析方法 采用絕對差值和百分誤差評估不同算法的準確性,百分誤差的具體計算方法為︱V其他方法-V手動分割︱/V手動分割×100%;一致性檢驗采用Bland?Altman分析(均數(shù)-差值)、組內(nèi)相關系數(shù)(ICC)表示,并采用PRISM GraphPad 8.0軟件繪制Bland?Altman分析圖。采用SPSS 20.0統(tǒng)計軟件進行數(shù)據(jù)處理與分析,正態(tài)性檢驗采用Kolmogorov?Smirnov檢驗,呈非正態(tài)分布的計量資料以中位數(shù)和四分位數(shù)間距[M(P25,P75)]表示,采用Mann?WhitneyU檢驗。以P≤0.05為差異具有統(tǒng)計學意義。
經(jīng)Kolmogorov?Smirnov檢驗,通過不同算法獲得的血腫體積以及各種方法與手動分割的體積百分誤差均為非正態(tài)分布資料(P=0.000),不同算法所得血腫體積和各種方法與手動分割的體積百分誤差如表1所示,以手動分割結(jié)果為“金標準”,算法分割的百分誤差小于多田公式,提示算法分割所得血腫體積更接近手動分割。
表1 不同算法測量的硬膜下和硬膜外血腫體積和百分誤差[M(P25,P75)]Table 1. Subdural/epidural hemorrhage volumes and percentage error by different measurement methods[M(P25,P75)]
算法分割對手動分割差值的中位數(shù)(?4.51 ml)較多田公式對手動分割差值的中位數(shù)(8.39 ml)小,提示算法分割結(jié)果較多田公式更接近“金標準”。一致性分析顯示,算法分割對手動分割差值的95%一致性界限(95%LoA)為?59.47~42.76 ml,差值范圍為102.23 ml,而多田公式對手動分割差值的95%LoA為?15.15~37.50 ml,差值范圍為52.65 ml,提示多田公式的波動范圍較??;兩種方法與手動分割的組內(nèi)相關系數(shù)均較高(>0.75),提示兩種算法與“金標準”均具有較好的一致性(表2,圖1)。
圖1 Bland?Altman一致性檢驗 1a 多田公式對手動分割的95%LoA范圍為?15.55~37.50 ml,約94.60%(333/352)的測值在95%LoA內(nèi) 1b 算法分割對手動分割的95%LoA為?59.47~42.76 ml,約94.89%(334/352)的測值在95%LoA內(nèi)Figure 1 Bland?Altman agreement test findings The 95%LoA of Tada formula vs.manual segmentation was?15.55-37.50 ml and the points inside 95%LoA was 94.60% (333/352,Panel 1a). The 95%LoA of algorithm segmentation vs.manual segmentation was?59.47-42.76 ml and the points inside 95%LoA was 94.89%(334/352,Panel 1b).
表2 不同測量方法的一致性檢驗(n=352)Table 2. Agreement test of different measurement methods(n=352)
不同血腫形態(tài)和邊界在同一種血腫體積測量方法中的差異如表3所示,血腫對稱與不對稱之間算法分割的百分誤差差異有統(tǒng)計學意義(P=0.000),提示算法分割在不對稱血腫的百分誤差更?。谎[邊界(模糊與清晰)在算法分割和多田公式的百分誤差均有統(tǒng)計學意義(P=0.000),其中算法分割在邊界清晰的血腫百分誤差更小,而多田公式在邊界模糊的血腫中的百分誤差更小。
表3 同一算法百分誤差在不同血腫形態(tài)和邊界中的比較[M(P25,P75),%]Table 3. Analysis of different hematoma shape and boundary in the same measurement method[M(P25,P75),%]
本研究采用基于卷積神經(jīng)網(wǎng)絡的顱內(nèi)血腫自動分割算法,可自動識別、分割頭部CT平掃顯示的硬膜下和硬膜外血腫,并計算血腫體積,以手動分割為“金標準”,分別對算法分割、多田公式進行一致性檢驗,結(jié)果顯示,與多田公式相比,算法分割的百分誤差最小,為23.62%;Bland?Altman分析顯示,有94.89%(334/352)的測值在95%LoA內(nèi),與“金標準”的一致性良好;但算法分割的95%LoA波動范圍更大,Mann?WhitneyU檢驗顯示血腫形態(tài)和邊界對算法分割的精確性有影響,算法分割測量形態(tài)不對稱、邊界清晰的血腫可能更佳。
多田公式的計算方法是由橢球體體積公式(4/3×π×0.5長×0.5寬×0.5高)簡化而來,作為床旁簡便、快捷的血腫體積估算工具,廣泛應用于腦實質(zhì)出血血腫的測量。也有學者探索其在硬膜下和硬膜外血腫中的應用。Petersen和Espersen[4]較早證實該公式可用于硬膜外血腫體積的估算,其平均誤差為?2.7 ml(標準差為3.7 ml),但該項研究納入標準嚴格限制為紡錘形硬膜外血腫,血腫量較小,故臨床推廣性較差。Gebel等[11]發(fā)現(xiàn),多田公式與手動分割算法在急性硬膜下血腫中的相關性較高(r=0.842),但相關性低于腦實質(zhì)出血(r=0.929)。Sucu等[1]驗證多田公式在慢性硬膜下血腫中的應用,發(fā)現(xiàn)長徑A和寬徑B在血腫面積最大層面進行測量,優(yōu)于在中間層面。但上述研究均存在一定局限性,首先是樣本量較小,均<50例;其次,比較的是不同算法對同一整體的測量結(jié)果,但統(tǒng)計學指標并未采用一致性評價而采用相關系數(shù)(correlation coefficients)[12];最后,多田公式在慢性硬膜下血腫中高估血腫體積約10%[5]。與上述研究結(jié)果類似,本研究結(jié)果顯示,多田公式可用于硬膜下和硬膜外血腫測量,其組內(nèi)相關系數(shù)較高(0.974)。但本研究多田公式的百分誤差較既往研究偏大(28.20%),平均高估出血量約8 ml,究其原因,可能是由于多田公式的誤差隨血腫體積的增加而增大[13]。
為彌補傳統(tǒng)算法的不足,近年越來越多的研究應用神經(jīng)網(wǎng)絡相關算法用于血腫分割[6,14],其準確度(Dice值)高達80%[6]。本研究算法分割的百分誤差較多田公式?。?3.62%對28.20%),絕對誤差更?。?4.51 ml對8.39 ml)。Bland?Altman圖證實有94.89%(334/352)的測值在95%LoA內(nèi),顯示與“金標準”的一致性良好,但其波動范圍較大(?59.47~42.76 ml),其原因主要是算法分割在多中心數(shù)據(jù)集上泛化能力較差,在測試中存在極值案例,導致約5.11%(18/352)在95%LoA以外的誤差遠超過多田公式;其次,本研究采用五折交叉驗證,即數(shù)據(jù)集隨機分為5組輪流作為訓練集和驗證集,最終結(jié)果顯示5種算法模型的平均能力,導致其95%LoA不僅反映算法分割與“金標準”之間的差異,而且反映不同算法模型之間的差異,導致其與多田公式相比,組內(nèi)相關系數(shù)較低。
本研究還發(fā)現(xiàn),無論是多田公式還是算法分割的準確性,均受血腫邊界清晰度的影響。這可能是由于慢性硬膜下血腫的邊界不清,在手工標注邊界、測量徑線時存在誤差,即使雙人背對背標注,仍存在較大的標注誤差,難以確定實際出血量;同時這種標注誤差也被引入算法分割訓練中,使得算法分割的精確性降低。同時算法分割還受血腫形態(tài)的影響,其在不對稱血腫中的百分誤差優(yōu)于對稱血腫(17.37%對29.31%),而多田公式無論血腫形態(tài)其百分誤差相近,約為30%,提示算法分割在形態(tài)不規(guī)則血腫中存在優(yōu)勢。
為了更好地把握病情、更精準地回答臨床問題,如何簡便快捷地計算顱內(nèi)血腫體積,特別針對傳統(tǒng)多田公式計算不準確的硬膜下和硬膜外血腫,是臨床醫(yī)師面臨的挑戰(zhàn)。腦實質(zhì)出血的血腫體積被作為判斷患者是否需行手術治療的指征之一[15];但在硬膜下和硬膜外血腫中,由于多田公式存在較大誤差,而手動分割又耗時費力,限制其在血腫體積與預后關系研究中的應用。簡便、準確的硬膜下和硬膜外血腫體積測量工具的開發(fā)與應用與患者預后的關系,使探索血腫體積作為手術指征成為可能。隨著人工智能(AI)技術在臨床醫(yī)學領域的深入應用,逐漸實現(xiàn)自動、精準和便捷的顱內(nèi)血腫分割,是未來影像組學、手術模擬和手術導航等算法進一步研究的基礎。
在硬膜下和硬膜外血腫中,與傳統(tǒng)多田公式相比,采用卷積神經(jīng)網(wǎng)絡計算頭部CT平掃圖像中的血腫體積,其百分誤差較小,與手動分割結(jié)果的一致性良好,在形態(tài)不對稱、邊界清晰的血腫中表現(xiàn)更好;但算法分割在少數(shù)病例中的誤差較大,臨床應用需進一步探索。
利益沖突 無