馬燁波,邵 杰,楊 桓,黃麒銘,邢文宇,葉長青,王卓然,楊明雷,陳 鍇,李 博,陳自強*,陳建剛
1. 華東師范大學上海市多維度信息處理重點實驗室,上海 200241
2. 海軍軍醫(yī)大學(第二軍醫(yī)大學)第一附屬醫(yī)院脊柱外科,上海 200433
3. 西交利物浦大學人工智能與先進計算學院,蘇州 215028
4. 復旦大學信息科學與工程學院生物醫(yī)學工程中心,上海 200433
5. 美的集團人工智能創(chuàng)新中心,北京 100015
脊柱內(nèi)固定融合術(shù)是一種常規(guī)的脊柱外科手術(shù)方式,椎弓根螺釘是目前應用最為廣泛的內(nèi)固定器械[1]。然而,由于人體的脊柱為復雜的三維結(jié)構(gòu)且周圍有許多重要組織,包括脊髓、神經(jīng)根、大血管和胸腹部臟器等,手術(shù)過程中錯誤置釘可能引起嚴重并發(fā)癥,甚至可導致癱瘓和死亡[2]。常規(guī)的手術(shù)方式是醫(yī)師根據(jù)經(jīng)驗“徒手”置釘,再使用C 形臂透視進行螺釘位置驗證,螺釘置入的準確性完全取決于手術(shù)醫(yī)師的經(jīng)驗和對二維圖像的判讀,具有較大的主觀性和不準確性[3]。雖然基于CT 的計算機輔助導航技術(shù)可以提高螺釘置入的準確率[4-5],但存在成本高、操作復雜、輻射暴露等缺點。
隨著超聲技術(shù)的發(fā)展,有研究者將超聲技術(shù)應用于椎弓根螺釘置入手術(shù)中,如超聲圖像融合配準[6]、釘?shù)缊D像超聲識別[7]、超聲松質(zhì)骨成像[8]等。與CT 相比,超聲設(shè)備體積小、重量輕、價格低廉,便于醫(yī)師以更快的速度和更低的成本獲取所需要的信息。前期有較多文獻報道了使用超聲進行椎弓根螺釘釘?shù)劳暾耘凶x的方法[9-11],然而術(shù)中圖像的判讀需要具備一定超聲診斷經(jīng)驗的醫(yī)師進行,且較易產(chǎn)生誤判?;谌斯ぶ悄艿挠嬎銠C輔助診斷技術(shù)不僅可以從超聲圖像中識別出所需的客觀指標,代替人眼對圖像進行判讀和識別,而且能夠在人眼難以判斷的情況下輔助醫(yī)師做出更準確的判讀。
脊柱椎弓根螺釘釘?shù)拦浅晥D像為判斷釘?shù)赖耐暾蕴峁┝撕芏嘤杏玫奶卣?,這些特征可以在支持向量機(support vector machine,SVM)模型的幫助下對超聲圖像進行分類。本研究首先采用圖像處理的方式提取在脊柱標本上預建立的椎弓根螺釘釘?shù)赖某晥D像特征,然后基于提取的特征使用SVM 模型對釘?shù)赖撞渴欠衿茡p進行二分類判斷。
1.1 材料與儀器 4 例新鮮尸體胸腰椎標本由海軍軍醫(yī)大學(第二軍醫(yī)大學)基礎(chǔ)醫(yī)學院解剖學教研室提供,男、女各2 例,年齡為59~85(73.14±9.87)歲。整個實驗方案得到了海軍軍醫(yī)大學(第二軍醫(yī)大學)第一附屬醫(yī)院倫理委員會審批。預建立椎弓根螺釘釘?shù)拦?0 個,使用20 MHz超聲換能器(型號UM-S20-17S,直徑1.7 mm,日本Olympus 公司)對預建立的釘?shù)赖撞窟M行超聲檢查并采集圖像,使用CT 儀(型號Aquilion ONE,日本Canon 醫(yī)療系統(tǒng)有限公司)對預建立的釘?shù)肋M行完整性評估。
1.2 研究方法 整體流程圖見圖1。由3 名具有5 年以上脊柱外科工作經(jīng)驗的醫(yī)師(2 名主治醫(yī)師、1 名副主任醫(yī)師),結(jié)合釘?shù)缹嶋H探測、CT 圖像和釘?shù)莱晥D像特點對釘?shù)劳暾院统晥D像進行分類。首先由其中2 名主治醫(yī)師各自獨立完成,如果2 名醫(yī)師意見存在分歧則由副主任醫(yī)師裁決,分類過程中排除重疊、不清晰的超聲圖像。判斷為釘?shù)劳暾臉颖颈欢x為正樣本,釘?shù)榔茡p的樣本被定義為負樣本。最終在得到的樣本(1 000 個正樣本和800 個負樣本)中隨機選取正、負樣本各400 個用于實驗,采用五折交叉驗證的方法對樣本進行數(shù)據(jù)增強,最終得到樣本集。
采用SVM 模型對獲得的超聲圖像樣本集進行釘?shù)朗欠衿茡p的二分類判斷,其中正樣本如圖2A所示。負樣本根據(jù)破損程度分為2 級:(1)容易被誤判為正樣本的負樣本,即破損不嚴重的樣本(圖2B);(2)可以準確判斷的負樣本,即破損較為嚴重的樣本(圖2C)。與破損不嚴重的負樣本、正樣本相比,破損較為嚴重的負樣本紋理清晰和規(guī)則程度較低,且不易描述;破損不嚴重的負樣本與正樣本均有清晰且規(guī)律的紋理,但是在破損不嚴重的負樣本中,聲波會通過破損的釘?shù)辣谠卺數(shù)劳庑纬陕暡ǚ瓷?,表現(xiàn)為離中央反射區(qū)較遠的區(qū)域有白色前景(圖2D)。
基于紋理特征分析有可能將破損較為嚴重的負樣本與正樣本、破損不嚴重的負樣本區(qū)分開,因此首先提取圖像紋理特征作為第一類特征并進行初始分類。考慮到僅使用紋理特征難以區(qū)分破損不嚴重的負樣本和正樣本,引入灰度分布分析得到用于區(qū)分前景和背景的閾值T;再做椎弓根螺釘釘?shù)赖耐膱A(直徑為椎弓根螺釘釘?shù)赖闹睆剑撏膱A的判別半徑通過設(shè)計的損失函數(shù)得到;最后提取同心圓外部圖像的一維統(tǒng)計特征作為第二類特征并進行二次分類。
1.2.1 圖像預處理 (1)圖像裁剪:為了避免超聲圖像中非樣本超聲影像部分對后續(xù)處理的影響,同時減少計算負載,將尺寸為1 920 像素×1 080像素的原始超聲圖像(圖3A)利用裁剪函數(shù)裁剪成尺寸為789 像素×761 像素的圖像,僅保留樣本超聲圖像區(qū)域(圖3B)。(2)圖像增強:為了擴大圖像中前景和背景的區(qū)分度,使用灰度變換函數(shù)將圖像I中的灰度值映射到圖像J中的新值以實現(xiàn)圖像增強,表達式為
其中,I表示要處理的圖像,J表示增強后的圖像。同時,圖像增強也可以改善圖像質(zhì)量、豐富信息量、增強對比度、加強圖像判讀和識別效果(圖3C)。(3)確定圓心位置:在該數(shù)據(jù)集中,所有超聲圖像的設(shè)置均保持一致,因此所有圖像的圓心位置均相同(圖3D、3E),以圖形左上角頂點為坐標原點,圓心坐標均為(411,381)。
1.2.2 第一類特征提取與初始分類 在第一類特征提取前,需要得到超聲圖像的灰度共生矩陣,大小設(shè)為L×L,即灰度共生矩陣的灰度級別為L。由于超聲圖像的生成角度、灰度級都會對灰度共生矩陣的構(gòu)造產(chǎn)生影響,因此需要先確定灰度共生矩陣的生成角度及灰度級。(1)生成角度選?。簽榱吮苊庠跇?gòu)造灰度共生矩陣的過程中丟失紋理特征信息,選取0°、45°、90°、135° 4 個角度上紋理特征參數(shù)的平均值作為第一類特征提取所需的特征參數(shù)。(2)灰度級選?。簽榱吮3窒袼鼗叶燃壊蛔?,同時減少運算量,將灰度歸一化至8 個量級。(3)特征參數(shù)選?。和ㄟ^得到的灰度共生矩陣,提取圖像的紋理特征參數(shù)作為第一類特征參數(shù)。選取角二階矩(angular second moment,ASM)和逆方差(inverse different moment,IDM)描述脊骨超聲圖像的紋理特征,表達式分別為
其中,P(i,j)是生成的大小為L×L的灰度共生矩陣中的元素,i、j分別表示灰度共生矩陣中第i行、第j列,L表示灰度共生矩陣的灰度級別。將ASM 和IDM 作為初始分類模型搭建2 個特征參數(shù)。
1.2.3 第二類特征提取與二次分類 在第二類特征提取前,首先獲得閾值T以區(qū)分前景和背景;然后做椎弓根螺釘釘?shù)赖耐膱A,該同心圓的半徑通過損失函數(shù)計算獲得;最后將同心圓外部圖像的一維統(tǒng)計特征作為特征參數(shù)進行二次分類。(1)閾值T的選?。阂詧D3D、3E 為例介紹閾值T的計算過程,圖像中前景部分占圖像的像素比例較低,故對圖像求解獲得灰度直方圖(圖4A、4B)。Pi(i∈(0, 255))表示灰度值為i的像素數(shù)量,若i=255 則表示圖像中灰度值在0~255 之間的所有像素數(shù)量,也等于圖像中的像素總數(shù),即
其中n表示第n個樣本。
(2)半徑R的選取:對于數(shù)據(jù)集中所有的超聲圖像,統(tǒng)計在以坐標(411,381)為圓心、半徑為R的同心圓內(nèi)灰度值超過閾值T的像素點數(shù)量,以及整張超聲圖像中灰度值超過閾值T的像素點數(shù)量,計算兩者的比值,記作Ra(ratio),其中正樣本的比值為Ra+,負樣本的比值為Ra-,表達式分別為
其中,i、j分別表示單張圖像中第i行、第j列,x(i,j)表示第i行、第j列個像素的灰度值,n表示第n個樣本。取90%作為判定界限,Ra≥90%判定為釘?shù)劳暾琑a<90%則判定為釘?shù)榔茡p,記作I(n),表達式為
在該數(shù)據(jù)集的正樣本中有x1個樣本滿足Ra+≥90%,負樣本中有x2個樣本滿足Ra-≥90%,定義損失函數(shù)L及正樣本損失函數(shù)L+、負樣本損失函數(shù)L-,并調(diào)整半徑R使L+-L-達到最大值,表達式分別為
當L達到最大值時表明此時的半徑對該數(shù)據(jù)集釘?shù)劳暾耘袛嗟臏蚀_度達到最佳。
(3)一維統(tǒng)計特征:為了使所有超聲圖像的灰度級為同一量級、消除指標之間的量綱影響,首先對超聲圖像進行歸一化處理,再提取同心圓外圖像的一維統(tǒng)計特征作為第二類特征參數(shù)。選取熵、方差、對比度、能量、平均絕對偏差5 個參數(shù)作為一維統(tǒng)計特征,進行二次分類模型的搭建。
1.3 統(tǒng)計學處理 采用準確度、特異度、靈敏度、F1 值、假正率、假負率對分類結(jié)果進行評估:準確度=(TP+TN)/(TP+TN+FP+FN),特異度=TN/(FP+TN),靈敏度(召回率)=TP/(TP+FN),F(xiàn)1 值=2×精確率×召回率/(精確率+召回率),假正率=FP/(FP+TN),假負率=FN/(TP+FN),其中精確率=TP/(TP+FP),TP 表示真陽性樣本數(shù),TN 表示真陰性樣本數(shù),F(xiàn)P表示假陽性樣本數(shù),F(xiàn)N 表示假陰性樣本數(shù)。
第一類特征提取后初始分類結(jié)果顯示,真陽性樣本數(shù)為326,真陰性樣本數(shù)為272,假陽性樣本數(shù)為128,假陰性樣本數(shù)為74。五折交叉驗證結(jié)果(表1)顯示,初始分類的準確度為74.75%,特異度為68.00%,靈敏度為81.50%,F(xiàn)1 值為76.35%,假正率為32.00%,假負率為18.50%。在二次分類前,計算得到閾值T為37。在不同半徑R下x1、x2、L、L+、L-如圖5 所示,得到最佳半徑R為108 像素。第二類特征提取后二次分類結(jié)果顯示,真陽性樣本數(shù)為390,真陰性樣本數(shù)為364,假陽性樣本數(shù)為36,假陰性樣本數(shù)為10。五折交叉驗證結(jié)果(表1)顯示,二次分類的準確度為94.25%,特異度為91.00%,靈敏度為97.50%,F(xiàn)1值為94.43%,假正率為9.00%,假負率為2.50%。
表1 第一類特征提取后初始分類及第二類特征提取后二次分類的五折交叉驗證結(jié)果Tab 1 Five-fold cross-validation results of initial classification after type 1 feature extraction and secondary classification after type 2 feature extraction
超聲檢查可實時評估椎弓根螺釘置入手術(shù)過程中釘?shù)赖耐暾?,能夠及時發(fā)現(xiàn)破損釘?shù)?,降低手術(shù)風險,具有較好的應用前景。與CT 等醫(yī)學影像學技術(shù)相比,超聲檢查操作簡單、實時性更高、無電離輻射。本研究提出了一種基于超聲圖像智能分析的椎弓根螺釘釘?shù)劳暾栽u估方法,該方法首先將紋理特征作為第一類特征對超聲圖像特征進行初始分類,篩選出椎弓根螺釘釘?shù)榔茡p嚴重的超聲圖像,再選取熵、方差、對比度、能量、平均絕對偏差5 個參數(shù)作為第二類特征,對超聲圖像進行二次分類。
實驗結(jié)果表明,在采集的800 個樣本中,二次分類的總體準確度為94.25%,特異度為91.00%,靈敏度為97.50%,F(xiàn)1 值為94.43%,假正率為9.00%,假負率為2.50%。二次分類在初始分類的基礎(chǔ)上,分類準確度提高了19.5%,具有較好的檢測性能。分類準確度提高的原因有以下幾點:(1)初始分類僅通過紋理特征篩選出椎弓根螺釘釘?shù)榔茡p嚴重的超聲圖像,但是破損的樣本包括破損嚴重的樣本和輕微破損的樣本,僅通過紋理特征分類的準確度較低;(2)二次分類是在初始分類的基礎(chǔ)上進行的,并且將熵、方差、對比度、能量、平均絕對偏差5 個參數(shù)作為第二類特征進行分類,由于在圖像中提取了更多的特征,因此有更高的分類準確度。
在第二類特征提取與二次分類前得到半徑R為108 像素的同心圓,通過計算同心圓內(nèi)外灰度值超過閾值T的像素點數(shù)量的比例是否超過判定界限90%的方法來判斷椎弓根螺釘釘?shù)朗欠衿茡p是不可行的,因為該方法是在已知椎弓根螺釘釘?shù)朗欠衿茡p的情況下得到同心圓的半徑。同時為了便于計算機處理與分類,本研究采用的超聲圖像均來自釘?shù)赖撞?。同時,釘?shù)劳膱A的半徑R取108 像素并非一個標準參數(shù),而是通過設(shè)計的損失函數(shù)得到的最佳值。在理想情況下,該同心圓的半徑與釘?shù)腊霃奖3忠恢?。但是在實際情況下,判定同心圓的半徑與超聲探頭是否達到洞底、聲波在松質(zhì)骨內(nèi)傳播的距離、超聲設(shè)備發(fā)射的聲波頻率和能量等有關(guān),且由于不同患者的骨密度不同也會導致釘?shù)赖木唧w形態(tài)存在差異,從而影響了分類的準確度。因此,可以通過對大量超聲圖像進行綜合處理建立一個半徑的綜合極限值,提高分類準確度。
在實際情況下,僅通過1 張圖像無法判斷椎弓根螺釘釘?shù)赖撞渴欠衿茡p,需要對同一例患者的釘?shù)肋M行多次不同方向的超聲掃描,再對多張超聲圖像進行多次判斷才能得到一個準確的結(jié)果,這點也需要在實際操作中注意。
本研究有以下局限性:(1)本研究采用的數(shù)據(jù)集包含800 個樣本,樣本量基本滿足機器學習的要求,但是后續(xù)仍需擴大病例數(shù)量及樣本數(shù)量以提高模型的泛化能力,同時本研究提取的圖像特征只有7 個,后續(xù)實驗可以通過增加數(shù)據(jù)量、利用影像組學提取特征等進一步對特征進行降維處理。(2)椎弓根螺釘釘?shù)赖钠茡p情況在不同個體中表現(xiàn)各不相同,未來工作中可以利用深度學習對破損等級進行多級分類。
超聲檢查在椎弓根螺釘置入手術(shù)中給醫(yī)師帶來了很大幫助,計算機自動輔助判斷釘?shù)赖耐暾砸卜奖懔顺暭夹g(shù)的臨床應用,無須依賴專業(yè)醫(yī)師對圖像進行判斷和解釋,給超聲圖像判讀經(jīng)驗較為欠缺的醫(yī)師帶來了極大的便利。