黃友清,楊輝虎,魏達友,羅文高,張翠萍
茂名市人民醫(yī)院 (廣東茂名 525100)
隨著計算機和醫(yī)學技術(shù)的發(fā)展,大部分醫(yī)院的超聲診斷儀均配備了圖文報告系統(tǒng),超聲醫(yī)師可使用計算機編寫超聲報告。但近年來各醫(yī)院超聲檢查申請量不斷增加,造成超聲醫(yī)師的工作量逐漸增多[1]。編寫超聲報告在超聲醫(yī)師所有工作耗時中占比較大,部分醫(yī)院甚至為其配備了專門的報告助理,但使用超聲報告助理會增加醫(yī)院人力成本;此外,受專業(yè)知識、教育背景及超聲系統(tǒng)操作熟練程度等因素影響,超聲報告助理并不能快速、準確地輸出高質(zhì)量超聲報告,若錄入速度跟不上檢查進度,還需超聲醫(yī)師進行二次檢查,影響工作效率[2]。超聲醫(yī)師(無助理)通常的工作流程如下:在檢查過程中采集具有病變信息及測量數(shù)據(jù)的圖像,完成檢查后,根據(jù)記憶及采集到的圖像回顧性生成報告。該超聲報告編寫方式不僅浪費時間,還可能因人為因素造成數(shù)據(jù)遺漏或輸入錯誤。基于此,石磊等[3]提出了一種基于光學字符識別技術(shù)的超聲報告數(shù)值自動讀取方法,通過連通區(qū)域檢測、數(shù)值區(qū)域提取、數(shù)值行劃分、文字識別、超聲報告自動生成等環(huán)節(jié),最終實現(xiàn)了超聲報告數(shù)值自動讀取。該方法可取代醫(yī)師手動輸入超聲報告數(shù)值,避免人為錄入數(shù)據(jù)可能造成的錯誤,提高數(shù)據(jù)準確率及超聲醫(yī)師工作效率。本研究在上述研究的基礎(chǔ)上,使用具有觸摸屏的超聲診斷儀,在檢查的同時添加超聲診斷注釋,獲取超聲診斷及測量兩方面的信息,實現(xiàn)了計算機自動化生成超聲報告。
使用Philips iU22 彩色多普勒超聲診斷儀,該設(shè)備的每個預設(shè)條件含2 張注釋頁,即完整診斷注釋(圖1)和組合診斷注釋(圖2),注釋項內(nèi)容以拼音首字母表示,共56 個項目。在完整診斷注釋頁中設(shè)置常用的完整診斷,并可組合數(shù)字1、2、3,用于表示輕、中、重不同的程度;在組合診斷注釋頁中設(shè)置部位、病變、類型及位置,用于組合為完整的診斷注釋項。通過以上兩種方式生成常見的超聲診斷注釋。
圖1 觸摸屏上的完整診斷注釋(局部)
圖2 觸摸屏上的組合診斷注釋(局部)
超聲工作站使用聯(lián)想啟天M430-B451 臺式計算機,操作系統(tǒng)為Windows 10,光學字符識別工具為Tesseract 4.1,編程工具為Python 3.6,使用SQLite 數(shù)據(jù)庫儲存超聲報告模板。超聲工作站使用南方醫(yī)科大學研制的超聲圖文報告系統(tǒng)。采集卡為MZ0380 PCI,輸入圖像的分辨率為1 680×1 050 像素;該報告系統(tǒng)可截取1 024×800 像素的圖像,并儲存于超聲工作站中。
超聲報告模板數(shù)據(jù)庫主要包含注釋項、超聲描述、超聲提示、檢查部位、操作方式等字段。注釋項為數(shù)據(jù)庫中的關(guān)鍵字段,用于檢索相應的超聲描述和超聲提示等內(nèi)容。超聲描述和超聲提示是超聲報告的2 個重要組成部分,其中的大部分內(nèi)容是固定不變的,對于可變部分內(nèi)容,需于相應位置標記錨點,在生成報告時,替換為相應的位置、測量數(shù)據(jù)等內(nèi)容。檢查部位用于加載默認模塊,生成正常報告。操作方式是根據(jù)不同的需要,在正常報告中進行覆蓋、替換、插入等。
通過Python 程序逐張讀取當前檢查采集到的所有圖像,截取其中含有注釋字符及測量數(shù)據(jù)的部分圖像(注釋字符及測量數(shù)據(jù)在圖像中的位置是固定的),將截取的圖像進行簡單的二值化處理,即可使用Tesseract 軟件進行識別,再將得到的結(jié)果處理為相應的報告處理指令行。
在超聲檢查中,若遇到異常圖像,可在其中加入注釋;若需具體信息,可進行測量,測量結(jié)果顯示后,可采集圖像。檢查結(jié)束后,啟動編制的Python 程序,讀取圖像中的字符信息,根據(jù)識別出的診斷性文字在數(shù)據(jù)庫中檢索相應的報告模板,若包含測量數(shù)據(jù),則將測量數(shù)據(jù)插入報告模板的相應位置,生成報告處理指令行,然后根據(jù)各項報告處理指令行自動化生成報告,通過接口輸出至超聲圖文報告系統(tǒng)中。采集的圖像及處理流程示例見圖3~4。
圖3 采集的圖像
圖4 處理流程示例
選取我院超聲診斷科2022 年1 月17—21 日(5 個工作日)完成的361 例超聲檢查評價本研究超聲報告自動生成方法的應用效果。其中,心臟檢查198 例(心臟超聲、左心功能測定各99 例),腹部超聲檢查72 例,血管超聲檢查50 例,其他超聲檢查41 例。
同一名超聲醫(yī)師在完成檢查后分別以手工處理(超聲醫(yī)師通過工作站中已設(shè)定常用報告模板、輸入法中已定義常用語句及詞組編寫報告)和自動化處理2 種方法生成超聲報告,并比較兩種報告處理方法的生成報告時長及點擊次數(shù)。此外,隨機選取其中的36 份超聲檢查結(jié)果,以采集圖像上的字符為參照,分析自動化處理方法的字符識別正確率。
采用SPSS 18.0 統(tǒng)計軟件進行數(shù)據(jù)分析。計量資料以±s表示,采用t檢驗。P<0.05 為差異有統(tǒng)計學意義。
2.4.1 兩種報告處理方法的生成報告時長及點擊次數(shù)比較
自動化處理方法的報告時長短于手工處理方法,點擊次數(shù)少于手工處理方法,差異均有統(tǒng)計學意義(P<0.05),見表1。
表1 兩種報告處理方法的生成報告時長及點擊次數(shù)比較(±s,361 例)
表1 兩種報告處理方法的生成報告時長及點擊次數(shù)比較(±s,361 例)
報告處理方法 報告時長(s) 點擊次數(shù)(次)手工 49.40±45.90 57.63±66.17自動化 24.25±37.98 21.23±45.30 t 14.47 15.64 P<0.01 <0.01
2.4.2 字符識別正確率
36 例超聲檢查圖像中,使用光學字符識別技術(shù)識別出感興趣區(qū)字符3 875 個,正確3 875 個,錯誤0 個,識別正確率為100%。
人工智能是在計算機科學、控制論、信息論、神經(jīng)心理學、哲學、語言學等多學科基礎(chǔ)上發(fā)展而來的一門綜合性較強的交叉學科,涉及新思想、新觀念、新理論、新技術(shù)[4-7]。近年來,人工智能發(fā)展迅速,已在醫(yī)學領(lǐng)域得到了廣泛應用,如輔助讀片系統(tǒng)、醫(yī)學專家系統(tǒng)、計算機輔助藥物設(shè)計及醫(yī)學機器人等。光學字符識別是一種電子字符識別技術(shù),為人工智能在計算機視覺領(lǐng)域的重要應用之一。該技術(shù)利用光學和計算機技術(shù)通過檢測字符每個像素的暗、亮模式確定其形狀,然后用字符識別方法將形狀翻譯為計算機文字[8]。Tesseract 是一款由惠普實驗室開發(fā),谷歌公司維護的開源光學字符識別引擎,其是少有的支持漢字識別的開源庫[9]。Tesseract 從4.0 版本開始采用了基于Long Short Term Memory(LSTM 網(wǎng)絡)的識別引擎,用戶可通過不斷訓練自己的數(shù)據(jù)庫,使圖像轉(zhuǎn)換為文本的能力不斷增強。
超聲報告用于描述超聲檢查的結(jié)果,可為醫(yī)師診斷及治療疾病提供重要依據(jù)。目前,超聲報告從手工編寫階段步入了計算機編寫階段,編寫逐漸規(guī)范、快捷,但由于超聲報告較復雜,常規(guī)計算機編寫報告方式仍需耗費超聲醫(yī)師大量時間和精力,且易出現(xiàn)錯誤。因此,自動生成超聲報告的技術(shù)受到了廣泛關(guān)注。
現(xiàn)階段,語音識別及光學字符識別是超聲報告自動化生成中常采用的2 種技術(shù)。語音識別技術(shù)發(fā)展較早,在實際應用時暴露出以下缺點:(1)識別準確率暫未達到95% 的預期效果;(2)環(huán)境噪聲對識別準確率影響較大[10-11];(3)需再次單獨使用語音重復測量數(shù)據(jù),費時費力;(4)醫(yī)師的語音內(nèi)容被患者聽到后可能會使其產(chǎn)生誤解。而光學字符識別技術(shù)發(fā)展亦較為成熟,若采集到的圖像分辨率較高,字符為規(guī)則字體,則可高效、準確識別。若采集到的圖像不清晰,會影響識別正確率,需對圖像進行處理,以提高正確率。此外,還可建立字符識別庫,并對識別過程進行訓練,隨著訓練樣本量的增加,正確率也會逐漸提高。與語音識別技術(shù)比較,光學字符識別技術(shù)具有以下優(yōu)點:(1)準確率較高,一般可接近100%;(2)使用簡單、便捷,只需安裝Tesseract 即可;(3)不受超聲檢查環(huán)境影響;(4)對于測量數(shù)據(jù)的識別,可以直接得到結(jié)果;(5)不會對患者造成影響。
本研究應用效果顯示,自動化處理方法的報告時長短于手工處理方法,點擊次數(shù)少于手工處理方法,且識別正確率為100%。與手工處理方法比較,以5 個工作日為計算單位,自動化處理方法節(jié)省了50.9%的超聲報告編寫時間(9 079 s,即2.52 h,平均每天可節(jié)省0.50 h),減少了63.2%的報告編寫工作量。
本研究改進的基于光學字符識別技術(shù)的超聲報告自動化生成方法仍存在以下問題:(1)不同廠家、型號超聲診斷儀測量數(shù)據(jù)及注釋的顯示方式各不相同,不同醫(yī)院采用的超聲報告系統(tǒng)各異,本方法需具備一定計算機基礎(chǔ)的醫(yī)師或?qū)I(yè)的計算機工作人員對超聲診斷儀及超聲圖像報告系統(tǒng)進行適配后才可使用,推廣受限,但其適配過程并不復雜;(2)部分超聲診斷儀無觸摸屏,或有觸摸屏但不便設(shè)置觸摸屏上的注釋,可通過平板電腦解決此問題,該方法在本項目后期已得到實現(xiàn),且效果很好;(3)部分報告無法完全自動化生成,需輔以手工編寫方法完成,造成該問題的主要原因為觸摸屏設(shè)置及報告模板不完善,可予以改進。
綜上所述,使用光學字符識別技術(shù)獲取超聲圖像中的字符信息,可完成超聲報告自動化編寫工作,減少超聲醫(yī)師工作量,提高工作效率。若計算機專業(yè)相關(guān)人員共同參與超聲報告自動化生成技術(shù)的改進,該項技術(shù)可更加完善,或?qū)⑷〈晥蟾嬷淼南嚓P(guān)工作。