王可欣, 邱建星
人工智能(artificial intelligence,AI)工具已經(jīng)用于醫(yī)學(xué)影像科臨床工作中,在圖像處理、影像診斷、流程優(yōu)化等方法取得了一定的成果。AI涉及多種技術(shù),包括傳統(tǒng)機(jī)器學(xué)習(xí)(machine learning)和深度學(xué)習(xí)(deep learning)算法兩大類; 從應(yīng)用的角度,可分為圖像、表格類數(shù)據(jù)、自然語言和語音處理等; 在圖像處理方面以影像組學(xué)和卷積神經(jīng)網(wǎng)絡(luò)是現(xiàn)在的熱點(diǎn)技術(shù)。AI工具的應(yīng)用場景多樣,除了用于輔助診斷,還可以用于流程優(yōu)化。本文重點(diǎn)對AI的非診斷應(yīng)用進(jìn)行綜述。
為了便于表述,本文姑且將應(yīng)用于醫(yī)學(xué)影像科的AI工具分為“診斷類(image interpretive)AI”與“非診斷類(non-interpretive)AI”[1]。從輔助影像診斷醫(yī)生工作的角度將AI工具按功能分類,診斷類AI主要是在圖像處理和報告書寫過程中幫助醫(yī)生完成診斷任務(wù),而非診斷類AI主要是在工作流中幫助流程優(yōu)化和完善服務(wù)。這種分類概念的外延和內(nèi)涵并不完全準(zhǔn)確,將來隨著技術(shù)的進(jìn)展和學(xué)科的演化可能會有更準(zhǔn)確的定義和分類。
美國放射醫(yī)師學(xué)院數(shù)據(jù)科學(xué)學(xué)院(American College of Radiology, Data Science Institute)在發(fā)布AI用例(use case)時,將非診斷類AI按應(yīng)用領(lǐng)域分為:事務(wù)管理、患者服務(wù)、公共衛(wèi)生、讀片環(huán)境和技術(shù)質(zhì)控等方面。另有研究者將非診斷類AI分為:圖像產(chǎn)生和質(zhì)量控制、影像科流程優(yōu)化、事務(wù)管理、研究應(yīng)用和影像AI教學(xué)等[2]。雖然分類不盡相同,但多數(shù)都認(rèn)為AI在流程優(yōu)化工具在臨床應(yīng)用中,目前已對影像科工作產(chǎn)生了直接幫助[3]。本文結(jié)合自身經(jīng)驗,綜述部分非診斷類AI的研究和應(yīng)用進(jìn)展,因認(rèn)識水平不足,難免有錯漏之處,歡迎同行專家批評指正。
AI可以用于提高圖像質(zhì)量以控制射線輻射風(fēng)險和對比劑風(fēng)險。隨著CT的廣泛應(yīng)用,醫(yī)學(xué)影像檢查的射線輻射問題日益引起關(guān)注。MR檢查雖然沒有射線輻射風(fēng)險,但含釓對比劑導(dǎo)致的不良反應(yīng)也成為醫(yī)療安全關(guān)注的問題之一。因此,低劑量CT(low-dose CT)、低對比劑增強(qiáng)MR成為更安全的影像檢查方法,但是因圖像噪聲較大、對比度欠佳,有可能影響臨床診斷而應(yīng)用受限。AI可用于降低噪聲、減少偽影,從而提高圖像質(zhì)量、縮短掃描時間、減少對比劑用量,取得保障患者安全和提高工作效率的成效[4]。
使用更好的圖像重建方法有助于提高圖像質(zhì)量,通過各種算法的實施目標(biāo)主要提高信噪比和減少偽影。AI技術(shù)中用于圖像重建的主要是卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN),近年來對抗生成網(wǎng)絡(luò)(generative adversarial network,GAN)顯示圖像降噪效果似乎更佳[5]。AI模型輸入的圖像來源于X線、CT、MR、超聲、PET等,既可以是探測器采集的原始數(shù)據(jù),也可以是處理后的圖像數(shù)據(jù)。AI模型學(xué)習(xí)的對象既可以是圖像中的解剖及病灶結(jié)構(gòu),也可以是噪聲。AI模型輸出的結(jié)果通常是優(yōu)化后的圖像。輸出圖像與輸入圖像相比,通常有更高的信噪比,偽影更少,且保持圖像中相關(guān)結(jié)構(gòu)的對比度。這類工作的評價通常是以醫(yī)生對圖像的主觀評估為主,也可結(jié)合一些客觀定量評價指標(biāo)[6]。通過降低圖像噪聲,可以轉(zhuǎn)換為患者安全、采集時間、圖像質(zhì)量等方面的獲益。利用AI技術(shù),可從低劑量CT數(shù)據(jù)產(chǎn)生高質(zhì)量圖像,影像科醫(yī)生的主觀評價認(rèn)為其效果優(yōu)于或等同于常規(guī)CT掃描[7]。通過AI模型,可利用注射極低劑量對比劑(常規(guī)劑量的10%)生成MR增強(qiáng)掃描,圖像對比度與常規(guī)增強(qiáng)MR圖像類似[8]。
AI應(yīng)用于醫(yī)學(xué)影像科的質(zhì)控要求對合適的患者以恰當(dāng)?shù)姆椒ㄈ〉煤细竦膱D像,并即時準(zhǔn)確地生成影像診斷報告。
AI可以用于判斷圖像質(zhì)量以輔助影像技術(shù)的質(zhì)控工作。影像檢查的質(zhì)控主要關(guān)注圖像質(zhì)量是否合格。技師通常在采集圖像之后通過觀察圖像中組織結(jié)構(gòu)的顯示來評價圖像是否合格。通常圖像質(zhì)控的要點(diǎn)有:掃描范圍、曝光條件或序列參數(shù)、動態(tài)增強(qiáng)掃描期相、圖像偽影等。技師判斷圖像不合格時,可采取適當(dāng)措施予以補(bǔ)救,必要時再次采集圖像。主觀評價要求承擔(dān)質(zhì)控任務(wù)者具備一定的經(jīng)驗,且質(zhì)控在檢查完成后,有一定的滯后性。AI模型有望用于判斷圖像質(zhì)量,且與圖像采集直接整合,在檢查當(dāng)時發(fā)現(xiàn)問題即提醒技師立刻處理,對全部檢查均可有效率地完成質(zhì)控任務(wù)[9]。
使用AI算法可以模擬技術(shù)專家評估圖像質(zhì)量。例如心臟超聲檢查中要通過標(biāo)準(zhǔn)的解剖定位以評價特定的心臟功能異常,人工定位不易保持精準(zhǔn),通過AI技術(shù)可以評估解剖定位是否達(dá)到質(zhì)量要求,以保證超聲測量值是可靠的[10]。胸片是影像科最常見的檢查工作,使用AI技術(shù)可以在投照完成之后立即自動判斷是否有肋膈角包括不全、患者體位是否有旋轉(zhuǎn)、患者吸氣是否恰當(dāng)?shù)萚11]。新生兒MR圖像常因存在運(yùn)動偽影或信噪比低而影響診斷,使用AI技術(shù)可以即時發(fā)現(xiàn)這些情況[12]。總之,通過對AI技術(shù)對圖像質(zhì)量的即時評估、即時反饋可以監(jiān)視圖像形成過程,以達(dá)到質(zhì)量要求,保障診斷需要。
AI可以用于縮短掃描時間和后處理時間以直接提高影像工作效率。目前影像科的檢查項目中,MR掃描的人次平均時間較長,檢查效率不高。既往通過k空間不全采樣(incomplete k-space sampling)、并行成像(parallel imaging)、壓縮感知(compressed sensing)等技術(shù)提高掃描速度,但仍有一定的局限性。在上述技術(shù)的基礎(chǔ)上,將AI用于MR圖像處理可以保證在縮短掃描時間時保持較高的圖像質(zhì)量,提高M(jìn)R工作效率[13]。AI工具可以用于提取影像中的定量信息,如使用AI技術(shù)可以從DCE MRI動態(tài)圖像中自動提取出Ktrans相關(guān)參數(shù)[14],從ASL序列中提取出組織灌注參數(shù)[15]等,這種自動的處理可以減少繁瑣的圖像后處理工作,提高后處理的工作效率。
AI可以用于優(yōu)化工作流程以提高工作效率。AI在優(yōu)化效率方面的應(yīng)用日益受到影像科管理者的關(guān)注。在影像科日常工作中,將患者、設(shè)備、工作人員的負(fù)荷精準(zhǔn)匹配,是非常復(fù)雜的任務(wù)。以MR檢查為例,由于設(shè)備功能各具特色,在不同掃描設(shè)備上完成相同檢查所需的時間不同,在相同設(shè)備上完成不同檢查所需的時間也不一致;有些檢查可以在全部設(shè)備上進(jìn)行,有些檢查僅能在某些設(shè)備上進(jìn)行。有研究通過收集信息系統(tǒng)中人員信息和設(shè)備信息,以機(jī)器學(xué)習(xí)或深度學(xué)習(xí)的方法分析影響患者預(yù)約時間、候檢時間的因素,對可能的爽約(no show)做出預(yù)測,就可以調(diào)整預(yù)約策略,以提高患者到檢率,提高設(shè)備利用率。也有研究使用AI優(yōu)化預(yù)約隊列,縮短了患者等候時間,增加了單位時間內(nèi)的MR檢查數(shù)量[16]?;贏I對工作人員排班和設(shè)備開機(jī)時間進(jìn)行管理,在不延長工作時間的情況下,提高檢查量,對工作人員和患者是雙贏的[17]。
AI工具可以用于提高報告效率和滿意度。醫(yī)學(xué)影像工作的價值一方面體現(xiàn)在提供有意義的診斷信息用于診療活動,另一方面體現(xiàn)在患者和臨床醫(yī)生的滿意度。將AI工具與信息化工具整合,可以為臨床醫(yī)生和患者提供更加快速、準(zhǔn)確、直觀的結(jié)構(gòu)化報告,提升滿意度。通過優(yōu)化IT系統(tǒng)可以將AI生成的結(jié)果直接返回到結(jié)構(gòu)化報告,使影像診斷醫(yī)生可以方便地利用AI結(jié)果[18]。將AI產(chǎn)生的病灶標(biāo)注區(qū)域自動地發(fā)送到多媒體報告(multimedia radiology report,MERR)中[19],臨床醫(yī)生和患者就可以在移動端直接查看文本報告和病灶的關(guān)鍵圖像,從而更直觀地了影像檢查的結(jié)果?;谝?guī)則和算法可以自動發(fā)送危急值警告、產(chǎn)生隨訪建議和推薦意見,并可以自動生成對報告的解釋,使得報告信息充分發(fā)揮作用,實現(xiàn)影像工作的價值[20]。
AI工具可以用于輔助醫(yī)學(xué)影像相關(guān)科研工作。NLP工具對科研數(shù)據(jù)的提取有幫助。從臨床材料中提取科研記錄時,常需要在醫(yī)學(xué)文檔中找到數(shù)據(jù)。既往日常工作中的臨床記錄多是自然語言文檔,需要花費(fèi)大量的時間去檢索、錄入、核查,因此大樣本的臨床研究成本很高。通過NLP自動提取文檔中的關(guān)鍵信息,有利于高效、準(zhǔn)確地整理臨床資料[21]。使用AI圖像分類模型可以對醫(yī)學(xué)影像圖像進(jìn)行初步篩選和分類,包括掃描范圍、期相;圖像中解剖結(jié)構(gòu)是否正確等,用于科研過程中圖像的整理。使用AI圖像分割模型可以對圖像中的解剖結(jié)構(gòu)和病變進(jìn)行分割,然后做出精確的定量評價,如:徑線、體積、密度/信號強(qiáng)度、增強(qiáng)曲線和功能參數(shù)等。AI模型的效率高、分析結(jié)果一致性強(qiáng),對于定量研究非常有益。
AI工具可以用于輔助醫(yī)學(xué)影像相關(guān)教學(xué)工作。AI技術(shù)既是醫(yī)學(xué)影像教學(xué)工作的內(nèi)容,也是教學(xué)的輔助工具。既往醫(yī)學(xué)教育中數(shù)學(xué)、統(tǒng)計和計算機(jī)內(nèi)容較少,臨床醫(yī)學(xué)工作者理解AI有一定困難。國外多個地區(qū)的醫(yī)學(xué)影像專業(yè)學(xué)會很關(guān)注這個問題[22-23],認(rèn)為應(yīng)對使用AI和研發(fā)AI的醫(yī)學(xué)工作者進(jìn)行繼續(xù)教育,修改大學(xué)課程和住院醫(yī)師規(guī)范化培訓(xùn)課程,增加AI相關(guān)的培訓(xùn)和考核。未來的醫(yī)學(xué)影像工作者必須有足夠的AI知識,才能適應(yīng)AI新技術(shù)帶來的工作模型轉(zhuǎn)變,并促進(jìn)學(xué)科發(fā)展。
AI工具也可以用于輔助教學(xué)[24]。通過收集醫(yī)學(xué)生和住院醫(yī)師在工作和學(xué)習(xí)過程中的資料,可對其學(xué)習(xí)表現(xiàn)進(jìn)行精細(xì)化評價,根據(jù)評價結(jié)果安排后續(xù)的學(xué)習(xí)活動,教學(xué)過程因人而異,對學(xué)生的知識體系進(jìn)行個性化評價,查缺補(bǔ)漏,有利于高效地完成學(xué)習(xí),使不同入學(xué)水平、不同轉(zhuǎn)輪計劃下的學(xué)生均達(dá)到同質(zhì)化的高水平。
非診斷類AI與診斷類AI有相似之處,因此二者面臨的問題和挑戰(zhàn)類似。與診斷類AI相關(guān),非診斷類AI研究和應(yīng)用中的問題很多,主要有:合格數(shù)據(jù)的獲取、模型的泛化和倫理問題等。另外,非診斷AI更多地關(guān)注流程數(shù)據(jù),涉及人類活動數(shù)據(jù)的收集和處理,利如對技師工作效率、醫(yī)師診斷準(zhǔn)確性、學(xué)生學(xué)習(xí)成績等數(shù)據(jù)的處理,這些情況在診斷類AI是不涉及的,因此其問題和挑戰(zhàn)也有其獨(dú)特之處。
非診斷類AI獲取數(shù)據(jù)不難,常從信息化工具提供的metadata(元數(shù)據(jù))而來[25],數(shù)據(jù)量通常也較大,但數(shù)據(jù)的結(jié)構(gòu)化困難非常大,影像工作中人類活動的本體(ontology)概念還不完善[26],使得大規(guī)模的模型共享、系統(tǒng)集成、知識獲取和重用都不易實現(xiàn)。所以當(dāng)前部分非診斷類AI的研究和應(yīng)用有強(qiáng)烈的環(huán)境依賴,未來模型泛化的可能是受限制的。
非診斷類AI關(guān)注的結(jié)局常常是人類行為表現(xiàn)、人類內(nèi)心體驗等,其評價指標(biāo)與診斷類AI不相同,其度量指標(biāo)(metrics)和參考標(biāo)準(zhǔn)(ground truth)與應(yīng)用場景密切相關(guān),不可一概而論[27]。在度量指標(biāo)和參考標(biāo)準(zhǔn)不一致的情況下,對AI工具的效能評價可能不一定反映其本質(zhì),不同AI工具的評價和比較也不容易實現(xiàn)。
非診斷類AI的倫理困難尤其實出[28]。診斷類AI通常是在在匿名化(annoymized)的數(shù)據(jù)集上用于訓(xùn)練模型,模型訓(xùn)練過程中的數(shù)據(jù)基本與特定的人無關(guān)。但非診斷類AI很多情況下以人類信息訓(xùn)練模型,即使把數(shù)據(jù)的標(biāo)識符(ID)去除,仍有可能追溯到個人。如果非診斷類AI生成的是用戶畫像(profile)或個性化推薦系統(tǒng)(recommend system),則AI應(yīng)用過程中的倫理問題更加嚴(yán)峻[29]。
總之,無論是診斷類AI還是非診斷類AI,醫(yī)學(xué)影像AI的最終目標(biāo)是提升價值,為患者提供更好的服務(wù)。非診斷類AI更多地關(guān)注患者和醫(yī)務(wù)工作者,通過流程優(yōu)化為醫(yī)療、教學(xué)、科研和管理提供輔助幫助[30]。