劉良斌 杜寶林 盧琰 王建全
摘? 要:文章以近二十年醫(yī)學(xué)圖像分割領(lǐng)域文獻(xiàn)為研究對(duì)象,基于CiteSpace軟件對(duì)該項(xiàng)技術(shù)的研究現(xiàn)狀、知識(shí)群組、研究主題及其演化路徑進(jìn)行系統(tǒng)研究;并在公開數(shù)據(jù)集上對(duì)同類醫(yī)學(xué)圖像分割方法進(jìn)行對(duì)比實(shí)驗(yàn)與分析。結(jié)果表明,醫(yī)學(xué)圖像分割技術(shù)研究核心主要表現(xiàn)在計(jì)算機(jī)科學(xué)、生物醫(yī)學(xué)與人工智能等學(xué)科,并正在從以區(qū)域生長(zhǎng)、模糊聚類技術(shù)為中心的模式向以深度學(xué)習(xí)等新興人工智能技術(shù)為中心的模式轉(zhuǎn)變,為產(chǎn)業(yè)發(fā)展戰(zhàn)略決策提供參考依據(jù)。
關(guān)鍵詞:醫(yī)學(xué)圖像分割;CiteSpace;知識(shí)群組;演化路徑;醫(yī)療健康產(chǎn)業(yè)
中圖分類號(hào):TP391? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? 文章編號(hào):2096-4706(2023)13-0105-07
Analysis of the Application and Development Trend of Image Segmentation Technology in the Medical Health Field at Home and Abroad
LIU Liangbin1, DU Baolin1,2, LU Yan1,2, WANG Jianquan3
(1.Guangdong Science & Technology Infrastructure Center, Guangzhou? 510033, China; 2.Guangdong Institute of Computing Technology Application, Guangzhou? 510033, China; 3.The First People's Hospital of Kashi Prefecture, Kashi? 844099, China)
Abstract: In this paper, the literature in the field of medical image segmentation in the past 20 years is taken as the research object. Based on CiteSpace software, the research status, knowledge group, research topic and evolution path of this technology are systematically studied. Comparative experiment and analysis of similar medical image segmentation methods are carried out on open dataset. The results indicate that the research core of medical image segmentation technology is mainly manifested in disciplines such as computer science, biomedicine, and artificial intelligence, and is transitioning from a mode centered on regional growth and fuzzy clustering technology to a mode centered on emerging artificial intelligence technologies such as deep learning, providing reference basis for industrial development strategic decision-making.
Keywords: medical image segmentation; CiteSpace; knowledge group; evolution path; medical health industry
0? 引? 言
隨著國(guó)際創(chuàng)新環(huán)境不斷優(yōu)化以及科研投入不斷加大,人工智能(Artificial Intelligence, AI)技術(shù)正越來(lái)越多地集成到醫(yī)療健康服務(wù)領(lǐng)域。人工智能技術(shù)與醫(yī)療健康產(chǎn)業(yè)的創(chuàng)新融合模式能夠滿足行業(yè)的價(jià)值鏈多方面需求點(diǎn),使得精確化醫(yī)療衛(wèi)生服務(wù)更加豐富[1]。其中,智能圖像分割作為圖像處理領(lǐng)域的一個(gè)重要分支,能夠通過(guò)人工智能技術(shù)在醫(yī)學(xué)圖像中高質(zhì)量劃定病變器官或組織的邊界,提供相關(guān)病變組織的形狀以及體積等關(guān)鍵定量信息。為此,眾多基于圖像分析的醫(yī)療臨床應(yīng)用產(chǎn)業(yè)的發(fā)展受益于醫(yī)學(xué)圖像解剖結(jié)構(gòu)領(lǐng)域智能語(yǔ)義分割技術(shù)的迭代更新。綜上,智能語(yǔ)義分割技術(shù)已然成為推動(dòng)醫(yī)療健康產(chǎn)業(yè)發(fā)展的重要力量,而創(chuàng)新是智能語(yǔ)義分割技術(shù)發(fā)展的主要驅(qū)動(dòng)力。因此,探究醫(yī)學(xué)圖像分割等人工智能技術(shù)在醫(yī)療健康領(lǐng)域應(yīng)用的研究現(xiàn)狀、創(chuàng)新模式及前沿?zé)狳c(diǎn),有助于規(guī)劃我國(guó)“人工智能+醫(yī)療健康”領(lǐng)域的科技計(jì)劃,進(jìn)而為政策制定提供情報(bào)依據(jù)。
在“人工智能+醫(yī)療健康”領(lǐng)域的研究中,學(xué)術(shù)界與產(chǎn)業(yè)界主要通過(guò)對(duì)研究文獻(xiàn)數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,以進(jìn)一步探究該領(lǐng)域研究的發(fā)展現(xiàn)狀、創(chuàng)新路徑及前沿?zé)狳c(diǎn),如,張俐等[2]通過(guò)對(duì)專利信息以及研究文獻(xiàn)的詞匯計(jì)量、引用關(guān)系以及標(biāo)引統(tǒng)計(jì)進(jìn)行數(shù)據(jù)挖掘分析,進(jìn)而對(duì)全球“區(qū)塊鏈+醫(yī)療”領(lǐng)域的研究現(xiàn)狀以及發(fā)展態(tài)勢(shì)進(jìn)行研究,揭示了該領(lǐng)域的研究前沿與研究熱點(diǎn)。付姣慧等[3]從文獻(xiàn)計(jì)量學(xué)的角度探索了近十年深度學(xué)習(xí)應(yīng)用于醫(yī)學(xué)影像領(lǐng)域的科研熱點(diǎn),統(tǒng)計(jì)分析了該技術(shù)領(lǐng)域的發(fā)展特點(diǎn)與未來(lái)趨勢(shì)。陳欣然等[4]通過(guò)整體與分領(lǐng)域?qū)用婕夹g(shù),系統(tǒng)分析了人工智能技術(shù)在醫(yī)療衛(wèi)生領(lǐng)域的應(yīng)用發(fā)展態(tài)勢(shì),研究結(jié)果為行業(yè)決策者調(diào)整與規(guī)劃醫(yī)療衛(wèi)生健康服務(wù)科技發(fā)展戰(zhàn)略及政策提供了情報(bào)參考,有利于提高資源配置效率。
基于此,為了探索醫(yī)學(xué)圖像分割領(lǐng)域的研究現(xiàn)狀與發(fā)展態(tài)勢(shì),本研究以CNKI中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)中1997至2022年間862篇以及Web of Science數(shù)據(jù)庫(kù)中3 563篇醫(yī)學(xué)圖像分割研究文獻(xiàn)為研究對(duì)象,基于CiteSpace軟件采用文獻(xiàn)關(guān)鍵詞聚類網(wǎng)絡(luò)圖譜分析方法對(duì)醫(yī)學(xué)圖像分割技術(shù)的研究現(xiàn)狀與知識(shí)群組進(jìn)行研究,并且通過(guò)將文獻(xiàn)計(jì)量與系統(tǒng)綜述相結(jié)合的方式分析其研究熱點(diǎn)主題與演化路徑。最后,在公開數(shù)據(jù)集上對(duì)同類醫(yī)學(xué)圖像分割方法進(jìn)行定量的性能對(duì)比實(shí)驗(yàn)與分析,為我國(guó)智能醫(yī)療健康產(chǎn)業(yè)發(fā)展提供參考。
1? 數(shù)據(jù)來(lái)源及研究方法
1.1? 數(shù)據(jù)來(lái)源
以醫(yī)學(xué)圖像分割相關(guān)文獻(xiàn)為研究對(duì)象,其文獻(xiàn)數(shù)據(jù)來(lái)源分為兩個(gè)部分:中文文獻(xiàn)和外文文獻(xiàn)。其中,中文文獻(xiàn)全部選自CNKI中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù),檢索關(guān)鍵詞為“醫(yī)學(xué)圖像分割”,檢索起始時(shí)間為1997年1月1日,檢索結(jié)束時(shí)間為2022年12月31日,來(lái)源類別選擇核心期刊、EI、SCI以及博士學(xué)位論文,共檢索到文獻(xiàn)862篇。外文文獻(xiàn)全部選自Web of Science數(shù)據(jù)庫(kù)核心合集,檢索關(guān)鍵詞為“Biomedical image segmentation”“Medical image segmentation”“Convolutional neural network”,共獲得有效文獻(xiàn)3 563篇。
1.2? 研究方法
采用計(jì)量學(xué)方法對(duì)醫(yī)學(xué)圖像分割研究文獻(xiàn)進(jìn)行分析,進(jìn)而通過(guò)繪制科學(xué)知識(shí)圖譜研究相關(guān)領(lǐng)域的技術(shù)熱點(diǎn)、知識(shí)網(wǎng)絡(luò)以及發(fā)展態(tài)勢(shì);其中知識(shí)圖譜被定義為分析知識(shí)領(lǐng)域的過(guò)程、方法和工具[5],能夠發(fā)現(xiàn)大數(shù)據(jù)蘊(yùn)含的特征或意義,并以透明與全面的格式將其可視化,它是知識(shí)管理中最重要的步驟之一。因此,本研究使用信息可視化分析軟件CiteSpace對(duì)引文及被引文獻(xiàn)進(jìn)行科學(xué)計(jì)量分析和數(shù)據(jù)挖掘,探索醫(yī)療圖像分割研究領(lǐng)域的知識(shí)基礎(chǔ),進(jìn)而對(duì)醫(yī)學(xué)圖像分割研究的知識(shí)群組、演化路徑等進(jìn)行研究,為智能醫(yī)療健康產(chǎn)業(yè)發(fā)展戰(zhàn)略決策提供參考依據(jù)。
2? 研究文獻(xiàn)的特征分析
2.1? 知識(shí)群組識(shí)別
隨著科學(xué)學(xué)科縱深、交叉、快速的發(fā)展,新興的研究課題以及研究領(lǐng)域不斷涌現(xiàn),然而,一個(gè)新興學(xué)科的發(fā)展需要建立在相關(guān)學(xué)科知識(shí)積累的基礎(chǔ)上,而研究論文在一定程度上代表了某一學(xué)科前沿,其文獻(xiàn)關(guān)鍵詞反映了該文獻(xiàn)的研究重點(diǎn)及知識(shí)基礎(chǔ)。因此,本研究基于醫(yī)學(xué)圖像分割學(xué)科或其他相關(guān)學(xué)科研究文獻(xiàn),在CiteSpace軟件的支持下,通過(guò)聚集醫(yī)學(xué)圖像分割研究論文中標(biāo)注的關(guān)鍵詞,確定該領(lǐng)域的知識(shí)群組。醫(yī)學(xué)圖像分割研究文獻(xiàn)關(guān)鍵詞聚類圖譜如圖1所示,關(guān)鍵詞共現(xiàn)頻次及年份統(tǒng)計(jì)分析(前20位)如表1所示。
由如圖1所示的文獻(xiàn)關(guān)鍵詞聚類圖譜和表1可知,在醫(yī)學(xué)影像語(yǔ)義分割研究中,“圖像分割”關(guān)鍵詞出現(xiàn)的頻次最高,其次是“醫(yī)學(xué)圖像”“深度學(xué)習(xí)”“水平集”“圖像處理”以及“三維重建”等,這與關(guān)鍵詞共現(xiàn)頻次的統(tǒng)計(jì)呈現(xiàn)一致。另一方面,由如圖1所示的文獻(xiàn)關(guān)鍵詞聚類圖譜可知,研究網(wǎng)絡(luò)集中性較強(qiáng),且節(jié)點(diǎn)文獻(xiàn)之間表現(xiàn)出較強(qiáng)的關(guān)聯(lián)性;其中,部分關(guān)鍵的節(jié)點(diǎn)文獻(xiàn)關(guān)鍵詞存在于相鄰知識(shí)群組的交界處,并且在相鄰群組間起到串聯(lián)的功效,具有聯(lián)系緊密且主題交叉融合等特征,能夠?yàn)楹罄m(xù)研究提供基礎(chǔ)理論的支持以及主題方向的指引。
基于上述的描述性統(tǒng)計(jì)分析,可知近幾年該領(lǐng)域取得大量?jī)?yōu)質(zhì)的研究成果,相關(guān)研究文獻(xiàn)的關(guān)鍵詞聚類特征展示出清晰的知識(shí)群組區(qū)間劃分以及相鄰知識(shí)組群之間的強(qiáng)關(guān)聯(lián)度,并且具有較為明顯的學(xué)科交融性,以技術(shù)融合推進(jìn)技術(shù)創(chuàng)新,進(jìn)而對(duì)產(chǎn)業(yè)變革產(chǎn)生潛在影響。
2.2? 關(guān)鍵聚類主題分析
根據(jù)如圖1所示的文獻(xiàn)關(guān)鍵詞聚類圖譜和如表1所示的關(guān)鍵詞共現(xiàn)頻次統(tǒng)計(jì)信息,本研究將醫(yī)療圖像分割研究領(lǐng)域劃分為:基于區(qū)域生長(zhǎng)技術(shù)的圖像分割方法、基于模糊聚類的圖像分割方法和基于深度學(xué)習(xí)的圖像分割方法三個(gè)知識(shí)群組。
2.2.1? 基于區(qū)域生長(zhǎng)的圖像分割技術(shù)研究
傳統(tǒng)的圖像分割技術(shù)大多魯棒性較好,常常作為圖像分析的預(yù)處理流程提取目標(biāo)圖像的關(guān)鍵特征信息,傳統(tǒng)圖像分割方法主要有基于閥值、邊緣、區(qū)域生長(zhǎng)的分割方法等。其中,基于區(qū)域生長(zhǎng)的圖像分割方法根據(jù)圖像像素的相似性特征對(duì)像素點(diǎn)進(jìn)行分類以構(gòu)成分割區(qū)域。被引頻次前五的基于區(qū)域生長(zhǎng)的醫(yī)學(xué)圖像分割研究論文統(tǒng)計(jì)分析如表2所示。然而,由于基于區(qū)域生長(zhǎng)的圖像分割方法對(duì)噪聲敏感,在提取焦點(diǎn)區(qū)域上容易存在區(qū)域空缺等現(xiàn)象[6-10]。
2.2.2? 基于模糊聚類的圖像分割技術(shù)研究
隨著醫(yī)學(xué)圖像分割任務(wù)需求的日益復(fù)雜化,基于聚類算法的分割技術(shù)也在不斷地發(fā)展。其中,最具代表性的方法是Ahmed等[11]提出的模糊C-均值聚類算法(Fuzzy C-means clustering, FCM),該分割技術(shù)能夠確定圖像像素所屬的區(qū)域,從而實(shí)現(xiàn)圖像的自動(dòng)分割。然而,傳統(tǒng)的FCM算法使用單個(gè)像素的灰度信息作為特征空間,不包含空間上下文信息,并對(duì)噪聲和強(qiáng)度不均勻性非常敏感[12-14],針對(duì)于此,研究人員通過(guò)使用收斂速度快的K-均值聚類技術(shù)獲得聚類中心,使得FCM算法收斂的迭代次數(shù)降低,提高了圖像分割任務(wù)的處理速度[15-17]。被引頻次前五的基于模糊聚類的醫(yī)學(xué)圖像分割研究論文統(tǒng)計(jì)分析如表3所示。
為了對(duì)比基于模糊聚類的圖像分割方法的性能,本文在COVID-CT-Dataset新冠感染數(shù)據(jù)集上對(duì)基于模糊C-均值的分割算法(如FCM模型、EnFCM模型)進(jìn)行了性能對(duì)比實(shí)驗(yàn)。各模型的圖像分割效果對(duì)比如圖2所示。由圖2(a)、2(b)和2(c)可知,相較于FCM算法,EnFCM算法在分割后的圖像質(zhì)量以及處理速度上有了一定的改善。綜上,基于模糊聚類的圖割方法各有利弊,在圖像信息復(fù)雜、圖像像素強(qiáng)度區(qū)分不明顯等情況下,其圖割性能較差;因此,在臨床使用中,應(yīng)當(dāng)依據(jù)圖割場(chǎng)景選擇適當(dāng)?shù)膱D像分割模型。
2.2.3? 基于深度學(xué)習(xí)的圖像分割技術(shù)研究
傳統(tǒng)的圖像處理方法通常依賴圖像像素的強(qiáng)度差異進(jìn)行圖像分割,對(duì)語(yǔ)義信息復(fù)雜化的醫(yī)學(xué)圖像分割任務(wù)來(lái)說(shuō)具有不小的挑戰(zhàn)性,而深度神經(jīng)網(wǎng)絡(luò)因其強(qiáng)大的特征提取和表示能力而受到廣泛關(guān)注[18-22]?;谏疃葘W(xué)習(xí)的醫(yī)學(xué)圖像分割研究論文統(tǒng)計(jì)分析如表4、表5所示。本節(jié)將重點(diǎn)探索四種基于深度學(xué)習(xí)的圖像分割方法,分別為FCN網(wǎng)絡(luò)、U-Net網(wǎng)絡(luò)、DeepLab網(wǎng)絡(luò)以及Segformer網(wǎng)絡(luò)。
2.2.3.1? FCN網(wǎng)絡(luò)
全卷積網(wǎng)絡(luò)是第一個(gè)用于像素級(jí)分割的深度學(xué)習(xí)網(wǎng)絡(luò)體系,以全監(jiān)督學(xué)習(xí)方式兼容任意尺寸圖像進(jìn)行圖像語(yǔ)義分割,主要由下采樣和上采樣兩部分組成,并將最后一個(gè)全連接層替換為全卷積層,這一重大改進(jìn)使網(wǎng)絡(luò)具有像素級(jí)的密集預(yù)測(cè)能力,并在語(yǔ)義分割方面優(yōu)于同時(shí)代的最先進(jìn)技術(shù)。FCN啟發(fā)了許多后續(xù)研究,Shelhamer等[28]將分類卷積神經(jīng)網(wǎng)絡(luò)改進(jìn)為完全卷積網(wǎng)絡(luò)框架,并使用微調(diào)技術(shù)將其學(xué)習(xí)表示轉(zhuǎn)移到分割任務(wù)中以實(shí)現(xiàn)精確分割。然而,對(duì)于醫(yī)學(xué)圖像分割任務(wù),F(xiàn)CN網(wǎng)絡(luò)的一個(gè)弊端是需要用到大量的樣本數(shù)據(jù)來(lái)訓(xùn)練模型,因此,相關(guān)基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分割任務(wù)目前仍十分具有挑戰(zhàn)性。
2.2.3.2? U-Net網(wǎng)絡(luò)
U-Net網(wǎng)絡(luò)是醫(yī)學(xué)圖像分割領(lǐng)域最著名的體系結(jié)構(gòu)之一,由Ronneberger等于2015年率先提出,截至目前該研究成果的總被引量達(dá)到了21 450次,得到業(yè)內(nèi)學(xué)者的高度認(rèn)可,U-Net網(wǎng)絡(luò)模型結(jié)構(gòu)如圖3所示。其骨干網(wǎng)是一個(gè)完全卷積的網(wǎng)絡(luò),該網(wǎng)絡(luò)的結(jié)構(gòu)是完全對(duì)稱的,由擴(kuò)張路徑和收縮路徑組成。由此可見,U-Net模型修改并擴(kuò)張了FCN網(wǎng)絡(luò),使其能夠在少量數(shù)據(jù)的訓(xùn)練下獲得精確的分割結(jié)果。廣泛的研究表明,U-Net網(wǎng)絡(luò)仍具有一定的局限性。因此學(xué)者們針對(duì)不同的應(yīng)用提出各種U-Net模型變體[25-29],如V-Net網(wǎng)絡(luò)、H-DenseUnet網(wǎng)絡(luò)、U-Net++網(wǎng)絡(luò)以及MultiResUNet網(wǎng)絡(luò)等。然而,該類算法存在高度依賴數(shù)據(jù)集屬性和硬件條件的困境。
2.2.3.3? Deeplab網(wǎng)絡(luò)
DeepLab網(wǎng)絡(luò)模型由Chen等[30]于2018年提出,其在骨干網(wǎng)絡(luò)中增加空洞卷積結(jié)構(gòu),以此緩解一系列卷積操作所導(dǎo)致的有效信息丟失等問(wèn)題。因此,DeepLab網(wǎng)絡(luò)以其良好的性能廣泛用于圖像分割領(lǐng)域,并取得了良好的成效。隨著深度學(xué)習(xí)理論的不斷深化,DeepLab系列模型在DeepLab網(wǎng)絡(luò)的基礎(chǔ)上逐漸被提出。
上文對(duì)各個(gè)時(shí)期的醫(yī)學(xué)圖像分割研究主題進(jìn)行了系統(tǒng)綜述,為了客觀地比較基于深度學(xué)習(xí)的各個(gè)圖像分割網(wǎng)絡(luò)模型的性能,本文在肺部分割數(shù)據(jù)集上對(duì)同類的三種醫(yī)學(xué)圖像分割方法(如:U-Net網(wǎng)絡(luò)和DeepLab V3網(wǎng)絡(luò))進(jìn)行了定量的性能對(duì)比實(shí)驗(yàn)和分析。實(shí)驗(yàn)環(huán)境為Intel(R) Core(TM) i7-3537U-CPU,各網(wǎng)絡(luò)模型在Python 3.8中實(shí)現(xiàn),選擇PyTorch作為深度學(xué)習(xí)框架。各模型的醫(yī)學(xué)圖像分割效果如圖4所示。實(shí)驗(yàn)結(jié)果表明,U-Net網(wǎng)絡(luò)和DeepLab V3網(wǎng)絡(luò)在醫(yī)學(xué)圖像分割任務(wù)中能夠取得良好的分割效果,相較于DeepLab V3網(wǎng)絡(luò),U-Net網(wǎng)絡(luò)能夠較為準(zhǔn)確地識(shí)別目標(biāo)區(qū)域。
綜上所述,在圖像自動(dòng)分割任務(wù)中,深度學(xué)習(xí)由于其優(yōu)異的特征提取能力而在醫(yī)學(xué)圖像分割領(lǐng)域發(fā)揮重大的作用。在很多時(shí)候,基于深度學(xué)習(xí)的圖像分割方法的良好性能很大程度上依賴于大量帶有高質(zhì)量標(biāo)簽的圖像集。遺憾的是,大量收集可靠的注釋不但成本高而且十分耗時(shí),在大多數(shù)情況下,只存在小部分的標(biāo)記數(shù)據(jù),這對(duì)監(jiān)督學(xué)習(xí)網(wǎng)絡(luò)的分割精度提出了挑戰(zhàn)。
2.3? 研究主題的演化路徑與發(fā)展趨勢(shì)分析
2.3.1? 研究主題的演化路徑識(shí)別
基于上述文獻(xiàn)關(guān)鍵詞聚類網(wǎng)絡(luò)的關(guān)鍵文獻(xiàn)信息以及分析,對(duì)圖像分割的主干技術(shù)及其相關(guān)基礎(chǔ)理論的研究主題演化路徑進(jìn)行研究。本研究借用關(guān)鍵詞節(jié)點(diǎn)間的連線顏色,分析了醫(yī)學(xué)圖像分割研究領(lǐng)域中的三條重要主題演化路徑:“醫(yī)學(xué)圖像分割—水平集—稀疏表示—深度學(xué)習(xí)”研究路徑、“圖像分割—模糊聚類—核函數(shù)—多尺度”研究路徑以及“圖像分割—深度學(xué)習(xí)—語(yǔ)義分割—聚類”研究路徑。醫(yī)學(xué)圖像分割研究的研究主題演化路徑如圖5所示,具體分析如下:
1)“醫(yī)學(xué)圖像分割—水平集—稀疏表示—深度學(xué)習(xí)”研究路徑。該路徑是醫(yī)學(xué)圖像分割研究中經(jīng)典技術(shù)與新興技術(shù)相融合的特色分支,該路徑主要描述醫(yī)學(xué)圖像分割研究的各個(gè)階段,研究主題從醫(yī)學(xué)圖像分割技術(shù)的基礎(chǔ)理論逐漸向外擴(kuò)展。與此同時(shí),結(jié)合文獻(xiàn)關(guān)鍵詞聚類網(wǎng)絡(luò)可以看出,醫(yī)學(xué)圖像分割研究初期集中于“水平集”等傳統(tǒng)圖像分割技術(shù),隨著理論研究的不斷深入,研究主題逐漸細(xì)化為“稀疏表示”等分支,并結(jié)合深度學(xué)習(xí)等新興的人工智能技術(shù),進(jìn)一步促進(jìn)醫(yī)學(xué)圖像分割技術(shù)的發(fā)展。
2)“圖像分割—模糊聚類—核函數(shù)—多尺度”研究路徑。該路徑主要展示了醫(yī)學(xué)圖像分割技術(shù)的研究演化過(guò)程,研究主題從圖像分割技術(shù)逐漸細(xì)化到特色的模糊聚類技術(shù),并在多尺度圖像分割應(yīng)用中進(jìn)行實(shí)證研究。在此研究的基礎(chǔ)上,研究主題引入多尺度分割的理念,促使醫(yī)學(xué)圖像分割研究進(jìn)入新的發(fā)展領(lǐng)域。
3)“圖像分割—深度學(xué)習(xí)—語(yǔ)義分割—聚類”研究路徑。該路徑是醫(yī)學(xué)圖像分割研究領(lǐng)域的新興特色分支,代表著醫(yī)學(xué)圖像分割研究在基于深度學(xué)習(xí)的計(jì)算機(jī)視覺(jué)領(lǐng)域的細(xì)化及應(yīng)用。該路徑是深度學(xué)習(xí)等新興技術(shù)與經(jīng)典分割任務(wù)的結(jié)合與碰撞,展現(xiàn)出強(qiáng)大的生命力。尤其是隨著計(jì)算機(jī)技術(shù)的改進(jìn),機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法成為圖像分割任務(wù)實(shí)現(xiàn)的主要選擇,并且有越來(lái)越多的研究學(xué)者開始了對(duì)該技術(shù)路徑的探索。
因此,在圖像分割領(lǐng)域的各分支方向上均存在大量的學(xué)科交叉與融合,為解決某種問(wèn)題,需采用多項(xiàng)技術(shù)結(jié)合研究并逐漸提出技術(shù)交叉的創(chuàng)新方法。隨著技術(shù)的不斷發(fā)展,“水平集”“遺傳算法”“區(qū)域生長(zhǎng)”等概念的研究熱度逐漸減弱,如實(shí)反映出醫(yī)學(xué)圖像分割領(lǐng)域的關(guān)鍵節(jié)點(diǎn)及發(fā)展脈絡(luò)。
2.3.2? 發(fā)展趨勢(shì)分析
通過(guò)對(duì)國(guó)內(nèi)外醫(yī)學(xué)圖像分割技術(shù)演化路徑趨勢(shì)的分析研究,能夠總結(jié)出國(guó)內(nèi)外醫(yī)學(xué)圖像分割技術(shù)的發(fā)展趨勢(shì):
1)零樣本語(yǔ)義分割技術(shù)。目前,醫(yī)學(xué)圖像語(yǔ)義分割網(wǎng)絡(luò)主要是監(jiān)督學(xué)習(xí)模式,該類模型表現(xiàn)出的優(yōu)異性能常常依賴于大量帶標(biāo)注的樣本數(shù)據(jù)進(jìn)行模型訓(xùn)練。然而,在實(shí)際應(yīng)用過(guò)程中,像素級(jí)標(biāo)注數(shù)據(jù)的獲取往往需要高昂的人力資源成本,導(dǎo)致醫(yī)學(xué)圖像分割領(lǐng)域普遍存在小樣本及數(shù)據(jù)孤島等問(wèn)題,限制了醫(yī)學(xué)圖像語(yǔ)義分割技術(shù)的拓展性。其中,零樣本學(xué)習(xí)通過(guò)知識(shí)的遷移,使得深度學(xué)習(xí)網(wǎng)絡(luò)模型可以對(duì)從未見過(guò)的數(shù)據(jù)類別進(jìn)行識(shí)別,為解決小樣本問(wèn)題開辟一個(gè)新的方向,并在圖像分類、類別定義等領(lǐng)域取得了顯著成效,是基于深度學(xué)習(xí)的圖像處理技術(shù)的重要發(fā)展趨勢(shì)之一。
2)遷移學(xué)習(xí)與弱監(jiān)督學(xué)習(xí)技術(shù)。深度卷積神經(jīng)網(wǎng)絡(luò)在醫(yī)學(xué)圖像分割領(lǐng)域成效顯著,并逐漸從監(jiān)督學(xué)習(xí)向無(wú)監(jiān)督學(xué)習(xí)擴(kuò)展。然而,在實(shí)際應(yīng)用中,往往會(huì)出現(xiàn)訓(xùn)練數(shù)據(jù)過(guò)期的情況,亟待重新標(biāo)定訓(xùn)練數(shù)據(jù)。這類方法不僅需要高昂的人力資源成本,而且還會(huì)造成前期已標(biāo)注訓(xùn)練數(shù)據(jù)的極大浪費(fèi)。而遷移學(xué)習(xí)是一種能夠?qū)⒃从蛉蝿?wù)中學(xué)習(xí)到的知識(shí)應(yīng)用于目標(biāo)域任務(wù)的學(xué)習(xí)方法,能夠有效利用已標(biāo)注好的樣本數(shù)據(jù)輔助目標(biāo)任務(wù)構(gòu)建模型,其效果得到了學(xué)術(shù)界與產(chǎn)業(yè)界的認(rèn)可,引起了廣泛的關(guān)注。
3)多模態(tài)圖像語(yǔ)義分割技術(shù)。由于醫(yī)學(xué)圖像成像的局限性,不同模態(tài)的醫(yī)學(xué)圖像數(shù)據(jù)僅能反映病人病理部位特定的信息。因此,對(duì)于同一研究主題,綜合利用多種不同模態(tài)醫(yī)學(xué)圖像數(shù)據(jù),能夠從多種不同特征方面捕捉更加全面的病理信息和特征表現(xiàn)。由于多模態(tài)醫(yī)學(xué)圖像的表型具有高度異質(zhì)的特點(diǎn),其醫(yī)學(xué)圖像分割的研究具有很大的挑戰(zhàn)性。為了提升多模態(tài)醫(yī)學(xué)圖像中的信息利用率,通過(guò)融合多模態(tài)互補(bǔ)醫(yī)學(xué)圖像特征數(shù)據(jù)的多模態(tài)醫(yī)學(xué)圖像分割方法得到了學(xué)界與產(chǎn)業(yè)界的高度重視。
3? 結(jié)? 論
利用信息可視化分析軟件CiteSpace對(duì)近25年(1997—2022年)國(guó)內(nèi)外圖像分割技術(shù)在醫(yī)療健康領(lǐng)域的研究文獻(xiàn)進(jìn)行了文獻(xiàn)計(jì)量學(xué)分析和知識(shí)網(wǎng)絡(luò)可視化,通過(guò)繪制醫(yī)學(xué)圖像分割研究文獻(xiàn)關(guān)鍵詞聚類網(wǎng)絡(luò)圖譜,分析該領(lǐng)域網(wǎng)絡(luò)聚集的五個(gè)知識(shí)群組,進(jìn)而識(shí)別出知識(shí)群組的知識(shí)演進(jìn)路徑。最后,綜述了基于區(qū)域、聚類、深度學(xué)習(xí)的圖像分割算法及其應(yīng)用,并在新冠疫情數(shù)據(jù)集與肺部分割數(shù)據(jù)集上對(duì)同類的醫(yī)學(xué)圖像分割方法進(jìn)行了對(duì)比實(shí)驗(yàn)與分析,并得出以下結(jié)論:
1)從知識(shí)群組識(shí)別分析來(lái)看,醫(yī)學(xué)圖像分割作為當(dāng)前研究的熱點(diǎn),近幾年來(lái)取得大量?jī)?yōu)質(zhì)的研究成果,研究熱度越來(lái)越高,其研究核心主要表現(xiàn)在計(jì)算機(jī)科學(xué)、生物醫(yī)學(xué)、人工智能科學(xué)以及機(jī)器人工程等學(xué)科,有較為明顯的學(xué)科交融性,以技術(shù)融合推進(jìn)技術(shù)創(chuàng)新,進(jìn)而對(duì)產(chǎn)業(yè)變革產(chǎn)生潛在影響。
2)從研究主題分析來(lái)看,基于深度學(xué)習(xí)技術(shù)對(duì)醫(yī)學(xué)圖像分割領(lǐng)域研究的原理以及方法較為豐富,并且隨著技術(shù)的不斷推進(jìn),未來(lái)多學(xué)科交叉定量研究的趨勢(shì)將逐漸增強(qiáng),進(jìn)而促進(jìn)智能醫(yī)療健康產(chǎn)業(yè)的發(fā)展。
3)從研究主題的演化路徑與發(fā)展趨勢(shì)來(lái)看,圖像分割技術(shù)正在從以區(qū)域、模糊聚類等傳統(tǒng)圖割技術(shù)為中心的模式向以深度學(xué)習(xí)等新興人工智能技術(shù)為中心的模式轉(zhuǎn)變,并具有主題交叉、聯(lián)系緊密等特點(diǎn)。其中,深度學(xué)習(xí)技術(shù)研究成為智能醫(yī)療健康領(lǐng)域高度系統(tǒng)化的研究熱點(diǎn)。
綜上所述,以深度學(xué)習(xí)為關(guān)鍵技術(shù)的模式是未來(lái)醫(yī)學(xué)圖像分割發(fā)展的必然趨勢(shì),研究與探索醫(yī)學(xué)圖像分割領(lǐng)域的研究現(xiàn)狀與發(fā)展態(tài)勢(shì),對(duì)推動(dòng)國(guó)內(nèi)圖像分割技術(shù)在醫(yī)療健康領(lǐng)域應(yīng)用研究與醫(yī)療臨床應(yīng)用產(chǎn)業(yè)發(fā)展具有重要的情報(bào)參考價(jià)值。
參考文獻(xiàn):
[1] 王藝培,閆雯,張益肇,等.面向精準(zhǔn)醫(yī)療的人工智能在病理圖像中的應(yīng)用 [J].現(xiàn)代信息科技,2018,2(5):170-172.
[2] 張俐,馬敏象,杜軍,等.基于文獻(xiàn)計(jì)量與標(biāo)引統(tǒng)計(jì)的醫(yī)療領(lǐng)域區(qū)塊鏈技術(shù)應(yīng)用發(fā)展趨勢(shì)研究 [J].情報(bào)學(xué)報(bào),2021,40(9):962-973.
[3] 付姣慧,常曉丹,沙俏麗,等.2011年—2020年深度學(xué)習(xí)用于醫(yī)學(xué)影像學(xué)研究文獻(xiàn)分析 [J].中國(guó)介入影像與治療學(xué),2022,19(1):53-57.
[4] 陳欣然,李國(guó)正,崔一迪,等.基于專利計(jì)量的全球人工智能技術(shù)在醫(yī)療健康領(lǐng)域應(yīng)用發(fā)展態(tài)勢(shì)分析 [J].科技管理研究,2021,41(3):139-147.
[5] FANG Y Q. Visualizing the structure and the evolving of digital medicine: a scientometrics review [J].Scientometrics,2015,105(1):5-21.
[6] 陸劍鋒,林海,潘志庚.自適應(yīng)區(qū)域生長(zhǎng)算法在醫(yī)學(xué)圖像分割中的應(yīng)用 [J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2005(10):28-33.
[7] 朱付平,田捷,林瑤,等.基于Level_Set方法的醫(yī)學(xué)圖像分割 [J].軟件學(xué)報(bào),2002,13(9):1866-1872.
[8] 王金濤,劉文耀,路爍.流域分割算法在細(xì)胞圖像分割中的應(yīng)用 [J].西南交通大學(xué)學(xué)報(bào),2002,37(3):290-294.
[9] 羅希平,田捷.一種改進(jìn)的交互式醫(yī)學(xué)圖像序列分割方法 [J].電子學(xué)報(bào),2003(1):29-32.
[10] 程明,黃曉陽(yáng),黃紹輝,等.定向區(qū)域生長(zhǎng)算法及其在血管分割中的應(yīng)用 [J].中國(guó)圖象圖形學(xué)報(bào),2011,16(1):44-49.
[11] AHMED M N,YAMANY S M,MOHAMED N,et al. A modified fuzzy C-means algorithm for bias field estimation and segmentation of MRI data [J].IEEE Transactions on Medical Imaging,2002,21(3):193-199.
[12] CHEN Z L,ZWIGGELAAR R. A modified fuzzy C-means algorithm for breast tissue density segmentation in mammograms [C]//Proceedings of the 10th IEEE International Conference on Information Technology and Applications in Biomedicine. Corfu:IEEE,2010:1-4.
[13] 田捷,韓博聞,王巖,等.模糊C-均值聚類法在醫(yī)學(xué)圖像分析中的應(yīng)用 [J].軟件學(xué)報(bào),2001(11):1623-1629.
[14] 吳林,郭大勇,施克仁,等.改進(jìn)的FCM在人腦MR圖像分割中的應(yīng)用 [J].清華大學(xué)學(xué)報(bào):自然科學(xué)版,2004(2):157-159.
[15] 吳永芳,楊鑫,徐敏,等.基于K均值聚類的圖割醫(yī)學(xué)圖像分割算法 [J].計(jì)算機(jī)工程,2011,37(5):232-234.
[16] 李宣平,王雪.模糊聚類協(xié)作區(qū)域主動(dòng)輪廓模型醫(yī)學(xué)圖像分割 [J].儀器儀表學(xué)報(bào),2013,34(4):860-865.
[17] 朱玲利,李吉桂,鮑蘇蘇.基于遺傳算法的聚類分析在CT圖像分割中的應(yīng)用 [J].計(jì)算機(jī)科學(xué),2006(10):186-188.
[18] 吳晨玥,易本順,章云港,等.基于改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)的視網(wǎng)膜血管圖像分割 [J].光學(xué)學(xué)報(bào),2018,38(11):133-139.
[19] 郭樹旭,馬樹志,李晶,等.基于全卷積神經(jīng)網(wǎng)絡(luò)的肝臟CT影像分割研究 [J].計(jì)算機(jī)工程與應(yīng)用,2017,53(18):126-131.
[20] 詹曙,梁植程,謝棟棟.前列腺磁共振圖像分割的反卷積神經(jīng)網(wǎng)絡(luò)方法 [J].中國(guó)圖象圖形學(xué)報(bào),2017,22(4):516-522.
[21] 王海鷗,劉慧,郭強(qiáng),等.面向醫(yī)學(xué)圖像分割的超像素U-Net網(wǎng)絡(luò)設(shè)計(jì) [J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2019,31(6):1007-1017.
[22] 于寧波,劉嘉男,高麗,等.基于深度學(xué)習(xí)的膝關(guān)節(jié)MR圖像自動(dòng)分割方法 [J].儀器儀表學(xué)報(bào),2020,41(6):140-149.
[23] RONNEBERGER O,F(xiàn)ISCHER P,BROX T. U-Net: Convolutional networks for biomedical image segmentation [J].Springer Cham,2015,10(1):234-241.
[24] SMITH S M. Fast robust automated brain extraction [J].Human Brain Mapping,2002,17(3):143-155.
[25] MILLETAR F,NAVAB N,AHMADI S A. V-Net fully convolutional neural networks for volumetric medical image segmentation [C]//2016 Fourth International Conference on 3D Vision (3DV).Stanford:IEEE,2016:565?571.
[26] TUSTISON N J,AVANTS B B,COOK P A,et al. N4ITK: improved N3 bias correction [J].IEEE Transactions on Medical Imaging,2010,29(6):1310-1320.
[27] KONSTANTINOS K,CHRISTIAN L,VIRGINIA F J N,et al. Efficient multi-scale 3D CNN with fully connected CRF for accurate brain lesion segmentation [J].Medical Image Analysis,2017,36:61-78.
[28] SHELHAMER E,LONG J,DARRELL T. Fully convolutional networks for semantic segmentation [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2017,39(4):640-651.
[29] ISENSEE F,JAEGER P F,KOHL S A,et al. nnU-Net:a self-configuring method for deep learning-based biomedical image segmentation [J].Nature Methods,2021,18(1):203-211.
[30] CHEN L C,PAPANDREOU G,KOKKINOS I,et al. Deeplab:Semantic image segmentation with deep convolutional nets,atrous convolution,and fully connected crfs [J].IEEE transactions on pattern analysis and machine intelligence,2018,40(1):834-848.
作者簡(jiǎn)介:劉良斌(1974—),男,漢族,湖北漢陽(yáng)人,高級(jí)工程師,碩士研究生,主要研究方向:科研管理、軟件工程、科技服務(wù)。
收稿日期:2023-01-30
基金項(xiàng)目:廣東省援疆科技(特派員)項(xiàng)目(2018YJ003);廣東省重點(diǎn)領(lǐng)域研發(fā)計(jì)劃項(xiàng)目(2020B0101130019)