任曉麗
(山西醫(yī)科大學(xué)汾陽(yáng)學(xué)院,汾陽(yáng) 032200)
圖像是目標(biāo)的復(fù)雜映射。數(shù)字化條件下,圖像是由離散圖像元素組成的多維數(shù)據(jù)。數(shù)據(jù)是介于目標(biāo)和圖像間的信息載體,醫(yī)學(xué)數(shù)據(jù)加上意義就是醫(yī)學(xué)信息的描述?;谖锢硪蜃优c人體組織作用機(jī)制,依據(jù)具體用途經(jīng)適合的數(shù)據(jù)處理系統(tǒng)而生成的醫(yī)學(xué)圖像,突破了原先聽(tīng)診、觸摸等臨床診斷方式的局限,以其形象化、無(wú)損化方式被廣泛使用,不斷發(fā)展為醫(yī)學(xué)界的一枝獨(dú)秀。其主要過(guò)程包括初始數(shù)據(jù)的采集獲取,針對(duì)對(duì)象特征信息的處理及最后目標(biāo)圖像的再現(xiàn)。
通過(guò)視覺(jué)方式獲取機(jī)體信息是臨床診斷的重要途徑。自19世紀(jì)末倫琴發(fā)明X射線(xiàn)攝影方法,100多年來(lái)分別產(chǎn)生了超聲(US)、計(jì)算機(jī)斷層掃描(CT)、核素顯像(RI)及共振(MRI)等電離輻射和非輻射型成像方式。共同之處都是由源到像的映射,將體內(nèi)不可見(jiàn)的信息進(jìn)行“可視化”的表達(dá)過(guò)程。醫(yī)學(xué)數(shù)據(jù)的可視化和分析是醫(yī)學(xué)研究的一個(gè)實(shí)際方向,初始數(shù)據(jù)的獲得及處理是良好診斷結(jié)果的基本前提[1]。人體內(nèi)不同組織臟器的位置形狀等性質(zhì)迥異,同一病灶在不同病理期的參數(shù)亦有變化,經(jīng)一定的能量波(電磁波、機(jī)械波)作用后,客體的特征逐漸被主體化,被賦予了處理描述的含義。
醫(yī)學(xué)圖像生成的前提是體內(nèi)的目標(biāo)物與輸入圖像的圖像結(jié)構(gòu)(區(qū)域、線(xiàn)等)之間的“正確”映射。不同模式的圖像因其成像機(jī)制不同各有特點(diǎn)和優(yōu)勢(shì)。X線(xiàn)圖像占臨床總影像的70%~80%,主要基于X光子和體內(nèi)物質(zhì)粒子的光電、康普頓作用。圖像是體內(nèi)某一特性對(duì)X線(xiàn)輻射強(qiáng)度的吸收衰減描述,是射線(xiàn)透過(guò)被檢組織、器官的投影。普通的X線(xiàn)成像將立體的目標(biāo)物沿X線(xiàn)方向壓成了二維圖像,產(chǎn)生骨骼組織重疊,深度信息被掩埋。用來(lái)獲取觀測(cè)目標(biāo)的斷層圖像技術(shù),即CT解決了目標(biāo)源到圖像的重疊映射的問(wèn)題。CT技術(shù)起源于醫(yī)學(xué)成像,也逐漸應(yīng)用到其他圖像領(lǐng)域。X-CT基于計(jì)算機(jī),采用精密的掃描、探測(cè)系統(tǒng),獲得人體的高密度分辨力和無(wú)重疊體層圖像。同時(shí)CT的出現(xiàn)也促進(jìn)了不同醫(yī)學(xué)成像方式的有機(jī)融合。廣義的醫(yī)學(xué)CT是通過(guò)某種輻射源(X射線(xiàn)、放射性核素、超聲波、磁場(chǎng)等)作用于信息源(目標(biāo)),檢測(cè)投影數(shù)據(jù),并進(jìn)行圖像重建、數(shù)據(jù)處理[2]。如發(fā)射型計(jì)算機(jī)斷層成像(ECT),基于放射性藥物經(jīng)人體代謝,在正常組織與病變部位間形成濃度差異,探測(cè)該差異進(jìn)行處理成像,是利用診斷物體內(nèi)部發(fā)射的能量波成像,著重提供臟器的功能信息。磁共振斷層成像(MRI),基于組織的氫質(zhì)子磁化矢量差異,由射頻波作用于三維人體生成的截面投影數(shù)據(jù)重建而形成二維圖像,具有多方位、多參數(shù)、無(wú)輻射、無(wú)骨偽影等優(yōu)勢(shì)??傊刹煌某上裨O(shè)備進(jìn)行功能的融合可獲取特定的斷層數(shù)字圖像序列。
醫(yī)學(xué)成像的根本目的是將人體內(nèi)各種生理、病理、生化活動(dòng)等信息轉(zhuǎn)化為圖像對(duì)象的特征:如顏色、紋理、形狀、邊界等傳統(tǒng)的一般特征。除此之外,還有三維物體的深度、表面法線(xiàn)方向、動(dòng)態(tài)景物的運(yùn)動(dòng)參數(shù)等信息。醫(yī)學(xué)圖像由計(jì)算機(jī)中的二維點(diǎn)陣構(gòu)成,即空間坐標(biāo)離散。其視野面積取決于點(diǎn)陣的大小和數(shù)目。各點(diǎn)的特征值用整數(shù)值表示,即性質(zhì)離散。眾多點(diǎn)陣組成的數(shù)據(jù)集合并不能明確表示對(duì)象的特征,遠(yuǎn)低于圖像所表示的邏輯語(yǔ)義層次上的意義。依據(jù)人們對(duì)圖像認(rèn)知處理的階梯性可將信息劃分為如下層次:1)基于初始圖像信息的像素層;2)基于特定領(lǐng)域的識(shí)別對(duì)象及一致性區(qū)域的對(duì)象層;3)高層次的語(yǔ)義概念層:運(yùn)用應(yīng)用領(lǐng)域知識(shí)經(jīng)驗(yàn)可生成基于對(duì)象級(jí)別所識(shí)別出的對(duì)象或區(qū)域信息。
由于受成像源或模態(tài)、參數(shù)、成像時(shí)間等因素的影響,醫(yī)學(xué)圖像數(shù)據(jù)復(fù)雜、多樣及上下文具有豐富的關(guān)聯(lián)[3]。圖像數(shù)據(jù)具有多個(gè)變量,反映同一對(duì)象的不同方面的細(xì)節(jié)特征,即高維性。對(duì)客體信息的詳盡描述離不開(kāi)對(duì)象的各個(gè)方面的特征及特征間的關(guān)系,需要有不同角度的數(shù)據(jù)描述支撐。因而,產(chǎn)生了多個(gè)變量抽象描述復(fù)雜對(duì)象,組成了矢量數(shù)據(jù),形成了抽象的高維數(shù)據(jù)空間,這種高維性是對(duì)圖像對(duì)象的多重屬性及相互聯(lián)系描述的基礎(chǔ),所有的屬性維度可能上升到指數(shù)級(jí)的組合情況。
高維數(shù)據(jù)空間對(duì)應(yīng)多維特征空間,作用是表達(dá)空間實(shí)體的多個(gè)屬性或特征,一個(gè)空間實(shí)體看作特征空間的一個(gè)點(diǎn),成千上萬(wàn)的數(shù)據(jù)記錄是特征空間成千上萬(wàn)的點(diǎn)。高維的矢量數(shù)據(jù)隱顯不同層次深度的信息,如基于像素級(jí)的微觀粒度,對(duì)應(yīng)分析層次的最小粒度;基于像素集團(tuán)級(jí)的中觀粒度;基于對(duì)象級(jí)的宏觀粒度,對(duì)應(yīng)分析層次的大粒度,表現(xiàn)為空間對(duì)象間的空間關(guān)系。不同層次的數(shù)據(jù)具有不同的特征,如淺層特征表示邊緣等信息,深層特征具有更高層的語(yǔ)義等。
由圖像與數(shù)據(jù)源的關(guān)系可將信息分為內(nèi)容信息(內(nèi)部)和源信息(外部)。后者指客觀直接的無(wú)需推理分析的所屬性信息(如患者年齡、性別等)及所用成像儀器種類(lèi)情況等。內(nèi)部信息對(duì)應(yīng)圖像的實(shí)質(zhì)性?xún)?nèi)容。具有可抽取、可挖掘性。即從一幅(或多幅)圖像數(shù)據(jù)中提取出有用、規(guī)律性的信息、圖像數(shù)據(jù)關(guān)系、空間模式等。
圖像數(shù)據(jù)是對(duì)全局圖像特征(灰度、顏色等)和圖像對(duì)象基于內(nèi)容及彼此間關(guān)系的描述(如邏輯和語(yǔ)義等),即數(shù)據(jù)的邏輯性,隱顯著各種預(yù)期的目標(biāo)醫(yī)學(xué)信息。除了反映客體最基本、最直觀的信息外(如器官層次:心臟、腦、肝臟等;系統(tǒng)層次:心血管、神經(jīng)系統(tǒng)等;及細(xì)胞層次[4]),還可提取出不同程度的圖像特征數(shù)據(jù)(像元層次、特征層次、對(duì)象層次)。如從海量的數(shù)據(jù)中可挖掘出不同種類(lèi)疾病間的關(guān)系以及疾病與職業(yè)、血型等因素的關(guān)系。挖掘過(guò)程旨在抽取出不同層次的概念,可理解為從圖像數(shù)據(jù)中形成概念,將數(shù)據(jù)賦予語(yǔ)義化信息聯(lián)系,可提取語(yǔ)義及關(guān)聯(lián)等特征,挖掘需要綜合利用領(lǐng)域相關(guān)的屬性數(shù)據(jù),而不是僅僅針對(duì)圖像數(shù)據(jù)本身,對(duì)圖像背后隱藏的需求進(jìn)行挖掘,并通過(guò)與周邊環(huán)境信息進(jìn)行關(guān)聯(lián)計(jì)算[5]。如基于紋理特征,從海量的圖像數(shù)據(jù)集中發(fā)現(xiàn)重要的關(guān)聯(lián)規(guī)則,進(jìn)而發(fā)現(xiàn)乳房X光圖像中的隱藏信息[6]。甚至深入挖掘特征空間的底層結(jié)構(gòu),探究特征之間的關(guān)系,進(jìn)行特征選擇,這同時(shí)是一種重要的降維技術(shù)[7]。
每個(gè)模態(tài)成像具有其特定的特征或功能,以獲得形態(tài)學(xué)信息結(jié)構(gòu)和生物功能,兩者在器官、組織或分子水平上關(guān)于圖像的內(nèi)容和解釋是不同的[3]。單一化的特征信息在圖像上的顯現(xiàn)、描述,不足以成為準(zhǔn)確判定某一病癥的依據(jù)。往往需要將不同來(lái)源、不同模式、不同表示的醫(yī)學(xué)圖像數(shù)據(jù)有機(jī)結(jié)合,即圖像融合,綜合不同成像機(jī)理的圖像特征,保留并加強(qiáng)各自的靶區(qū)特征信息,最終顯示在一張圖像上[8],以得到目標(biāo)對(duì)象的更精確描述,即醫(yī)學(xué)數(shù)據(jù)融合。這是類(lèi)似于腦組織收集并綜合處理各類(lèi)信息的過(guò)程[9]。低層次的融合主要針對(duì)初始的多源數(shù)據(jù)加權(quán)相加。較高層次的特征融合事先對(duì)各源數(shù)據(jù)提取特征信息,形成特征向量再融合分析,如基于主元分析的特征級(jí)數(shù)據(jù)融合可以解決特征向量維數(shù)高的問(wèn)題。融合在臨床上應(yīng)用的關(guān)鍵是多模態(tài)圖像的有效相似度度量[10]。數(shù)據(jù)融合有利于目標(biāo)對(duì)象特征的全面分析和抽取。如在MRI和PET圖像的融合結(jié)果中可以反映出MRI腦軟組織結(jié)構(gòu)信息與PET的腦內(nèi)部代謝情況[8];在腫瘤定位中PET/CT既能反映組織細(xì)胞的代謝信息,又能準(zhǔn)確定位病灶[11];PET和SPET可以提供大量功能性、生化類(lèi)和生理學(xué)信息。
醫(yī)學(xué)圖像的生成是針對(duì)體內(nèi)特征進(jìn)行二維投影及“信息處理”的過(guò)程 。
圖像處理通常概括為從不完整的數(shù)據(jù)中恢復(fù)真實(shí)的目標(biāo)信息的問(wèn)題,處理目的是通過(guò)輸入圖像提取出適應(yīng)的圖像結(jié)構(gòu)與線(xiàn)索等視覺(jué)元素,以確定圖像特征的真實(shí)表現(xiàn),是為了獲得更好的解釋。
成像過(guò)程中不可能做到無(wú)誤差數(shù)據(jù)的映射。加之人體是一個(gè)高度復(fù)雜的非線(xiàn)性動(dòng)力學(xué)系統(tǒng),即發(fā)生在確定性系統(tǒng)中的貌似隨機(jī)的不規(guī)則運(yùn)動(dòng)[4],導(dǎo)致圖像會(huì)產(chǎn)生一定的退化現(xiàn)象。受微觀粒子特性的隨機(jī)影響,局部體效應(yīng)(同一體素含有不同目標(biāo)對(duì)象)的存在,及患者的自主性運(yùn)動(dòng)或本能性生理活動(dòng)等,都會(huì)使圖像中盤(pán)現(xiàn)各類(lèi)噪聲和偽影,邊緣失銳和信號(hào)強(qiáng)度異常衰減。加之投影算子不唯一可逆[1]。很可能存在病態(tài)物理求解情況:成像環(huán)節(jié)中所進(jìn)行的各種模型化處理與實(shí)際物理過(guò)程總會(huì)產(chǎn)生誤差,一旦數(shù)學(xué)方程組的系數(shù)發(fā)生變化,即便是微小的,也會(huì)導(dǎo)致待測(cè)量的較大波動(dòng),最終會(huì)影響到圖像特征的正確顯現(xiàn)。當(dāng)然求解的病態(tài)程度取決于人們對(duì)圖像精細(xì)程度的要求,是相對(duì)的。因?yàn)閳D像數(shù)據(jù)值本身具有相對(duì)性,取決于圖像與周?chē)尘暗年P(guān)系。由此需要擴(kuò)充各種先驗(yàn)知識(shí)(醫(yī)學(xué)領(lǐng)域、成像工程),建立并改進(jìn)與目標(biāo)對(duì)象吻合的處理模型,從測(cè)量的數(shù)據(jù)出發(fā),試圖恢復(fù)所需要的信息,努力還原圖像的“原創(chuàng)性”。
針對(duì)初始數(shù)據(jù)的缺憾(不完整、含噪、重復(fù)等),在主要的圖像處理之前進(jìn)行一定預(yù)處理,如傳統(tǒng)的圖像增強(qiáng)、濾波,可提高對(duì)比度及信噪比等。該過(guò)程輸入、輸出均為圖像,基本沒(méi)有知識(shí)的參與指導(dǎo),屬于低級(jí)處理。
由于圖像診斷的廣泛利用及成像設(shè)備的不斷改進(jìn),醫(yī)學(xué)圖像數(shù)據(jù)大規(guī)模增加,為提高醫(yī)生的判讀效率與質(zhì)量,借助計(jì)算機(jī)視覺(jué)(CV),模擬人的視覺(jué)機(jī)理對(duì)圖像目標(biāo)進(jìn)行識(shí)別、跟蹤、測(cè)量,從多維數(shù)據(jù)中獲取信息形成“感知”的能力。
將圖像轉(zhuǎn)化為更適合人眼觀察或便于儀器檢測(cè)的形式,屬于生物視覺(jué)的一種模擬。其中根本的問(wèn)題是判定一組圖像數(shù)據(jù)中是否包含某個(gè)特定的物體特征或運(yùn)動(dòng)狀態(tài),可通過(guò)圖像分割將具有特殊意義的不同區(qū)域分開(kāi),即用具有生物學(xué)意義的標(biāo)簽(如解剖結(jié)構(gòu)和組織類(lèi)型)標(biāo)記圖像像素或體素的過(guò)程,這是生物醫(yī)學(xué)圖像分析的基本問(wèn)題之一[12],也是計(jì)算機(jī)視覺(jué)識(shí)別研究的根本所在。
早期的圖像分割有邊界提取、基于灰度的區(qū)域增長(zhǎng)算法等,是經(jīng)典的直接的分割處理。隨著計(jì)算機(jī)視覺(jué)理論方法及圖像分析的不斷完善,對(duì)于圖像興趣區(qū)的分割方法得到很大改進(jìn)。針對(duì)不同的臟器及成像模態(tài),形成了基于不同成像設(shè)備、參數(shù)和解剖結(jié)構(gòu)等先驗(yàn)知識(shí)的專(zhuān)門(mén)分析算法。如基于不同組織結(jié)構(gòu)共振成像時(shí)有不同的成像參數(shù),同種組織不同參數(shù)灰度表現(xiàn)不同,對(duì)應(yīng)不同的加權(quán)圖像,T1圖像主要顯示解剖結(jié)構(gòu)[I=kB0ρ(1-e-TR/T1)],T2圖像主要對(duì)病變組織進(jìn)行定性分析(I=kB0ρe-TE/T2),基于上述共振成像原理的先驗(yàn)知識(shí),針對(duì)腦磁共振圖像,使用不同頻譜,而非單一的T1圖像,在分開(kāi)腦白質(zhì)和灰質(zhì)之后,可有效分割各自的損傷區(qū)域。
圖像分析著重構(gòu)造圖像描述方法,并利用各種有關(guān)知識(shí)進(jìn)行推理??蓪⒃嫉母呔S數(shù)據(jù)通過(guò)線(xiàn)性或非線(xiàn)性變換映射到一個(gè)低維空間,獲得一個(gè)關(guān)于原數(shù)據(jù)集緊致的低維表示,即降低高維醫(yī)學(xué)數(shù)據(jù)的維數(shù)(維度約簡(jiǎn))。由更具代表的屬性集合處理高維性的問(wèn)題;基于深度學(xué)習(xí)的多層面數(shù)據(jù)處理,組建多個(gè)處理層對(duì)原始數(shù)據(jù)進(jìn)行逐層抽象,從數(shù)據(jù)中獲得不同層面的抽象特征[13]。如基于形態(tài)特征ROI提取可獲得具有診斷意義的像素區(qū)域信息;基于局部、全局、邊緣的紋理粗細(xì)度及方向性變化的紋理特征提取等[14];將研究對(duì)象固有的、本質(zhì)的屬性量值化,有效提取特征參數(shù);分解對(duì)象以形成各區(qū)域的特征向量,相關(guān)的特征選擇是從高維數(shù)據(jù)屬性中選取重要屬性的子集,得到該圖像的某個(gè)或某些特征的信息或描述,從而形成圖像分析結(jié)果,輸出數(shù)據(jù)。
把分析的結(jié)果作為輸入,進(jìn)一步對(duì)圖像進(jìn)行理解和識(shí)別。圖像理解就是對(duì)圖像語(yǔ)義的理解,即以圖像為對(duì)象、知識(shí)為核心、研究圖像中有什么目標(biāo)及目標(biāo)之間的關(guān)系。故處理的信息分為視覺(jué)數(shù)據(jù)信息和人類(lèi)知識(shí)信息,屬于高級(jí)計(jì)算機(jī)視覺(jué)范疇,是在人類(lèi)先驗(yàn)知識(shí)的參與指導(dǎo)下,基于人類(lèi)對(duì)客觀世界的認(rèn)知機(jī)理,借助計(jì)算機(jī)系統(tǒng)將某種成像模式數(shù)據(jù),利用一定的知識(shí)信息進(jìn)行加工以期獲得解釋。輸入的是圖像的初級(jí)特征,輸出的是高層次信息描述。這是人的先驗(yàn)性領(lǐng)域知識(shí)與計(jì)算機(jī)圖像處理有機(jī)契入的過(guò)程,如基于專(zhuān)家知識(shí),對(duì)圖像數(shù)據(jù)集進(jìn)行標(biāo)注,提取形態(tài)學(xué)特征[15]。
綜上,依據(jù)人們對(duì)圖像的遞進(jìn)認(rèn)知,完整的圖像分析理解層別有:1)獲取圖像數(shù)據(jù)的數(shù)據(jù)層(灰度圖等),主要針對(duì)像素操作;2)提取特征的描述層,將像素表示形式化;3)以有一定強(qiáng)度的知識(shí)作為支撐的認(rèn)知層以及應(yīng)用層,得益于計(jì)算機(jī)技術(shù),人們對(duì)醫(yī)學(xué)圖像的解釋終將克服人工解釋的有限、主觀、差異和疲勞等缺憾[16]。
科學(xué)證明人們通過(guò)視覺(jué)獲得的信息占總信息的70%以上,醫(yī)學(xué)圖像以其百聞不如一見(jiàn)的優(yōu)勢(shì)在現(xiàn)代醫(yī)學(xué)中起著越來(lái)越重要的作用。在影像大數(shù)據(jù)條件下,基于醫(yī)學(xué)圖像數(shù)據(jù)的巨量性、高維性、挖掘及融合特征,人們將拓寬知識(shí)信息獲取的途徑、增加信息推理的多樣性,改進(jìn)數(shù)據(jù)生成的隨機(jī)性和物理求解的病態(tài)性。在數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)算法基礎(chǔ)上精確檢測(cè)解剖標(biāo)記[17],正確提取圖像特征。不斷豐富知識(shí)領(lǐng)域,將復(fù)雜的感知和概念處理用于圖像分析的基礎(chǔ)上,將圖像像素轉(zhuǎn)換成有意義的內(nèi)容,對(duì)醫(yī)生診斷觀察行為進(jìn)行建模[18];利用計(jì)算機(jī)視覺(jué)領(lǐng)域的技術(shù)選擇——深度卷積網(wǎng)絡(luò)[19],進(jìn)行更多隱含層的信息分層處理,構(gòu)筑穩(wěn)固的計(jì)算機(jī)視覺(jué)能力;充分利用深度學(xué)習(xí)開(kāi)創(chuàng)圖像重建的革新模式[20]??傊诓粩嘭S富圖像模態(tài)的同時(shí)也提高圖像顯示的精確性,最終將促進(jìn)醫(yī)學(xué)圖像與目標(biāo)物之間的精準(zhǔn)映射。