国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

DICOM標(biāo)準(zhǔn)在醫(yī)學(xué)CT圖像語義自動標(biāo)注中的應(yīng)用構(gòu)想

2012-10-24 09:25:38張騰
關(guān)鍵詞:分詞本體語義

張騰

(北方民族大學(xué)計算機(jī)學(xué)院 寧夏銀川 750021)

DICOM標(biāo)準(zhǔn)在醫(yī)學(xué)CT圖像語義自動標(biāo)注中的應(yīng)用構(gòu)想

張騰

(北方民族大學(xué)計算機(jī)學(xué)院 寧夏銀川 750021)

如今醫(yī)學(xué) CT圖像的標(biāo)注還處于人工標(biāo)注和半人工標(biāo)注,使用的技術(shù)與其他圖像的標(biāo)注技術(shù)一樣,都是從圖像特征入手,對圖像的紋理、顏色、外形等信息進(jìn)行處理,之后進(jìn)行標(biāo)注,面對一些失真圖像無法進(jìn)行準(zhǔn)確的標(biāo)注。為解決這個問題,本文提出了結(jié)合DICOM標(biāo)準(zhǔn)對醫(yī)學(xué)CT圖像進(jìn)行語義標(biāo)注,并在一定程度上實現(xiàn)語義自動標(biāo)注。

DICOM;CT圖像;本體;語義標(biāo)注;自動標(biāo)注

一、引言

隨著計算機(jī)技術(shù)和數(shù)字成像技術(shù)的發(fā)展,醫(yī)學(xué)信息化也在快速發(fā)展。核磁共振(MRI)、計算機(jī)斷層掃描(CT)、超聲成像(US)等醫(yī)學(xué)成像技術(shù)也在逐步走向成熟,由這些技術(shù)所生成的 DICOM圖像不僅為醫(yī)生診斷病例提供了重要的診斷依據(jù),而且可以進(jìn)行遠(yuǎn)程傳輸,面對疑難雜癥醫(yī)生不僅可以利用自身醫(yī)院的醫(yī)學(xué)資料,還可以通過網(wǎng)絡(luò)獲取其他醫(yī)院的圖像信息等,從而對病例做出更加準(zhǔn)確的判斷,在一定程度上減少誤診的出現(xiàn)頻率,使患者可以得到有效的治療。影像歸檔與通訊系統(tǒng)(PACS)是對醫(yī)學(xué)圖像信息進(jìn)行數(shù)字化采集、存儲、管理、傳輸和重現(xiàn)的系統(tǒng)。而如何快速有效的尋找到所需圖像資料便成為擺在人們面前的一個新問題。以往的檢索方式是基于關(guān)鍵詞的檢索,如果需要某一種病例的信息,必須將這種病例作為關(guān)鍵詞進(jìn)行檢索,使用簡單且方便,但是所得到的圖像信息比較局限,與其相關(guān)的信息比如并發(fā)癥等無法顯示出。于是醫(yī)學(xué)圖像的語義標(biāo)注由此產(chǎn)生,結(jié)合語義技術(shù)與醫(yī)學(xué)圖像可以更好的實現(xiàn)醫(yī)學(xué)圖像的檢索,使得檢索結(jié)果更加豐富且準(zhǔn)確,對醫(yī)生診斷病例提供了更加準(zhǔn)確的醫(yī)學(xué)資料。

DICOM標(biāo)準(zhǔn)即數(shù)字影像和通信標(biāo)準(zhǔn),在醫(yī)學(xué)影像信息學(xué)的發(fā)展和 PACS的研究過程中,由于醫(yī)療設(shè)備生產(chǎn)廠商的不同,造成與各種設(shè)備有關(guān)的醫(yī)學(xué)圖像存儲格式、傳輸方式千差萬別,使得醫(yī)學(xué)影像及其相關(guān)信息在不同系統(tǒng)、不同應(yīng)用之間的交換受到嚴(yán)重阻礙。為此美國放射學(xué)會(ACR)和全美電子廠商聯(lián)合會(NEMA)認(rèn)識到急需建立一種標(biāo)準(zhǔn),以規(guī)范醫(yī)學(xué)影像及其相關(guān)信息的交換,DICOM標(biāo)準(zhǔn)就是在這樣的背景下產(chǎn)生的。

如今醫(yī)學(xué) CT圖像的語義標(biāo)注仍處于人工標(biāo)注和半人工標(biāo)注階段,所使用技術(shù)與對其他圖像進(jìn)行標(biāo)注的技術(shù)一樣,一般有兩種:①提取圖像視覺信息,從紋理,顏色,外形等方面入手,對圖像信息進(jìn)行加工處理,之后進(jìn)行標(biāo)注;②從圖像的內(nèi)容入手,通過算法對圖像進(jìn)行標(biāo)注。這兩種方法都暴露出一個問題,面對失真圖像無法標(biāo)注。

DICOM文件不僅包含了圖像信息,還包含了患者姓名、時間、地點和病歷信息等后期附加信息。這些附加信息的加工便可對醫(yī)學(xué) CT圖像進(jìn)行準(zhǔn)確標(biāo)注,而且面對失真圖像也不會出現(xiàn)無法標(biāo)注的情況。

二、DICOM標(biāo)準(zhǔn)在醫(yī)學(xué) CT圖像語義自動標(biāo)注中的應(yīng)用構(gòu)想

(一)DICOM標(biāo)準(zhǔn)

DICOM標(biāo)準(zhǔn)從屬于醫(yī)學(xué)信息學(xué)領(lǐng)域。在這個領(lǐng)域內(nèi),它負(fù)責(zé)醫(yī)學(xué)成像設(shè)備之間數(shù)字信息的交換。因為醫(yī)學(xué)成像設(shè)備可以與其他的醫(yī)學(xué)設(shè)備互操作,標(biāo)準(zhǔn)的范圍需要與醫(yī)學(xué)信息學(xué)領(lǐng)域的其他部分重疊,DICOM 3.0由下面九個部分組成:

第一部分:介紹和概述;第二部分:兼容性;第三部分:信息對象定義;第四部分:服務(wù)類規(guī)范;第五部分:數(shù)據(jù)結(jié)構(gòu)和語義學(xué);第六部分:數(shù)據(jù)字典;第七部分:消息交換;第八部分:消息交換的網(wǎng)絡(luò)通訊支持;第九部分:消息交換的點對點通訊支持。各部分關(guān)系描述圖見文末圖1。

(二)dcm4che和dcm4chee

dcm4che是使用Java語言開發(fā)的一個開源類庫,官方網(wǎng)站為 h ttp://www.dcm4che.org/,支持JDK1.4以上。dcm4che的核心是實現(xiàn)了 DICOM 標(biāo)準(zhǔn)的應(yīng)用。dcm4che-1.x中的工具包在世界上許多應(yīng)用產(chǎn)品中得到應(yīng)用,現(xiàn)階段在 dcm4che-2.x在 dcm4che-1.x基礎(chǔ)上重新設(shè)。目前為止,最新的版本為2012年1月24日發(fā)布的dcm4che-2.0.26。由于完全符合DICOM標(biāo)準(zhǔn),所以就其本身而言對于學(xué)習(xí) DICOM標(biāo)準(zhǔn)的研究人員來說學(xué)習(xí)dcm4che也是學(xué)習(xí)DICOM標(biāo)準(zhǔn)的一個方法。

dcm4chee使用的是 J2EE架構(gòu),基于 JBoss服務(wù)器,提供了一系列的臨床應(yīng)用,主要有兩種用處,一種是用于 DICOM圖片的存儲管理;另一種是結(jié)合OsiriX,K-PACS,ClearCanvas,Ginkgo CADx等查看器形成一個圖片存檔通信系統(tǒng),也就是 dcm4cheePACS,這個系統(tǒng)開源,支持多平臺,免費且是企業(yè)級的 PACS服務(wù)器,支持 DICOM和 HL7協(xié)議,可在 dcm4 chee PACS上輕松管理上 T級別的數(shù)據(jù)(1 TB=1000 GB=1000,000 MB=1000,000,000 KB)。

③查詢報銷憑證。對于一些財務(wù)檔案管理規(guī)范、賬目清楚的村莊,如果機(jī)井建設(shè)時間確定,可以通過查詢報銷憑證的方法獲得機(jī)井設(shè)備型號。

在dcm4che2中包含了一系列的連接dcm4chee和存儲器的方法,還提供了一些處理 DICOM對象的方法,比如 dcm2txt,dcm2xml,dcmdir,jpg2dcm,pdf2dcm,txt2dcm,xml2dcm等等。其中 dcm2xml是在設(shè)想中需要用到的一個方法。

(三)語義標(biāo)注

在了解語義標(biāo)注之前,首先需要明確提出語義標(biāo)注的目的在哪,語義標(biāo)注的最終目的就是智能化,讓計算機(jī)知道操作者的目的,之后對應(yīng)目的使用本體和推理作出正確的反饋,其中的本體原本是一個哲學(xué)理論中的概念,用于描述事物本質(zhì),現(xiàn)在作為信息抽象和知識描述的工具被計算機(jī)領(lǐng)域采用,本體的構(gòu)建需要領(lǐng)域?qū)<遗c計算機(jī)人員合作完成。本體構(gòu)建的基礎(chǔ)是領(lǐng)域概念的抽象表示和描述,以及領(lǐng)域中概念的層次描述和潛在的關(guān)系及公理,在構(gòu)建本體的過程中一般不會考慮實例,因為在一個領(lǐng)域中實例往往很多而且動態(tài)性比較強(qiáng),不可能描述所有的實例,所以只有當(dāng)本體和實例結(jié)合時才有意義,找到實例中的對應(yīng)的領(lǐng)域本體,構(gòu)建映射實例與本體的映射關(guān)系,這就是語義標(biāo)注,在語義層面上指出資源的特征,比如,圖書館里給書分類可以視為語義標(biāo)注,它使用本體(分類法)為資源(書)賦予語義特征(分類號),為博客文章添標(biāo)簽也可以視為語義標(biāo)注,它使用本體(已有標(biāo)簽集合)為資源(文章)賦予語義特征(標(biāo)簽),語義標(biāo)注的結(jié)果是語義元數(shù)據(jù),如一本書的分類號是什么,一篇文章的標(biāo)簽是什么都是語義元數(shù)據(jù),可以用于檢索,owl是本體表示語言。

語義標(biāo)注的方法一般有兩種,第一種是人工標(biāo)注,將標(biāo)注信息手工標(biāo)注到需標(biāo)注的事物上,建立標(biāo)注信息與需標(biāo)注事物之間的聯(lián)系,這種方法標(biāo)注準(zhǔn)確率最高,除非出現(xiàn)人為差錯,不然不會出現(xiàn)問題;第二種方法是自動標(biāo)注,通過算法,模型,機(jī)器學(xué)習(xí)等一系列的方法將信息標(biāo)注到需標(biāo)注事物上,建立標(biāo)注信息與需標(biāo)注事物間聯(lián)系,自動標(biāo)注相較于人工標(biāo)注準(zhǔn)確率上有所下降,但排除了人為差錯,且節(jié)省人力資源,減少資源浪費,自動標(biāo)注已成為時下研究的重點。語義標(biāo)注工具如SHOE Knowledge Annotator,Annotea,SMPRE,Yawas,Melita,GATE等,有很多。

(四)基于 DICOM標(biāo)準(zhǔn)的醫(yī)學(xué) CT圖像語義自動標(biāo)注實現(xiàn)方法構(gòu)想

1.本體構(gòu)建

本體作為共享的概念模型的形式化的規(guī)范說明,它反映的是某一個領(lǐng)域的概念層次描述和潛在的關(guān)系及公理,在構(gòu)建本體的過程中一般不會考慮到實例,因為在一個領(lǐng)域中實例往往很多且動態(tài)多變,不能能描述出所有的實例。

本體構(gòu)建工具很多,Ontolingua Server、Ontosaurus、WebOnto、Protégé-2000、OntoEdit、WebODE、OILEd和DUET都比較著名,其中 Protégé是斯坦福大學(xué)基于 Java語言開發(fā)的本體編輯和知識獲取軟件,屬于開放源代碼軟件,主要用于語義網(wǎng)中本體的構(gòu)建,是語義網(wǎng)中本體構(gòu)建的核心開發(fā)工具軟件,由于其優(yōu)秀的設(shè)計和眾多的插件,已經(jīng)成為目前最廣泛使用的本體編輯軟件之一,相較于其他的本體構(gòu)建工具而言,Protégé最大的好處是支持中文,且插件很多,所以使用的越來越廣泛。

醫(yī)學(xué) CT圖像本體構(gòu)建方法很多,下面介紹兩種劃分方法,第一種是按照 CT的檢查范圍來進(jìn)行劃分,分為頭部、胸部、腹部、脊柱和四肢。其中頭部疾病又分為頭骨類、腦類等;胸部可分為肺部病和骨類;腹部可分為結(jié)石類和腫瘤、出血、炎癥等;脊柱四肢可分為骨類、結(jié)核、腫瘤等。第二種按照所屬病變來進(jìn)行劃分,分為炎癥、腫瘤、骨類、出血、外傷、結(jié)核、結(jié)石等。炎癥中有腦部炎癥、胸部炎癥和腹部炎癥等。腫瘤分為腦部腫瘤、胸部腫瘤和腹部腫瘤等。骨類分為腦部骨類、胸部骨類、腹部骨類、脊柱和四肢骨類。出血分為腦部出血、胸部出血和腹部出血等;外傷分為腦部外傷、腹部外傷、脊柱四肢外傷等。結(jié)核分為肺結(jié)核、脊柱四肢結(jié)核病等;結(jié)石分為膽結(jié)石、泌尿系統(tǒng)結(jié)石等。

按照這兩種劃分方法可以構(gòu)建出這些概念之間的層次關(guān)系和潛在的關(guān)系等,之后再使用 Protégé軟件進(jìn)行本體的構(gòu)建。

2.工具的編寫及工具目的

對醫(yī)學(xué) CT圖像進(jìn)行語義自動標(biāo)注時首先需要讀取到 DICOM圖像中的文本信息,所以需要編寫一款可以對DICOM圖像進(jìn)行編輯的軟件,可以實現(xiàn) DICOM圖像的顯示以及圖像內(nèi)部文本信息讀取及修改。除此之外,還需要自動生成 XML文檔,文檔具有對專業(yè)詞匯的標(biāo)注信息。

由于有 dcm4che這個開源的 Java類庫,所以使用Java相對于其他語言在編寫工具軟件是會有很大的優(yōu)勢。在 dcm4che類庫中有許多方法可以調(diào)用,比如dcm2txt,dcm2xml,dcmdir等等,可以通過這些方法來實現(xiàn)所需要的功能。

3.對文本信息的處理

在讀取到 DICOM圖像中的文本信息之后,需要對文本信息進(jìn)行處理得到專業(yè)詞匯,而如何得到專業(yè)詞匯便成為自動標(biāo)注的一個關(guān)鍵問題。對于這種問題一般會使用中文分詞算法,傳統(tǒng)的中文分詞算法有很多,比如機(jī)械分詞法(基于字符串匹配的分詞法),基于理解的分詞法,基于語義的分詞法和基于統(tǒng)計的分詞法。而與Java結(jié)合比較緊密的是庖丁解牛分詞器,庖丁系統(tǒng)是個完全基于 lucene的中文分詞系統(tǒng),庖丁解牛分詞器有一個很明顯的缺點,在分詞時無法根據(jù)語境來進(jìn)行分詞,可能會出現(xiàn)分詞錯誤,比如對“發(fā)展社區(qū)老年活動場所和服務(wù)設(shè)施”進(jìn)行分詞,有可能會將“和服”分解出來,根據(jù)語境這兩個字完全沒有意義。DICOM圖片中的文本信息十分專業(yè),觀察一段CT診斷報告:“左側(cè)基底節(jié)區(qū)見不規(guī)則片狀低密度影,右側(cè)內(nèi)囊前肢小片狀低密度影,腦室系統(tǒng)未見明顯異常,腦溝裂顯示清晰,中線結(jié)構(gòu)無移位”,由此可見,CT診斷中的用語十分專業(yè),語義確定,且簡單無修辭,所以當(dāng)使用庖丁解牛分詞器對其進(jìn)行分詞時,在一定程度上會減少上述情況的發(fā)生。

4.專業(yè)詞匯的標(biāo)注

使用分詞器對 DICOM圖像中的文本信息處理完之后就會得到一個個的專業(yè)詞匯,之后的工作便是對專業(yè)詞匯進(jìn)行標(biāo)注,使之與對應(yīng)本體建立聯(lián)系。

可擴(kuò)展標(biāo)記語言(Extensible Markup Language,XML),用于標(biāo)記電子文件使其具有結(jié)構(gòu)性的標(biāo)記語言,可以用來標(biāo)記數(shù)據(jù)、定義數(shù)據(jù)類型,是一種允許用戶對自己的標(biāo)記語言進(jìn)行定義的源語言。在工具軟件編寫階段還會編寫出自動生成 XML文檔的功能部件,這個部件的主要功能就是對專業(yè)詞匯進(jìn)行自動的語義標(biāo)注,并生成 XML文檔,在文檔中有語義標(biāo)注信息。當(dāng)分解出的專業(yè)詞匯與本體名完全一致時,會自動生成相應(yīng)的 XML文檔,而當(dāng)專業(yè)詞匯與本體名不完全一致時,會進(jìn)行語義相似度計算,通過算法將相似度最高的本體標(biāo)注到專業(yè)詞匯上,并生成 XML文檔,當(dāng)然這種情況會降低標(biāo)注的準(zhǔn)確率,最好的解決辦法就是在本體構(gòu)建階段將所有本體構(gòu)建出來。

三、結(jié)束語

通過本文的分析,我們會發(fā)現(xiàn)醫(yī)學(xué) CT圖像的語義自動標(biāo)注是可行的,而且不僅 CT圖像,任何 DICOM圖像的語義自動標(biāo)注都是可行的,惟一的影響因素就是本體的構(gòu)建,若想自動標(biāo)注任何 DICOM圖像就需要在本體構(gòu)建階段將所有的醫(yī)學(xué)概念、概念之間的層次關(guān)系、隱含關(guān)系以及公理構(gòu)建出來,這個工程十分龐大,不是單獨個人可以完成的,但是可以預(yù)想的是這個本體庫可以構(gòu)建完成,醫(yī)學(xué)圖像的語義標(biāo)注會向前邁進(jìn)一大步,再加上語義檢索技術(shù),往后醫(yī)生看病時出現(xiàn)誤診的幾率會大大降低,這對與人類的健康事業(yè)無異于是一個巨大的貢獻(xiàn)。

[1]H Lilian Tang,Rudolf Hanka,Horace H S. Histological Image Retrieval Based on Semantic Content Analysis[J]. IEEE Transactions on information technology in biomedicine,2003(l).

[2]Hong SHAO,Ji-Wu ZHANG, Wen-cheng CUI,etal.Automatic Feature Weight Assignment Based Genetic Algorithm for Image Retrieval[C]. IEEE International Conference on Robotics,Intelligent Systems and Signal Processing,2003,P731-735(ISTP收錄000189506600128).

[3]W. Wei,P. M. Barnaghi. Semantic support for medical image search and retrieval. Proceedings of the Fifth IASTED International Conference on Biomedical Engineering. Anaheim,CA,USA:ACTA Press,2007,P315-319.

[4]Xiaohang,Ma.Semantics Modeling based Image Retrieval System Using Neural Networks[C]∥IEEE Conf. Image Processing,2005(1),P1165-1168.

[5]向前.基于本體的圖像檢索系統(tǒng)[博士學(xué)位論文].北京交通大學(xué),2008.

[6]盧漢清,劉靜.基于圖學(xué)習(xí)的自動圖像標(biāo)注.計算機(jī)學(xué)報,2008(9),P1629-1639

[7]韋娜,耿國華,周明全.基于相關(guān)反饋的文物圖像語義標(biāo)注[J].西北大學(xué)學(xué)報,2008,P387-390.

[8]王梅,周向東,施伯樂,et a1.基于擴(kuò)展生成語言模型的圖像自動標(biāo)注方法[J].軟件學(xué)報,2008(9),P2449-2460.

張騰(1988-),男,山西省垣曲縣人,北方民族大學(xué)計算機(jī)科學(xué)與工程學(xué)院計算機(jī)應(yīng)用技術(shù)專業(yè)碩士。

2012-03-11

猜你喜歡
分詞本體語義
Abstracts and Key Words
對姜夔自度曲音樂本體的現(xiàn)代解讀
語言與語義
結(jié)巴分詞在詞云中的應(yīng)用
智富時代(2019年6期)2019-07-24 10:33:16
值得重視的分詞的特殊用法
“上”與“下”語義的不對稱性及其認(rèn)知闡釋
《我應(yīng)該感到自豪才對》的本體性教學(xué)內(nèi)容及啟示
認(rèn)知范疇模糊與語義模糊
Care about the virtue moral education
卷宗(2013年6期)2013-10-21 21:07:52
高考分詞作狀語考點歸納與疑難解析
晋州市| 义马市| 天水市| 泗洪县| 文化| 潞西市| 湖南省| 扎兰屯市| 得荣县| 繁昌县| 从江县| 永清县| 汝阳县| 温泉县| 德兴市| 北海市| 白银市| 班玛县| 化德县| 鞍山市| 高阳县| 玛多县| 华宁县| 新晃| 水富县| 涟源市| 凌海市| 乌恰县| 永顺县| 涿鹿县| 荔波县| 江西省| 贵州省| 绥滨县| 五家渠市| 察雅县| 芷江| 专栏| 民丰县| 贡觉县| 永川市|