鄧 楊,包 驥
(四川大學華西醫(yī)院病理研究室,四川 成都 610041)
數字病理中計算機輔助診斷研究展望
鄧 楊,包 驥
(四川大學華西醫(yī)院病理研究室,四川 成都 610041)
隨著數字病理切片掃描儀的出現,病理切片圖像信息能夠通過全玻片數字掃描(Whole slide imaging, WSI)技術實現全數字化。WSI首先可以通過計算機網絡開展病理遠程會診,但更重要的是可以和計算機強大的計算能力結合開展計算機輔助診斷(computer-aided diagnosis,CAD)。病理圖像的全數字化起步較晚,數字病理圖像CAD目前在全球范圍內還只處于實驗室研究階段,但已是數字病理發(fā)展的方向和目標。隨著與人工智能、大數據與云技術的結合,數字病理CAD研發(fā)將迎來快速發(fā)展期。本文將著重討論CAD在未來數字病理臨床應用中的發(fā)展階段和研究方向。
全玻片數字掃描;計算機輔助診斷;數字病理
病理以疾病病變?yōu)榍腥朦c,是對疾病病因、發(fā)病機制、臨床表現等全方位研究的醫(yī)學學科。病理診斷是腫瘤診斷的“金標準”,病理醫(yī)生被稱為“醫(yī)生中的醫(yī)生”,病理科診斷水平決定了醫(yī)院診療水平[1]。但是近百年來,臨床病理學家所用的技術并沒有實質性的改變, 在傳統(tǒng)病理診斷模式中,病理醫(yī)生借助顯微鏡觀察玻璃病理切片上的細胞學和組織學病變確定疾病類型,閱片效率低;同時病理圖像信息被保存在玻璃切片上,無法與計算機與網絡技術結合,造成信息傳遞困難,信息處理方式受限,病理學科發(fā)展緩慢。但隨著人們對于醫(yī)療保健的要求越來越高,對提高病理診斷準確率和診斷效率的需求越來越迫切[2]。
近年來興起的數字病理(Digital pathology,DP)是指將計算機和網絡應用于病理學領域,它的核心技術是全玻片數字掃描技術(Whole slide imaging, WSI)。WSI一種現代數字系統(tǒng)與傳統(tǒng)光學放大裝置有機結合的技術,它是通過全自動顯微鏡掃描采集得到高分辨數字圖像,再應用計算機對得到的圖像自動進行高精度多視野無縫隙拼接和處理,獲得優(yōu)質的全玻片病理圖像數據,形成數字切片或虛擬切片,可以應用于病理學的各個領域[3]。WSI為病理學家突破了傳統(tǒng)顯微鏡的限制,不僅可以通過網絡傳輸進行遠程病理會診,更關鍵的是可以與不斷發(fā)展的計算機人工智能,大數據與云技術結合,開發(fā)計算機輔助診斷系統(tǒng)(computer-aided diagnosis,CAD),推動病理診斷智能化,將病理醫(yī)生從高強度、低效率、職業(yè)傷害大的傳統(tǒng)顯微鏡工作環(huán)境中解放出來。
數字病理圖像CAD雖然在全球范圍內還只處于實驗室研究階段,但已是數字病理發(fā)展的目標。不同于傳統(tǒng)玻片上的病理圖像,數字化后的WSI病理圖像的形狀、大小和顏色信息等都是量化,可用于圖像檢索,模式識別,計算機學習和深度學習,建立CAD數學模型,提取出相應的量化特征或是識別特定的感興趣區(qū)域(region of interest, ROI)[4]。而這些通過CAD所得到的量化特征或區(qū)域,可以為病理學家最后的診斷提供參考意見和理論依據,提高診斷準的確率、效率和可重復性。
根據數字病理CAD的開發(fā)難度和實現臨床應用的時間,可以大致分為四個階段:基礎圖像測量與文獻輔助、圖像識別和定量分析、數字化診斷新指標、大數據個性化診斷分析。
基礎圖像測量與文獻輔助是CAD的最基本功能,也將是計算機技術應用于數字病理的最初階段,目前相關功能已經基本實現并且被廣泛地應用于病理學研究與教學。
1.1基礎圖像測量基礎圖像測量包括對WSI上病理圖像進行測距、測面積、旋轉、特殊結構測量、多圖同屏瀏覽及對比、截圖追蹤等,可以為病理醫(yī)生診斷提供初步幫助。
1.2文獻輔助當我們使用WSI成功的實現了病理切片的數字化之后,數字化的切片就成為了數字文獻的一部分,利用計算機可以存儲、檢索以及使用它們。在使用WSI查看病理圖像時,可以通過計算機搜索現有文獻中的相似圖像、信息,將它們進行對比,從而輔助病理醫(yī)生快速做出診斷。
2.1圖像識別圖像識別是指利用圖像分析技術對WSI中的特定圖像特征信息進行處理,并從中提取出有意義的信息[5]。現有的圖像識別方法,可分為監(jiān)督和非監(jiān)督兩類。監(jiān)督圖像檢索,是指通過人工貼標的方法,進行病理圖像檢索,實現計算機輔助診斷。目前,這種方法已經被許多研究人員采用,并已經開發(fā)了各種監(jiān)督圖像識別方法,如分類、分割、感興趣的區(qū)域(region of interest, ROI)檢測和注釋等[6]。然而,監(jiān)督的圖像檢索方法由于需要人工貼標,相當的費時和費力。所以我們有理由認為,一個快速和高效的圖像檢索的方法應該是非監(jiān)督和基于內容的。用基于內容的圖像檢索方法,可以通過尋找WSI中相似區(qū)域的特征信息,在未標記的數據庫搜索并返回與查詢圖像相似的圖像,來幫助診斷一個未知的病理圖像。例如,北航病理研究室和麥克奧迪公司就提出了一種非監(jiān)督,準確,快速的乳腺組織圖像檢索方法:該方法提出了細胞核形態(tài)和分布的局部統(tǒng)計特征,并采用Gabor特征描述紋理信息,潛在狄利克雷分布(Latent Dirichlet Allocation)模型用于高層語義挖掘,使用位置敏感散列加速搜索。研究表明使用這種方法進行乳腺組織圖像檢索,準確度能達到90%以上[6]?,F在人工智能技術的興起,模糊模式識別方法和神經網絡學習等人工智能的方法已經在WSI病理圖像中被使用,不僅可以對WSI圖像進行判斷,如識別圖像是否是某種特定的細胞、組織,或是判斷腫瘤良惡性等,還可以對WSI圖像進行定義,如提取相關感興趣區(qū)域、辨別相關疾病類型等。
2.2定量分析在圖像識別的基礎上,計算機還可以對WSI病理圖像中的ROI區(qū)域進行定量分析。由計算機得出定量分析結論,不僅效率高、準確度高,同時可重復性高,為學術研究、教學培訓乃至質量控制等提供強大技術保證。
在圖像識別和定量分析的基礎上,計算機可以對病理圖像的形態(tài)特征進行深度挖掘,產生診斷新指標。這些新的指標可能是人眼不易觀察,或者不易總結的,無法判斷它們與病情、預后之間的聯系,但通過計算機技術,可以挖掘出它們和病情發(fā)展及預后之間的關系,進而能夠在一定程度上作為診斷的依據。斯坦福大學的Yu等報道,選擇2186個HE染色肺癌組織芯片圖像(TCGA),其中包括肺腺癌、肺鱗狀細胞癌及鄰近良性組織,從這些圖像中提取客觀形態(tài)信息,輔助以相關的病理學注釋和臨床信息,再用機器學習的方法進行診斷分級來預測其預后,結果提示這些自動提取圖像的特征可以預測肺癌患者的預后,并且這種方法可以擴展到其他器官的組織病理學圖像[7]。另外,哈佛大學醫(yī)學院的Beck等用來自荷蘭癌癥研究所(NKI)的248例和溫哥華綜合醫(yī)院(VGH)的328例乳腺癌患者病理圖像為基礎,選取了總共671張(NKI)和615張(VGH)乳腺癌WSI用來分析。用他們自主開發(fā)的一個組合通路系統(tǒng)來測量來自乳腺癌上皮和基質中的大量的圖像特征(6642個特征),構建一個基于圖像特征的預后模型來預測患者的5年生存率。最后得出11個與預后相關最密切特征,其中8個來自上皮細胞而3個來自基質,而這3個基質的特征與5年生存率的相關性比模型中上皮特征的相關性更強。這些發(fā)現表明了基質形態(tài)結構是一個以前未發(fā)現的乳腺癌預后決定因素[8]。
在病理學形成數字化之后,我們就可以整合病理學與其他臨床數據資源(包括影像信息、患者臨床信息、患者預后情況等),形成醫(yī)學大數據庫。這個醫(yī)學大數據形成后,在遇到個體病例時,就可以結合此數據庫中的文獻經驗,由計算機輔助自動給出參考診斷,為臨床提供治療方案建議與預后概率分析,類似IBM公司的Watson系統(tǒng)。
德克薩斯大學的騰訊AI研究室 (Tencent AI Lab),研究出了一種基于WSI圖像的生存預測方法WSISA (Whole Slide Histopathological Images Survival Analysis)[9]。該方法是將WSI圖像特征與患者的預后情況相結合,綜合分析WSI以及患者的相關信息,使用深度卷積生存模型(Deep Conv Surv Molde) 對已有的數據集進行訓練,最后得到可以基于WSI進行患者的生存預測的模型。WSISA就是數字病理結合其他醫(yī)學大數據信息(患者預后信息)的產物,它是首個基于WSI、無注釋的生存預測模型,解決了小樣本訓練生存模型的問題、腫瘤異質性造成的預測偏差、患者整體信息的捕捉等關鍵性問題,大大提高了生存預測模型的性能,展現出了十分可觀的臨床應用前景。
在數字病理CAD發(fā)展中,病理醫(yī)生作為一個專業(yè)的、關鍵的決策人,扮演著最核心的角色。病理學家有了解和熟悉數字病理和WSI使用技術的義務和責任,特別是對其適應癥和局限性的了解,從而充分利用這些工具來提高診斷質量[10]。首先,病理醫(yī)生是CAD問題和需求的提出者。CAD需要輔助哪些東西,其判斷的方法、量化的標準,ROI選擇的標準等,都需要從病理醫(yī)生專業(yè)的角度提出。其次,病理醫(yī)生也是CAD研發(fā)的參與者。計算機專家需要與病理醫(yī)生緊密協(xié)同工作,根據病理專家對組織圖像的標注開發(fā)更有效地針對不同病理組織結構的檢測、分割、特征提取的算法,提高WSI圖像的分析效率。第三,病理醫(yī)生還是研究結果的判定者,可以從病理專業(yè)的角度來分析CAD得到的結果,準確率、效率如何,怎樣對臨床產生幫助,需要如何改進等。最后,病理醫(yī)生更是CAD成果轉化的使用者,決定了CAD如何更好的應用于病理學,并且隨著數字病理大數據和認知計算的結合,產生表型組學,之后與放射組學,基因組學的數據融合從而形成真正的現代病理,更好的為精準醫(yī)療服務。
多項研究表明,使用WSI進行病理診斷,和用傳統(tǒng)顯微鏡診斷相比,其結果的一致率都在90%以上[11~13]。隨著,WSI逐步替代傳統(tǒng)顯微鏡用于日常病理診斷,CAD技術也將跟隨進入病理醫(yī)生的日常工作,這將對病理學的發(fā)展帶來革命性的改變和突破。目前,人工智能與醫(yī)療影像的結合正在發(fā)生,2015年,奧多明尼昂大學和北卡羅來納大學提出利用深度學習分割腦MR圖像的方法[14];2016年,Google發(fā)布一項學術報告,稱人工智能糖網病診斷精度可用于臨床[15];2017年,斯坦福大學在Nature上發(fā)布一項研究報告,表明人工智能皮膚癌診斷精度已達專家水平[16]。作為醫(yī)療領域“金標準”的病理圖像,隨著WSI技術的出現,人工智能與病理圖像的結合也已初現端倪,成為未來病理學的發(fā)展方向。2017年07月20日,國務院發(fā)布了《新一代人工智能發(fā)展規(guī)劃》,2017年衛(wèi)計委也出臺了《人工智能輔助診斷技術管理規(guī)范(2017年版)》,國家政策的支持,病理學科發(fā)展的強烈需求,結合我國在病理數據方面的先天優(yōu)勢,以及我國計算機行業(yè)的高速發(fā)展,我們有理由相信,隨著數字病理圖像大數據積累,人工智能技術的興起,未來計算機將能夠自動檢測數字切片中的病變區(qū)域并定量評估各項指標,幫助病理醫(yī)生做出快速、準確、重復性高的病理診斷,引領病理學走向人工智能時代。
[1] Kumar, Vinay.Robbins and Cotran pathologic basis of disease[M].Elsevier Saunders, 2005.
[2] Montalto MC.An industry perspective:An update on the adoption of whole slide imaging[J].Journal of Pathology Informatics, 2016, 7(1):18.
[3] Gurcan MN, Boucheron L, Can A, et al.Histopathological Image Analysis:A Review[J].IEEE Reviews in Biomedical Engineering, 2009, 2:147-171.
[4] Lloyd MC, Johnson JO, Kasprzak A, et al.Image analysis of the tumor microenvironment[M]// Systems Biology of Tumor Microenvironment.Springer International Publishing, 2016.
[5] Serra J.Image analysis and mathematical morphology" [M].Academic Press, 1982.
[6] Ma Y, Jiang Z, Zhang H, et al.Breast histopathological image retrieval based on latent dirichlet allocation[J].IEEE Journal of Biomedical & Health Informatics, 2016, PP(99):1.
[7] Yu KH, Zhang C, Berry GJ, et al.Predicting non-small cell lung cancer prognosis by fully automated microscopic pathology image features[J].Nature Communications, 2016, 7:12474.
[8] Beck AH, Sangoi AR, Leung S, et al.Systematic analysis of breast cancer morphology uncovers stromal features associated with survival[J].Science Translational Medicine, 2011, 3(108):108ra113.
[9] Zhu XL, Yao JW, Zhu FY, et al.WSISA:Making survival prediction from whole slide pathology images[C].IEEE CVPR,2017.
[10]Cheng CL, Tan PH.Digital pathology in the diagnostic setting:beyond technology into best practice and service management[J].Journal of Clinical Pathology, 2017, 70(5):454-457.
[11]Melike P, Pinar US, Yelda O, et al.Pitfalls in the use of whole slide imaging for the diagnosis of central nervous system tumors:A pilot study in surgical neuropathology[J].Journal of Pathology Informatics, 2016, 7(1):25.
[12]Goacher E, Randell R, Williams B, et al.The diagnostic concordance of whole slide imaging and light microscopy:a systematic review[J].Archives of Pathology & Laboratory Medicine, 2017, 141(1):151-161.
[13]Onega T, Weaver D, Geller B, et al.Digitized whole slides for breast pathology interpretation:current practices and perceptions[J].Journal of Digital Imaging, 2014, 27(5):642-648.
[14]Zhang W, Li R, Deng H, et al.Deep convolutional neural networks for multi-modality isointense infant brain image segmentation.[J].Neuroimage, 2015, 108:214-224.
[15]Gulshan V, Peng L, Coram M, et al.Development and validation of a deep learning algorithm for detection of diabetic retinopathy in retinal fundus photographs[J].Jama, 2016, 316(22):2402-2410.
[16]Esteva A, Kuprel B, Novoa RA, et al.Dermatologist-level classification of skin cancer with deep neural networks[J].Nature, 2017, 542(7639):115-118.
Theresearchprospectincomputer-aideddiagnosisofdigitalpathology
DENGYang,BAOJi
(LaboratoryofPathology,WestChinaHospital,SichuanUniversity,Chengdu610041,China)
BAOJi
With the appearance of digital pathological slice scanners, the image information of glass pathological slices can be fully digitized through whole slide imaging (WSI) technology.WSI can be firstly used for remote pathological consultation through computer network.More importantly, WSI can be carried out for computer-aided diagnosis (CAD) by combination with the powerful calculating power of the computer.The full digitization of the pathological images starts relatively late.The CAD of digital pathology is currently only at the laboratory research stage on a global scale, but it is the direction and goal of digital pathology development.With the combination of artificial intelligence, large data and cloud technology, digital pathology CAD research and development will usher in a rapid period.This article will discuss the developmental stages and research directions of CAD of digital pathology in future clinical applications.
Whole slide imaging;Computer-aided diagnosis;Digital pathology
包驥,男,博士,副研究員,碩士研究生導師。主要研究方向:數字病理。
R446.8
A
1672-6170(2017)05-0010-03
2017-07-31)