陳 豪,過華蕾,王文慧,尹曉娜,龔儀棠,金 晨,李 兢
(杭州市婦產(chǎn)科醫(yī)院病理科,浙江 杭州 310000)
宮頸鱗狀細胞癌(squamous cell carcinoma of cervix,SCC)是最常見的婦科惡性腫瘤之一。據(jù)世界衛(wèi)生組織國際癌癥研究署(IARC)發(fā)布的2020 年全球最新癌癥負擔數(shù)據(jù)顯示[1],2020 年全球新增宮頸癌60 萬,新增宮頸癌死亡34 萬例,發(fā)病人數(shù)和死亡人數(shù)在女性癌癥中均位居第4。而我國每年約有14萬例宮頸癌的新發(fā)病例,每年大約有2 萬婦女死于宮頸癌;從宮頸癌前病變發(fā)展到嚴重的浸潤癌通常需要數(shù)年時間(一般是8~10 年),對早期宮頸癌進行治療的難度相對較小,費用也較低[2]。因此,早期宮頸癌的及時檢出具有重要臨床意義。近10 年來,隨著計算機技術的快速發(fā)展和數(shù)字病理的產(chǎn)生,人工智能(artificical intelligence,AI)技術在宮頸癌的細胞學篩查方面取得不少成績[3-6],但在組織學切片的應用方面還有待完善和開拓[7,8]。本研究結合數(shù)字病理切片和AI 技術,用AI 對高級別鱗狀上皮內病變(HSIL)、微小浸潤性鱗狀細胞癌(早期癌)及浸潤性宮頸鱗癌(浸潤癌)這三類鱗狀上皮病變進行識別判讀,并對其診斷結果進行統(tǒng)計分析,旨在分析AI 技術在宮頸組織學切片輔助診斷的應用價值。
1.1 樣本來源 收集杭州市婦產(chǎn)科醫(yī)院2016 年1月-2020 年12 月宮頸鱗狀上皮病變患者113 例的組織學切片。患者中位年齡45 歲,組織學切片包括宮頸活檢、錐切及腫瘤根治標本,病理診斷結論均由2 名中級以上病理醫(yī)師閱片復核。
1.2 方法 采用麥克奧迪數(shù)字切片掃描與應用系統(tǒng)(型號:KF-PRO-005)對所選組織學切片進行40 倍分辨率數(shù)字掃描。數(shù)字掃描后導入浙江賽爾微因公司的人工智能圖像分析系統(tǒng)(CellVigen v11.0),由高年資中級以上病理診斷醫(yī)師對組織學切片的掃描片進行標注,見圖1。標注的內容包括:①宮頸癌前病變即高級別鱗狀上皮內病變,含累腺;②宮頸早期癌(微小浸潤性鱗狀細胞癌,包括出芽、迷芽兩種浸潤方式,不包括融合浸潤方式);③浸潤性宮頸鱗癌組織(浸潤癌);④纖維間質成分(病變成分比對作用,有利于AI 更好的識別病變)。113 例全數(shù)字掃描切片內標注宮頸癌前病變307 幅,早期癌441 幅,浸潤癌390 幅,纖維間質成分100 幅,標定線顏色分別選擇紅色、黃色、綠色、白色(圖2A、2B)。標注完成后,標注圖片數(shù)按訓練集∶驗證集∶測試集=6∶2∶2 進行分配,見表1。用AI 對訓練集圖片進行學習并建立相應的AI 組織學數(shù)據(jù)庫模型。用模型對驗證集三類宮頸鱗狀上皮病變圖片進行判讀,將通過AI 分析的結果與病理醫(yī)師的判讀結果進行對比(圖2C、2D)。以病理診斷結果為標準,評估通過訓練集建立的數(shù)據(jù)庫驗證的準確性。通過訓練集建立的數(shù)據(jù)庫模型以驗證的準確性>90%具有臨床意義,80%~90%相對具有臨床意義,<80%為無臨床意義。再用模型對測試集宮頸鱗狀上皮病變圖片進行判讀,將AI 分析的結果與病理醫(yī)師的判讀結果進行相關性分析。
表1 三類宮頸鱗狀上皮病變標注圖片數(shù)分配表(標記圖片數(shù))
圖1 宮頸鱗狀上皮病變組織學切片HE 染色圖
圖2 病理醫(yī)師與AI 在人工智能圖像分析系統(tǒng)中分別對宮頸病變的判讀
1.3 統(tǒng)計學方法 采用SPSS 19.0 統(tǒng)計軟件對驗證樣本的診斷結果的例數(shù)進行統(tǒng)計分析,計數(shù)資料使用(n)和(%)表示,組間比較采用χ2檢驗,以P<0.05 為差異有統(tǒng)計學意義。
2.1 AI 數(shù)據(jù)庫驗證集判讀結果 通過訓練集建立的AI 數(shù)據(jù)庫模型判讀驗證集癌前病變、早期癌及浸潤癌圖片與病理醫(yī)師診斷結果符合率分別為86.70%、92.00%、92.00%,癌前病變具有相對臨床意義,早期癌與浸潤癌具有臨床意義,見表2。
表2 AI 數(shù)據(jù)庫驗證集與病理結果標記圖片數(shù)符合情況(n)
2.2 AI 數(shù)據(jù)庫測試集效果 使用AI 數(shù)據(jù)庫對測試集宮頸上皮內病變圖片進行判讀。AI 將61 張癌前病變圖像3 張診斷為早期癌,4 張診斷為浸潤癌,診斷符合率88.50%(54/61);88 張早期癌圖像4 張診斷為癌前病變,1 張為浸潤癌,符合率94.30%(83/88);78 張浸潤癌圖像2 張被診斷為癌前病變,3 張為早期癌,符合率93.60%(73/78)。AI 技術診斷結果與病理診斷醫(yī)師的診斷結果比較,差異有統(tǒng)計學意義(χ2=354.700,P<0.05)。
表3 測試集AI 診斷與病理結果標記圖片數(shù)交叉表(n)
宮頸癌是全世界范圍內女性發(fā)病率和死亡率均排第4 位的惡性腫瘤[9]。我國宮頸癌是第2 大女性惡性腫瘤,發(fā)病率僅次于乳腺癌[10]。而宮頸癌前病變發(fā)展為宮頸癌通常需要數(shù)年時間,因此宮頸癌的早期診斷具有著重要的臨床意義。對宮頸正常組織、癌前病變、早期癌及浸潤癌的正確診斷有助于制定有針對性的治療方案。宮頸癌的早期診斷最有效的方法是宮頸組織病理學檢查,但宮頸組織病理學圖像比較復雜,需要有經(jīng)驗的病理學醫(yī)師進行顯微檢查,還可能出現(xiàn)誤診漏診。我國基層醫(yī)院缺乏全面開展病理檢測與診斷的能力,普遍存在著基礎薄弱、診斷能力較差及病理醫(yī)師的嚴重缺乏的問題[11]。近年來,隨著數(shù)字病理及AI 技術的發(fā)展,AI 在乳腺癌、前列腺癌及宮頸癌等病理診斷方面均取得了一定的進展[12,13]。利用計算機對組織學圖像進行深度學習,輔助病理醫(yī)生對疾病進行診斷可以提高診斷效率與準確性。對于AI 在宮頸癌的應用,目前大多都應用于細胞學的篩查并取得了明顯成效,但在組織學的應用方面仍具有一定的局限性[14,15]。AI 技術在組織學中應用困難的主要原因是宮頸鱗狀細胞癌組織形態(tài)多樣,浸潤方式復雜,浸潤深度的評估需要結合手術方式和切緣情況進行綜合判斷。
本研究驗證集結果證實AI 技術能有效的對宮頸癌前病變、早期癌及浸潤癌組織學圖像進行識別診斷,具有較高的診斷符合率,癌前病變、早期癌及浸潤癌符合率分別為86.70%、92.00%、92.00%。AI技術對癌前病變的識別具有相對臨床意義,對早期癌與浸潤癌的識別具有臨床意義,說明本研究建立的模型可以較準確識別宮頸鱗狀上皮病變組織學圖像。本研究測試集結果證實AI 模型診斷結果與病理醫(yī)師診斷結果比較,差異有統(tǒng)計學意義。證明AI模型能夠較為準確的識別和區(qū)分宮頸癌前病變、早期癌及浸潤癌的組織學圖像,實現(xiàn)對宮頸鱗狀上皮病變組織學病理的輔助診斷。
AI 誤判原因主要為:將高級別鱗狀上皮內病變累腺誤判為早期癌及浸潤癌、早期癌有反常角化誤判為浸潤癌、對迷芽識別困難、非角化型鱗癌誤判為癌前病變及早期癌。宮頸組織病理學圖像相比較于細胞學結構更加復雜,形態(tài)多樣化,同時圖像背景的干擾因素增加,如炎性改變,間質反應性改變,鱗狀細胞化生及制片質量原因等[16]。要提高AI 技術對組織學切片中疾病圖像識別的準確性,需要增加AI 模型數(shù)據(jù)庫對圖像學習數(shù)量,同時需要嚴格把握制片質量[17,18]。雖然AI 診斷準確度有待進一步提高,但其在一定程度上可以幫助病理醫(yī)師,起到很好的輔助診斷作用[19]。隨著臨床病理醫(yī)師參與度的提升和社會研究資本的投入,AI 技術診斷準確性還將不斷提高[20]。
本研究結果證明AI 技術能夠有效的識別宮頸鱗狀上皮病變的組織學圖像,實現(xiàn)對宮頸鱗狀上皮病變的輔助病理診斷。AI 技術能夠提高病理醫(yī)師對宮頸癌前病變的診斷的效率和準確性,幫助更好的實現(xiàn)宮頸癌的早篩早治。AI 技術的成熟和應用將逐漸填補我國基層醫(yī)院病理科醫(yī)師的缺口,具有重要的臨床應用價值。