張詩雨 綜述 段 華 審校
(首都醫(yī)科大學(xué)附屬北京婦產(chǎn)醫(yī)院 北京婦幼保健院婦科微創(chuàng)中心,北京 100006)
子宮內(nèi)膜癌為女性生殖系統(tǒng)三大惡性腫瘤之一,發(fā)病率在全球范圍內(nèi)呈持續(xù)上升趨勢[1,2],早期診斷可能降低死亡率,提高無病生存率,故此,亟待確立高效的篩查途徑來實現(xiàn)子宮內(nèi)膜癌的早期診斷[3]。部分指南認(rèn)為經(jīng)陰道超聲檢查(transvaginal ultrasound,TVS)可以作為子宮內(nèi)膜癌的一線影像學(xué)檢查[4~6],但其特異度較低,并且有一定的操作者主觀評判以及儀器誤差。對于子宮內(nèi)膜癌篩查取樣方式,多數(shù)指南推薦門診一次性子宮內(nèi)膜取樣器和細(xì)胞學(xué)制片[3]。不能單獨將經(jīng)陰道超聲檢查用于對子宮內(nèi)膜癌的篩查,需結(jié)合子宮內(nèi)膜微量組織病理檢查或子宮內(nèi)膜細(xì)胞學(xué)檢查[7]。
人工智能作為計算機科學(xué)的一個分支,經(jīng)歷了感知器數(shù)學(xué)模型,反向傳播(back propagation,BP)算法,正迎來第三次發(fā)展高潮——深度學(xué)習(xí)[8,9]。人工智能系統(tǒng)逐漸應(yīng)用于醫(yī)學(xué)領(lǐng)域,尤其在疾病的篩查及診斷方面表現(xiàn)突出[10~12]。本文對人工智能在子宮內(nèi)膜癌篩查工作中的研究進(jìn)展進(jìn)行綜述,旨在為人工智能輔助決策系統(tǒng)應(yīng)用于子宮內(nèi)膜癌篩查提供參考。
將子宮內(nèi)膜癌發(fā)病風(fēng)險人群分為低、中、高風(fēng)險的風(fēng)險預(yù)測模型有助于制定個體化的癌癥預(yù)防策略[13]。但繁雜的臨床數(shù)據(jù)以及各種主觀因素導(dǎo)致預(yù)測模型難以建立,所創(chuàng)模型的準(zhǔn)確度有待商榷。多項研究將人工智能技術(shù)應(yīng)用于發(fā)病風(fēng)險人群分類,通過搜集人群信息數(shù)據(jù)創(chuàng)建的多種數(shù)據(jù)模型可以協(xié)助進(jìn)行風(fēng)險預(yù)測,提出干預(yù)措施來降低子宮內(nèi)膜癌風(fēng)險,如飲食和運動改變、孕激素或抗雌激素治療、胰島素降低治療和定期的子宮內(nèi)膜活檢[14]。Hüsing等[15]使用歐洲癌癥和營養(yǎng)前瞻性調(diào)查隊列(EPIC)201 811名女性(大多數(shù)年齡30~65歲)數(shù)據(jù)建立子宮內(nèi)膜癌預(yù)測模型,包括子宮內(nèi)膜癌855例(0.4%),曲線下面積(area under the curve,AUC)為0.77。Pfeiffer等[16]使用前列腺癌、肺癌、結(jié)直腸癌和卵巢癌篩查試驗(PLCO)和美國國立衛(wèi)生研究院AARP飲食與健康研究(NIH-AARP)146 679名50歲以上女性的數(shù)據(jù)建立子宮內(nèi)膜癌預(yù)測模型,其中子宮內(nèi)膜癌1559例(1.1%),使用護(hù)士健康研究隊列進(jìn)行驗證,AUC為0.68。Har等[14]使用PLCO試驗78 215名女性的數(shù)據(jù),其中961例(1.2%)入組5年內(nèi)發(fā)生子宮內(nèi)膜癌,建立機器學(xué)習(xí)模型用于子宮內(nèi)膜癌篩查,測試AUC為0.96。進(jìn)一步將機器學(xué)習(xí)模型與15名臨床醫(yī)生(包括婦科腫瘤學(xué)專家和初級保健醫(yī)生)對100名女性進(jìn)行子宮內(nèi)膜癌風(fēng)險分層進(jìn)行比較,在識別高于平均風(fēng)險女性方面,隨機森林模型比臨床醫(yī)生好2.5倍,神經(jīng)網(wǎng)絡(luò)模型比臨床醫(yī)生好2倍。Wang等[17]回顧1922例子宮內(nèi)膜活檢、診刮或子宮切除術(shù)資料,其中良性1552例,子宮內(nèi)膜癌370例,結(jié)合3種最佳機器學(xué)習(xí)方法,即邏輯回歸、梯度提升決策樹和隨機森林,建立模型,并在1個內(nèi)部驗證隊列和2個外部驗證隊列中進(jìn)行驗證,結(jié)果顯示,總子宮內(nèi)膜癌預(yù)測的AUC分別為0.9346、0.8341和0.8649,Ⅰ期子宮內(nèi)膜癌預(yù)測的AUC分別為0.9347、0.8073和0.871。
針對不同的風(fēng)險群體,建議采用不同的篩查和輔助治療策略。篩查風(fēng)險分層對于個體化治療非常重要,基于一定數(shù)量的子宮內(nèi)膜癌臨床數(shù)據(jù)所構(gòu)建的人工智能決策系統(tǒng)可以以較高的準(zhǔn)確率進(jìn)行人群篩查,以期對子宮內(nèi)膜癌做到早發(fā)現(xiàn)、早診斷。
子宮內(nèi)膜細(xì)胞學(xué)檢查是目前臨床上使用較廣泛的子宮內(nèi)膜癌篩查方法之一,具有操作簡易、能夠在門診完成、并發(fā)癥風(fēng)險較低、標(biāo)本合格對于內(nèi)膜厚度的要求較低等優(yōu)勢[18]。Li等[19]建立自動識別和診斷子宮內(nèi)膜細(xì)胞團(tuán)病理圖像的人工智能系統(tǒng),使用113個子宮內(nèi)膜樣本(惡性42個,良性71個)構(gòu)建包括15 913個圖像的數(shù)據(jù)集,用細(xì)胞神經(jīng)網(wǎng)絡(luò)捕捉子宮內(nèi)膜細(xì)胞團(tuán)的特征,構(gòu)建以DenseNet201為骨架的DL模型對良惡性細(xì)胞群落進(jìn)行分類。使用經(jīng)過訓(xùn)練的U-Net從15 913張圖像中提取出39 000個子宮內(nèi)膜細(xì)胞團(tuán)圖片,其中26 880個為訓(xùn)練集,11 520個為測試集,其余300個良性和300個惡性圖片為驗證集,測試集準(zhǔn)確率93.5%,特異性92.2%,敏感性92.0%。該系統(tǒng)可顯著提高醫(yī)生的工作效率,適用于大規(guī)模開展篩查和診斷工作。
Pouliakis等[20]建立基于細(xì)胞核區(qū)分子宮內(nèi)膜良惡性疾病的人工篩查系統(tǒng),納入222份經(jīng)組織學(xué)證實的液體細(xì)胞學(xué)涂片(良性117例,惡性62例,增生伴或不伴異型43例),共收集22 783個細(xì)胞核,其中50%為訓(xùn)練集,用于構(gòu)建分類回歸樹(classification and regression trees,CART)模型,剩余50%為測試集,其準(zhǔn)確率85%,特異性90.68%,敏感性72.05%。該系統(tǒng)突出了子宮內(nèi)膜細(xì)胞核形態(tài)的診斷特征,為子宮內(nèi)膜癌的篩查提供了新的思路及方法。
不同于子宮內(nèi)膜細(xì)胞學(xué)檢查,子宮內(nèi)膜微量組織病理檢查所取得的標(biāo)本量更多,準(zhǔn)確率更高,但其對子宮內(nèi)膜厚度的要求也更高,取材不足可致假陰性[21]。Pergialiotis等[22]回顧178例絕經(jīng)后女性的子宮內(nèi)膜診刮病理結(jié)果,包括106例惡性,72例正常,使用人工神經(jīng)網(wǎng)絡(luò)的總準(zhǔn)確率高達(dá)85.4%,敏感度為86.8%,特異度為83.3%,使用分類回歸樹分別為77.5%、78.3%和76.4%,使用回歸分析僅為72.5%、76.4%和66.7%。
子宮內(nèi)膜癌的分子分型包括DNA聚合酶ε(DNA polymerase epsilon,POLE)突變型、微衛(wèi)星不穩(wěn)定高突變型(microsatellite instability-high,MSI-H)、低拷貝數(shù)變化型(copy number variation-low,CNV-L)和高拷貝數(shù)變化型(copy number variation-high,CNV-H),可能成為個體化治療的目標(biāo)[23,24],確定分子亞型和單基因突變可以補充和完善組織學(xué)分類,但這些信息的可用性受到測序時間和成本的限制。人工智能有可能根據(jù)組織病理學(xué)圖像預(yù)測子宮內(nèi)膜癌的分子分型,有助于風(fēng)險分層和個性化管理。Hong等[25]使用癌癥基因組圖譜(TCGA)和臨床蛋白質(zhì)組腫瘤分析聯(lián)盟(CPTAC)的福爾馬林固定石蠟包埋HE染色玻片,共納入456例496張玻片,并注釋亞型和基因突變信息,形成TCGA-CPTAC混合數(shù)據(jù)集,隨機分為訓(xùn)練集、驗證集和測試集,以此為基礎(chǔ)開發(fā)多分辨率深度卷積神經(jīng)網(wǎng)絡(luò)模型Panoptes,其中最佳結(jié)構(gòu)模型對子宮內(nèi)膜樣和漿液性組織學(xué)亞型進(jìn)行分類的AUC為0.969,對分子亞型CNV-H有非常高的精確度(AUC 0.934),還可以準(zhǔn)確識別來自組織學(xué)子宮內(nèi)膜樣癌的CNV-H樣本(AUC 0.958),以及CNV-L(AUC 0.889)、MSI-H(AUC 0.827)、CNV-H標(biāo)志基因TP53突變(AUC 0.873)、PTEN(AUC 0.781)、FAT1(AUC 0.835)和ZFHX3(AUC 0.824),認(rèn)為該模型可幫助病理學(xué)家在無需測序的情況下確定子宮內(nèi)膜癌的分子亞型和突變,具有臨床應(yīng)用潛力。
近年來,人工智能、機器學(xué)習(xí)以及深度學(xué)習(xí)方法在子宮內(nèi)膜癌篩查研究中的應(yīng)用顯示出了徹底改變其篩查和診斷的潛力,人工智能和機器學(xué)習(xí)技術(shù)在婦科腫瘤中的潛在優(yōu)勢可以大大提高癌癥診斷的準(zhǔn)確性和有效性,減少診斷延誤,并可能消除不必要的侵入性手術(shù)操作。結(jié)合發(fā)病風(fēng)險人群分類、子宮內(nèi)膜微量組織病理檢查、子宮內(nèi)膜細(xì)胞學(xué)檢查的人工智能篩查技術(shù),可提高子宮內(nèi)膜癌篩查的簡便性和可接受性,簡化子宮內(nèi)膜癌篩查流程,提高國內(nèi)子宮內(nèi)膜癌篩查診斷的效率和質(zhì)量,助力人工智能在婦產(chǎn)科學(xué)的推進(jìn)。作為數(shù)據(jù)驅(qū)動的科學(xué),人工智能為發(fā)展充滿精準(zhǔn)腫瘤學(xué)機遇的健康系統(tǒng)鋪平了一條充滿希望的道路。