侯思源,王振霖
(首都醫(yī)科大學(xué)宣武醫(yī)院 耳鼻咽喉頭頸外科顱底外科中心,北京 100053)
垂體腺瘤(pituitary adenoma, PA)是鞍區(qū)常見(jiàn)的良性病變,是繼腦膜瘤和神經(jīng)膠質(zhì)瘤之后第3常見(jiàn)的顱內(nèi)腫瘤,占15%~20%[1-2]。PA可發(fā)生于任何年齡的人群中,發(fā)病率約為(80~90)/10萬(wàn)人,手術(shù)治療是目前最為肯定的根治性治療方法之一。然而,由于不同種類的PA患者具有復(fù)雜多樣的臨床特征,單純使用傳統(tǒng)的生物統(tǒng)計(jì)學(xué)技術(shù)或評(píng)分系統(tǒng)來(lái)對(duì)其診斷、手術(shù)風(fēng)險(xiǎn)或術(shù)后結(jié)果進(jìn)行分層預(yù)測(cè)具有很大的挑戰(zhàn)性。近年來(lái),機(jī)器學(xué)習(xí)作為人工智能的重要研究領(lǐng)域,越來(lái)越多地被應(yīng)用于PA的診斷和治療等方面的研究中。與傳統(tǒng)研究方法不同的是,機(jī)器學(xué)習(xí)可以自動(dòng)篩選變量,捕捉變量之間的非線性關(guān)系,從而提高預(yù)測(cè)能力[3]。本文擬對(duì)機(jī)器學(xué)習(xí)在PA研究中的應(yīng)用作一綜述。
機(jī)器學(xué)習(xí)這一概念最早由計(jì)算機(jī)學(xué)家Arthur Samuel于1959年提出,是計(jì)算機(jī)科學(xué)的一個(gè)分支,依賴于多種計(jì)算機(jī)程序?qū)崿F(xiàn),所采用的常見(jiàn)算法包括支持向量機(jī)、K鄰近算法、樸素貝葉斯、隨機(jī)森林樹(shù)及人工神經(jīng)網(wǎng)絡(luò)等。如今已廣泛應(yīng)用于醫(yī)學(xué)領(lǐng)域中。臨床醫(yī)生利用數(shù)據(jù)進(jìn)行發(fā)掘及分類,進(jìn)而更準(zhǔn)確地對(duì)疾病進(jìn)行診斷、治療及預(yù)后預(yù)測(cè)。根據(jù)學(xué)習(xí)類型的不同,可分為監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)。監(jiān)督學(xué)習(xí)的主要目的為分類和回歸,即通過(guò)對(duì)已進(jìn)行標(biāo)簽分類的訓(xùn)練數(shù)據(jù)學(xué)習(xí),識(shí)別觀察類別,進(jìn)行模型訓(xùn)練,并將訓(xùn)練好的模型應(yīng)用于預(yù)測(cè)新的標(biāo)簽數(shù)據(jù)中。非監(jiān)督機(jī)器學(xué)習(xí)則用來(lái)處理不具有分類標(biāo)簽的數(shù)據(jù),目的在于尋找數(shù)據(jù)之間潛在的規(guī)律[4-5]。除此之外,半監(jiān)督學(xué)習(xí)是監(jiān)督學(xué)習(xí)與非監(jiān)督學(xué)習(xí)的融合,可以分析大量無(wú)標(biāo)簽數(shù)據(jù),同時(shí)用少量的含有分類標(biāo)簽的數(shù)據(jù)增強(qiáng)其識(shí)別能力[6]。近年來(lái),逐漸被應(yīng)用于PA的研究領(lǐng)域,主要涉及PA的影像識(shí)別、手術(shù)并發(fā)癥和預(yù)后預(yù)測(cè)等。
放射組學(xué)是一個(gè)快速發(fā)展的研究領(lǐng)域,即利用數(shù)學(xué)算法在醫(yī)學(xué)圖像中提取定量指標(biāo),不僅可以達(dá)到對(duì)圖像進(jìn)行高級(jí)分析的目的,甚至可以提示腫瘤的基因表達(dá),以協(xié)助臨床進(jìn)行早期的疾病篩查、治療選擇并判斷預(yù)后[7],其有效性已在多種腫瘤中得到了證實(shí),包括預(yù)測(cè)結(jié)直腸癌術(shù)前淋巴結(jié)轉(zhuǎn)移、非小細(xì)胞肺癌的預(yù)后等[8]。放射組學(xué)分析的主要步驟包括圖像的采集與重建、目標(biāo)區(qū)域分割、特征提取與篩選以及模型的建立與驗(yàn)證[7]。對(duì)于PA的影像識(shí)別而言,放射組學(xué)所提取的PA影像特征可分為4類,包括:腫瘤強(qiáng)度特征、腫瘤形狀和大小特征、腫瘤紋理特征和腫瘤小波特征[9]。通過(guò)對(duì)影像學(xué)資料中的信號(hào)進(jìn)行分析,有助于對(duì)腫瘤的性質(zhì)、范圍和侵襲性等進(jìn)行更加準(zhǔn)確的判斷。 Niu等[10]于PA患者T1WI加權(quán)像中共提取了65個(gè)定量成像特征,經(jīng)過(guò)Lasso回歸及支持向量機(jī)模型的構(gòu)建,可于術(shù)前有效地判斷PA對(duì)海綿竇區(qū)域的侵襲性,并以Knosp分級(jí)體現(xiàn)。 Wang等[11]收集了105例經(jīng)病理診斷為PA的患者和100例經(jīng)病理診斷為Rathke囊腫的患者,通過(guò)提取MRI中的特征,分別利用4種機(jī)器學(xué)習(xí)的算法建立了用于術(shù)前區(qū)分PA和Rathke囊腫的模型。作者發(fā)現(xiàn)其中人工神經(jīng)網(wǎng)絡(luò)模型的性能最佳,其準(zhǔn)確率、敏感性和特異性分別為76.7%、73.9%、80.0%,曲線下面積(area under the curve,AUC)為0.848。Zhao等[12]則進(jìn)一步基于術(shù)前影像學(xué)特征聯(lián)合血液學(xué)指標(biāo),建立了鑒別垂體囊實(shí)性腺瘤與顱咽管瘤的模型,決策曲線分析顯示這一模型獲得了滿意的鑒別診斷效果,有助于術(shù)前對(duì)疾病進(jìn)行準(zhǔn)確的臨床診斷。由此提示放射組學(xué)使得術(shù)前對(duì)PA的影像識(shí)別成為了可能,甚至可以幫助術(shù)者在術(shù)前區(qū)分腫瘤的類型,了解侵襲情況,還可提示PA的亞型和增殖情況。Zhang等[9]利用此種方法成功地依靠影像學(xué)資料聯(lián)合臨床特征在術(shù)前區(qū)分了無(wú)功能PA中的零細(xì)胞腺瘤與其他亞型,從而為選擇治療方案提供了參考依據(jù)。Peng等[13]應(yīng)用支持向量機(jī)模型,通過(guò)分析PA患者的MRI圖像,精確地區(qū)分出不同的PA免疫組化亞型之間的差異,結(jié)果顯示,該模型在T2加權(quán)圖像上表現(xiàn)良好,可為神經(jīng)外科醫(yī)生在術(shù)前的臨床決策提供潛在的指導(dǎo)。此外,Ugga等[14]通過(guò)統(tǒng)計(jì)89例接受鼻內(nèi)鏡下PA切除術(shù)的患者,應(yīng)用分析術(shù)前MRI中的紋理衍生參數(shù)及術(shù)后病理結(jié)果,首次提出應(yīng)用放射組學(xué)可有效預(yù)測(cè)垂體大腺瘤的ki-67增殖指數(shù),便于更準(zhǔn)確地在術(shù)前進(jìn)行病變分類,且有助于更集中、更高效地隨訪和長(zhǎng)期管理。值得關(guān)注的是,上述兩項(xiàng)研究均認(rèn)為T2WI序列對(duì)于模型的建立更具價(jià)值。Zeynalova等[15]的研究結(jié)果則進(jìn)一步證實(shí),與單序列模型比較,T2WI加權(quán)圖像更能預(yù)測(cè)垂體大腺瘤的質(zhì)地。在預(yù)測(cè)組織病理學(xué)方面,T2WI加權(quán)圖像似乎比T1WI和T1WI增強(qiáng)圖像包含了更多的鑒別信息。有研究認(rèn)為這可能與腫瘤本身大小、特征有關(guān),其潛在的機(jī)制仍需進(jìn)一步研究和驗(yàn)證。
機(jī)器學(xué)習(xí)在個(gè)性化醫(yī)療中的應(yīng)用日益增多,利用大數(shù)據(jù)集和預(yù)測(cè)模型使臨床醫(yī)生能夠更有信心地診斷、治療和判斷預(yù)后。與傳統(tǒng)統(tǒng)計(jì)學(xué)基于因果假設(shè)的檢驗(yàn)原理不同,機(jī)器學(xué)習(xí)對(duì)于模型的可解釋性關(guān)注較少,重點(diǎn)圍繞算法的交叉驗(yàn)證及迭代改進(jìn),在數(shù)學(xué)上關(guān)注模型的預(yù)測(cè)性能和泛化,能夠發(fā)現(xiàn)變量之間的內(nèi)在聯(lián)系,其復(fù)雜性是傳統(tǒng)模型無(wú)法比擬的[6,16]。建立預(yù)測(cè)模型通常分為4個(gè)階段,包括:提出臨床問(wèn)題、數(shù)據(jù)預(yù)處理、訓(xùn)練模型及模型驗(yàn)證。對(duì)于PA來(lái)講,準(zhǔn)確預(yù)測(cè)術(shù)后不良事件有助于提醒外科醫(yī)生更多地關(guān)注到有可能發(fā)生術(shù)后并發(fā)癥的患者[17]。Hollon等[18]在納入400例PA的回顧性隊(duì)列研究中,利用機(jī)器學(xué)習(xí)方法,建立了預(yù)測(cè)PA術(shù)后出現(xiàn)早期并發(fā)癥的模型,準(zhǔn)確率高達(dá)87%,并篩選出了圍術(shù)期最低和最高血鈉濃度、年齡、體質(zhì)指數(shù)和存在庫(kù)欣病與否等重要變量。
PA術(shù)后低鈉血癥發(fā)生率為2.4%~23%[16,19],可表現(xiàn)為不同程度的頭痛、惡心、嘔吐、精神狀態(tài)改變、癲癇發(fā)作甚至死亡。相關(guān)研究表明,術(shù)后延遲低鈉血癥報(bào)告的發(fā)生率為3.6%~19.8%[20-21]。其多發(fā)生于術(shù)后第7天,使患者再入院率升高或延長(zhǎng)住院時(shí)間。因此,預(yù)測(cè)術(shù)后低鈉血癥的發(fā)生有利于對(duì)重點(diǎn)人群進(jìn)行監(jiān)測(cè)。既往的單中心回顧性研究對(duì)術(shù)后低鈉血癥的影響因素進(jìn)行了探索,提出其危險(xiǎn)因素可能包括術(shù)后腦脊液分流,心臟、腎臟及甲狀腺的基礎(chǔ)疾病等[19]。Cote等[21]則認(rèn)為其發(fā)生可能與年齡、性別、腫瘤大小、血鈉水平及有無(wú)庫(kù)欣病相關(guān)。Patel等[20]進(jìn)一步綜合了多項(xiàng)研究總結(jié)認(rèn)為高齡、女性、庫(kù)欣病、高促甲狀腺激素水平為術(shù)后發(fā)生延遲性低鈉血癥的危險(xiǎn)因素。總體而言,對(duì)于術(shù)后低鈉血癥的發(fā)生,各項(xiàng)研究得出的危險(xiǎn)因素不甚相同,缺乏系統(tǒng)性的預(yù)測(cè)模型。Voglis報(bào)道應(yīng)用機(jī)器學(xué)習(xí)方法建立了術(shù)后低鈉血癥的預(yù)測(cè)模型,最終模型納入了10個(gè)預(yù)測(cè)變量,其中術(shù)前血清催乳素是最重要的預(yù)測(cè)指標(biāo),其次是術(shù)前血清胰島素樣生長(zhǎng)因子1水平、體質(zhì)指數(shù)和術(shù)前血清鈉水平等。這項(xiàng)預(yù)測(cè)模型相比于傳統(tǒng)研究方法考慮到了各個(gè)危險(xiǎn)因素之間的相互作用,能夠更加準(zhǔn)確地預(yù)測(cè)術(shù)后低鈉血癥的發(fā)生[16]。
除低鈉血癥外,術(shù)中腦脊液漏的發(fā)生同樣不可忽視,持續(xù)性的腦脊液漏可導(dǎo)致頭痛、顱內(nèi)感染等。Staartjes等[22]基于深度神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型對(duì)術(shù)后腦脊液漏進(jìn)行預(yù)測(cè),結(jié)果提示鞍上Hardy等級(jí)高、既往手術(shù)史和年齡較大可能是預(yù)測(cè)腦脊液漏的關(guān)鍵因素。Tariciotti則應(yīng)用了5種不同的算法對(duì)238例PA患者術(shù)中腦脊液漏進(jìn)行預(yù)測(cè),其中隨機(jī)森林樹(shù)的預(yù)測(cè)性能優(yōu)于其他模型,研究認(rèn)為重要的預(yù)測(cè)因素有激素水平、年齡、腫瘤直徑、體積、侵襲性、腫瘤橫徑與兩側(cè)海綿竇段頸內(nèi)動(dòng)脈距離的比等[23]。
大多數(shù)研究判斷PA術(shù)后復(fù)發(fā)的依據(jù)是基于PA全切除術(shù)后的隨訪期間復(fù)查的MRI以及術(shù)后恢復(fù)正常的激素水平再次升高。不同PA的復(fù)發(fā)率不同,泌乳素瘤及無(wú)功能腺瘤的復(fù)發(fā)率最高,庫(kù)欣病患者次之[24]。關(guān)于PA的術(shù)后復(fù)發(fā),絕大多數(shù)研究仍舊使用傳統(tǒng)的統(tǒng)計(jì)學(xué)方法來(lái)探索其危險(xiǎn)因素。2018年,Lv等[25]開(kāi)展了一項(xiàng)納入了270例PA患者的單中心研究,進(jìn)行了長(zhǎng)達(dá)10年的隨訪,通過(guò)多因素分析得出腫瘤大小、侵襲性和病理類型是預(yù)測(cè)腫瘤復(fù)發(fā)的重要影響因素。而對(duì)于無(wú)功能腺瘤來(lái)講,患者的年齡、性別、腫瘤大小及侵襲性在一些研究中也被認(rèn)為存在預(yù)測(cè)腫瘤復(fù)發(fā)的價(jià)值[24,26]。為了更加準(zhǔn)確地預(yù)測(cè)患者手術(shù)的預(yù)后結(jié)果,加強(qiáng)重點(diǎn)患者的管理和隨訪,有必要使用更為準(zhǔn)確的方法來(lái)對(duì)PA患者的預(yù)后情況進(jìn)行研究。
目前應(yīng)用于PA預(yù)后預(yù)測(cè)的研究多集中于庫(kù)欣病。Liu等[27]使用了決策樹(shù)、梯度增強(qiáng)決策樹(shù)、極限梯度提升等5種算法對(duì)北京協(xié)和醫(yī)院970例PA患者的術(shù)后復(fù)發(fā)情況進(jìn)行了預(yù)測(cè),其中隨機(jī)森林樹(shù)模型的預(yù)測(cè)性能最好[AUC=0.781,95%CI(0.706, 0.856)],最重要的預(yù)測(cè)變量包括年齡、術(shù)后晨血清皮質(zhì)醇最低點(diǎn)和術(shù)后晨促腎上腺皮質(zhì)激素水平最低點(diǎn)、術(shù)前晨促腎上腺皮質(zhì)激素水平、病程、術(shù)前血清皮質(zhì)醇水平、術(shù)前24 h尿游離皮質(zhì)醇水平和術(shù)后24 h尿游離皮質(zhì)醇水平最低點(diǎn)。Nadezhdina等[28]也采用了人工神經(jīng)網(wǎng)絡(luò)模型對(duì)249例PA患者術(shù)后3年內(nèi)是否復(fù)發(fā)進(jìn)行了預(yù)測(cè),預(yù)測(cè)因素包括年齡、病程、MRI數(shù)據(jù)、術(shù)后晨促腎上腺皮質(zhì)激素和皮質(zhì)醇水平,其AUC為0.912。此外,Zoli等[29]回顧性分析了151例接受內(nèi)鏡經(jīng)鼻蝶入路手術(shù)治療庫(kù)欣病的PA患者,其研究終點(diǎn)結(jié)局為腫瘤徹底切除、術(shù)后緩解和疾病的長(zhǎng)期控制。其使用K鄰近、支持向量機(jī)、梯度提升算法分別建立了預(yù)測(cè)模型,并根據(jù)AUC值調(diào)整算法,結(jié)果認(rèn)為腫瘤大小、侵襲性和促腎上腺皮質(zhì)激素分泌細(xì)胞的組織學(xué)是3個(gè)終點(diǎn)的主要預(yù)測(cè)因素。
在PA患者的預(yù)后方面,Fan通過(guò)對(duì)201例庫(kù)欣病PA術(shù)后患者隨訪,應(yīng)用開(kāi)發(fā)并驗(yàn)證了用于預(yù)測(cè)PA術(shù)后未達(dá)到立即緩解的患者是否會(huì)在長(zhǎng)期隨訪中出現(xiàn)延遲緩解的模型,其AUC值為0.762,研究者認(rèn)為這一模型有助于個(gè)體化治療策略的制定[30]。除庫(kù)欣病外,Qiao等[3]統(tǒng)計(jì)了2010—2018年患有生長(zhǎng)激素型PA的833例患者,使用多種算法建立了預(yù)測(cè)術(shù)后6個(gè)月內(nèi)的內(nèi)分泌緩解模型。這些模型在99例來(lái)自另一院區(qū)的患者和52例來(lái)自第3家機(jī)構(gòu)的患者中進(jìn)行了驗(yàn)證,算法的C統(tǒng)計(jì)量高于傳統(tǒng)算法(P<0.001)。以上研究提示機(jī)器學(xué)習(xí)在PA患者預(yù)后方面可能存在著優(yōu)良的預(yù)測(cè)價(jià)值。
既往的研究顯示機(jī)器學(xué)習(xí)有更強(qiáng)的預(yù)測(cè)能力,目前已被廣泛應(yīng)用于PA的影像學(xué)判讀、術(shù)前評(píng)估、治療方案的制定、并發(fā)癥預(yù)判及術(shù)后緩解或復(fù)發(fā)的預(yù)測(cè)中,但機(jī)器學(xué)習(xí)的過(guò)程易受到數(shù)據(jù)缺失值的影響,結(jié)果往往解釋性較差。另外,由于樣本量、外部驗(yàn)證的限制或缺乏統(tǒng)一的研究標(biāo)準(zhǔn),在一定程度上制約了機(jī)器學(xué)習(xí)在PA診斷及預(yù)后預(yù)測(cè)方面的應(yīng)用。因此,未來(lái)應(yīng)以建立高質(zhì)量多中心的數(shù)據(jù)庫(kù)為目標(biāo),規(guī)范納入及排除標(biāo)準(zhǔn),完善并統(tǒng)一臨床資料數(shù)據(jù),開(kāi)發(fā)更為精準(zhǔn)的預(yù)測(cè)模型并于臨床中進(jìn)一步驗(yàn)證,促進(jìn)PA的規(guī)范化管理及精準(zhǔn)治療。