周蕾, 彭俊紅, 胡浩, 阮學(xué)廣, 周利華
近年來,前列腺癌(prostate cancer,PCa) 的患病率在世界范圍內(nèi)已居男性惡性腫瘤第2位,在男性癌癥中的病死率居第6位,而在我國人群中其發(fā)病率和病死率也呈上升趨勢[1]。MRI是診斷前列腺癌的最佳影像學(xué)手段,但目前常規(guī)MRI序列對早期PCa的診斷仍有局限性,單指數(shù)模型DWI能夠無創(chuàng)反映活體內(nèi)水分子的擴(kuò)散特征,有效提高PCa的診斷準(zhǔn)確性,但活體內(nèi)組織信號并不隨b值呈單指數(shù)衰減,因此DWI并不能真實(shí)反映體素內(nèi)水分子的真實(shí)擴(kuò)散特征,在鑒別前列腺良惡性病變時仍存在部分重疊。體素內(nèi)不相干運(yùn)動(intravoxel Incoherent Motion,IVIM)擴(kuò)散加權(quán)成像可在不注射對比劑的情況下定量評估并區(qū)分組織分子真性擴(kuò)散和微循環(huán)灌注的假性擴(kuò)散信息,能更準(zhǔn)確地反映病變組織的病理生理學(xué)變化,近年來IVIM成像已成為鑒別病變良惡性的研究熱點(diǎn),國內(nèi)外已有研究報道IVIM成像中的真性分子擴(kuò)散系數(shù)(molecular diffusion coefficient,D)值在鑒別診斷前列腺癌中有重要價值[2],但對其準(zhǔn)確性的報道尚不多。筆者通過Meta分析系統(tǒng)性分析目前關(guān)于IVIM中D值診斷PCa的研究,從而對D值的診斷效能做出綜合、客觀的評價。
檢索的數(shù)據(jù)庫有PubMed、Embase、中國知網(wǎng)、萬方和維普數(shù)據(jù)庫。英文檢索詞為(“intravoxel incoherent motion”or “biexponential” or “IVIM”)and(“prostate”);中文檢索詞為 (“體素內(nèi)不相干運(yùn)動” 或“IVIM”或“雙指數(shù)模型”)和(“前列腺”)。檢索時間均從建庫截止至2018 年11月。為盡量查全文獻(xiàn),采用網(wǎng)上檢索和手動檢索相結(jié)合的方式,并對納入文獻(xiàn)的參考文獻(xiàn)進(jìn)行二次檢索。
文獻(xiàn)納入標(biāo)準(zhǔn):①研究類型。公開發(fā)表的IVIM-DWI診斷前列腺癌的應(yīng)用研究,限中英文。②研究對象。擬診前列腺病變,應(yīng)用IVIM-DWI檢查診斷前列腺癌的研究,病例總數(shù)≥ 30例。③金標(biāo)準(zhǔn)。穿刺活檢或手術(shù)切除病理確診。④可以直接或間接提取四格表數(shù)據(jù)包括真陽性值(true positive,TP)、假陽性值(false positive,F(xiàn)P)、假陰性值(false negative,F(xiàn)N) 、真陰性值(true negative,TN)或敏感度(sensitivity,Se)、特異度(specificity,Sp)及D值等指標(biāo)。
文獻(xiàn)排除標(biāo)準(zhǔn):①重復(fù)發(fā)表的文獻(xiàn)(保留數(shù)據(jù)最全最新的文獻(xiàn));② 綜述、評述、病例報告及文摘類研究;③ 動物試驗(yàn)。
由2位高年資醫(yī)師/技師獨(dú)立進(jìn)行文獻(xiàn)篩選和資料提取,并交叉核對,如遇分歧通過討論協(xié)商達(dá)成一致。提取的資料主要包括第一作者、發(fā)表時間、研究類型、設(shè)備類型、b值個數(shù)及數(shù)值、掃描層厚、樣本量、D值、診斷閾值及各項(xiàng)研究入選病例的惡性率(癌灶數(shù)/總病灶數(shù))等信息,提取的四格表數(shù)據(jù)信息包括TP、FP、FN、TN等指標(biāo)。
按照Cochrane協(xié)作網(wǎng)推薦的診斷準(zhǔn)確性研究質(zhì)量評價(Quality Assessment of Diagnostic Accuracy Study,QUADAS)工具[3]由3位評價員獨(dú)立評價納入文獻(xiàn)的質(zhì)量,對14個評價條目做出“是”(低度偏倚或適用性好) 、“否”(高度偏倚或適用性差) 或“不清楚”(缺乏相關(guān)信息或偏倚情況不確定)的判斷,滿足“是”的條目≥10條的納入文獻(xiàn)被視為質(zhì)量較高的文獻(xiàn)。
采用Meta-Disc1.4和Stata14.0軟件進(jìn)行統(tǒng)計學(xué)分析。通過Stata14.0軟件以標(biāo)準(zhǔn)化均數(shù)差(standardized mean differences,SMD)比較PCa與良性病變的D值差異;采用Cochran-Q檢驗(yàn)及I2值進(jìn)行異質(zhì)性檢驗(yàn),若I2<50% 可認(rèn)為研究結(jié)果間有較低異質(zhì)性,采用固定效應(yīng)模型合并SMD、Se、Sp、陽性似然比(positive likelihood ratio ,LR+)、陰性似然比(negative likelihood ratio,LR-)、診斷比值比(diagnostic odds ratio,DOR)等效應(yīng)量,匯總受試者工作特征曲線(summary receiver operating characteristic curve,SROC)的曲線下面積(area under the curve ,AUC);若I2≥50% 則提示存在高度異質(zhì)性,采用隨機(jī)效應(yīng)模型合并效應(yīng)量。通過Spearman相關(guān)系數(shù)檢驗(yàn)有無閾值效應(yīng)(Spearman相關(guān)系數(shù)呈高度正相關(guān)且P<0.05即提示存在閾值效應(yīng))引起的異質(zhì)性。若存在高度異質(zhì)性則進(jìn)一步進(jìn)行亞組及回歸分析探討異質(zhì)性來源。采用Egger'檢驗(yàn)分析D值的發(fā)表偏倚,采用Deeks'漏斗圖檢驗(yàn)分析D值診斷效能的發(fā)表偏倚,若P<0.05則提示存在明顯發(fā)表偏倚。
表1 納入研究的基本特征
表2 納入文獻(xiàn)的D值的基本診斷參數(shù)及診斷閾值
表3 診斷性試驗(yàn)質(zhì)量評價標(biāo)準(zhǔn)QUADAS工具評價匯總(篇)
通過初步檢索獲得可能相關(guān)的文獻(xiàn)78篇,經(jīng)過閱讀標(biāo)題、摘要及全文逐層嚴(yán)格篩選排除,最終納入13篇文獻(xiàn)[4-16],其中英文2篇,中文11篇。共納入研究的患者835例,病灶945個;前列腺癌組患者402例,病灶438個;良性病變組患者433例,病灶507個。納入研究的基本特征及診斷參數(shù)見表1、2。
按照診斷試驗(yàn)的設(shè)計特征,主要評價標(biāo)準(zhǔn)共計14項(xiàng)(表3)。共計3篇文獻(xiàn)滿足14條評價標(biāo)準(zhǔn),6篇滿足13條標(biāo)準(zhǔn),4篇滿足12條標(biāo)準(zhǔn),提示納入的13篇文獻(xiàn)均具有較高質(zhì)量。
對納入的13篇文獻(xiàn)采用Egger'檢驗(yàn)分析D值的發(fā)表偏倚(圖1),采用Deeks'漏斗圖檢驗(yàn)D值診斷效能的發(fā)表偏倚(圖2),結(jié)果顯示P值分別為0.12和0.40(均>0.05),提示本研究納入的文獻(xiàn)結(jié)果不存在明顯的發(fā)表偏倚。
圖4 敏感度森林圖。 圖5 特異度森林圖。 圖6 D值診斷效能的SROC曲線圖。
表4 亞組分析及回歸分析
以SMD為效應(yīng)量進(jìn)行異質(zhì)性檢驗(yàn)I2=65.7%,提示存在明顯異質(zhì)性,選用隨機(jī)效應(yīng)模型合并SMD,森林圖(圖3)結(jié)果顯示合并后的SMD為-2.09(95%CI:-2.37~-1.80)(P<0.01)。以DOR為效應(yīng)量進(jìn)行異質(zhì)性檢驗(yàn)I2=52.7%(P=0.01),表明異質(zhì)性較大,采用隨機(jī)效應(yīng)模型合并各效應(yīng)量,合并后的Se、Sp、LR+、LR-、DOR分別為0.91(95%CI:0.88~ 0.94)、0.84(95%CI:0.80~0.87)、5.35 (95%CI:3.56~8.05)、0.12(95%CI:0.08~0.20)、63.83(95%CI:30.67~132.85),匯總SROC曲線下面積為0.95(圖4~6)。
閾值效應(yīng)分析結(jié)果顯示D值診斷前列腺癌的Spearman 相關(guān)系數(shù)為0.48,P=0.09>0.05,表明各項(xiàng)研究不存在明顯閾值效應(yīng),提示D值診斷閾值不是異質(zhì)性的主要來源。為探討異質(zhì)性來源,根據(jù)研究特點(diǎn),分別對最大b值(≤1000 s/mm2、>1000 s/mm2)、b值個數(shù)(<10個、≥10個)、設(shè)備類型(3.0T、1.5T)、惡性率(<50%、≥50%)、層厚(≤4 mm、>4 mm)、研究類型(前瞻性、回顧性)進(jìn)行Meta亞組及回歸分析,結(jié)果顯示敏感度在惡性率和研究類型方面差異有統(tǒng)計學(xué)意義(P<0.05),特異度在最大b值、b值個數(shù)和研究類型方面差異有統(tǒng)計學(xué)意義(P<0.05,表4)。
前列腺癌是男性常見的惡性腫瘤之一,許多患者確診時就已發(fā)生周圍組織侵犯或遠(yuǎn)處轉(zhuǎn)移,預(yù)后較差,早發(fā)現(xiàn)、早診斷及早治療是提高PCa患者生活質(zhì)量及改善預(yù)后的關(guān)鍵。IVIM擴(kuò)散加權(quán)成像是在DWI基礎(chǔ)上發(fā)展起來的,由Le Bihan等[17]于1986 年首次提出,采用4個及以上b值通過雙指數(shù)模型擬合可獲得IVIM擴(kuò)散加權(quán)成像相關(guān)參數(shù),包括真實(shí)擴(kuò)散系數(shù)D值、灌注相關(guān)擴(kuò)散系數(shù)(perfusion-related diffusion coefficient,D*)及灌注分?jǐn)?shù)(perfusion fraction,f)。D值反映活體內(nèi)單純的水分子擴(kuò)散運(yùn)動;D*值反映毛細(xì)血管血流灌注效應(yīng)造成的假性擴(kuò)散信息,與微循環(huán)血流速度、平均毛細(xì)血管長度相關(guān);f值反映的是組織微循環(huán)灌注占整體擴(kuò)散效應(yīng)的容積百分比,與組織微循環(huán)的血容量相關(guān)。
前列腺癌細(xì)胞增殖快且排列緊密,細(xì)胞外間隙窄,水分子擴(kuò)散明顯受限。國內(nèi)外研究表明前列腺癌D值較前列腺良性病變明顯減低,差異有統(tǒng)計學(xué)意義,但D*值、f值在前列腺癌與良性病變之間的差異有無統(tǒng)計學(xué)意義尚無定論[2],目前國內(nèi)外關(guān)于D值診斷PCa準(zhǔn)確性方面的研究報道尚不足,且大部分研究的樣本量較小,結(jié)果間存在一定程度的差異性。筆者通過Meta分析有效增大樣本量,減少隨機(jī)誤差,并通過對同類研究的多個獨(dú)立研究結(jié)果進(jìn)行系統(tǒng)性分析,更客觀系統(tǒng)地評價以D值為診斷標(biāo)準(zhǔn)時IVIM對國人PCa的診斷價值。
本研究結(jié)果顯示合并后的PCa組與良性病變組D值的SMD為-2.09(95%CI:-2.37~-1.80)(P<0.01),表明PCa組D值低于良性病變組,差異有統(tǒng)計學(xué)意義,與國內(nèi)相關(guān)研究結(jié)果一致[4-16]。合并后的Se、Sp分別為0.91和0.84,均較高,表明D值能很好地篩查并鑒別出PCa患者。陽性似然比表明診斷試驗(yàn)出現(xiàn)真陽性結(jié)果與假陽性結(jié)果的比值,值越大,說明診斷價值越高;陰性似然比表明診斷試驗(yàn)出現(xiàn)假陰性結(jié)果與真陰性結(jié)果的比值,值越小,說明診斷價值越高。本研究合并后的LR+、LR-分別為5.35和0.12,均提示D值對PCa的診斷價值較高。DOR表明檢查患者出現(xiàn)陽性結(jié)果與陰性結(jié)果的比值,合并后的DOR值為63.83,證實(shí)了D值擁有較高的病變檢出率。AUC是綜合評價診斷試驗(yàn)診斷準(zhǔn)確性的最佳指標(biāo),通常AUC值在0.7~0.9及0.9以上提示具有較高診斷價值和極高診斷價值,本研究合并后的AUC為0.95,進(jìn)一步提示D值在診斷PCa上有極高的診斷價值。劉佳琦等[18]的大數(shù)據(jù)Meta分析結(jié)果顯示傳統(tǒng)的功能成像DWI、MRS診斷中國人群PCa的AUC分別為0.90、0.93,可見D值的綜合診斷效能高于DWI及MRS,表明D值具有重要的臨床推廣應(yīng)用價值。
本研究納入的13篇文獻(xiàn)均滿足最少12條以上評價標(biāo)準(zhǔn),表明納入該研究的文獻(xiàn)質(zhì)量較高,提示研究結(jié)果的可靠度高。診斷準(zhǔn)確性的異質(zhì)性分析顯示I2值為52.7%,提示各項(xiàng)研究異質(zhì)性較大,而Spearman相關(guān)檢驗(yàn)結(jié)果顯示不存在明顯閾值效應(yīng)造成的異質(zhì)性。通過對最大b值、b值個數(shù)、設(shè)備類型、惡性率、層厚、研究類型等因素進(jìn)行Meta亞組分析,結(jié)果顯示敏感度在惡性率和研究類型方面差異有統(tǒng)計學(xué)意義(P<0.05),提示最大b值、b值個數(shù)、掃描層厚等掃描參數(shù)及設(shè)備類型對診斷敏感度均無明顯影響,而惡性率不同的主要原因在于納入的研究來自不同地區(qū)及不同級別的醫(yī)院,入選患者在構(gòu)成比上存在不可避免的差異。特異度在最大b值、b值個數(shù)和研究類型方面差異有統(tǒng)計學(xué)意義(P<0.05),提示最大b值、b值個數(shù)均是D值診斷PCa特異度的重要影響因素,從亞組分析結(jié)果可以看出掃描條件中最大b值>1000 s/mm2和b值個數(shù)≥10個的亞組特異度高達(dá)0.89,且亞組間差異有統(tǒng)計學(xué)意義(P<0.01),多項(xiàng)研究結(jié)果表明采用≥10個b值和最大b值>1000 s/mm2掃描時特異度可達(dá)0.95以上[6,8,16]。b值是IVIM 的重要掃描參數(shù),目前b 值的選擇還沒有統(tǒng)一標(biāo)準(zhǔn),仍在探索中,這也是IVIM技術(shù)今后研究的熱點(diǎn)方向之一。研究類型對敏感度和特異度均有影響,筆者認(rèn)為主要原因在于回顧性研究在病例的選擇上存在一定程度的偏倚。Egger'檢驗(yàn)和Deeks'漏斗圖檢驗(yàn)結(jié)果顯示納入的各項(xiàng)研究的D值和診斷準(zhǔn)確性均不存在明顯發(fā)表偏倚,表明納入的13篇文獻(xiàn)研究結(jié)果的可信度較高。
本研究納入的13篇文獻(xiàn)以回顧性研究(11篇)為主,僅2篇為前瞻性研究,且研究的樣本人群均為國人,存在一定的偏倚;本次納入的研究不包含未公開發(fā)表的文獻(xiàn)和正在研究的資料,存在一定的偏倚。本次納入的研究采用的D值診斷閾值雖然無明顯閾值效應(yīng),但仍存在一定程度的差異,而非統(tǒng)一診斷標(biāo)準(zhǔn),有待進(jìn)一步研究。
綜上所述,IVIM-DWI檢查PCa組D值低于良性病變組,差異有統(tǒng)計學(xué)意義;以D值為診斷閾值鑒別診斷PCa的敏感度和特異度均較高,D值具有極高的診斷效能,可以作為無創(chuàng)性篩查PCa患者的有效指標(biāo)用于臨床推廣。而最大b值和b值個數(shù)是影響診斷準(zhǔn)確性的重要因素,目前尚無統(tǒng)一標(biāo)準(zhǔn),這也是今后研究的方向之一。