吳靜云, 米悅, 劉義, 馬帥, 李作峰, 施雅慧, 李俊博, 魏娟, 王霄英
·腹部影像學(xué)·
泌尿系結(jié)石患者手術(shù)方式的選擇:“臨床信息+CT特征”的預(yù)測效能
吳靜云, 米悅, 劉義, 馬帥, 李作峰, 施雅慧, 李俊博, 魏娟, 王霄英
目的探討泌尿系結(jié)石手術(shù)前的臨床信息(癥狀、體征等)和CT報(bào)告與手術(shù)方式的相關(guān)性。方法選取因泌尿系結(jié)石住院治療的患者的病例資料,導(dǎo)出有完整術(shù)前資料的患者文檔,以自然語言處理(NLP)技術(shù)對(duì)文檔進(jìn)行分析,提取加工其中的關(guān)鍵信息,研究術(shù)前關(guān)鍵信息與手術(shù)方式的相關(guān)性。結(jié)果收集連續(xù)患者資料371例,行輸尿鏡碎石術(shù)(URL)患者190例,行經(jīng)皮腎鏡碎石取石術(shù)(PNL)患者142例,行輸尿管軟鏡碎石術(shù)(RIRS)患者39例。利用NLP比較臨床信息、CT報(bào)告與手術(shù)方式的相關(guān)性,單純“CT報(bào)告”分類符合率為0.456,ROC曲線下面積為0.608;“CT報(bào)告+臨床信息”分類符合率為0.461,ROC曲線下面積為0.618。增加臨床信息后,NLP模型的分類符合率未見明顯變化,但決策樹路徑變長,節(jié)點(diǎn)變多,規(guī)則復(fù)雜,不利于臨床使用。結(jié)論對(duì)于擬行手術(shù)的泌尿系結(jié)石患者,手術(shù)前的CT報(bào)告與手術(shù)方式具有相關(guān)性,可為手術(shù)方式的臨床決策提供直接有效的信息。增加癥狀和體征的臨床信息,不能提高預(yù)測手術(shù)方式的符合率。
自然語言處理; 臨床決策; 泌尿系統(tǒng)結(jié)石; 影像信息學(xué)
泌尿系結(jié)石是泌尿系統(tǒng)的常見病和多發(fā)病,在結(jié)石患者就診過程中,通常在先有臨床癥狀(以血尿、腹痛為主),有時(shí)可有查體的陽性發(fā)現(xiàn),在此基礎(chǔ)上行CT檢查可做出結(jié)石的確定診斷,同時(shí)提供指導(dǎo)治療的信息[1]。本研究按照泌尿系結(jié)石患者最終進(jìn)行的手術(shù)方式進(jìn)行分類,利用自然語言處理(natural language processing,NLP)決策樹方法來探究患者的臨床信息(癥狀、體征)和CT報(bào)告內(nèi)容與手術(shù)方式的相關(guān)性,研究各種信息在臨床醫(yī)生決策過程中的價(jià)值。
材料與方法
1.研究對(duì)象
選取住院病例系統(tǒng)中診斷為“泌尿系結(jié)石”、并行手術(shù)治療的連續(xù)病例,均有完整的癥狀、體征、CT報(bào)告資料。將上述資料導(dǎo)出為Excel文件,存儲(chǔ)并匯總后進(jìn)行NLP分析。
2.NLP分析
首先進(jìn)行文檔預(yù)處理,手工修正有錯(cuò)誤、缺失信息的數(shù)據(jù),對(duì)不能用于分析的文檔刪除,形成raw_text格式。
然后進(jìn)行CT特征的提取和加工,分詞、形成向量,統(tǒng)計(jì)詞頻、以高頻詞匯構(gòu)建特征向量,進(jìn)行語義分析,最終得到描述CT特征的關(guān)鍵詞。
再進(jìn)行臨床信息的提取和加工,從出院小結(jié)中刪除包含最終手術(shù)方案部分的描述,利用正則表達(dá)式識(shí)別“入院后”“行XX術(shù)”等關(guān)鍵詞,將“出院小結(jié)”部分拆分成手術(shù)前臨床信息描述部分和手術(shù)方案部分。手術(shù)方案部分的描述不進(jìn)入詞袋模型的構(gòu)建過程。
patterns = [u'[^。;]*收入我[科室院]([^。;])', u'[^。;]*[/d-]+[^,。前。,]+術(shù)[^后]', u'[^。;]*入院后', u'[^。;]*完善.{,3}檢查', u'[^。;]*檢查基本完善', u'[^。;]*手術(shù).{,5}順利', u'[^。;]*行[^、,。]+術(shù)']
對(duì)上述拆分出的CT報(bào)告內(nèi)容和臨床信息構(gòu)建ngram信息,用于決策樹的構(gòu)建與評(píng)價(jià)。
3.統(tǒng)計(jì)學(xué)方法
以十折交叉驗(yàn)證方法驗(yàn)證僅用“CT報(bào)告”、“CT報(bào)告+臨床信息”時(shí),NLP模型預(yù)測手術(shù)方案的分類符合率。
結(jié)果
371例患者的連續(xù)資料入組,其中行輸尿鏡碎石術(shù)(ureteroscopic lithotripsy,URL)190例,行經(jīng)皮腎鏡碎石取石術(shù)(percutaneous nephrolithotripsy,PNL)142例,行輸尿管軟鏡碎石術(shù)(retrograde intrarenal surgery,RIRS)39例。
從“CT報(bào)告+臨床信息”中提取的信息,構(gòu)建決策樹見圖1。
比較“CT報(bào)告”、“CT+臨床信息”NLP的驗(yàn)證結(jié)果(表1)。從表1所示的具體評(píng)價(jià)指標(biāo)可以看出,僅用“CT報(bào)告”的模型對(duì)各個(gè)分類的識(shí)別性能與“CT報(bào)告+臨床信息”相似。在已有CT報(bào)告的基礎(chǔ)上,增加臨床信息對(duì)于手術(shù)方案的決策并未提供更多的幫助,但此時(shí)的決策樹路徑更長,節(jié)點(diǎn)多,規(guī)則復(fù)雜。從實(shí)際工作的角度考慮,與“CT報(bào)告+臨床信息”比較,僅使用“CT報(bào)告”中的內(nèi)容對(duì)于決策提供的信息更加直接有效,相比之下決策樹更小、決策路徑更短。
表1 不同NLP模型決策樹的驗(yàn)證結(jié)果
討論
泌尿系結(jié)石的常見臨床表現(xiàn)為:腰腹部絞痛、脹痛、血尿,偶伴惡心、睪丸疼痛、膀胱刺激癥狀[2]等,不僅影響患者生活質(zhì)量,而且其引起的泌尿系梗阻可危害腎功能甚至繼發(fā)嚴(yán)重感染。多排螺旋CT檢查是泌尿系結(jié)石首選的影像檢查方法,可清晰顯示結(jié)石數(shù)量、位置、大小、CT值、與周圍組織的關(guān)系及腎積水情況等,增強(qiáng)CT還可進(jìn)一步評(píng)價(jià)腎臟功能。所以CT既有確診結(jié)石的作用,又有指導(dǎo)結(jié)石治療的價(jià)值[3-4]。目前結(jié)石治療以微創(chuàng)腔內(nèi)手術(shù)為主,臨床醫(yī)生選擇手式方式時(shí),需綜合考慮患者的全身狀況和結(jié)石具體情況[5]。
本研究利用NLP技術(shù),探索使用基于決策樹的數(shù)據(jù)挖掘技術(shù)是否可對(duì)臨床手術(shù)決策起到提示作用。前期本團(tuán)隊(duì)已初步驗(yàn)證了NLP可提取CT報(bào)告中的關(guān)鍵特征,與專家提取的關(guān)鍵特征具有可比性。另外,NLP提取的特征,在經(jīng)過優(yōu)化后可模擬臨床醫(yī)生的決策,CT報(bào)告中結(jié)石、炎癥和輸尿管形態(tài)的描述與手術(shù)方式的選擇有一定的相關(guān)性。在以上前期工作的基礎(chǔ)上,本研究試圖探索增加臨床信息后,可否進(jìn)一步提高NLP對(duì)手術(shù)方式的預(yù)測效能。但結(jié)果顯示,增加臨床信息不能提高對(duì)手術(shù)方式的預(yù)測符合率,考慮其原因,可能有以下兩個(gè)方面:
①增加臨床信息后,NLP的數(shù)據(jù)質(zhì)量下降,降低了決策效能。本研究對(duì)比了“CT報(bào)告”、“CT報(bào)告+臨床信息”對(duì)臨床決策的價(jià)值,結(jié)果顯示單純使用“CT報(bào)告”決策符合率為0.456,使用“CT報(bào)告+臨床信息”符合率為0.461。十折交叉驗(yàn)證結(jié)果顯示,兩種模型對(duì)各個(gè)分類的識(shí)別性能相近,只在數(shù)字上有細(xì)微的差異。從模型結(jié)構(gòu)分析中可以看出,使用臨床信息時(shí)的決策樹決策路徑更長,節(jié)點(diǎn)更多,規(guī)則更加復(fù)雜。將CT報(bào)告、臨床信息兩部分內(nèi)容整合之后,由于報(bào)告內(nèi)容的具體表述不完全一致,導(dǎo)致詞頻矩陣更加稀疏,使得模型的預(yù)測能力有所降低。因此,僅CT報(bào)告中的內(nèi)容可為臨床決策提供更加直接有效的信息,且決策樹計(jì)算規(guī)則相對(duì)簡化。
②臨床信息的實(shí)際價(jià)值主要在入院選擇和預(yù)后評(píng)估,而對(duì)手術(shù)方式的選擇價(jià)值明顯低于CT信息。在常規(guī)實(shí)際工作中,泌尿系結(jié)石治療決策的制定需要考慮到患者的所有信息例如患者的基礎(chǔ)疾病、目前的臨床癥狀和體征等臨床信息、泌尿系統(tǒng)的解剖結(jié)構(gòu)、結(jié)石的影像征象、患者的訴求等復(fù)雜因素,最終由醫(yī)患雙方協(xié)商決定。但臨床醫(yī)生做出決策時(shí),各部分信息的權(quán)重并不相同。本研究收集的病例均為住院手術(shù)的結(jié)石患者,這些患者術(shù)前已排除了手術(shù)禁忌癥,例如全身感染、發(fā)熱等,即已經(jīng)決定選擇手術(shù)治療了。那么進(jìn)一步確定手術(shù)方案時(shí),則主要依靠CT征象。CT的診斷價(jià)值首先是除外非結(jié)石性的血尿病因,特別是腫瘤性病變[6];其次是描述結(jié)石的關(guān)鍵特征,大多數(shù)情況下這些關(guān)鍵特征是選擇術(shù)式的主要依據(jù)[7]。本研究以NLP的客觀數(shù)據(jù),提出了術(shù)式選擇過程以CT信息為主、增加臨床信息不改變術(shù)式選擇的推論,揭示了本疾病在日常臨床工作決策過程中可能的規(guī)律,當(dāng)然這一推論尚需大量實(shí)驗(yàn)反復(fù)驗(yàn)證。實(shí)際上,在疾病的診治過程中,這種情況并不少見,如:疾病影像診斷明確,以微創(chuàng)術(shù)式為主,手術(shù)整體難度不大、手術(shù)對(duì)患者全身情況要求不高時(shí),病灶的局部信息對(duì)術(shù)式的選擇更重要[8]。需注意的是,手術(shù)方式的選擇僅是結(jié)石患者診治全過程中的一個(gè)環(huán)節(jié),臨床信息在其他環(huán)節(jié)的決策應(yīng)有重要價(jià)值,今后應(yīng)進(jìn)一步研究。
圖1 “CT+臨床信息”的決策樹。
“CT報(bào)告+臨床信息”有望用于區(qū)分門診與住院治療。上尿路結(jié)石是泌尿外科常見疾病,治療方案較多,常用治療方案包括保守治療、藥物治療、體外沖擊波碎石、輸尿管鏡取石術(shù)、經(jīng)皮腎鏡取石術(shù)及開放手術(shù)。隨著微創(chuàng)術(shù)式的普及,泌尿外科醫(yī)師在結(jié)石治療時(shí)面臨多重選擇。治療前根據(jù)影像資料準(zhǔn)確判斷結(jié)石的相關(guān)信息,可以幫助臨床醫(yī)生制定更加詳實(shí)可靠的治療方案[9]。泌尿系CT報(bào)告可以提供結(jié)石的位置、大小、成分等信息,有利于臨床優(yōu)化現(xiàn)有的治療方案,制定一個(gè)標(biāo)準(zhǔn)的診斷治療流程。但CT報(bào)告中不能反映患者的病史、全身情況,而這些對(duì)選擇治療方案也是非常重要的[10]。最近人工研究的結(jié)果已顯示,因急性腎絞痛就診的患者,CT報(bào)告結(jié)石較大、密度較高、位于近端的,合并寒戰(zhàn)、發(fā)熱和白細(xì)胞升高的患者預(yù)測其行有創(chuàng)治療的可能性較高[11]。所以,將來可使用大量數(shù)據(jù),以NLP研究“CT報(bào)告+臨床信息”對(duì)選擇入院手術(shù)治療的患者是否具有指導(dǎo)作用。
“CT報(bào)告+臨床信息”有望用于評(píng)價(jià)結(jié)石的復(fù)發(fā)和預(yù)后。結(jié)石形成的危險(xiǎn)因素主要有代謝異常、尿路梗阻、感染、異物等局部因素以及引起結(jié)石的藥物因素。結(jié)石成因可以用于評(píng)估治療方案及預(yù)后,它影響結(jié)石的復(fù)發(fā)幾率[12]。泌尿系結(jié)石的常見成分為含鈣結(jié)石、磷酸鎂銨結(jié)石(鳥糞石)、尿酸結(jié)石及胱氨酸結(jié)石,通常是混合成分結(jié)石,雙能量CT可分析結(jié)石成分[13]。所以,將來可以NLP研究“CT報(bào)告+臨床信息+隨訪信息”,對(duì)患者的術(shù)后并發(fā)癥、結(jié)石復(fù)發(fā)和預(yù)后做出評(píng)估[14]。目前已有研究已證明,影像資料對(duì)患者的預(yù)后有明確的提示作用[15],與臨床資料結(jié)合,形成“影像組學(xué) (radiomics)”、“影像基因組學(xué)(radiogenomics)”數(shù)據(jù)[16],是一種重要的影像信息學(xué)研究方法,用于預(yù)后評(píng)價(jià)的作用已經(jīng)獲得一些證據(jù)的支持,是影像與臨床信息整合的重要價(jià)值之一。
本研究的結(jié)果雖然沒有接受最初的研究假設(shè),增加臨床信息后未能提高CT對(duì)手術(shù)方式的預(yù)測效能,但其提示意義仍然非常重要:在影像信息學(xué)研究過程中,首先應(yīng)定義明確的任務(wù),其次應(yīng)以高質(zhì)量的數(shù)據(jù)進(jìn)行研究,最后IT研究人員應(yīng)與醫(yī)務(wù)人員緊密合作,充分挖掘有效數(shù)據(jù),才能為臨床決策提供有力的幫助。更加重要的是,疾病的種類千差萬別,即使是同一種疾病在不同的決策階段,各類信息的輔助決策價(jià)值也是不同的。所以,臨床醫(yī)學(xué)中的信息化進(jìn)程不可能一蹴而就,研究者必須有足夠的耐心,細(xì)致地逐個(gè)解決問題,才有可能把信息學(xué)工具真正用于臨床工作中。
[1] Pearle MS,Goldfarb DS,Assimos DG,et al.American urological assocation.Medical management of kidney stones:AUA guideline[J].J Urol,2014,192(2):316-324.
[2] Heller MT,Tublin ME.In search of a consensus:evaluation of the patient with hematuria in an era of cost containment[J].AJR,2014,202(6):1179-1186.
[3] Bosmans JML,Weyler JJ,De Schepper AM,et al.The radiology report as seen by radiologists and referring clinicians:results of the COVER and ROVER surveys[J].Radiology,2011,259(1):184-195.
[4] Nazim SM,Ather MH,Khan N.Measurement of ureteric stone diameter in different planes on multi-detector computed tomography:impact on the clinical decision making[J].Urology,2014,83(2):288-292.
[5] Cheng PM,Moin P,Dunn MD,et al.What the radiologist needs to know about urolithiasis:Part 2-CT findings,reporting,and treatment[J].AJR,2012,198(6):W548-W554.
[6] Moloney F,Murphy KP,Twomey M,et al.Haematuria:an imaging guide[J].Adv Urol,2014:1-9.doi:10.1155/2014/414125.
[7] Fulgham PF,Assimos DG,Pearle MS,et al.Clinical effectiveness protocols for imaging in the management of ureteral calculous disease:AUA technology assessment[J].J Urol,2013,189(4):1203-1213.
[8] Bultitude M,Rees J.Management of renal colic[J].BMJ,2012,345:e5499.doi:10.1136/bmj.e5499.
[9] Sahin C,Eryildirim B,Kafkasli A,et al.Predictive parameters for medical expulsive therapy in ureteral stones:a critical evaluation[J].Urolithiasis,2015,43(3):271-275.
[10] Choi T,Yoo KH,Choi SK,et al.Analysis of factors affecting spontaneous expulsion of ureteral stones that may predict unfavorable outcomes during watchful waiting periods:what is the influence of diabetes mellitus on the ureter[J].Korean J Urol,2015,56(6):455-460.
[11] Lotan E,Weissman O,Guranda L,et al.Can unenhanced CT findings predict interventional versus conservative treatment in acute renal colic[J].AJ R,2016,207(5):1016-1021.
[12] Scales CD Jr,Smith AC,Hanley JM,et al.Prevalence of kidney stones in the united states[J].Eur Urol,2012,62(1):160-165.
[13] 范兵,邱建星,王霄英,等.雙能CT對(duì)離體泌尿系尿酸結(jié)石的診斷價(jià)值[J].放射學(xué)實(shí)踐,2012,27(3):268-270.
[14] Tonolini M,Villa F,Ippolito S,et al.Cross-sectional imaging of iatrogenic complications after extracorporeal and endourological treatment of urolithiasis[J].Insights Into Imaging,2014,5(6):677-689.
[15] Huber J,Winkler A,Jakobi H,et al.Preoperative decision making for renal cell carcinoma:cystic morphology in cross-sectional imaging might predict lower malignant potential[J].Urol Oncol,2014,32(1):37.
[16] Lambin P,Rios-Velazquez E,Leijenaar R,et al.Radiomics:extracting more information from medical images using advanced feature analysis[J].Eur J Cancer,2012,48(4):441-446.
Correlationbetweenclinicalinformation,CTsignsandsurgicalproceduresofurinarycalculus:naturallanguageprocessingresearch
WU Jing-yun,MI Yue,LIU Yi,et al.
Department of Radiology,Peking University First Hospital,Beijing 100034,China
Objective:To explore the value of clinical information (symptom+sign) and CT findings of urinary calculus in clinical decision-making of surgical procedures.MethodsMedical recording documents were retrospectively archived from HIS for patients who had CT examination for urinary calculus and surgical procedures in the hospital.By using different types of NLP model,all the imaging and clinical data were extracted and processed for searching the descriptors of CT features,symptoms and signs.The correlation of the descriptors with surgical methods was studied.Results371 consecutive data were collected (142 percutaneous nephrolithotripsy,190 ureteroscopic lithotripsy,and 39 retrograde intrarenal surgery,respectively).The precision of quot;CT reportquot; was 0.456 (AUC 0.608).The precision of quot;CT report+clinical informationquot; was 0.464 (AUC 0.618).With additional information of clinical data,the classification accuracy of NLP was not improved,but leading to longer path of decision tree,more nodes and more complex rules.ConclusionThe content of CT report can provide direct and effective information for clinical decision-making of surgical procedure.
Natural language processing; Clinical decision-making; Urinary calculus; Imaging informatics
100034 北京,北京大學(xué)第一醫(yī)院醫(yī)學(xué)影像科(吳靜云、劉義、馬帥、王霄英),泌尿外科(米悅);200233 上海,飛利浦中國研究院(李作峰、施雅慧、李俊博、魏娟)
吳靜云(1985-),女,廣西桂林人,博士,主治醫(yī)師,主要從事腎臟功能MR成像、對(duì)比劑研究及醫(yī)學(xué)數(shù)據(jù)庫研究。
王霄英,E-mail: cjr.wangxiaoying@vip.163.com
R814.42; R693.4
A
1000-0313(2017)11-1183-04
10.13609/j.cnki.1000-0313.2017.11.018
2016-11-10)