国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于BI-RADS描述的乳腺腫瘤判別

2014-09-08 02:13:30碩,薛
食管疾病 2014年2期
關(guān)鍵詞:決策樹(shù)乳腺準(zhǔn)確率

翁 碩,薛 松

基于BI-RADS描述的乳腺腫瘤判別

翁 碩1,薛 松2

目的探討B(tài)I-RADS在乳腺腫瘤檢查中的應(yīng)用價(jià)值。方法先是預(yù)處理大量的歷史數(shù)據(jù)集含BI-RADS特征和對(duì)應(yīng)的病理結(jié)果,然后基于這些數(shù)據(jù)集進(jìn)行決策樹(shù)算法建模,最后采用留一法(leave-one-out cross validation)驗(yàn)證模型的性能。結(jié)果對(duì)實(shí)驗(yàn)中收集的361例(良性182例,惡性179例)進(jìn)行留一法驗(yàn)證,實(shí)驗(yàn)結(jié)果準(zhǔn)確率為91%,敏感性為87%,特異性為95%,受試者工作特征曲線下面積為95%。結(jié)論基于BI-RADS描述的乳腺腫瘤判別方法十分有效,有望為臨床診斷提供有價(jià)值的參考意見(jiàn)。

乳腺腫瘤;BI-RADS;決策樹(shù);分類(lèi)器;識(shí)別

乳腺癌是女性最常見(jiàn)的惡性腫瘤之一。據(jù)腫瘤流行病學(xué)調(diào)查,歐美乳腺癌發(fā)病率居女性惡性腫瘤首位,中國(guó)乳腺癌發(fā)病率僅次于子宮頸癌,年死亡數(shù)超過(guò)2萬(wàn)人[1]。同時(shí),近年來(lái)乳腺癌呈高速發(fā)展趨勢(shì),如果沒(méi)有相關(guān)措施,中國(guó)乳腺癌發(fā)病率可能從每10萬(wàn)人中25~60人升至100人[2]。

乳腺影像報(bào)告數(shù)據(jù)系統(tǒng)(breast imaging reporting and data system,BI-RADS)是美國(guó)放射協(xié)會(huì)(ACR:the American College of Radiology)于2003年制定的標(biāo)準(zhǔn)乳腺成像報(bào)告和數(shù)據(jù)系統(tǒng),它有利于與臨床的溝通,對(duì)乳腺病變的診斷、評(píng)判有重要意義,是目前國(guó)內(nèi)外公認(rèn)的有效的乳腺影像學(xué)診斷指導(dǎo),在我國(guó)也已經(jīng)得到了長(zhǎng)期廣泛的應(yīng)用。本文是采用先預(yù)處理大量的歷史數(shù)據(jù)(包含BI-RADS特征和對(duì)應(yīng)的病理結(jié)果)——基于這些數(shù)據(jù)集進(jìn)行決策樹(shù)算法建模——采用留一法(leave-one-out cross validation)驗(yàn)證模型的性能的方法來(lái)驗(yàn)證BI-RADS在乳腺腫瘤檢查中的應(yīng)用價(jià)值。

1 資料與方法

1.1 資料本文的實(shí)驗(yàn)數(shù)據(jù)是以患者為中心的乳腺腫瘤數(shù)據(jù),包括超聲圖像、BI-RADS格式化描述、臨床信息(含病史、家族史、年齡和病理結(jié)果)。收集的病例共381例,其中良性腫瘤192例,惡性腫瘤189例。所有數(shù)據(jù)收集于2012~2014年,來(lái)自于福清市中醫(yī)院超聲科室。采用的超聲儀型號(hào)有ATL HDI-3000,GE Logic 9,ACUSON Sequoia 512,SIMENS G50 和Hitachi 8500,超聲探頭頻率范圍5~13 mHz。 為了減少不同醫(yī)師之間的不一致性,所有患者乳腺腫瘤的BI-RADS描述來(lái)自?xún)晌唤?jīng)驗(yàn)豐富的醫(yī)師的一致檢查。本文中所提到的乳腺腫瘤均是經(jīng)過(guò)活組織檢查確認(rèn)或者是經(jīng)過(guò)2 a以上隨診認(rèn)為是良性腫瘤。

2.2 方法

2.2.1 數(shù)據(jù)預(yù)處理 本文所收集的數(shù)據(jù)包含超聲圖像,BI-RADS格式化描述,臨床信息和病理結(jié)果。實(shí)驗(yàn)時(shí)首先過(guò)濾提取含BI-RADS特征和病理結(jié)果的數(shù)據(jù),也就是將以患者為中心的數(shù)據(jù)轉(zhuǎn)化為以病例為中心的數(shù)據(jù),因?yàn)橛行┗颊呖赡苡幸粋€(gè)良性腫瘤和一個(gè)惡性腫瘤。其次,BI-RADS有些特征信息丟失,有些病理結(jié)果沒(méi)有記錄,在實(shí)驗(yàn)時(shí)需要進(jìn)行特殊對(duì)待。對(duì)于病理結(jié)果沒(méi)有記錄的病例需要被剔除;對(duì)于BI-RADS特征部分丟失的,可以設(shè)置一定的閥值,剔除丟失特征過(guò)多的病例;部分特征缺失可以采用相似性插值進(jìn)行填補(bǔ)[7]。經(jīng)過(guò)數(shù)據(jù)預(yù)處理后的數(shù)據(jù)總共為361例,含182例良性和179例惡性病例。

2.2.2 決策樹(shù)模型 數(shù)據(jù)處理需要先建立和訓(xùn)練機(jī)器學(xué)習(xí)模型,即以BI-RADS特征為自變量,以病理結(jié)果為因變量,建立一種映射,目的是使這種映射精確地?cái)M合歷史數(shù)據(jù),同時(shí)又能夠精確地預(yù)測(cè)未知數(shù)據(jù)。有大量的機(jī)器學(xué)習(xí)建模方法,如回歸分析,決策樹(shù)模型,神經(jīng)網(wǎng)絡(luò),貝葉斯網(wǎng)絡(luò)和支撐向量機(jī)[3-4]等。由于BI-RADS部分特征是數(shù)值型,部分特征是種類(lèi)型,因此一些方法如回歸分析就不太適合。由于決策樹(shù)模型能夠處理數(shù)值型和種類(lèi)型自變量,而且決策樹(shù)模型能夠容忍噪聲和易于解釋?zhuān)疚牟捎脹Q策樹(shù)模型這個(gè)方法。 決策樹(shù)算法是以實(shí)例為基礎(chǔ)的歸納學(xué)習(xí)算法,以其計(jì)算量相對(duì)較小、易于提取顯示規(guī)則、可以顯示重要決策屬性和較高的分類(lèi)準(zhǔn)確率等優(yōu)點(diǎn)而得到廣泛的應(yīng)用[5]。ID3(Iterative Dichotomizer 3)算法、C4.5算法和CART算法是比較常用的3種經(jīng)典的決策樹(shù)算法。本文采用的是CART(Classification And Regression Tree:分類(lèi)回歸樹(shù))算法,它是僅有的一種通用的樹(shù)生長(zhǎng)算法。該算法采用的是二分遞歸分割的技術(shù),將當(dāng)前的樣本集分割成兩個(gè)子樣本集,使得生成的每個(gè)非葉子節(jié)點(diǎn)都有兩個(gè)分支。

2.2.3 決策樹(shù)模型的驗(yàn)證 為了測(cè)試預(yù)測(cè)模型的泛化能力,需要進(jìn)行模型驗(yàn)證。常見(jiàn)的模型驗(yàn)證有兩種[5]:一種是隨機(jī)地將數(shù)據(jù)集分成訓(xùn)練集和測(cè)試集,一般將2/3的數(shù)據(jù)集作為訓(xùn)練集訓(xùn)練模型,1/3的數(shù)據(jù)作為測(cè)試集,從而了解模型的預(yù)測(cè)能力。另一種是k折交叉驗(yàn)證(k-fold cross validation),即初始隨機(jī)地分割成k個(gè)子樣本,一個(gè)單獨(dú)的子樣本被保留作為驗(yàn)證模型的數(shù)據(jù),其他k-1個(gè)樣本用來(lái)訓(xùn)練。交叉驗(yàn)證重復(fù)k次,每個(gè)子樣本驗(yàn)證1次,平均k次的結(jié)果作為了解模型的預(yù)測(cè)能力。當(dāng)k取數(shù)據(jù)集大小時(shí),即為留一法驗(yàn)證(leave-one-out cross validation)。本文采用leave-one-out 交叉驗(yàn)證決策樹(shù)模型的性能。

2 結(jié)果

為了量化預(yù)測(cè)模型的結(jié)果,這里采用3個(gè)指標(biāo)描述腫瘤診斷應(yīng)用價(jià)值:準(zhǔn)確率(Accuracy)、敏感性(Sensitivity)、特異性(Specificity)。敏感性反映試驗(yàn)檢測(cè)疾病的能力;特異性反映識(shí)別疾病的辨別能力。不同的應(yīng)用目的對(duì)腫瘤診斷評(píng)估的主要指標(biāo)要求也不同,如篩查、診斷、治療監(jiān)視和復(fù)發(fā)均要求敏感性值比較高,診斷和復(fù)發(fā)對(duì)特異性要求比較高,各定義如下:

Accuracy=(TP+TN)/(TP+TN+FP+FN)

Sensitivity=TP/(TP+TN)

Specificity=TN/(TN+FP)

其中TP:True Positive(真陽(yáng)性),TN:True Negative(真陰性),F(xiàn)P:False Positive(假陽(yáng)性),F(xiàn)N:False Negative(假陰性)。建立的決策樹(shù)模型如圖1。

圖1 決策樹(shù)模型圖

采用leave-one-out交叉驗(yàn)證,決策樹(shù)模型獲得的準(zhǔn)確率是91%,敏感性是87%,特異性是95%。為了充分客觀評(píng)價(jià)訓(xùn)練的模型,顯示受試者工作特征曲線(ROC:receiver operating characteristic curve)以及ROC曲線下的面積(AUC: area under curve),AUC=95%。

3 討論

早期乳腺癌篩選的影像檢查主要有鉬靶X線攝片和超聲檢查,鉬靶X線攝片檢查主要是通過(guò)發(fā)現(xiàn)微小鈣化以及鈣化分布形態(tài)來(lái)實(shí)現(xiàn)診斷的,對(duì)于無(wú)鈣化的乳腺癌診斷帶來(lái)一定困難,特別是亞州人群的致密型乳腺;X線檢查電離輻射可能誘發(fā)癌癥,所以泌乳期的年輕婦女不宜乳腺放射線檢查;此外單以鉬靶X線作為乳腺癌的診斷手段會(huì)造成一定的假陰性,而且鉬靶X線攝片對(duì)乳腺腫瘤大小、浸潤(rùn)范圍等信息提供甚少。超聲檢查能清晰地顯示乳腺及其周?chē)浗M織的解剖結(jié)構(gòu),具有檢查方法簡(jiǎn)單、價(jià)格低廉、無(wú)創(chuàng)、實(shí)時(shí)、可重復(fù)性強(qiáng)等優(yōu)點(diǎn),目前已成為國(guó)內(nèi)外乳腺科醫(yī)師的首選檢查方法[6]。但是基于超聲檢查方法診斷乳腺癌的準(zhǔn)確率主要依賴(lài)于超聲醫(yī)生的診斷經(jīng)驗(yàn),不同醫(yī)生的診斷準(zhǔn)確率會(huì)有所不同。因此缺少經(jīng)驗(yàn)的醫(yī)生急需客觀量化的臨床決策支持(clinical decision support,CDS)[7-9]輔助他們做出準(zhǔn)確的診斷。

本研究結(jié)果顯示,BI-RADS描述體系的應(yīng)用,在診斷結(jié)果中引入了可能范圍的概念,對(duì)乳腺超聲異常所見(jiàn)進(jìn)行評(píng)估分類(lèi),每一級(jí)都只是一個(gè)良惡性可能的范圍,這使得超聲醫(yī)師在做出診斷時(shí)既可以參照自己的臨床經(jīng)驗(yàn)確定病變良惡性的范圍,又可給出一個(gè)臨床可靠的指導(dǎo),這對(duì)于經(jīng)驗(yàn)不夠的醫(yī)師可大大提高診斷的準(zhǔn)確率。同時(shí)通過(guò)實(shí)驗(yàn)也驗(yàn)證了BI-RADS描述體系對(duì)乳腺癌的診斷敏感、準(zhǔn)確,在乳腺腫瘤檢查診斷中具有較好的應(yīng)用價(jià)值。

[1]Parkin P,Parkin DM,Bray FI,et al.Estimates of the worldwide mortality from 25 cancers in 1990[J].Int J Cancer,1999,83(1):18-29.

[2]Linos E,Spanos D,Rosner BA,et al.Effects of reproductive and demographic changes on breast cancer incidence in China:a modeling analysis[J].J Natl Cancer Inst,2008,100(19): 1352-1360.

[3]Ping-ning Tan,Michael Steinbach,Vipin Kumar.數(shù)據(jù)挖掘?qū)д揫M].北京:人民郵電出版社,2012:27-38,89-168.

[4]邊肇祺,張學(xué)工.模式識(shí)別[M].北京:清華大學(xué)出版社,2000:9-360.

[5]楊靜,張楠男,李建等.決策樹(shù)算法的研究與應(yīng)用[J].計(jì)算機(jī)技術(shù)與發(fā)展,2010,20(2):114-116.

[6]李治安,李建國(guó),劉吉斌.臨床超聲影像學(xué)[M].北京:人民衛(wèi)生出版社,2003:1630-1643.

[7]Drukker K,Gruszauskas NP,Sennectt CA,et al.Breast US computer-aided diagnosis workstation: performance with a large clinical diagnostic population[J].Radiol,2008,248:392-397.

[8]Kuo WJ,Chang RF,Moon WK,et al.Computer-aided diagnosis of breast tumors with different us systems[J].Acad Radiol,2002,9:793-799.

[9]Huang YL,Kuo SJ,Chang CS.Image retrieval with principal component analysis for breast cancer diagnosis on various ultrasonic systems[J].Ultrasound Obstet Gynecol,2005,26:588-566.

DeterminationofBreastCancerBasedonBI-RADS

WENG Shuo,XUE Song

(Fujian Qiaoxing Light Industry School,Fuqing 350300,China)

ObjectiveTo assess the value of BI-RADS(Breast Imaging-Reporting and Data System ) in the examination of the breast cancer.MethodsFirst to deal with a lot of historical data including the feature of BI-RADS and the corresponding pathological findings,Then to model the decision tree algorithm based on these datas.Finally to use the “l(fā)eave-one-out cross validation” to verify the performance of the model.Resultsthe pathological examination( revealed 182 benign and 179 malignant lesions) was verified.The accuracy,sensitivity and specificity of the result were 91%,87% and 95%.Area under the ROC curve was 95%.ConclusionThe discrimination method of breast cancer based on BI-RADS is very effective,it is expected to provide valuable reference for clinical diagnosis.

breast tumor;BI-RADS;decision tree;classifier;identification

2014-03-22

1.福建省僑興輕工學(xué)校,福建福清 350300 2.福清市中醫(yī)院超聲科室,福建福清 350300

翁碩(1981-),女,福建福清人,講師,從事教師工作。

R730.41,R737.9

A

1672-688X(2014)02-0099-03

猜你喜歡
決策樹(shù)乳腺準(zhǔn)確率
乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹(shù)算法
體檢查出乳腺增生或結(jié)節(jié),該怎么辦
決策樹(shù)和隨機(jī)森林方法在管理決策中的應(yīng)用
電子制作(2018年16期)2018-09-26 03:27:06
高速公路車(chē)牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
得了乳腺增生,要怎么辦?
媽媽寶寶(2017年2期)2017-02-21 01:21:22
基于決策樹(shù)的出租車(chē)乘客出行目的識(shí)別
容易誤診的高回聲型乳腺病變
景谷| 酒泉市| 汾西县| 涟水县| 铁岭市| 陵水| 东海县| 怀集县| 工布江达县| 石门县| 毕节市| 库尔勒市| 祁阳县| 遵义市| 九寨沟县| 大方县| 汝城县| 梨树县| 文成县| 巴彦淖尔市| 横峰县| 如皋市| 礼泉县| 宁都县| 玉龙| 大理市| 调兵山市| 天峻县| 松溪县| 买车| 烟台市| 顺义区| 洞头县| 德庆县| 正安县| 中卫市| 静海县| 明星| 华宁县| 台中县| 龙陵县|