陳梅香白學(xué)軍
(1教育部人文社會科學(xué)重點研究基地天津師范大學(xué)心理與行為研究院,天津 300074)(2廈門大學(xué)心理咨詢與教育中心,廈門 361005)
事件率對專家與新手放射科醫(yī)生醫(yī)學(xué)圖像視覺搜索的影響:來自眼動的證據(jù)*
陳梅香1,2白學(xué)軍1
(1教育部人文社會科學(xué)重點研究基地天津師范大學(xué)心理與行為研究院,天津 300074)(2廈門大學(xué)心理咨詢與教育中心,廈門 361005)
探討低事件率對醫(yī)學(xué)圖像視覺搜索漏報的影響,用SMI250眼動儀記錄放射科專家與新手檢測胸部X光片的過程。結(jié)果發(fā)現(xiàn): (1)專家和新手在低事件率 (10%)下的漏報率多于高事件率 (50%),但專家在高低事件率的漏報率的差值小于新手。 (2)專家和新手在低事件率下的注視次數(shù)少于高事件率,眼跳幅度、掃描錯誤比例大于高事件率。結(jié)論認(rèn)為:專家與新手進(jìn)行醫(yī)學(xué)圖像視覺搜索時出現(xiàn)低事件率效應(yīng),低事件率效應(yīng)主要是由于掃描錯誤引起的。
專家,新手,放射科醫(yī)生,事件率,視覺搜索。
低事件率效應(yīng) (low prevalence effect)指視覺搜索任務(wù)中,隨著事件率降低而出現(xiàn)漏報率增加的現(xiàn)象 (Wolfe,Horowitz,&Kenner,2005)。Wolf等人 (2005)采用安檢圖片視覺搜索任務(wù),比較不同事件率 (50%、10%和1%)對視覺搜索績效的影響時發(fā)現(xiàn),與高事件率條件 (50%)相比,當(dāng)事件率低至1%時,目標(biāo)被漏報平均達(dá)30%。
對于低事件率效應(yīng)有多重決策模型和優(yōu)勢反應(yīng)抑制失敗兩種觀點。多重決策模型認(rèn)為低事件率會改變被試的搜索行為和知覺,使被試變得更加保守而傾向于進(jìn)行沒有目標(biāo)的按鍵反應(yīng) (Wolfe et al., 2005)。Fleck和Midriff(2007)提出優(yōu)勢反應(yīng)抑制失敗說,主張低事件率條件下,被試出現(xiàn)了更多的漏報錯誤,但是這種漏報錯誤并不是由于被試沒有看到目標(biāo)物造成的,而是由于他們的動作錯誤導(dǎo)致的。隨后,Wolfe等 (2007)、Van-Wert,Horowitz和Wolfe(2009)、Kunar,Rich和Wolfe(2010)研究表明即使給被試糾正錯誤的機(jī)會也不能有效地減少漏報率??梢?,針對低事件率搜索中的漏報錯誤的產(chǎn)生機(jī)制存在兩種截然不同的解釋,一種觀點歸之于識別階段的無覺察,而另一種則歸之于反應(yīng)階段的動作失誤 (李富洪,曹碧華,肖風(fēng),李紅,2011)。
醫(yī)學(xué)圖像是一種特殊的搜索任務(wù),同樣具有事件率低的特點。在影像學(xué)的檢查中,醫(yī)生的每次搜索并不能確定病灶 (如腫瘤)是否存在,醫(yī)院常規(guī)體檢和臨床檢查的事件率也不均衡。研究表明,在乳腺X光影像檢查人群中,其事件率約為0.3%(Gur et al.,2004;Pisano et al.,2005)。Kundel(2000)開展的12項關(guān)于肺癌檢測的調(diào)查,發(fā)現(xiàn)肺癌發(fā)病率從0.9%-47.6%。雖然醫(yī)學(xué)影像搜索有低事件率的特點,但是一旦出現(xiàn)漏報,會造成嚴(yán)重的后果,導(dǎo)致患者錯過最佳的治療時機(jī),危害到患者的生命安全,引起重大醫(yī)療事故。
有研究表明事件率對被試搜索績效的影響不顯著 (Gur,Rockette,Warfel,Lacomis,&Fuhrman, 2003;Gur et al.,2004),甚至隨著事件率的提高,觀察者回答的確信度 (confidence ratings)降低(Gur et al.,2007)。而另有研究表明隨著事件率的增加,被試提高了搜索績效。Ethell和 Manning(2001)實驗中使用手腕破裂出現(xiàn)概率為 83%、50%和22%,結(jié)果表明隨著概率的增加,被試檢測的績效提高;Evans,Birdwell和Wolfe(2013)比較了1%事件率和50%事件率下被試的搜索績效,結(jié)果顯示低事件率下漏報率為30%,高事件率下漏報率為12%。研究結(jié)果的分岐,可能的原因是實驗的材料、實驗程序操作以及被試樣本量少。已有的研究大多停留在現(xiàn)象學(xué)的描述或解釋上,且當(dāng)前關(guān)于低事件率效應(yīng)的解釋是基于安檢任務(wù)下低事件率效應(yīng)產(chǎn)生機(jī)制的理論探討,由于醫(yī)學(xué)圖像復(fù)雜性的特點,已有的理論能否適用于醫(yī)學(xué)圖像,還有待于進(jìn)一步考察。
在已有研究的基礎(chǔ)上,本研究以胸部X光片(以下簡稱胸片)為實驗材料,試圖去探討低事件率對不同經(jīng)驗水平放射科醫(yī)生醫(yī)學(xué)圖像視覺搜索漏報的影響以及漏報錯誤產(chǎn)生的原因。肺癌早期表現(xiàn)多為肺結(jié)節(jié),臨床上,肺結(jié)節(jié)指的是肺部類直徑在3-30mm間的局灶性不透明病灶 (Lee,Kouzani,& Hu,2012;Valente et al.,2016)。由于隱蔽位置的結(jié)節(jié)較易漏報 (賈守勤,2009;Kundel,2015),因此本研究針對肺隱蔽位置的結(jié)節(jié)進(jìn)行探討。參考已有研究關(guān)于低事率值的設(shè)定,結(jié)合醫(yī)學(xué)圖像視覺搜索的特點,本研究將10%作為低事件率 (Egglin& Feinstein,1996;李宇涵,2014;王陵宇,2015)。
2.1 被試
本研究選取專家和新手2組被試 (Law,Atkins, Kirkpatrick,Lomax,&Mackenzie,2004;Giovinco et al.,2015)。專家醫(yī)生選自福建省某三級甲等醫(yī)院,選擇標(biāo)準(zhǔn)是:①看胸部X光片經(jīng)驗10年以上;②職稱為副主任醫(yī)師及以上 (Ericsson,Krampe,& Tesch-R觟mer,1993;Ericsson,2006)。新手選取的是醫(yī)學(xué)院在讀研一影像學(xué)專業(yè)學(xué)生,目前在醫(yī)院臨床實習(xí)。研究共選取被試30人,其中專家醫(yī)生15人 (男11人),平均年齡43.73歲 (SD=5.31);新手15人 (男8人),平均年齡24.53歲 (SD= 0.52)。所有被試視力或者矯正視力正常,無眼部疾病,無色弱或色盲。所有被試給予一定費用作為其參加實驗的報酬。
2.2 實驗材料
80張胸片,其中40張正常,40張異常 (有結(jié)節(jié))。刺激材料顯示尺寸為787(寬)×768(高)像素。正常圖片以20張正常胸片為模板 (10男10女),1張胸片重復(fù)2次。異常圖片以20張正常胸片為模板 (10男10女),在1張正常胸片里取1個隱蔽位置,操作2個大小不同的結(jié)節(jié)。參照醫(yī)學(xué)標(biāo)準(zhǔn),隱蔽位置取肺尖區(qū)、肺門區(qū)、心影后區(qū)、脊柱旁、橫隔區(qū)、肋骨重疊區(qū),共20個位置。本實驗操作的結(jié)節(jié)大小為5mm-20mm,肺部結(jié)節(jié)只有1個。
為保證模擬結(jié)節(jié)的真實性,本實驗材料由精通Photoshop的1名放射科住院醫(yī)師制作,實驗材料制作方法參照 (Burgess,1999;Beutel,Kundel,& Metter,2000;Donovan&Litchfield,2013)。由2名放射科主任醫(yī)師 (平均工齡19.5年)對結(jié)節(jié)真實性或難度進(jìn)行了5點評定。10%事件率下的實驗材料在50%事件率實驗材料的40張異常胸片里取16張。結(jié)果為:50%事件率下:對40張異常胸片結(jié)節(jié)是否符合臨床的真實程度進(jìn)行5點量表 (1代表非常不真實,5代表非常真實)評定,兩個評分者一致性系數(shù)為 r=0.90(肯德爾和諧相關(guān),p< 0.001),評定均值為4.81(SD=0.41)。對結(jié)節(jié)的難度進(jìn)行5點 (1代表非常容易,5代表非常難)評定,兩個評分者一致性系數(shù)為0.82(p<0.001),評定均值為4.23(SD=0.55)。10%事件率下,結(jié)節(jié)難度均值為4.21(SD=0.58)。對10%事件率下16個結(jié)節(jié)的難度值和50%事件率下40個結(jié)節(jié)的難度值進(jìn)行t檢驗,結(jié)果為t=0.17,p>0.05。
2.3 實驗儀器
實驗儀器是SMI250眼動記錄儀,采樣頻率為500Hz。戴爾19英寸TFT LCD顯示器呈現(xiàn)刺激,刷新頻率為100Hz,分辨率為1280×1024像素。實驗程序采用iView 2.5進(jìn)行編程。
2.4 實驗設(shè)計
采用2(經(jīng)驗:專家、新手)×2(事件率: 50%事件率、10%事件率)的混合實驗設(shè)計。經(jīng)驗為被試間因素,事件率為被試內(nèi)因素。測量指標(biāo)兩部分:一是行為指標(biāo),主要包括漏報率、敏感性及判斷標(biāo)準(zhǔn);二是眼動指標(biāo),主要包括注視次數(shù)(fixation count,指被試超過 100ms的總注視次數(shù))、平均注視時間 (fixation duration average,指對每個注視到的刺激的編碼和比較時間)、平均眼跳幅度 (average saccade amplitude,指圖像觀看過程中被試眼跳的平均幅度)。本實驗中,圍繞結(jié)節(jié)輪廓以0.5厘米為半徑,劃定興趣區(qū) (李富洪等人,2011;王陵宇,2015)。興趣區(qū)內(nèi)的注視,選取興趣區(qū)內(nèi)的停留時間 (dwell time of AOI,指被試的眼睛停留在興趣區(qū)內(nèi)的時間,時間越長說明加工越多,反映了用于目標(biāo)識別的效率)指標(biāo)。
2.5 實驗程序
被試坐在離顯示器約60cm的位置,實驗開始前向被試呈現(xiàn)指導(dǎo)語,指導(dǎo)語如下: “本實驗的任務(wù)是識別和定位胸部結(jié)節(jié)。下面將看到一些胸部X光片,每一張X光片有一個或沒有結(jié)節(jié)。請關(guān)注肺部有無結(jié)節(jié),無需關(guān)注心臟、骨骼、大血管等結(jié)構(gòu)。首先屏幕將出現(xiàn)一個注視點,請注視注視點,屏幕隨后會呈現(xiàn)X光片。請仔細(xì)觀看圖像,如果您判斷有結(jié)節(jié),請將鼠標(biāo)移到目標(biāo)的位置并點擊鼠標(biāo)左鍵。同時鼠標(biāo)點擊您對判斷的確信程度。如果判斷沒有結(jié)節(jié),同樣也需要用鼠標(biāo)點擊您對判斷的確信程度。接下來請按空格鍵啟動下一個刺激?!北辉嚸靼缀筮M(jìn)行眼睛較準(zhǔn),然后進(jìn)行4個練習(xí)實驗,直到被試對實驗操作完全明白后進(jìn)入正式實驗。正式實驗中每張胸片的觀察時間不限。
整個實驗包括:10%事件率的1個block,共160試次 (中間設(shè)置1次休息時間,3分鐘),50%事件率的1個block,共80個試次。兩種事件率block的呈現(xiàn)順序在被試間進(jìn)行平衡。實驗過程中根據(jù)被試的狀況隨時可以休息。實驗分為前后兩次施測,前后間隔一周時間。本研究要求被試對是否有結(jié)節(jié)進(jìn)行5點評分 (1-5),1代表沒有結(jié)節(jié),2-5代表有結(jié)節(jié)的確定性水平,越靠近5,確定性越高 (Evans,Birdwell,&Wolfe,2013;Reed,Chow, Chew,&Brennan,2014)。
2.6 數(shù)據(jù)的整理與分析
刪除圖片上沒有一個注視點及眼動儀誤差造成的錯誤數(shù)據(jù),占總數(shù)據(jù)的1.17%,采用Microsoft Excel、Spss17.0軟件包對收集到的數(shù)據(jù)進(jìn)行分析。
3.1 專家與新手放射科醫(yī)生醫(yī)學(xué)圖像視覺搜索績效的比較
3.1.1 漏報率
專家與新手在高、低事件率條件下的漏報率具體見表1。
表1 專家與新手在高、低事件率下的漏報率 (M±SD) (%)
對漏報率進(jìn)行重復(fù)測量方差分析,結(jié)果發(fā)現(xiàn):經(jīng)驗的主效應(yīng)顯著,F(xiàn)(1,28)=122.7,p<0.001,η2=0.81,專家的漏報率小于新手。事件率的主效應(yīng)顯著,F(xiàn)(1,28)=38.97,p<0.001,η2=0.58,50%事件率下的漏報率小于10%事件率。經(jīng)驗和事件率交互作用顯著,F(xiàn)(1,28)=7.88,p<0.01。簡單效應(yīng)分析發(fā)現(xiàn),專家與新手在10%事件率下的漏報率高于50%事件率 (分別為p<0.05,p<0.001)。專家在10%事件率、50%事件率下的漏報率均小于新手 (p<0.001)。
為進(jìn)一步考察專家與新手受低事件率影響程度的差異,把10%事件率下的漏報率減去50%事件率下的漏報率,得到兩組數(shù)據(jù)的差值,以差值為因變量進(jìn)行專家和新手兩組漏報率差值的t檢驗,結(jié)果為t=-2.81,p<0.01,表明專家受低事件率的影響程度遠(yuǎn)遠(yuǎn)小于新手。
3.1.2 判斷標(biāo)準(zhǔn)與敏感性
專家與新手在高、低事件率下的判斷標(biāo)準(zhǔn)和敏感性具體見表2。
表2 專家與新手在高、低事件率下的判斷標(biāo)準(zhǔn)與敏感性(M±SD)
(1)敏感性方面
經(jīng)驗的主效應(yīng)顯著,F(xiàn)(1,28)=23.59,p< 0.001,η2=0.46,專家的敏感性大于新手的敏感性。事件率的主效應(yīng)顯著,F(xiàn)(1,28)=15.77,p< 0.001,50%事件率下的敏感性要高于10%事件率。
(2)判斷標(biāo)準(zhǔn)方面
經(jīng)驗和事件率交互作用顯著,F(xiàn)(1,28)= 5.62,p<0.05,η2=0.17。簡單效應(yīng)分析發(fā)現(xiàn),專家在10%事件率和50%事件率下的判斷標(biāo)準(zhǔn)無顯著差異,p>0.05;新手在10%事件率下的判斷標(biāo)準(zhǔn)高于50%事件率,p<0.05。專家在10%事件率下的判斷標(biāo)準(zhǔn)低于新手,p<0.05;在50%事件率下的判斷標(biāo)準(zhǔn)與新手無顯著差異,p>0.05。
3.2 漏報錯誤歸類
參考Donovan和Litchfield(2013)關(guān)于漏報錯誤類型的劃分辦法,根據(jù)有無注視點落在興趣區(qū)內(nèi),將漏報錯誤進(jìn)行歸類:興趣區(qū)內(nèi)無注視點的漏報錯誤,視為掃描錯誤;興趣區(qū)內(nèi)有注視點的漏報錯誤視為識別錯誤。專家與新手在高、低事件率下的漏報錯誤歸類見表3。
對掃描錯誤比例進(jìn)行重復(fù)測量方差分析,結(jié)果發(fā)現(xiàn):經(jīng)驗的主效應(yīng)顯著,F(xiàn)(1,28)=24.32,p< 0.001,η2=0.46,專家的掃描錯誤比例小于新手。事件率的主效應(yīng)顯著,F(xiàn)(1,28)=33.32,p<0.001,η2=0.54,50%事件率下的掃描錯誤比例小于10%事件率。
表3 專家和新手在不同事件率下的視覺搜索漏報錯誤歸類 (%)
3.3 不同事件率下對整體圖像的注視
(1)平均注視時間
以平均注視時間為因變量,對經(jīng)驗、事件率和反應(yīng)類型 (擊中和漏報)進(jìn)行三因素重復(fù)測量方差分析,結(jié)果發(fā)現(xiàn),見表4。
表4 專家與新手在不同事件率下的異常圖像的眼動數(shù)據(jù)(M±SD)
經(jīng)驗的主效應(yīng)顯著,F(xiàn)(1,28)=1853.51,p< 0.001,η2=0.19,專家的平均注視時間少于新手。事件率的主效應(yīng)顯著,F(xiàn)(1,28)=1562.23,p< 0.001,η2=0.16,50%事件率下的平均注視時間小于10%事件率。反應(yīng)類型的主效應(yīng)顯著,F(xiàn)(1,28)=15088.54,p<0.001,η2=0.65,擊中反應(yīng)的平均注視時間大于漏報反應(yīng)。經(jīng)驗和事件率交互作用顯著,F(xiàn)(1,28)=187.82,p<0.001。經(jīng)驗和反應(yīng)類型交互作用顯著,F(xiàn)(1,28)=857.81,p<0.001。事件率和反應(yīng)類型交互作用顯著,F(xiàn)(1,28)=1066.56,p<0.001。經(jīng)驗、事件率、反應(yīng)類型三者的交互作用顯著,F(xiàn)(1,28)=505.90,p<0.001。進(jìn)一步簡單簡單效應(yīng)分析發(fā)現(xiàn):專家在10%事件率下的擊中反應(yīng)平均注視時間、10%事件率下的漏報反應(yīng)平均注視時間、50%事件率下的擊中反應(yīng)平均注視時間、50%事件率下的漏報反應(yīng)平均注視時間均顯著小于新手 (p<0.001)。
專家和新手在10%事件率、50%事件率下的擊中反應(yīng)平均注視時間均顯著大于漏報反應(yīng) (p< 0.001),10%事件率下的擊中反應(yīng)、漏報反應(yīng)的平均注視時間均顯著大于50%事件率 (p<0.001)。
(2)注視次數(shù)
以注視次數(shù)為因變量,進(jìn)行重復(fù)測量方差分析,結(jié)果見表4。
經(jīng)驗的主效應(yīng)顯著,F(xiàn)(1,28)=405.52,p< 0.001,η2=0.31,專家的注視次數(shù)少于新手。反應(yīng)類型的主效應(yīng)顯著,F(xiàn)(1,28)=432.89,p<0.001,η2= 0.31,擊中反應(yīng)的注視次數(shù)小于漏報反應(yīng)。事件率的主效應(yīng)顯著,F(xiàn)(1,28)=37.06,p<0.001,η2= 0.04,50%事件率下的注視次數(shù)大于10%事件率。經(jīng)驗和事件率交互作用顯著,F(xiàn)(1,28)=26.73,p< 0.001。經(jīng)驗和反應(yīng)類型交互作用顯著,F(xiàn)(1,28)= 4.03,p<0.05。事件率和反應(yīng)類型交互作用顯著,F(xiàn)(1,28)=358.41,p<0.001。經(jīng)驗、事件率、反應(yīng)類型三者的交互作用顯著,F(xiàn)(1,28)=5.14,p<0.05。進(jìn)一步簡單簡單效應(yīng)分析發(fā)現(xiàn):專家在10%事件率下的擊中反應(yīng)注視次數(shù)、10%事件率下的漏報反應(yīng)注視次數(shù)、50%事件率下的擊中反應(yīng)注視次數(shù)、50%事件率下的漏報反應(yīng)注視次數(shù)均小于新手 (p< 0.001)。專家在擊中反應(yīng)中,10%事件率和50%事件率下的注視次數(shù)無顯著差異 (p>0.05),而在漏報反應(yīng)中,10%事件率下的注視次數(shù)少于50%事件率(p<0.001)。新手在擊中反應(yīng)中,10%事件率下的注視次數(shù)多于50%事件率 (p<0.05),而在漏報反應(yīng)中,10%事件率下的注視次數(shù)少于50%事件率 (p< 0.001)。專家與新手在高、低事件率下,漏報反應(yīng)的注視次均多于擊中反應(yīng) (p<0.001)。
(3)平均眼跳幅度
以平均眼跳幅度為因變量,進(jìn)行重復(fù)測量方差分析,結(jié)果見表4。
經(jīng)驗的主效應(yīng)顯著,F(xiàn)(1,28)=56.14,p< 0.001,η2=0.29,專家的平均眼跳幅度大于新手。反應(yīng)類型的主效應(yīng)顯著,F(xiàn)(1,28)=4.23,p<0.05,η2=0.30,擊中反應(yīng)的平均眼跳幅度大于漏報反應(yīng)。事件率的主效應(yīng)顯著,F(xiàn)(1,28)=10.49,p<0.01,η2=0.07,50%事件率下的平均眼跳幅度小于10%事件率。經(jīng)驗和反應(yīng)類型交互作用邊緣顯著,F(xiàn)(1,28)=2.89,p=0.09。專家與新手在擊中反應(yīng)的平均眼跳幅度和漏報反應(yīng)的平均眼跳幅度上差異均顯著 (p<0.001)。專家的擊中反應(yīng)平均眼跳幅度小于漏報反應(yīng) (p<0.01),新手擊中反應(yīng)平均眼跳幅度與漏報反應(yīng)無顯著差異 (p>0.05)。
3.4 不同事件率下對興趣區(qū)的注視
以擊中反應(yīng)的興趣區(qū)內(nèi)的停留時間為因變量,進(jìn)行重復(fù)測量方差分析,結(jié)果見表5。
表5 專家與新手興趣區(qū)內(nèi)停留時間的眼動數(shù)據(jù) (M±SD)
經(jīng)驗的主效應(yīng)顯著,F(xiàn)(1,28)=7169.59,p< 0.001,η2=0.12,專家的停留時間大于新手。事件率的主效應(yīng)顯著,F(xiàn)(1,28)=19662.05,p<0.001,η2= 0.28,10%事件率下興趣區(qū)內(nèi)的停留時間高于50%事件率。經(jīng)驗和事件率交互作用顯著,F(xiàn)(1,28)= 6411.88,p<0.001,η2=0.11。專家與新手在10%事件率和50%事件率下興趣區(qū)內(nèi)的停留時間差異均顯著 (p<0.001),均表現(xiàn)為專家在興趣區(qū)內(nèi)的停留時間大于新手。專家與新手在10%事件率下興趣區(qū)內(nèi)的停留時間均顯著高于50%事件率 (p<0.001)。
4.1 事件率對專家與新手放射科醫(yī)生視覺搜索績效及視覺注視的影響
行為指標(biāo)方面,專家與新手都表現(xiàn)出在低事件率下的漏報率要高于高事件率,但專家受低事件率的影響程度遠(yuǎn)遠(yuǎn)小于新手。專家與新手在低事件率下的敏感性均要低于高事件率。Green和Swets(1966)研究表明,目標(biāo)概率較低時,被試的辨別能力降低,以至難以確定目標(biāo)。
眼動指標(biāo)方面,將擊中反應(yīng)與漏報反應(yīng)的平均注視時間進(jìn)行比較,結(jié)果發(fā)現(xiàn),專家與新手在擊中反應(yīng)中,低事件率下的平均注視時間顯著多于高事件率,這說明,在低事件率條件下,為了正確地搜索出目標(biāo),在每個注視到的位置需要付出更長的注視時間。通過興趣區(qū)的劃分,進(jìn)一步分析擊中反應(yīng)興趣區(qū)內(nèi)的停留時間則發(fā)現(xiàn),專家與新手低事件率下的興趣區(qū)內(nèi)的停留時間均顯著多于高事件率,這說明在低事件率下目標(biāo)的識別與確認(rèn)需要更長的時間。由于在低事件率條件下,對目標(biāo)所在區(qū)域的刺激進(jìn)行編碼和比較的時間投入不夠,導(dǎo)致低事件率下由于未能識別出目標(biāo)而產(chǎn)生的漏報錯誤增多。
平均眼跳幅度方面,低事件率下的平均眼跳幅度顯著大于高事件率,說明低事件率條件下要正確發(fā)現(xiàn)目標(biāo)需要更精細(xì)地搜索刺激。注視次數(shù)方面,低事件率下,專家與新手都表現(xiàn)出漏報反應(yīng)的注視次數(shù)變得更少,這提示低事件率條件下出現(xiàn)更多漏報錯誤可能與注視次數(shù)變得更少有關(guān)。這符合速度—正確率權(quán)衡理論的觀點,錯誤的增多是由快速反應(yīng)所導(dǎo)致的。
4.2 醫(yī)學(xué)圖像視覺搜索低事件率效應(yīng)產(chǎn)生的機(jī)制
低事件效應(yīng)是如何產(chǎn)生的,多重決策模型認(rèn)為低事件率使被試的判斷標(biāo)準(zhǔn)升高,被試變得更加保守而傾向于進(jìn)行沒有目標(biāo)的按鍵反應(yīng) (Wolfe et al.,2005)。本研究結(jié)果表明,新手在事件率低時,判斷標(biāo)準(zhǔn)趨于保守,漏報率更高,符合Wolfe等人(2005)的理論假設(shè)。在本研究中,專家沒有表現(xiàn)出事件率低時,反應(yīng)標(biāo)準(zhǔn)顯著增大的結(jié)果??梢姷褪录蕦Σ煌?jīng)驗的放射科醫(yī)生的影響是不同的,不能單單從信號檢測論的角度來檢驗醫(yī)學(xué)圖像視覺搜索低事件率的問題。醫(yī)生的專業(yè)水平、人格特點、醫(yī)療風(fēng)險評估以及醫(yī)學(xué)圖像本身復(fù)雜性的特點等都有可能成為影響決策的因素。楊帆 (2011)研究表明被試的判斷標(biāo)準(zhǔn)升高,并不意味著其漏報率也一定升高,還應(yīng)考慮誤報率的變化。本實驗要求被試用鼠標(biāo)點擊目標(biāo)位置,同時又需要用鼠標(biāo)點擊確定性水平,因此排除了被試在低事件率條件下由于反應(yīng)過快,按鍵錯誤引起的漏報錯誤,故而不支持Fleck和Midriff(2007)的抑制失敗說。
對專家與新手在高、低事件率下的漏報錯誤類型進(jìn)行分析,結(jié)果發(fā)現(xiàn),專家和新手在高事件率下的掃描錯誤比例顯著小于低事件率,這說明低事件率效應(yīng)可能是由于低事件率下出現(xiàn)了更多的掃描錯誤導(dǎo)致的。結(jié)合平均眼跳幅度的數(shù)據(jù)來看,低事件率下的平均眼跳幅度顯著大于高事件率,說明這些掃描錯誤可能是由于在低事件率下的眼跳幅度過大,沒有精細(xì)而充分地掃描到目標(biāo)區(qū)域?qū)е碌摹?/p>
在本實驗條件下可以得到以下結(jié)論: (1)專家與新手進(jìn)行醫(yī)學(xué)圖像視覺搜索時均出現(xiàn)低事件率效應(yīng),但專家受低事件率的影響程度遠(yuǎn)遠(yuǎn)小于新手。 (2)專家在高事件率下辨別力更高,高、低事件率的反應(yīng)標(biāo)準(zhǔn)無差異,新手則表現(xiàn)為高事件率下辨別力更高,低事件率條件下反應(yīng)標(biāo)準(zhǔn)變高。(3)低事件率條件下,專家和新手對漏報反應(yīng)圖像的注視次數(shù)變少,平均眼跳幅度變大;低事件率條件下出現(xiàn)的由于掃描錯誤導(dǎo)致的漏報錯誤顯著多于高事件率條件,因此,低事件率效應(yīng)主要是由于掃描錯誤引起的。
賈守勤.(2009).常規(guī)DR胸片對肺結(jié)節(jié)漏診原因的分析 (博士學(xué)位論文).山東大學(xué),濟(jì)南.
李富洪,曹碧華,肖風(fēng),李紅.(2011).抑制控制在極小概率目標(biāo)搜索任務(wù)中的作用.心理學(xué)報,43(5),509-518.
李宇涵.(2014).低事件率效應(yīng)發(fā)生機(jī)制的研究 (碩士學(xué)位論文),河北師范大學(xué),石家莊.
王陵宇.(2015).低事件率效應(yīng)的機(jī)制與對策 (博士學(xué)位論文).中國科學(xué)院,北京.
楊帆.(2011).X光行李檢測中危險品漏報的影響因素和對策 (博士學(xué)位論文).中國科學(xué)院,北京.
Beutel,J.,Kundel,H.L.,&Van Metter,R.L.(2000).Handbook of medical imaging:Physics and psychophysics(Vol.1).Spie Press.
Burgess,A.E.(1999).Producing lesions for hybrid mammograms: Extracted tumors and simulated micro calcifications.Proceedings of SPIE-The International Society for Optical Engineering, 3663,316-322.
Donovan,T.,&Litchfield,D.(2013).Looking for cancer:Expertise related differences in searching and decision making.Applied Cognitive Psychology,27(1),43-49.
Egglin,T.K.,&Feinstein,A.R.(1996).Context bias:A problem in diagnostic radiology.Jama,276(21),1752-1755.
Ericsson,K.A.,Krampe,R.T.,&Tesch-R觟mer,C.(1993).The role of deliberate practice in the acquisition of expert performance.Psychological Review,100(3),363-406.
Ericsson,K.(2006).The influence of experience and deliberate practice on the development of superior expert performance. The Cambridge handbook of expertise and expert performance (pp.685-705).Cambridge:Cambridge University Press.
Ethell,S.C.,&Manning,D.(2001).Effects of prevalence on visual search and decision making in fracture detection.Medical Imaging,4324,249-257.
Evans,K.K.,Birdwell,R.L.,&Wolfe,J.M.(2013).If you don′t find it often,you often don′t find it:Why some cancers are missed in breast cancer screening.Plos One,8(5),e64366.
Fleck,M.S.,&Mitroff,S.R.(2007).Rare targets are rarely missed in correctable search.Psychological Science,18(11),943-947.
Giovinco,N.A.,Sutton,S.M.,Miller,J.D.,Rankin,T.M.,Gonzalez, G.W.,Najafi,B.,&Armstrong,D.G.(2015).A passing glance? Differences in eye tracking and gaze patterns between trainees and experts reading plain film bunion radiographs.The Journal of Foot and Ankle Surgery,54(3),382-391.
Green,D.M.,&Swets,J.A.(1966).Signal detection theory and psychophysics.The Quarterly Review of Biology,42(4),578.
Gur,D.,Bandos,A.I.,Fuhrman,C.R.,Klym,A.H.,King,J.L., &Rockette,H.E.(2007).The prevalence effect in a laboratory environment:Changing the confidence ratings.Academic Radiology,14(1),49-53.
Gur,D.,Rockette,H.E.,Warfel,T.,Lacomis,J.M.,&Fuhrman, C.R.(2003).From the laboratory to the clinic:The″prevalence effect″.Academic Radiology,10(11),1324-1326.
Gur,D.,Sumkin,J.H.,Rockette,H.E.,Ganott,M.,Hakim,C., Hardesty,L.,et al.(2004).Changes in breast cancer detection and mammography recall rates after the introduction of a computer-aided detection system.Journal of the National Cancer Institute,96(3),185-190.
Kunar,M.A.,Rich,A.N.,&Wolfe,J.M.(2010).Spatial and temporal separation fails to counteract the effects of low prevalence in visual search.Visual Cognition,18(6),881-897.
Kundel,H.L.(2000).Disease prevalence and the index of detectability:A survey of studies of lung cancer detection by chest radiography.Proceeding of SPIE,3981,135-144.
Kundel,H.L.(2015).Visual search and lung nodule detection on CT scans.Radiology,274(1),14-16.
Law,B.,Atkins,M.S.,Kirkpatrick,A.E.,Lomax,A.J.,&Mackenzie, C.L.(2004).Eye gaze patterns differentiate novice and experts in a virtual laparoscopic surgery training environment.In A. Duchowski,and R.Vertegan(Eds.),Proceedings of the 2004 symposium on eye tracking research and applications(pp.41-48).San Antonio,TX:Association for Computing Machinery.
Lee,S.L.A.,Kouzani,A.Z.,&Hu,E.J.(2012).Automated detection of lung nodules in computed tomography images:A review.Machine Vision and Applications,23(1),151-163.
Pisano,E.D.,Gatsonis,C.,Hendrick,E.,Yaffe,M.,Baum,J.K., &Acharyya,S.,et al.(2005).Diagnostic performance of digital versus film mammography for breast-cancer screening.New England Journal of Medicine,353(17),1773-1783.
Reed,W.M.,Chow,S.L.C.,Chew,L.E.,& Brennan,P.C. (2014).Can prevalence expectations drive radiologists′behavior?.Academic Radiology,21(4),450-456.
Valente,I.R.S.,Cortez,P.C.,Neto,E.C.,Soares,J.M.,Albuquerque,V.H.C.D.,&Tavares,J.M.R.S.(2016).Automatic 3d pulmonary nodule detection in CT images:A survey. Computer Methods and Programs in Biomedicine,124,91-107.
Van Wert,M.J.,Horowitz,T.S.,&Wolfe,J.M.(2009).Even in correctable search,some types of rare targets are frequently missed. Attention,Perception,&Psychophysics,71(3),541-553.
Wolfe,J.M.,Horowitz,T.S.,&Kenner,N.M.(2005).Rare items often missed in visual searches.Nature,435(7041),439-440.
Wolfe,J.M.,Horowitz,T.S.,Wert,M.J.V.,Kenner,N.M., Place,S.S.,&Kibbi,N.(2007).Low target prevalence is a stubborn source of errors in visual search tasks.Journal of Experimental Psychology General,136(4),623-638.
The Im pact of target prevalence in M edical Image Visual Searching of Novice and Expert Radiologists:Evidence from Eye M ovement
Chen Meixiang1,2,Bai Xuejun1
(1 Key Research Base of Humanities and Social Sciences of Ministry of Education,Academy of Psychology and Behavior,Tianjin Normal University,Tianjin 300074;2 Counseling and Education Center,Xiamen University,Xiamen 361005)
To measure the effect of abnormality-prevalence on novices and experienced radiologists′performance during pulmonary nodular lesion detection on a chest radiograph,SMI250 eye tracker was used to record participants′eye movements.We asked experts and novices to detect chest X-ray in different target prevalence(50%or 10%).The results showed that:1)the miss(false-negative)rate of experts and novices in low prevalence (10%)was significantly higher than that of high prevalence(50%),but the miss rate difference of experts in high and low prevalence was less than that of novices.2)Experts and novices spent less fixation counts but more fixation duration average in low prevalence.In addition,the average saccade amplitude and the scanning error in low prevalence were greater than that in high prevalence.These findings suggested that scanning errors were the main reason for the more miss errors in low prevalence than those in high prevalence.
expert,novice,radiologist,target prevalence,visual search.
B842.1
2017-1-2。
全國文化名家暨四個一批人才項目。
白學(xué)軍,E-mail:bxuejun@126.com。