段慧煜 任曉雨 王琳琳 史芳羽 范磊 翟廣濤
(1.上海交通大學圖像通信與網(wǎng)絡工程研究所,上海 200241;2.上海市董李鳳美康健學校,上海 200233)
孤獨癥譜系障礙(autism spectrum disorder,ASD),也稱自閉癥,是一種神經(jīng)發(fā)育障礙,其主要特征包括表達困難、社會交往障礙、重復刻板的行為及狹隘的興趣[1]。自閉癥的致病原因目前尚不清楚。近年的流行病學調查數(shù)據(jù)顯示,全球范圍內自閉癥患病率呈現(xiàn)上升趨勢,患病率在1%左右。自閉癥患者多預后不良,成年后缺乏獨立生活的能力,給家庭和社會帶來沉重負擔。但研究發(fā)現(xiàn)早期確診和早期干預治療可顯著改善自閉癥患者的核心癥狀,呈現(xiàn)較好的預后效果[2]。
社會交往障礙被認為是自閉癥的核心特征之一。作為社交障礙的重要表象,非典型的視覺注意經(jīng)常出現(xiàn)在自閉癥患者身上[3],即患有自閉癥的人對各種視覺刺激,尤其是在有關社會交流活動的視覺刺激(如人臉、文字等)上經(jīng)常表現(xiàn)出非典型的視覺注意[4]。因此,學習這種非典型的視覺注意可以幫助我們更好地了解自閉癥。
針對自閉癥患者視覺注意的研究已取得了一些成果。Dawson等人[4]證實自閉癥患者對面部、聲音、手勢等社會性刺激的關注減少,對非社會性刺激的關注增加,且對社會和聯(lián)合注意行為的減少。然而先前這些研究絕大部分都使用了限制性或非自然的刺激,如獨立的面部和物體,或者是只有低語義特征的刺激,這限制了對自閉癥共同特征的探索。
眼球運動編碼了大量有關個體的注意力、動眼神經(jīng)控制和個人心理因素的信息。與眼跳和注視有關的眼動特征已經(jīng)被證明在識別精神狀態(tài)、認知過程和神經(jīng)病理學方面具有價值[5-7]。因此,分析自閉癥兒童的眼球運動,能夠在一定程度上描述自閉癥的特征,有助于自閉癥的診斷。
針對自閉癥的眼球運動研究也取得了一些成果。Tseng 等人[6]的研究分析了人類觀看短視頻時的注視模式,將其與低層特征結合,證實了納入視覺注意在識別特殊疾病方面的優(yōu)勢。但該工作并沒有考慮高層語義特征和社會信息。隨著機器學習的發(fā)展,高層語義特征可以很容易地被提取。Wang 等人[8]使用線性支持向量機(SVM),首次通過多層次特征量化了自閉癥患者的非典型視覺注意,并證實自閉癥患者的注視模式有更強的中央偏好,對低層特征的關注度更高,對高層語義特征的關注度更低。但該工作依賴于人工標記提取的特征。隨著深度學習的快速發(fā)展,物體檢測走向成熟,使機器提取物體特征成為可能。Liu 等人[9]提出了一種機器學習方法,基于他們在人臉識別任務中的注視模式,對自閉癥患者與對照組進行分類。但該工作高度依賴于自閉癥患者的現(xiàn)有認知,因此很難推廣到不同教育水平的個體。隨著深度神經(jīng)網(wǎng)絡(deep neural networks,DNN)的發(fā)展,對于自閉癥患者非典型視覺注意的研究取得了很大進展。Jiang等人[10]應用深度神經(jīng)網(wǎng)絡提取了眼球運動特征,并用于微調一種顯著性預測算法,以對被試進行分類,結果證明他們的工作獲得了更好的表現(xiàn)。Duan 等人[11]建立了孤獨癥兒童顯著性預測(SPCA)數(shù)據(jù)庫,并微調了四個基于深度神經(jīng)網(wǎng)絡的顯著性預測模型,以研究自閉癥兒童的注視模式。
之前的針對自閉癥眼動的研究還存在著一些共性的不足之處。例如,這些研究所采用的圖像刺激都受限于研究人員的預期選擇和攝影師的有限視野(field of view,F(xiàn)OV),而他們都不曾患有自閉癥。此外,這些研究所使用的大多是在被試處于“被動”觀察情況下的眼動數(shù)據(jù),即在頭部固定的狀態(tài)下對平面圖像進行觀察的眼動數(shù)據(jù)。然而事實上,積極的觀看條件影響知覺加工。在“被動”狀態(tài)下,被試只能通過眼球運動探索單一視野的場景。相反,在“主動”狀態(tài)下,人們會通過眼球轉動、頭部轉動和身體運動積極地探索周邊場景[12-13]。因此,這種“被動”狀態(tài)下采集到的數(shù)據(jù)并不能完全展示出被試的視覺注意。并且這些平面圖像大多顯示在與現(xiàn)實世界相比視野受限且相對較小的屏幕上,對于這些圖片和對于真實世界的語義感知依舊存在很大差異?,F(xiàn)實中自閉癥患者的視覺注意仍是未知的。
針對上述研究的不足,本文選擇應用360°全景圖像,在虛擬現(xiàn)實(VR)環(huán)境下收集眼球追蹤數(shù)據(jù),建立了首個大規(guī)模的全景圖像ASD 眼動數(shù)據(jù)集;改進了三層顯著性計算模型[14],使用物體檢測和深度估計等算法取代人工標記,對數(shù)據(jù)集中所有圖像的特征進行量化;從對不同特征的視覺關注度,到頭眼運動的區(qū)別與聯(lián)系,進行了對自閉癥兒童在現(xiàn)實世界中非典型視覺注意的定性與定量分析,得出自閉癥兒童的非典型視覺注意特征:對場景中的焦點和社會性信息的關注較低,且在人臉不突出且未表達出與觀察者互動傾向的場景中,其視覺注意往往更局限;對圖像深度、赤道及背景特征的關注度更高,對圖像語義級特征的關注度更低;在室外場景中,中心偏好更弱,且更傾向于向下看;頭眼運動的協(xié)調性更低等。這有助于進一步了解自閉癥,也有助于相關的應用領域,如診斷[10,15]和預后康復[16]。
文中剩余內容分為四個部分,第一部分介紹了全景圖像ASD 眼動數(shù)據(jù)集及其構建;第二部分介紹了改進的三層顯著性計算模型;第三部分分析了自閉癥兒童在現(xiàn)實世界中的非典型視覺注意;第四部分總結全文。
本實驗從兩個大規(guī)模全景圖像數(shù)據(jù)集中選取了300 張高分辨率全景圖像,其中85 張選自Salient360 數(shù)據(jù)集[17],215 張選自SUN360 數(shù)據(jù)集[18]??紤]到自閉癥患者/非自閉癥患者對社會性/非社會性刺激的視覺注意的差異,還平衡了數(shù)據(jù)集中各圖像所包含的語義信息。如圖1 所示,選取的圖像中包含各種像素級、物體級和語義級信息,也囊括室內場景、室外場景、城市風景、自然風景、物體、人群等多種圖像類別。
圖1 本數(shù)據(jù)集中的圖像樣本Fig.1 Sample stimuli of the database
本實驗使用HTC Vive Pro Eye 來展示全景圖像刺激并收集眼動數(shù)據(jù)。該設備采用雙OLED 顯示器,分辨率為2880×1600 像素,視場角為110°,刷新率為90 Hz。該設備含有內置眼動儀,采用五點校準,數(shù)據(jù)輸出頻率(雙目)為120 Hz,可以進行精準眼動態(tài)追蹤。軟件系統(tǒng)通過Unity3D 平臺搭建,用于控制實驗過程和記錄所有數(shù)據(jù)。
本實驗共有被試31 名,其中包括15 名自閉癥兒童和16 名健康兒童(typically developing,TD)。所有自閉癥被試都屬中高功能自閉癥,可以滿足實驗要求。自閉癥被試的年齡從7 歲至13 歲不等,平均年齡為10.4 歲。健康兒童作為對照被試,年齡從7 歲至9.6 歲不等,平均年齡為8 歲。除年齡外,兩組被試的性別、慣用手和表現(xiàn)智商也是匹配的。實驗前,所有被試的父母都閱讀并簽署了知情同意書。實驗中,所有被試的視力都正?;虺C正正常。
具體的實驗過程包括以下幾個步驟:VR 設備使用練習、校準和正式采集數(shù)據(jù)。在VR 設備練習階段,被試佩戴VR 設備HTC Vive Pro Eye,首先進行兩次全景圖像的觀察,以確保被試在開始正式實驗之前已經(jīng)適應了在虛擬環(huán)境中的觀察。完成練習階段之后,執(zhí)行眼動儀校準程序,以驗證眼球追蹤的準確性,確保數(shù)據(jù)的可靠性。
關于正式眼動數(shù)據(jù)采集,目前有三種在VR 環(huán)境下進行眼球追蹤實驗的方法。Rai 等人[17]進行了被試坐立情況下自由探索場景的眼球追蹤研究。Sitzmann等人[19]進行了被試在坐立和站立兩種情況下自由探索場景的眼球追蹤研究。Haskins 等人[20]選擇在被試坐立情況下進行眼球追蹤,但與此同時全景圖像會以恒定速度旋轉??紤]到自閉癥兒童可能存在的認知和交流障礙,分別采取以下兩種情況進行了兩次實驗:
站立情況:第一次實驗中,被試在站立情況下,通過設備的頭戴式顯示器(HMD)自由觀察探索200 張全景圖像??紤]到ASD 被試缺乏耐心,和被試眼部疲勞會導致所采集數(shù)據(jù)準確性降低等問題,將實驗劃分為20 組,每組包含10 幅全景圖像。實驗過程中,每幅圖像顯示20 秒,圖像之間有1 秒的灰屏作為分隔。一組10幅圖像觀察完成后,被試會進行短暫的休息。休息完畢后,再次執(zhí)行眼動儀校準程序,校準完成后開始下一組圖像觀察。
坐立情況:由于Haskins 等人[20]的方法易引起眩暈,本文提出一種改進方法。第二次實驗中,被試被指示坐在一個固定的椅子上觀察100張全景圖像。實驗劃分為10 組,每組包含10 幅全景圖像,每幅圖像顯示20 秒,但每5 秒會旋轉90°。其他設置均與站立情況相同。
在被試觀察過程中,由設備自動記錄被試的頭動、眼動數(shù)據(jù)和時間戳等信息。
全景圖像ASD 眼動數(shù)據(jù)集包含300 張全景圖像,以及相對應的眼動數(shù)據(jù)。目前為止,已采集到15名自閉癥兒童與16名健康兒童觀察300張圖像所得到的總8639組有效眼動數(shù)據(jù),因校準失敗和因其他原因導致觀察時長不足等異常數(shù)據(jù)已被去除。數(shù)據(jù)集中每張全景圖像的平均觀察者總數(shù)為28人,平均每張圖片的自閉癥觀察者為12 人,健康觀察者為16人。
眼動數(shù)據(jù)包含:時間戳、眼球注視點在觀察球面上的三維直角坐標、頭部所在位置的三維直角坐標和頭部旋轉的姿態(tài)角。
由于圖像尺寸原因,最終只有299 張全景圖像被用于后續(xù)研究。需要注意的是,為了規(guī)范計算,數(shù)據(jù)集中所有全景圖像都被重新調整尺寸至900×450(寬×高)。
本文改進的三層顯著性計算模型如圖2 所示。主要在所考慮圖像特征及其提取方法上進行改進,使模型適用于自閉癥兒童非典型視覺注意的分析。
圖2 三層顯著性計算模型概述Fig.2 Computational saliency model
為了更好地對比分析自閉癥兒童在現(xiàn)實世界中的非典型視覺注意,高級特征十分關鍵。原三層顯著性計算模型考慮像素級特征(顏色、亮度、方向),物體級特征(尺寸、復雜度、凸度、實心度、偏心率),語義級特征等三級特征,和背景特征[14]。針對全景圖像ASD 眼動數(shù)據(jù)集,本文改進了三層顯著性計算模型所考慮的圖像特征,各特征的詳細描述可見表1,具體改進如下所述:
表1 三層顯著性計算模型使用的圖像特征總結[8]Tab.1 Summary of all features used in the three-layered computational saliency model[8]
(1)更改語義級特征的分類
比起物體級特征,人類更傾向于將視覺注意集中在語義實體上。人類和靈長類動物有專門的神經(jīng)系統(tǒng)用來處理人類面孔這種視覺刺激[21]。研究表明,人類的視覺注意偏向于關注人類面部[22]。本文的主要研究目的不在于分析各語義級特征對視覺注意影響的差異。因此,本文假設各物體都具有一定語義屬性,且只將“人類”這一語義屬性單獨考慮,其余語義屬性都被歸為“其他”。
對于數(shù)據(jù)集中每張包含物體的全景圖像,對其所蘊含的語義級特征進行評分,1 代表該物體蘊含該語義級特征,0代表該物體不蘊含該語義級特征。
(2)增加全景圖像赤道特征
Wang 等人[8]證實了人類的視覺注意更被平面圖像的中心區(qū)域所吸引,而自閉癥患者的注視模式有更強的中央偏好。Rai 等人[17]證實了對于全景圖像觀察,人類對圖像赤道區(qū)域的注視更加頻繁,卻不顯示對于特定經(jīng)度的偏好。本文考慮被試對全景圖像赤道區(qū)域的視覺注意。
(3)增加全景圖像深度特征
研究表明,在三維場景中,深度這一線索被人類用于理解周圍的環(huán)境,并在視覺顯著性中發(fā)揮著重要作用[23-24]。
(1)像素級特征的提取
像素級特征圖依舊根據(jù)Itti等人的算法生成[14]。
(2)物體級、語義級和背景特征的提取
關于顯著性的一些重要特征只能通過物體的精細輪廓分割來測量。比如凸度是一個重要的物體級特征,低凸度的物體一般表示被其他物體所遮擋的物體。如果使用方形邊界框,這個特征就會丟失。因此,需要數(shù)據(jù)集各圖像中物體的種類及精細分割的掩膜。Xu 等人[14]使用了一種交互式手動物體分割工具[25]進行人工標記提取特征。但手動提取物體特征需要大量的人力和時間資源,且可能受到個人偏好的影響。
本文為了改進該不足,經(jīng)過對比選擇Cascade Mask R-CNN 物體檢測算法,由于出現(xiàn)在本數(shù)據(jù)集中圖像上的物體多為日常事物,故應用MMlab 開源代碼庫mmdetection 模塊[26]中在coco 數(shù)據(jù)集上的預訓練模型Cascade Mask R-CNN X-101-32x4d-FPN(具體參數(shù)見表2),來識別圖像中所有像素點的類別。為每張全景圖像中每個識別出的物體生成一張完整的mask 掩膜,包含該物體的像素點為1,其余為0;并標注了其蘊含的語義屬性,如人類或其他物體。而沒有包含任何物體的圖像區(qū)域則被視為背景。
表2 預訓練模型參數(shù)Tab.2 Pre-trained model parameters
物體級和語義級特征圖的生成方法,是在每個物體的中心放置一個σ=12°的二維高斯核,選用依據(jù)與文章[14]相同。再與計算得出的物體級/語義級特征數(shù)值相乘,最后歸一化得到物體級/語義級特征圖。背景特征圖的生成方法,是將圖像上所有包含物體的像素點設為0,不包含物體的像素點設為1。
(3)全景圖像深度特征的提取
為了提取深度特征,在全景圖像ASD 眼動數(shù)據(jù)集上應用了SliceNet[27],BiFuse[28],UniFuse[29],Ho-HoNet[30],ACDNet[31]五種專為全景圖像設計的深度估計算法,對比結果后,最終選擇了在本數(shù)據(jù)集上表現(xiàn)最好的ACDNet。從結果中可以看出,此算法在室內和室外場景中均工作良好。但在全景圖像南北兩極處皆存在畸變情況,這是全景圖像深度估計算法的通病。但在實際采集數(shù)據(jù)實驗中,被試很少會觀察天和地,也就是全景圖像中南北兩極的位置。因此,選擇遍歷深度圖,用顏色最深處的灰度值覆蓋每張深度圖的畸變處,以生成最終的全景圖像深度特征圖。
(4)全景圖像赤道特征的提取
全景圖像赤道特征圖的生成方法為:首先生成一張900×450 的全黑圖片,將圖片赤道設成1,再在經(jīng)度方向上應用σ=1°的一維高斯濾波。
本文使用SVM 來評估六個因素對視覺注意分配的影響程度:全景圖像赤道特征、全景圖像深度特征、背景特征、像素級特征、物體級特征以及語義級特征。相應特征圖被用來訓練三層顯著性計算模型(見圖2)。為了訓練和測試這個模型,將數(shù)據(jù)集分為240張訓練圖像和59張測試圖像[14]。
需要注意的是,由于等距柱狀投影的全景圖像并不能完全反映被試在VR 環(huán)境下看到的真實場景[32],且在南北兩極處存在畸變,本文將等距柱狀投影的全景圖像分割成六個立方投影,并在立方投影上也完成了特征提取工作。事實上,在訓練模型的過程中使用到的特征圖,除了全景圖像赤道和深度的特征圖以外,都是由立方投影的特征圖再轉成等距柱狀投影的。具體過程如下:
首先,基于全景圖像ASD 眼動數(shù)據(jù)集中的眼動數(shù)據(jù),生成對應的注視點圖,注視點密度圖,以及熱度圖。
然后,計算出數(shù)據(jù)集中每張全景圖像的赤道和深度特征圖。再將全景圖像轉換為立方投影,計算出對應的像素級、物體級、語義級以及背景特征圖,再將這些立方投影的特征圖轉回等距柱狀投影。
最后,分別對于ASD 組和TD 組的數(shù)據(jù),完成兩個三層顯著性計算模型的訓練和測試,得出顯著性權重。
基于全景圖像ASD 眼動數(shù)據(jù)集,本文對比不同場景中自閉癥兒童和健康兒童的視覺注意分布熱度圖,以分析其視覺注意的差異和相似性。如圖3所示,熱度越高,被試注視該區(qū)域的時間越長。
圖3(a)~圖3(c)表明,比起健康兒童,自閉癥兒童對人臉的視覺注意集中程度更低,相對來說目光更為發(fā)散。此外,自閉癥兒童還會被場景中人臉以外的物體所吸引,比如圖3(a)中的方向盤,圖3(b)中的掛畫和圖3(c)中的樹。圖3(d)~圖3(h)展現(xiàn)了自閉癥患者的核心特征,即社會交往障礙,他們對非社會性信息的視覺注意增加,而健康兒童則傾向于對社會性信息給予更多的關注。另外,如圖3(d)和圖3(g),在人臉不突出且未表達出與觀察者互動傾向的場景中,健康兒童的注意力分布范圍較廣,而自閉癥兒童往往局限于某個或某些部分,從這個角度來說,健康兒童比自閉癥兒童表現(xiàn)出對整個場景更強的探索行為。并且,如圖3(g)和圖3(h)所示,自閉癥兒童比較缺乏信息整合的能力,他們對場景中主要焦點的關注度降低。圖3(i)和圖3(j)表明,對于不含人的室外場景、語義信息的空間分布相對均勻的場景,或者是非社交場景來說,自閉癥兒童和健康兒童在整個場景中的全局視覺注意是相似的。
圖3 不同場景中自閉癥兒童(上)和健康兒童(下)的視覺注意分布熱度圖Fig.3 Visual attention of autistic children(top)and healthy controls(bottom)
三層顯著性計算模型為每個特征輸出一個顯著性權重,代表該特征對預測視覺注意力分配的相對貢獻。從圖4 中可以看出,兩組被試觀察圖像時都有較強的赤道偏好,這是符合預期的。值得注意的是,自閉癥兒童對于圖像赤道特征的偏向明顯更強,但是對于語義級特征的偏向明顯減低。
圖4 分組特征的顯著性權重Fig.4 Saliency weights of subgroup features
本文也針對兩組眼動數(shù)據(jù)生成的注視點密度圖和特征圖,計算了常用的顯著性評價指標,即CC、SIM 和NSS,統(tǒng)計細節(jié)見圖5(星號*表示經(jīng)過U 檢驗,自閉癥與健康受試者的數(shù)據(jù)存在顯著差異:*p<0.05,**p<0.01,***p<0.001)??梢钥闯鲎蚤]癥兒童對于全景圖像深度、赤道和背景這三個特征的偏好更強,這驗證了上一節(jié)中定性分析自閉癥兒童觀察特征的結論,即自閉癥兒童會減少對圖像中物體的關注,而傾向于關注不含任何語義信息的圖像背景。還驗證了先前研究得出的自閉癥兒童的注視模式特征,即他們有更強的中央偏好(對于全景圖像來說為赤道偏好),且傾向于觀察更遠的地方[8]。此外,對于赤道特征來說,三個評價指標的對比都具有統(tǒng)計意義,因此進一步研究自閉癥兒童與健康兒童的赤道偏好是有意義的。
圖5 分組特征的顯著性評價指標Fig.5 Saliency metrics of subgroup features
為了分析自閉癥兒童與健康兒童的赤道偏好,本文計算了每張全景圖像的注視點的緯度,以1°為最小區(qū)間,統(tǒng)計每個區(qū)間內注視點的數(shù)量,最后將全部圖像的注視點數(shù)量相加得到總和,進行歸一化處理后,得到兩組被試注視點頻率關于緯度的分布圖,如圖6(a)和圖6(b)所示。可以看出對于本數(shù)據(jù)集而言,兩組被試在全景圖像上的視覺注意力分布都是赤道附近最多,向兩極呈遞減趨勢。并且,兩組被試都有向下看的傾向。
Fang 等人[15]證實,對于高層語義信息含量較低的室外場景,如街道場景和自然場景,健康兒童的中心偏好往往更明顯。本文選取了數(shù)據(jù)集中符合條件的75張圖像,并同樣得出該類型場景下兩組被試注視點頻率關于緯度的分布圖,如圖6(c)與圖6(d)所示??梢钥闯鲈谶@類場景中,健康兒童注視模式對于赤道附近區(qū)域的偏向更加顯著。此外,自閉癥兒童向下看的偏好更加明顯。通過高斯擬合(擬合系數(shù)見表3)可以得出,自閉癥兒童注視點的緯度中心更靠下,且其擬合曲線的寬度更寬。這也許可以說明在室外場景中,自閉癥兒童的“赤道集中”偏好沒有健康兒童強烈。
表3 高斯函數(shù)擬合系數(shù)(室外場景)Tab.3 Gaussian function fitting coefficients(outdoor scenes)
圖6 注視點頻率關于緯度的分布圖及其高斯擬合((a):ASD,(b):TD,(c):ASD室外,(d):TD室外)Fig.6 Frequency of fixations for each latitude and Gaussian curve approximation((a):ASD,(b):TD,(c):ASD outdoor,(d):TD outdoor)
眼球運動通常受到頭部運動的影響,頭部運動與眼球運動通常是相關聯(lián)的[33]。事實上,在VR 環(huán)境中觀察全景圖像時,眼前顯示的場景會隨著頭部的旋轉和身體的平移而發(fā)生相應的變化[17]。因此,研究頭部運動及眼球運動的協(xié)調性,也有助于分析自閉癥兒童的非典型視覺注意。
為了研究頭眼運動的區(qū)別與聯(lián)系,生成了基于頭部運動的“注視點密度圖”和熱度圖,部分熱度圖如圖7 所示??梢钥闯鰧τ趦山M被試而言,頭部運動和眼球運動的存在范圍基本一致,符合頭眼運動的協(xié)調性。但是頭眼運動得出的熱度圖也存在差異。首先,兩組熱度圖的注視焦點,即熱度最高的區(qū)域的中心位置存在偏差。因為根據(jù)頭動數(shù)據(jù)生成頭動“注視點密度圖”,是基于眼球注視點為頭部所對視口的中心點這一假設的,然而事實上在探索場景時,被試的眼球并不總是正視前方。此外,頭動熱度圖在分布上呈連續(xù)趨勢,而眼動熱度圖呈點狀分布的特點。這是因為在觀察過程中,頭部的運動趨勢比較平緩,大多是連續(xù)的過程,而眼球的運動相比之下更具有跳躍性,從一個注視點到另一個注視點的空間跨度更大。經(jīng)過對兩組頭眼運動熱度圖,可以發(fā)現(xiàn)自閉癥兒童頭部運動與眼球運動的協(xié)調性更低。這可以從某些角度解釋一個通常的現(xiàn)象,即自閉癥在社交時,其面部朝向社交事物,而眼睛看向其他方向。
圖7 頭動熱度圖(上)與眼動熱度圖(下)Fig.7 Heat map of head movement(top)and heat map of eye movement(bottom)
在整個數(shù)據(jù)集上,計算了每幅圖像所對應的頭動與眼動“注視點密度圖”之間的CC,結果如圖8 所示。可以得出自閉癥兒童比健康兒童的頭眼運動的相關性更低,自閉癥兒童的頭眼運動協(xié)調性低于健康兒童。
圖8 頭動和眼動“注視點密度圖”的相關系數(shù)分布Fig.8 CC between the fixation density map of head movement and the fixation density map of eye movement
本文構建了首個全景圖像ASD 眼動數(shù)據(jù)集。基于該數(shù)據(jù)集,改進了三層顯著性計算模型,使其更適用于自閉癥兒童眼動分析。通過對比分析,得出自閉癥兒童的非典型視覺注意特征:對場景中的焦點和社會性信息的關注較低,且在人臉不突出且未表達出與觀察者互動傾向的場景中,其視覺注意往往更局限;對圖像深度、赤道及背景特征的關注度更高,對圖像語義級特征的關注度更低;在室外場景中,中心偏好更弱,且更傾向于向下看;頭眼運動的協(xié)調性更低。本文得出的結論有助于了解自閉癥,眼動分析或許有助于自閉癥新型診斷工具的開發(fā)。但分析方向不夠全面,今后的研究中需要通過增加對被試的個人情況(如智商、逆商和年齡)、注視點演變、凝視時長等,和各圖像特征之間的相互影響的分析,進一步得出自閉癥視覺注意的特征。