倪華 王秀紅
摘要:隨著信息社會(huì)的發(fā)展,信息檢索面臨著冗余的問(wèn)題,大量無(wú)序的檢索結(jié)果加大了用戶獲得有效信息的難度,降低了效率。文章通過(guò)將基于眼動(dòng)技術(shù)的閱讀實(shí)驗(yàn)指標(biāo)加入到研究信息檢索的優(yōu)化過(guò)程,構(gòu)建了基于眼動(dòng)指標(biāo)的檢索結(jié)果排序賦分方法,增加了現(xiàn)有信息檢索的用戶數(shù)據(jù)來(lái)源維度,優(yōu)化了檢索結(jié)果排序的算法體系,能夠更好的促進(jìn)信息檢索系統(tǒng)的發(fā)展。
關(guān)鍵詞:眼動(dòng);信息檢索;優(yōu)化;應(yīng)用
一、引言
隨著現(xiàn)代信息網(wǎng)絡(luò)的迅猛發(fā)展,信息的檢索在人們獲取信息的途徑中占到了主要的地位。同時(shí),隨著信息的日益增多,用戶在進(jìn)行檢索時(shí)往往遇到檢索結(jié)果內(nèi)存在大量沒(méi)有用或者不關(guān)聯(lián)的信息。例如實(shí)用百度搜索引擎搜索關(guān)鍵詞“蘋(píng)果”,其相關(guān)結(jié)果約100,000,000個(gè),在首界面中包含蘋(píng)果公司的股票信息,計(jì)算機(jī)公司蘋(píng)果的官方網(wǎng)站,蘋(píng)果的制作方法,蘋(píng)果的營(yíng)養(yǎng)成分以及電影等許多雜亂信息,影響了用戶體驗(yàn)和信息獲取的效率。為了改善用戶對(duì)搜索的體驗(yàn),提高用戶獲得所需要檢索結(jié)果的效率,并設(shè)計(jì)出具有更好交互性能的檢索系統(tǒng)是目前十分重要的研究方向。
國(guó)內(nèi)外目前研究用戶信息搜尋行為最常用的方法是基于點(diǎn)擊日志分析法,通過(guò)分析大量的歷史點(diǎn)擊數(shù)據(jù)記錄或查詢(xún)?nèi)罩?,從而發(fā)現(xiàn)用戶在搜索過(guò)程中的一般行為特征及其規(guī)律特性。但是,雖然能有助于了解用戶的某些行為習(xí)慣,但是很難進(jìn)行用戶的特征識(shí)別,同時(shí)日志文件的更新頻率不是即時(shí)的,不能準(zhǔn)確的反映用戶的真實(shí)意圖以及內(nèi)在的心理特征和行為特征。眼動(dòng)技術(shù)的出現(xiàn),為信息檢索研究提供了新的途徑,它提供了實(shí)施更新的數(shù)據(jù)集以及直觀的可視化工具,使研究方法得到有效的補(bǔ)充。
二、眼動(dòng)數(shù)據(jù)的產(chǎn)生與記錄
眼動(dòng)記錄的實(shí)現(xiàn)主要借助于實(shí)驗(yàn)的方法,原理上,通過(guò)眼動(dòng)設(shè)備加工來(lái)自紅外線眼球攝像機(jī)所記錄的視頻信息,從而識(shí)別和確定瞳孔中心和眼角膜反射點(diǎn)之間的距離變化。通過(guò)測(cè)量這些點(diǎn)的x軸和y軸方向的向量距離,得到各個(gè)注視點(diǎn)的坐標(biāo),從而獲得眼動(dòng)的精確值,從而得到實(shí)現(xiàn)追蹤的完整過(guò)程。目前的實(shí)驗(yàn)設(shè)備主要是非侵入式眼動(dòng)儀,采用外部顯示的模式,不干擾讀者的閱讀,從而數(shù)據(jù)的獲取更加易用和準(zhǔn)確。由于是非侵入式的眼動(dòng)設(shè)備進(jìn)行實(shí)驗(yàn),受測(cè)者無(wú)需佩戴頭盔,配戴眼鏡,這樣可以允許較大的頭動(dòng)范圍。
同時(shí),基于瞳孔漂移補(bǔ)償算法能保證容許較大的光線差別,同時(shí)適合明亮?xí)r瞳空和黑暗時(shí)瞳孔追蹤。設(shè)備高效的雙眼追蹤可研究受測(cè)者的單只眼動(dòng)情況,在不同的環(huán)境光條件和較大的頭部運(yùn)動(dòng)條件下仍然可保證穩(wěn)定追蹤性能。
實(shí)驗(yàn)的一般步驟如下:
1. 實(shí)驗(yàn)前,完成實(shí)驗(yàn)設(shè)備的架設(shè)工作,邀請(qǐng)受測(cè)者填寫(xiě)測(cè)前問(wèn)卷,用來(lái)了解受測(cè)者的閱讀和檢索習(xí)慣等,為后期實(shí)驗(yàn)結(jié)果的處理做準(zhǔn)備。
2. 實(shí)驗(yàn)為受測(cè)者逐一進(jìn)行實(shí)驗(yàn),每一位受測(cè)者單個(gè)進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)時(shí)的坐姿注意保持,適當(dāng)注意身體與屏幕的距離。妥善安放受測(cè)者的手機(jī)等個(gè)人物品,既不打擾試驗(yàn)運(yùn)行也保障受測(cè)者的個(gè)人物品不會(huì)丟失。
3. 調(diào)整受測(cè)者的坐姿使受測(cè)者達(dá)到舒適的程度,調(diào)整椅子距離屏幕的距離,使得受測(cè)者與屏幕的距離為一個(gè)設(shè)備可以接納的固定值,采用九點(diǎn)定標(biāo)法,對(duì)受測(cè)者的視線進(jìn)行校準(zhǔn),保證定標(biāo)結(jié)果顯示良好。
4. 在實(shí)驗(yàn)準(zhǔn)備工作進(jìn)行結(jié)束后,在經(jīng)過(guò)受試者同意并確認(rèn)實(shí)驗(yàn)的有關(guān)要求了解的情況下正式開(kāi)展實(shí)驗(yàn)。實(shí)驗(yàn)中,被測(cè)者逐一閱覽實(shí)驗(yàn)材料,實(shí)驗(yàn)將持續(xù)進(jìn)行,直到試驗(yàn)結(jié)束后,測(cè)試界面跳回到初始界面。
5. 試驗(yàn)完成后,進(jìn)行數(shù)據(jù)保存,被試者的身份信息將會(huì)被匿去,發(fā)放實(shí)驗(yàn)津貼給參與實(shí)驗(yàn)的被測(cè)人員,后期開(kāi)展實(shí)驗(yàn)數(shù)據(jù)的分析。
三、通過(guò)分析眼動(dòng)數(shù)據(jù)得到檢索優(yōu)化指標(biāo)
興趣區(qū)(Area of Interest,AOI)是對(duì)實(shí)驗(yàn)材料畫(huà)出的特定區(qū)域,用來(lái)表達(dá)被測(cè)者在某一區(qū)域內(nèi)的眼動(dòng)表現(xiàn)。
眼動(dòng)實(shí)驗(yàn)記錄的主要指標(biāo)主要由關(guān)注度指標(biāo)和操作性指標(biāo)兩種指標(biāo)構(gòu)成。
關(guān)注度是指界面上興趣區(qū)(AOI)對(duì)于用戶的吸引力的大小。
操作性是指界面上的興趣區(qū)對(duì)用戶使用績(jī)效的影響。
通過(guò)將閱讀領(lǐng)域中眼動(dòng)研究指標(biāo)選擇的相關(guān)文獻(xiàn),結(jié)合實(shí)驗(yàn)的實(shí)際數(shù)據(jù)表現(xiàn),信息檢索分析過(guò)程中采用的基于眼動(dòng)的行為數(shù)據(jù)有平均訪問(wèn)時(shí)間、平均注視次數(shù)和瞳孔直徑比作為衡量某條檢索結(jié)果的用戶興趣度值是十分合理的。
(一)用戶訪問(wèn)時(shí)間(T)
人類(lèi)視覺(jué)的主要信息都是從注視的場(chǎng)景中獲得的,訪問(wèn)是指一段從首個(gè)注視點(diǎn)出現(xiàn)在興趣區(qū)到下一個(gè)注視點(diǎn)移出興趣區(qū)的這段總時(shí)間。
(二)用戶注視次數(shù)(C)
注視是指眼睛相對(duì)同步在相對(duì)穩(wěn)定的狀態(tài)下一段時(shí)間內(nèi)(通常是80~200毫秒),個(gè)體眼球停留在某一個(gè)點(diǎn)。當(dāng)眼球?qū)ψ⒁暤膬?nèi)容加工結(jié)束時(shí),則出現(xiàn)眼跳,開(kāi)始下一次注視。注視的次數(shù)反映了被測(cè)試者的信息加工熟練程度、加工策略以及閱讀材料對(duì)受測(cè)者的難易程度,該參數(shù)是估計(jì)用戶興趣度的最好的行為指標(biāo)之一。
(三)瞳孔直徑比(E)
有研究表明,瞳孔直徑與情緒、動(dòng)機(jī)和態(tài)度有關(guān)。瞳孔大小變化在一定程度上反映了人的心理活動(dòng)情況,如心負(fù)荷、語(yǔ)言加工。瞳孔擴(kuò)大是心理努力的敏感指標(biāo)。讀書(shū)入迷的人和對(duì)某些事物感到濃厚興趣的人,他們的瞳孔都會(huì)不同程度地放大。將用戶在某一檢索結(jié)果內(nèi)所有注視的瞳孔直徑的平均值作為平均瞳孔直徑。
四、眼動(dòng)研究數(shù)據(jù)在檢索結(jié)果優(yōu)化中的應(yīng)用
眼動(dòng)數(shù)據(jù)是用戶在實(shí)驗(yàn)的過(guò)程中記錄的大量信息,為了便于宏觀計(jì)量,一般眼動(dòng)儀提供了兩種數(shù)據(jù)的表現(xiàn)形式:直觀的數(shù)據(jù)熱點(diǎn)圖和實(shí)時(shí)記錄的數(shù)值記錄。
數(shù)據(jù)熱點(diǎn)圖是系統(tǒng)經(jīng)過(guò)計(jì)算的本次實(shí)驗(yàn)所記錄的信息的直觀表達(dá),如圖1和圖2所示。該圖可以直觀反映被測(cè)者凝視時(shí)間最長(zhǎng)的部分,深顏色的紅色則表示被測(cè)者在閱讀過(guò)程中關(guān)注的部分,淺色的綠色代表注視時(shí)間較短的部分,兩種顏色之間過(guò)渡的顏色表示被測(cè)者關(guān)注點(diǎn)以外的其他視覺(jué)停留點(diǎn)。
實(shí)時(shí)記錄的數(shù)據(jù)在實(shí)驗(yàn)結(jié)束后,由研究者從系統(tǒng)后臺(tái)進(jìn)行數(shù)據(jù)導(dǎo)出,經(jīng)過(guò)數(shù)據(jù)的整理和計(jì)算,最后得出的數(shù)據(jù),通過(guò)預(yù)先設(shè)定程序,系統(tǒng)也可以通過(guò)自身進(jìn)行實(shí)時(shí)運(yùn)算。
五、結(jié)論與啟示
根據(jù)數(shù)據(jù)集,可以得出眼動(dòng)在信息檢索排序過(guò)程中的排序得分算法:
Rankscore(eye)=T×WeightT+C×WeightC+E×WeightE(公式1)
其中weight為相關(guān)指標(biāo)的權(quán)重值。
從科研角度分析,瞳孔直徑比(E)是無(wú)量綱數(shù),而平均訪問(wèn)時(shí)間(T)、平均注視次數(shù)(C)是有量綱量,在進(jìn)行統(tǒng)一的權(quán)重計(jì)算時(shí),不能直接進(jìn)入公式1的計(jì)算。進(jìn)而,要對(duì)平均訪問(wèn)時(shí)間(T)、平均注視次數(shù)(C)進(jìn)行歸一化處理,將其統(tǒng)一轉(zhuǎn)化為無(wú)量綱量。將平均訪問(wèn)時(shí)間(T)轉(zhuǎn)化為該檢索結(jié)果中用戶平均訪問(wèn)時(shí)間與該用戶被記錄的所有檢索結(jié)果平均訪問(wèn)時(shí)間之比T;將平均注視次數(shù)(C)轉(zhuǎn)化為該檢索結(jié)果中用戶平均注視次數(shù)與該用戶被記錄的所有檢索結(jié)果平均注視次數(shù)之比C。
Rankscore′×WeightT+C′×WeightC+E×WeightE(公式2)
總體而言,在創(chuàng)新性方面,本指標(biāo)體系的構(gòu)建是基于實(shí)驗(yàn)得出的量化的,實(shí)時(shí)的反饋數(shù)據(jù),相較于傳統(tǒng)的基于對(duì)用戶的半結(jié)構(gòu)化訪談,觀察記錄或問(wèn)卷等形式得出的檢索排序指標(biāo),基于實(shí)驗(yàn)的檢索結(jié)果興趣度表征指標(biāo)體系能夠有效的補(bǔ)充其存在的不足,在如今信息日益膨脹的整體信息環(huán)境下,基于用戶的個(gè)性化檢索定制有著重要的意義。
可行性方面,隨著科技的不斷進(jìn)步,用戶生理信息的采集愈發(fā)方便和高效,尤其是對(duì)眼球的識(shí)別以及虹膜識(shí)別技術(shù)已經(jīng)十分成熟。針對(duì)移動(dòng)設(shè)備的眼動(dòng)實(shí)驗(yàn)設(shè)備也愈發(fā)小型化和輕型化。用戶在非實(shí)驗(yàn)條件下信息檢索過(guò)程中的信息也能被捕捉和采集從而進(jìn)行匯總分析并加以?xún)?yōu)化和完善,信息技術(shù)的進(jìn)步為信息獲得者帶來(lái)的效率改善將得到極大的提升,故而本研究有著一定的前瞻性。
參考文獻(xiàn):
[1]許鑫,曹陽(yáng).基于眼動(dòng)追蹤實(shí)驗(yàn)的高校圖書(shū)館門(mén)戶網(wǎng)站網(wǎng)頁(yè)設(shè)計(jì)研究[J].大學(xué)圖書(shū)館學(xué)報(bào),2017(03).
[2]王婷婷.大學(xué)生對(duì)招聘網(wǎng)頁(yè)注意偏好的眼動(dòng)研究[D].魯東大學(xué),2017.
[3]王秀紅,袁銀池.閱讀行為眼動(dòng)研究知識(shí)圖譜分析[J].圖書(shū)情報(bào)研究,2016(02).
[4]周健.信息界面視覺(jué)刺激的用戶行為模式研究[D].東南大學(xué),2016.
[5]袁銀池.用戶專(zhuān)利文獻(xiàn)閱讀興趣拓?fù)溲芯考霸谥鲃?dòng)推送微服務(wù)中的應(yīng)用[D].江蘇大學(xué),2016.
[6]張文雅.基于可讀性的信息檢索模型研究[D].天津大學(xué),2016.
[7]陳永強(qiáng).基于眼動(dòng)和主題模型的個(gè)性化實(shí)時(shí)查詢(xún)擴(kuò)展模型的研究[D].天津大學(xué),2016.
[8]盧萬(wàn)譞.基于眼動(dòng)跟蹤的網(wǎng)絡(luò)搜索行為分析與預(yù)測(cè)[D].北京理工大學(xué),2015.
[9]花妍.具有語(yǔ)義一致性的跨模態(tài)關(guān)聯(lián)學(xué)習(xí)與信息檢索[D].北京郵電大學(xué),2015.
[10]李娜.中學(xué)生多媒體瀏覽行為的眼動(dòng)實(shí)驗(yàn)研究[D].寧波大學(xué),2015.
[11]胡偉.大學(xué)生多媒體閱讀中檢索行為的眼動(dòng)實(shí)驗(yàn)研究[D].寧波大學(xué),2015.
[12]王宇,張?jiān)魄?探索式搜索行為的眼動(dòng)研究[J].圖書(shū)情報(bào)工作,2014(11).
[13]郭一超.基于眼動(dòng)追蹤技術(shù)的區(qū)域顯著性評(píng)估方法研究[D].北京交通大學(xué),2014.
[14]徐賁.CNKI文獻(xiàn)關(guān)聯(lián)推薦用戶選擇行為的實(shí)驗(yàn)研究[D].浙江師范大學(xué),2011.
[15]蔣波,章菁華.1980~2009年國(guó)內(nèi)眼動(dòng)研究的文獻(xiàn)計(jì)量分析[J].心理科學(xué),2011(01).
[16]李曉麗,黃敏,莫冰.視線跟蹤法——網(wǎng)絡(luò)用戶信息行為研究的新方法[J].圖書(shū)館理論與實(shí)踐,2009(08).
(作者單位:江蘇大學(xué)科技信息研究所)