国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

多模態(tài)信息搜索行為實(shí)驗(yàn)研究

2023-11-15 08:24:46朱佳雨李志義王振芳
情報(bào)工程 2023年4期
關(guān)鍵詞:被試者音頻檢索

朱佳雨 李志義 王振芳

1.中國(guó)科學(xué)院廬山植物園 九江 332900;

2.華南師范大學(xué)經(jīng)濟(jì)與管理學(xué)院 廣州 510006;

3.福建師范大學(xué)文學(xué)院 福州 350007

引言

信息搜索行為鏈接著被搜索信息與信息系統(tǒng)的主客體兩端,在圖片掃描檢索、語音識(shí)別檢索等技術(shù)發(fā)展完善之前,通常以文字描述進(jìn)行搜索,至今仍有大量人使用這種搜索方式,無論搜索文字、圖片還是音樂,文字語義描述不可避免的一點(diǎn)就是必須克服“語義鴻溝”,這一問題在圖片、音樂這些跨模態(tài)搜索中尤其突出。早在2005 年,溫超等[1]就關(guān)注過圖像檢索中的語義差異問題,王靖豪等也認(rèn)為目前網(wǎng)絡(luò)環(huán)境中的多模態(tài)信息缺乏信息層次結(jié)構(gòu)之間的關(guān)聯(lián),缺少多種模態(tài)數(shù)據(jù)的信息融合,致使相關(guān)研究大多依賴于某一種模態(tài)數(shù)據(jù)的信息[2],從而影響搜索的查全率和查準(zhǔn)率。對(duì)此,胡文婷[3]利用眼動(dòng)跟蹤技術(shù)記錄人瀏覽圖像時(shí)的眼動(dòng)行為,證實(shí)眼動(dòng)行為可表達(dá)語義,克服文字與圖片之間的語義邊界,網(wǎng)站利用這一點(diǎn),將可以更高效地推送用戶需要的圖片。秦靜、林鴻飛等[4]提出了一種基于示例語義的音樂檢索模型,使用語義相關(guān)標(biāo)簽來標(biāo)記未知,將音樂映射到“語義空間”滿足語義音樂檢索的需求。邵曦、郁青玲[5]分析了文本特征和音樂內(nèi)容特征潛在的統(tǒng)計(jì)關(guān)系,通過子空間映射解決了不同模態(tài)之間的特征異構(gòu)問題,再根據(jù)歐氏距離的大小衡量?jī)烧叩南嚓P(guān)性,從而實(shí)現(xiàn)了音樂跨模態(tài)搜索。由于用戶的知識(shí)背景不同,所以對(duì)文字、圖片、音樂等信息特征的提煉和歸納能力有所不同,使得每個(gè)檢索者面臨的語義差異問題也有相應(yīng)的不同。但隨著技術(shù)發(fā)展,網(wǎng)站可以直接掃描圖片,匹配相同或相似的圖片,音樂也可以通過語音識(shí)別,查找或匹配相似信息,王培培等[6]提出一種基于語句特征的音樂哼唱快速檢索技術(shù),將音樂數(shù)據(jù)庫和用戶提供的哼唱片段,按自然停頓方式劃分音樂語句,使用BDTW 算法對(duì)音樂語句片段進(jìn)行音高相似性計(jì)算,能夠減少用戶的檢索時(shí)間。這些技術(shù)的突破意味著不再需要用戶對(duì)被搜索信息進(jìn)行特征提煉,繞開了“語義鴻溝”這個(gè)問題,使單模態(tài)信息的查準(zhǔn)率和查全率得到了較好解決。

隨著信息技術(shù)的深化與推廣,各種文字、圖像和視頻等互動(dòng)分享網(wǎng)站日新月異,催生了大量相同語義而有著多種表現(xiàn)方式的信息——多模態(tài)信息。多模態(tài)信息搜索問題便成為了學(xué)者關(guān)注的重點(diǎn),學(xué)者Li[7]等研究了多模態(tài)信息搜索行為影響因素,該研究基于TAM 理論模型,認(rèn)為多模態(tài)信息搜索行為與多模態(tài)信息的搜索意愿直接相關(guān),而搜索意愿與多模態(tài)信息搜索有用性和容易度感知相關(guān),且用戶的信息檢索能力及信息環(huán)境直接影響多模態(tài)信息的多模態(tài)信息搜索有用性和容易度感知。邱瑾、吳丹[8]進(jìn)行了用戶協(xié)同信息檢索行為實(shí)驗(yàn)及結(jié)果分析,發(fā)現(xiàn)任務(wù)類型不同,用戶“瀏覽網(wǎng)頁”“檢索”和“使用圖片”行為差距較大,導(dǎo)航類任務(wù)涉及專業(yè)知識(shí),用戶需要輸入更多的檢索式以便對(duì)其有一個(gè)全面的認(rèn)識(shí)。對(duì)于專業(yè)性任務(wù),許多專業(yè)人士已經(jīng)做了一些總結(jié)和分析,可能一個(gè)圖片就包含了大量有用的信息,事務(wù)類任務(wù)解決的是實(shí)踐問題,用戶在檢索過程中思考、探索的時(shí)間較多,而瀏覽頁面和檢索次數(shù)都較少。檢索任務(wù)類型不同對(duì)用戶選擇的檢索式也會(huì)有較大影響。

綜上,不難發(fā)現(xiàn)用戶的信息需求已呈現(xiàn)出由慢到快、由少到多、由單一到多樣的變化,信息搜索行為也逐漸從單一模態(tài)信息搜索向多模態(tài)信息搜索轉(zhuǎn)移。而當(dāng)前國(guó)內(nèi)學(xué)者缺乏對(duì)多模態(tài)信息搜索行為特征的挖掘,使多模態(tài)信息搜索行為研究存在空白,為提高多模態(tài)信息搜索效率,有必要堅(jiān)持以人為本的研究理念,以用戶為中心,圍繞用戶在信息技術(shù)、網(wǎng)絡(luò)技術(shù)發(fā)展進(jìn)程中突現(xiàn)的日益增長(zhǎng)的多模態(tài)信息需求,研究其搜索多模態(tài)信息行為特征。因此,本文通過設(shè)計(jì)多模態(tài)搜索任務(wù),研究用戶的多模態(tài)信息行為特征,將有利于豐富信息搜索理論,為實(shí)現(xiàn)多模態(tài)信息系統(tǒng)建設(shè)、提升多模態(tài)信息素養(yǎng)提供依據(jù)。

1 研究設(shè)計(jì)

1.1 多模態(tài)信息搜索行為分析指標(biāo)

對(duì)于信息搜索行為研究,基于用戶信息搜索過程的,比較著名的有 Willson 模型、Kuhlthau 模型和 Choo 三階段模型[9]。其中Willson 模型重點(diǎn)對(duì)影響搜索需求到搜索行為發(fā)生整個(gè)過程的因素進(jìn)行了較全面的分析。Kuhlthau 模型重點(diǎn)對(duì)信息搜索全過程中的用戶認(rèn)知影響進(jìn)行了分析[10]。Choo 模型將信息搜索活動(dòng)分為信息需要、信息搜索和信息利用3 個(gè)過程,并檢驗(yàn)了認(rèn)知、情感和情境因素對(duì)這些過程的影響[11]。國(guó)內(nèi)學(xué)者甘利人將用戶的多模態(tài)信息搜索行為過程劃分為信息定義、信息搜索和信息收集三個(gè)階段,并根據(jù)不同階段的具體行為表現(xiàn)歸納用戶的行為特征[12]。對(duì)此本文在借鑒前人研究成果的基礎(chǔ)上,將多模態(tài)信息搜索行為分成三個(gè)階段進(jìn)行分析,并確定了多模態(tài)信息搜索行為特征分析指標(biāo),如表1 所示。

表1 多模態(tài)信息搜索行為分析指標(biāo)

1.2 實(shí)驗(yàn)任務(wù)與流程

在搜索任務(wù)劃分上,有依據(jù)搜索路徑將搜索任務(wù)分為水平性任務(wù)、簡(jiǎn)單性任務(wù)和垂直性任務(wù)[20];或根據(jù)任務(wù)的多個(gè)屬性將信息任務(wù)劃分為事實(shí)性、解釋性和探索性任務(wù)[21]。Broder[22]則將搜索任務(wù)劃分為導(dǎo)航型任務(wù)、事實(shí)型任務(wù)和事務(wù)性任務(wù)。孫麗[23]根據(jù)任務(wù)的實(shí)際應(yīng)用情景將網(wǎng)絡(luò)健康信息搜尋任務(wù)類型劃分為開放式任務(wù)和封閉式任務(wù)。

考慮多模態(tài)信息搜索不僅搜索模態(tài)多,搜索路徑也多,因此本文按照不同模態(tài)進(jìn)行劃分,分別從文本、圖片和音頻三個(gè)搜索模態(tài)設(shè)計(jì)實(shí)驗(yàn)任務(wù),三類實(shí)驗(yàn)任務(wù)定義如表2。每個(gè)被試者均需依次完成三個(gè)任務(wù),在執(zhí)行任務(wù)的過程中可以根據(jù)實(shí)際情況運(yùn)用一種或多種模態(tài)進(jìn)行搜索。

表2 任務(wù)類型定義

任務(wù)1(文本搜索任務(wù)):假設(shè)你看完某個(gè)電影后便喜歡上了李安導(dǎo)演。你想通過上網(wǎng)搜索了解更多的關(guān)于他的信息,現(xiàn)請(qǐng)你把他的基本信息、照片和他的相關(guān)視頻通過網(wǎng)絡(luò)搜索整理出來。(參考用時(shí)8 分鐘)

任務(wù)2(圖片搜索任務(wù)):請(qǐng)你根據(jù)圖片1,通過網(wǎng)絡(luò)搜索,將圖片名稱、作者的基本信息以及其他相似圖片搜索出來。(參考用時(shí)10 分鐘)

圖1 實(shí)驗(yàn)圖例

任務(wù)3(音頻搜索任務(wù)):請(qǐng)你根據(jù)實(shí)驗(yàn)員播放的音頻,通過網(wǎng)絡(luò)搜索,將音頻名稱、作者的基本信息和及其他相似音樂搜索出來。(參考用時(shí)12 分鐘)

1.3 實(shí)驗(yàn)流程

實(shí)驗(yàn)流程主要包括被試者招募、實(shí)驗(yàn)平臺(tái)安排和實(shí)驗(yàn)過程設(shè)計(jì)等。

在被試者招募方面,筆者根據(jù)研究目的,并考慮實(shí)驗(yàn)任務(wù)需具備一定知識(shí)儲(chǔ)備,因此將招募對(duì)象設(shè)為受過高等教育的群體。通過微博、微信等發(fā)布有償招募實(shí)驗(yàn)志愿者公告,并根據(jù)報(bào)名情況篩選符合研究條件的被試者。周曉英等[24]在研究互聯(lián)網(wǎng)信息搜索用戶行為模型時(shí)的樣本數(shù)量為32 人。吳丹等[25]在研究移動(dòng)搜索策略時(shí)選取了30 名大學(xué)生為研究對(duì)象。因此本研究最終招募了45 名被試者。

在實(shí)驗(yàn)平臺(tái)設(shè)計(jì)方面,本研究考慮到實(shí)驗(yàn)過程的連續(xù)性,實(shí)驗(yàn)數(shù)據(jù)的完整性,且為了避免用戶實(shí)驗(yàn)受陌生機(jī)型及應(yīng)用的影響,故將本研究的實(shí)驗(yàn)平臺(tái)設(shè)定為被試者自帶的智能移動(dòng)手機(jī)。實(shí)驗(yàn)前統(tǒng)一安裝錄屏軟件,用于錄制多模態(tài)信息搜索全過程??紤]到錄制過程會(huì)涉及到隱私信息,如搜索歷史等,故在實(shí)驗(yàn)開始前會(huì)溫馨提示被試者整理手機(jī)可能會(huì)涉及到的隱私信息。

在實(shí)驗(yàn)前,組織者向受試者講解實(shí)驗(yàn)過程和注意事項(xiàng)。實(shí)驗(yàn)順序依次為任務(wù)1、2、3,每個(gè)任務(wù)流程為:閱讀題目-實(shí)施搜索-保存搜索結(jié)果。每項(xiàng)搜索任務(wù)完成后,被試者需將每個(gè)任務(wù)的搜索結(jié)果收集整理發(fā)給實(shí)驗(yàn)負(fù)責(zé)人,以此類推,直至三個(gè)任務(wù)全部完成。在實(shí)驗(yàn)過程中,為使被試者端正態(tài)度提高搜索效率,每項(xiàng)搜索任務(wù)提供參考用時(shí),且實(shí)驗(yàn)員將進(jìn)行計(jì)時(shí)操作,但為了體現(xiàn)實(shí)驗(yàn)的完整性,故即使被試者用時(shí)超過參考用時(shí)也不會(huì)被打斷。實(shí)驗(yàn)完成后,評(píng)委會(huì)根據(jù)網(wǎng)絡(luò)信息搜索常用指標(biāo)“準(zhǔn)確性”“完整性”[26]對(duì)被試者的搜索結(jié)果進(jìn)行評(píng)分,并以此獎(jiǎng)勵(lì)被試者。準(zhǔn)確性表示搜索目標(biāo)與搜索任務(wù)的匹配度,分值為5。完整性指搜索到的信息在模態(tài)、數(shù)量以及任務(wù)完成的情況,分值為5。每項(xiàng)任務(wù)的分值為10,三個(gè)任務(wù)總分為30 分。

2 結(jié)果與討論

本研究共有45 名符合研究條件的志愿者參與。其中女性被試者為26 人,占比約57.78%,男性被試者為19 人,占比約42.22%。被試者學(xué)歷大專有1 人,本科有19 人,研究生學(xué)歷25 人(含碩士研究生23 人,博士研究生2 人),群體涉及有社會(huì)在職人員與在校學(xué)生,專業(yè)涉及生物工程、農(nóng)學(xué)、法學(xué)、金融學(xué)、理論物理、光學(xué)工程、中國(guó)現(xiàn)當(dāng)代文學(xué)、情報(bào)學(xué)和圖書館學(xué)等。刪除畫質(zhì)不清、實(shí)驗(yàn)不完整視頻,最終獲得有效實(shí)驗(yàn)數(shù)據(jù)41 份。41 份實(shí)驗(yàn)數(shù)據(jù)共約691 分48 秒,減去程序加載、網(wǎng)頁緩沖和其他與任務(wù)搜索無關(guān)時(shí)間等,最終具有統(tǒng)計(jì)分析意義時(shí)間約606 分52 秒。

2.1 多模態(tài)信息搜索結(jié)果分析

本研究邀請(qǐng)了來自圖情領(lǐng)域與非圖情領(lǐng)域的三名學(xué)者為評(píng)委,對(duì)實(shí)驗(yàn)者的搜索結(jié)果進(jìn)行評(píng)分,用三者評(píng)分的平均分作為被試者多模態(tài)信息搜索結(jié)果的最終得分,以此分析調(diào)查者的多模態(tài)信息搜索的效率,其中包括了多模態(tài)信息搜索的準(zhǔn)確性、完整性。如表3。

表3 多模態(tài)信息搜索任務(wù)完成情況

數(shù)據(jù)顯示,從整體上看,多模態(tài)信息搜索準(zhǔn)確性較好,在完整性上表現(xiàn)較差。從不同模態(tài)看,文本信息搜索的整體完成情況最好,準(zhǔn)確性和完整性平均分超9 分;音頻搜索整體評(píng)分居中;圖片搜索的整體平均分最低,且準(zhǔn)確性分?jǐn)?shù)最低。說明文本為搜索模態(tài)搜索多模態(tài)信息,仍是目前效率最高的搜索方式;圖片搜索的準(zhǔn)確性則有待提高。

2.2 多模態(tài)信息搜索行為分析

圖2 反映的是用戶的多模態(tài)信息搜索各個(gè)階段人均耗時(shí)。數(shù)據(jù)顯示,多模態(tài)的搜索任務(wù)人均耗時(shí)約983 秒,結(jié)合錄屏,文本搜索單人最高耗時(shí)645 秒,圖片搜索單人最高耗時(shí)923秒,音頻搜索單人最高耗時(shí)690 秒,這三人所在專業(yè)均屬生物類。從不同階段上看,搜索階段耗時(shí)最長(zhǎng),其次是信息收集階段,定義階段耗時(shí)最短。從不同搜索模態(tài)上看,文本搜索耗時(shí)最短,圖片搜索耗時(shí)最長(zhǎng),音頻搜索居中。結(jié)合錄屏可知,用戶向信息系統(tǒng)輸入搜索需求時(shí),文本輸入速度普遍較快且系統(tǒng)識(shí)別的準(zhǔn)確率和完整性較高;輸入圖片或音頻時(shí),信息系統(tǒng)在識(shí)別音頻或圖片時(shí)需要較長(zhǎng)時(shí)間,且識(shí)別失敗率較高,迫使被試者重新檢索,從而一定程度上增加耗時(shí)。說明當(dāng)前階段用戶的多模態(tài)信息搜索速度,特別是圖片搜索和音頻搜索,受信息系統(tǒng)的響應(yīng)速度和識(shí)別精準(zhǔn)度影響較大。

(1)多模態(tài)信息需求定義階段

在信息搜索過程中,用戶需理解所找到的信息,從而確定自己的需求[27]。圖3 統(tǒng)計(jì)的是被試者理解搜索任務(wù)的時(shí)長(zhǎng),即從打開任務(wù)文檔到打開搜索軟件這一時(shí)間段的時(shí)長(zhǎng)。由圖可知,圖片搜索需求理解平均耗時(shí)最長(zhǎng)達(dá)30.84 秒,音頻搜索平均耗時(shí)最短,文本搜索居中。結(jié)合錄屏,被試者在進(jìn)行圖片搜索時(shí),用戶除理解搜索任務(wù)外,還會(huì)對(duì)圖片細(xì)節(jié)進(jìn)行放大確認(rèn),在細(xì)節(jié)確認(rèn)過程中耗時(shí)較長(zhǎng)。對(duì)于音頻搜索,大部分被試者在聽到音頻后便第一時(shí)間打開音樂軟件進(jìn)行識(shí)別,在選擇搜索方法與途徑上反應(yīng)迅速。

圖3 信息定義階段需求理解耗時(shí)

表4 反映的是被試者確認(rèn)搜索需求情況,即重復(fù)閱讀任務(wù)題目的次數(shù)。實(shí)驗(yàn)顯示,大部分被試者在確定搜索任務(wù)需求時(shí)需重復(fù)確認(rèn),最高重復(fù)閱讀次數(shù)多達(dá)5 次。音頻搜索重復(fù)閱讀任務(wù)題目次數(shù)最少,且出現(xiàn)較多不需要重復(fù)閱讀的情況,而文本搜索需求確認(rèn)次數(shù)最多。

表4 信息定義階段需求重復(fù)確定次數(shù)

綜上,在多模態(tài)信息搜索需求定義階段,用戶對(duì)音頻搜索需求的理解能力較強(qiáng),在確認(rèn)和選擇音頻搜索方法與途徑上比較迅速;而對(duì)于圖片搜索,雖然大部分用戶依賴圖片識(shí)別工具,但由于圖片細(xì)節(jié)較多,用戶在對(duì)圖片細(xì)節(jié)捕捉上需耗費(fèi)一定精力與時(shí)間。而文本搜索符合大部分用戶現(xiàn)階段的閱讀習(xí)慣,所以用戶在此階段無需花費(fèi)過多的時(shí)間。

(2)多模態(tài)信息搜索階段

信息搜索是多模態(tài)信息搜索的核心階段,具體行為表現(xiàn)有:選擇搜索途徑、選擇檢索方式、篩選搜索結(jié)果和搜索策略調(diào)整等。

①搜索路徑

搜索途徑選擇是用戶進(jìn)行多模態(tài)信息搜索動(dòng)作的第一步,本文從用戶所選的搜索路徑來分析用戶搜索不同模態(tài)信息的行為特征。圖4顯示,目前多模態(tài)信息搜索選擇最多的搜索方式為搜索引擎,其次是瀏覽器。結(jié)合實(shí)驗(yàn),發(fā)現(xiàn)被試者在進(jìn)行文本搜索時(shí)大都選擇瀏覽器,而在圖片搜索時(shí)則傾向于具有圖片識(shí)別功能的搜索引擎,其次是電商類APP 如淘寶等;音頻搜索傾向于專業(yè)APP 如網(wǎng)易云等,其次是搜索引擎。由此可以說明搜索引擎是當(dāng)前多模態(tài)信息搜索的主要途徑,但用戶會(huì)根據(jù)搜索模態(tài)選擇多種且具有針對(duì)性的方式,這與前人的研究結(jié)果保持一致,無論哪種類型的搜索問題都有大部分大學(xué)生選擇搜索引擎作為信息檢索的第一工具[28]。

圖4 搜索路徑

②選擇搜索方式

構(gòu)造檢索式是信息需求的外化過程,是用戶的認(rèn)知靈活性與知識(shí)遷移、應(yīng)用和創(chuàng)新能力的具體表現(xiàn)。根據(jù)圖5 可知,短語搜索多模態(tài)信息是搜索過程中使用最多的檢索方式,圖片搜索和音頻搜索除了依賴專業(yè)的圖片識(shí)別和音頻識(shí)別工具外,均使用文本搜索輔助搜索。此外,值得注意的是語音輸入僅是個(gè)別用戶選擇。說明目前關(guān)鍵詞搜索仍是多模態(tài)信息搜索的主流,而圖片識(shí)別和音頻識(shí)別也成為了重要的搜索方法之一。

圖5 短語、句子、圖片和音頻識(shí)別使用頻次

圖6 反映的是用文本、圖片和音頻作為搜索模態(tài)占全部搜索方式的比例及搜索詞從實(shí)驗(yàn)題材中提取的情況。數(shù)據(jù)顯示,被試者使用圖片識(shí)別和音頻識(shí)別作為搜索方式各占9.77%,使用文本搜索的高達(dá)80.46%。結(jié)合錄屏,發(fā)現(xiàn)在音頻搜索任務(wù)中,檢索關(guān)鍵詞取詞來源大部分取自歌詞本身,而圖片搜索和文本搜索部分搜索詞源于自身對(duì)搜索任務(wù)的認(rèn)知,并在此基礎(chǔ)上思考并提出新的檢索詞。說明在完成信息搜索任務(wù)的過程中,音頻搜索僅依靠直觀理解,并沒有做出太多個(gè)人的判斷與評(píng)價(jià),缺乏對(duì)檢索詞的深度加工,而圖片搜索和文本搜索則相反,這一結(jié)論進(jìn)一步驗(yàn)證了信息搜索受用戶的學(xué)習(xí)認(rèn)知投入的影響[29]。

圖6 搜索方式比例

③篩選搜索結(jié)果

信息篩選是指用戶根據(jù)信息系統(tǒng)反饋的信息查找和篩選目標(biāo)信息,具體行為表現(xiàn)有網(wǎng)頁瀏覽。表5 數(shù)據(jù)顯示,網(wǎng)頁瀏覽占整個(gè)多模態(tài)信息搜索階段的耗時(shí)一半以上,其中音頻搜索中的網(wǎng)頁瀏覽耗時(shí)最長(zhǎng),在整個(gè)搜索過程的耗時(shí)占比也最大,文本搜索則相反。結(jié)合實(shí)驗(yàn)發(fā)現(xiàn),音頻搜索用戶點(diǎn)擊瀏覽網(wǎng)頁的數(shù)量最多,人均點(diǎn)擊量約為7.34 頁;網(wǎng)頁點(diǎn)擊瀏覽數(shù)量最少的是文本搜索,人均點(diǎn)擊量約為5.9 頁。由此反映用戶及信息系統(tǒng)均對(duì)文本信息搜索需求捕捉較精準(zhǔn),反饋效率高,而圖片和音頻信息需求捕捉和信息反饋的準(zhǔn)確性和時(shí)效有待提高,這也說明信息系統(tǒng)在滿足用戶偏好可視化和娛樂性強(qiáng)的新媒體信息需求上[30],還需做進(jìn)一步改進(jìn)和提升。

表5 網(wǎng)頁瀏覽耗時(shí)

④搜索策略調(diào)整

相較于搜索方法,搜索策略立足于整體,強(qiáng)調(diào)對(duì)整個(gè)搜索過程的計(jì)劃與變通[31]。表6數(shù)據(jù)顯示,大部分被試者在進(jìn)行多模態(tài)信息搜索過程中都需要調(diào)整搜索策略,不需要調(diào)整或調(diào)整次數(shù)3 次及以上的是少數(shù)。結(jié)合錄屏,發(fā)現(xiàn)多模態(tài)信息搜索策略調(diào)整主要是平臺(tái)切換,如文本搜索主要從瀏覽器轉(zhuǎn)為百度搜索引擎,而圖片和音頻搜索則主要從專業(yè)識(shí)別工具轉(zhuǎn)為瀏覽器或百度搜索引擎。另外,圖片搜索和音頻搜索在搜索策略調(diào)整上比較頻繁且主觀性較強(qiáng),文本搜索則相反。從搜索模態(tài)上看,目前圖片搜索和音頻搜索則存在較頻繁的圖文、音文相互轉(zhuǎn)換的情況,而文字搜索則沒有這種情況。

表6 多模態(tài)信息搜索策略調(diào)整情況

綜上,可以說明當(dāng)前被試者的多模態(tài)搜索仍以跨平臺(tái)搜索為主,大部分多模態(tài)信息搜索與收集無法集中在一個(gè)平臺(tái)內(nèi)完成。這與此前研究成果中的發(fā)現(xiàn)一致:信息搜索行為在不同任務(wù)環(huán)節(jié)存在一定差異,尤其是檢索次數(shù)、檢索工具等[32]。

(3)多模態(tài)信息收集階段

圖7 反映的是多模態(tài)信息搜索結(jié)果的信息來源情況。數(shù)據(jù)顯示,用戶的多模態(tài)信息收集渠道比較集中,百科類網(wǎng)頁特別是百度百科占了絕大多數(shù),且百度系列網(wǎng)頁是絕大部分被試者的多模態(tài)信息來源。說明百度作為搜索引擎的代表,在多模態(tài)信息融合方面具有較大的優(yōu)勢(shì),普遍被用戶所接受。值得注意的是,新興的社交媒體如豆瓣和應(yīng)用軟件如淘寶、京東等電商網(wǎng)站也逐漸成為了用戶的多模態(tài)信息來源,這一結(jié)果驗(yàn)證了社交網(wǎng)絡(luò)逐漸成為除搜索引擎與數(shù)據(jù)庫之外的主要信息來源渠道[33]。

圖7 多模態(tài)信息收集來源

綜上,縱觀整個(gè)多模態(tài)信息搜索過程,可以發(fā)現(xiàn)多模態(tài)信息搜索在準(zhǔn)確性上表現(xiàn)較好,而完整性上則表現(xiàn)較差。在需求階段需求理解上比較費(fèi)時(shí),普遍存在重復(fù)確認(rèn)現(xiàn)象。在搜索方式上仍以文字搜索和跨平臺(tái)搜索為主,且搜索策略調(diào)整次數(shù)較多,在搜索模態(tài)上轉(zhuǎn)變較頻繁。在信息收集上集中于百科類網(wǎng)頁,特別是百度百科占了絕大多數(shù),而社交媒體和電商應(yīng)用軟件也成為用戶的多模態(tài)信息來源之一。

3 研究建議

通過本研究,發(fā)現(xiàn)當(dāng)前的信息系統(tǒng)還無法兼顧文本、圖片和音頻信息搜索的查全率和查準(zhǔn)率,致使用戶在搜索多模態(tài)信息時(shí),需跨平臺(tái)、換模態(tài)和多次重復(fù)搜索,且搜索結(jié)果還不完整。在內(nèi)容上也無法滿足用戶的可視化、娛樂性和富含文化底蘊(yùn)的信息需求。此外,實(shí)驗(yàn)還發(fā)現(xiàn)用戶本身對(duì)多模態(tài)信息搜索也存在認(rèn)知不足,包含對(duì)信息的多模態(tài)表現(xiàn)形式、獲取方式和信息整合等認(rèn)知,具體表現(xiàn)在需求確定過程中重復(fù)確認(rèn)搜索任務(wù)的次數(shù)多,搜索策略調(diào)整次數(shù)多,在搜索模態(tài)上轉(zhuǎn)換頻繁。對(duì)此本研究從多模態(tài)信息系統(tǒng)設(shè)計(jì)與開發(fā)與用戶信息素養(yǎng)教育方面提出建議。

3.1 多模態(tài)信息系統(tǒng)開發(fā)與設(shè)計(jì)

在多模態(tài)信息搜索系統(tǒng)開發(fā)與設(shè)計(jì)方面,本研究認(rèn)為,要兼顧查全率和查準(zhǔn)率,需在檢索頁面設(shè)計(jì)方面,探索圖像、視頻、文本、語音等多模態(tài)輸入的高效感知與綜合理解手段[34],提供文字輸入的同時(shí),增加語音、圖片和音頻輸入功能,放置顯眼區(qū)域,強(qiáng)化引導(dǎo)用戶用多模態(tài)進(jìn)行檢索,擴(kuò)大檢索面。此外,針對(duì)用戶的跨屏信息搜索需求也應(yīng)提供更好的跨屏檢索服務(wù)[35]。在多模態(tài)信息融合方面,建立多模態(tài)信息語義系統(tǒng),將語義相同的不同模態(tài)信息進(jìn)行多維度關(guān)聯(lián),擴(kuò)充信息系統(tǒng)的不同模態(tài)的信息資源,以提升整個(gè)系統(tǒng)的查全率和查準(zhǔn)率。在多模態(tài)信息呈現(xiàn)方面,改變以文本信息為主的傳統(tǒng)網(wǎng)頁呈現(xiàn)形式,呈現(xiàn)兼顧可視化、娛樂性和文化底蘊(yùn)的多模態(tài)信息,具體可通過語義關(guān)聯(lián)將文本信息、圖片信息和音頻信息深度融合并分類呈現(xiàn),努力做到多模態(tài)信息一站式檢索,需求一站式滿足。

3.2 多模態(tài)信息素養(yǎng)提升

在數(shù)字化媒體盛行的新時(shí)代,信息素養(yǎng)是學(xué)生適應(yīng)當(dāng)下、迎接未來所必須具備的能力素養(yǎng)之一[36]。因此在多模態(tài)信息素養(yǎng)培養(yǎng)方面,學(xué)校應(yīng)根據(jù)多模態(tài)信息特征,努力幫助學(xué)生避免因信息表現(xiàn)形式多而導(dǎo)致信息迷航,跳出因精準(zhǔn)推薦導(dǎo)致的信息繭房。重點(diǎn)圍繞幫助學(xué)生明確問題對(duì)象-“要何種信息做什么”;明確信息搜索目標(biāo)-“滿足什么樣的需求”;明確時(shí)間-解決問題的時(shí)間節(jié)點(diǎn);明確信息內(nèi)容-信息的表現(xiàn)方式(文本、圖片或音頻等模態(tài));明確信息搜索策略(不同搜索模態(tài)的不同搜索路徑、搜索方法和信息源等)。增設(shè)多模態(tài)信息搜索、加工利用教學(xué)課程,培養(yǎng)相關(guān)能力。一方面,針對(duì)不同信息對(duì)象靈活開展各種模態(tài)信息的相關(guān)檢索策略、語言和路徑等系統(tǒng)的理論指導(dǎo)教育,培養(yǎng)學(xué)生多模態(tài)搜索信息的意識(shí),引導(dǎo)學(xué)生善于利用知識(shí)整合需求信息、構(gòu)造檢索式、多途徑搜索。另一方面,學(xué)校需在理論指導(dǎo)上輔以合作基地進(jìn)行實(shí)踐教學(xué),例如建立以文字為主的中國(guó)知網(wǎng)數(shù)據(jù)庫、圖片為主的淘寶電商網(wǎng)站、以視頻為主的抖音短視頻開發(fā)商等校企合作鏈,定期安排學(xué)生到合作基地進(jìn)行學(xué)習(xí),加強(qiáng)學(xué)生對(duì)圖片和音頻信息的特征挖掘、信息融合和檢索技術(shù)等方面的認(rèn)識(shí)與實(shí)踐。

3.3 加強(qiáng)多模態(tài)信息搜索行為倫理與法規(guī)引導(dǎo)

多模態(tài)信息涉及到了許多知識(shí)產(chǎn)權(quán)、設(shè)計(jì)專利和個(gè)人隱私等信息,規(guī)范多模態(tài)信息行為的重要性不言而喻。規(guī)范多模態(tài)信息行為,從源頭上看是要用戶形成信息自覺,實(shí)現(xiàn)則從培養(yǎng)信息用戶的信息倫理意識(shí)著手。要使用戶在主觀上尊重知識(shí)產(chǎn)權(quán),保護(hù)隱私信息,抵制不良信息,在行動(dòng)上杜絕網(wǎng)絡(luò)謠言、信息暴力和網(wǎng)絡(luò)詐騙等行為。重點(diǎn)是完善相關(guān)的法律法規(guī),特別是知識(shí)產(chǎn)權(quán)和個(gè)人信息方面的法律,增加多模態(tài)信息違法成本,將法律監(jiān)管覆蓋多模態(tài)信息的產(chǎn)生、加工和傳播等全過程。建立多模態(tài)信息誠(chéng)信黑名單制度,一旦發(fā)現(xiàn)有相關(guān)不良信息記錄的用戶或平臺(tái)立即發(fā)出警告,嚴(yán)重者將其列入信息誠(chéng)信黑名單、封鎖相關(guān)賬號(hào)并追究其相關(guān)法律責(zé)任,限制其對(duì)多模態(tài)信息發(fā)表、下載、轉(zhuǎn)發(fā)和保存的權(quán)限。

4 結(jié)束語

本文依據(jù)信息搜索行為階段理論,分析多模態(tài)信息搜索行為特征,通過實(shí)驗(yàn)研究,發(fā)現(xiàn)多模態(tài)信息搜索在準(zhǔn)確性上表現(xiàn)較好,而完整性上則表現(xiàn)較差;對(duì)多模態(tài)信息搜索在需求階段需求理解上比較費(fèi)時(shí),普遍存在重復(fù)確認(rèn)現(xiàn)象。在搜索階段仍以文字搜索和跨平臺(tái)搜索為主,且搜索策略調(diào)整次數(shù)較多,在搜索模態(tài)上轉(zhuǎn)變較頻繁。在信息收集階段,收集渠道集中于百科類網(wǎng)頁特別是百度百科占了絕大多數(shù),而社交媒體和電商應(yīng)用軟件也成為用戶的多模態(tài)信息來源之一。

本研究也存在一定的局限性。一方面人工對(duì)錄屏數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析可能存在一定誤差,個(gè)人理解差異也可能對(duì)分析結(jié)果產(chǎn)生一定的影響;另一方面研究群體覆蓋面不夠廣,分析指標(biāo)也需要進(jìn)一步豐富。未來可針對(duì)以上不足,擴(kuò)大樣本,采用多種統(tǒng)計(jì)分析方法,提高研究的科學(xué)性和全面性。

猜你喜歡
被試者音頻檢索
德西效應(yīng)
2019年第4-6期便捷檢索目錄
德西效應(yīng)
必須了解的音頻基礎(chǔ)知識(shí) 家庭影院入門攻略:音頻認(rèn)證與推薦標(biāo)準(zhǔn)篇
基于Daubechies(dbN)的飛行器音頻特征提取
電子制作(2018年19期)2018-11-14 02:37:08
兒童花生過敏治療取得突破
音頻分析儀中低失真音頻信號(hào)的發(fā)生方法
電子制作(2017年9期)2017-04-17 03:00:46
專利檢索中“語義”的表現(xiàn)
專利代理(2016年1期)2016-05-17 06:14:36
為什么我們會(huì)忍不住發(fā)朋友圈?
奧秘(2016年3期)2016-03-23 21:58:57
Pro Tools音頻剪輯及修正
人間(2015年8期)2016-01-09 13:12:42
宜宾县| 大港区| 黑山县| 弥勒县| 肃北| 汕尾市| 福鼎市| 天气| 湟源县| 郑州市| 米泉市| 徐闻县| 长岭县| 大邑县| 饶阳县| 枞阳县| 堆龙德庆县| 鹤壁市| 布拖县| 敦化市| 蒙阴县| 新乡县| 邯郸县| 黔东| 平定县| 大埔区| 竹北市| 衡阳县| 苏州市| 陈巴尔虎旗| 手游| 宾川县| 微山县| 南投市| 武胜县| 维西| 新乐市| 伊宁县| 施甸县| 会泽县| 那曲县|