国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

應對過濾氣泡:算法策展對用戶信息消費行為選擇性和態(tài)度極端化的影響

2024-07-01 15:26:44姜婷婷呂妍傅詩婷
現(xiàn)代情報 2024年7期

姜婷婷 呂妍 傅詩婷

關鍵詞: 過濾氣泡; 算法策展; 排序方式; 行為選擇性; 態(tài)度極端性

DOI:10.3969 / j.issn.1008-0821.2024.07.003

〔中圖分類號〕G252.0 〔文獻標識碼〕A 〔文章編號〕1008-0821 (2024) 07-0022-12

個性化推薦系統(tǒng)已被廣泛應用于購物、新聞和流媒體等在線服務平臺, 其本質是通過對用戶行為痕跡數(shù)據(jù)的分析, 預測用戶可能感興趣的內容并進行推薦。然而, 這種“定制化” 的信息服務往往因為引發(fā)了“過濾氣泡” 問題而飽受詬?。郏保?。以往研究認為, 個性化推薦算法使得人們只能接收到符合自身偏好的內容, 難以接觸到多元化信息, 長此以往, 用戶將身處“窄化的信息世界” 中[2] 。盡管人類本身就具有趨近與自身興趣和觀點一致的信息、回避不一致信息的傾向[3] , 但過濾氣泡的形成會加劇這一趨勢, 身處其中的人們只能聽到與自己立場和偏好一致的聲音, 逐漸產生極端化態(tài)度, 進而促使不同立場的人群之間更加割裂, 甚至導致社會的兩極分化[4-6] 。

為了避免這些負面影響, 如今的個性化推薦系統(tǒng)不再盲目追求推薦信息與用戶偏好的高度一致性,而是傾向于在推薦算法的準確性和多樣性之間尋求平衡, 比如在推薦過程中引入意外發(fā)現(xiàn)(Serendipi?ty)機制, 以提供更廣泛的信息源和更多的異質信息[7] 。需要注意的是, 盡管信息異質性得到提升,但不一致的信息仍有可能被用戶所忽略。這是因為個性化推薦算法對信息的策展過程是多階段的, 除了基礎的信息選擇之外, 還包括了對信息的排序、分類和組織呈現(xiàn)[8] 。其中, 信息的排序被證明是能否吸引用戶點擊與注意的決定性因素[9-10] 。目前的個性化推薦系統(tǒng)排序方式綜合考慮了多個因素, 其中最常見的因素包括信息內容與用戶個人偏好的匹配度、信息質量與發(fā)布時間等[11-12] 。為了實現(xiàn)準確性與多樣性平衡的信息消費, 算法開發(fā)者需要對不同的排序指標分配合理的權重, 而其實現(xiàn)基礎則是需要理解這些排序指標對于過濾氣泡是否存在以及存在怎樣的促進或者緩解作用。

此外, 本研究認為用戶對于算法的感知和理解,即算法素養(yǎng)(Algorithm Literacy)[13] , 也會影響其對于算法推薦內容的心理與行為反應。以往研究表明,高算法素養(yǎng)的人群會對于推薦信息作出更多批判性思考并基于此做出正確決策[14] , 推薦系統(tǒng)排序方式的改變對其行為態(tài)度的影響可能會被削弱。然而已有的過濾氣泡研究往往聚焦于算法本身, 而忽視了用戶算法素養(yǎng)的調節(jié)作用。因此, 本研究還進一步檢驗了用戶算法素養(yǎng)在不同排序方式對信息消費選擇性、態(tài)度極端性變化情況的影響過程中是否存在調節(jié)作用。

綜上, 盡管已有大量研究致力于改進個性化推薦系統(tǒng)算法, 以促進用戶對多元立場信息的接觸,緩解過濾氣泡的負面影響。但這些研究都忽視了信息排序方式的重要性。關于信息排序指標是否以及如何影響過濾氣泡, 以及不同人群之間這一影響是否存在差異, 目前仍然缺乏實證研究證據(jù)。因此,本研究通過開展受控實驗, 觀察3 種排序方式下參與者的信息消費行為選擇性及態(tài)度極端性變化情況,同時考慮到用戶算法素養(yǎng)的調節(jié)作用, 旨在解決以下研究問題: ①個性化推薦系統(tǒng)的信息排序方式如何影響用戶信息消費行為的選擇性? ②個性化推薦系統(tǒng)的信息排序方式如何影響用戶態(tài)度的極端性的變化? ③用戶算法素養(yǎng)是否以及如何在上述過程中起到調節(jié)作用?

本研究結論不僅揭示了不同推薦算法排序方式對過濾氣泡的影響, 為過濾氣泡相關研究提供了新的研究視角與方法論, 還為算法開發(fā)者進行個性化推薦系統(tǒng)的排序指標設計提供了實踐啟示。

1 文獻回顧

1.1 過濾氣泡: 行為選擇性與態(tài)度極端性

過濾氣泡這一概念最初是由Pariser E[1] 在TheFilter Bubble: What the Internet Is Hiding from You 一書中提出, 是指個性化推薦算法可以隨時捕捉用戶的偏好, 并據(jù)此自動過濾信息, 以向用戶提供個性化的信息服務, 這會使得每個人都身處一個獨有的信息世界。雖然過濾氣泡有助于緩解信息過載等問題[15] , 但它在公共議題討論、信息傳播等方面仍存在不利影響[5,16] 。因此, 如何有效應對過濾氣泡一直都是研究人員關注的重點。例如, 利用信息過濾可視化、優(yōu)化個性化推薦算法等方式降低過濾氣泡的影響[7,17] 。

然而, 要評估對過濾氣泡的應對效果, 關鍵在于選擇適當?shù)姆绞綄^濾氣泡進行測量。目前, 尚缺乏通用的過濾氣泡度量手段, 因此, 如何在現(xiàn)實世界與實驗室中捕捉該現(xiàn)象一直是一項難題。部分研究通過觀察不同用戶在同一平臺所接觸信息的相似性來測量過濾氣泡的程度, 即用戶間的信息相似性越小, 說明他們被過濾氣泡所隔離的程度越大[18-19] 。另一部分研究則側重于觀察用戶信息消費內容的多樣性, 將個體信息消費的低多樣性和高選擇性視為過濾氣泡的表現(xiàn)形式[7,20] 。本研究認為, 過濾氣泡的本質是推薦算法對個體的信息選擇性接觸行為的強化[21] , 與其探究不同用戶間的差異, 聚焦于單個用戶的信息消費模式會具有針對性。因此, 本研究選擇第二種方法對過濾氣泡進行測量。

信息消費是指用戶使用信息來滿足自身需求的過程, 如對信息的獲取、理解、使用等[22-23] 。信息的選擇性消費行為則是指用戶對于信息的接觸存在立場偏向性, 這一行為模式在立場多元化的社交媒體上普遍存在[24] 。行為的選擇性可以體現(xiàn)在標題點擊與文章閱讀兩種情況: 一方面, 用戶更傾向于點擊符合自身立場的新聞[25] ; 另一方面, 用戶更愿意花費更多時間去閱讀與其觀點一致的信息[3] 。

用戶態(tài)度也是過濾氣泡產生和發(fā)展的關鍵動力。一方面, 具有極端態(tài)度的個體為避免認知失調, 傾向于更多地選擇消費與其觀點一致的信息[26] , 而這種交互痕跡數(shù)據(jù)將被算法用于預測其立場與偏好, 進而形成過濾氣泡[27] ; 另一方面, 處于過濾氣泡中的個體長期接觸與其觀點一致的信息, 對于該觀點的認可和信任程度進一步強化, 同時缺乏對異質信息的了解[16] , 對于該問題的認識會越來越偏激, 進而加劇用戶的選擇性接觸行為[5] , 久而久之, 用戶行為的選擇性與態(tài)度的極端性在個性化推薦算法的作用下不斷放大, 最終形成惡性循環(huán)。鑒于用戶行為和態(tài)度之間的復雜關系, 本研究認為,過濾氣泡的觀測還應考慮到與信息選擇性消費行為相關的態(tài)度變化, 用戶態(tài)度極端性的增加可以被視為過濾氣泡的體現(xiàn)[28] 。讓用戶接觸更為多樣化的信息內容、接觸更為平衡的信息觀點, 態(tài)度極端性才有可能降低[29-30] , 進而緩解過濾氣泡帶來的負面影響。

1.2 個性化推薦中的信息排序方式

信息在流向用戶的過程中會經過算法的層層過濾, 包括信息源選擇與收集、信息選擇與優(yōu)先級排序、信息展示等多個技術環(huán)節(jié)[8] 。以往研究認為,過濾氣泡是由于推薦系統(tǒng)僅推送與用戶觀點一致的信息所導致的[18] , 因而重點關注“應選擇哪些信息推薦給用戶”, 旨在通過提升推薦信息的多樣性來擴展用戶對于不一致信息的接觸, 避免過濾氣泡所帶來的負面影響[7] 。然而實際上, “如何對推薦信息進行排序” 同樣重要, 因為用戶與信息的交互會受到順序效應的影響, 當不一致信息被賦予較低的呈現(xiàn)優(yōu)先級時, 就難以吸引用戶的注意與選擇。以往研究發(fā)現(xiàn), 在搜索結果頁面上, 用戶更傾向于點擊與注視位于頂部(尤其是前3 條)的結果條目[9] ;在旅游預定平臺上, 排名靠前的酒店會獲得更高的預定量[10] 。因此, 異質信息的排序方式決定了用戶是否能夠真正接觸到這類推薦信息。

在目前的個性化系統(tǒng)中, 例如今日頭條、騰訊新聞等, 算法通常根據(jù)用戶的基礎屬性信息及其歷史行為數(shù)據(jù), 為用戶推薦更符合其偏好的信息, 并基于推薦內容與用戶偏好的一致程度對信息進行排序[31-32] 。此外, 新聞網站和社交媒體還致力于尋找用戶偏好和多樣性的平衡, 將更多的因素納入算法排序的考慮之中, 其中考慮最多的是時間和質量因素[33-34] 。例如, Facebook 中提供了兩種帖子排序方式, 第一種是最新(Most Recent), 即將所有新聞按照時間倒序的方式進行排序, 人們接觸到的是最新的新聞, 而時效性不足的新聞則會淡出人們的視線。第二種則是熱門新聞(Top Stories), 即綜合考慮點評贊數(shù)量、用戶粉絲數(shù)等因素衡量帖子質量,并據(jù)此將帖子按照質量從高到低的順序進行排列,人們首先接觸到的均是高質量的文章[35] 。綜上, 目前常見的排序指標主要分為以下3 類: 基于用戶偏好的排序、基于信息發(fā)布時間的排序、基于信息質量的排序。

基于用戶偏好的排序將與用戶興趣相符的信息賦予更高的權重[31-32] , 與用戶偏好匹配程度更高的態(tài)度一致信息往往會被排在前列, 吸引用戶的點擊與閱讀[36] 。基于信息發(fā)布時間的排序是指推薦算法傾向于為發(fā)布時間更近的信息賦予更高的排序權重[12,37] 。這在新聞推薦系統(tǒng)中尤為常見, 因為時效性是新聞的“生命”。Jiang T 等[38] 的研究發(fā)現(xiàn),時效性越強的新聞的價值性越高, 更容易引起用戶的閱讀興趣, 即用戶會更多的點擊新近新聞, 并且更加信任其內容。而基于信息質量的排序是指推薦算法傾向于為高質量內容的信息賦予更高的排序權重[11,39] , 這種排序可以幫助過濾低質量信息、推廣優(yōu)質信息, 進而影響用戶偏好。例如, Lu H 等[40] 發(fā)現(xiàn), 優(yōu)質信息有效提升用戶的新聞閱讀時長, 并且提升用戶對信息內容的信任度, 從而使用戶更加客觀地了解多方面的信息, 緩解用戶的極端態(tài)度。

綜上, 這3 種排序指標對用戶對于信息的選擇、使用和對信息內容的感知會產生不同的效果。但現(xiàn)有的關于個性化推薦算法的排序方式的研究多是從算法技術角度出發(fā), 旨在通過納入不同的因素來提升個性化推薦系統(tǒng)的性能, 如準確性、效率等指標[12,41] 。而較少的從用戶行為視角出發(fā), 比較用戶在不同排序方式下與算法的交互行為的差異。哪種排序指標對于過濾氣泡的影響更大, 尚不得而知。

1.3 算法素養(yǎng)

在算法時代, 人們所接觸的大部分信息是由推薦算法控制的, 人們在享受其提供的便捷的同時,也面臨著算法帶來的負面影響, 如過濾氣泡、算法偏見等。人們對于推薦算法的理解與認知程度在很大程度上決定了人們是否能與算法開展良性互動、避免負面影響[42] 。算法素養(yǎng)這一概念應運而生, 是指用戶對于算法的了解程度, 包括算法意識(Algo?rithm Awareness)和算法知識(Algorithm Knowledge)兩個維度[13] 。算法素養(yǎng)被認為是影響人與算法交互的重要因素之一, 算法素養(yǎng)能有效幫助人們理解推薦算法的內在邏輯, 意識到推薦算法的潛在風險, 進而為規(guī)避這些風險采取有效手段[43-44] 。

之前研究發(fā)現(xiàn), 不同人群的算法素養(yǎng)存在高低之分, 且提高算法素養(yǎng)有助于避免過濾氣泡的負面影響[45-46] , 這主要體現(xiàn)在對算法推薦信息的識別與評估能力上。一方面, 相比于低算法素養(yǎng)用戶,高算法素養(yǎng)用戶更了解算法機制, 對過濾氣泡表現(xiàn)出更高的認識, 從而更能準確地對推薦內容做出判斷與篩選。具體表現(xiàn)為, 這類用戶在瀏覽在線購物網站時, 更容易意識到算法在跟蹤他們的購物行為,據(jù)此提供個性化的內容, 并對其中的精準營銷廣告作出甄別[47] ; 另一方面, 相比于低算法素養(yǎng)用戶傾向于不加批判地全盤接受算法推薦的信息, 高算法素養(yǎng)用戶往往會在決策前進行評估與思考[42] , 通過比較接受推薦信息的收益與風險, 進而作出更為明智的決策[48] 。因此, 高算法素養(yǎng)用戶往往會對過濾氣泡表現(xiàn)出更強的抵抗意圖, 會有意識跳出算法的控制, 在與算法交互時表現(xiàn)出更高水平的自主性,包括但不限于調整平臺的推薦機制, 閱讀更多非個性化內容, 改變自身閱讀習慣等[47,49-50] 。

綜上所述, 不同算法素養(yǎng)水平的用戶對于排序指標的認知與行為反應不同。因此, 本研究假設對于不同算法素養(yǎng)水平的用戶而言, 排序方式對新聞點擊行為與閱讀行為的影響存在差異。

2 研究設計

鑒于過濾氣泡的研究通常涉及圍繞政黨之爭、食品安全等兩極分化的爭議性主題[5,51] , 本研究基于200 份問卷調查結果, 選擇了目前在國內受到廣泛討論并且存在兩級分化立場的話題之一———“轉基因食品” 作為實驗信息主題。本研究構建了模擬的新聞個性化推薦小程序, 通過開展被試間實驗設計, 將參與者分到不同新聞排序方式的實驗組(基于用戶偏好/ 時間/ 質量的排序)。觀察并記錄用戶對于不同立場的轉基因食品相關新聞的瀏覽行為, 并在實驗前后分別使用態(tài)度量表度量參與者對于“轉基因食品” 的態(tài)度。

2.1 實驗參與者

研究通過社交媒體發(fā)布招募廣告進行實驗參與者招募。研究人員提出了兩項招募要求, 以確保參與者正處于過濾氣泡之中: ①已經對轉基因食品持有極端態(tài)度, 譬如非常支持或非常反對轉基因食品;②在日常生活中獲取轉基因食品相關信息時存在選擇性, 譬如明顯傾向于瀏覽與自己態(tài)度立場一致的新聞。招募問卷通過7 點李克特量表分別測量了參與者對于轉基因食品所持態(tài)度[52] 及相關新聞消費行為的選擇性。其中態(tài)度得分≤3 分的代表反對態(tài)度, ≥5 分的代表支持態(tài)度, 得分處于3~5 分之間代表持中立態(tài)度; 同樣, 行為得分≤3 或≥5 代表了參與者存在選擇性新聞消費行為, 得分處于3~5之間則說明不存在選擇性新聞消費行為。

研究者從70 份招募問卷中選取了38 名符合要求的參與者, 其中男性18 名, 女性20 名, 年齡均在18~25 歲之間, 持支持或反對轉基因食品態(tài)度的各19 人。這些參與者被隨機地分配到3 個實驗組, 盡量確保每組中持兩種態(tài)度的人數(shù)相仿, 具體分組情況如表1 所示。

2.2 實驗材料

2.2.1 新聞文本設計

為了確保推送信息的真實性, 研究者從澎湃新聞、今日頭條等主流新聞平臺搜集了轉基因食品相關新聞60 篇, 從中篩選出立場明確的28 篇新聞,其中對轉基因食品持支持、反對、中立立場的新聞分別為12、12、4 篇。研究人員邀請了1 位專業(yè)新聞編輯對新聞進行改寫, 其目的在于最大限度地控制與減少除排序方式之外的因素(比如文本長度、修辭特征等)對于實驗結果的潛在影響。最終每篇新聞的標題長度均在10~15 個字符之間, 不包括任何標點符號和阿拉伯字母, 均采用陳述句式, 不涉及特殊語言風格(如夸張、煽情)等; 新聞正文長度均在300~ 350 字之間, 均使用通俗易懂、簡單自然的語言表述。在推送界面中, 為了避免信息源權威性的干擾, 所有新聞的發(fā)布來源被隱去。新聞發(fā)布時間均控制在2022 年范圍內, 并按照新聞的真實發(fā)布時間進行排序, 在后續(xù)實驗中作為時間排序指標的取值。

隨后, 10 位新聞傳播領域的專業(yè)人士被邀請對改寫后的新聞進行評估。在閱讀完每篇新聞的標題和內容之后, 10 位專業(yè)人士需要填寫對新聞立場(Q1)、標題吸引力(Q2)、新聞質量(Q3~5)的評估量表(略)。其中, 新聞立場、標題吸引力由單一測量項構成, 均為7 點李克特量表。結果表明,每篇新聞的立場均具有明顯偏向并且符合初始分類,任意兩組之間的獨立t 樣本檢驗結果表明, 不同立場新聞在標題吸引力方面不存在顯著差異(t(22)=0.206, p = 0.839; t (14) = 1.560, p = 0.141; t(14)= 0.946, p = 0.360)。新聞質量則包括可讀性、邏輯性和可信度3 個測量維度[53-54] , 用3 個維度的均值進行表示, 并與以往研究保持一致, 采用了5 點李克特量表。新聞質量的得分存在明顯的高低差異(t(27)= 11.042, p = 0.000), 作為基于質量排序的實驗組的排序依據(jù)。

2.2.2 系統(tǒng)界面設計

通過模仿主流新聞推送平臺的界面設計, 本研究設計并開發(fā)了名為“轉基因食品小科普” 的新聞推薦平臺。平臺首頁呈現(xiàn)了以特定方式排序的20 條新聞標題, 每條新聞標題文本下顯示該新聞的發(fā)布時間與質量評分, 當參與者點擊任一新聞標題之后,即可進入新聞內容詳情頁。

根據(jù)以往過濾氣泡相關研究, 個性化推薦算法所推薦的信息中與用戶立場一致的信息往往占據(jù)了較高比例[5,55] 。為了確定這一比例的具體數(shù)字, 本研究開展了預實驗, 觀察當一致新聞推送占比分別為50%、60%、70%、80%、90%時, 參與者對于算法個性化程度的感知及其新聞消費體驗。本研究一共招募了15 名參與者分別對不同頁面進行評價。結果表明, 除了50%占比的對照組之外, 其余組均被參與者識別為個性化推薦情景, 并且大部分參與者(N=12,80%)認為當一致新聞占比為60%時最貼近于日常新聞消費體驗, 因此, 本研究采?。叮埃プ鳛橐恢滦侣劦耐扑捅壤W罱K, 在模擬新聞推薦系統(tǒng)所推送的20篇新聞中, 有12 篇(60%)新聞與參與者的立場相一致, 4篇(20%)新聞立場相反, 4篇(20%)新聞持中立立場。換而言之, 對于前測態(tài)度為支持轉基因食品的參與者, 為其推送的新聞中包括12篇支持轉基因食品、4 篇反對轉基因食品、4篇對此持中立立場的新聞, 反之亦然。

盡管在不同實驗組中, 持有相同前測態(tài)度的參與者被推送的20 篇新聞內容是相同的, 但每組的新聞排序方式存在差異: 在基于偏好排序組中, 根據(jù)專家對每篇新聞的立場評分與用戶自身立場分數(shù)的一致性程度(其分數(shù)相減絕對值為一致性得分, 得分越高則表示該條新聞與用戶偏好越不一致), 將參與者所接觸到的新聞按照態(tài)度一致程度從非常一致到非常不一致進行排序, 如圖1(a)所示; 在基于時間排序組中, 新聞將根據(jù)發(fā)布時間從近到遠進行排序, 如圖1(b)所示; 在基于質量排序組中,新聞將根據(jù)專家質量評分從高到低進行排序, 如圖1(c)所示。

2.3 變量的測量

信息消費行為的選擇性。行為選擇性是指用戶行為的偏向性, 本研究將通過參與者對于一致新聞與不一致新聞的點擊或閱讀行為差異進行度量。通過微信小程序的后臺日志文件, 研究者獲取了用戶對新聞標題的點擊次數(shù)以及新聞文章閱讀時長。一方面, 本研究通過用戶對一致新聞標題的點擊量與不一致新聞標題的點擊量之差測量新聞點擊行為的選擇性; 另一方面, 本研究通過用戶對于一致與不一致新聞的平均閱讀時長之差測量新聞文章閱讀行為的選擇性。

態(tài)度極端性的變化。態(tài)度極端性(Attitude Ex?tremity)是指用戶態(tài)度偏離中立的程度, 通過用戶態(tài)度取值與態(tài)度量表中點(4) 差距的絕對值進行測量[56] 。研究者在實驗前后使用同一量表分別測量了參與者對于轉基因食品的態(tài)度, 并且將二者相減,以反映參與者的態(tài)度極端性變化情況, 如式(1)所示。

其中AEpost表示用戶后測態(tài)度的極端性, AEpiror表示用戶前測態(tài)度的極端性; ATpost表示用戶后測態(tài)度, ATpiror表示用戶前測態(tài)度。根據(jù)參與者在實驗前后的態(tài)度變化情況, 可以將其分為3 類: 當該值大于0 時, 表示參與者態(tài)度的極端性在接觸推送新聞之后有所增強, 即“態(tài)度極化”; 當該值小于0 時, 表示參與者態(tài)度的極端性有所下降, 即“態(tài)度緩和”; 當該值等于0 時, 表示參與者態(tài)度的極端性保持不變, 即“態(tài)度不變”。

算法素養(yǎng)。本研究所采用的算法素養(yǎng)量表改編自Dogruel L 等[13] 的算法素養(yǎng)量表(Cronbachs α =0 734), 包括算法意識和算法知識兩個維度, 各維度均包含11 道判斷題(略)。每個題項都是一個或真或假的表述, 參與者需要判斷這一表述是否正確或錯誤, 或者選擇“不知道”。參與者判斷正確則計1 分, 判斷錯誤或者選擇“不知道” 則不加分。所有題項的累計總分反映了參與者的算法素養(yǎng)水平。本研究中, 38 名參與者的算法素養(yǎng)得分在10~22 之間, 平均得分為15 68, 得分的中位數(shù)為16。參照Neter E 等[57] 的研究, 本研究使用中位數(shù)作為分類基準, 當參與者的算法素養(yǎng)得分低于中位數(shù)時, 被劃分為低算法素養(yǎng)人群, 當?shù)梅值扔诨蚋哂谥形粩?shù)時被劃分為高算法素養(yǎng)人群。在本研究所招募的38 位參與者中, 低算法素養(yǎng)參與者共18人, 高算法素養(yǎng)參與者共20 人。

2.4實驗流程

整個實驗過程由4個階段組成。首先, 在招募過程中, 研究者采集參與者的人口統(tǒng)計學信息、轉基因食品新聞的日常消費行為、對于轉基因食品的前測態(tài)度, 篩選符合要求的參與者進入正式實驗;其次, 參與者在到達實驗室后, 需要簽署知情同意書并閱讀相應的實驗操作指南, 以了解整體實驗流程, 熟悉實驗平臺的界面操作與基本功能, 并填寫算法素養(yǎng)量表。隨后, 參與者被分配到不同實驗組,需要按照日常新聞閱讀習慣, 瀏覽所分配的模擬新聞推送平臺中的新聞, 在瀏覽過程中, 研究者并不會給予具體任務或時間限制, 并且整個交互過程將記錄在系統(tǒng)日志文件中; 最后, 參與者在實驗結束之后會填寫一份后測問卷, 報告此時自身對于轉基因食品的態(tài)度。整個實驗將持續(xù)30分鐘左右, 每位參與者獲得價值30元禮品作為實驗報酬。

3 研究結果

3.1 排序方式對于點擊行為選擇性的影響

在整個實驗過程中, 平均每位參與者點擊了12.18 篇系統(tǒng)推送的新聞, 其中包括7.53 篇立場與其態(tài)度一致的新聞(SD=3.162, Range=2~12),2.44 篇立場與其態(tài)度不一致的新聞(SD = 1.191,Range= 1 ~ 4), 2.21 篇持中立立場的新聞(SD =1.234,Range= 0~4)。如圖2 所示, 所有實驗組參與者的新聞點擊行為均具有選擇性。

單因素方差分析(ANOVA)結果表明, 排序方式對于點擊行為選擇性不存在顯著影響(F(2,36)=2.487, p= 0.098)。即無論在哪一種排序方式下,參與者始終會更多地點擊一致新聞而非不一致新聞。

3.2 排序方式對于閱讀行為選擇性的影響

在整個實驗過程中, 每位參與者平均花費22.88s閱讀每篇新聞, 其中一致新聞的平均閱讀時長為23.12s(SD = 12.12, Range = 7.40 ~ 49.41), 不一致新聞的平均閱讀時長為22.53s (SD=10.70,Range=4.86~ 49.92), 中立新聞的平均閱讀時長為20.19s(SD= 14.87, Range = 0~62.89)。如圖3所示, 不同實驗組參與者的新聞閱讀行為選擇性存在差異。

單因素方差分析(ANOVA)結果表明, 排序方式對于參與者的閱讀行為選擇性存在顯著影響(F(2,36)= 18.639, p =0.000)。根據(jù)事后檢驗(Posthoc)結果, 基于偏好排序組的閱讀行為選擇性顯著高于基于時間排序組(M偏好= 9.019±8.556>M時間=0.841±4.351, p=0.007), 而基于時間排序組又顯著高于基于質量排序組(M時間=0.841±4.35>M質量=-8.07±7.620, p=0.004)。

為了進一步揭示排序方式對不同類型新聞的閱讀時長的具體影響, 研究者分別對一致新聞平均閱讀時長、不一致新聞的平均閱讀時長開展單因素方差分析(ANOVA)。結果表明, 排序方式對于一致新聞的平均閱讀時長不存在顯著影響(F(2,36)=1.100,p=0.344), 但對于不一致新聞的平均閱讀時長存在顯著影響(F(2,36)= 3.393, p = 0.045)。對于后者, 事后檢驗(Post-hoc)結果表明, 基于質量排序組參與者的不一致新聞平均閱讀時長要顯著高于基于偏好排序組(M質量= 28.071±9.95<M偏好=17.901±8.83, p=0.014), 而基于時間排序組與其余兩組均沒有顯著差異(M時間= 21.549±11.397,M偏好= 17.901 ± 8.83, p = 0.373; M時間= 21.549 ±11.397, M質量=28.071±9.95, p=0.115)。這一結果表明, 基于質量的排序方式主要是通過增加用戶對于不一致新聞的閱讀時長來降低用戶閱讀行為的選擇性。

3.3 個性化推薦排序方式對態(tài)度極端性變化的影響

圖4展示了參與者在實驗前后的態(tài)度變化情況, 其中近一半?yún)⑴c者的態(tài)度在瀏覽新聞后更為緩和(N=18, 47.37%); 5 名參與者從支持態(tài)度和反對態(tài)度轉變?yōu)橹辛B(tài)度(N=5, 13.16%); 12 名參與者的態(tài)度立場雖然未發(fā)生改變, 但態(tài)度的極端程度有所降低(N = 13, 34.21%)。然而, 也有28%的參與者在瀏覽新聞之后態(tài)度更為極端(N = 11,28.95%)。此外, 23%的參與者的態(tài)度沒有發(fā)生任何變化(N= 9,23.68%), 其中包括了初試態(tài)度為支持(N=3,7.89%)或反對(N=6,15. 79%)的人群。

單因素方差分析(ANOVA)結果表明, 排序方式對于態(tài)度極端性變化程度存在顯著影響(F(2,36)= 7.073, p = 0.003)。事后檢驗(Post-hoc)結果表明, 基于質量排序組參與者的態(tài)度極端性變化程度顯著高于基于偏好排序組(M質量= -0.666 ±0.527<M偏好=-0.333±0.653, p=0.001); 而基于時間排序組參與者的態(tài)度極端性變化程度與其余兩組(M時間= -0.139±0.834,M偏好=-0.333±0.653,p= 0.091; M時間= -0.139±0.834, M質量=-0.666±0.527,p=0.060)均沒有顯著差異。

3.4 算法素養(yǎng)的調節(jié)作用

多因素方差分析(MANOVA)結果表明, 算法素養(yǎng)在排序方式對用戶點擊行為選擇性的影響中并不存在顯著的調節(jié)作用(F(2,32)= 0.096, p=0.909),如圖5 所示。這一結果表明, 對于不同算法素養(yǎng)水平的參與者而言, 排序方式對于用戶點擊行為選擇性的影響不存在顯著差異。

此外, 算法素養(yǎng)在排序方式對用戶閱讀行為選擇性的影響中也不存在顯著調節(jié)作用(F(2,32)=0.156, p= 0.856), 如圖6 所示。這一結果表明,對于不同算法素養(yǎng)水平的參與者而言, 排序方式對于用戶閱讀行為選擇性的影響不存在顯著差異。

4討論

本研究首次通過實證研究揭示了新聞推薦系統(tǒng)的排序方式對于新聞閱讀行為選擇性、態(tài)度極端性變化程度存在顯著影響, 并且這一影響對于不同算法素養(yǎng)水平的人群而言均存在, 并不存在群體差異。

首先, 本研究證明了排序方式并不影響點擊行為的選擇性, 所有參與者都更傾向于點擊與自身態(tài)度一致的新聞。這打破了以往研究認為用戶偏好排序靠前信息的固有觀點[9] 。這可能是由于以往研究結論往往針對傳統(tǒng)信息搜索情景, 此時排序靠前代表信息的高度相關性, 進而吸引更多點擊行為[58] 。然而, 新聞瀏覽行為作為一種無定向的信息搜尋行為[59] , 往往由興趣驅動, 此時用戶的目的不是尋找最準確的答案, 而是挑選出符合自身興趣或喜好的新聞[20] 。因此, 無論采取何種排序方式, 用戶對于新聞的選擇偏好仍然會保持穩(wěn)定。

其次, 本研究證明了排序方式對于用戶的閱讀行為選擇性存在影響, 具體表現(xiàn)為在基于用戶偏好的排序組中呈現(xiàn)出較高的閱讀行為選擇性, 基于時間的排序組次之, 基于質量的排序組最低。并且,這一差異主要體現(xiàn)在用戶對于不一致新聞而非一致新聞的平均閱讀時長差異上。具體來說, 相較于基于偏好排序組, 基于質量排序組中的用戶在不一致新聞上花費的時間更多。其原因可能在于, 人們通常傾向于對不一致新聞投入較少的認知努力[60] , 不愿意花費過多時間處理不一致信息。而在基于質量的排序方式中, 用戶更容易接觸到那些排在前面的高質量新聞, 即使這些新聞與用戶觀點不一致, 其較高的感知說服力也會提升用戶的閱讀時間[61-62] 。

此外, 本研究還證明了不同排序方式對于用戶態(tài)度極端性變化程度存在顯著影響, 即相比于基于用戶偏好的排序組, 基于質量的排序組參與者閱讀新聞后的態(tài)度極端性會有更大程度的削弱。這可能是由于在基于質量的排序組中, 不一致信息的呈現(xiàn)次序會比基于偏好的排序組更靠前。而用戶往往對于排名靠前的新聞更為信任[63] , 更傾向于采納排名靠前的信息觀點[64] , 因此用戶更容易接納不一致信息的觀點, 削弱自身態(tài)度的極端性。

最后, 本研究證明了上述影響在不同算法素養(yǎng)水平的人群中均普遍存在, 且沒有顯著差異。這說明無論用戶是否具備豐富的算法知識, 是否對推薦系統(tǒng)有著全面理解或深層次思考, 都不可避免地會受到影響。因此, 排序方式對過濾氣泡的影響更像是一種隱性的“助推(Nudge)” 形式[65] , 潛移默化地影響著人們對于推薦信息的行為反應與心理活動。

5結語

本研究首次通過受控實驗驗證了推薦算法排序方式不影響用戶點擊行為選擇性, 但會影響閱讀行為選擇性與態(tài)度極端性變化程度。具體而言, 相較于基于偏好的排序方式, 在基于質量的排序中, 用戶閱讀行為選擇性會顯著降低、自身態(tài)度極端性會更大程度地削弱。而基于時間的排序對用戶行為選擇性和態(tài)度極端性變化的影響與基于偏好的排序之間沒有顯著差異。

本研究的理論意義在于: ①提出了過濾氣泡干預策略的新研究視角。以往研究聚焦于優(yōu)化推薦信息的“選擇” 策略, 但本研究通過實證研究證明“排序” 策略也同樣重要, 并從行為選擇性與態(tài)度極端性兩個維度揭示了不同排序方式對于過濾氣泡的干預效果, 為后續(xù)開展相關研究提供了新的方向;②為過濾氣泡實證研究提供了方法論啟示。目前,大部分過濾氣泡研究并未開展實驗研究, 或僅僅采用了定性研究方法。本研究首次通過實證研究, 驗證了用行為選擇性與態(tài)度極端性量化過濾氣泡程度的可行性, 打破了該研究領域的方法論瓶頸。

本研究結果還為實踐提供了指導。①從平臺角度而言, 根據(jù)本研究結果, 算法開發(fā)與設計人員應對基于質量的排序指標賦予更高的權重, 并在不損害用戶體驗的前提下適當降低基于用戶偏好的排序指標, 從而緩解過濾氣泡的負面影響。然而, 在面對浩渺的信息流, 算法如何準確判斷信息內容的質量高低, 仍然是個嚴峻的挑戰(zhàn)。除了利用點贊、播放等初級指標之外, 還需要人類參與其中進行監(jiān)督與判斷, 讓算法實現(xiàn)類似于人類專家的信息質量評估策略, 構建起內容推薦機制的“人在回路” (Hu?man-in-the-Loop)機制; ②從用戶角度來說, 盡管算法素養(yǎng)的調節(jié)作用不顯著, 但其高低仍會影響用戶的態(tài)度改變, 因而在打破過濾氣泡的過程中還需要注意用戶算法素養(yǎng)的提升, 加強個性化推薦算法相關知識的教育, 提高用戶對于推薦算法的意識,從而有能力辨別所推薦信息的價值, 不被個性化推薦算法所左右。

迁西县| 鄯善县| 潜山县| 樟树市| 饶阳县| 贡觉县| 彭州市| 宿迁市| 黔江区| 汤原县| 浪卡子县| 古田县| 车致| 来凤县| 合水县| 翁牛特旗| 揭东县| 大关县| 宜良县| 青铜峡市| 应用必备| 曲沃县| 额济纳旗| 灵丘县| 司法| 灵石县| 苗栗县| 宜昌市| 沁源县| 合作市| 栾川县| 巴彦县| 民勤县| 铜山县| 琼海市| 泾源县| 镇江市| 桂阳县| 沈丘县| 蓬莱市| 汤原县|