于書亞
摘要:隨著技術(shù)的發(fā)展,互聯(lián)網(wǎng)時代的信息分發(fā)機制已與傳統(tǒng)媒體時代大有不同。網(wǎng)絡(luò)媒體平臺替代傳統(tǒng)的大眾媒體機構(gòu)成為信息流動的重要中介渠道。傳統(tǒng)媒體時代的被動“受眾”向互聯(lián)網(wǎng)時代的“信息用戶”轉(zhuǎn)變,個體擁有了更多的信息自主選擇權(quán)。技術(shù)的高速發(fā)展使傳播環(huán)境從傳統(tǒng)的“一對一”發(fā)展成為“多對多”的信息爆炸時代,為解決內(nèi)容消費痛點,社交性分發(fā)機制、搜索引擎式分發(fā)機制以及算法型分發(fā)機制紛紛應(yīng)運而生并各自瓜分占領(lǐng)數(shù)字空間的內(nèi)容分發(fā)渠道。
關(guān)鍵詞:分發(fā)機制 衍變 人機共治
互聯(lián)網(wǎng)平臺多樣的內(nèi)容分發(fā)機制提升了信息-用戶的傳播效率,更好的滿足了個體用戶對信息的個性化需求,于此對應(yīng)的是,傳統(tǒng)媒體機構(gòu)日益失去了內(nèi)容分發(fā)的主動權(quán),面臨生存和發(fā)展的危機,其內(nèi)容生產(chǎn)和分發(fā)模式的深度變革迫在眉睫。在流量和連接逐漸富余的時代,主流媒體如何在互聯(lián)網(wǎng)上建設(shè)有效的分發(fā)手段,建立“優(yōu)質(zhì)內(nèi)容-用戶”的直接傳播關(guān)系、削弱平臺的控制力,發(fā)揮其優(yōu)質(zhì)內(nèi)容資源的最大價值,并建設(shè)獨立自主可控的新興媒體平臺,將成為推動媒體融合背景下轉(zhuǎn)型發(fā)展的重要方向。
基于此,本文試圖通過梳理互聯(lián)網(wǎng)內(nèi)容分發(fā)機制的發(fā)展歷程,對智媒時代下信息分發(fā)方式的機制原理進行深入研究,探究主流媒體在互聯(lián)網(wǎng)化的過程中如何解決信息分發(fā)的問題。
一、信息分發(fā)機制與算法型信息分發(fā)
傳統(tǒng)媒體時代,信息的生產(chǎn)和分發(fā)都是一體的,都由媒體機構(gòu)完成。新聞的分發(fā)是粗放式、普適性的。由記者與編輯完成新聞采編,并藉由媒體自身的傳播渠道完成內(nèi)容的發(fā)布,發(fā)布過程體現(xiàn)“群體式推送”的特征。由于受到主觀條件和客觀條件的限制,此時廣義上的“內(nèi)容分發(fā)”難以進行細致的拆分,更加偏向于“發(fā)布”的概念,即重視媒體單向的傳播過程。而狹義的“分發(fā)環(huán)節(jié)”一般是指在報刊室將報刊、雜志等內(nèi)容傳遞到讀者手中的這一環(huán)節(jié)。如果細化“分發(fā)”環(huán)節(jié),強調(diào)的正是信息內(nèi)容傳播至個體的這一過程。
信息分發(fā)是在新媒體時代下產(chǎn)生的新現(xiàn)象。強調(diào)的同樣也是媒體和平臺通過信息的發(fā)布和推送,最終收集到用戶的注意力。本文所界定的信息發(fā)布的概念沿用此描述。信息分發(fā)包括人工分發(fā)和機器分發(fā)兩種類型,前者包括媒體在新媒體平臺上進行信息發(fā)布和用戶轉(zhuǎn)發(fā),后者是指應(yīng)用算法、機器等技術(shù)在新聞聚合平臺上將信息內(nèi)容精準推薦給用戶。
本文探討的信息分發(fā)機制是指,互聯(lián)網(wǎng)時代以來,信息分發(fā)成為相對獨立的傳播環(huán)節(jié)。平臺或機構(gòu)如何將信息內(nèi)容傳播至個體的精準匹配的過程?;ヂ?lián)網(wǎng)的信息分發(fā)機制不只是簡單地將新聞報道放置于“網(wǎng)絡(luò)版面”上,而是依據(jù)不同平臺特征,不同終端設(shè)備,不同使用場景下,采取不同的分發(fā)方式,從而更快實現(xiàn)“信息——人”的傳輸。由于這是在技術(shù)的助推下得以實現(xiàn)的,因此信息分發(fā)機制的發(fā)展進程始終緊密圍繞技術(shù)手段的進步。
本文所界定的信息分發(fā)機制聚焦于兩點:(1)完成了“信息——人”的完整傳播閉環(huán),精準適配個人的信息需求;(2)從“信息”到“人”的過程中各個環(huán)節(jié)相互作用的過程,并依托算法最終達成精準分發(fā)。
算法分發(fā)機制是一種以算法為信息發(fā)布機制的核心技術(shù),用以實現(xiàn)信息的自主推送,通過對大數(shù)據(jù)的整理和匯聚,并依據(jù)特定的程序自動抓取相關(guān)內(nèi)容進行錄入、分析、排序、標簽化,并根據(jù)對用戶標簽的分析進行針對性的分發(fā),將用戶與內(nèi)容進行準確匹配,為用戶提供優(yōu)質(zhì)服務(wù),最大程度實現(xiàn)用戶的個性化需求。
在當前的信息環(huán)境中,隨著技術(shù)的高速發(fā)展,算法以其強大和高速的數(shù)據(jù)處理能力介入到多種的信息交互過程中。因此本文探討的算法型的信息分發(fā)機制不僅局限于個性化推薦引擎式的信息分發(fā),同樣也包括搜索引擎式的信息分發(fā)和社交式的信息分發(fā)。
二、互聯(lián)網(wǎng)信息分發(fā)機制的衍變
在我國,互聯(lián)網(wǎng)出現(xiàn)以前的信息內(nèi)容的生產(chǎn)和分發(fā)是由國家壟斷,國家掌握著廣播、電視臺、報社、出版社等分發(fā)渠道。互聯(lián)網(wǎng)時代帶來信息生產(chǎn)和分發(fā)的進一步剝離,平臺成為信息分發(fā)的主要渠道。傳統(tǒng)媒體自建網(wǎng)站發(fā)布自己的新聞,門戶網(wǎng)站、搜索引擎成為了重要的信息發(fā)布平臺,它們并不直接生產(chǎn)新聞,而是獲取傳統(tǒng)媒體所生產(chǎn)的新聞并在自己的平臺上進行發(fā)布。之后,社交分發(fā)成為新的分發(fā)機制,各類服務(wù)類平臺也獲得了信息分發(fā)的能力。人工智能時代,算法分發(fā)占據(jù)信息分發(fā)體系的龍頭地位,使網(wǎng)絡(luò)時代所出現(xiàn)的各類新聞分發(fā)平臺進入新紀元,信息分發(fā)平臺和用戶平臺在一定程度上是重合的,即是新聞發(fā)布平臺,也是用戶接受平臺。依據(jù)其主導(dǎo)力量的不同,并結(jié)合互聯(lián)網(wǎng)技術(shù)發(fā)展階段,筆者將信息分發(fā)機制的歷史衍變分為“依據(jù)人工力量為主的分發(fā)機制”和“以算法為核心的分發(fā)機制”兩種模式進行梳理,它們各自具備不同的分發(fā)邏輯、技術(shù)手段和意義。
(一)人工分發(fā)
1.列表分發(fā):分類索引,用戶拿取
由傳統(tǒng)媒體時代沿襲而來的編輯式分發(fā)機制仍然在互聯(lián)網(wǎng)崛起的當今時代占有一席之地,所謂的“編輯式分發(fā)”是指,“通過人工篩選和編輯,并基于受眾的共性需求向所有用戶分發(fā)相同的內(nèi)容。”在Web1.0時代,此類應(yīng)用信息的列表式分發(fā)的平臺主要表現(xiàn)為門戶網(wǎng)站,門戶網(wǎng)站也被視為中國傳統(tǒng)媒體觸網(wǎng)發(fā)展的第一輪數(shù)字化轉(zhuǎn)型。肇始于上世紀九十年代,眾多傳統(tǒng)報刊開始嘗試在互聯(lián)網(wǎng)上建立自己的門戶網(wǎng)站,專業(yè)的編輯按照一定的標準將信息進行取舍,并最終按照不同的版塊呈現(xiàn)在統(tǒng)一的媒體平臺上,取舍和選擇信息的依據(jù)主要基于平臺定位、信息內(nèi)容特質(zhì)、用戶需求等。當前,此類門戶網(wǎng)站包括兩類,一是傳統(tǒng)媒體的新聞門戶網(wǎng)站,如人民日報、新華社等,二是互聯(lián)網(wǎng)的新聞門戶網(wǎng)站,如騰訊新聞、新浪新聞、網(wǎng)易新聞等。
隨著移動互聯(lián)網(wǎng)時代來臨,大多數(shù)傳統(tǒng)門戶網(wǎng)站的轉(zhuǎn)型突出表現(xiàn)為以傳統(tǒng)新聞門戶網(wǎng)站向移動端“挪移”。目前,我國大多數(shù)的新聞資訊APP仍采用“列表分發(fā)”的信息分發(fā)模式。由專業(yè)編輯統(tǒng)一設(shè)定媒體的欄目分類、更新頻率、內(nèi)容審核標準等,編輯按照一定的標準將信息的重要性、顯著性進行把關(guān)并統(tǒng)一設(shè)定排序,所有用戶最終接收到的內(nèi)容在統(tǒng)一的界面之上都是相同的。
總的來看,這種信息的列表式分發(fā)呈現(xiàn)具有顯著的特點:第一,其內(nèi)容通常是廣泛而全面的,覆蓋社會各個層面、各個領(lǐng)域,以頭部內(nèi)容為主;第二,分發(fā)主要依靠編輯的把關(guān)能力,對技術(shù)依賴性弱,界面頻道設(shè)定為不同分類的信息資訊,供用戶自行選擇感興趣的內(nèi)容分欄獲取或自行搜索獲取信息;第三,內(nèi)容生產(chǎn)受分發(fā)影響小。信息內(nèi)容多數(shù)為傳統(tǒng)媒體內(nèi)專業(yè)的采編團隊自行創(chuàng)作或轉(zhuǎn)載主流媒體的新聞內(nèi)容,選擇內(nèi)容的標準則由專業(yè)編輯統(tǒng)一把關(guān),突出強調(diào)新聞價值性和顯著性。
2.社交分發(fā):訂閱關(guān)注、社交傳播
伴隨大量互聯(lián)網(wǎng)用戶的廣泛介入和網(wǎng)絡(luò)帶寬的提升,互聯(lián)網(wǎng)服務(wù)能力的進一步提升,起始于BBS衍生出的社區(qū)論壇,每個用戶都可以自行建站,并與其他個體直接產(chǎn)生關(guān)聯(lián)。WEB2.0的概念開始被提出,用戶主導(dǎo)產(chǎn)品服務(wù)的時代來臨,并誕生了一批基于此種理念設(shè)計的社交產(chǎn)品,如Facebook、Reddit、YouTube等。由于信息的發(fā)布方式發(fā)生了根本性的轉(zhuǎn)變,信息的分發(fā)方式也隨之產(chǎn)生改變,一種基于XML的全新協(xié)議RSS被廣泛運用。不同于門戶網(wǎng)站的分發(fā)方式,RSS允許網(wǎng)站向用戶推送其最新摘要,當其運用于個人博客上時,便成為了一種全新的訂閱服務(wù),即RSS集合閱讀器。這種閱讀器是完全個性化的,用戶所接收到的信息內(nèi)容完全由用戶自己的訂閱列表決定。這一技術(shù)帶來了內(nèi)容分發(fā)劃時代的變革。換言之,在WEB1.0時代,用戶接入互聯(lián)網(wǎng)獲取信息的最快捷路徑是通過聚合信息的門戶網(wǎng)站或搜索引擎,而在WEB2.0時代,用戶則可以直接通過訂閱或關(guān)注的用戶列表獲取信息。
隨著移動網(wǎng)絡(luò)的普及,信息的生產(chǎn)和分發(fā)權(quán)力下放至普遍個體,越來越多的人成為移動媒體的穩(wěn)定用戶,社交也越來越成為信息生產(chǎn)與傳播的主要動力。隨著移動媒體的影響力不斷擴大,以社交為主的信息分發(fā)方式也逐漸成為主流。援引皮尤研究中心的數(shù)據(jù),美國成年人中有超過70%的用戶每日通過社交媒體獲取新聞,在我國,則表現(xiàn)為微博、微信的一時火爆,我國通過社交媒體獲取新聞內(nèi)容的人口比例高達八成。據(jù)2021年1月數(shù)據(jù),微信日活達10.9億,微信朋友圈日活高達7.8億,微信公眾號日活達到3.9億??梢?,社交式分發(fā)仍然是當前內(nèi)容分發(fā)格局中主流方式之一。
社交式分發(fā)方式是指,社交好友通過好友關(guān)注、點贊、轉(zhuǎn)發(fā)、評論等行為所實現(xiàn)的信息的傳播。首先需要在用戶之間建立一種社交性連接,再通過社交媒體中介渠道進行內(nèi)容的分發(fā)。如微博始終將自身功能定位于“打造基于人際關(guān)系的信息生產(chǎn)和集散開放中心”,鼓勵使用該平臺的用戶隨時隨地分享和獲取身邊的新鮮事兒。當你在微博上與朋友互相關(guān)注,或關(guān)注了特定圈層的名人、網(wǎng)紅等,你在此平臺上所瀏覽到的內(nèi)容維度便被劃定。每位博主的每一條動態(tài)、好友之間的私信等都可被稱為它的社交分發(fā)。又例如號稱“打造我國最大社交生態(tài)系統(tǒng)”的微信平臺,其內(nèi)容分發(fā)的主要窗口是朋友圈、群組聊天、微信公眾號等。微信更加強調(diào)在熟人社交的強關(guān)系鏈基礎(chǔ)上進行信息分發(fā)和傳播。
社交式分發(fā)機制對傳播邏輯的改變是顛覆式的。在這種分發(fā)機制下,信息的傳播首次變?yōu)椤扒饲妗?,每個用戶不再被動地統(tǒng)一接收單一的信息內(nèi)容,而是通過自己的社交圈和興趣愛好擁有了個性化的內(nèi)容消費。正如“世上沒有兩片完全相同的葉子”一樣,也沒有兩個人的“朋友圈頁面”或“微博首頁”是完全一致的,因為每個人都擁有獨特的社交結(jié)構(gòu)和自身屬性。另外,社交式分發(fā)強調(diào)傳播過程中的“去中心化”,每個用戶都可以藉由自己的社交關(guān)系鏈條完成信息的接收與分發(fā)。信息的分發(fā)權(quán)由專業(yè)的記者與編輯讓渡到了每個普通受眾,每個人都可以成為社交關(guān)系鏈中內(nèi)容分發(fā)的中心。與此同時,這也激活了大眾傳播時代被閑置的一些“長尾”內(nèi)容。
社交式的分發(fā)機制下,用戶所接收的內(nèi)容廣度和質(zhì)量都更多由其自身選擇決定。一方面,信息的內(nèi)容豐富程度由用戶的社交廣度所決定,關(guān)注更多的用戶即可帶來更多的內(nèi)容;另一方面,內(nèi)容的價值由社交關(guān)系鏈的質(zhì)量決定,用戶也可以選擇關(guān)注特定圈層的名人,來彌補單一熟人社交分發(fā)中可能出現(xiàn)的同質(zhì)化和圈層化的缺陷。
社交式分發(fā)機制下的內(nèi)容價值更多由社交互動來評定。如微博熱搜和公眾號“10w+”的爆款文章,都是由內(nèi)容的互動指標為內(nèi)容增值,使其能夠進行更廣泛的裂變傳播,進而成為“熱門微博”展示在微博平臺的公共榜單首頁,或成為“爆款文章”在朋友圈引起瘋狂轉(zhuǎn)發(fā)。這不可避免的帶來了諸多病癥,諸如虛假新聞、低俗取向、營銷網(wǎng)文、雞湯文章等,此類為獲取更多互動指標的“無效信息”和內(nèi)容生產(chǎn)源過多從而導(dǎo)致的“信息超載”使得基于社交關(guān)系的內(nèi)容分發(fā)質(zhì)量不斷降低。當前,F(xiàn)acebook、微信、微博等社交平臺都建立了相應(yīng)的人工和技術(shù)審核制度來完善社交式的信息分發(fā)生態(tài)。
(二)算法分發(fā)
“算法”是計算機領(lǐng)域中的一種定義,指的是一系列解決問題的指令,代表著用工程和系統(tǒng)的方法來解決問題的某種策略。算法式分發(fā)機制即是指,利用編程技術(shù)來解決信息精準分發(fā)問題的一種機制。2016年,算法式信息分發(fā)內(nèi)容已經(jīng)超過資訊信息分發(fā)市場的50%,它意味著算法式分發(fā)已成潮流?!八惴ㄊ椒职l(fā)”之所以在社交式分發(fā)成為主流的分發(fā)機制后應(yīng)運而生并得以廣泛應(yīng)用,一方面是由于算法本就與大數(shù)據(jù)、人工智能等概念強相關(guān),能夠處理海量、幾乎無上限的信息量,恰好解決了信源爆炸導(dǎo)致的信息超載等問題,同時更好的激活了以往小眾長尾內(nèi)容的活力。另一方面,算法通過對社交式分發(fā)機制進行快速的重組和排序,再次優(yōu)化信息的推薦結(jié)果??偟亩?,算法型分發(fā)能夠最大限度實現(xiàn)對于海量信息價值的重新評估和有效適配,更加精準的滿足了用戶需求。目前,無論是新聞客戶端,還是社交媒體等平臺也紛紛引入算法,介入到信息分發(fā)中。算法式分發(fā)無疑成為信息爆炸時代實現(xiàn)人與信息更好更快的匹配的更優(yōu)解法。因此,本文在之后所討論的互聯(lián)網(wǎng)信息分發(fā)機制也定位于最具分發(fā)效率的“算法型信息分發(fā)機制”。
依照用戶主動性的維度進行劃分,應(yīng)用算法的主流分發(fā)機制主要包括兩種,分別是搜索引擎式的信息分發(fā)和個性化推薦引擎的信息分發(fā)。
1.搜索引擎:用戶搜索、算法調(diào)度
搜索引擎作為一種信息檢索技術(shù),是信息傳遞過程中的一種渠道,伴隨著技術(shù)進步而產(chǎn)生,帶有獨特的媒介屬性??偟膩碚f,一方面,信息社會的壓力為搜索引擎的出現(xiàn)提供了時代背景,另一方面,技術(shù)的不斷進步也是搜索引擎發(fā)展的必要條件。至今,搜索引擎仍然是網(wǎng)民使用最多、最緊密的互聯(lián)網(wǎng)信息服務(wù)項目之一。在互聯(lián)網(wǎng)浩瀚如海的信息資訊中,搜索引擎猶如導(dǎo)航燈塔一般,幫助用戶在信息海洋中開辟出一條清晰的檢索路徑,以便我們更快找到所需信息。
搜索引擎式的信息分發(fā)肇始于WEB1.0時代。從技術(shù)范疇來講,搜索引擎共歷經(jīng)三代發(fā)展:第一代以Yahoo搜索引擎為代表,主要依靠人工輸入數(shù)據(jù)并進行目錄式搜索和信息接收,很快,人類不再簡單滿足于這種方式;第二代搜索引擎以Google和百度為代表,用戶鍵入不同的關(guān)鍵詞并進行搜索,搜索引擎后臺則根據(jù)不同的算法規(guī)則由機器進行信息的快速檢索、調(diào)取、匹配和排序、分發(fā),這大大提高了信息分發(fā)的效率;第三代搜索引擎轉(zhuǎn)向基于自然語言搜索,而非單一關(guān)鍵詞的匹配方式,讓搜索引擎更加“智能”,讀懂用戶所需。但從本質(zhì)上而言,其分發(fā)機制仍舊需要依靠算法的支持,才能實現(xiàn)對海量數(shù)據(jù)的即時獲取與重組,并對用戶查詢內(nèi)容作出準確快速的響應(yīng)。
搜索引擎式的信息分發(fā)過程一般原理分為三步,分別是:(1)抓取網(wǎng)頁→(2)建立索引數(shù)據(jù)庫→(3)搜索內(nèi)容的排序呈現(xiàn),并引導(dǎo)用戶按照得到的搜索結(jié)果進一步搜索下去。
當前搜索引擎式信息分發(fā)最典型的應(yīng)用,國外是Google,國內(nèi)則是百度搜索。其原理是從互聯(lián)網(wǎng)提煉抓取各個網(wǎng)站的內(nèi)容及超鏈,建立索引數(shù)據(jù)庫,在用戶檢索關(guān)鍵詞時依據(jù)一定的算法和數(shù)據(jù)庫中的索引詞進行匹配運算,并根據(jù)算法按照一定的排列順序給用戶提供檢索服務(wù)。Google和百度都擁有自己的檢索程序,能夠自己采集并建立網(wǎng)頁信息數(shù)據(jù)庫,當用戶進行相關(guān)內(nèi)容的搜索時,能夠利用算法快捷直接地從自身的索引數(shù)據(jù)庫中直接調(diào)用,并將信息精準分發(fā)至用戶手中。這個過程類似于在智能詞典中檢索查字的過程。
搜索引擎式信息分發(fā)有以下特征:
第一,信息源包括所有互聯(lián)網(wǎng)上的網(wǎng)頁信息。第二,搜索引擎式信息傳播中的信息需求者不僅僅是被動接受,而是主動參與到傳播過程中,在搜索引擎數(shù)據(jù)庫建立之后,用戶通過“關(guān)鍵詞”介入到信息傳播過程中,從某種意義上說,“搜索引擎使用者”或“信息需求者”更加適合。第三,搜索引擎式信息分發(fā)過程呈現(xiàn)層次化的特點,從初試建立數(shù)據(jù)庫抓取的信息到后臺程序匹配呈現(xiàn)的信息,再到用戶實際會選取的需求信息,其信息量級逐層遞減,但信息的價值含量逐層增加。搜索引擎的信息分發(fā)是在信息需求方主動參與的基礎(chǔ)上動態(tài)呈現(xiàn)。第四,搜索引擎不僅只是作為傳播渠道的一種中介載體,而是承擔了信息整合與分發(fā)的全部工作,通過借助算法整合海量信息資源,并選擇突出或屏蔽某些要素的信息內(nèi)容、確定信息呈現(xiàn)排列順序,并潛移默化地影響用戶的信息接收。在這種信息分發(fā)機制下,用戶更具有主動性,按照所需選取信息、及時反饋。
搜索引擎式信息分發(fā)機制開啟了信息的“完全私人訂制”時代。由于其技術(shù)工作原理,搜索引擎是一種完全由使用者主導(dǎo)的信息獲取技術(shù),為用戶形成了一種“我想看的完全是我自己想看的”的狀態(tài)(理想狀態(tài)下),在此之前,任何其他媒介都無法實現(xiàn)這種信息分發(fā)。
2.推薦引擎:個性分析、精準匹配
推薦引擎系統(tǒng)最早被應(yīng)用于電商領(lǐng)域,在大數(shù)據(jù)技術(shù)的不斷發(fā)展下,逐漸被應(yīng)用于各種領(lǐng)域。推薦引擎式信息分發(fā)機制以今日頭條、一點資訊為代表的資訊應(yīng)用為里程碑,發(fā)展勢頭日益高漲,逐漸成為信息資訊市場的顛覆性力量。
推薦引擎式的信息分發(fā)機制顛覆了傳統(tǒng)的內(nèi)容生產(chǎn)與推送一體的模式,徹底分離了內(nèi)容的生產(chǎn)與分發(fā)。按照個體不同的信息需求,為用戶提供定制化的信息推送。
算法推薦引擎一般包括“用戶模型、內(nèi)容模型、推薦過程”三部分。
用戶模型反映的是用戶的相關(guān)信息,基于算法對用戶的特定數(shù)據(jù)進行描述。如年齡、地域、性別、階層、愛好,通過大量收集用戶數(shù)據(jù)、內(nèi)容偏好、閱讀行為等標簽生成用戶畫像,從而勾勒出一個用戶的個性化特征。同時,基于人工智能的算法技術(shù)還具有機器深度學(xué)習的能力,通過對使用者的行為進行一段時間的跟蹤,能夠適時調(diào)整對用戶興趣的識別結(jié)果,極大的提升了信息分發(fā)和用戶需求之間的傳播效率。
內(nèi)容模型是指對內(nèi)容數(shù)據(jù)進行標簽化、建模、分類和排序。通過提取內(nèi)容特征,擬定相似函數(shù)以便最大程度上和用戶特征進行匹配。推薦內(nèi)容的精準度和內(nèi)容模型的數(shù)量是正比關(guān)系。內(nèi)容模型越多,推薦精準度越高。通過算法對互聯(lián)網(wǎng)上海量的內(nèi)容進行精確的篩選,根據(jù)平臺的既定標準對信息的質(zhì)量進行研判,根據(jù)“關(guān)鍵詞、熱度、時效性、轉(zhuǎn)載、原創(chuàng)度”等指標進行判定,滿足用戶對內(nèi)容時效性、顯著性、趣味性等因素的需要。一般而言,需要經(jīng)歷“重復(fù)標識——內(nèi)容篩選——內(nèi)容質(zhì)量標識——時效判別——關(guān)鍵字提取分類”幾個環(huán)節(jié)。信息內(nèi)容可以根據(jù)用戶畫像標記多個不同標簽,多個標簽形成一組反映用戶興趣的標簽集合,每個標簽使用的頻次則與用戶的興趣程度成正比。
推薦過程就是利用大數(shù)據(jù)將獲取到的用戶信息依據(jù)不同的算法應(yīng)用于不同的環(huán)境中形成推薦內(nèi)容?;诓煌乃惴P偷贸龅耐扑]策略,結(jié)合用戶反饋和平臺規(guī)則,獲得最終的推薦列表。
推薦引擎的分發(fā)機制實現(xiàn)了通過編程技術(shù),在內(nèi)容和用戶之間架起一座橋梁,大數(shù)據(jù)不再僅僅是海量信息的簡單堆疊,而是有序、有類的有效信息精準到達用戶。借助網(wǎng)絡(luò)爬蟲技術(shù)和算法技術(shù),個性化推薦引擎能夠?qū)崿F(xiàn)信息的精準分發(fā),使具備定向?qū)傩缘臉撕灮畔⑦m配用戶個性化需求,這與報紙、電視等傳統(tǒng)媒介機構(gòu)形成鮮明對比。推薦引擎在當前的信息分發(fā)渠道上形成壟斷之勢。
推薦引擎式信息分發(fā)更加強調(diào)算法的主導(dǎo)地位,相比于人工式分發(fā)而言,不需大量專業(yè)人才或龐大的社交網(wǎng)絡(luò)作為基礎(chǔ),算法能夠更加簡便迅捷、也更加了解用戶的個性化需求。而相比搜索引擎式分發(fā)而言,推薦引擎式的分發(fā)機制打破了用戶“主動獲知”的局限,從橫向上幫助個體拓寬了當前的眼界和認知范圍。同時,這類信息分發(fā)機制能夠滿足用戶在“被動”情景下的信息需求。你無須思考和行動,你感興趣的信息便會自動的到達你的面前。
三、互聯(lián)網(wǎng)信息分發(fā)機制技術(shù)原理:以“算法”為核心
隨著信息技術(shù)的進一步發(fā)展,web3.0時代加速來臨,以“算法”為核心的信息分發(fā)機制成為解決內(nèi)容生產(chǎn)與用戶信息需求適配這一矛盾的重要工具。算法型信息分發(fā)在一定程度上決定著信息流向以及用戶對于信息內(nèi)容的關(guān)注度。
(一)推薦引擎式分發(fā)機制:以“今日頭條”為例
在中國,今日頭條是推薦引擎式信息分發(fā)機制的代表。今日頭條將自身定位為一款“基于數(shù)據(jù)挖掘的推薦引擎,自身不生產(chǎn)內(nèi)容,運轉(zhuǎn)核心是一套由代碼搭建而成的算法”。據(jù)公開數(shù)據(jù)顯示,今日頭條2019年6月的月活躍人數(shù)達到2.9億,仍在繼續(xù)增長。推薦引擎仍是當今信息環(huán)境中重要的分發(fā)工具。而今日頭條的核心分發(fā)邏輯則是通過“算法”進行內(nèi)容的海量聚合和精準分發(fā),以多元內(nèi)容吸引用戶留存。
1.內(nèi)容生產(chǎn)路徑:內(nèi)容聚合與審核
內(nèi)容的來源是內(nèi)容分發(fā)的重要前提。今日頭條將自身定位與“新聞搬運工”式的內(nèi)容聚合類平臺,顛覆了傳統(tǒng)傳播邏輯下的內(nèi)容分發(fā)機制。其內(nèi)容聚合主要來源于三個渠道,一是和平臺有合作協(xié)議的內(nèi)容生產(chǎn)源,二是平臺利用爬蟲自主抓取到的所有信息資訊,另外,一些個體用戶主動向平臺提供原創(chuàng)內(nèi)容。(如表2)
不同來源的相似話題將會在系統(tǒng)中統(tǒng)一被標注為同類標簽,如來自媒體①的內(nèi)容A、B、C,來自媒體②的內(nèi)容B、C、D,來自媒體③的內(nèi)容A、C、D……以此類推,這些不同的內(nèi)容標簽也將被用于后續(xù)的個性化推送過程中。
內(nèi)容質(zhì)量審核也是尤為重要的一環(huán),包括機器的自動審核和人工審核兩部分。機器審核通過系統(tǒng)標注關(guān)鍵字詞,自動攔截部分不符合平臺推送原則的信息內(nèi)容。審核包括標題長度、錯別字、價值取向、圖片、文字、視頻、音頻等各種類型的內(nèi)容。機器審核會將相關(guān)違規(guī)信息標注出相應(yīng)的顏色,轉(zhuǎn)入下一步的人工審核。人工審核包括初審——復(fù)審——終審三個環(huán)節(jié),環(huán)環(huán)相扣,層層把關(guān),確保平臺推送內(nèi)容的質(zhì)量,也為個性化的推送分發(fā)打下鋪墊。
2.個性化分發(fā)路徑:推薦系統(tǒng)適配用戶需求
個性化推薦的分發(fā)機制其核心在于算法。算法原理本質(zhì)上是擬合一個用戶對內(nèi)容滿意度的函數(shù),即Y=F(Xi、Xv、Xc)。
內(nèi)容、用戶和環(huán)境分別是三個基本變量。在今日頭條的分發(fā)機制中,主要包括四種基本算法,分別是:基于文本的算法(給用戶推薦與其瀏覽記錄匹配的資訊)、基于用戶的算法(相似矩陣用戶瀏覽過的資訊推薦)、基于關(guān)聯(lián)規(guī)則的算法(著重用戶和資訊本身的聯(lián)動邏輯)和基于場景的算法(包括地理位置、時間段等)??偟膩碚f,這四種算法的核心都是“貼標簽”。今日頭條通過機器識別、人工編輯和用戶自身提交信息等方式建立的標簽體系,并將“內(nèi)容標簽”與“用戶標簽”“平臺標簽”進行交叉驗證,更好地實現(xiàn)內(nèi)容——用戶的精準分發(fā)。這種分發(fā)過程包含四種環(huán)節(jié)要素:系統(tǒng)分析、內(nèi)容分析、用戶分析及評估分析。
(1)系統(tǒng)分析
系統(tǒng)分析是為了實現(xiàn)用戶、場景及信息更加精準的匹配。一方面,用戶在建立個人檔案時和行為特征、興趣特征等數(shù)據(jù)幫助建立對于用戶的分類。另一方面,按照“優(yōu)先鏈接機制”對聚合而來的信息內(nèi)容進行分類、標簽化處理,摘要提取以及LDA主題分析等。在此過程中,場景分析也是極為重要的一環(huán),帶有“場景標簽”的信息能更好擊中用戶的實時需求。場景式的分發(fā)常常糅雜在內(nèi)容、用戶的推薦方式中,從地理位置、時間、網(wǎng)絡(luò)狀況、天氣及狀態(tài)等方面進行場景分類。用戶和環(huán)境的特征和信息的標簽一旦匹配,就可以進行資訊的分發(fā),符合用戶此時此刻想要看到的信息內(nèi)容。
今日頭條的個性化推薦模型依靠四類特征來實現(xiàn)內(nèi)容、用戶與環(huán)境的匹配,分別是:第一,相關(guān)性特征,也就是將用戶的屬性和內(nèi)容進行相似評估;第二類是環(huán)境特征;第三類是內(nèi)容熱度特征,在平臺冷啟動時能更有效地將信息分發(fā)給普遍的用戶;第四類是協(xié)同特征,通過分析不同用戶之間的興趣、圈層相似度,拓寬其算法模型的自我學(xué)習能力,一定程度上可以緩解信息繭房。
(2)內(nèi)容分析
如何將豐富的信息分發(fā)到對此可能感興趣的特定用戶面前,首先需要對這些內(nèi)容進行智能分析和標簽化處理。內(nèi)容分析包括文本、圖片和視頻分析三類,由于“今日頭條”最為代表性的分發(fā)內(nèi)容仍是新聞資訊類,因此著重研究文本分析。
內(nèi)容的“標簽”化處理是基礎(chǔ)的一環(huán),主要依靠的算法技術(shù)是基于內(nèi)容的推薦(content-based recommendation)。最重要的是進行文本特征的提取,語義標簽和隱式語義標簽,如關(guān)鍵詞、主題等。時空特征是“標簽化”的重要考量因素,應(yīng)用基于新熱特征推薦,即基于全局內(nèi)容的時效性、熱度進行推薦。如最新消息的實時推送,體現(xiàn)著時新性;又如來自深圳的最新交規(guī)對于北京本地的用戶意義不大。
另外,用戶查看完相關(guān)內(nèi)容后,也將被打上和文本關(guān)鍵詞一致的用戶標簽。當你看完一篇有關(guān)“NBA”的文章,系統(tǒng)之后也會繼續(xù)為你推送相關(guān)的資訊。
內(nèi)容分析在整個個性化分發(fā)過程中主要起到幾點作用:(1)用戶興趣建模,內(nèi)容的“標簽化”可以有效地匹配用戶興趣建模,解決一部分推薦系統(tǒng)冷啟動的問題。(2)幫助內(nèi)容推薦,與系統(tǒng)分析一起,能夠?qū)⑴c用戶和環(huán)境匹配度更高的信息分發(fā)給用戶。(3)生成頻道內(nèi)容,不同的標簽內(nèi)容進入不同頻道,如“娛樂”內(nèi)容進入“娛樂頻道”,“學(xué)術(shù)”內(nèi)容進入“學(xué)術(shù)頻道”。
(3)用戶分析
用戶分析同樣也是推薦系統(tǒng)的基礎(chǔ)環(huán)節(jié)之一,通過對用戶進行畫像建模,所有信息分發(fā)將基于用戶的個人興趣為起點,并以用戶的實際或潛在信息需求為落點。算法將根據(jù)用戶的興趣圖譜、用戶社會關(guān)系鏈圖譜、用戶歷史行為偏好等規(guī)則定制個性化內(nèi)容并進行個性化分發(fā)。
用戶分析首先需要進行用戶的虛擬身份建模,其技術(shù)手段包括:基于爬蟲技術(shù)、數(shù)據(jù)庫及個人信息檔案(包括性別、年齡、職業(yè)、教育信息、興趣愛好等)、基于追蹤用戶歷史行為的推薦算法(點擊、瀏覽、轉(zhuǎn)發(fā)、評論、頁面停留時長等)。當用戶采用“第三方登錄”時,也能向其他平臺直接快速鏈接到用戶的個人信息以及興趣圖譜(也被稱為“投靠原則”),這有助于擺脫算法冷啟動的困境。
用戶分析另一部分是基于用戶的協(xié)同過濾(Collaborative Filtering Recommendation),通過機器模型進行數(shù)據(jù)評估和機器學(xué)習預(yù)測用戶的興趣類屬和場景化還原(也被稱為用戶冷啟動)應(yīng)用賭博算法(bandit algorithm),給具有相同社會屬性的用戶推送同類資訊。
另外,用戶分析可以與內(nèi)容分析進行交叉比對,分析用戶所瀏覽到的信息中不同標簽之間的聯(lián)系,并根據(jù)一定的社會網(wǎng)絡(luò)算法進行加權(quán)計算,并依據(jù)用戶的歷史使用行為不斷迭代用戶“標簽”,并繼續(xù)影響后續(xù)推薦內(nèi)容的調(diào)整。這一環(huán)節(jié)是算法型信息分發(fā)機制的關(guān)鍵,直接影響到信息分發(fā)的精準度,并有效挖掘用戶的潛在需求。
(4)評估分析
評估分析是推薦系統(tǒng)的最后一個環(huán)節(jié),即通過分析用戶滿意度來評估這個系統(tǒng)的推送效果。這一環(huán)節(jié)主要通過統(tǒng)一的評估測評師進行使用滿意度的調(diào)研,以及分析平臺的日活、月活數(shù)據(jù)等得到。評估系統(tǒng)的存在進一步促進推薦系統(tǒng)在內(nèi)容的分發(fā)達到更好的效果。這一環(huán)節(jié)的存在意味著,算法分發(fā)并非意圖將決策權(quán)全部交由機器,人工力量仍能不斷的進行糾偏、設(shè)計、監(jiān)督并且進行算法模型的維護和管理。
(二)搜索引擎+社交式分發(fā)機制:以“知乎”為例
“信息爆炸的互聯(lián)網(wǎng)汪洋大海中,有價值的信息始終是稀缺的”,知乎的誕生正是源于這樣的初心。從問答起步,知乎歷經(jīng)八年成長為一個綜合性的知識內(nèi)容平臺,目前涵蓋話題綜述25萬多個,問題總數(shù)2700萬多個,共計1.2億個回答內(nèi)容,月活290億,打出了“有問題,上知乎”這句口號。通過個性化推薦和搜索功能,知乎通過打造全網(wǎng)個性化分發(fā)社區(qū)平臺,縮短了用戶和內(nèi)容之間的距離,緩解了用戶信息過載的壓力。
知乎在內(nèi)容的分發(fā)方面,主要由推薦、熱榜、圈子、話題、關(guān)注這幾大板塊,不同的板塊呈現(xiàn)的內(nèi)容各有側(cè)重,所運用到的分發(fā)規(guī)則也有所區(qū)別。
知乎是基于虛擬社區(qū),用戶之間通過提問和回答的形式進行交談、建立社會聯(lián)系并形成互動的網(wǎng)絡(luò)平臺。由上表可見,知乎的核心功能都離不開底層技術(shù)架構(gòu)和算法在內(nèi)容分發(fā)方面的重要作用。因此本章節(jié)選取“知乎”作為算法式信息分發(fā)機制的典型案例,來剖析它是如何搭建起成熟的“搜索”+“推薦”一體化的問答分發(fā)機制。
1.內(nèi)容生產(chǎn):多元內(nèi)容生產(chǎn)者,算法調(diào)節(jié)社交分發(fā)
知乎這款產(chǎn)品的核心就是1個問題+N個回答的問答社區(qū)模式,共包含了三種不同類型的連接:一是人和人之間的連接,二是人與內(nèi)容之間的連接,三是內(nèi)容與內(nèi)容自身的連接。在內(nèi)容生產(chǎn)路徑的更新迭代中,同樣也引入了算法作為重要的工具,不僅加強了平臺的社區(qū)黏性,更進一步促進知乎的社交式分發(fā)的有效實現(xiàn)。
(1)早期:KOL入場積累優(yōu)質(zhì)內(nèi)容池
優(yōu)質(zhì)的內(nèi)容離不開用戶的優(yōu)質(zhì)輸出。知乎早期以邀請機制限定用戶數(shù)量,吸引李開復(fù)、雷軍等知名意見領(lǐng)袖下場答題,引來大量相似圈層的優(yōu)質(zhì)用戶,積累了大量優(yōu)質(zhì)答案,逐漸形成了精英社區(qū)的文化氛圍。在這一階段,內(nèi)容的分發(fā)仍然遵循傳統(tǒng)社交分發(fā)的分發(fā)機制。
(2)中期:威爾遜算法激活社交生產(chǎn)與分發(fā)
2013年,知乎開放權(quán)限,吸引了大批的年輕互聯(lián)網(wǎng)人入駐,知乎社區(qū)開始充滿各種大開腦洞的提問與回答。但此時一些抖機靈、內(nèi)容價值低的答案也陸續(xù)出現(xiàn),并依靠其內(nèi)容本身的傳播特性獲得更多的點贊和關(guān)注,導(dǎo)致部分用心答題的答主對平臺失去熱情。同時,一些大V開始在答題區(qū)內(nèi)擁有馬太效應(yīng),新用戶的回答往往會排在后位,導(dǎo)致新人的曝光率難以提高,答題區(qū)內(nèi)一家獨大。在此階段,如何維護問答社區(qū)的內(nèi)容輸出質(zhì)量,保持良好的用戶粘性,成為了知乎需要改進的方向。于是,知乎開始引入了威爾遜算法進行內(nèi)容的隨機分發(fā),以此來加持社區(qū)的用戶粘性。
威爾遜算法所控制的答案排序大致有如下規(guī)律:
①所有用戶看到的排序是相同的;
②獲得點贊會使回答排序升高,獲得反對會使回答排序降低;
③某個領(lǐng)域下的優(yōu)質(zhì)回答將提升該發(fā)布用戶在此領(lǐng)域下的投票權(quán)重;
④某個領(lǐng)域下的高權(quán)重用戶投票對內(nèi)容整體排序影響力更高,此類用戶的回答排序也會更加靠近回答前端;
⑤使用匿名身份投票或答題時,不會計算用戶的權(quán)重。
用戶在某個領(lǐng)域下的投票權(quán)重,是基于其在該領(lǐng)域內(nèi)相關(guān)話題下的點贊數(shù)、反對數(shù)、沒有幫助數(shù)共同決定的。但該算法不對用戶計算全局權(quán)重,即用戶的權(quán)重在每個領(lǐng)域下的值不可通用,在某個區(qū)域內(nèi)提高權(quán)重的最好方法就是在該領(lǐng)域的相關(guān)話題下輸出優(yōu)質(zhì)答案。
威爾遜算法的導(dǎo)入,有效地減小了知乎大V的馬太效應(yīng),為一個更加公平客觀的社區(qū)環(huán)境提供底層技術(shù)架構(gòu),調(diào)動了新用戶的參與積極性,進一步促進了人和人的連接。
(3)后期:推薦系統(tǒng)刺激用戶創(chuàng)作欲望
為了讓用戶快速看到自己感興趣的提問,并且激發(fā)用戶的創(chuàng)作欲望,知乎在內(nèi)容分發(fā)上從兩個方向進行了布局,從而促進內(nèi)容生產(chǎn)的加強,分別如下:
問題提出
問題提出是一個從用戶的查詢中識別出意圖,發(fā)現(xiàn)知乎現(xiàn)在還無法滿足的意圖,引導(dǎo)用戶進行提問,并根據(jù)用戶的意圖生成合理的問題的過程,得到提問和描述后,后臺的卷積神經(jīng)網(wǎng)絡(luò)模型會從知乎超過二十五萬個話題中選擇出最匹配的話題,進行話題的推薦和綁定。
問題路由
問題路由是如何分發(fā)問題以讓合適的用戶看到問題、激發(fā)他們的創(chuàng)作欲望。這是一個典型的機器學(xué)習排序(Learning to Rank)模式:先在眾多用戶中通過召回定位合適的范圍,然后通過 Pointwise/Pairwise/Listwise 等排序方法,找出最有可能接受邀請以及最有可能產(chǎn)生優(yōu)質(zhì)回答的用戶進行推薦,或讓用戶選擇委托系統(tǒng)進行邀請。問題路由在其中起到的作用就是提升匹配精準度和效率。
通過這兩種推薦系統(tǒng)的調(diào)節(jié),一方面,在用戶無法通過搜索精準的獲得內(nèi)容時,該用戶會成為平臺的下一個提問者,進而通過“1個問題”連接到“N個用戶+N個回答”。 另一方面,用戶在接收到“提問”時,就成為了內(nèi)容的生產(chǎn)者,而內(nèi)容的標簽也會和用戶的標簽更新綁定,成為其協(xié)同內(nèi)容的分發(fā)新變量。從某種角度來看,這種算法的調(diào)節(jié)進一步強化了人與人、人與內(nèi)容、甚至是內(nèi)容與內(nèi)容的連接。
2.分發(fā)路徑:算法推薦+用戶主動搜尋;推薦系統(tǒng):算法式分發(fā),既精準又多樣
知乎首頁信息流的個性化推薦應(yīng)用的正是知乎的推薦系統(tǒng)。不同用戶在不同時間、不同場景打開的知乎首頁都是完全不同的。
受訪的知乎技術(shù)工程師表示:“我們的信息流推薦框架叫水晶球,一個基于多策略融合的多源內(nèi)容推薦系統(tǒng),之所以叫這個名字,是希望能夠通過這個系統(tǒng)得以一窺用戶想要看到什么內(nèi)容,然后推薦給他”。
四、啟示與思考
(一)算法型分發(fā)機制仍存隱憂
1.當前流行推薦算法固有缺陷
在“算法分發(fā)”成為互聯(lián)網(wǎng)新聞資訊的主要分發(fā)方式的背景下,算法模型的“默認設(shè)置”掌管著復(fù)雜系統(tǒng)。這種默認設(shè)置的內(nèi)容和特征取決于設(shè)置的設(shè)計者,而用戶又常常因為改變默認設(shè)置所需要的成本(知識、時間、精力等)而放棄修改。一般而言,這種“默認設(shè)置”更多衡量信息內(nèi)容的熱度價值,即“點擊率”。這也就意味著默認設(shè)置是預(yù)設(shè)設(shè)置的人用于操縱系統(tǒng)和影響使用者的工具。從本質(zhì)上來說,從“編輯分發(fā)”到“算法分發(fā)”是新聞資訊服務(wù)內(nèi)置默認設(shè)置的一種調(diào)整。這意味著無論用戶如何選擇,或是不選擇,其結(jié)果都是接受系統(tǒng)選擇的結(jié)果。人們自主選擇信息的權(quán)力被不斷擠壓,僅剩下在不同機構(gòu)提供的算法之間選擇。而目前幾種主流的算法模型都存在著相應(yīng)的特點和不同的調(diào)整方向。
社交關(guān)系型分發(fā)機制中應(yīng)用的算法規(guī)則難以有效應(yīng)對前文提到的問題,即用戶社交關(guān)系鏈復(fù)雜前提下過多內(nèi)容生產(chǎn)源所帶來的“信息超載”。另外,對親密社交關(guān)系的長期加權(quán)很容易使用戶陷入相對封閉的同質(zhì)化社交圈。算法對親密社交圈的識別可以幫助用戶進行高效信息篩選,但是勢必會促使大范圍的交往變成私人領(lǐng)地內(nèi)部的互動,并阻礙新的社交關(guān)系形成和維持。在宏觀層面上,這種對社交關(guān)系的強調(diào)會進一步加劇圈層的分化,不同圈層建構(gòu)出迥異的群體認同和社會感知,社會割裂成一個個隔絕甚至對立的回聲室,社交平臺無法通過高效的信息傳播和意見送達實現(xiàn)社會整合功能,本應(yīng)具有公共屬性的社交平臺變得碎片化。
興趣加權(quán)算法模型依賴系統(tǒng)內(nèi)整個用戶歷史數(shù)據(jù)庫作為其推薦系統(tǒng)的原料,當數(shù)據(jù)嚴重稀缺時,會存在冷啟動(這里所謂的冷啟動是指對于某APP的新用戶,算法系統(tǒng)缺少其歷史數(shù)據(jù),難以通過算法準確了解和把握其需求的狀況)差、推薦精準度下降等問題。加入基于模型的推薦可以有效地解決這一問題,通過算法根據(jù)訓(xùn)練集數(shù)據(jù)學(xué)習得出一個復(fù)雜的模型,來預(yù)測用戶感興趣的信息,提升預(yù)測的準確度,但存在建模復(fù)雜的缺陷。
另外,興趣加權(quán)算法可以推薦用戶更愿意閱讀的內(nèi)容,提高用戶的粘性。但是相比推薦系統(tǒng)在購物、音樂等領(lǐng)域的應(yīng)用,其在信息分發(fā)中的應(yīng)用需要更加嚴格的審視。如今,互聯(lián)網(wǎng)成為人進行社會感知的重要信息來源,基于興趣推薦的算法介入會使符合用戶頭腦中主觀期待的信息有更大概率被呈現(xiàn),傳統(tǒng)大眾傳播時代的非個性化的信息環(huán)境變成“投其所好”式的定向投放,信息價值觀發(fā)生偏向,大眾傳播的教育、整合功能可能有所減弱。不同用戶接觸的資訊信息必然存在明顯的差異,且生活環(huán)境、生活方式差異越大的群體之間的信息結(jié)構(gòu)差異也就越大。長此以往,這種資訊消費模式的發(fā)展和固化將導(dǎo)致 “知識鴻溝”和“信息鴻溝”的擴大,并進一步帶來社會群體之間的深度隔離和社會群體的分化。
2.算法型分發(fā)機制下的內(nèi)容“流量經(jīng)濟”
“流量經(jīng)濟”這一概念最早是孫希有2003年提出,指的是“依靠人才、信息、知識、資金等要素資源的流動帶來經(jīng)濟效益的一種行業(yè)業(yè)態(tài)”。內(nèi)容的“流量經(jīng)濟”是指,在當今的互聯(lián)網(wǎng)信息環(huán)境中,用戶的點擊、閱讀、瀏覽行為為平臺帶來的價值轉(zhuǎn)化。在此模式下,信息內(nèi)容是吸引和留存用戶的載體,媒體為了獲得更大的商業(yè)價值,必須以更符合用戶個人興趣的內(nèi)容來吸引他。
通過信息選擇的或然率可知,平臺為了獲取更多的用戶,一方面需要通過不斷優(yōu)化分發(fā)技術(shù),促進信息的分發(fā)效率,降低受眾“費力的程度”,而以算法為核心的分發(fā)機制恰是性價比最高的最優(yōu)解。另一方面,娛樂化、碎片化、情感性的內(nèi)容在單位時間內(nèi)的閱讀難度更低,更易引起受眾興趣,得到更廣泛人群的接受。因此,算法本身作為一套數(shù)學(xué)公式,雖然是不帶有任何立場的。但算法分發(fā)機制的背后實則蘊含著其使用者的價值選擇和利益取向。在算法型分發(fā)機制下,為了抓住用戶的眼球,會出現(xiàn)低俗化、娛樂化、同質(zhì)化內(nèi)容大量充斥,標題黨層出不窮,內(nèi)容質(zhì)量參次不齊等問題的出現(xiàn)。這正是算法分發(fā)機制過于迎合用戶個人興趣所導(dǎo)致的內(nèi)容泛流量化。
3.算法型分發(fā)機制加重“信息繭房”
信息分發(fā)機制的歷史發(fā)展進程中,越來越符合媒體去中心化、社交化的內(nèi)容生產(chǎn)與分發(fā)趨勢,傳播邏輯轉(zhuǎn)向傳受一體化,發(fā)展至算法為核心的信息分發(fā)機制,受者本位成為信息分發(fā)的根本核心。但過度迎合受眾興趣的算法型信息分發(fā)機制,正越來越加重“信息繭房”。這也是眾多學(xué)者在探討算法技術(shù)所可能引起的負面問題中最為廣泛提及的一點。
“信息繭房”假說最早由凱斯·桑斯坦提出,他認為,在信息傳播中,公眾習慣只注意自己選擇的內(nèi)容和使自己感到愉悅的信息,久而久之,公眾就桎梏于“蠶繭”一樣的信息繭房中。事實上,信息繭房在傳統(tǒng)媒體時代就已經(jīng)存在,只是隨著算法分發(fā)技術(shù)的普遍應(yīng)用,這一現(xiàn)象變得尤為突出。信息繭房并非由算法技術(shù)一手造成,而是人性的弱點。技術(shù)的發(fā)展讓個人擁有更強的主動選擇權(quán),人們更加主動傾向于接受自己喜愛的信息內(nèi)容,逐漸導(dǎo)致用戶的視野受限。在這樣的分發(fā)機制下,同質(zhì)化的信息內(nèi)容將個體包裹起來,形成密不透風的繭壁,個體受困其中卻不自知。
但算法型分發(fā)機制對用戶并沒有造成單純負面的“繭房”效應(yīng)。從技術(shù)而言,正如今日頭條所應(yīng)用算法推薦技術(shù)中的協(xié)同特征。即通過分析不同用戶之間的相似性,依靠機器自我學(xué)習能力逐漸提高算法推薦模型的優(yōu)化迭代,有可能破除“繭房”。例如,A用戶平時喜歡瀏覽體育、財經(jīng)和社會新聞,B用戶喜歡體育和社會新聞,那么系統(tǒng)也會嘗試給B用戶推送財經(jīng)新聞。這樣做,部分程度上可以幫助解決所謂算法狹窄的問題。
另一方面,算法型的信息分發(fā)機制有利于用戶避免選擇信息接觸和認知不協(xié)調(diào)的心理機制。當用戶需求被推薦算法精準捕捉并適配內(nèi)容時,個體用戶的內(nèi)容需求可以被直接滿足,活躍用戶還可以使用搜索引擎和社交功能來拓展主題以及觀點范圍,獲得更廣的信息資源。因此,算法型分發(fā)機制在無形中可能會使得“信息繭房”得以強化,但并不是唯一原因。用戶的媒介素養(yǎng)、技術(shù)素養(yǎng)、信息接受習慣等都可能會導(dǎo)致“信息繭房”的加深。更重要的不是探討算法分發(fā)機制是如何使“繭房”加重,而是如何從算法優(yōu)化、用戶自身、媒體擔當?shù)确矫嫒シ此既绾未蚱啤袄O房”的禁錮。
(二)新型主流媒體建設(shè)算法型分發(fā)機制的啟示
從傳統(tǒng)的“人工列表式”信息分發(fā)模式,到社交媒體的“UGC-社交分發(fā)”模式,再到以算法為核心的推薦引擎和搜索引擎的分發(fā)模式?;ヂ?lián)網(wǎng)信息分發(fā)機制的變遷既反映出傳媒技術(shù)的不斷進步,也體現(xiàn)了傳播邏輯的不斷改變。分發(fā)機制的變遷和發(fā)展對新型主流媒體的建設(shè)有著重要的啟示作用。可以從目前發(fā)展成熟的互聯(lián)網(wǎng)信息分發(fā)平臺的分發(fā)機制中得出對新型主流媒體在互聯(lián)網(wǎng)化的過程中建構(gòu)有效的分發(fā)手段、加強信息分發(fā)的渠道建設(shè)得出幾點啟示。
1.理解“分發(fā)”,實現(xiàn)由受眾到用戶的理念轉(zhuǎn)型
傳統(tǒng)媒體時代,報刊的“分發(fā)”指的是報刊室將報刊、書本、雜志派送到讀者手中的那一環(huán)節(jié),強調(diào)的是“to C”的最終一環(huán)。媒體互聯(lián)網(wǎng)化的初始階段,媒體對于互聯(lián)網(wǎng)上的信息分發(fā)概念停留在內(nèi)容的“網(wǎng)絡(luò)版”刊登,即內(nèi)容的發(fā)布,此類的發(fā)布機制仍然帶有濃重的單向度傳播烙印,受眾只是在被動的接受信息內(nèi)容。
但隨著傳媒的發(fā)展和技術(shù)的進步,媒體權(quán)力不斷下移,普通大眾擁有了普遍的媒介接近和媒介使用權(quán)利,受眾的主動性逐漸突出,并逐漸朝向“用戶”轉(zhuǎn)型,擁有信息選擇甚至信息生產(chǎn)的主動權(quán)和能動性?!八惴ㄐ托畔⒎职l(fā)機制”實質(zhì)上貫徹的正是用戶優(yōu)先的理念,一切信息分發(fā)以用戶的個體需求和信息習慣為導(dǎo)向。實現(xiàn)從“受眾”到“用戶”的理念轉(zhuǎn)型,是媒介信息環(huán)境變化背景下建設(shè)有效的信息分發(fā)機制的基礎(chǔ)。按照“使用與滿足理論”,受眾在進行信息消費時是帶有明確的主觀目的性。因此,新型主流媒體應(yīng)對受眾的主觀能動性和真實、個性化的信息需求基于足夠的重視,將“受眾”視為“用戶”,一切的信息生產(chǎn)和分發(fā)行為都以大眾的需求為導(dǎo)向。這種理念的創(chuàng)新是一切技術(shù)和制度創(chuàng)新的驅(qū)動力量。
2.理解“技術(shù)”,優(yōu)化算法機制和模型
算法作為互聯(lián)網(wǎng)信息分發(fā)鏈條中的核心技術(shù),根據(jù)個人愛好為用戶定制內(nèi)容并進行分發(fā)。在此傳播環(huán)境下,新型主流媒體更應(yīng)加強對算法的基礎(chǔ)常識。并根據(jù)用戶數(shù)據(jù)和內(nèi)容的數(shù)據(jù)不斷優(yōu)化算法分發(fā)機制,建立更加全面、科學(xué)的算法模型來分析用戶的興趣內(nèi)容,增進數(shù)據(jù)的匹配度,并提升算法的透明度。推薦引擎、搜索引擎和智能社交式分發(fā)機制都可以為主流媒體打造互聯(lián)網(wǎng)上有效的分發(fā)手段提供可借鑒的技術(shù)思路。
(1)推薦引擎式分發(fā)機制
新型主流媒體建設(shè)分發(fā)機制的前提首先在于,深刻理解數(shù)據(jù)是算法分發(fā)機制的核心要素。推薦引擎式的分發(fā)機制核心就在于數(shù)據(jù)的獲取和匹配。為了實現(xiàn)信息內(nèi)容和用戶的精準適配,首先需要獲取用戶數(shù)據(jù)和內(nèi)容數(shù)據(jù)。用戶數(shù)據(jù)分析包含用戶的興趣特征分析、用戶身份特征分析和用戶的網(wǎng)絡(luò)歷史行為特征分析。目前而言,通過建立流式計算框架來進行用戶標簽的數(shù)據(jù)處理是今日頭條更高效率的做法。其流程如下:通過實施處理用戶數(shù)據(jù),并在收集一定量的用戶數(shù)據(jù)后通過機器的自我學(xué)習不斷動態(tài)更新用戶的興趣模型,其使用的范圍更廣、效率更高,能夠解決大部分用戶的數(shù)據(jù)跟蹤推送。
內(nèi)容數(shù)據(jù)的機器處理則包含兩個環(huán)節(jié),首先利用LDA(Latent Dirichlet Allocation)主題分析生成模型,對信息內(nèi)容按照詞、主題和文檔進行分類,并將每篇單獨內(nèi)容按照不同的概率和不同主題的形式進行發(fā)布。接下來,使用基于深度神經(jīng)網(wǎng)絡(luò)模型來進行文本的情感分析,從文字中識別出讀者對于特定內(nèi)容的主觀意見、情緒等,從而進行符合人類情感態(tài)度的內(nèi)容分發(fā)。
在用戶數(shù)據(jù)和內(nèi)容數(shù)據(jù)的標簽化完成后,推薦引擎式分發(fā)需遵循兩種匹配邏輯:
一是為用戶找到他的內(nèi)容,依托用戶數(shù)據(jù)完成跟蹤推送。依托于用戶數(shù)據(jù)分析后利用算法模型預(yù)測用戶可能感興趣的信息內(nèi)容,并分別將部分用戶的數(shù)據(jù)作為訓(xùn)練集和測試集,依次進行模型的評估測試,得到模型的準確率。簡單來講,用戶基數(shù)越大,用戶數(shù)據(jù)越豐富,推薦算法模型的預(yù)測正確率越高,推薦的信息內(nèi)容更加精準。
二是為內(nèi)容找到它的用戶,內(nèi)容標簽精準集中目標用戶。對于已經(jīng)標簽化的信息內(nèi)容,通過分發(fā)和用戶反饋來對推送模型進行評估和修正。同時,用戶的行為數(shù)據(jù)也會影響內(nèi)容分發(fā)算法的自我迭代,例如用戶最近關(guān)注體育類文章,機器學(xué)習會大批量自動抓取和生成相關(guān)的內(nèi)容,有關(guān)體育的文章也會被優(yōu)先推送至用戶。為了能夠使內(nèi)容標簽精準集中目標用戶,需要使用協(xié)同過濾算法對用戶的興趣進行深度挖掘。
歸根到底,用戶的興趣圖譜精細化和內(nèi)容標簽的多元化處理分類是完成兩種匹配邏輯的必要前提。
(2)搜索引擎+社區(qū)問答式分發(fā)機制
一方面,新型主流媒體要發(fā)揮資源優(yōu)勢,加強在算法分發(fā)技術(shù)上的探索和運用。在搜索方面,加強機器對用戶語義的識別能力,精準洞察用戶需求,實現(xiàn)快速響應(yīng)、智能響應(yīng)。換言之,新型主流媒體建設(shè)搜索引擎式的分發(fā)機制,首先需要有多元、專業(yè)的信息資源庫存作為儲備,并以完善科學(xué)的搜索響應(yīng)系統(tǒng)架構(gòu)提供技術(shù)底層支持。
另一方面,利用協(xié)同算法聚合內(nèi)容,豐富社區(qū)式問答分發(fā)功能,延伸分發(fā)觸角,擴大影響力。部分主流媒體平臺只停留于“用戶提問-相關(guān)回答”這一單一環(huán)節(jié),當用戶在平臺搜索某個問題,平臺跳出一篇新聞的報道,整個搜索過程便終止了。用戶有相關(guān)的疑問時,在平臺提出問題,等待后臺編輯或其他網(wǎng)友的解答后,問答過程也終止了。新型主流媒體分發(fā)平臺可以借鑒“社交式分發(fā)”的邏輯,為其分發(fā)機制注入社交基因。如知乎平臺利用算法快速實現(xiàn)對用戶檢索內(nèi)容或其問題的自動識別和分類呈現(xiàn)。新型主流媒體客戶端無須做到對于問答內(nèi)容的面面俱到,但可以充分發(fā)揮平臺的權(quán)威性和專業(yè)性,在滿足用戶頭部新聞內(nèi)容的需求同時,滿足用戶對于新聞信息的深度需求。例如對某一重點事件的報道可由專業(yè)編輯根據(jù)新聞發(fā)展分為“背景探析——時間進行中——長尾討論”不同階段,并在不同階段結(jié)合算法分發(fā)技術(shù)吸納更多用戶的關(guān)注和參與。背景探析部分可設(shè)置立足于新聞事件的專業(yè)問題,介紹新聞的相關(guān)背景并邀請到用戶參與事件的討論。在新聞不斷的發(fā)展變化中,發(fā)揮時效優(yōu)勢,在恰當時機再次提出問題,包括新聞后續(xù)的討論和延伸方向,可以邀請到“專家觀點+草根用戶解讀+組織機構(gòu)發(fā)聲+事件當事人現(xiàn)身說法”等不同主體共同參與新聞報道,從不同角度挖掘信息價值,從問答互動中挖掘報道素材和角度,并將優(yōu)質(zhì)的長尾內(nèi)容納入到新一輪的信息生產(chǎn)與分發(fā)環(huán)節(jié)中,形成分發(fā)——再分發(fā)的完整閉環(huán)。這些功能的實現(xiàn)需要強大的數(shù)據(jù)處理能力和機器響應(yīng)能力,對于不同信息內(nèi)容進行“標簽”設(shè)定,并將平臺專業(yè)化內(nèi)容+優(yōu)質(zhì)問答內(nèi)容進行篩選-聚合-排序-呈現(xiàn),并依據(jù)用戶畫像進行協(xié)同話題的推薦和分發(fā)。
總的來說,頭部的新聞內(nèi)容成為最主要的流量入口,其分發(fā)算法中提高時效性、重要性、顯著性等新聞價值要素的權(quán)重,滿足用戶基礎(chǔ)的信息需求。同時,開拓尾部新聞問答的分發(fā)空間,滿足用戶信息個性化需求。這需要新型主流媒體不僅局限在頭部內(nèi)容的分發(fā)層面,也需要對“原生信息”視為素材,吸引用戶的點贊或評論,進一步利用“再加工的信息材料”,提煉引導(dǎo)觀點,擴大影響力。由專業(yè)編輯+機器算法將這些長尾內(nèi)容進行篩選及重新聚合、排序、審核、分類呈現(xiàn)。并發(fā)揮專業(yè)編輯把關(guān)、撰寫、整合的能力,提高長尾內(nèi)容的整體質(zhì)量,這些長尾內(nèi)容也可以和頭部內(nèi)容進行組合分發(fā),使新聞報道更加完整、全面。
新型主流媒體客戶端應(yīng)與“知乎”等移動新聞客戶端的問答式平臺形成功能區(qū)別,以自身優(yōu)勢的資訊權(quán)威力和優(yōu)質(zhì)新聞資源吸引更多用戶,捕捉他們對于信息的深度需求,不僅僅局限于頭部新聞內(nèi)容的分發(fā),而是吸納更多長尾的信息問答內(nèi)容,與互聯(lián)網(wǎng)平臺媒體形成差別,找到自己獨特的生態(tài)定位,在網(wǎng)絡(luò)分發(fā)渠道占據(jù)一席之地。
在 Feed 流的推薦場景下,用戶都是越來越“懶”的,大部分用戶希望及時不通過不進行繁瑣的操作,也能得到非常精準的推薦結(jié)果。這也是“水晶球”的信息流推薦框架意圖達到的分發(fā)效果。當用戶來到知乎的推薦頁面時,線上模塊的部分分為召回、排序和重排三個階段,并最終將返回的推薦結(jié)果展示給用戶,形成了我們所看到的千人千面的信息流頁面。
其中,“召回”主要是將盡可能“大而全”地將所有用戶可能感興趣的內(nèi)容都提取出來,根據(jù)用戶的歷史行為表現(xiàn)(即用戶畫像),確定數(shù)十個推薦隊列,或者說數(shù)十個“召回源”的召回比例和召回數(shù)量。推薦隊列是一個個含有特定標簽的內(nèi)容合集。有些隊列里內(nèi)容性質(zhì)相似,比如熱點新聞隊列、視頻隊列。還有的隊列與用戶行為緊密相關(guān),比如關(guān)注的人隊列、搜索關(guān)鍵詞隊列。這一模塊主要采用的技術(shù)包括:對圖文內(nèi)容、視頻內(nèi)容的基本的識別和畫像,對用戶的畫像,以及圖文內(nèi)容和視頻內(nèi)容里面的實體識別以及關(guān)聯(lián)。
緊接著,“Ranking”會基于用戶可能感興趣的程度對所召回的全部內(nèi)容進行重新排列,力圖更加“精準”的關(guān)聯(lián)用戶興趣,一般基于時間順序、線性加權(quán)等規(guī)則。Ranking模塊借鑒了Facebook的Edge Rank算法,加入了用戶親密度的參考維度,并在最近的優(yōu)化版本Global Ranking中采用了深度學(xué)習模型、DNN(即深度神經(jīng)網(wǎng)絡(luò)技術(shù))等,能夠快速處理高達幾十萬的話題量級,DNN 可以在一百毫秒內(nèi)對數(shù)百條召回內(nèi)容完成打分和排序過程,決定推送給用戶的內(nèi)容。
最后,“Reranking”則會根據(jù)平臺規(guī)則或業(yè)務(wù)需求,對推薦物料再次加工,如給視頻、圖文內(nèi)容進行一定的提權(quán);又如將相似內(nèi)容隔離開避免話題堆砌感等,最終將推薦的內(nèi)容分發(fā)至用戶。
知乎的推薦系統(tǒng)針對這一需求持續(xù)進行優(yōu)化,比如:在召回環(huán)節(jié),引入更多根據(jù)用戶的行為來召回內(nèi)容的方式;在排序環(huán)節(jié),把用戶的各種行為,以及內(nèi)容的各種標簽都引入進來,并通過 DNN 神經(jīng)網(wǎng)絡(luò)進行排序。
(3)推薦系統(tǒng)分發(fā)規(guī)則
為完成精準又多樣的個性化分發(fā),在系統(tǒng)架構(gòu)的底層支持下,知乎的分發(fā)規(guī)則應(yīng)用的主要就是基于內(nèi)容和用戶的協(xié)同過濾。
協(xié)同過濾(Collaborative Filtering)就是基于鄰域的算法,即使用某人的行為behavior來預(yù)測其它人會做什么。
基于用戶的協(xié)同過濾是指根據(jù)用戶對物品的偏好,找到相似的用戶,然后向當前用戶推薦相似用戶最喜歡的物品。其主要權(quán)重是用戶標簽之間的相似重合系數(shù),預(yù)測目標用戶對相似物品的喜好程度,最后展示出最符合其預(yù)期的內(nèi)容推薦給他。
如圖(表4)所示,用戶A喜歡內(nèi)容1、內(nèi)容3,用戶C喜歡內(nèi)容1、內(nèi)容3、內(nèi)容4,從用戶的偏好行為數(shù)據(jù)中可以觀察到,用戶A與用戶C擁有相似的內(nèi)容喜好,于是系統(tǒng)會優(yōu)先將內(nèi)容4也推薦給用戶A。
同時,基于內(nèi)容的協(xié)同過濾規(guī)則也不盡相同,但它主要參考的是內(nèi)容1與內(nèi)容2、內(nèi)容3……的相似程度,并根據(jù)用戶畫像,將內(nèi)容推薦給當前用戶。
內(nèi)容分類呈現(xiàn)結(jié)構(gòu)化的特點。知乎的各個頻道、分類、話題都是對內(nèi)容的一種分類。單個回答或文章來說,包括數(shù)值特征(如內(nèi)容長度、點贊量、瀏覽量等)、內(nèi)容類型(關(guān)鍵詞、話題ID)等。
內(nèi)容理解不僅為匹配奠定基礎(chǔ),同時也是知乎進行分發(fā)規(guī)則設(shè)定的另一種表現(xiàn)形式,即流量分發(fā),其代表產(chǎn)品就是知乎的熱榜。以熱榜為代表的流量分發(fā)方式,可以引爆一些話題。
除了基礎(chǔ)的用戶自然屬性畫像以外,知乎更加重視用戶的行為畫像,如用戶搜索行為、點贊數(shù)、用戶評論數(shù)等統(tǒng)計特征。你在知乎的每一次關(guān)注、點贊、分享、評論、收藏,甚至某個回答的停留時長,都是你的一次行為標簽。平臺對不同的行為標簽有不同的權(quán)重,例如評論的權(quán)重大于點贊。多元的用戶標簽用于建立用戶畫像系統(tǒng)。
為了達到更好的分發(fā)效果,知乎并沒有單純使用以上其中一種作為單一的分發(fā)規(guī)則。通過進一步的相似度計算,完成二者的協(xié)同過濾。
因此,當你打開知乎首頁,看到給你推薦的那些內(nèi)容,都是基于你過往的搜索、瀏覽、點贊、評論等行為標簽計算得來的,你的每一個動作,都是在為自己可能接受到的信息投票。
3.搜索分發(fā):精準切中用戶需求
知乎打出“有問題,上知乎”這一口號。用戶主動獲取內(nèi)容是知乎主要的內(nèi)容分發(fā)形式,分為搜索和提問兩種形式。知乎作為一個大型的中文問答社區(qū),有超過四千萬的提問和超過兩億條回答,其中蘊含了豐富的知識、經(jīng)驗和見解,知乎搜索是幫助用戶快速獲取信息,找到答案的重要途徑,隨著媒介的升級,搜索結(jié)果的形式也不在局限于圖文,視頻解答也越來越多。
知乎首頁的問答內(nèi)容依據(jù)“搜索算法”一系列的識別、匹配和排序后,將結(jié)果呈現(xiàn)在每個用戶的眼前,而推薦的依據(jù)則在于不同用戶的關(guān)注和搜索行為。
搜索,是用戶獲取信息,找答案最方便快捷的方式。在知乎,一次用戶搜索會經(jīng)歷 Query 解析、召回、排序多個環(huán)節(jié)。用戶輸入 Query 之后,首先要進行 Query 解析,生成查詢 Query Tree 和語義表示向量。之后進入多隊列的召回模塊,召回階段從召回方式上說可以分為倒排召回和向量召回,在這一環(huán)節(jié)會篩選出前400的文檔進入到排序階段。排序階段又分為精排和重排序兩個環(huán)節(jié),精排階段通過模型對多召回源的文檔進行統(tǒng)一打分,之后將 Top16的文檔送入重排序模型進行位置的微調(diào),最終呈現(xiàn)給用戶。排序作為最后整個過程一環(huán),對用戶的體驗有最直接的影響。
(三)新型主流媒體建設(shè)信息分發(fā)機制的創(chuàng)新思考
1.算法優(yōu)化:主流價值觀駕馭的優(yōu)質(zhì)算法分發(fā)
對主流媒體而言,算法的廣泛應(yīng)用是把雙刃劍。一方面,算法能夠為承擔主流價值傳播的主流媒體賦能,提升新聞生產(chǎn)能力與信息分發(fā)的精準度;另一方面,算法分發(fā)依據(jù)的邏輯規(guī)則也對主流意識形態(tài)帶來沖擊和影響。如何在算法廣泛應(yīng)用的時代背景下牢牢掌握網(wǎng)絡(luò)輿論場上的主動權(quán)話語權(quán),是主流媒體面臨的一大挑戰(zhàn)。
從國內(nèi)典型的信息精準推送平臺的實踐看,新型主流媒體實現(xiàn)精準分發(fā)需要包含以下環(huán)節(jié):其一是建立內(nèi)容數(shù)據(jù)庫來聚合海量信息;其二是建立用戶數(shù)據(jù)庫來記錄用戶身份和行為數(shù)據(jù);其三是建立標簽體系,標注內(nèi)容信息與用戶數(shù)據(jù),以便于匹配和調(diào)用二者;其四是確定規(guī)則,尋找相應(yīng)算法,建立數(shù)學(xué)模型,開發(fā)計算機程序;其五是利用大數(shù)據(jù)訓(xùn)練算法程序??偟膩碚f,就是基于信息內(nèi)容標簽來預(yù)測用戶不同場景下的信息需求,完善分發(fā)算法的標簽體系,不斷豐富其算法標簽中的內(nèi)容要素,使標簽體系更加貼近用戶的需求和個人偏好,以提高分發(fā)的適配度和傳播效率。
更重要的是,作為主流媒體,將主流價值觀作為標簽納入到算法的取值和分析過程中,這是為實現(xiàn)社會公共利益的最大化所必要完成的。從社會維度看,社會主義核心價值觀是當今社會的主導(dǎo)價值觀,包含了國家、社會和公民層面的價值要求,其應(yīng)當成為新型主流媒體算法機制建構(gòu)的重要指導(dǎo)。從專業(yè)維度看,包含“真實、準確、客觀、公正”等在內(nèi)的職業(yè)理念和操作準則,與強調(diào)“黨性和人民性統(tǒng)一”等原則的馬克思主義新聞觀,正在當下共同影響和規(guī)范著我國的信息傳播實踐。新型主流媒體的算法設(shè)計應(yīng)充分體現(xiàn)主流價值觀,并將深入探索滿足社會成員個人的信息需要與促進其與社會一體化之間的辯證關(guān)系,以此為基礎(chǔ)提升算法分發(fā)的科學(xué)性。通過全面地分析把握用戶本質(zhì)的信息需求,建立更加科學(xué)的算法規(guī)則,可從以“點擊量”為主要參考因素的模式,轉(zhuǎn)變?yōu)橹w現(xiàn)新聞內(nèi)容的“重要性”的“社會化”標準。在這一標準的基礎(chǔ)上,新型主流媒體將能夠重點突出主流價值觀在信息分發(fā)環(huán)節(jié)中的把關(guān)作用,實現(xiàn)個人信息選擇和社會公共利益的最大平衡。為此,新型主流媒體需搭建相應(yīng)權(quán)重和算法函數(shù)關(guān)系指導(dǎo)信息推薦中的“內(nèi)容評級”和“用戶畫像”機制,建設(shè)起新型主流媒體平臺的精準推送能力。
其一,在用戶層面,充分體現(xiàn)信息對于用戶個人的“重要性”。移動傳播體系中的信息分發(fā)效果,依據(jù)主流價值觀作出的判斷是否能夠廣泛傳播,社會是否能夠在這樣的信息底層上達成共識,最終都取決于用戶的點擊打開和閱讀播放。這一過程中,可借鑒今日頭條、知乎等商業(yè)平臺算法分發(fā)機制規(guī)則設(shè)定中對于用戶需求、社交關(guān)系的權(quán)重分配,具體分析用戶個人的信息需求特征,精準推送相關(guān)信息。
其二,在內(nèi)容層面,以主流價值指導(dǎo)內(nèi)容數(shù)據(jù)庫建設(shè)和內(nèi)容審核及評級。移動傳播時代的信息傳播是個人化傳播,而用戶個人的需求是多元且豐富的。用戶不僅需要新聞等公共信息,更需要各類娛樂資訊、生活資訊和自我表達的空間。互聯(lián)網(wǎng)技術(shù)提供了這樣的可能性。因此,新型主流媒體平臺需要比自己以往和比互聯(lián)網(wǎng)商業(yè)平臺在更大范圍內(nèi)聚合各類信息和數(shù)據(jù),并建立具有更多維度的科學(xué)的標簽體系,并在此基礎(chǔ)上,通過對各類資訊的科學(xué)評估,包括內(nèi)容與社會主流價值觀的一致性等,來進行分發(fā)內(nèi)容的把關(guān),在一個品類豐富、高質(zhì)量的內(nèi)容數(shù)據(jù)庫的基礎(chǔ)上建構(gòu)精準推送能力。
2.人機共治:建立分層分級“把關(guān)制度”
人工編輯在選擇新聞信息時候有基本的價值判斷標準,而算法技術(shù)雖然可以幫助快速篩選信息內(nèi)容,提升分發(fā)效率,但缺乏更加專業(yè)化的判斷能力,因此突出“人工編輯”在新聞價值觀方面的引導(dǎo),可以改善算法機械化的弊端,增強信息的價值含量,又可以使算法在深度學(xué)習中更加“懂”人。完成“工具理性”和“價值理性”的適配和相互促進。
一是在內(nèi)容生產(chǎn)和分發(fā)方面,建設(shè)獨立于算法系統(tǒng)外的人工編輯預(yù)估系統(tǒng),由有豐富編輯、審核經(jīng)驗的傳統(tǒng)專業(yè)媒體團隊,從新聞價值等角度預(yù)判用戶的偏好,并將其預(yù)判的結(jié)果和機器的預(yù)測結(jié)果進行協(xié)同化計算處理,動態(tài)調(diào)整用戶畫像,并動態(tài)調(diào)整信息的分發(fā)權(quán)重。而不只是單純憑借機器對用戶歷史瀏覽行為數(shù)據(jù)的跟蹤來進行用戶標簽集的創(chuàng)建,通過相應(yīng)的算法機制適配,保障用戶獲得更加全面、均衡的信息。這樣或能更好、更精準的實現(xiàn)用戶數(shù)據(jù)和內(nèi)容數(shù)據(jù)的精準匹配,提升信息分發(fā)的效率。同時,利用人工智能和數(shù)據(jù)庫相結(jié)合的方式,結(jié)合心理學(xué)建模,加強平臺自動化進行內(nèi)容審核和管控的力度,加強對虛假信息、泛娛樂化信息的甄別與控制,沉淀更多優(yōu)質(zhì)信息資源。加強人工干預(yù)和算法自動分發(fā)機制的配合,在某種程度上有助于平臺能夠進行不同類型素材的輸入,降低了內(nèi)容同質(zhì)化趨勢,保證信息內(nèi)容的多元化。同時也能彌補算法難以判斷內(nèi)容價值傾向的弊端,保證分發(fā)的內(nèi)容具有一定的新聞價值。
二是動態(tài)調(diào)整不同類別新聞分發(fā)的權(quán)重,實現(xiàn)硬資訊和軟資訊之間的平衡,實現(xiàn)社會信息需求和個人信息需求之間的平衡,保證個人在獲取個人興趣內(nèi)容之外也能獲得其他方面的信息內(nèi)容。一定程度上能夠幫助用戶更好的擴展其內(nèi)容接觸面,拓展興趣點,甚至引導(dǎo)用戶主動搜索更加多元化的信息內(nèi)容,避免信息繭房。
三是恪守公正、真實的原則,利用技術(shù)手段通過對信息分發(fā)路徑各個環(huán)節(jié)的追蹤,實現(xiàn)對虛假信息的實時監(jiān)測和快速識別,提升對虛假信息的有效管控,發(fā)揮全媒體時代互聯(lián)網(wǎng)信息“把關(guān)人”的重要作用,維持網(wǎng)絡(luò)空間良好信息秩序,營造安定有序的互聯(lián)網(wǎng)信息環(huán)境。
四是在分發(fā)機制的設(shè)定中保持審慎、公平的態(tài)度來制定算法規(guī)則和標準制定,在內(nèi)容分發(fā)的各個環(huán)節(jié)中,謹慎避免“算法偏見”,防止用于算法訓(xùn)練的原始數(shù)據(jù)集存在人為的不良傾向,遵循中立、公平的算法程序開發(fā)原則,同時引入專業(yè)人員實時對分發(fā)的流程和算法的自我學(xué)習流程進行檢測,提升信息交互質(zhì)量,在分發(fā)之前較早的識別偏見、修正算法程序,保證用戶接收到的信息內(nèi)容更加全面、客觀。
參考文獻
[1]匡文波.新媒體概論(第2版)[M].北京:中國人民大學(xué)出版社,2015.
[2]郭慶光.傳播學(xué)教程(第2版)[M].北京:中國人民大學(xué)出版社,2011.
[3]劉海龍.大眾傳播理論:范式與流派[M].北京:中國人民大學(xué)出版社,2008.
[4]胡正榮,段鵬,張磊.傳播學(xué)總論[M].北京:清華大學(xué)出版社,2008.
[5]林祥.互聯(lián)網(wǎng)時代媒體平臺經(jīng)濟發(fā)展的理論與實踐[M].北京:國家圖書館出版社,2018.
[6]梅爾文·德弗勒,桑德拉·鮑爾—洛基奇.大眾傳播學(xué)緒論(杜立平譯)[M].北京:新華出版社,1990(原著出版于1957年).
[7]尼古拉·尼葛洛龐帝.數(shù)字化生存(胡泳,范海燕譯)[M].北京:電子工業(yè)出版社,2017(原著出版于1997年).
[8]沙蓮香.社會心理學(xué)(第二版)[M].北京:中國人民大學(xué)出版社,2006.
[9]納賽·佛林,小詹姆斯·坦卡徳.傳播理論——起源、方法與應(yīng)用[M].北京:華夏出版社,2000(原著出版于1979年).
[10]《人工智能讀本》編寫組.人工智能讀本.北京:人民出版社,2019.
[11]保羅·萊文森.信息革命的自然歷史與未來(何道寬譯)[M].上海:復(fù)旦大學(xué)出版社,2011(原著出版于1998年).
[12]戴維·克勞利,保羅·海爾.傳播的歷史——技術(shù)、文化和社會(董璐等譯,第6版)[M].北京:北京大學(xué)出版社,2018(原著出版于2003年).
[13]米歇爾.機器學(xué)習(曾華軍等譯)[M].北京:機械工業(yè)出版社,2015(原著出版于1968年).
[14]彭蘭.網(wǎng)絡(luò)傳播概論(第3版)[M].北京:中國人民大學(xué)出版社,2012.
[15]鐘瑛.網(wǎng)絡(luò)傳播導(dǎo)論(第2版)[M].北京:中國人民大學(xué)出版社,2016.
[16]張鳳軍.基于Neo4j圖數(shù)據(jù)庫的社交網(wǎng)絡(luò)數(shù)據(jù)的研究與應(yīng)用[G].湖南大學(xué)碩士論文,2016.
[17]王子今.郵傳萬里: 驛站與郵遞[M].長春:長春出版社,2004.
[18]喻國明.媒介革命:互聯(lián)網(wǎng)邏輯下傳媒業(yè)發(fā)展的關(guān)鍵與進路[M].北京:人民日報出版社,2015.
[19]宋建武.構(gòu)建全媒體傳播體系的實踐路徑[J].傳媒評論,2021(02):13-16.
[20]宋建武.全媒體傳播格局中的主流價值引領(lǐng)[J].新聞與寫作,2019(11):1.
[21]宋建武,馮雯璐.全媒體時代主流媒體的數(shù)據(jù)化生存與發(fā)展[J].湖南大學(xué)學(xué)報(社會科學(xué)版),2019(33):153-160.
[22]宋建武.全媒體傳播格局中的主流價值引領(lǐng)[J].新聞與寫作, 2019(11):1.
[23]宋建武,黃淼.信息精準推送中主流價值觀的算法實現(xiàn)[J].新聞與寫作,2018(09):5-10.
[24]宋建武,陳璐穎.建設(shè)區(qū)域性生態(tài)級媒體平臺——打造新型主流媒體的路徑探索[J].新聞與寫作,2016(1):5-12.
[25]宋建武,黃淼,陳璐穎.平臺化:主流媒體深度融合的基石[J].新聞與寫作,2017(10):5-14.
[26]陳昌鳳,石澤.技術(shù)與價值的理性交往:人工智能時代信息傳播——算法推薦中工具理性與價值理性的思考[J].新聞戰(zhàn)線,2017(9):71-74.
[27]劉戰(zhàn)偉,劉蒙之.編輯、社交和算法:信息分發(fā)路徑、權(quán)力格局與未來圖景[J].城市黨報研究,2020(02),46-53.
[28]王萬良,李卓蓉.生成式對抗網(wǎng)絡(luò)研究進展[J].通信學(xué)報,201839(2):135-148.
[29]彭蘭.移動化、社交化、智能化:傳統(tǒng)媒體轉(zhuǎn)型的三大路徑[J].新聞界,2018(1),35-41.
[30]劉永俊.論大數(shù)據(jù)背景下編輯理念的變革之路——以“今日頭條”新聞客戶端為例[J].出版廣角,2015(9):96-97.
[31]彭蘭.未來傳媒生態(tài):消失的邊界與重構(gòu)的版圖[J].現(xiàn)代傳播,2017(1):4-5.
[32]師文,陳昌鳳.社交分發(fā)與算法分發(fā)融合:信息傳播新規(guī)則及其價值挑戰(zhàn)[J]. 當代傳播,2018(06):31-33+50.
[33]仇筠茜,陳昌鳳.黑箱:人工智能技術(shù)與新聞生產(chǎn)格局嬗變[J].新聞界,2018(1): 28-34.
[34]沈浩,袁璐.人工智能:重塑媒體融合新生態(tài)[J].現(xiàn)代傳播,2018(7):8-11.
[35]施威,熊佳敏.媒介技術(shù)演進的社會動因與選擇機制[J].新聞傳播, 2013(11):110-111.
[36]司崢鳴.技術(shù)演進中的傳統(tǒng)媒體發(fā)展重構(gòu)——基于Web2.0理念下傳統(tǒng)媒體的現(xiàn)狀和未來[J].哈爾濱商業(yè)大學(xué)學(xué)報(社會科學(xué)版),2010(1):93-97.
[37]陶飛,劉蔚然,劉檢華,劉曉軍,劉強等.數(shù)字孿生及其應(yīng)用探索[J].計算機集成制造系統(tǒng),2018-24(1):1-18.
[38]蘇濤,彭蘭.“智媒”時代的消融與重塑——2017年新媒體研究綜述[J].國際新聞界,2018(1):13-14.
[39]金兼斌.機器新聞寫作:一場正在發(fā)生的革命[J].新聞與寫作,2014(9):30-35.
[40]黃典林,白宇.人工智能與新聞業(yè)變革的技術(shù)和文化邏輯[J].新聞與傳播評論,2018(6):31-40.
[41]李沁.沉浸媒介:重新定義媒介概念的內(nèi)涵和外延[J].國際新聞界,2017(8):115-139.
[42]李煜.廣播史研究的范式轉(zhuǎn)移[J]. 現(xiàn)代傳播(中國傳媒大學(xué)學(xué)報),2014-36(9): 38- 45.
[43]蘇濤,彭蘭.“智媒”時代的消融與重塑——2017年新媒體研究綜述[J]. 國際新聞界,2018(1).
[44]杰羅姆.平臺型新媒體(Platisher)是有效的商業(yè)模式嗎?[J].中國傳媒科技,2014(23):5.
[45]方師師.雙強寡頭平臺新聞推薦算法機制研究[J].傳播與社會學(xué)刊,2018(1)45-47+31.
[46]方師師.算法機制背后的新聞價值觀———圍繞 “Facebook 偏見門” 事件的研究[J].新聞記者,2016(9):64-65.
[47]王茜.打開算法分發(fā)的 “黑箱” ———基于今日頭條新聞推送的量化研究[J].新聞記者,2017.
[48]段偉文.人工智能時代的價值審度與倫理調(diào)適[J].中國人民大學(xué)學(xué)報, 2017(6):98-108.
[49]傅丕毅,徐常亮,陳毅華.“大數(shù)據(jù)+人工智能”的新聞生產(chǎn)和分發(fā)平臺——新華社“媒體大腦”的主要功能和AI時代的新聞愿景[J].中國記者,2018(3):17-20.
[50]張洪忠,石韋穎,劉力銘.如何從技術(shù)邏輯認識人工智能對傳媒業(yè)的影響[J].新聞界,2018(2):17-22.
[51]美通社-美通說傳播.騰訊全媒派劉勝男談未來媒體的內(nèi)容格局[OL].http://prnasia.com/blog/archives/20419,2018-1-3.
(作者系中國人民大學(xué)新聞學(xué)院碩士研究生)