佘曉晨
超過6成的中國人在網絡平臺消費內容,同時,其中一部分人也扮演著生產者的角色。
隨著Twitter、微博的出現(xiàn),UGC(User Generated Content,用戶生產內容)開始成為網民在互聯(lián)網上瀏覽的重要信息。根據(jù)中國網絡視聽節(jié)目服務協(xié)會發(fā)布的報告,截至2020年12月,我國網絡視聽用戶規(guī)模達9.44億,其中短視頻用戶已達8.73億。
UGC平臺隨著移動互聯(lián)網的擴張愈加普及和通用,而它的副作用也隨之而來——首先是注意力被占用,緊接著是迅速消逝的時間和被放大的情緒。而在海量內容當中,能找出真正稱得上是“有用信息”的東西,無異于在沙里淘金。
很多用戶都有過這樣的經歷,抖音里經常能刷到不同的博主念著一模一樣的文案,煞有介事地給觀眾說教或者科普,實際上他們也不懂自己說的是什么。這些都是做號團隊在背后操縱批量生產。
垃圾信息的生產已有成熟的流水線,而與其的對抗與縱容,也成為互聯(lián)網世界中的常態(tài)。
有生產者毫不諱言自己產出的內容就是“垃圾”。
2018年后,抖音快手迅速崛起,信息流廣告成為極為熱門的投放方式。于夢在一家教育公司上班,她的工作是做出適合“混在”抖音里的廣告。這些廣告會被投放到“目標用戶”的終端里,吸引他們點開,再引流到自家的教育課程APP上。
這份工作肯定談不上是創(chuàng)作。
“首先是分析數(shù)據(jù),從廣告上線到用戶觸達,都有一系列的硬性指標去衡量?!崩ψ∮趬舻腒PI包括且不限于點擊率、轉化率、3秒播放、5秒播放等等數(shù)據(jù)。教育行業(yè)的特殊性讓她覺得工作多少有點意義,但她還是覺得,這些視頻“99%都是垃圾”。
做信息流廣告,沒有量,一切都是空談。在于夢的團隊里,一個人一個月可以做出150條左右的視頻。這意味著每天每個人需要產出7條內容。每條視頻有自己的去處——它們對應著不同的抖音ID,一個ID就是一個廣告“點位”。
上傳好一條視頻后,于夢會在后臺設置出對應的“點位”。地理位置、年齡、手機類型甚至職業(yè),都能成為“點位”的區(qū)分點。
公司業(yè)務增長確實也從中獲益,但那些點擊量極高的視頻在哪一個環(huán)節(jié)起了作用,并沒有一個確定的原因。
于夢說,爆款短視頻廣告的成功有運氣成分,而制作投放只是基礎動作。在視頻內容同質化競爭越來越強的情況下,后續(xù)的效果還需要市場檢驗??偠灾?,量是有用的。于夢和她的同事只能周而復始地生產內容。
另一部分流水線的搭建則源于甲方對“流量”的需求。評論、點贊、轉發(fā)——所有的可量化指標都會變成“數(shù)據(jù)”,沒人在意數(shù)據(jù)之下,100字的內容到底從何而來。
“沖熱搜”是李暉工作中最重要的部分??蛻粲行枰臅r候,李暉負責找水軍、找大V發(fā)帖。從素人號到KOL,所有的內容發(fā)布都是明碼標價的。
負面輿情處理是最典型的例子。一兩個小時之內,李暉和他的團隊就能完成幾十個內容模板,然后通過“水軍供應商”發(fā)布出去。
做出閱讀量和熱度是最基本的操作,屬于供應商們的“數(shù)據(jù)維護”業(yè)務。而在所有“水軍”中,素人號是最多的,“隨手點開一個熱門微博的評論就有”;預算足夠的話,就可以買到更高級的僵尸粉,他們的賬號權重更高,評論會排在前面。
李暉比任何人都清楚哪些東西是假的。他對水軍的文案“套路”爛熟于心,點開微博熱搜,李暉基本上可以判斷出哪些詞條是買上去的。
更多的“垃圾”躲在暗處。
它們像是內容廣場里的蛀蟲:一旦野蠻生長,整個廣場都會被腐蝕。在QQ群搜索“知乎批量評論”、“小紅書筆記代發(fā)”,組織者用2元的低廉價格獲取一條垃圾信息,一條條黑灰產業(yè)鏈就此延伸。
和垃圾對抗是魏寧的日常工作。作為一家國內安全服務公司的產品負責人,他和團隊為很多知名互聯(lián)網公司提供內容安全服務。涉黃、涉政和暴恐內容,都屬于他們監(jiān)測的范圍。
算法和模型是其中的關鍵。首先加入戰(zhàn)斗的是負責人工打標的員工,他們熟知哪些網站有“垃圾內容”的素材,這是他們搜集樣本的來源。一個樣本里通常只有1-2處可以標注出來的垃圾內容特征,被標注的樣本進入模型側,再進行后續(xù)的機器學習和訓練。
最近一兩年,黑灰產中的垃圾內容是內容安全產品重點監(jiān)測的領域,例如殺豬盤。發(fā)布這些內容的人往往來自于同一個團伙。魏寧稱,在檢測出發(fā)布者的設備后,他們會將此設備上登錄的賬號都定義為違規(guī),然后直接封禁該設備。這樣一來,垃圾內容的發(fā)布者就需要換個賬號甚至換個手機來去進行下一次發(fā)布,成本就會大幅提高。
“這些發(fā)布者往往有一些共性的行為特征,例如注冊登陸的行為、使用的頭像以及對自己的描述和聊天內容?!笨偨Y下來,魏寧認為,最好的辦法是將業(yè)務安全和內容安全相結合,提高垃圾內容的發(fā)布成本。
大公司逐漸完善自己研發(fā)的內容審核平臺,而不少中等規(guī)模的內容平臺則會選擇和魏寧的團隊合作。審核的技術思路大多類似,但大廠配備的審核人員更多,用“人工+AI”完成整個檢測過程。
不過與此同時,垃圾生產者們也會學著“進步”,想盡辦法繞過平臺監(jiān)管。
從平臺角度看,生產與清理也是一個持續(xù)對抗的過程。
一位從2014年開始從事內容安全服務的產品總監(jiān)告訴界面新聞,他們研發(fā)的產品人工復審率在3%以內。如果一個平臺一天有1萬個內容數(shù)據(jù),內容審核員只需要重點審核處理其中的300多個,相比人工的效率提升將近30倍。
但算法亦有其存在的弊病。正因為平臺過于依賴算法,內容生產者往往會思考如何“踩中”算法的推薦點,優(yōu)先級甚至高于取悅用戶。在今日頭條工作過的一位運營看來,這也會導致內容的畸形。比如一些文章標題堆砌著容易得到流量推薦的關鍵詞,但連文本通順都難以做到。
這也是為什么互聯(lián)網公司需要大量“運營”崗位——人必須和技術一起對抗垃圾,“和算法做斗爭”也存在必要性。
“垃圾”一定是不必要的嗎?對于大公司來說,未必能給出肯定的答復。
在某個頭部手機廠商實習的經歷,顛覆了姜玲玲對“內容運營”這個崗位的認知。她的工作職責是給公司的新產品拉新促活。再細化一下工作任務,則是每天逛豆瓣和貼吧,找到合適的內容“搬運”到新的APP。
新產品面向下沉用戶,足夠“下沉”的內容才受歡迎,越是“震碎三觀”的故事越有閱讀量,比如家長里短、婚戀相親、美女八卦。找到這些內容之后,姜玲玲需要快速改寫,在公司開發(fā)的APP里批量發(fā)布,“不停灌水”。
在某個文娛互聯(lián)網公司工作過的劉燕有相似的經歷。在公司開發(fā)的音樂類APP上線之初,劉燕的工作是在各大音樂播放軟件中翻找評論,通過搬運和改寫,為每一首歌“匹配”5-6條人工評論。每天下班之前,100多首歌曲和評論被匯總在excel表格里,顯示她的工作成果。
即使過了早期發(fā)展的階段,平臺對于垃圾內容的態(tài)度也不是非黑即白。在這里,定義“價值”需要另一套衡量標準:在不違規(guī)的情況下,內容本身能夠吸引用戶,就是最大的價值。
對于那些重復的、沒有什么營養(yǎng)的垃圾信息,上述今日頭條的運營能感受到平臺的某種包容。作為一個信息聚合類的平臺,今日頭條缺少原生熱點,因此需要大量的內容支撐整個平臺的運作。信息量足夠大,用戶才能搜索到想要的東西,算法的精確性才能得以驗證和提升。一位業(yè)務領導曾在開會的時候對他們說,運營的工作就像是“在大海里撈魚”。
事實也證明了這種“包容”的作用。公開信息顯示,今日頭條上線一年后,用戶數(shù)突破5000萬;上線4年時間,累積6億的激活用戶;2021年Q1,Trustmobile數(shù)據(jù)顯示,今日頭條的月活超過2.8億。
一些猶豫是否要創(chuàng)造大海的產品也消失了。幾年前,一個新聞資訊產品在今日頭條的迅猛攻勢下出現(xiàn)危機感。一位參與該產品運作的人士告訴界面新聞,她明顯感覺到,對于是否“包容”垃圾信息,團隊內部始終沒有達成一致。在APP上線很久之后,內容編輯還在各種會議上探討,“是否要給下沉市場的人群傳送垃圾內容?”如今,該APP已經關停。
在用戶增長和高質量內容面前,平臺方始終保持著一種微妙的博弈態(tài)度。但隨著競爭和監(jiān)管的加強,平臺也意識到,一個想要長遠發(fā)展下去的產品,必須提供更干凈的海洋。
據(jù)Tech星球報道,今年今日頭條成立了兩個新業(yè)務團隊,其中一個團隊將去做定位高端的資訊平臺和智能閱讀工具“識區(qū)”。早期以“土味視頻”為增長引擎的快手,今年也頻繁發(fā)力知識類視頻和直播內容。一位創(chuàng)業(yè)者決定在今年投身知識內容的孵化,原因是“平臺不會永遠給用戶喂垃圾?!?/p>
但商業(yè)公司的天性是追逐利益,人的天性則是尋求不費力的趣味和刺激。在技術之外,和垃圾信息的對抗,更像是人性與人性之間的永恒戰(zhàn)爭。(來源:界面新聞)
責任編輯/吳艷平