賦能與負(fù)能：新聞聚合平臺(tái)數(shù)字爬蟲技術(shù)的倫理危機(jī)與治理路徑

2023-01-24 09:08:25孫海榮趙志豪

傳媒論壇 2022年24期

孫海榮趙志豪

一、引言

大數(shù)據(jù)時(shí)代新聞聚合平臺(tái)的發(fā)展更多基于Python語言的“網(wǎng)絡(luò)爬蟲”技術(shù)。網(wǎng)絡(luò)爬蟲是一種用來自動(dòng)瀏覽萬維網(wǎng)的網(wǎng)絡(luò)機(jī)器人，其使用針對(duì)性的方法對(duì)所需數(shù)據(jù)進(jìn)行高效的抓取，如面對(duì)動(dòng)態(tài)加載的網(wǎng)頁，使用模擬發(fā)送請(qǐng)求或使用Selenium模擬用戶操作的方法抓取數(shù)據(jù)。［1］但為新聞聚合平臺(tái)提供“數(shù)據(jù)抓取”“數(shù)值分析”“算法推薦”的數(shù)字爬蟲技術(shù)的同時(shí)也帶來了一系列智能倫理危機(jī)。表面的客觀數(shù)據(jù)背后隱藏著偏見和歧視、精準(zhǔn)的智能推送背后隱藏著對(duì)公民隱私權(quán)和信息自由權(quán)的侵犯、大數(shù)據(jù)優(yōu)化的背后隱藏著數(shù)據(jù)利益的驅(qū)使和人文關(guān)懷的缺失等［2］，為用戶、社會(huì)以及新聞專業(yè)主義生態(tài)環(huán)境造成了一定的影響。本文將就數(shù)字爬蟲技術(shù)的使用為切入點(diǎn)，就數(shù)字爬蟲技術(shù)對(duì)新聞業(yè)的賦能與負(fù)能進(jìn)行具體闡述，并分別從法律、科技、平臺(tái)、機(jī)器行為學(xué)角度綜合提出治理路徑以針對(duì)新聞聚合平臺(tái)數(shù)字爬蟲技術(shù)所帶來的智能倫理危機(jī)。

二、賦能與負(fù)能：新聞聚合平臺(tái)數(shù)字爬蟲技術(shù)理論分析

法國哲學(xué)家貝爾納·斯蒂格勒所言“人的發(fā)明”蘊(yùn)含兩層含義：一是說人發(fā)明了技術(shù)，二是說人是“被”發(fā)明的。［3］這里將人與技術(shù)規(guī)定為主體-客體之間的關(guān)系，突出了技術(shù)在人與技術(shù)之間的重要地位。從技術(shù)賦能角度來看，技術(shù)是一種“人之為人”思維下的實(shí)踐產(chǎn)物，在這一關(guān)系中，人是與技術(shù)不可分離、相互規(guī)定的技術(shù)存在物。人在發(fā)明創(chuàng)造技術(shù)的同時(shí)，技術(shù)實(shí)踐也在“創(chuàng)造”人，這就是客體改造與主體改造的相互統(tǒng)一。賈開等學(xué)者（2021）［4］從機(jī)器行為學(xué)視角出發(fā)將爬蟲技術(shù)視為嵌入社會(huì)環(huán)境并具有主體性的行動(dòng)者，爬蟲技術(shù)作為行為主體與環(huán)境進(jìn)行主動(dòng)交互，以社會(huì)環(huán)境中“人”的形態(tài)實(shí)現(xiàn)主體賦予其的動(dòng)機(jī)并反過來促進(jìn)技術(shù)實(shí)踐與適應(yīng)環(huán)境本身。

數(shù)字爬蟲技術(shù)對(duì)新聞產(chǎn)業(yè)的生產(chǎn)工藝流程的優(yōu)化升級(jí)不僅在于對(duì)于微操細(xì)節(jié)的革新，關(guān)鍵在于對(duì)新聞產(chǎn)業(yè)生產(chǎn)工藝?yán)碚摰纳?jí)。以前端、終端、后臺(tái)操作流程為例，前端通過網(wǎng)頁抓取、版權(quán)媒體、聚合平臺(tái)孵化三個(gè)流程將產(chǎn)出內(nèi)容進(jìn)行查重、機(jī)器審核后發(fā)送至后臺(tái)。后臺(tái)通過人工審核進(jìn)行安全性審核與話題流量入口多寡后由內(nèi)容運(yùn)營進(jìn)行對(duì)接，如原創(chuàng)欄目、資源開發(fā)。后臺(tái)通過算法推薦進(jìn)行內(nèi)容分發(fā)，將用戶自選擇的頻道置頂進(jìn)行干預(yù)、編輯置頂精選內(nèi)容。

但技術(shù)實(shí)踐并非是完全積極正面的，技術(shù)實(shí)踐所引發(fā)的倫理問題通常表現(xiàn)為技術(shù)發(fā)明或社會(huì)應(yīng)用問題，但其背后隱藏的則是倫理問題。韋伯區(qū)分“信念倫理”與“責(zé)任倫理”，強(qiáng)調(diào)技術(shù)實(shí)踐的責(zé)任倫理優(yōu)先。技術(shù)實(shí)踐首先要對(duì)技術(shù)行動(dòng)后果負(fù)責(zé)，這是“責(zé)任倫理”優(yōu)先原則。從技術(shù)負(fù)能角度出發(fā)，由爬蟲技術(shù)所引發(fā)的倫理問題單從外部規(guī)制無法將其即將出現(xiàn)的技術(shù)風(fēng)險(xiǎn)一并概括，此刻用以應(yīng)對(duì)一切技術(shù)風(fēng)險(xiǎn)及技術(shù)代價(jià)的“信念倫理”與事后承責(zé)的“責(zé)任倫理”處于同等地位。并且技術(shù)與倫理道德的關(guān)系上，倫理道德并非是超越時(shí)空占據(jù)絕對(duì)統(tǒng)治地位的，技術(shù)帶給倫理更多的是“挑戰(zhàn)”而非“請(qǐng)教”。

數(shù)字爬蟲技術(shù)給新聞聚合平臺(tái)所帶來的倫理問題不僅對(duì)用戶本身造成了侵犯，同時(shí)也對(duì)整個(gè)新聞業(yè)的專業(yè)精神與專業(yè)理念進(jìn)行了重構(gòu)。從新聞聚合平臺(tái)的用戶角度出發(fā)，隱私侵犯、信息自決權(quán)受限以及信息繭房等問題體現(xiàn)了數(shù)字爬蟲技術(shù)對(duì)用戶個(gè)人的技術(shù)掌控，用戶個(gè)人新聞獲取處于技術(shù)牢籠之中。而在新聞業(yè)的專業(yè)精神與專業(yè)理念方面，技術(shù)與內(nèi)容之間的矛盾、新聞價(jià)值理念潛規(guī)則、行業(yè)產(chǎn)權(quán)糾紛等涉及新聞專業(yè)主義精神的倫理問題層出不窮。

三、賦能流程：新聞聚合平臺(tái)數(shù)字爬蟲技術(shù)的發(fā)展

根據(jù)艾媒網(wǎng)發(fā)布的中國新聞客戶端用戶規(guī)模統(tǒng)計(jì)數(shù)據(jù)，2021年中國新聞客戶端用戶約為9.23億人次。諸如“今日頭條”“一點(diǎn)資訊”“谷歌新聞”等深度新聞聚合平臺(tái)所采用的爬蟲技術(shù)結(jié)合新聞聚合平臺(tái)內(nèi)部的其他算法可以為數(shù)字新聞的“采、編、發(fā)”傳統(tǒng)流程帶來系統(tǒng)化的升級(jí)。而這種技術(shù)賦能也確實(shí)為用戶帶來了全新體驗(yàn)，使新聞獲取以及新聞產(chǎn)出變得更加便捷與高效。

（一）新聞采集：數(shù)據(jù)抓取與中文切詞拓展新聞來源

新聞聚合平臺(tái)依托數(shù)字爬蟲技術(shù)的數(shù)據(jù)抓取以及中文切詞技術(shù)可以使使用者在短時(shí)間內(nèi)獲得海量文章的有關(guān)數(shù)據(jù)，對(duì)其進(jìn)行快速統(tǒng)計(jì)處理。而在人工智能的加持下，根據(jù)已有的參數(shù)變量在整個(gè)互聯(lián)網(wǎng)平臺(tái)進(jìn)行快速采集，大大拓展了新聞渠道來源，能夠在新聞發(fā)生的第一時(shí)間“快、準(zhǔn)、狠”地精準(zhǔn)推送。這極大地降低了新聞工作者的勞動(dòng)強(qiáng)度，同時(shí)也使得新聞聚合平臺(tái)牢牢抓住用戶群體，用戶群體在整個(gè)環(huán)節(jié)中不僅是內(nèi)容產(chǎn)出者，同時(shí)也是內(nèi)容的傳播擴(kuò)散者，更是維持新聞聚合平臺(tái)收益的核心群體。

（二）新聞編寫：智能寫作自主設(shè)置行文結(jié)構(gòu)

利用“爬蟲技術(shù)+算法”進(jìn)行新聞寫作可以為新聞聚合平臺(tái)實(shí)現(xiàn)每日發(fā)布數(shù)以萬計(jì)的海量新聞稿件，但不同的新聞內(nèi)容具有其不同風(fēng)格的要求、特色、格式和范式，新聞編寫是如何實(shí)現(xiàn)這一精準(zhǔn)化分配呢？可以利用爬蟲技術(shù)進(jìn)行參數(shù)設(shè)置，將已知統(tǒng)計(jì)過的各類高閱讀量標(biāo)簽化文本融入智能編輯中，幫助作者設(shè)置標(biāo)準(zhǔn)化標(biāo)題，從而規(guī)避不當(dāng)標(biāo)題和“標(biāo)題黨”的誕生，幫助記者更好的查漏補(bǔ)缺。另外，爬蟲技術(shù)通過爬取不同樣本的行文結(jié)構(gòu)特點(diǎn)，使得新聞產(chǎn)品可以契合各渠道的傳播方式，呈現(xiàn)新媒體、全媒體時(shí)代的新聞稿件篇章規(guī)則，幫助新聞更大范圍的傳播。寫作方面通過“人工+算法”相結(jié)合的方式，智能機(jī)器人根據(jù)算法設(shè)置的參數(shù)進(jìn)行文章初稿的生成與擬定，后續(xù)由內(nèi)容編輯進(jìn)行內(nèi)容審核及安全性審核，按不同自媒體成文方式進(jìn)行修改。但應(yīng)值得注意的是“爬蟲技術(shù)+算法”所產(chǎn)出的智能編輯并不能完全替代人工編輯，主要原因是算法在與環(huán)境的互動(dòng)當(dāng)中會(huì)不斷自我進(jìn)化，而這種進(jìn)化多是依據(jù)已有的參數(shù)目標(biāo)進(jìn)行，很容易在非主觀的情況下產(chǎn)生新聞倫理失范行為，即算法歧視、缺乏人文關(guān)懷精神的新聞稿件。所以，當(dāng)下智能寫作機(jī)器人還是較多應(yīng)用于地震災(zāi)難新聞和財(cái)經(jīng)數(shù)據(jù)新聞，而面對(duì)社會(huì)民生類新聞當(dāng)下仍然是以智能寫作機(jī)器人輔助人工編輯為主。

（三）內(nèi)容審核：“內(nèi)容庫”和“表現(xiàn)形式”精準(zhǔn)化識(shí)別

傳統(tǒng)的新聞審核容易出現(xiàn)新聞來源審查難（非官方的新聞來源真假難以辨別）、新聞稿件數(shù)量大、人工成本較高、人工審核偏見（個(gè)人閱歷及價(jià)值觀的不同）等問題，導(dǎo)致傳統(tǒng)的新聞審核時(shí)長滯后于新聞發(fā)布。審核周期過長影響新聞發(fā)布的及時(shí)性，長此以往也會(huì)削弱傳統(tǒng)媒體的行業(yè)地位，導(dǎo)致其賴以生存的訂閱量逐步下降。在當(dāng)前大數(shù)據(jù)時(shí)代“爬蟲技術(shù)+算法”所形成的智能把關(guān)模式為新聞審核階段保駕護(hù)航，“內(nèi)容庫”和“表現(xiàn)形式”的審核機(jī)制可以高效率地篩選、攔截、撤回內(nèi)容有偏差的新聞稿件。新聞聚合平臺(tái)均有其專屬的“內(nèi)容庫”，在具體的新聞審核過程中，以內(nèi)容庫內(nèi)的主體、關(guān)鍵詞、關(guān)鍵數(shù)據(jù)等為主要依據(jù)，對(duì)待審查的新聞稿件相關(guān)內(nèi)容自動(dòng)標(biāo)紅，將不符合內(nèi)容規(guī)范的新聞稿件撤回并重新發(fā)至發(fā)稿人處，提醒其問題所在并推薦重新編輯后再度上傳。而針對(duì)“表現(xiàn)形式”進(jìn)行新聞審核，主要在于判斷新聞稿件內(nèi)的照片、視頻、H5、超鏈接等是否符合其所投稿的新聞版塊及是否符合其新聞主題，若內(nèi)容違規(guī)或不符主題則同樣撤回。智能把關(guān)模式也會(huì)實(shí)時(shí)審核已發(fā)布稿件，針對(duì)違規(guī)的已發(fā)布稿件進(jìn)行自動(dòng)撤回，保障新聞內(nèi)容的合法性和新聞聚合平臺(tái)的核心競爭力。

（四）新聞分發(fā)：適配用戶個(gè)人特征利用“Python+”推薦新聞

算法推薦新聞即利用“Python+算法工具”分析使用者個(gè)人用戶畫像從而將適配于各個(gè)用戶的不同新聞內(nèi)容進(jìn)行精準(zhǔn)分發(fā)，也可以理解為利用算法工具滿足不同用戶的個(gè)性化需求。算法推薦新聞這種新聞分發(fā)方式，極大地解放勞動(dòng)力，使得新聞工作者可以專注于新聞生產(chǎn)的更多方面。算法推薦新聞的核心工具即爬蟲技術(shù)，該技術(shù)通過模擬人類行為，批量分析和處理大規(guī)模的新聞內(nèi)容數(shù)據(jù)?！敖袢疹^條”新聞聚合平臺(tái)作為國內(nèi)較為成熟的算法推薦新聞使用者，首先以爬蟲技術(shù)在互聯(lián)網(wǎng)中大量收集、分析數(shù)據(jù)，并以貼標(biāo)簽的形式將不同類型的新聞內(nèi)容進(jìn)行打包分類。隨后跟蹤用戶的平臺(tái)使用習(xí)慣如頁面停留時(shí)間、喜好領(lǐng)域、當(dāng)前定位所在地等信息對(duì)用戶形成一個(gè)基本的用戶畫像，將分類編排好的新聞內(nèi)容包按照用戶的個(gè)人畫像進(jìn)行個(gè)性化分發(fā)，滿足用戶需求。而其中較為隱私的信息如地點(diǎn)、性別、收入、學(xué)歷等個(gè)人身份特征信息通常平臺(tái)在收集時(shí)會(huì)對(duì)用戶進(jìn)行事先詢問，征求同意與否。

四、負(fù)能表現(xiàn)：數(shù)字爬蟲技術(shù)不當(dāng)使用下的倫理危機(jī)

技術(shù)倫理，即對(duì)技術(shù)行為進(jìn)行倫理導(dǎo)向，通過倫理干預(yù)，使技術(shù)活動(dòng)在科技視角之外，更要考慮技術(shù)的目標(biāo)、手段及其后果的正當(dāng)性。以反爬蟲技術(shù)為例，針對(duì)過度數(shù)據(jù)挖掘或可能暴露用戶隱私數(shù)據(jù)的行為，編輯算法對(duì)爬取行為進(jìn)行反制，將數(shù)據(jù)挖取保持在一個(gè)合理的界限之內(nèi)。

諸如“今日頭條”“一點(diǎn)資訊”“財(cái)新APP”等多種不同類型的新聞聚合平臺(tái)，通過定位推送同城信息、根據(jù)個(gè)人喜好進(jìn)行個(gè)性化推送、用戶自選興趣領(lǐng)域等人性化功能，為人們的生活帶來了便利。但因新聞聚合平臺(tái)技術(shù)濫用所導(dǎo)致的問題層出不窮，不論是破壞行業(yè)格局還是捆綁脅迫收集用戶隱私，此類問題不僅涉及技術(shù)越界，更產(chǎn)生了法律糾紛。本文通過定性研究方式對(duì)數(shù)字爬蟲技術(shù)所導(dǎo)致的事件現(xiàn)象、社會(huì)行為及倫理問題進(jìn)行分析。

（一）市場糾紛：過度數(shù)據(jù)抓取影響行業(yè)生態(tài)

在數(shù)字經(jīng)濟(jì)時(shí)代，數(shù)據(jù)的互聯(lián)、共享不僅給平臺(tái)競爭賦入新的競爭優(yōu)勢，以此進(jìn)化出的新競爭優(yōu)勢更加便利于用戶的日常使用。而各個(gè)互聯(lián)網(wǎng)平臺(tái)之間的數(shù)據(jù)抓取主要依賴于算法的核心工具，即爬蟲技術(shù)。

但爬蟲技術(shù)的不正當(dāng)使用也帶來一系列違背行業(yè)規(guī)則更甚觸碰法律的行為?；ヂ?lián)網(wǎng)平臺(tái)內(nèi)有大量由用戶自主上傳生成的數(shù)據(jù)內(nèi)容，盡管“UGC”內(nèi)容權(quán)屬存在爭議［5］，但肆意抓取不但消耗個(gè)人用戶的創(chuàng)作熱情，并且對(duì)其他競品平臺(tái)在行業(yè)內(nèi)的地位也產(chǎn)生影響。通過抓取競品平臺(tái)公開、免費(fèi)的數(shù)據(jù)資源從而鞏固自身利益，逐步替代原平臺(tái)在行業(yè)中的競爭優(yōu)勢，在行業(yè)中形成壟斷，這種“搭便車”的行為無疑破壞了行業(yè)生態(tài)，對(duì)其他平臺(tái)產(chǎn)生不正當(dāng)競爭。如此前深圳市中級(jí)人民法院審理的“酷米客”訴“車來了”案，“車來了”平臺(tái)通過爬取“酷米客”平臺(tái)上的公共交通數(shù)據(jù)資源轉(zhuǎn)為己用，是一種典型的搭便車行為，“酷米客”所投入的時(shí)間、人工、經(jīng)濟(jì)成本無法得到補(bǔ)償。需要注意的是，兩家平臺(tái)同擁有為用戶提供當(dāng)前公共交通定位實(shí)時(shí)查詢的功能，“車來了”的不正當(dāng)競爭行為損害了“酷米客”的商業(yè)利益，理應(yīng)做出相應(yīng)的賠償。

需要注意的是，當(dāng)爬取到其他平臺(tái)內(nèi)部尚未公開或已署名“獨(dú)家發(fā)布”的數(shù)據(jù)時(shí)，會(huì)進(jìn)一步產(chǎn)生產(chǎn)權(quán)糾紛，而不僅僅是不正當(dāng)競爭的問題。并且“Python+算法”生成的智能機(jī)器人根據(jù)互聯(lián)網(wǎng)資源所創(chuàng)作的新聞產(chǎn)品是否具有原創(chuàng)著作權(quán)？當(dāng)智能機(jī)器人所創(chuàng)作的新聞產(chǎn)品被他人盜用時(shí)是否觸犯了智能機(jī)器人的著作權(quán)？又或當(dāng)其他平臺(tái)的智能機(jī)器人剽竊了同競品平臺(tái)的智能機(jī)器人作品時(shí)該如何定義此類案件的侵權(quán)行為？這些問題也亟待解決。

（二）階層固化：算法推薦新聞限制用戶自身視野

信息時(shí)代下的信息差決定著經(jīng)濟(jì)差，而算法推薦新聞在無形中限制人的視野的同時(shí)也在鞏固著社會(huì)階級(jí)關(guān)系，精英階層與社會(huì)底層可以接收到的信息在數(shù)字時(shí)代不但沒有縮小彼此之間的數(shù)字鴻溝，反而加大了兩個(gè)階層之間的差距。以新聞聚合平臺(tái)為例，當(dāng)用戶打開新聞聚合平臺(tái)時(shí)，第一眼在首頁中所看到的即是與自己興趣相關(guān)或者當(dāng)前定位相關(guān)的新聞內(nèi)容，這種內(nèi)容選擇性呈現(xiàn)方式表面看似幫助用戶節(jié)省時(shí)間且內(nèi)容種類多樣，但實(shí)際上用戶所接受到的由算法推薦的新聞多是算法通過識(shí)別用戶畫像進(jìn)而將分類打包好的新聞內(nèi)容投送至用戶處。這種默默無聞的新聞推送方式表面看似便捷多元化，但實(shí)際逐漸限制了用戶視野。大多數(shù)用戶都會(huì)遭遇到一類情形，即在某新聞平臺(tái)長期使用后，其用戶特征已被平臺(tái)算法進(jìn)行精準(zhǔn)定位很難在除了自身主動(dòng)搜索訊息以外的情況下獲得不同層面的新聞內(nèi)容。而想要修改已生成的用戶畫像已十分困難，在面對(duì)已不感興趣卻頻繁接受推送的新聞內(nèi)容時(shí)，用戶難免產(chǎn)生放棄平臺(tái)或麻木的心態(tài)。

產(chǎn)生此類現(xiàn)象的主要原因在于，精英階層有著足夠的經(jīng)濟(jì)儲(chǔ)備量和廣泛的社交范圍，其群體不需要僅僅通過社交媒體或新聞聚合平臺(tái)來獲取最新的信息。算法推薦可以限制其網(wǎng)絡(luò)上的視野，但在實(shí)際生活當(dāng)中精英階層有著更多的信息來源渠道，以及足夠的金錢去支撐他們接觸新的視野和培養(yǎng)新的愛好。但針對(duì)于底層人民而言，缺乏時(shí)間、金錢與高壓力是此類人群的主要特征，該群體的日常消磨時(shí)間方式多放在了社交媒體或新聞聚合平臺(tái)上。但隨著算法與環(huán)境不斷互動(dòng)形成其個(gè)人用戶畫像后，該類群體僅剩的拓展知識(shí)層面與個(gè)人視野的渠道也被限制。這樣的算法控制會(huì)逐漸拉大精英階層與底層之間的知識(shí)鴻溝與經(jīng)濟(jì)差，無法實(shí)現(xiàn)階級(jí)越遷的底層人民會(huì)被固化在自己所固有的社會(huì)地位里，久而久之這種情形對(duì)社會(huì)結(jié)構(gòu)的穩(wěn)定會(huì)產(chǎn)生一定的影響。

（三）隱私侵犯：Python算法黑箱下的實(shí)時(shí)監(jiān)控

基于爬蟲技術(shù)算法“黑箱”的存在，用戶隱私侵犯問題使用戶感到焦慮。［6］算法“黑箱”是指算法內(nèi)部運(yùn)行機(jī)制過于復(fù)雜，以至于算法推薦新聞過程能夠使用算法卻無法具體了解算法編程的內(nèi)容和結(jié)構(gòu)的現(xiàn)象。［7］算法黑箱的實(shí)時(shí)監(jiān)控下，用戶個(gè)人如同“衣不遮體”般暴露在互聯(lián)網(wǎng)平臺(tái)面前，導(dǎo)致用戶雖知算法監(jiān)控的存在但卻又無可奈何。

很多新聞聚合平臺(tái)利用自身功能的必需性來對(duì)使用者隱私進(jìn)行捆綁威脅，若使用者未同意平臺(tái)所給予的條款則會(huì)被限制使用其產(chǎn)品的部分功能。這種算法權(quán)利的越位對(duì)使用者產(chǎn)生了很大的影響，大多使用者并不是不愿意公布自身的隱私，而是害怕隱私上交之后能否被合理保護(hù)以及被索取隱私的目的是為何，這些問題都是需要算法權(quán)利的掌控者所需要回答的。2021年5月，國家網(wǎng)信辦曾通報(bào)百度等105款A(yù)PP侵犯用戶個(gè)人隱私的現(xiàn)象。這些APP均存在未經(jīng)用戶同意收集使用個(gè)人信息以及未按法律更正個(gè)人信息等問題，搜狗輸入法、訊飛輸入法、QQ輸入法等市場份額較高的輸入法也包含在內(nèi)，可見問題之普遍。

（四）主體模糊：技術(shù)人員由幕后走進(jìn)臺(tái)前，承責(zé)主體模糊

在當(dāng)前智能技術(shù)時(shí)代，技術(shù)人員以技術(shù)開發(fā)者、平臺(tái)運(yùn)營者等身份由幕后走上了臺(tái)前，承責(zé)主體劃分標(biāo)準(zhǔn)主要以與算法倫理問題之間的關(guān)系密切程度進(jìn)行劃分。技術(shù)開發(fā)者作為算法的創(chuàng)造者理應(yīng)成為承責(zé)主體之一，平臺(tái)運(yùn)營者通常承擔(dān)算法目的規(guī)劃師的職責(zé)也被包含于承責(zé)主體之一，平臺(tái)本身作為算法最大的受益方則也作為承責(zé)主體之一。將技術(shù)開發(fā)者、平臺(tái)運(yùn)營者、平臺(tái)本身作為承責(zé)主體同樣囊括于新聞傳播倫理規(guī)范中，這對(duì)新聞倫理失范問題進(jìn)行責(zé)任主體問責(zé)產(chǎn)生了一定的阻礙，究其原因在于難以判斷失責(zé)主體是否主觀所為。在傳統(tǒng)的新聞傳播活動(dòng)中，“采、編、發(fā)”新聞生產(chǎn)流程多是以人工為主、機(jī)器為輔的方式進(jìn)行。當(dāng)某一環(huán)節(jié)出現(xiàn)問題時(shí)，便可以按照內(nèi)部管理機(jī)制進(jìn)行主要責(zé)任人的問責(zé)，整體流程清晰而迅速。但在當(dāng)下智能時(shí)代，由算法產(chǎn)生的新聞倫理問題通常會(huì)以兩種形式出現(xiàn)，即主觀與非主觀。

算法產(chǎn)生倫理問題時(shí)，主觀情況下則多與算法開發(fā)的技術(shù)人員有關(guān)。其中涉及技術(shù)人員的新聞道德、個(gè)人主觀、經(jīng)濟(jì)效益等多種因素。但如何判定算法主觀失誤是一個(gè)沒有界限的問題，因?yàn)樵诋?dāng)前的“弱智能”時(shí)代，算法多是作為一種工具而非獨(dú)立個(gè)體，即算法只具備與環(huán)境之間的互動(dòng)進(jìn)化而不具備自我意識(shí)，所以算法的純主觀失誤很難出現(xiàn)。

而當(dāng)算法出現(xiàn)非主觀失誤時(shí)，其問責(zé)對(duì)象則變得比較模糊。首先，算法由技術(shù)人員開發(fā)而成，而這之中必然包含了算法開發(fā)人員自身不可避免的立場與偏見，在算法的不斷使用過程中這種偏見會(huì)以“技術(shù)中立”的形象推送至用戶面前。其次，互聯(lián)網(wǎng)平臺(tái)同樣也具有其經(jīng)營目標(biāo)，這一目標(biāo)同樣會(huì)施壓于技術(shù)開發(fā)人員從而成為算法的一部分。所以在具體承責(zé)方面具有主體模糊以及主次不分的問題。

現(xiàn)有的法律框架難以對(duì)此類新聞倫理失范問題進(jìn)行責(zé)任主體問責(zé)。主要原因在于：第一，在技術(shù)合理使用制度條件下，哪種技術(shù)的使用是符合超規(guī)格使用例外的，而且如何判定算法的主觀與非主觀失誤；第二，技術(shù)開發(fā)人員缺乏一定的新聞倫理常識(shí)，多是按照平臺(tái)所給予的規(guī)定進(jìn)行算法設(shè)計(jì)。而平臺(tái)也有自身生存下去的經(jīng)營目標(biāo)，法律適用時(shí)在平臺(tái)生存與新聞倫理尊嚴(yán)之間難以抉擇，所以針對(duì)智能新聞倫理案件時(shí)的責(zé)任主體定責(zé)相對(duì)模糊。

五、治理路徑：新聞聚合平臺(tái)數(shù)字爬蟲技術(shù)倫理危機(jī)的應(yīng)對(duì)方案

新聞聚合平臺(tái)的技術(shù)濫用產(chǎn)生的技術(shù)倫理危機(jī)對(duì)行業(yè)生態(tài)、新聞倫理、傳媒結(jié)構(gòu)等形成了一系列負(fù)能影響，為應(yīng)對(duì)此趨勢理探討一種有效的治理路徑。從技術(shù)倫理的控制目標(biāo)來說，技術(shù)倫理并非要限制技術(shù)的發(fā)展，而是要使作為人類行為產(chǎn)物的技術(shù)活動(dòng)，在人類社會(huì)倫理范疇內(nèi)運(yùn)行。為此，盛國榮（2010）［8］提出，對(duì)技術(shù)倫理的控制必須充分考慮以下幾個(gè)命題：一是科技方法可能改變了人類的環(huán)境以及傳統(tǒng)倫理觀念在世界中的適用性，這種適用性需要技術(shù)倫理的跟蹤；二是涉及人們對(duì)技術(shù)破壞倫理的思考路徑問題；三是涉及人們對(duì)自然的倫理關(guān)系的認(rèn)識(shí)問題；四是涉及人們的新倫理建構(gòu)問題，即新的倫理產(chǎn)生之后如何建立起一套新的倫理原則和標(biāo)準(zhǔn)。理應(yīng)從不同角度出發(fā)思考對(duì)技術(shù)倫理的控制，在原有的倫理結(jié)構(gòu)基礎(chǔ)上進(jìn)行破局再建構(gòu)，新聞聚合平臺(tái)所產(chǎn)生的智能倫理問題不僅要從現(xiàn)有的法律、人文角度出發(fā)，也要主動(dòng)探索新的技術(shù)治理路徑和治理理念，平衡現(xiàn)有主體與新入主體之間的利益流動(dòng)，從而推動(dòng)新聞聚合平臺(tái)的健康發(fā)展。

（一）法律角度：建立新聞出版者鄰接權(quán)，維護(hù)行業(yè)生態(tài)

當(dāng)前，我國針對(duì)新聞出版者保護(hù)以及應(yīng)對(duì)新聞聚合平臺(tái)民事糾紛所采用的法律框架為《著作權(quán)法》和《不正當(dāng)競爭法》，但二者之間的缺陷也極其明顯。2018年歐盟正式通過《數(shù)字化單一市場版權(quán)指令》法案，該法案中最具爭議性的一點(diǎn)即在于互聯(lián)網(wǎng)平臺(tái)通過以摘要或鏈接的形式轉(zhuǎn)載其他媒體平臺(tái)的內(nèi)容時(shí)需不需要支付一定的費(fèi)用。這對(duì)于探討我國新聞出版者鄰接權(quán)問題具有很大的啟示作用。

在新聞聚合平臺(tái)民事糾紛案件中，爬蟲技術(shù)所涉及的新聞作品與新聞出版者數(shù)量繁多，眾多被侵權(quán)方需一一佐證其對(duì)作品享有著作權(quán)，這使維權(quán)方的維權(quán)成本陡然升高，維權(quán)方成為了被“為難”的一方。結(jié)合我國國情創(chuàng)建新聞出版者鄰接權(quán)主要要義在于加強(qiáng)新聞著作權(quán)的內(nèi)容保護(hù)，保障新聞出版者的合法權(quán)利，以維護(hù)新聞專業(yè)權(quán)威?？蓪⑿侣劤霭嬲哙徑訖?quán)解釋為“保護(hù)新聞出版者的腦力勞動(dòng)，新聞作品蘊(yùn)含了新聞出版者的人工成本、時(shí)間成本，如果被他人免費(fèi)使用則會(huì)降低新聞出版者的生產(chǎn)積極性，不利于新聞?lì)I(lǐng)域的發(fā)展”（辜凌云2019）。這一權(quán)利在當(dāng)前智能時(shí)代適用，可以為那些不具備“獨(dú)創(chuàng)性”的作品提供有力保障，保護(hù)新聞出版者的合法知識(shí)勞動(dòng)。

《不正當(dāng)競爭法》則是一種兜底性的法律保護(hù)措施，具有事后調(diào)整、個(gè)案調(diào)整以及證明責(zé)任較重的缺點(diǎn)。具體體現(xiàn)在信息平臺(tái)之間的“搭便車”行為，如一些網(wǎng)站在不經(jīng)允許的情況下擅自將其他信息平臺(tái)的數(shù)據(jù)進(jìn)行數(shù)字化處理推送給自家網(wǎng)站的用戶?；蛞浴百N摘要”“掛鏈接”的形式表面指明數(shù)據(jù)的從屬方，但實(shí)際所摘取的信息已滿足自身網(wǎng)站用戶需求而導(dǎo)致數(shù)據(jù)從屬方丟失大量點(diǎn)擊率、廣告商以及用戶量，造成行業(yè)之間的不正當(dāng)競爭。而新聞出版鄰接權(quán)可以有效防止新聞聚合平臺(tái)的肆意“搭便車”行為，法令中對(duì)“鏈接行為”有著明確的要求，即使用鏈接方需獲得被鏈接方的許可并支付一定的費(fèi)用，使得新聞工作者的知識(shí)產(chǎn)品獲得了有效保障，避免傳統(tǒng)媒體行業(yè)淪為互聯(lián)網(wǎng)平臺(tái)內(nèi)容制造機(jī)的尷尬局面。同時(shí)也為傳統(tǒng)媒體行業(yè)提供新的生存路徑，即發(fā)展高質(zhì)量的新聞內(nèi)容作品，形成內(nèi)容為王的核心品牌價(jià)值，實(shí)現(xiàn)內(nèi)容變現(xiàn)。

（二）科技角度：平臺(tái)創(chuàng)新算法運(yùn)作方式，提防算法的隱私侵犯

當(dāng)前我們?nèi)蕴幱凇叭跞斯ぶ悄軙r(shí)代”，算法的智能化水平比較有限，但算法作為一個(gè)擁有極大發(fā)展?jié)摿Φ男屡d技術(shù)，其對(duì)人類產(chǎn)生愈發(fā)強(qiáng)烈的影響，無疑是一種時(shí)代趨勢。在對(duì)算法技術(shù)的規(guī)制中，多元主體的協(xié)同并進(jìn)是必不可少的?！秶鴦?wù)院關(guān)于印發(fā)新一代人工智能發(fā)展規(guī)劃的通知》提出，要建立健全公開透明的人工智能監(jiān)督管理體系，實(shí)現(xiàn)對(duì)智能算法的全過程監(jiān)管。尤其是算法開發(fā)平臺(tái)作為算法技術(shù)的主體擁有者，其在算法技術(shù)治理環(huán)節(jié)中占有絕對(duì)地位，而平臺(tái)在此環(huán)節(jié)中所要履行的則是其技術(shù)職責(zé)。從技術(shù)緯度出發(fā)，以算法監(jiān)督算法是一種有效應(yīng)對(duì)算法倫理問題的解決辦法。［9］

首先，建立健全算法風(fēng)險(xiǎn)預(yù)防機(jī)制［10］，即技術(shù)開發(fā)人員通過設(shè)定具備治理算法功能的算法機(jī)制實(shí)時(shí)監(jiān)控日常平臺(tái)系統(tǒng)的運(yùn)行。當(dāng)算法運(yùn)行出現(xiàn)失誤時(shí)由系統(tǒng)自動(dòng)進(jìn)行矯正，將算法恢復(fù)初識(shí)默認(rèn)值進(jìn)行重新循環(huán)。其次，算法開發(fā)人員可以將自己的源代碼進(jìn)行開源式設(shè)計(jì)，邀請(qǐng)代表用戶參與整體算法的設(shè)計(jì)，這樣既能滿足大部分使用者需求，也可令算法開發(fā)過程透明、公開，使使用者了解算法開發(fā)的意圖、用法。最后，可以采用智能芯片植入的方式令智能機(jī)器人獲得相關(guān)的新聞倫理與底線思維，雖然智能新聞倫理失范并非硬性法則便可治理一切問題，但通過智能芯片的植入可以對(duì)大部分新聞聚合平臺(tái)侵權(quán)糾紛進(jìn)行預(yù)防，當(dāng)智能識(shí)別此行為可能違反芯片內(nèi)所包含的硬性規(guī)則，算法則會(huì)進(jìn)行自我矯正。

（三）機(jī)器行為學(xué)角度：構(gòu)建風(fēng)險(xiǎn)評(píng)估框架，發(fā)展風(fēng)險(xiǎn)管理工具

“機(jī)器行為學(xué)”中的“機(jī)器”并不單單指工廠內(nèi)部的生產(chǎn)設(shè)備亦或是具有實(shí)體形態(tài)的生產(chǎn)機(jī)器，其所指的是所有具有工具屬性的人造物或人造物構(gòu)成的人工現(xiàn)象。算法在當(dāng)前智能時(shí)代作為一種人造工具，其具有與實(shí)體環(huán)境之間不斷交互進(jìn)化的屬性，這種被環(huán)境改變的屬性則被稱為“權(quán)變性”。而算法不會(huì)完全融合于“權(quán)變性”的必然性，所以將算法看作機(jī)器的角度進(jìn)行行為分析有利于囊括盡可能多的風(fēng)險(xiǎn)因素，對(duì)當(dāng)前的算法治理原則進(jìn)行修改。

當(dāng)前算法風(fēng)險(xiǎn)治理缺乏一種整體的理論框架為指導(dǎo)，不能針對(duì)算法各個(gè)風(fēng)險(xiǎn)因素產(chǎn)生很好的關(guān)聯(lián)性從而建構(gòu)風(fēng)險(xiǎn)治理框架。從機(jī)器行為學(xué)的角度理解算法可以從觸發(fā)、開發(fā)、功能和進(jìn)化四個(gè)角度入手，以一個(gè)算法生命周期為基準(zhǔn)構(gòu)建新的算法治理理論框架。從觸發(fā)、開發(fā)、功能和進(jìn)化等不同環(huán)節(jié)入手，分析每一環(huán)節(jié)中風(fēng)險(xiǎn)因素的關(guān)聯(lián)性，可以為風(fēng)險(xiǎn)治理框架提供依據(jù)，更多角度的為算法治理制度創(chuàng)新提供可能。

過去傳統(tǒng)算法治理策略中多將“算法”看作為單獨(dú)的技術(shù)個(gè)體而拎出來單獨(dú)研究，形成了“頭痛醫(yī)頭，腳痛醫(yī)腳”的片面監(jiān)管方式。而機(jī)器行為學(xué)則更多從“技術(shù)-環(huán)境”“技術(shù)-個(gè)體”的視角進(jìn)行問題研究，更加方便針對(duì)算法自身進(jìn)化而導(dǎo)致的一系列倫理問題。如算法推薦引擎在給用戶推薦新聞的同時(shí)，也在通過篩選點(diǎn)擊率、頁面停留時(shí)間等客觀指標(biāo)不斷優(yōu)化操作指令。當(dāng)人們?cè)谒阉鳌鞍兹恕睍r(shí)所關(guān)聯(lián)的內(nèi)容較為中性，而在搜索“黑人”時(shí)則會(huì)更多與犯罪有所關(guān)聯(lián)。這并非算法本身技術(shù)設(shè)定的算法歧視，而是在與環(huán)境的交互中衍生出來的。所以算法治理的范疇?wèi)?yīng)進(jìn)一步擴(kuò)大，以更全面地囊括可能發(fā)生治理風(fēng)險(xiǎn)的因素。

總的來說，若從“機(jī)器行為學(xué)”角度出發(fā)探討算法治理框架，前者是從算法生命周期著手，從觸發(fā)、開發(fā)、功能、進(jìn)化四個(gè)議題展開；而后者則更多從“算法-群體”“算法-環(huán)境”等人機(jī)混合層面。基于此框架我們既可以對(duì)當(dāng)前眾多的算法治理原則或規(guī)范進(jìn)行評(píng)估以明確其遺漏所在，同時(shí)也可以對(duì)不同利益相關(guān)體的不同偏好作出對(duì)應(yīng)分析，以更好理解各方的優(yōu)勢與不足。

（四）平臺(tái)管理角度：建議嚴(yán)格懲罰細(xì)則，分清承責(zé)主體次序

當(dāng)前所存在的一個(gè)問題是，企業(yè)內(nèi)部承責(zé)制度不明晰，未能很好地將法律制度、技術(shù)治理、行業(yè)規(guī)范融合進(jìn)企業(yè)內(nèi)部條例，使得平臺(tái)治理方在處理企業(yè)內(nèi)部出現(xiàn)的智能倫理問題時(shí)所采用的方式較為滯后。

2021年9月15日，國家互聯(lián)網(wǎng)信息辦公室發(fā)布《關(guān)于進(jìn)一步壓實(shí)網(wǎng)站平臺(tái)信息內(nèi)容主體責(zé)任的意見》，旨在充分發(fā)揮網(wǎng)站平臺(tái)信息內(nèi)容管理第一責(zé)任人作用，引導(dǎo)推動(dòng)網(wǎng)站平臺(tái)準(zhǔn)確把握主體責(zé)任。新聞聚合平臺(tái)應(yīng)將外部規(guī)制與內(nèi)部規(guī)制雙結(jié)合，以政策、法律、行規(guī)作為外因，以效益、價(jià)值觀作為內(nèi)因?qū)φw企業(yè)承責(zé)制度進(jìn)行嚴(yán)格化重建。

具體可以體現(xiàn)：首先，建立由層級(jí)逐漸向下延伸的懲罰辦法，通過層級(jí)管理的方式進(jìn)行命令下達(dá)與審核，從源頭杜絕可能產(chǎn)生新聞倫理問題的一切風(fēng)險(xiǎn)，并將法律制度與公司條例相結(jié)合，涉及法律底線的行為將會(huì)直接移送司法處理；其次，由部門審核指定既具有新聞專業(yè)知識(shí)又具備技術(shù)開發(fā)的人員來進(jìn)行關(guān)前和關(guān)后的審核工作，做到以技術(shù)治理技術(shù)。內(nèi)部規(guī)則將代碼問題與員工個(gè)人效益直接掛鉤，既可以杜絕社會(huì)效益讓位于經(jīng)濟(jì)效益的問題，也在一定程度上實(shí)現(xiàn)了企業(yè)內(nèi)部的自控能力與社會(huì)責(zé)任承擔(dān)功能。

六、結(jié)語

技術(shù)本身無所謂對(duì)錯(cuò)，主要在于技術(shù)的使用者以及技術(shù)的使用程度。在當(dāng)前的“技術(shù)大航海”時(shí)代，互聯(lián)網(wǎng)平臺(tái)已經(jīng)成為信息社會(huì)的重要基礎(chǔ)設(shè)施，并逐步滲透到現(xiàn)行的社會(huì)運(yùn)行與制度制定中。作為網(wǎng)民獲取信息的社會(huì)公器，新聞聚合平臺(tái)理應(yīng)承擔(dān)起應(yīng)有的社會(huì)責(zé)任，形成自身中立、獨(dú)立、高質(zhì)、高效的品牌價(jià)值。但隨著資本的注入與技術(shù)的濫用，新聞聚合平臺(tái)逐漸模糊自身定位，在社會(huì)公器與私人商域之間搖擺不定。

新聞聚合平臺(tái)應(yīng)時(shí)刻牢記自身“公共性”的內(nèi)涵，要承擔(dān)起社會(huì)公器所應(yīng)該承擔(dān)的責(zé)任，與傳統(tǒng)媒體相互協(xié)作，做好優(yōu)質(zhì)新聞作品的傳聲筒以及利用自身高效的連接性維護(hù)新聞行業(yè)的生態(tài)穩(wěn)定。充分利用自身的技術(shù)優(yōu)勢，做好數(shù)字新聞版權(quán)保護(hù)和優(yōu)質(zhì)原創(chuàng)內(nèi)容的產(chǎn)出，保證優(yōu)質(zhì)新聞內(nèi)容的流通，打破社會(huì)輿論結(jié)構(gòu)的圈層化現(xiàn)象。開拓?cái)?shù)字新聞新局面的同時(shí)，也理應(yīng)注意到新聞聚合平臺(tái)的生存來源在于商業(yè)收益，不能過分追求其承擔(dān)社會(huì)責(zé)任而損害了新聞聚合平臺(tái)的商業(yè)利益，那么如何平衡好商業(yè)私域與價(jià)值公器成為未來需要探討的一個(gè)問題。

針對(duì)新聞聚合平臺(tái)的技術(shù)治理是一個(gè)多元主體多維度共同任務(wù)，需要平臺(tái)、法律、行政、用戶等多主體的相互協(xié)作。在未來的實(shí)際操作中，不能傳統(tǒng)的將技術(shù)視作為單一個(gè)體，而要從宏觀的角度將其與環(huán)境、群體聯(lián)系起來，視為一個(gè)具有生命、可自我進(jìn)化的人工技術(shù)，只有在這種視野下建構(gòu)的技術(shù)治理理論框架才能承擔(dān)并抵御更多可能性因素的風(fēng)險(xiǎn)。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡