郭運滔 韓兵
(1.戰(zhàn)略支援部隊信息工程大學 河南鄭州 450001;2. 32727部隊)
開源情報工作是通過公開、合法的方式從公開來源獲取信息,并進行加工、提煉獲取情報的過程[1]。新聞媒體是開源情報的重要來源,人工智能技術在新聞領域得到廣泛應用,這對開源情報工作構成了重大影響。
當前人工智能已廣泛應用于國內外新聞工作的各業(yè)務環(huán)節(jié)[2],基本涵蓋了從選題策劃、內容生產到產品分發(fā)等全過程[3]。
在選題策劃階段,人工智能可以幫助發(fā)現(xiàn)具有潛在新聞價值的話題和事件,進而提供新聞創(chuàng)作思路。傳統(tǒng)的選題策劃主要依賴經驗和靈感,現(xiàn)在則更多地借助人工智能和大數(shù)據(jù)技術收集信息、挖掘線索。人工智能可以快速地提取核心觀點、事件發(fā)展趨勢、輿論情感導向、分析事件傳播路徑,讓新聞生產者迅速了解整個事件的來龍去脈,提供創(chuàng)作思路,從而縮減創(chuàng)作的時間,提高新聞價值[4]。
開發(fā)利用智能化的大數(shù)據(jù)平臺系統(tǒng),采集挖掘社交媒體數(shù)據(jù),監(jiān)測網絡輿情,捕捉網絡話題,是目前國內外主流媒體的普遍做法。這些平臺的功能模塊一般包括突發(fā)事件預警、新聞線索發(fā)現(xiàn)、新聞熱點發(fā)現(xiàn)、新聞事件核查、熱度走勢預測、新聞價值研判和輔助報道決策等。有的平臺能自動識別突發(fā)事件線索并高亮突出火災、爆炸、交通事故等事件信息,有的平臺能實時監(jiān)測分析互聯(lián)網信息來源、熱度走勢、地域分布等,有的平臺能捕捉熱點事件、分析發(fā)展趨勢并提出可操作的選題策劃建議[3]。以《紐時時報》為例,其機器人Blossom能通過社交媒體數(shù)據(jù)分析預測用戶關注度和事件的新聞價值,而另一款機器人Editor可以自動識別語義標簽并追蹤實時新聞要素數(shù)據(jù)[5]。
1.多模態(tài)信息處理
隨著機器學習技術的發(fā)展,智能化的文本、圖片、音頻、視頻等多模態(tài)信息處理技術目前已廣泛應用于新聞領域。各種人工智能技術組合搭配后形成了針對不同應用場景的信息處理工具,大幅度提升了新聞工作效率。語音識別、語音轉換和機器翻譯技術相結合可以實現(xiàn)語音轉文字和多語種實時轉寫,方便了訪談等錄音的整理。在智能標引、語音合成、語義檢索等技術支撐下,可以將文字稿直接轉換為視頻,并實現(xiàn)音視頻智能生成。計算機視覺和自動摘要等技術融合實現(xiàn)了視頻資料的識別與高效處理。數(shù)據(jù)可視化技術則可以更直觀地展示數(shù)據(jù)內涵,方便受眾理解新聞。
2.機器人寫作
寫稿機器人是一種基于算法的自動編寫新聞的計算機軟件程序[6],可以運用大數(shù)據(jù)分析和云計算技術從海量信息中篩選出有價值的內容,并結合自然語言處理技術以符合人類閱讀習慣的方式呈現(xiàn)。寫稿機器人主要有模板式、抽取式、生成式等三種內容生成方式,基于數(shù)據(jù)挖掘和算法優(yōu)化的模板式是目前應用最廣泛的一種[7]。寫稿機器人的一般工作流程包括建設內容數(shù)據(jù)庫、抓取或輸入相關報道素材、利用算法進行處理和分析、發(fā)現(xiàn)信息關聯(lián)和趨勢、確定新聞寫作角度和方向、自動選用寫作模板并生成新聞、內容審核和分發(fā)等。機器人寫作能大幅提升新聞生產速度,強化新聞生產的客觀性和數(shù)據(jù)的準確性,有利于讓記者和編輯從事更具理性沉思的深度報道和探討社會意義的人文寫作。
3.新聞內容校審
人工智能還應用于新聞事實核查和新聞內容校審。網絡虛假信息甄別技術是開展新聞事實核查的重要手段,目前主要有語言特征分析、社交網絡分析和圖像特征分析等三種智能核查方法,能從文字內容、傳播行為和圖像特征入手檢測信息的真實性[8]。新聞內容的校對質檢是自然語言處理技術在新聞領域的另一個應用場景,能有效提升校審效率。例如,新華社智能檢校機器人“較真”在傳統(tǒng)檢校軟件功能的基礎上應用了機器學習技術,可以實現(xiàn)人名自動識別、語言語法使用、語義搭配理解、知識辨別、邏輯搭配、日期規(guī)范及稿件電頭格式等方面的校驗功能[3]。
算法推薦技術應用于新聞分發(fā)環(huán)節(jié),有效提高了新聞分發(fā)速度和精準度。算法推薦有“用戶畫像”和“聊新聞”兩種實現(xiàn)模式。“用戶畫像”以召回算法和排序算法為基本算法原理[9],實踐中通過采集互聯(lián)網上用戶個人信息和使用“痕跡”數(shù)據(jù),分析公眾的個性化需求,進而繪制出因人而異的公眾日常生活圖譜和社交網絡圖譜,并在圖譜的“指導”下,自動在數(shù)據(jù)庫中進行信息檢索匹配后完成推送工作[10]。目前百度新聞和今日頭條都采用了類似的個性化推薦技術?!傲男侣劇蹦J绞怯萌斯ぶ悄芗夹g搭建一個聊天“機器人”,在聊天過程中通過關鍵詞提取和話語分析來獲知用戶的情感偏好和個人興趣,并向其推送相應的新聞信息。
新聞媒體智能化對開源情報工作的影響是全面的、深遠的和系統(tǒng)性的。
機器生成內容克服了人的部分生理限制,制造了豐富的開源情報素材。一是人工智能使新聞產出數(shù)量急劇增加。當前絕大部分新聞媒體都已經實現(xiàn)了電子化,很容易在線獲取[11]。人工智能應用于內容生產,催生了即時數(shù)據(jù)新聞、視覺新聞、互動新聞、自動化新聞、傳感器新聞等報道樣式[12]。這些新報道樣式在本質上都是以數(shù)據(jù)驅動新聞生產,通過對網絡海量數(shù)據(jù)信息的挖掘、統(tǒng)計和分析,找出數(shù)據(jù)間的相關性,發(fā)現(xiàn)新聞線索,確定報道選題并通過可視化的數(shù)據(jù)形式呈現(xiàn)新聞故事的新聞報道方式[10]。二是人工智能幫助豐富了新聞報道的角度。通過專題聚類可以對事件進行全方位描述,匯聚采集各方觀點,為更加全面地開展情報分析奠定了基礎。三是機器翻譯技術使新聞利用突破了語言限制。新聞媒體通常使用標準詞匯,遵循公式化的結構,因此機器翻譯新聞內容非常高效。
人工智能的應用提升了新聞的情報價值和效用,從中提煉出有價值情報的可能性越來越大。第一,人工智能提升了新聞的時效性。從新聞事件的發(fā)生到新聞報道發(fā)出的時間間隔被縮短至秒級,并且可以7×24小時不間斷工作,任何突發(fā)事件都會被迅速報道,極大地滿足了動向和態(tài)勢情報的監(jiān)控需求。第二,人工智能部分地減少了新聞生產過程中的主觀性影響?;跀?shù)據(jù)和算法的新聞生產方式,解放了人力,并在一定程度上消除了采編人員個人因素的影響。第三,人工智能可以更有效地對抗假新聞。在網絡環(huán)境中,假新聞形式多樣、識別困難,深度偽造等新技術的應用使局面更加復雜嚴峻,這種情況下只能寄希望于先進技術[13]。
新聞的智能化導致海量新聞當中無關信息、虛假信息充斥,同質化問題嚴重,增加了開源情報開發(fā)難度和成本。首先,新聞機構應用人工智能技術的水平參差不齊,甚至形成代差,導致新聞產出質量標準不一。其次,算法技術中隱藏著技術開發(fā)人員的算法偏見和利益相關者的經濟目標,影響新聞的客觀性。再次,智能推送導致產生“信息繭房”、回音室效應和群體極化效應,造成偏頗的信息內容和片面的信息來源充斥,少數(shù)派觀點被壓制。最后,新聞的海量增長要求增加人財物投入,使從業(yè)人員素質和軟硬件技術水平與開源情報發(fā)展要求相匹配。
人工智能技術的應用促進了新聞與開源情報的競爭與融合,并在客觀上提高了開源情報工作的標準與要求。一方面,人工智能應用于新聞,能更直接更便捷地滿足用戶的即時信息需求,從而導致開源情報用戶流失,體現(xiàn)出新聞對開源情報的競爭優(yōu)勢。另一方面,新聞與開源情報呈現(xiàn)明顯的交叉融合。盡管新聞與開源情報分屬傳播學和情報學兩個學科,但是在本質上都是信息,并且當前二者在研究對象、研究方法和應用領域的交叉越來越明顯。
要有效應對新聞智能化,開源情報工作應積極引進和改造相關新聞智能化技術,并創(chuàng)造性開發(fā)一些特色技術。
新聞是開源情報的基礎性來源。開源信息可以劃分為由機構產生的新聞媒體內容、灰色文獻和由個人產生的社交短文、社交長文,新聞媒體內容在采集、處理、利用和生產等開源情報業(yè)務流程當中的利用難度最小[11],可以視為開源情報的基礎。
新聞技術一般領先并引領開源情報技術發(fā)展。開源情報以特定情報用戶為服務對象,以服務決策為主要目標,因此多以行政化方式運作。新聞面向特定受眾群體,強調新聞的內容價值同時更強調新聞的傳播價值,市場化競爭更有利于新聞領域的技術創(chuàng)新。情報來源公開是開源情報的基本內涵,情報來源的變化與人類社會信息傳播媒介技術的發(fā)展緊密相關。例如,針對印刷媒體,開源情報的工作重點是編制索引、儲存和方便獲取書面信息,為此發(fā)展出了剪報技術,“一把剪刀、一瓶漿糊和一個資料柜”成為許多情報專家的標配。開源情報工作要應對新聞的智能化必須首先學習新聞的智能化。具體從實踐角度看,前文提到的新聞智能化應用幾乎都可以對應到開源情報具體流程當中,并能拓展應用于新聞之外的信息。例如,虛假新聞甄別技術可以應用于開源情報溯源查證等。
開源情報工作有其特殊性,在引進新聞智能化技術的同時需要結合實踐加以改造。比如新聞產品不能代替開源情報。新聞強調傳播價值,以有趣或有用的內容吸引人。開源情報更突出效用性和競爭性,而且在此基礎上會產生某些保密要求,因此可能需要增加保密功能模塊等內容。又如,內容上開源情報一般與國家安全相關,新聞涵蓋領域則更寬泛,具體的分析方法可能存在差異。再如,與采集新聞受眾的數(shù)據(jù)信息相比,情報用戶數(shù)據(jù)信息的采集存在較多限制,采用用戶畫像方式進行開源情報推送的可行性存疑。在具體的開源情報部門,智能化技術的引進和改造也應特別注意以現(xiàn)實需求為依據(jù)。
引進和改造智能化技術的同時,必須重視創(chuàng)造性開發(fā)。開源情報是大情報體系當中的一個門類,發(fā)揮著引導情報搜集和為秘密情報提供補充等作用。除了直接以產品服務用戶外,還有情報協(xié)同、多元情報融合等應用場景,這些場景是新聞工作中一般涉及不到的。人工智能技術還處于弱人工智能發(fā)展階段,與之關聯(lián)的數(shù)據(jù)、算法和算力等要素正在快速發(fā)展過程中。開源情報智能化技術創(chuàng)新應當緊跟新技術發(fā)展,結合服務特定應用場景進行開發(fā)。另外在開發(fā)過程中還必須警惕“技術崇拜”,注意及時預判和解決智能化技術可能帶來的負面影響。