司凱威
國(guó)家廣播電視總局二九三臺(tái) 河南省 鄭州市 451162
本文系統(tǒng)研究廣播電視節(jié)目在中短波、有線數(shù)字電視、地面無線數(shù)字電視、IPTV、互聯(lián)網(wǎng)電視、短視頻平臺(tái)、移動(dòng)應(yīng)用程序等平臺(tái)的傳播特點(diǎn),利用硬件虛擬化、數(shù)據(jù)安全傳輸、數(shù)據(jù)智能處理與存儲(chǔ)等技術(shù),搭建完成一體化的監(jiān)管平臺(tái)。利用網(wǎng)絡(luò)爬蟲、區(qū)塊鏈、特征識(shí)別、多源數(shù)據(jù)處理等技術(shù),構(gòu)建具有節(jié)目采集、指標(biāo)判斷、內(nèi)容識(shí)別、輿情分析、預(yù)警上報(bào)、信息傳遞等功能的應(yīng)用軟件,探索建立融媒體時(shí)代網(wǎng)絡(luò)化、智慧化、協(xié)同化的節(jié)目監(jiān)管新模式。
廣播電視機(jī)構(gòu)在不斷改善傳統(tǒng)傳播渠道覆蓋效果的基礎(chǔ)上,持續(xù)加大互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、IPTV、互聯(lián)網(wǎng)電視等新媒體的資金和人員投入,達(dá)到網(wǎng)上網(wǎng)下同步發(fā)力,大小屏聯(lián)動(dòng)傳播效果。以中央廣播電視總臺(tái)制作的冬奧會(huì)節(jié)目為例,通過中短波、調(diào)頻、衛(wèi)星、有線數(shù)字電視、地面無線數(shù)字電視等對(duì)全國(guó)進(jìn)行有效覆蓋,利用央視頻等客戶端,愛尚傳媒等IPTV 播控總平臺(tái)、互聯(lián)網(wǎng)電視播控平臺(tái)、微博和微信等社交軟件、快手和抖音等短視頻平臺(tái)等進(jìn)行網(wǎng)絡(luò)傳播。
在現(xiàn)代互聯(lián)網(wǎng)和通信技術(shù)的帶動(dòng)下,新媒體傳播廣播電視節(jié)目不再受制于頻率和時(shí)長(zhǎng),可將圖文、片花、花絮、動(dòng)畫等與節(jié)目進(jìn)行融合傳播。近年來,隨著信息推薦算法的興起和碎片化傳播能力的提升,廣播電視機(jī)構(gòu)開始建立融媒體創(chuàng)作中心,對(duì)節(jié)目資源進(jìn)行二次編輯和傳播,進(jìn)一步提升節(jié)目的影響力。以北京冬奧會(huì)的相關(guān)節(jié)目為例,網(wǎng)民不僅能看到直播節(jié)目,還能夠從多個(gè)渠道獲取賽事預(yù)告、選手信息、精彩視頻、網(wǎng)民評(píng)論等信息。
廣播電視媒體紛紛在社交軟件、短視頻平臺(tái)、客戶端等平臺(tái)開通了留言、評(píng)論等互動(dòng)專區(qū),為節(jié)目制作人員和受眾,受眾與受眾之間提供溝通和交流的平臺(tái),以便收集反饋意見和提升節(jié)目的影響力。
相對(duì)于廣播電視節(jié)目通過無線、有線、衛(wèi)星等傳統(tǒng)渠道進(jìn)行傳輸,新媒體的傳播渠道使用了大量新的播控和網(wǎng)絡(luò)設(shè)備,開放了遠(yuǎn)程維護(hù)端口,帶來了新的網(wǎng)絡(luò)安全隱患。
在確保網(wǎng)絡(luò)安全的情況下,為提升硬件資源的利用率、內(nèi)容提取和識(shí)別效率、監(jiān)管數(shù)據(jù)的存取速度、兼顧平臺(tái)靈活性和可擴(kuò)展性,將系統(tǒng)劃分為節(jié)目信息采集、數(shù)據(jù)安全傳輸、數(shù)據(jù)處理與存儲(chǔ)、數(shù)據(jù)應(yīng)用等4個(gè)子系統(tǒng),如圖1所示。
圖1 系統(tǒng)結(jié)構(gòu)示意圖
專網(wǎng)節(jié)目信息采集部分主要指中短波、調(diào)頻、有線數(shù)字電視、地面無線數(shù)字、IPTV 等監(jiān)測(cè)前端設(shè)備。該類設(shè)備一般由信號(hào)接收裝置、解調(diào)設(shè)備、音視頻錄像設(shè)備、控制主機(jī)、通信設(shè)備等組成,能夠?qū)崿F(xiàn)信號(hào)接收、信號(hào)測(cè)量、音視頻采集、EPG 讀取、網(wǎng)絡(luò)管理、數(shù)據(jù)庫管理等功能。因地域的限制,該類設(shè)備一般需要安裝在各個(gè)地市,通過電信運(yùn)營(yíng)商的數(shù)據(jù)專線與本地技術(shù)系統(tǒng)通信。
互聯(lián)網(wǎng)節(jié)目信息采集部分主要是利用本地服務(wù)器獲取視頻網(wǎng)站、互聯(lián)網(wǎng)電視、移動(dòng)客戶端、社交軟件、短視頻平臺(tái)等渠道的節(jié)目、標(biāo)題、評(píng)論、彈幕等信息。該類傳播渠道的節(jié)目信息一般具有數(shù)量多、內(nèi)容豐富、更新速度快、不受地域限制等特點(diǎn)。為防止長(zhǎng)時(shí)間、高頻次、大流量的數(shù)據(jù)抓取而被監(jiān)管對(duì)象封堵的情況,系統(tǒng)中使用了IP 地址代理等多種反封堵的技術(shù)。
協(xié)作單位節(jié)目信息采集部分主要指從廣播電視制作、播控、傳輸、監(jiān)測(cè)單位獲取節(jié)目審核信息。因協(xié)作單位的技術(shù)系統(tǒng)不完全相同,需分別設(shè)計(jì)單獨(dú)的通訊接口,以及時(shí)的獲取節(jié)目審核信息。在本系統(tǒng)中,使用區(qū)塊鏈的聯(lián)盟鏈的技術(shù),將廣播電視節(jié)目的名稱、時(shí)間、頻率、審核人等信息整合,以便于減少審核的成本和快速定位故障節(jié)點(diǎn)。
數(shù)據(jù)安全傳輸部分主要包括通信線路、網(wǎng)絡(luò)通信設(shè)備、網(wǎng)絡(luò)安全設(shè)備。為確保通信的穩(wěn)定性和安全性,在專網(wǎng)、互聯(lián)網(wǎng)節(jié)目信息采集中,使用了聯(lián)通、移動(dòng)、電信、有線等運(yùn)營(yíng)商的MSTP 專線。在與協(xié)作單位的數(shù)據(jù)通信中,使用虛擬專用網(wǎng)技術(shù),建立安全的數(shù)據(jù)傳輸通道。在系統(tǒng)內(nèi)部,使用兩臺(tái)千兆路由器和交換機(jī)確保設(shè)備間通信的速度。在優(yōu)化防火墻等安全策略的基礎(chǔ)上,引入VPN、IDS 等網(wǎng)絡(luò)安全設(shè)備,防止技術(shù)系統(tǒng)的核心數(shù)據(jù)被竊取。
數(shù)據(jù)處理與存儲(chǔ)部分主要包括多臺(tái)高性能的數(shù)據(jù)處理和存儲(chǔ)服務(wù)器、磁盤陣列。為確保數(shù)據(jù)的處理速度和網(wǎng)絡(luò)數(shù)據(jù)的吞吐速率,利用設(shè)備虛擬化技術(shù),對(duì)計(jì)算和網(wǎng)絡(luò)資源進(jìn)行統(tǒng)一的調(diào)度和管理,滿足對(duì)海量文字、圖片、音視頻、特征值的運(yùn)算需求。使用專門的調(diào)度管理服務(wù)器,對(duì)虛擬服務(wù)器的運(yùn)行狀態(tài)進(jìn)行監(jiān)控。
為保證數(shù)據(jù)的存取速度和減少數(shù)據(jù)冗余,使用實(shí)時(shí)同步的磁盤陣列和數(shù)據(jù)庫服務(wù)器分別保存過程數(shù)據(jù)和監(jiān)管結(jié)果,使用關(guān)系型數(shù)據(jù)庫MYSQL 和非關(guān)系型的數(shù)據(jù)庫MONGODB 來分別保存格式化和非格式化的數(shù)據(jù)。
數(shù)據(jù)應(yīng)用部分主要包括網(wǎng)站發(fā)布服務(wù)器、網(wǎng)絡(luò)安全設(shè)備、用戶終端設(shè)備和網(wǎng)絡(luò)通信接口服務(wù)器。系統(tǒng)使用支持高并發(fā)的發(fā)布服務(wù)器滿足多個(gè)用戶終端的進(jìn)行節(jié)目審核、預(yù)警處理等方面的需求。通過通訊服務(wù)器向上級(jí)主管部門和協(xié)作單位推送監(jiān)管數(shù)據(jù)。
為實(shí)現(xiàn)廣播電視節(jié)目信息采集、指標(biāo)判斷、內(nèi)容識(shí)別、輿情分析、預(yù)警上報(bào)、信息傳遞等功能,提供智慧化的技術(shù)監(jiān)測(cè)、內(nèi)容監(jiān)管、系統(tǒng)運(yùn)行等預(yù)警服務(wù),按照分層設(shè)計(jì)和面向?qū)ο蟮木幊汤砟?,將系統(tǒng)軟件分為基礎(chǔ)環(huán)境層、采集層、存儲(chǔ)與處理層、業(yè)務(wù)應(yīng)用層,如圖2 所示。
圖2 系統(tǒng)軟件組成示意圖
基礎(chǔ)環(huán)境層主要包括監(jiān)測(cè)前端、網(wǎng)絡(luò)設(shè)備、磁盤陣列、數(shù)據(jù)庫等技術(shù)接口,為上層軟件的正常運(yùn)行提供硬件和軟件環(huán)境。將所有的接口按照面向?qū)ο蟮木幊桃?guī)范進(jìn)行封裝,以提升軟件的擴(kuò)展性和可維護(hù)性。
數(shù)據(jù)采集層通過采集程序獲取節(jié)目名稱、內(nèi)容、制作機(jī)構(gòu)、播出機(jī)構(gòu)、信號(hào)指標(biāo)、傳播情況、網(wǎng)民評(píng)論等信息。一是遠(yuǎn)程調(diào)用中短波、調(diào)頻、有線數(shù)字電視、地面無線數(shù)字電視、IPTV 監(jiān)測(cè)前端的采集程序,對(duì)播出信號(hào)和內(nèi)容進(jìn)行采樣,并回傳到本地服務(wù)器。為便于后期的內(nèi)容識(shí)別,音視頻節(jié)目均需添加時(shí)間戳。二是利用網(wǎng)絡(luò)爬蟲、終端控制、IP 代理等技術(shù),實(shí)時(shí)采集視頻網(wǎng)站、移動(dòng)應(yīng)用程序、社交網(wǎng)站、互聯(lián)網(wǎng)電視等渠道的節(jié)目信息,將獲取的鏈接地址、頁面內(nèi)容、節(jié)目、下載鏈接、網(wǎng)民評(píng)論等信息保存到數(shù)據(jù)庫和磁盤陣中。為便于任務(wù)維護(hù),將網(wǎng)絡(luò)爬蟲的采集廣度和深度等規(guī)則保存在數(shù)據(jù)庫中。三是調(diào)用協(xié)作單位的數(shù)據(jù)交換接口,以獲取制作、播出、傳輸?shù)拳h(huán)節(jié)產(chǎn)生的區(qū)塊鏈信息,解析得到節(jié)目名稱、時(shí)長(zhǎng)、審核結(jié)果、審核單位、審核人等數(shù)據(jù)。
數(shù)據(jù)存儲(chǔ)層用于存儲(chǔ)設(shè)備信息、任務(wù)參數(shù)、指標(biāo)參數(shù)、圖文、音視頻、運(yùn)行指標(biāo)、控制規(guī)則、監(jiān)管結(jié)果、反饋意見等數(shù)據(jù)。利用非關(guān)系型數(shù)據(jù)存儲(chǔ)技術(shù),保存海量非標(biāo)準(zhǔn)化原始采集文字、圖片、頁面、動(dòng)畫等數(shù)據(jù)。調(diào)用音視頻指紋生成算法,計(jì)算各個(gè)節(jié)目之間的相似度,減少不同渠道獲取的音視頻數(shù)據(jù)的重復(fù)保存,以節(jié)省存儲(chǔ)空間。在數(shù)據(jù)庫中,用存儲(chǔ)節(jié)目信息的HASH 值,提升數(shù)據(jù)的查詢、比較、更新速度。
數(shù)據(jù)處理層對(duì)采集到的廣播電視信息中的文字、圖片、音視頻等數(shù)據(jù)進(jìn)行處理,獲取信號(hào)指標(biāo)、節(jié)目?jī)?nèi)容和系統(tǒng)運(yùn)行狀態(tài)預(yù)警數(shù)據(jù)。在處理文字信息時(shí),首先利用分詞技術(shù)進(jìn)行數(shù)據(jù)清洗,對(duì)于缺失數(shù)據(jù)進(jìn)行補(bǔ)充和異常數(shù)據(jù)進(jìn)行修正。利用情感分析和關(guān)鍵詞比對(duì)技術(shù),判別預(yù)警類別和級(jí)別,同時(shí)為節(jié)目?jī)?nèi)容預(yù)警提供線索。在處理獲取到的圖片時(shí),利用圖片指紋特征識(shí)別技術(shù),進(jìn)行相似度的比對(duì),減少對(duì)圖片識(shí)別的次數(shù),節(jié)約計(jì)算資源。在音視頻處理中,除了使用最新的識(shí)別算法外,將歷史經(jīng)驗(yàn)數(shù)據(jù)融入到大數(shù)據(jù)的處理算法中,提升識(shí)別的精準(zhǔn)性。為綜合利用多個(gè)渠道的預(yù)警數(shù)據(jù),采用基于貝葉斯估計(jì)的多源數(shù)據(jù)處理算法生成一致性的指標(biāo)、內(nèi)容和運(yùn)行狀態(tài)預(yù)警結(jié)論。
業(yè)務(wù)應(yīng)用層提供技術(shù)監(jiān)測(cè)、內(nèi)容監(jiān)管、系統(tǒng)運(yùn)行等預(yù)警信息的查詢、修改、審核、上報(bào)等功能。按照權(quán)限規(guī)定,系統(tǒng)將相關(guān)信息推送給節(jié)目研判員、協(xié)作單位、上級(jí)部門,并提供數(shù)據(jù)異議處理和節(jié)目聯(lián)合研判等功能。
技術(shù)監(jiān)測(cè)預(yù)警模塊主要提供停播、劣播、無伴音、馬賽克、無載波、無運(yùn)行圖等指標(biāo)報(bào)警信息。系統(tǒng)將廣播電視信號(hào)實(shí)時(shí)測(cè)量結(jié)果與廣播電視主管部門批復(fù)的指標(biāo)進(jìn)行比對(duì),按照事件事故的管理規(guī)定,對(duì)預(yù)警信息進(jìn)行分級(jí),向節(jié)目研判員提供技術(shù)指標(biāo)預(yù)警的時(shí)間、地點(diǎn)、節(jié)目、類型、范圍以及預(yù)測(cè)的事故原因等信息,以便準(zhǔn)確定位故障環(huán)節(jié),挽救播出事故。
內(nèi)容監(jiān)管預(yù)警模塊主要提供廣播電視節(jié)目?jī)?nèi)容、節(jié)目輿情和直播等預(yù)警服務(wù)。節(jié)目?jī)?nèi)容預(yù)警提供數(shù)據(jù)處理層產(chǎn)生的疑似包含違規(guī)內(nèi)容的文字、圖片、音視頻、廣告等節(jié)目信息,輔助節(jié)目研判員監(jiān)聽監(jiān)看。輿情預(yù)警主要是通過趨勢(shì)圖、詞云、熱搜榜等形式提供視聽網(wǎng)站、移動(dòng)APP 等平臺(tái)中的受到關(guān)注或增長(zhǎng)較快的涉廣播電視節(jié)目類輿情。直播預(yù)警主要是提供廣播電視頻道直播重大活動(dòng)時(shí)系統(tǒng)內(nèi)容識(shí)別的結(jié)果,以發(fā)現(xiàn)是否包含違規(guī)內(nèi)容。
系統(tǒng)運(yùn)行預(yù)警模塊提供通訊線路、硬件設(shè)備、運(yùn)行程序、網(wǎng)絡(luò)安全等運(yùn)行狀態(tài)預(yù)警。通訊線路預(yù)警主要提供網(wǎng)絡(luò)中斷、擁塞等預(yù)警信息。硬件設(shè)備預(yù)警反應(yīng)云計(jì)算服務(wù)器、前端站點(diǎn)等硬件設(shè)備的運(yùn)行狀態(tài)。軟件預(yù)警包括采集、存儲(chǔ)和處理程序的更新、運(yùn)行、維護(hù)、非法調(diào)用等預(yù)警信息。
系統(tǒng)管理層提供任務(wù)、人員、軟件、硬件等運(yùn)行狀態(tài)的監(jiān)控和設(shè)置功能。按照權(quán)限設(shè)置,提供設(shè)備參數(shù)、任務(wù)周期、設(shè)備型號(hào)、存儲(chǔ)位置、操作日志等數(shù)據(jù)的新建、分配、更新、刪除等操作。
廣播電視節(jié)目信息采集、處理、存儲(chǔ)、通信等程序?qū)τ贑PU、內(nèi)存、網(wǎng)絡(luò)、存儲(chǔ)等資源需求是動(dòng)態(tài)變化的。為提升硬件的利用率和增強(qiáng)系統(tǒng)的擴(kuò)展性,使用VMware 的虛擬化技術(shù)對(duì)多臺(tái)服務(wù)器進(jìn)行集群式管理。該技術(shù)能夠?qū)⒌讓佑布筒僮飨到y(tǒng)分開來,將所有的CPU、內(nèi)存、存儲(chǔ)等作為資源池進(jìn)行統(tǒng)一管理,具有較強(qiáng)的系統(tǒng)恢復(fù)能力和擴(kuò)展能力,適合于靈活多變的監(jiān)管任務(wù)。以廣播電視直轉(zhuǎn)播監(jiān)管任務(wù)為例,系統(tǒng)管理員可以將更多的網(wǎng)絡(luò)和計(jì)算資源分配給中短波、調(diào)頻、有線數(shù)字電視等專網(wǎng)數(shù)據(jù)的采集和處理程序,以提升數(shù)據(jù)采集和完整性轉(zhuǎn)播的研判的速度。
為解決媒體融合傳播帶來節(jié)目信息審核需求增加與監(jiān)管力量有限之間的矛盾,基于區(qū)塊鏈體系中的聯(lián)盟鏈實(shí)現(xiàn)技術(shù)設(shè)計(jì)廣播電視節(jié)目監(jiān)管區(qū)塊鏈,如表1。通過打通播出、傳輸、監(jiān)測(cè)機(jī)構(gòu)的數(shù)據(jù)壁壘,達(dá)到共享節(jié)目信息審核數(shù)據(jù)、擴(kuò)大監(jiān)管工作的覆蓋面、減少人員支出的目的。將有限的計(jì)算和網(wǎng)絡(luò)資源用在對(duì)重點(diǎn)節(jié)目的審核之中,將集中的監(jiān)管變成分布式的監(jiān)管,將原來的事后監(jiān)管變成了事中監(jiān)管,及時(shí)發(fā)現(xiàn)廣播電視節(jié)目傳播中出現(xiàn)的問題。
表1 廣播電視監(jiān)管區(qū)塊鏈信息表
針對(duì)主要媒體傳播渠道上的多數(shù)廣播電視節(jié)目是一致的實(shí)際情況,為節(jié)約有限的系統(tǒng)計(jì)算和存儲(chǔ)資源,對(duì)所有的音視頻節(jié)目進(jìn)行切片,利用特征分析技術(shù)獲取每個(gè)切片特征值,對(duì)通過衛(wèi)星信號(hào)獲取的節(jié)目進(jìn)行比對(duì),給出可信度。對(duì)于可信度較高的節(jié)目,無需進(jìn)一步的處理,也可準(zhǔn)確判斷故障節(jié)點(diǎn)。
為獲取網(wǎng)絡(luò)評(píng)論、彈幕等信息中的違規(guī)節(jié)目和優(yōu)秀節(jié)目的傳播線索,將分詞技術(shù)和關(guān)鍵詞比較技術(shù)進(jìn)行結(jié)合,對(duì)社交軟件、評(píng)論區(qū)等節(jié)目信息進(jìn)行分析,找出帶有攻擊性和贊揚(yáng)性的詞匯。為提升算法的精準(zhǔn)性,需要對(duì)關(guān)鍵詞的權(quán)重進(jìn)行調(diào)整,形成關(guān)鍵詞權(quán)重動(dòng)態(tài)調(diào)整的工作機(jī)制。
為有效整合從專網(wǎng)、互聯(lián)網(wǎng)、協(xié)作單位獲取的節(jié)目信息,獲取一致性的預(yù)警數(shù)據(jù),提升監(jiān)管工作速度和準(zhǔn)確度,利用貝葉斯估計(jì)算法將已知的數(shù)據(jù)處理結(jié)論融入到新的預(yù)警數(shù)據(jù)判別之中,從多源數(shù)據(jù)中得出估計(jì)和判決,進(jìn)而得到可信度較高的結(jié)論。
為解決媒體融合時(shí)代廣播電視節(jié)目監(jiān)管遇到的新問題,在系統(tǒng)研究主流傳播渠道特點(diǎn)的基礎(chǔ)上,利用虛擬化、音視頻特征識(shí)別、貝葉斯估計(jì)、區(qū)塊鏈等技術(shù),設(shè)計(jì)具有數(shù)據(jù)采集、處理、存儲(chǔ)、上報(bào)的智能監(jiān)管系統(tǒng),探索出了一條廣播電視節(jié)目智慧化監(jiān)管的新模式。該系統(tǒng)滿足了當(dāng)前技術(shù)監(jiān)測(cè)、內(nèi)容監(jiān)管的業(yè)務(wù)需求,還具有運(yùn)行穩(wěn)定、擴(kuò)展性強(qiáng)、配置靈活等優(yōu)點(diǎn),便于下一步引入節(jié)目?jī)?nèi)容AI 識(shí)別和大數(shù)據(jù)處理算法等。