文/蔣文利
大數(shù)據(jù)技術為廣播的長足發(fā)展提供技術支撐
文/蔣文利
本文提出了大數(shù)據(jù)技術概念、特點及對廣播媒體的重大意義,介紹了大數(shù)據(jù)技術管理平臺的構建方式及采用的關鍵技術,探討了大數(shù)據(jù)技術原理及大數(shù)據(jù)在安全方面遇到的問題。結合電臺的工作實際,詳細敘述了大數(shù)據(jù)技術在提高廣播節(jié)目制作質量、精準的收聽率調查、信息獲取渠道及發(fā)揮主流媒體作用等方面的作用。
大數(shù)據(jù);廣播媒體;云計算;數(shù)據(jù)分析
大數(shù)據(jù)管理對廣播媒體的意義不在于它的海量數(shù)據(jù),而是在于對這些有用的信息進行媒體化的信息整理,也就是讓大數(shù)據(jù)成為廣播媒體的一種有價值的工具,通過對音頻數(shù)據(jù)的深度挖潛,實現(xiàn)廣播媒體資產(chǎn)的保值增值。廣播媒體如何融入大數(shù)據(jù)時代,搭建大數(shù)據(jù)管理平臺,利用對大數(shù)據(jù)的采集、內(nèi)容的綜合分析改變廣播媒體的傳播方式,創(chuàng)新營利模式,為廣播節(jié)目的改版、名牌節(jié)目和名牌頻率創(chuàng)新提供決策依據(jù)。探索出廣播媒體在新的媒體環(huán)境下信息傳播和媒體服務的發(fā)展之路,提升廣播的核心競爭力,是廣播人不可回避的問題。
大數(shù)據(jù)也稱之為海量的資料,是利用現(xiàn)代化的IT技術產(chǎn)生的巨量信息資產(chǎn),具有巨大的觀察力、決策力、高成長性和信息種類多樣性等特點。大數(shù)據(jù)管理是對不同的信息來源、不同格式的信息內(nèi)容進行收集、存儲和關聯(lián)分析,從中獲得新規(guī)律,創(chuàng)造出有新價值的信息技術和服務業(yè)態(tài),它是數(shù)據(jù)容量巨大、種類繁多、索引和調取速度極快、可用價值高的巨型數(shù)據(jù)庫。因此,大數(shù)據(jù)相比傳統(tǒng)數(shù)據(jù)在“快速、價廉、優(yōu)化”三個方面是最好的。
(1)大數(shù)據(jù)收集技術。是通過頻道隨錄音頻節(jié)目、網(wǎng)絡廣播及聽眾互動、社交網(wǎng)站互動所收集的結構化、非結構化和半結構化的巨量數(shù)據(jù)。利用兩個功能模塊實現(xiàn)大數(shù)據(jù)采集:大數(shù)據(jù)智能傳感模塊即數(shù)據(jù)傳感部分、互聯(lián)網(wǎng)數(shù)據(jù)交換部分、感知適配器部分、自動識別系統(tǒng)及軟件硬件聯(lián)接部分,對不同結構的巨量數(shù)據(jù)進行自動臻別、追蹤、定位、上傳下載、信號轉碼、監(jiān)管、預處理等。大數(shù)據(jù)分析整理模塊:將大數(shù)據(jù)平臺的服務器虛擬化。采用分布式、網(wǎng)格節(jié)點數(shù)據(jù)存儲方式,大數(shù)據(jù)提取、存儲、集聚、解析和可視化接口技術,大數(shù)據(jù)的網(wǎng)絡數(shù)據(jù)交換及數(shù)據(jù)壓縮技術,大數(shù)據(jù)加密技術等完成對大數(shù)據(jù)的處理。
(2)大數(shù)據(jù)初始化技術。是對收集數(shù)據(jù)的辨別、分析、提取、整理等操作。重點包含兩個方面。數(shù)據(jù)提?。嚎蓪⑦@些不同結構類型的數(shù)據(jù)轉化成統(tǒng)一的、方便處理的數(shù)據(jù)結構類型,提高數(shù)據(jù)解析和處理能力。數(shù)據(jù)清理:采集的大數(shù)據(jù)不是完全都有用的,首先要對采集的數(shù)據(jù)去偽存真和去粗取精,避免一些無用的信息對有用信息的干擾。數(shù)據(jù)清理的目的就是對有用和無用信息進行有效的過濾和分離,從而獲得所需要的有用數(shù)據(jù)。
(3)大數(shù)據(jù)的存儲和管理技術。大數(shù)據(jù)存儲與監(jiān)管就是把收集到的不同結構的數(shù)據(jù)保存到所建立的數(shù)據(jù)庫中,并對其進行管理和上傳下載。大數(shù)據(jù)存儲方式有高速讀存的存儲、分布式文件存儲、網(wǎng)格節(jié)點存儲、去冗余數(shù)據(jù)存儲及高性價比的大數(shù)據(jù)存儲技術。大數(shù)據(jù)管理技術包括數(shù)據(jù)庫建模、數(shù)據(jù)復合、不同類型大數(shù)據(jù)管理、大數(shù)據(jù)查尋及可視化等相關技術。
(4)大數(shù)據(jù)分析及挖掘技術。大數(shù)據(jù)分析提升了現(xiàn)有的音頻節(jié)目數(shù)據(jù)高效利用,采取面向對象的數(shù)據(jù)聯(lián)接、相似性聯(lián)接大數(shù)據(jù)整合,解決網(wǎng)絡媒體用戶的主觀好惡分析、在線收聽分析等面向互聯(lián)網(wǎng)的大數(shù)據(jù)分析技術。大數(shù)據(jù)挖潛技術是從龐大的、不完整的、不清晰的、隨機的實際數(shù)據(jù)中,提取隱藏的、不可預知的,但又確實存在的有用信息內(nèi)容的過程。
廣播的大數(shù)據(jù)管理需要建設大數(shù)據(jù)技術管理平臺,來實現(xiàn)廣播音頻節(jié)目、文字稿件及相關的廣播資源在平臺上的聯(lián)接、存儲、解析、共建共享、索引調用和管理的目標。大數(shù)據(jù)平臺包括音頻節(jié)目聯(lián)接模塊、存儲模塊、解析模塊和管理模塊四個模塊的內(nèi)容。音頻節(jié)目聯(lián)接模塊:它能完成最基本的技術服務功能,向電臺各頻道不同格式的整體節(jié)目和節(jié)目素材提供不同的類型的數(shù)據(jù)應用接口,為電臺的音頻節(jié)目大數(shù)據(jù)平臺提供最基本的音頻數(shù)據(jù)支撐。存儲模塊:它是大數(shù)據(jù)管理平臺最主要的部分,是數(shù)據(jù)采集的歸屬地和資源池,用來存儲不同格式的音頻數(shù)據(jù)。采用音頻的元數(shù)據(jù)和音頻節(jié)目分開管理,查尋節(jié)目的元數(shù)據(jù)內(nèi)容很少,占用的碼流也就很少,實現(xiàn)音頻節(jié)目高速查詢功能。存儲方式采用的是云存儲結構,音頻節(jié)目被存儲在云存儲系統(tǒng)中的不同存儲節(jié)點上,音頻節(jié)目是采用高速并行的訪問方式,提高了節(jié)目的音頻的上傳和下載的速度。解析模塊:它是大數(shù)據(jù)管理的核心模塊,采用分布式存放和并行網(wǎng)格計算,并提供數(shù)據(jù)的聚集、類型劃分、提供聯(lián)接、測算和可視化插件及音頻數(shù)據(jù)的深度挖潛、解析、開發(fā)軟件工具。管理模塊:提供音頻節(jié)目、元數(shù)據(jù)、編目、操作人員權限、數(shù)據(jù)接口、系統(tǒng)服務監(jiān)控、平臺運行維護等管理功能。
大數(shù)據(jù)管理不能用某一臺電腦完成任務,應利用云計算的分布式、云端存儲、虛擬化、高速并行數(shù)據(jù)庫和互聯(lián)網(wǎng)等相關技術,通過云計算系統(tǒng)平臺向數(shù)十臺、數(shù)百臺乃至上千臺計算機分配工作,并行計算和處理,然后再進行數(shù)據(jù)的匯總,最后得出對龐大數(shù)據(jù)進行分布式的挖掘后的運算結果。
大數(shù)據(jù)的技術原理包括以下幾個方面:數(shù)據(jù)中心原理:對非結構音頻數(shù)據(jù)處理從以“過程”為中心,轉換成以“數(shù)據(jù)”為中心,通過多種技術對不同來源的信息進行整合,從而獲得大數(shù)據(jù)。數(shù)據(jù)的價值原理:大數(shù)據(jù)的使用是通過互聯(lián)網(wǎng)實現(xiàn)的,非網(wǎng)絡環(huán)境IT產(chǎn)品使用體現(xiàn)在功能上;互聯(lián)網(wǎng)環(huán)境IT產(chǎn)品使用體現(xiàn)在數(shù)據(jù)上。全標本原理:從過去的部分樣本轉變?yōu)槿繕颖?,?shù)據(jù)越是足夠多,可視化程度越清晰、受眾看得越清楚。注重效率原理:是由注重精準度變?yōu)樽⒅匦?,讓廣播媒體的發(fā)展決策更高效。注重關聯(lián)性原理:從注重因果關系變?yōu)樽⒅仃P聯(lián)性,只需知道是什么,不用知道為什么。事件預測原理:大數(shù)據(jù)最重要價值是事件預測,是把云計算的網(wǎng)格運算運用到巨量的大數(shù)據(jù)上來,預知事件發(fā)生的可能性。
之所以稱之為“大數(shù)據(jù)”,是因為它的種類繁多、存儲信息量龐大。它能把不同結構數(shù)據(jù)經(jīng)過整理、提純、解析后獲得有利用價值的信息。大數(shù)據(jù)不僅廣播媒體喜愛,黑客也在覬覦。大數(shù)據(jù)存在以下幾方面的安全問題。云數(shù)據(jù)安全問題:大數(shù)據(jù)通常經(jīng)過云端進行數(shù)據(jù)交互,極易遭到黑客的攻擊,需要采用安全可靠的大數(shù)據(jù)云計算策略。網(wǎng)絡防范:越來越多的線上交易、線上數(shù)據(jù)互換、線上互動都是在網(wǎng)絡上進行的,使黑客得手的機會不斷增加,一旦出現(xiàn)問題,大量的數(shù)據(jù)會丟失,媒體的聲譽及經(jīng)濟利益遭受損失,甚至還會發(fā)生法律糾紛。大數(shù)據(jù)加密:大數(shù)據(jù)的采集、存儲、數(shù)據(jù)在網(wǎng)絡的上傳下載,均通過計算機和移動設備,數(shù)據(jù)存在安全隱患,一旦信息泄露將導致不可挽回的損失,應利用透明加密技術對大數(shù)據(jù)加密。透明加密是使用者在透明加密環(huán)境下,系統(tǒng)采用智能方式對文件加密和解密,當退出透明加密環(huán)境時,黑客無法打開自動加密的文件,起到了對大數(shù)據(jù)的保護效果。
傳統(tǒng)廣播收聽率調查是采用隨機抽樣的方式,對聽眾收聽廣播的地域、時間、收聽工具等進行信息收集統(tǒng)計,它是一種概率統(tǒng)計結果,對數(shù)據(jù)內(nèi)容的分析很少。利用大數(shù)據(jù)進行收聽率的調查具有兩個特點:一是不依照樣本數(shù)據(jù),采用的是總體數(shù)據(jù)。二是大數(shù)據(jù)在原理和應用上更加科學有效。所收集的數(shù)據(jù)大幅度增加,數(shù)據(jù)參數(shù)也不斷更新,并對采集數(shù)據(jù)進行綜合分析和深度挖掘,知其然更知所以然,不僅可以提高收聽調查數(shù)據(jù)的精準性,所獲得的數(shù)據(jù)具有豐富性、多樣性和相關性,并整合出收聽率調查數(shù)據(jù)庫,降低獲得收聽率調查數(shù)據(jù)的成本,為電臺的節(jié)目改版、節(jié)目創(chuàng)新提供強有力的數(shù)據(jù)支撐。
互聯(lián)網(wǎng)上聚集了數(shù)量龐大的各種信息,它包括音頻節(jié)目、視頻內(nèi)容和文字稿件,而自媒體的內(nèi)容更是取之不盡,每個網(wǎng)絡用戶都可以成為信息的發(fā)布者。大數(shù)據(jù)的采集渠道多樣,數(shù)據(jù)種類繁多,數(shù)據(jù)量巨大,而這些數(shù)據(jù)是通過多個大型數(shù)據(jù)庫進行數(shù)據(jù)解析、分類、歸納,編輯記者可從類型繁雜的數(shù)據(jù)中提取出對廣播媒體有用的信息,使廣播媒體獲得的信息更加精準。
采用大數(shù)據(jù)管理對廣播音頻節(jié)目進行深層次的挖掘和管理,將使這些普通的音頻節(jié)目產(chǎn)生具有數(shù)據(jù)功能的價值。電臺媒體資源的真實性、公信力和權威性一直被社會所公認,對大數(shù)據(jù)的分析挖掘是在原始數(shù)據(jù)真實可信的基礎上進行的。這些大數(shù)據(jù)可為廣大受眾和其他媒體提供新聞信息的增值服務。如:大數(shù)據(jù)可以對財經(jīng)類新聞進行分類、整理、歸納,把整理出來的數(shù)據(jù)通過網(wǎng)絡平臺出售給客戶和受眾;讓客戶了解國家政策、經(jīng)濟走勢、科技動向、市場行情,并進行市場預測和引導;擴大了網(wǎng)絡自媒體的真實信息的來源,占領網(wǎng)絡媒體的主陣地,讓廣播媒體發(fā)揮主流媒體應有的作用,避免虛假新聞在社會的負面影響。這樣無疑可將電臺的音頻節(jié)目及相關數(shù)據(jù)得到多次應用,提升電臺媒體資源的使用率和再利用率,讓電臺的媒體資產(chǎn)增值。
媒體在大數(shù)據(jù)時代的競爭就是媒體大數(shù)據(jù)的采集、整理、計算分析和應用能力強與弱的競爭。廣播媒體只有掌握了大數(shù)據(jù)的采集、挖掘和分析,并從中獲得對新聞內(nèi)容更加深刻的觀察、理解和預見,才能制作出一批大數(shù)據(jù)媒體節(jié)目。通過對大數(shù)據(jù)的管理和分析,對廣播的發(fā)展格局做出相應的調整,為廣播轉型發(fā)展提供有價值的數(shù)據(jù)。廣播媒體完全有能力成為大數(shù)據(jù)應用的引領者,為廣播媒體未來取得長足發(fā)展探索出一條行之有效的發(fā)展之路。
[1]欒軼玫:《大數(shù)據(jù)重塑媒介生態(tài)》,《視聽界》,2013(4).
[2]張守信.廣電如何玩轉大數(shù)據(jù)?――兼談社交網(wǎng)絡分析工具對廣電大數(shù)據(jù)應用的啟示[J].聲屏世界,2013(10):8-11.
[3]吳林飛.大數(shù)據(jù)時代的廣電網(wǎng)絡客戶關系管理[J].中國數(shù)字電視,2013(9):39-42.
[4]王建磊.大數(shù)據(jù)帶給廣電行業(yè)的本質變革[J].聲屏世界,2013(9):8-11.
[5]朱艷紅.大數(shù)據(jù)時代廣播電視節(jié)目的轉型升級[J].新聞研究導刊.
(作者單位:天津廣播電視臺)
TP391
A
1671-0134(2017)10-077-02
10.19483/j.cnki.11-4653/n.2017.10.031