■文/陳 懿
播控機房智能監(jiān)測系統(tǒng)架構及應用
■文/陳 懿
本文主要介紹了安徽廣播電視臺播出總控機房智能監(jiān)測系統(tǒng)的架構,包括系統(tǒng)設計思路、整體架構、策略和實施的一些細節(jié),闡述了智能監(jiān)測系統(tǒng)作為確保電視播出系統(tǒng)安全運行的重要輔助工具的重要性。
智能監(jiān)測平臺;設備監(jiān)測;信號監(jiān)測;業(yè)務監(jiān)測;電力和環(huán)境監(jiān)測
智能監(jiān)測是電視播出的輔助系統(tǒng),能夠有效了解系統(tǒng)運行情況、預防并及時處理系統(tǒng)故障、提高系統(tǒng)管理水平。
智能監(jiān)測系統(tǒng)作為保證播控系統(tǒng)安全穩(wěn)定運行的系統(tǒng),高安全性是項目設計的基本原則之一,監(jiān)測系統(tǒng)本身不會對各個業(yè)務系統(tǒng)做任何控制操作,各個業(yè)務系統(tǒng)完全可以獨立于總監(jiān)測系統(tǒng)而正常運行。實用性是另一個主要原因,智能監(jiān)測系統(tǒng)要能夠對各子系統(tǒng)上報的數(shù)據(jù)進行過濾和分析,以提高監(jiān)測系統(tǒng)報警的準確性,使其真正成為能夠準確幫助值班人員判斷故障的工具。
在新中心播控機房建立統(tǒng)一的網絡智能監(jiān)測系統(tǒng)平臺。通過該系統(tǒng)的建立實現(xiàn)涵蓋播總控系統(tǒng)及播出全業(yè)務的智能化預警和監(jiān)測平臺。
智能監(jiān)測平臺不僅能夠對信號層、設備層進行監(jiān)測,還能夠對業(yè)務流程、網絡環(huán)境、電力環(huán)境、機房環(huán)境等進行全面、準確、實時監(jiān)測,并對采集的信息進行實時分析、分級分類提醒。
智能監(jiān)測系統(tǒng)的總體架構分為三層,分別是采集服務層、匯聚分析服務層、應用展現(xiàn)層。
主要硬件包括:數(shù)據(jù)庫服務器、數(shù)據(jù)采集服務器、匯聚分析服務器和信號質量檢測卡及溫濕度感應器等,另外,還包括16個頻道監(jiān)測展現(xiàn)工作站和2個總控監(jiān)測展現(xiàn)工作站。
主要監(jiān)測內容:
AV設備監(jiān)測內容,主要參考各硬件設備廠商提供的MIB(信息管理)庫;
IT設備監(jiān)測內容;傳輸系統(tǒng)監(jiān)測;機房環(huán)境監(jiān)測內容。
借助信號質量監(jiān)測卡建立信號質量監(jiān)測體系;依據(jù)業(yè)務流程建立文件化流程監(jiān)控。
從系統(tǒng)功能方面劃分為監(jiān)測、客戶端展現(xiàn)、運維管理。
3.1 設備監(jiān)測層面
由于SNMP(簡單網絡管理協(xié)議)協(xié)議具有簡單通用等特點,很多廣電行業(yè)設備廠商的設備都支持SNMP協(xié)議,我們使用SNMP協(xié)議對設備進行監(jiān)測和管理,采用SNMP協(xié)議中輪詢和陷阱(Tarp)的方式對設備運行狀態(tài)進行監(jiān)測。
AV設備檢測參數(shù):
根據(jù)播總控設備、周邊板卡及機箱提供的自身狀態(tài)MIB文件與工作狀態(tài)信息(通過SNMP協(xié)議或其他專用協(xié)議獲?。?/p>
IT設備檢測參數(shù):
IT設備硬件獲取,如CPU使用率、內存占用率、硬盤占用率、機箱溫度等。
網絡相關信息采集: 每個端口網絡數(shù)據(jù)流量、每個端口的網絡協(xié)議(如果支持)、配置文件等。
3.2 信號監(jiān)測層面
涉及上載、審看、播出關鍵點,主要使用信號質量檢測卡。信號質量關系播出質量,它的評判標準依據(jù)國家廣電總局金帆獎告警參數(shù)。主要技術參數(shù)、系統(tǒng)指標:SD:625i50 HD:1080i50。信號檢測內容:靜幀、黑場、彩場、彩條、靜音、聲音過高、聲音過低。
3.3 業(yè)務監(jiān)測層面
播出串聯(lián)單從接收到播出各階段狀態(tài)信息監(jiān)測;文件上載、審核、遷移到播出的各階段狀態(tài)信息監(jiān)測。
技審平臺簡介:技審平臺包括自動技審和人工復檢軟件。
自動技審通過軟件自動分析被檢素材的每一幀視頻和音頻信號, 并將解析出的數(shù)據(jù)與相關標準進行對比,從而確定被檢素材中是否含有黑場、彩條、靜音等技術問題,并在認為有問題的地方打標記點,供人工復檢使用。針對 MXF文件,自動技審軟件能夠檢測 MXF 文件的結構信息,在人工復檢軟件中進行查看 MXF 文件結構錯誤信息。由于自動技審的檢測較機械化,沒有人腦的邏輯判斷力,所以在人工復檢流程中,需要對自動技審中發(fā)現(xiàn)的問題進行瀏覽復查,以確認問題是否屬實。人工復檢軟件可以對節(jié)目單中標記為“自動技審不通過”條目進行人工復檢,在時碼上定位到出問題的點,并在回顯畫面中顯示當前時碼的圖像, 人工確認該問題是否為錯誤點, 并將該素材標記為 “人工復檢通過”或者“人工復檢不通過” 。
在中心機房內部署多個環(huán)境監(jiān)測點,來獲取UPS、精密空調和機房溫濕度等環(huán)境信息,其中對UPS的監(jiān)測能獲取系統(tǒng)電力相關信息,如系統(tǒng)電壓、電流、功率等,對精密空調的監(jiān)測以及在機房內部署溫濕度傳感器,能獲取系統(tǒng)各個點溫度、濕度信息。
4.1 屏幕展現(xiàn)
使系統(tǒng)維護人員了解整個播出系統(tǒng)的運行狀態(tài),通過多種方式(如樹狀目錄、系統(tǒng)電子圖、關鍵字搜索等),對在線設備(正在使用和熱備份設備)工作狀態(tài)的實時查詢;
提供設備告警信息的分級告警(展現(xiàn)界面警示、聲光告警);
列出告警信息總表,并且能通過查詢獲得所需要的告警信息;
告警能采用多種方式分級顯示,如從機房->機柜->板卡的分級顯示或機房->系統(tǒng)->模塊->設備的顯示方式;
根據(jù)需要,分級對系統(tǒng)硬件鏈路及信號路由進行實時圖形化顯示,可預設顯示范圍;
不同值班崗位的監(jiān)測提示展現(xiàn)界面。
4.2 監(jiān)測子系統(tǒng)的響應時間指標
總監(jiān)測系統(tǒng)針對不同的應用級別有不同的響應時間要求,根據(jù)需要把響應分為2個級別:實時響應和快速響應。
實時響應:對于與安全播出密切相關,以及直接影響安全播出的播出主、備路鏈路信號與設備,采用快速可靠的方法,實時地將監(jiān)測結果和應急提示置于明顯的監(jiān)看位置,并配備聲光告警。與安全播出密切相關、直接影響安全播出的播出主備路鏈路信號與設備的報警響應,實時響應時間小于2秒,力爭1秒以內。
快速響應:對不直接影響安全播出的非播出鏈路設備信號與設備,采用可靠的方法將監(jiān)測結果較快速地(小于5秒)置于監(jiān)看和監(jiān)測相應界面位置,并能夠進行查詢和篩選。
4.3 系統(tǒng)誤報率及漏報率指標
設備狀態(tài)類報警:不得出現(xiàn)軟件漏報,并且軟件誤報率小于0.1%;
播出流程類報警:不得出現(xiàn)軟件漏報,并且軟件誤報率低于0.1%;
環(huán)境狀態(tài)類報警:不得出現(xiàn)軟件漏報,并且軟件誤報率小于0.3%;
系統(tǒng)主要提供有四種查詢:故障狀態(tài)查詢、設備故障次數(shù)、故障時間統(tǒng)計分析、設備資產的查詢;
設備檔案庫由以下數(shù)據(jù)表構成:設備型號表、設備型號圖形表、設備說明書表、設備熱點信息表、設備型號接口表、設備代碼表、實體設備信息表、設備維修維護表。
安徽廣播電視臺新中心電視播控智能監(jiān)測系統(tǒng),于2013年7月進場施工、調試。2013年8月15日開始試用,2013年10月22日正式為播出系統(tǒng)服務。
智能監(jiān)測系統(tǒng)從2013年10月上線以來,大大減輕了值班人員和技術維護人員的工作量,而且播出系統(tǒng)中的設備信息、故障信息、人員行為、設備報警信息都可以在數(shù)據(jù)庫中查詢并保存。用軟件巡查代替人工巡查,幫助值班人員快速響應、正確處理,提高系統(tǒng)應急的效率,增加了播出的安全性。
智能監(jiān)測系統(tǒng)具備高度的及時性、準確性和可用性,嚴格保證值班人員在出現(xiàn)故障的第一時間接到報警通知,通過提升監(jiān)測技術水平,杜絕漏報,盡量不出現(xiàn)誤報,快速實現(xiàn)故障定位和分析,成為能夠有效輔助運維人員進行排查故障和應急處理手段。
[1]吳永生,楊旸.播出信號監(jiān)測監(jiān)錄系統(tǒng)的設計與應用[J].電視技術,2014,38(8):87-90.
[2]李昕,周軍超,孫燕.電視臺播出智能監(jiān)控系統(tǒng)的設計[J].廣播與電視技術,2013,40(6):50-53.
[3]關亞東,張明剛,劉菁.電視臺演播室智能監(jiān)控系統(tǒng)的實現(xiàn)[J].現(xiàn)代電視技術,2014(12):102-105.
(作者單位:安徽廣播電視臺播控中心)
G202
A
1671-0134(2017)06-107-02
10.19483/j.cnki.11-4653/n.2017.06.035