羅 清(作者單位:江蘇省廣播電視總臺)
?
江蘇廣播網絡中心機房監(jiān)控管理平臺的建設
羅 清
(作者單位:江蘇省廣播電視總臺)
摘 要:為滿足廣播事業(yè)建設發(fā)展需求,江蘇廣播新建了有云計算能力和網絡高吞吐量的網絡中心機房。具有高可靠性和統(tǒng)一集中管理的監(jiān)控管理平臺是保障中心機房7×24小時安全運維的必要手段。本文介紹了包含視頻監(jiān)控、消防監(jiān)控、動力監(jiān)控和環(huán)境監(jiān)控子系統(tǒng)的監(jiān)控管理平臺的設計建設,以及項目實施后的實際應用情況。
關鍵詞:監(jiān)控管理平臺;信息采集層;遠程瀏覽監(jiān)控
在媒體融合與互聯(lián)網+的發(fā)展背景下,江蘇廣播事業(yè)建設快速地發(fā)展。為積極響應江蘇廣播電視總臺深入推進“十項工程”,大力推進技術服務機制,優(yōu)化技術支撐保障,滿足新一代廣播全臺網、未來江蘇廣播私有云、以及CDR數(shù)字音頻廣播等新興項目的建設需求,廣播傳媒中心異地選址,新建了江蘇廣播云服務網絡中心機房,具備云計算能力和網絡高吞吐量。新機房重新構架了全臺網基礎設施,主要包括雙路配電UPS系統(tǒng)、恒溫恒濕機房空調系統(tǒng)、新風系統(tǒng)、防雷接地系統(tǒng)、安防監(jiān)控、環(huán)境監(jiān)控系統(tǒng)等。2014年上半年完成新舊機房技術系統(tǒng)割接,新機房正式投入使用。作為無人值守的云服務網絡信息機房,必須要滿足可見、可控、自動化的運行維護要求,因此機房監(jiān)控管理平臺是保障7×24小時安全運維的必要手段。
新機房占地面積約100平方米,分為主機房和電池配電間。其中,主機房按功能規(guī)劃為網絡核心設備區(qū)、綜合業(yè)務網設備區(qū)、云存儲設備區(qū)、廣播云設備區(qū)共四個區(qū)域。在運維原有信息中心機房十多年來管理經驗的基礎上,我們確定了新機房的監(jiān)控管理平臺的建設目標如下:(1)為機房內各系統(tǒng)及設備運行提供高可靠穩(wěn)定的監(jiān)控信息資源;(2)建立機房運維管理數(shù)據(jù)庫,實現(xiàn)對機房日常運維的規(guī)范管理;(3)集成度高,免維護,提高機房管理工作效率,節(jié)省機房運行管理費用;(4)系統(tǒng)軟硬件采用模塊化結構設計,具有可擴展性、可變性。
圖1 監(jiān)控管理平臺的監(jiān)控對象
圖2 機房監(jiān)控管理平臺架構圖
機房監(jiān)控管理平臺的監(jiān)控對象如圖1所示,主要包括:視頻監(jiān)控、消防監(jiān)測、動力監(jiān)控、環(huán)境監(jiān)控等。通過對相關監(jiān)控數(shù)據(jù)的收集、整理、分析,形成對江蘇廣播云服務網絡中心機房運行狀態(tài)的全面監(jiān)控,提高機房運維管理水平和效率。在未來規(guī)劃中,監(jiān)控平臺還將接入總臺技術管理系統(tǒng)的全景化監(jiān)控模塊,進行可視化的展示。
機房監(jiān)控管理平臺由現(xiàn)場設備信息采集層、監(jiān)控服務器、本地或遠程瀏覽終端三個部分組成,架構如圖2所示。
現(xiàn)場設備信息采集層主要包括供配電監(jiān)測、UPS監(jiān)測、空調監(jiān)測、溫濕度監(jiān)測、漏水監(jiān)測、消防監(jiān)控、安防監(jiān)測和視頻監(jiān)控。
3.1 配電監(jiān)測子系統(tǒng)
采用4個八路隔離高壓輸入模塊,在電池配電間的配電柜上安裝電量監(jiān)測儀,電流監(jiān)測用電流互感器變換后再由電量儀測量,實時監(jiān)測配電柜主進線的相電壓、相電流、相功率、頻率、功率因素等,以及監(jiān)測各配電柜的輸入和輸出。
3.2 UPS監(jiān)測子系統(tǒng)
UPS的RS232/485通訊接口通過一體化智能采集器智能接口接入,采集到UPS各種運行數(shù)據(jù)及狀態(tài)信息,經過處理后的數(shù)據(jù)發(fā)布到對外數(shù)據(jù)接口,集中監(jiān)控平臺讀取監(jiān)控服務器對外數(shù)據(jù)接口的數(shù)據(jù),實現(xiàn)對UPS在線實時監(jiān)控。
3.3 精密空調監(jiān)控子系統(tǒng)
通過精密空調廠家提供RS232/485通訊接口及通訊協(xié)議,對精密空調運行狀態(tài)進行在線實時采集監(jiān)控,實現(xiàn)對空調的制冷器運行狀態(tài)、壓縮機高壓故障、過濾網阻塞等的監(jiān)測與報警。還可以控制空調機的啟停,改變溫度與濕度的設定,實時顯示并保存運行參數(shù)和狀態(tài)。
3.4 溫濕度監(jiān)測子系統(tǒng)
在機房的四個重要區(qū)域及重要機柜內安裝智能溫濕度傳感器,使用智能通信接口RS485方式并接接入,以3D仿真圖示定位方式對溫濕度的實時數(shù)值進行展示。當傳感器檢測到的數(shù)據(jù)超過設定的上限或下限時,監(jiān)控系統(tǒng)會發(fā)出警報。
3.5 漏水監(jiān)測子系統(tǒng)
采用耐腐蝕、高靈敏度的定位式測漏控制模塊,將兩臺精密空調地板底下可能會有水源的地方用漏水感應線圍起來,感應設備通過傳感器將漏水信號及時地輸送到監(jiān)控系統(tǒng),并在第一時間報警。
3.6 消防監(jiān)測子系統(tǒng)
采用8路隔離數(shù)字量輸入模塊,對消防廠家提供的干接點信號進行采集,與監(jiān)控服務器進行通訊。同時,消防輸出信號接入門禁系統(tǒng),實現(xiàn)消防聯(lián)動,實時顯示并保存消防主機的放氣狀態(tài)及報警情況。
3.7 安防監(jiān)控
通過紅外微波型雙鑒探測器進行布防,8路隔離數(shù)字量輸入模塊,對機房內大物體的移動進行實時監(jiān)測,出現(xiàn)異常按策略對相應狀況進行告警。
3.8 視頻監(jiān)控
采用定焦定向廣角彩色半球攝像機,監(jiān)視8路視頻,對機房室門的進出及機房服務器區(qū)的狀況進行現(xiàn)場視頻場景監(jiān)控。與動力環(huán)境監(jiān)控系統(tǒng)聯(lián)動,一旦有故障會自動打開攝像頭進行拍照并錄像,圖像內容自動保存到硬盤錄像機中,供日后查詢管理。
3.9 門禁管理子系統(tǒng)
用RS-485總線與門禁控制器通訊,采用智能感應卡方式的,實現(xiàn)對機房進出人員控制和記錄。當有人刷卡進門時,系統(tǒng)立刻彈出相應的門禁記錄管理窗口,可將持卡人管理資料一并彈出。能夠實現(xiàn)遠程開門,有門開超時報警等。
監(jiān)控服務器采用專用于無人值守的監(jiān)控嵌入式主機,選用D igiVi3000網絡型服務器,配置GSM短信模塊、AM S告警管理軟件。監(jiān)控服務器集中了現(xiàn)場視頻采集、監(jiān)控數(shù)控采集、協(xié)議轉換、聯(lián)動控制、內嵌WEB服務器等各種功能,進行統(tǒng)一的集中監(jiān)控管理,提供友好的WEB服務,實現(xiàn)個性化的需求。系統(tǒng)支持短信分級報警,當報警信息沒有及時回復時,能自動地再次發(fā)送報警信息給更高權限的管理人員。為保證報警的準確性。報警系統(tǒng)具備延時過濾功能。
監(jiān)控服務器既支持C/S客戶端監(jiān)控模式,也支持B/S瀏覽監(jiān)控模式。監(jiān)控服務器可以在本地通過IE瀏覽監(jiān)控設備,也能夠通過互聯(lián)網遠程訪問管理站,實現(xiàn)專業(yè)集中監(jiān)控,為系統(tǒng)管理人員提供多屏、集中報警、報表、管理等功能。即使脫離網絡,設備也可獨立運行,存儲監(jiān)控數(shù)據(jù)和聯(lián)動控制。
系統(tǒng)運行至今已一年多時間,穩(wěn)定可靠。在實際應用中,我們依據(jù)需求不斷地調整系統(tǒng)設置,較好地完成對信息中心機房的日常管理維護。其中,主要子系統(tǒng)模塊應用介紹如下。
4.1 配電監(jiān)測子系統(tǒng)
當監(jiān)測的電壓或電流超過設定的允許值時,配電監(jiān)測子系統(tǒng)診斷為有故障事件發(fā)生,監(jiān)控主系統(tǒng)發(fā)出報警。2015 年1月,曾發(fā)生因裝修工人誤操作,將樓道強電井中一路UPS的輸入電閘關閉,造成一路供電斷電,監(jiān)控管理平臺及時發(fā)出警報,避免了重大的辦公網絡中斷事故發(fā)生。
圖3 UPS監(jiān)測子系統(tǒng)界面
圖4 精密空調監(jiān)控子系統(tǒng)界面
圖5 溫濕度監(jiān)測子系統(tǒng)界面
圖6 安防監(jiān)控子系統(tǒng)界面
4.2 UPS監(jiān)測子系統(tǒng)
監(jiān)測各項UPS參數(shù),如圖3所示。2015年UPS系統(tǒng)曾發(fā)生過四次警告,但都未影響使用,運維人員都及時聯(lián)系了相關人員進行針對性的維修恢復。
4.3 精密空調監(jiān)控子系統(tǒng)
精密空調監(jiān)控子系統(tǒng)包括:監(jiān)測和控制。監(jiān)測主要參數(shù)如圖4所示,可以遠程開機、關機、對空調的溫、濕度的遠程設定等。2015年盛夏,空調曾出現(xiàn)冷凝壓力過高、壓縮機高壓故障、過濾網空氣過濾超時等監(jiān)測報警,經及時聯(lián)系相關空調維護人員修復。
4.4 溫濕度監(jiān)測子系統(tǒng)
在機房主要區(qū)域共布有5個監(jiān)控點,如圖5所示,由溫濕度傳感器采集各機房內的信號,實時顯示溫度信號、濕度信號。截至目前機房溫濕度一直都很穩(wěn)定。
4.5 安防監(jiān)控子系統(tǒng)
安防采用吸頂式紅外探測器、監(jiān)視防盜入侵情況,同時也可以讓上級部門對對運維人員日常工作起到隨時隨地的檢查監(jiān)督的作用。如圖6所示。
4.6 視頻監(jiān)控配置
視頻監(jiān)控采用彩色半球定焦定向廣角攝像機,對機房室門的進出及機房服務器區(qū)的狀況進行現(xiàn)場視頻場景監(jiān)控。硬盤容量為2TB,監(jiān)視8路視頻錄像,保存30天,其中每路視頻24小時的CIF錄像文件大小為3G。
總之,通過機房監(jiān)控管理平臺的建設應用,我們很好地實現(xiàn)了對江蘇廣播網絡信息中心運維管理,做到無人值守,提供高可靠的監(jiān)控信息資源,統(tǒng)一集中的監(jiān)控管理,實現(xiàn)節(jié)能化、功能化和高效率地管理維護,為今后即將開始的新一代廣播制播系統(tǒng)的建設以及提供以云采編、云制作、云分發(fā)、云存儲等云服務信息中心打下了良好的運維環(huán)境基礎。網站訂購信息等,以提高客戶對電子營業(yè)廳的粘性和忠誠度。
圖7 機房視頻監(jiān)控圖像及可以選擇視頻回放頁面
1.2.2 統(tǒng)一接口平臺
統(tǒng)一接口平臺對BOSS系統(tǒng)、呼叫中心等多個第三方業(yè)務系統(tǒng)進行統(tǒng)一的接入管理,通過接口封裝和適配,屏蔽第三方業(yè)務系統(tǒng)變化對電子營業(yè)廳的影響,保障業(yè)務流程各個環(huán)節(jié)的正常運行。
1.2.3 統(tǒng)一后臺管理
統(tǒng)一后臺管理為后臺管理員和操作員提供可視化操作界面,為電子營業(yè)廳系統(tǒng)穩(wěn)定運行提供支撐,主要包括權限管理、配置管理、訂單管理、產品管理、積分管理、內容管理、報表管理、日志管理等。
1.3 與外部系統(tǒng)關系
1.3.1 與BOSS系統(tǒng)關系
主要包括電子渠道與BOSS之間的實時請求和同步數(shù)據(jù)接口,實時請求采用WebService接口,同步數(shù)據(jù)采用FTP文件方式。功能上涵蓋業(yè)務訂購與退訂、賬本查詢、賬單同步等。
1.3.2 與支付平臺關系
通過與現(xiàn)有支付平臺的對接,為電子渠道提供涉及資金賬戶的支付處理調用。電子渠道通過調用相關接口,可發(fā)送支付處理請求,支付平臺根據(jù)請求內容進行邏輯處理。其功能包括銀行卡支付/退款、對賬、充值等。
1.3.3 與客服系統(tǒng)關系
電子渠道與現(xiàn)有客服系統(tǒng)采用WebService方式的實時接口對接,提供電子渠道業(yè)務的訂購情況、繳費情況的查詢以及相關業(yè)務的受理,可實現(xiàn)電子渠道投訴建議、工單等信息的實時通知,可對在電子渠道上用戶的業(yè)務預約、業(yè)務咨詢等業(yè)務作出快速響應。
為確保業(yè)務系統(tǒng)的高可靠性和高穩(wěn)定性,建立了相應的監(jiān)控管理機,實現(xiàn)了對各電子渠道平臺的實時監(jiān)控。系統(tǒng)監(jiān)控主要包括數(shù)據(jù)庫和應用的監(jiān)控。
2.1 Oracle數(shù)據(jù)庫監(jiān)控
作為系統(tǒng)核心之一的數(shù)據(jù)庫,其性能的優(yōu)劣直接影響到用戶的操作體驗,因此極有必要對其進行監(jiān)控,利用Oracle數(shù)據(jù)庫的管理指令以及自定義的告警策略實現(xiàn)對數(shù)據(jù)庫的自動監(jiān)控。主要監(jiān)控對象包括:(1)數(shù)據(jù)庫性能,包括Session數(shù)、數(shù)據(jù)庫鎖、緩沖活動連接數(shù)、緩沖池命中率等;(2)數(shù)據(jù)庫表空間,包括碎片化程度、已用/剩余空間、總容量等;(3)數(shù)據(jù)庫連接數(shù),包括用戶連接數(shù)、登錄數(shù)、注銷數(shù)等;(4)數(shù)據(jù)庫進程,包括CPU百分比、執(zhí)行時間、使用內存數(shù)、進程數(shù)等;(5)非法訪問,即是否有未經授權的IP地址、用戶等訪問數(shù)據(jù)庫的行為。
2.2 應用監(jiān)控
應用監(jiān)控包括進程監(jiān)控、頁面監(jiān)控、日志監(jiān)控等。進程監(jiān)控通過SNMP/WMI/ CLI監(jiān)控服務器中運行的進程,可全面了解系統(tǒng)資源的負荷,以及服務器中運行的應用程序和服務的進程的性能,當某進程超越設定閥值時,故障管理模塊觸發(fā)相關告警流程;頁面監(jiān)控在檢查URL以確保其可訪問性以及監(jiān)控用戶登陸狀況的同時,還在頁面上搜索特定內容,以檢測是否遭到破壞;日志監(jiān)控定時將所有日志文件通過索引引擎制成索引文件提供給監(jiān)控平臺,監(jiān)控平臺通過搜索引擎將日志文件進行特定分類,以便于系統(tǒng)維護人員查找。
電子渠道的實施為廣電營銷建立了全新的途徑,為多渠道營銷帶來了更多的可能性,為江蘇有線蘇州分公司在移動互聯(lián)網時代的整體競爭力、實現(xiàn)創(chuàng)新發(fā)展提供了有力的支持,對于整合傳統(tǒng)內容、拓寬營銷渠道、優(yōu)化用戶交互方式等方面有著指導意義。同時,通過大數(shù)據(jù)技術的應用,進一步發(fā)揮了現(xiàn)有電子渠道的作用,通過用戶行為分析,使業(yè)務運營發(fā)展始終基于科學預測,提升了用戶的認可度。
參考文獻:
[1]王喆.基于Hybrid App的手機銀行開發(fā)與探索[D].天津:天津大學2013.
[2]韋恩敏.廣電網絡渠道建設及運營淺析[J].中國數(shù)字電視,2011(7).
[3]王朝暉.湖南移動多電子渠道建設研究[D].長沙:中南大學2007.
(上接第210頁)