陽歲紅 于英濤 方鐳
(1.江西省委信息保障中心 江西省南昌市 330036 2.華北計(jì)算技術(shù)研究所 北京市 100083)
為了保障網(wǎng)絡(luò)空間安全,提升我國信息化能力和數(shù)字經(jīng)濟(jì)水平,我國將信創(chuàng)(信息技術(shù)應(yīng)用創(chuàng)新)納入國家信息化發(fā)展戰(zhàn)略。所謂信創(chuàng)建設(shè)就是從關(guān)鍵環(huán)節(jié)核心組件的自的設(shè)備品牌、類型眾多、設(shè)備質(zhì)量參差不齊、運(yùn)維服務(wù)業(yè)務(wù)繁雜、壓力大、不能有效地對問題進(jìn)行系統(tǒng)化、自動(dòng)化分析與統(tǒng)計(jì)等主創(chuàng)新入手,從政府信息化等關(guān)鍵行業(yè)試點(diǎn),從而逐步建立自主知識產(chǎn)權(quán)的IT 底層架構(gòu)和標(biāo)準(zhǔn),實(shí)現(xiàn)全I(xiàn)T 全產(chǎn)業(yè)鏈實(shí)力和結(jié)構(gòu)的優(yōu)化升級。近年來,信創(chuàng)產(chǎn)業(yè)出現(xiàn)爆發(fā)式的增長,改造和新建了大量的基于信創(chuàng)環(huán)境的信息化系統(tǒng),這些系統(tǒng)的運(yùn)維管理也將迎來挑戰(zhàn)和機(jī)遇。
運(yùn)維管理是信息化部門的基本職能,如何提高運(yùn)行維護(hù)效率,規(guī)范運(yùn)維管理行為,使業(yè)務(wù)部門對信息部門提供的信息服務(wù)更為滿意,是信息部門一直思考的問題?;谛艅?chuàng)環(huán)境的運(yùn)維管理系統(tǒng),通過對原有運(yùn)維系統(tǒng)進(jìn)行適配改造并部署,實(shí)現(xiàn)對國產(chǎn)軟硬件設(shè)備監(jiān)控和管理,可以為運(yùn)維工程師提供統(tǒng)一的工作平臺和技術(shù)手段。通過掌握基礎(chǔ)設(shè)施狀況和實(shí)時(shí)運(yùn)行情況,提供運(yùn)維縱向、橫向的協(xié)同手段,可以實(shí)現(xiàn)對基礎(chǔ)資源的統(tǒng)一監(jiān)控、資產(chǎn)臺賬信息的統(tǒng)一維護(hù)管理、運(yùn)維流程的規(guī)范化管理、各類數(shù)據(jù)的統(tǒng)一門戶展現(xiàn),從而加強(qiáng)IT 系統(tǒng)維護(hù)能力、提高維護(hù)工作效率、改善維護(hù)工作的質(zhì)量,進(jìn)而保證各系統(tǒng)維護(hù)水平的可持續(xù)性提升。
因此,針對當(dāng)前信創(chuàng)環(huán)境信息化項(xiàng)目在服務(wù)運(yùn)維和保障中存在的設(shè)備品牌、類型眾多、設(shè)備質(zhì)量參差不齊,運(yùn)維服務(wù)業(yè)務(wù)繁雜、工作壓力大、難以有效對問題進(jìn)行系統(tǒng)化、自動(dòng)化分析與統(tǒng)計(jì)等難題,通過規(guī)范化、統(tǒng)一化和清晰化的處理和管理工單事務(wù),建立基于信創(chuàng)環(huán)境的運(yùn)維管理系統(tǒng)勢在必行。它不僅能夠滿足信創(chuàng)環(huán)境信息系統(tǒng)運(yùn)行保障及后續(xù)升級需要,而且可以為部門或行業(yè)的信息化工程提供有力的技術(shù)支撐與保障。
根據(jù)基于信創(chuàng)環(huán)境的運(yùn)維管理實(shí)際需求,系統(tǒng)設(shè)計(jì)按照為最終用戶提供服務(wù)的角色層次分成用戶接入服務(wù)層、服務(wù)核心業(yè)務(wù)層和平臺數(shù)據(jù)服務(wù)層。系統(tǒng)總體架構(gòu)如圖1 所示。
圖1: 基于信創(chuàng)環(huán)境的運(yùn)維管理系統(tǒng)總體架構(gòu)圖
其中,用戶接入服務(wù)層是運(yùn)維服務(wù)平臺面向設(shè)備使用者、現(xiàn)場工程師、原廠工程師等角色的交互層,它包括面向終端設(shè)備使用者的一鍵服務(wù)終端,面向現(xiàn)場和原廠工程師等角色的微信平臺,面向統(tǒng)一電話接入的服務(wù)熱線入口。核心業(yè)務(wù)層提供運(yùn)維服務(wù)平臺的核心業(yè)務(wù)能力,目前它包括:智能服務(wù)臺,工單系統(tǒng),服務(wù)供應(yīng)商管理系統(tǒng),設(shè)備管理系統(tǒng),終端監(jiān)控系統(tǒng),服務(wù)器監(jiān)控系統(tǒng),應(yīng)用監(jiān)控系統(tǒng),未來可以支撐業(yè)務(wù)能力的持續(xù)擴(kuò)展。平臺數(shù)據(jù)服務(wù)層是為上層的核心業(yè)務(wù)層的各個(gè)系統(tǒng)提供公共接口和數(shù)據(jù)交換服務(wù)。
2.2.1 電話服務(wù)熱線統(tǒng)一的對外服務(wù)熱線,通過電話服務(wù)熱線入口,為用戶提供個(gè)性化的服務(wù)。為給用戶提供優(yōu)質(zhì)的服務(wù),這就需要客服人員必須,熟悉服務(wù)運(yùn)作流程,達(dá)到用戶滿意的同時(shí),提高工作效率,迅速找到解決方案,減少每個(gè)電話的占線時(shí)間,盡快應(yīng)答隊(duì)列中下一客戶的電話。
2.2.2 一鍵服務(wù)客戶端
一鍵幫助服務(wù)客戶端是終端設(shè)備用戶的嵌入式服務(wù)入口。當(dāng)用戶在終端設(shè)備按下鍵盤上的幫助熱鍵,一鍵幫助服務(wù)客戶端的服務(wù)窗口啟動(dòng),用戶可以在服務(wù)窗口中查詢常見問題,進(jìn)行自助服務(wù);也可以由智能文本機(jī)器人引導(dǎo)受理服務(wù)請求,分流至在線運(yùn)維工程師來處理解決。
2.2.3 微信平臺
微信平臺中的微信小程序和服務(wù)號是對外服務(wù)窗口。微信小程序?yàn)榭头峁┕涡陆ā⒐尾樵?、工單追蹤等功能;為運(yùn)維工程師提供工單查看、工單修改、工單維護(hù)等功能;為用戶提供掃碼報(bào)修、進(jìn)度追蹤、服務(wù)評價(jià)、查閱知識庫信息等功能;為各單位信息化管理者提供每天、每月的報(bào)障情況,故障分析等功能。微信服務(wù)號主要是幫助用戶了解行業(yè)動(dòng)態(tài)、提醒用戶和運(yùn)維工程師工單信息,幫助提高故障解決效率。如圖2 所示。
圖2
2.2.4 智能服務(wù)臺
智能服務(wù)臺主要是通過集中化部署、集中化服務(wù)受理、多級工程師支持流程等方式,為用戶在使用終端設(shè)備和應(yīng)用服務(wù)過程中遇到的問題進(jìn)行受理、通過整合各種資源信息進(jìn)行處理、對處理結(jié)果進(jìn)行滿意度回訪,保障運(yùn)維工作的順利開展。系統(tǒng)支持來電智能分配功能、根據(jù)在線客服的服務(wù)狀態(tài)、當(dāng)前服務(wù)隊(duì)列、排隊(duì)情況進(jìn)行智能分配給空余客服,提高服務(wù)響應(yīng)效率。
2.2.5 工單系統(tǒng)
工單管理模塊主要為用戶、客服和運(yùn)維工程師提供在線工單服務(wù),用戶可通過微信端快速創(chuàng)建工單,客服、運(yùn)維工程師可通過網(wǎng)頁創(chuàng)建工單。主要包括工單新建、工單修改、工單分配、工單確認(rèn)、工單全程追蹤、評價(jià)、查詢、歷史回溯、導(dǎo)出等功能,通過標(biāo)準(zhǔn)化工單體系,來使工單系統(tǒng)所有的操作,處理,管理和維護(hù)全部滿足和履行該標(biāo)準(zhǔn)化的內(nèi)容,避免服務(wù)拖延,服務(wù)延遲,避免降低服務(wù)質(zhì)量和資源浪費(fèi),通過SLA 服務(wù)目標(biāo)能讓工單系統(tǒng)的工單處理操作和相關(guān)服務(wù)進(jìn)行是否達(dá)標(biāo)評定。如圖3 所示。
圖3
2.2.6 知識庫
知識庫系統(tǒng)作為安全可靠知識和運(yùn)維經(jīng)驗(yàn)的收集和共享平臺,將系統(tǒng)維護(hù)案例、安全可靠領(lǐng)域內(nèi)相關(guān)產(chǎn)品知識、技術(shù)知識、技能知識、經(jīng)驗(yàn)方法等知識進(jìn)行體系化的梳理和積累并提供查詢。通過這個(gè)知識共享平臺,為技術(shù)人員、使用者提供發(fā)現(xiàn)問題和解決問題的能力,減少重復(fù)勞動(dòng)。知識庫系統(tǒng)涵蓋知識的提交、審核、共享、應(yīng)用、創(chuàng)新、消亡等整個(gè)生命周期,統(tǒng)一整理、統(tǒng)一錄入,實(shí)現(xiàn)知識的整合、記錄、查詢及共享。如圖4 所示。
圖4
2.2.7 服務(wù)供應(yīng)商管理
此系統(tǒng)功能包括兩塊,一是用于客服創(chuàng)建工單時(shí)填寫設(shè)備、應(yīng)用所屬供應(yīng)商信息,可根據(jù)供應(yīng)商名稱模糊查詢,并返回查詢結(jié)果,在后期進(jìn)行數(shù)據(jù)分析時(shí)可按供應(yīng)商維度分析設(shè)備運(yùn)行情況、設(shè)備維修情況、服務(wù)水平、故障解決情況。二是從服務(wù)的視角組織管理設(shè)備和應(yīng)用的原廠商,以便有效合規(guī)地把原廠商納入服務(wù)體系,打通服務(wù)能力。系統(tǒng)提供對供應(yīng)商的基礎(chǔ)信息,服務(wù)合同,以及服務(wù)SLA 的管理。包括供應(yīng)商內(nèi)容管理、供應(yīng)商合同內(nèi)容管理、數(shù)據(jù)查詢與修改、供應(yīng)商狀態(tài)管理。
2.2.8 設(shè)備管理系統(tǒng)
設(shè)備管理對終端設(shè)備、服務(wù)器設(shè)備等進(jìn)行信息狀態(tài)維護(hù)管理,建立以信息化為核心的管理方法,解決設(shè)備不清,設(shè)備閑置等問題,減輕設(shè)備管理人員數(shù)據(jù)處理負(fù)擔(dān),提高設(shè)備管理效率。包括設(shè)備添加、維護(hù)、查詢、刪除、搜索功能,以及對各類軟硬件設(shè)備資產(chǎn)數(shù)據(jù)導(dǎo)入和導(dǎo)出功能。管理員可查看所有用戶單位設(shè)備信息,各用戶單位管理員可查看本單位和所轄單位設(shè)備信息。設(shè)備信息查詢時(shí)可根據(jù)設(shè)備領(lǐng)用單位、設(shè)備廠商、設(shè)備SN 碼、設(shè)備分類進(jìn)行查詢。查詢時(shí)返回匹配結(jié)果包括設(shè)備的配置信息、當(dāng)前領(lǐng)用單位、設(shè)備廠商、所在位置、領(lǐng)用時(shí)間、服務(wù)期限等。如圖5 所示。
圖5
2.2.9 備品備件管理
備品備件是設(shè)備檢修、運(yùn)行、提高問題解決效率的重要保證,備件管理對IT 設(shè)備的可靠運(yùn)行起著至關(guān)重要的作用。備品備件管理系統(tǒng)包含對備件供應(yīng)商的管理、備件類型的管理、備件出入庫管理、備件報(bào)廢管理、備件查詢管理、備件申請管理等功能。
2.2.10 終端監(jiān)控系統(tǒng)
設(shè)備監(jiān)控系統(tǒng)用來采集設(shè)備運(yùn)行數(shù)據(jù),為設(shè)備管理模塊提供數(shù)據(jù)和接口服務(wù)。能夠靈活地對監(jiān)控對象、數(shù)據(jù)收集間隔等進(jìn)行配置,并提供管理界面,對終端設(shè)備的使用情況進(jìn)行數(shù)字化跟蹤和分析。
終端監(jiān)控代理完成終端設(shè)備適配后,通過母盤預(yù)裝在終端設(shè)備(即電腦PC 終端),需要具備開機(jī)自動(dòng),隨系統(tǒng)內(nèi)置操作系統(tǒng)服務(wù)中,并以root 身份運(yùn)行,具有讀取系統(tǒng)運(yùn)行數(shù)據(jù)的權(quán)限。系統(tǒng)自動(dòng)獲取終端系統(tǒng)SN 碼,與設(shè)備管理中SN 碼進(jìn)行匹配,匹配成功后,監(jiān)控自行啟動(dòng)。通過監(jiān)控時(shí)間段內(nèi)設(shè)備鼠標(biāo)的使用情況,進(jìn)而判斷該設(shè)備是否真正的被使用,并將此信息進(jìn)行數(shù)據(jù)上報(bào),作為后續(xù)終端設(shè)備推廣實(shí)際效果的判斷依據(jù)。
2.2.11 服務(wù)器監(jiān)控系統(tǒng)
服務(wù)器監(jiān)控系統(tǒng)可以實(shí)現(xiàn)對服務(wù)器、網(wǎng)絡(luò)設(shè)備、安全設(shè)備、Web 服務(wù)器、數(shù)據(jù)庫等進(jìn)行統(tǒng)一的監(jiān)控管理,對服務(wù)器設(shè)備的資源情況進(jìn)行數(shù)字化跟蹤和分析??梢愿鶕?jù)相關(guān)監(jiān)控指標(biāo)進(jìn)行故障報(bào)警,能夠設(shè)置不同類型資源的策略規(guī)則,并關(guān)聯(lián)指定的資源,策略匹配之后進(jìn)行觸發(fā)告警及消息提示,對預(yù)警信息、故障信息進(jìn)行整合處理,為用戶提供即時(shí)有效的風(fēng)險(xiǎn)提示。
服務(wù)器監(jiān)控代理提供運(yùn)行時(shí)多種指標(biāo)監(jiān)控,包括靜態(tài)信息和系統(tǒng)運(yùn)行的狀態(tài)信息,如:CPU 使用率、內(nèi)存使用情況、文件系統(tǒng)使用情況、文件系統(tǒng)IO 情況、網(wǎng)絡(luò)接口使用情況等為管理人員呈現(xiàn)XC 服務(wù)器的健康狀態(tài),對異常情況進(jìn)行告警提示。安全設(shè)備監(jiān)控代理能夠?qū)Π踩O(shè)備運(yùn)行狀態(tài)監(jiān)控,包括防火墻、IPS、IDS、網(wǎng)關(guān)等硬件設(shè)備等,主要監(jiān)控指標(biāo)包括CPU 使用率、內(nèi)存使用率、設(shè)備在線狀態(tài)、設(shè)備響應(yīng)時(shí)間等。
2.2.12 應(yīng)用監(jiān)控系統(tǒng)
信息系統(tǒng)存在眾多服務(wù)應(yīng)用,針對應(yīng)用服務(wù)的運(yùn)行狀態(tài)進(jìn)行動(dòng)態(tài)監(jiān)控,并能夠通過配置不同的閾值來進(jìn)行預(yù)警,從而實(shí)現(xiàn)主動(dòng)IT 支持服務(wù),保障應(yīng)用服務(wù)的持續(xù)可用性。應(yīng)用監(jiān)控系統(tǒng)會根據(jù)不同應(yīng)用實(shí)現(xiàn)方式來安裝不同的監(jiān)控探針,設(shè)置不同的監(jiān)控指標(biāo),從而實(shí)現(xiàn)精確監(jiān)控、提前預(yù)警。其中還包含了對中間件Web 線程池利用率、當(dāng)前線程數(shù)、忙碌線程數(shù)、響應(yīng)時(shí)間等信息監(jiān)控以及數(shù)據(jù)庫共享內(nèi)存使用、占用CPU 時(shí)長、數(shù)據(jù)庫狀態(tài)等指標(biāo)監(jiān)控,保障數(shù)據(jù)庫安全,優(yōu)化數(shù)據(jù)庫性能。
2.2.13 身份認(rèn)證系統(tǒng)
身份認(rèn)證即用戶管理、授權(quán)管理系統(tǒng),用戶管理系統(tǒng)主要提供用戶注冊和用戶管理服務(wù)??梢詾橛脩籼峁┪⑿哦丝焖僮浴€(gè)人信息維護(hù)等功能;為管理人員提供服務(wù)機(jī)構(gòu)維護(hù)、服務(wù)人員維護(hù)、客服小組管理、廠商管理等功能。授權(quán)管理系統(tǒng)是按照角色訪問系統(tǒng)的權(quán)限提供管理服務(wù),通過系統(tǒng)建立用戶、客服、運(yùn)維工程師、系統(tǒng)管理員等角色,并進(jìn)行權(quán)限分配。如圖6 所示。
圖6
目前,該運(yùn)維管理系統(tǒng)已穩(wěn)定運(yùn)行并成功服務(wù)于政府部門信創(chuàng)工程項(xiàng)目,取得了較好的建設(shè)成效。通過信息化管理手段和方式,將運(yùn)行維護(hù)中的多種資源和信息整合為面向管理者、使用者、技術(shù)人員的運(yùn)維管理平臺,實(shí)現(xiàn)了統(tǒng)一的基礎(chǔ)設(shè)施管理、運(yùn)維工作與績效管理、技術(shù)支撐等,提升了整體運(yùn)維服務(wù)水平。據(jù)統(tǒng)計(jì),2021 年下半年該系統(tǒng)服務(wù)情況如表1 所示。
表1: 基于信創(chuàng)環(huán)境的運(yùn)維管理系統(tǒng)服務(wù)情況2021 年下半年服務(wù)情況表
該項(xiàng)目建立了一套完整、統(tǒng)一的工單運(yùn)維服務(wù)體系,支持項(xiàng)目的日常運(yùn)維工作,提供用戶幫助支持、售后支持、IT服務(wù)支持,形成了流程化、規(guī)范化、統(tǒng)一化的事件管理方式,高效、成功地解決了用戶發(fā)起的各種事件請求,為項(xiàng)目各類產(chǎn)品的故障情況進(jìn)行總結(jié)和分析,及時(shí)發(fā)現(xiàn)產(chǎn)品質(zhì)量問題、使用問題、生態(tài)問題,為政府部門、運(yùn)維服務(wù)單位、廠家等有針對性地解決問題、開展培訓(xùn)工作、提升技術(shù)人員專業(yè)技能、促進(jìn)產(chǎn)業(yè)生態(tài)發(fā)展提供了有效的依據(jù)。具體包括:
(1)統(tǒng)一化、流程化管理事件、服務(wù)請求、建議等工單,客服、客戶、技術(shù)溝通無障礙,同平臺溝通交互,快速地解決了用戶問題,提升了服務(wù)質(zhì)量和用戶滿意度??头?、用戶、技術(shù)均可以通過電話服務(wù)熱線、一鍵服務(wù)客戶端、微信小程序、智能服務(wù)臺等方式報(bào)工單;工程師通過小程序接收工單,并及時(shí)錄入工單處理情況,對處理完畢的工單,進(jìn)行故障分析、總結(jié);客服、用戶可以通過小程序查看自己所創(chuàng)建工單的處理進(jìn)度,對工單進(jìn)行督辦。
(2)服務(wù)單位將系統(tǒng)中的知識庫按照一定的方法進(jìn)行分類保存,并方便編輯、修改,用戶通過微信小程序查詢知識庫內(nèi)容,自助解決問題,加快了知識的流動(dòng),有利于知識共享與交流,提升了服務(wù)滿意度。
(3)用戶可以在微信服務(wù)號中查閱服務(wù)臺對外發(fā)布的公告、通知等信息,總攬自己發(fā)起工單的全過程,了解政府政策、掌握行業(yè)動(dòng)態(tài)。
(4)備件管理和工單管理數(shù)據(jù)在系統(tǒng)中實(shí)時(shí)呈現(xiàn),備品備件調(diào)度得心應(yīng)手,充分提升了整體軟硬件平臺事件的解決效率和管理水平,實(shí)現(xiàn)了政府部門通過可視化和量化指標(biāo)對運(yùn)維工作進(jìn)行考核。
(5)通過對資產(chǎn)進(jìn)行全生命周期的管控,實(shí)現(xiàn)資產(chǎn)透明化。通過權(quán)限管理,實(shí)現(xiàn)所有權(quán)、管理權(quán)、使用權(quán)分離,一方面確保資產(chǎn)安全可靠、另一方面方便政府部門了解各單位設(shè)備的使用情況、故障情況,了解廠家的故障率、解決率等信息。
針對當(dāng)前信創(chuàng)環(huán)境信息化項(xiàng)目在服務(wù)運(yùn)維管理中存在的難題,建立了一種基于信創(chuàng)環(huán)境的運(yùn)維管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)方法。該運(yùn)維平臺實(shí)現(xiàn)了運(yùn)維服務(wù)過程中的資產(chǎn)管理、服務(wù)臺管理、工單管理、備件管理、知識庫管理等管理功能,能夠支持相關(guān)軟硬件運(yùn)行維護(hù)工作,為運(yùn)維服務(wù)提供了有力的技術(shù)支撐與保障,是用戶、客服、運(yùn)維和廠商之間溝通、協(xié)調(diào)和服務(wù)保障的系統(tǒng)。平臺根據(jù)不同組織、部門和客戶的需求,通過統(tǒng)一門戶展現(xiàn),標(biāo)準(zhǔn)化的流程和操作,對設(shè)備使用情況、運(yùn)維服務(wù)情況進(jìn)行自動(dòng)分析和統(tǒng)計(jì)等滿足了操作層、管理層、決策層的業(yè)務(wù)需求,實(shí)現(xiàn)了管理的規(guī)范化、信息化,保證了各系統(tǒng)維護(hù)水平的可持續(xù)性提升,提高了政府部門的運(yùn)維管理效率和和企業(yè)的運(yùn)維服務(wù)水平。