国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

“宕機(jī)”背后云安全的問(wèn)題有多少?

2019-03-19 03:51梅雅鑫
通信世界 2019年7期
關(guān)鍵詞:災(zāi)備誤操作可靠性

本刊記者|梅雅鑫

近日,阿里云突發(fā)的宕機(jī)事件又將云安全推到風(fēng)口浪尖,據(jù)了解,此次事件是阿里云華北2地域可用區(qū)C部分的ECS服務(wù)器(云服務(wù)器)等實(shí)例出現(xiàn)IO HANG(IO不響應(yīng))導(dǎo)致的。阿里云經(jīng)緊急排查處理后,業(yè)務(wù)已全部恢復(fù)。同時(shí),阿里云方面表示,將根據(jù)SLA協(xié)議(服務(wù)合同)盡快處理因此次故障受影響企業(yè)的賠償事宜。

但是比起賠償,業(yè)內(nèi)人士更加關(guān)注此次宕機(jī)事件帶來(lái)的影響和事件背后折射出的問(wèn)題。經(jīng)過(guò)十余年的發(fā)展,中國(guó)的云計(jì)算市場(chǎng)已經(jīng)初具規(guī)模,各種新技術(shù)、新應(yīng)用、新場(chǎng)景、新架構(gòu)成為公有云/私有云平臺(tái)市場(chǎng)保持快速、持續(xù)增長(zhǎng)的助推器。目前越來(lái)越多的企業(yè)將其業(yè)務(wù)系統(tǒng)、數(shù)據(jù)部署在云上,云服務(wù)器一旦宕機(jī),企業(yè)業(yè)務(wù)必然會(huì)受波及。因而安全被各企業(yè)視為頭等要?jiǎng)?wù)。

理論上不存在“永不宕機(jī)”的云

事實(shí)上,不止是阿里云,其他云服務(wù)提供商也都出現(xiàn)過(guò)宕機(jī)事件。僅2018年一年,全球主流云計(jì)算廠商曾發(fā)生數(shù)十起宕機(jī)事故。

2018年1月18日,谷歌云自動(dòng)化失效導(dǎo)致宕機(jī);

2018年3月2日,AWS宕機(jī)致部分Alexa失聲;

2018年5月31日,AWS北弗吉尼亞地區(qū)數(shù)據(jù)中心出現(xiàn)硬件問(wèn)題;

2018年6月17日,因愛(ài)爾蘭數(shù)據(jù)中心的恒溫系統(tǒng)出現(xiàn)問(wèn)題,微軟Azure愛(ài)爾蘭數(shù)據(jù)中心宕機(jī);

2018年7月20日,騰訊云云硬盤故障;

2018年9月4日,微軟云Azure數(shù)據(jù)中心遭雷劈宕機(jī);

2018年11月9日,谷歌公有云下的Kubernetes服務(wù)(GKE)宕機(jī);

不難發(fā)現(xiàn),雖然宕機(jī)的原因不盡相同,但宕機(jī)卻時(shí)有發(fā)生。

據(jù)悉,云服務(wù)產(chǎn)生故障的原因一般分為兩類:一是因?yàn)檎`操作導(dǎo)致的問(wèn)題(用不用云服務(wù)都有這個(gè)問(wèn)題),二是云平臺(tái)故障導(dǎo)致的問(wèn)題。中國(guó)信息通信研究院云計(jì)算與大數(shù)據(jù)研究所所長(zhǎng)何寶宏也表示,目前發(fā)生的宕機(jī)事故約80%是因?yàn)榧夹g(shù)人員操作不規(guī)范或“誤操作”導(dǎo)致的,相比于“誤操作”,云平臺(tái)故障的技術(shù)問(wèn)題僅占20%。

云服務(wù)提供商的云平臺(tái)可提供服務(wù)器快照、數(shù)據(jù)庫(kù)備份和日志備份等諸多功能,這些功能為企業(yè)帶來(lái)了便利,遠(yuǎn)比企業(yè)自己構(gòu)建類似的服務(wù)簡(jiǎn)單好用,但是涉及到權(quán)限問(wèn)題就值得思考了。企業(yè)使用云平臺(tái)上的賬戶權(quán)限管理時(shí),嚴(yán)格地避免無(wú)意或者惡意的“誤操作”很重要,因?yàn)槿绻品?wù)管理權(quán)限每個(gè)人都有,那么很容易出現(xiàn)“誤操作”的問(wèn)題,所以要嚴(yán)格控制賬戶管理的權(quán)限。

無(wú)論是傳統(tǒng)的環(huán)境,還是云環(huán)境,都不能做到絕對(duì)“持續(xù)可用”。何寶宏對(duì)此表示,理論上任何技術(shù)或者服務(wù)出現(xiàn)中斷都是不可避免的,僅是概率大小的問(wèn)題。

雖然所有的云服務(wù)都不是絕對(duì)安全的,沒(méi)有辦法100%保證系統(tǒng)的正常。但是大部分情況下,云環(huán)境的可用性和可靠性都比傳統(tǒng)環(huán)境高,這主要是因?yàn)樵破脚_(tái)的運(yùn)維更加專業(yè)。可見(jiàn),盡管云會(huì)發(fā)生故障,但云仍然是值得信任的。

服務(wù)可靠性、業(yè)務(wù)連續(xù)性需不斷加強(qiáng)

未來(lái)云服務(wù)或?qū)⑾袼娒阂粯映蔀榛A(chǔ)設(shè)施。停電1分鐘,對(duì)于一般家庭而言,也許只意味著少看一會(huì)兒電視、少吹一會(huì)兒空調(diào),但對(duì)于企業(yè)而言,或許意味著一條生產(chǎn)線的癱瘓、整個(gè)生產(chǎn)流程的推倒重來(lái)。同理,云服務(wù)器宕機(jī)1分鐘,對(duì)于云服務(wù)提供商來(lái)說(shuō)是一次運(yùn)維故障,但對(duì)企業(yè)而言,或許意味著客戶的流失甚至企業(yè)破產(chǎn),特別是不可逆的故障不是云服務(wù)提供商賠償就能挽回的。

有業(yè)內(nèi)專家透露,宕機(jī)的后果可以分為兩種,一種是可恢復(fù)的,一種是不可恢復(fù)的。例如,此前騰訊云因硬盤故障導(dǎo)致一家初創(chuàng)公司近千萬(wàn)元的平臺(tái)數(shù)據(jù)丟失,且不能恢復(fù),讓騰訊云元?dú)獯髠c之相比,阿里云的損失就沒(méi)有那么慘重了。

而且此次事件折射出來(lái)的問(wèn)題并不完全屬于云安全范疇,隨著云計(jì)算在各垂直領(lǐng)域的不斷滲透,云服務(wù)的可靠性、業(yè)務(wù)連續(xù)性將成為下一步云計(jì)算發(fā)展的重中之重。

可靠性和業(yè)務(wù)連續(xù)性一直是電信業(yè)非常重視的指標(biāo),但云廠商對(duì)于服務(wù)可靠性的要求還不夠。何寶宏指出,該問(wèn)題并不只出現(xiàn)于云廠商提供的服務(wù)中,而是新興行業(yè)發(fā)展初期常常會(huì)遇到的問(wèn)題。例如,2016年國(guó)家電網(wǎng)公司經(jīng)營(yíng)區(qū)域內(nèi)城市配電網(wǎng)和農(nóng)村配電網(wǎng)的供電可靠率分別達(dá)到99.946%、99.782%,但隨著近年來(lái)工業(yè)互聯(lián)網(wǎng)的需求越來(lái)越大,對(duì)電網(wǎng)的依賴性越來(lái)越高,99.9999%的供電可靠率也逐漸出現(xiàn)。由此可見(jiàn),一項(xiàng)服務(wù)的可靠性可以隨著人們對(duì)該服務(wù)的依賴程度提升而越來(lái)越高。

未來(lái),云服務(wù)的可靠性和業(yè)務(wù)連續(xù)性也將會(huì)隨著企業(yè)上云以及垂直行業(yè)對(duì)云服務(wù)的依賴程度的加深而不斷提升。當(dāng)然這樣的提升需要更多經(jīng)驗(yàn)的積累和時(shí)間的考驗(yàn),眼下還是應(yīng)該盡量避免宕機(jī)事件的發(fā)生。

“多云”部署或成企業(yè)新保障

諸多宕機(jī)事件告訴我們,面對(duì)天災(zāi)人禍,不論是公有云還是私有云都不能獨(dú)善其身。為減少業(yè)務(wù)中斷帶來(lái)的損失,云服務(wù)廠商需要構(gòu)建云容災(zāi)方案。

何寶宏指出,預(yù)防宕機(jī)發(fā)生可以從多個(gè)方面著手。

一是云廠商技術(shù)的完善,即不斷地增強(qiáng)云服務(wù)的可靠性和業(yè)務(wù)連續(xù)性,但毋庸置疑的是無(wú)論可靠性達(dá)到幾個(gè)9都無(wú)法保證云服務(wù)“永不宕機(jī)”。

二是企業(yè)需根據(jù)自身特點(diǎn)選擇云災(zāi)備和云保險(xiǎn)服務(wù),盡量在經(jīng)濟(jì)和人員條件可行的情況下使用這些服務(wù)分散風(fēng)險(xiǎn),如果故障只出現(xiàn)在一個(gè)服務(wù)器集群,采用異地災(zāi)備的方案,就可以以最快時(shí)間切換到另一個(gè)集群,保持系統(tǒng)可用;云保險(xiǎn)則是企業(yè)的最后一道屏障。

三是增強(qiáng)用云規(guī)范意識(shí),為避免由于人員的“誤操作”或者相關(guān)人員操作不規(guī)范造成的宕機(jī)事故,相關(guān)企業(yè)和政府機(jī)構(gòu)應(yīng)加強(qiáng)技術(shù)人員的培訓(xùn)和建立災(zāi)備意識(shí),企業(yè)的IT人員日常應(yīng)做到異機(jī)備份、數(shù)據(jù)容災(zāi)、業(yè)務(wù)雙活、定期對(duì)災(zāi)備和雙活進(jìn)行演練等,盡可能避免云故障帶來(lái)的損失。

宕機(jī)事件的發(fā)生使不少企業(yè)對(duì)云服務(wù)的部署方式產(chǎn)生了質(zhì)疑,于是,“多云戰(zhàn)略”成為很多企業(yè)正在考慮的方案。業(yè)內(nèi)分析師也坦言,真正安全的方式需要將重要業(yè)務(wù)分別放在不同的“籃子”里,也就是選擇多個(gè)供應(yīng)商,進(jìn)行“多云”部署?!岸嘣啤辈渴鸨旧硪彩且环N災(zāi)備預(yù)案,如果自身服務(wù)非常重要,可以考慮租用多個(gè)云服務(wù)器互為主備,或者自建機(jī)房,只是這樣成本和技術(shù)復(fù)雜度會(huì)成倍增加。

對(duì)于初創(chuàng)企業(yè)或中小企業(yè)而言,自建機(jī)房的運(yùn)維難度很大,運(yùn)維水平也遠(yuǎn)低于大的云服務(wù)廠商,因而故障概率更大、損失更加不可控。所以采用多云或混合云可能是未來(lái)最為靠譜的方案,純公有云、純私有云都是不太安全的解決方案。

而有實(shí)力的企業(yè)應(yīng)該盡可能自建服務(wù)器,將核心數(shù)據(jù)、核心業(yè)務(wù)邏輯放在自己的內(nèi)網(wǎng)服務(wù)器上,前端模塊等可以考慮放在公有云服務(wù)器上,這樣的話可以最大限度地實(shí)現(xiàn)風(fēng)險(xiǎn)分擔(dān),保障企業(yè)的用云安全。

猜你喜歡
災(zāi)備誤操作可靠性
基于鐵路主數(shù)據(jù)中心建設(shè)的災(zāi)備管理系統(tǒng)框架研究
合理使用及正確測(cè)試以提升DC/DC變換器可靠性
GO-FLOW法在飛機(jī)EHA可靠性分析中的應(yīng)用
對(duì)一起誤操作事故的幾點(diǎn)看法
變電運(yùn)行電氣誤操作事故原因分析及防范措施
電子制作(2017年2期)2017-05-17
論如何提高電子自動(dòng)化控制設(shè)備的可靠性
發(fā)電廠供電設(shè)備電氣誤操作原因分析和對(duì)策探討
深藍(lán)云海“云災(zāi)備”正式上線
共享災(zāi)備走向智能化