嚴(yán)立忠
IT已經(jīng)變得越來越復(fù)雜,用戶迫切需要能夠簡化工作流程的技術(shù)。智能自動化的預(yù)測分析將取代人工密集型任務(wù)。
正確地運用人工智能(AI)和機(jī)器學(xué)習(xí),通過加強(qiáng)IT運營流程和工作的自動化,將會極大地簡化IT的運營。IT已經(jīng)變得越來越復(fù)雜,用戶迫切需要能夠簡化工作流程的技術(shù)。智能自動化的預(yù)測分析將取代人工密集型任務(wù)。IT部門能夠利用數(shù)據(jù)和人工智能迅速發(fā)現(xiàn)潛在的問題,提出解決現(xiàn)有問題的建議,通過自助服務(wù)和自我恢復(fù)功能簡化自動化流程,并預(yù)測未來的結(jié)果,從而估算出成本,優(yōu)化資產(chǎn)回報。
Gartner發(fā)現(xiàn)了這一趨勢,創(chuàng)造了“面向IT運營的人工智能(AIOps)”這一術(shù)語。試想一下,系統(tǒng)能夠為那些我們尚未想到的問題提供深刻見解—這正是AIOps的潛力所在。
AIOps不僅能夠提供解決問題的建議,還可以從過去的行為和解決方案中學(xué)習(xí),自動解決問題和預(yù)測故障,由此極大地簡化了IT。這要求機(jī)器的配置狀態(tài)具備可見性,還要理解過去的行為和交互—包括好的和壞的。AIOps通過自動應(yīng)用深度分析,確保在高性能IT環(huán)境下能夠主動做出決策,最終讓業(yè)務(wù)更加健康地運行,從而進(jìn)一步提高了IT運營分析(ITOA)能力。
DevOps對于業(yè)務(wù)必不可少:高速發(fā)展還是緩慢前行
DevOps是Development和Operations的組合,可以把DevOps看作開發(fā)(軟件工程)、技術(shù)運營和質(zhì)量保障(QA)三者的交集。
傳統(tǒng)的軟件組織將開發(fā)、IT運營和質(zhì)量保障設(shè)為各自分離的部門。在這種環(huán)境下如何采用新的開發(fā)方法,這是一個重要的課題:按照從前的工作方式,開發(fā)和部署不需要IT支持或者QA深入的、跨部門的支持,卻需要極其緊密的多部門協(xié)作。現(xiàn)在,DevOps考慮的是一套針對這幾個部門間溝通與協(xié)作問題的流程和方法。
雖然企業(yè)高層還不太熟悉DevOps,但它是當(dāng)今高度復(fù)雜和快速發(fā)展的環(huán)境中建立并保持競爭優(yōu)勢的關(guān)鍵所在。隨著每一家企業(yè)都將成為數(shù)字化企業(yè),企業(yè)開發(fā)并交付的數(shù)字服務(wù)將決定其業(yè)務(wù)的沉浮。競爭力取決于交付速度、客戶體驗質(zhì)量以及數(shù)字服務(wù)所實現(xiàn)的業(yè)務(wù)目標(biāo)。DevOps不僅使數(shù)字服務(wù)交付得更快,而且更高效,并能讓團(tuán)隊的工程和運營人員更好地參與進(jìn)來。要做到這樣,機(jī)構(gòu)必須具備靈活性,以便輕松地提高團(tuán)隊開發(fā)和交付服務(wù)的技能、流程和技術(shù)。
為實現(xiàn)DevOps所承諾的速度、質(zhì)量和業(yè)務(wù)影響,機(jī)構(gòu)將繼續(xù)采用新的人員配置方法和新技術(shù),為團(tuán)隊提供支持,使團(tuán)隊更敏捷。從吸收部門新概念(例如,自我管理團(tuán)隊和松散耦合的工具鏈等),到吸收新技術(shù)例如,容器、微服務(wù)、“功能即服務(wù)”解決方案,以及采用少代碼/無代碼方法開發(fā)軟件等,機(jī)構(gòu)將經(jīng)歷不斷的變化。因此,DevOps不僅意味著不同部門對生產(chǎn)服務(wù)的質(zhì)量和性能有統(tǒng)一全面的理解,而且對軟件開發(fā)、構(gòu)建和發(fā)布過程所涉及的質(zhì)量和性能也有統(tǒng)一全面的理解。
DevSecOps—下一個前沿
為滿足不斷提高的管理、審計和合規(guī)要求,同時保持發(fā)展速度,很多團(tuán)隊都將采用DevSecOps。正如IT部門正在進(jìn)行優(yōu)化,在其交付平臺和應(yīng)用程序中置入更多的監(jiān)測功能,他們的安全需求也會隨之優(yōu)化。這意味著開發(fā)人員將發(fā)揮更大的作用(以及承擔(dān)更多的責(zé)任),以確保其應(yīng)用程序和所處理數(shù)據(jù)的安全。同樣,安全部門還應(yīng)該更多地與開發(fā)和運營部門協(xié)作,以保證應(yīng)用程序和交付過程的安全。
為了應(yīng)對越來越老練的數(shù)字對手,企業(yè)必須促進(jìn)此前相互獨立的IT部門和安全部門之間更好的協(xié)作,以提升運營安全戰(zhàn)略,獲得業(yè)務(wù)成果;同時還要增強(qiáng)運營保護(hù)、檢測和響應(yīng)能力,降低IT風(fēng)險,減少網(wǎng)絡(luò)安全威脅和欺詐。
這里有個很好的案例:自從部署了領(lǐng)先的機(jī)器數(shù)字平臺Splunk Enterprise、能夠?qū)崟r監(jiān)測業(yè)務(wù)運營后,全中國發(fā)展最快的互聯(lián)網(wǎng)金融服務(wù)供應(yīng)機(jī)構(gòu)—快錢公司可以輕易地追蹤系統(tǒng)的異常情況并加以分析,積極減輕系統(tǒng)問題,可用性大大提高。配合其自行開發(fā)的大數(shù)據(jù)分析系統(tǒng),該公司可以通過Splunk平臺提升整體安全性,并且加強(qiáng)預(yù)防外來的入侵。其它問題也可以在1至2秒定位,例如交易延遲、系統(tǒng)停機(jī)和支付轉(zhuǎn)賬失敗等,達(dá)到“秒級報警”的目標(biāo)。即使是最復(fù)雜的故障排解任務(wù),也可以在2至3分鐘以內(nèi)完成。
不再有界限—企業(yè)之間的透明度
采用“可組合”的新方法來提供業(yè)務(wù)服務(wù),包括SaaS、容器和API,傳統(tǒng)的關(guān)于企業(yè)如何交付和運營應(yīng)用程序的概念不再適用。為能夠在當(dāng)今激烈的競爭環(huán)境中生存下去,IT部門應(yīng)與第三方協(xié)作以提高開發(fā)速度,提供更可靠的服務(wù)。IT部門將依靠很多這類第三方公司,包括從外包開發(fā),到借助于云或者服務(wù)提供商提供的服務(wù)等各種工作。這就要求IT運營部門能全面掌握各種內(nèi)部和外部服務(wù),無論在防火墻內(nèi)部還是外部,都能夠共享運營信息,進(jìn)一步提高透明度。
API將使所需透明度得以實現(xiàn),幫助形成跨越客戶、供應(yīng)商、員工和企業(yè)的生態(tài)支持系統(tǒng)的基礎(chǔ)。這將開啟企業(yè)應(yīng)用程序的新功能,以支持更快速的服務(wù)實驗和開發(fā),也使對應(yīng)用程序運行的安全性和可見性需求增加。
新型IT運營人員
隨著持續(xù)交付和DevOps的興起,一批新的IT運營專業(yè)人員正在定義怎樣交付和管理服務(wù)。在配置和容量方面與Python和Ruby一樣匹配,他們在系統(tǒng)自動化、架構(gòu)靈活性、開發(fā)人員授權(quán)和網(wǎng)站可靠性等方面處于領(lǐng)先地位,能夠更快地交付更好的應(yīng)用程序,并且有很好的用戶體驗。2017年度Splunk公共部門IT運營調(diào)查,與去年相比,至少60%的公共部門IT專業(yè)人士對履行職責(zé)的信心有所下降。Splunk軟件為IT和安全專業(yè)人員提供了分析解決方案,有助于提高其信心。很多專業(yè)人員不斷提高他們的軟件開發(fā)技能,以便更有效地與開發(fā)人員協(xié)作,因此,網(wǎng)站可靠性工程師(SRE)的角色將成為主流。