蓋國強(qiáng) 楊廷琨 謝筠 黃宸寧
(云和恩墨(北京)信息技術(shù)有限公司,北京 100026)
關(guān)系數(shù)據(jù)庫理論自20世紀(jì)70年代誕生以來,一舉成為數(shù)據(jù)庫市場(chǎng)上的核心理論,由此催生的一系列的數(shù)據(jù)庫軟件公司,已經(jīng)成為當(dāng)今數(shù)據(jù)庫市場(chǎng)上的統(tǒng)治者。而隨著大數(shù)據(jù)時(shí)代的來臨和數(shù)據(jù)庫技術(shù)應(yīng)用的不斷深入,今天幾乎所有的應(yīng)用系統(tǒng)后臺(tái)都運(yùn)行著各種數(shù)據(jù)庫軟件,存儲(chǔ)著各種類型的用戶數(shù)據(jù)。伴隨數(shù)據(jù)庫軟件的應(yīng)用,隨之形成了一個(gè)數(shù)據(jù)庫服務(wù)領(lǐng)域,在整個(gè)信息服務(wù)中承載著越來越重要的使命。本文將從數(shù)據(jù)庫服務(wù)范疇的服務(wù)定義、服務(wù)范圍、服務(wù)形式、服務(wù)品質(zhì)和市場(chǎng)規(guī)模等方面進(jìn)行分析闡述。
自1970年埃德加·科德 (Edgar F. Codd)博士發(fā)表了題為“大型共享數(shù)據(jù)庫的關(guān)系模型”的論文之后,關(guān)系型數(shù)據(jù)庫取得了蓬勃發(fā)展,在此基礎(chǔ)上全球涌現(xiàn)出大量商業(yè)和開源數(shù)據(jù)庫產(chǎn)品,如Oracle、DB2、SQL Server、MySQL、PostgreSQL等[1]。近年,隨著國內(nèi)基礎(chǔ)軟件的蓬勃發(fā)展,中國數(shù)據(jù)庫市場(chǎng)也涌現(xiàn)出大量的國產(chǎn)數(shù)據(jù)庫品牌,包括TiDB、PolarDB、GaussDB 、TDSQL、OceanBase、達(dá)夢(mèng)、GBase、巨杉、KingBase等。
生產(chǎn)實(shí)踐中各具特質(zhì)的數(shù)據(jù)在不斷推動(dòng)數(shù)據(jù)庫技術(shù)的發(fā)展,時(shí)至今日,從關(guān)系型到非關(guān)系型,從結(jié)構(gòu)化到非結(jié)構(gòu)化,從小數(shù)據(jù)到大數(shù)據(jù),數(shù)據(jù)庫正在不斷擴(kuò)展范疇,承載越來越重要的使命。數(shù)據(jù)庫按照數(shù)據(jù)存儲(chǔ)的形態(tài)可以分為關(guān)系型和非關(guān)系型(NoSQL為主)數(shù)據(jù)庫,按照數(shù)據(jù)應(yīng)用的形態(tài)又可以分為OLTP事務(wù)型和OLAP分析型數(shù)據(jù)庫。隨著新技術(shù)形態(tài)的引入,數(shù)據(jù)庫市場(chǎng)又催生了云生態(tài)的DBaaS 、融合SQL和NoSQL的NewSQL產(chǎn)品。當(dāng)然,今天的數(shù)據(jù)庫技術(shù)都在不斷互相借鑒成長,HTAP試圖提供混合事務(wù)分析處理能力,數(shù)據(jù)湖技術(shù)又嘗試把所有的企業(yè)數(shù)據(jù)統(tǒng)一存儲(chǔ),也就導(dǎo)致很難再去對(duì)數(shù)據(jù)進(jìn)行精確的歸類和區(qū)分。
如圖1所示,中國DBA聯(lián)盟與云和恩墨對(duì)數(shù)據(jù)庫產(chǎn)品進(jìn)行了粗略分類和歸納,從中可以看出百花齊放的數(shù)據(jù)庫生態(tài)格局。數(shù)據(jù)庫產(chǎn)品的極大豐富,也為用戶的應(yīng)用和運(yùn)維服務(wù)帶來了新的挑戰(zhàn)[2]。
關(guān)于“服務(wù)”,管理大師格羅魯斯將其定義為:“服務(wù)是由一種或一系列、或多或少具有無形特性的活動(dòng)所構(gòu)成的一種過程,這種過程是在客戶與員工、有形資源的互動(dòng)關(guān)系中進(jìn)行的,這些有形資源(有形產(chǎn)品或有形系統(tǒng))是作為客戶問題的解決方案而提供給客戶的。[3]”
進(jìn)一步,分析機(jī)構(gòu)Gartner為信息技術(shù)服務(wù)(IT Service)提供的定義是:信息技術(shù)服務(wù)是指應(yīng)用業(yè)務(wù)和技術(shù)專長,使組織能夠創(chuàng)建、管理、優(yōu)化或獲取信息和業(yè)務(wù)流程。信息技術(shù)服務(wù)市場(chǎng)可按提供服務(wù)所采用的技能類型(設(shè)計(jì)、構(gòu)建、運(yùn)行)來劃分。服務(wù)也有不同的類別,比如業(yè)務(wù)流程服務(wù)、應(yīng)用服務(wù)和基礎(chǔ)設(shè)施服務(wù)。如果將這些服務(wù)外包,則被稱為業(yè)務(wù)流程外包(Business Process Outsourcing,BPO)、應(yīng)用外包(Applications Outsourcing,AO)和基礎(chǔ)設(shè)施外包(Infrastructure Outsourcing)[4]。
數(shù)據(jù)庫服務(wù)是指圍繞著數(shù)據(jù)庫的規(guī)劃設(shè)計(jì)、建設(shè)實(shí)施、優(yōu)化提升、運(yùn)行維護(hù)等環(huán)節(jié),為數(shù)據(jù)庫系統(tǒng)提供正常使用所展開的信息技術(shù)工作。企業(yè)可以通過自建團(tuán)隊(duì)或者服務(wù)外包等方式提供數(shù)據(jù)庫服務(wù)。數(shù)據(jù)庫外包(Database Outsourcing)是指企業(yè)(數(shù)據(jù)擁有者)將自身的數(shù)據(jù)庫創(chuàng)建、訪問、維護(hù)、升級(jí)、管理等任務(wù)委托給專門的可以提供這些功能的第三方(數(shù)據(jù)庫服務(wù)提供者)管理[3]。
數(shù)據(jù)庫作為信息系統(tǒng)的基礎(chǔ)軟件發(fā)展至今,已經(jīng)有50多年的時(shí)間,由于數(shù)據(jù)庫產(chǎn)品和應(yīng)用、硬件基礎(chǔ)設(shè)施的聯(lián)系非常緊密,在很長一段時(shí)間內(nèi),國內(nèi)的數(shù)據(jù)庫服務(wù)工作主要以附屬技能的形式由應(yīng)用開發(fā)商和硬件服務(wù)商用戶提供保障。而隨著數(shù)據(jù)時(shí)代的不斷發(fā)展,數(shù)據(jù)庫對(duì)于企業(yè)的重要性越來越高,企業(yè)對(duì)于專業(yè)的服務(wù)需求越加迫切,獨(dú)立的數(shù)據(jù)庫服務(wù)廠商漸漸成長和呈現(xiàn)出來,由此形成了一個(gè)專業(yè)專注的數(shù)據(jù)庫服務(wù)領(lǐng)域。
在當(dāng)前數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,企業(yè)已經(jīng)開始運(yùn)用海量實(shí)時(shí)數(shù)據(jù)來分析業(yè)務(wù)發(fā)展、了解客戶行為和優(yōu)化配置資源,并據(jù)此制定企業(yè)發(fā)展戰(zhàn)略。數(shù)據(jù)是數(shù)字化組織增強(qiáng)洞察力、驅(qū)動(dòng)業(yè)務(wù)持續(xù)發(fā)展的重要武器。數(shù)據(jù)庫系統(tǒng)作為數(shù)據(jù)存儲(chǔ)的主要載體,其數(shù)據(jù)庫服務(wù)貫穿企業(yè)IT系統(tǒng)的整個(gè)生命周期。按照信息系統(tǒng)建設(shè)的不同階段,數(shù)據(jù)庫服務(wù)主要在規(guī)劃設(shè)計(jì)、建設(shè)實(shí)施、優(yōu)化提升、運(yùn)行管理4個(gè)階段展開,整個(gè)數(shù)據(jù)庫的生命周期就如同一個(gè)建筑體的生命周期。
(1)規(guī)劃設(shè)計(jì)階段:此階段是藍(lán)圖的制定階段,以保證穩(wěn)健出眾的建筑輸出。數(shù)據(jù)庫規(guī)劃選型及數(shù)據(jù)庫架構(gòu)設(shè)計(jì)是這一階段的關(guān)鍵,理想的數(shù)據(jù)架構(gòu)應(yīng)該由數(shù)據(jù)專家與業(yè)務(wù)專家進(jìn)行需求分析、模型設(shè)計(jì),并進(jìn)行物理架構(gòu)的合理規(guī)劃,才能真正實(shí)現(xiàn)架構(gòu)領(lǐng)先和應(yīng)用性能可控。
(2)建設(shè)實(shí)施階段:此階段是建筑的奠基搭建階段,以實(shí)現(xiàn)前期的設(shè)計(jì)規(guī)劃。數(shù)據(jù)庫的安裝部署、高可用容災(zāi)、整合遷移等服務(wù)可以幫助用戶實(shí)現(xiàn)標(biāo)準(zhǔn)化、規(guī)范化的基礎(chǔ)建設(shè),同時(shí),為保障業(yè)務(wù)的連續(xù)性要求,數(shù)據(jù)環(huán)境建設(shè)之初就應(yīng)當(dāng)消除單點(diǎn)故障,實(shí)現(xiàn)設(shè)計(jì)的可用性目標(biāo)。
(3)優(yōu)化提升階段:此階段是建筑的裝修加固階段,以保證建筑更健康宜居。數(shù)據(jù)庫系統(tǒng)在運(yùn)行過程中,往往會(huì)不斷積累問題、暴露隱患,其中可能包括架構(gòu)設(shè)計(jì)不完善、參數(shù)設(shè)置不優(yōu)化、存儲(chǔ)設(shè)計(jì)不合理、SQL效率不穩(wěn)定等問題。數(shù)據(jù)庫性能優(yōu)化、SQL審核優(yōu)化等服務(wù)是這一階段的主要工作。
(4)運(yùn)行管理階段:此階段是建筑的修復(fù)保養(yǎng)階段,以使建筑生命更持久更安全。在業(yè)務(wù)系統(tǒng)上線之后,業(yè)務(wù)支撐系統(tǒng)轉(zhuǎn)入運(yùn)行管理階段,數(shù)據(jù)庫服務(wù)就成為例常的運(yùn)維保障和支撐,此時(shí)的數(shù)據(jù)庫健康巡檢、數(shù)據(jù)庫備份、數(shù)據(jù)庫補(bǔ)丁升級(jí)成為常見的工作。
可見,數(shù)據(jù)庫服務(wù)的終極目標(biāo)是以合理的成本、極致的性能提供不中斷的數(shù)據(jù)庫連續(xù)服務(wù),以上4個(gè)階段提供的不同服務(wù)都應(yīng)當(dāng)以這一目標(biāo)為核心展開。
在數(shù)據(jù)庫服務(wù)領(lǐng)域,通常的服務(wù)形式包括項(xiàng)目式和維保式兩種形態(tài)。項(xiàng)目式服務(wù)通常以完成某個(gè)確定的任務(wù)為目標(biāo),通過單人或者團(tuán)隊(duì)完成項(xiàng)目職責(zé),常見的服務(wù)內(nèi)容包括架構(gòu)咨詢、升級(jí)遷移、緊急救援和異?;謴?fù)等工作;維保式服務(wù)則是通過相對(duì)固定的工作對(duì)數(shù)據(jù)庫運(yùn)行提供連續(xù)的支持服務(wù),通常以按需服務(wù)或者人力外包的形式提供,常見的服務(wù)內(nèi)容包括健康巡檢、變更維護(hù)、補(bǔ)丁修復(fù)等。
隨著技術(shù)的不斷進(jìn)步,數(shù)據(jù)庫服務(wù)正在從傳統(tǒng)的以人工方式為主,逐漸向標(biāo)準(zhǔn)化、自動(dòng)化、智能化數(shù)據(jù)庫服務(wù)方向演進(jìn),同時(shí)從以往“被動(dòng)式”服務(wù)方式向基于用戶體驗(yàn)的“主動(dòng)式”服務(wù)方式轉(zhuǎn)變。
一個(gè)行業(yè)成熟的標(biāo)志就是在經(jīng)歷了較長期的碎片化發(fā)展之后,最終走向標(biāo)準(zhǔn)化、自動(dòng)化、智能化。數(shù)據(jù)庫服務(wù)行業(yè)經(jīng)過數(shù)十年的發(fā)展后,在當(dāng)前大環(huán)境驅(qū)動(dòng)下,正處于這樣一個(gè)資源大整合的時(shí)代。
在長期的數(shù)據(jù)庫服務(wù)實(shí)踐中,技術(shù)人員開發(fā)出各種數(shù)據(jù)庫運(yùn)維管理工具,如SQL審核系統(tǒng)、數(shù)據(jù)庫審計(jì)系統(tǒng)、數(shù)據(jù)庫運(yùn)維管理平臺(tái)等,越來越多輔助產(chǎn)品的出現(xiàn),標(biāo)志著數(shù)據(jù)庫服務(wù)進(jìn)入類似制造業(yè)的機(jī)器生產(chǎn)時(shí)代。下一個(gè)階段的發(fā)展趨勢(shì)應(yīng)該是將這些經(jīng)驗(yàn)系統(tǒng)在流程和數(shù)據(jù)上進(jìn)行整合,朝著自動(dòng)化與智能化方向挺進(jìn)。以期在更大程度上取代人工,消除人工服務(wù)所帶來的非標(biāo)準(zhǔn)和質(zhì)量不穩(wěn)定的隱患,進(jìn)一步地提高服務(wù)效率、降低服務(wù)成本。
基于用戶體驗(yàn)的“主動(dòng)式”數(shù)據(jù)庫服務(wù)形式,目標(biāo)是改變?cè)小氨粍?dòng)式”低效響應(yīng)式服務(wù),采用“以用戶體驗(yàn)為中心”和“主動(dòng)服務(wù)”的理念,圍繞“構(gòu)體系、建機(jī)制、強(qiáng)管理”的原則,提升數(shù)據(jù)庫服務(wù)管理能力、應(yīng)急處置能力及創(chuàng)新創(chuàng)效能力,由被動(dòng)服務(wù)向主動(dòng)服務(wù)轉(zhuǎn)變,構(gòu)建基于用戶體驗(yàn)的“主動(dòng)式”數(shù)據(jù)庫服務(wù)模式,確保信息系統(tǒng)7×24安全、穩(wěn)定、持續(xù)、高效運(yùn)行[5]。
總之,數(shù)據(jù)庫服務(wù)的形式隨著行業(yè)的發(fā)展演進(jìn)在不斷向前迭代,正走向更高級(jí)的提供形態(tài)。
目前,國內(nèi)尚無獨(dú)立的數(shù)據(jù)庫服務(wù)標(biāo)準(zhǔn)體系,主要的服務(wù)管理遵從 ITSM 體系,并且通過諸如 ISO9001、ISO27001、ISO20000 等標(biāo)準(zhǔn)體系或認(rèn)證來實(shí)現(xiàn)服務(wù)的標(biāo)準(zhǔn)化和質(zhì)量保證。近期,中國信息通信研究院聯(lián)合國內(nèi)數(shù)據(jù)庫廠商和服務(wù)商,共同研發(fā)并發(fā)布了“數(shù)據(jù)庫服務(wù)能力成熟度模型”,期望為國內(nèi)的數(shù)據(jù)庫服務(wù)生態(tài)體系提出更全面和專業(yè)的評(píng)估標(biāo)準(zhǔn)。該模型將數(shù)據(jù)庫服務(wù)劃分即規(guī)劃設(shè)計(jì)、實(shí)施部署和運(yùn)維運(yùn)營3個(gè)能力域,具體服務(wù)項(xiàng)目又可對(duì)應(yīng)到數(shù)據(jù)庫從選型評(píng)估、規(guī)劃設(shè)計(jì)、部署實(shí)施、運(yùn)維保障、開發(fā)優(yōu)化等多個(gè)方面。表1展示了該模型中的服務(wù)能力領(lǐng)域劃分情況。
對(duì)于用戶來說,服務(wù)的體驗(yàn)主要通過可用性、性能指標(biāo)體現(xiàn)出來??捎眯酝ǔMㄟ^服務(wù)級(jí)別協(xié)議(Service Level Agreement,SLA)體現(xiàn)出來,SLA定義的平均故障間隔時(shí)間(Mean Time Between Failure,MTBF)是主要考察指標(biāo)之一。MTBF又被稱為平均無故障時(shí)間,也就是常見的N個(gè)9問題,如5個(gè)9的可用性,全年可宕機(jī)時(shí)間就是5.26 min(見表2)。在數(shù)據(jù)庫方向上,通常要求達(dá)到99.99%的可用性[6]。
表1 數(shù)據(jù)庫服務(wù)能力成熟度模型中的能力領(lǐng)域劃分
表2 平均無故障時(shí)間示例
性能指標(biāo)通常是指QPS(每秒處理查詢量)、TPS(每秒處理事務(wù)量)和RP(響應(yīng)時(shí)間)。通過基準(zhǔn)測(cè)試和性能優(yōu)化服務(wù)等方式,可將系統(tǒng)調(diào)整到最佳的運(yùn)行狀態(tài),保障業(yè)務(wù)的平穩(wěn)運(yùn)行。這些核心的性能指標(biāo)和系統(tǒng)設(shè)計(jì)、業(yè)務(wù)要求有關(guān),需要通過基準(zhǔn)測(cè)試,找到系統(tǒng)的標(biāo)稱能力,并在實(shí)踐中不斷進(jìn)行整體的優(yōu)化和提升。系統(tǒng)的最佳性能往往源自各種條件的均衡,如圖2所示,并發(fā)吞吐量的上升帶來延時(shí)的增加,讓系統(tǒng)運(yùn)行在最佳狀態(tài)是技術(shù)服務(wù)的核心目標(biāo)之一。
數(shù)據(jù)庫服務(wù)的品質(zhì),還需要通過標(biāo)準(zhǔn)化的流程、自動(dòng)化的產(chǎn)品來進(jìn)一步完善和保障。在商業(yè)和開源數(shù)據(jù)庫百花齊放的時(shí)代,既需要掌握更多數(shù)據(jù)庫技術(shù)提供傳統(tǒng)式的服務(wù),也需要通過更完善的軟件產(chǎn)品構(gòu)建標(biāo)準(zhǔn)化、自動(dòng)化、智能化的數(shù)據(jù)庫服務(wù)平臺(tái),通過多種服務(wù)形式的互補(bǔ)實(shí)現(xiàn)更高的數(shù)據(jù)庫服務(wù)品質(zhì)。
根據(jù)公開的數(shù)據(jù),2019年全球GDP總量為87.75萬億美元,另據(jù)如表3所示Gartner的統(tǒng)計(jì)數(shù)據(jù),2019年全球IT投入為2.3995萬億美元(表3中去除了通信服務(wù)部分),全球IT投入占GDP的比重平均為2.7%,其中美國投入最高,占比達(dá)到 4.5%,中國的IT投入占比僅為1.6%,低于全球平均水平(2019年中國GDP為99萬億元人民幣,IT相關(guān)投入為1.6萬億元人民幣左右)[7]。
在中國3014億元人民的IT服務(wù)中,第三方運(yùn)維服務(wù)占比達(dá)到47.3%,數(shù)據(jù)庫服務(wù)又占據(jù)其中大約25%的比例,也就是說中國數(shù)據(jù)庫服務(wù)市場(chǎng)規(guī)模大約在356億元左右,市場(chǎng)空間極為廣闊。2019年,中國數(shù)據(jù)庫市場(chǎng)規(guī)模為178.5億元,這意味著,每有1元的數(shù)據(jù)庫軟件銷售,就會(huì)隨之帶來 2倍左右的服務(wù)市場(chǎng)[8]。
2020年6月22日,央行召開調(diào)查統(tǒng)計(jì)工作會(huì)議指出,要高質(zhì)量完成金融基礎(chǔ)數(shù)據(jù)等各項(xiàng)統(tǒng)計(jì)制度的制定與實(shí)施,高質(zhì)量建設(shè)統(tǒng)一管理的數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)分析平臺(tái),高質(zhì)量開展國家金融基礎(chǔ)數(shù)據(jù)的綜合應(yīng)用工作,鞏固和拓展金融業(yè)綜合統(tǒng)計(jì)成果,高質(zhì)量建設(shè)符合大數(shù)據(jù)發(fā)展方向的國家金融基礎(chǔ)數(shù)據(jù)庫。2020年7月15日,中國移動(dòng)公布了 OLTP 自主可控?cái)?shù)據(jù)庫聯(lián)合創(chuàng)新項(xiàng)目,國產(chǎn)數(shù)據(jù)庫中的南大通用、阿里巴巴、中興通訊、人大金倉、萬里開源五大廠商數(shù)據(jù)庫產(chǎn)品中標(biāo)入選??梢灶A(yù)見,隨著國產(chǎn)數(shù)據(jù)庫的不斷發(fā)展、應(yīng)用,數(shù)據(jù)庫服務(wù)的市場(chǎng)將會(huì)進(jìn)一步擴(kuò)大,這對(duì)整個(gè)產(chǎn)業(yè)生態(tài)領(lǐng)域提出了新的挑戰(zhàn),也帶來了新的機(jī)遇。
表3 2019年中國IT支出水平與全球IT支出水平的比對(duì)(數(shù)據(jù)來源:Gartner)