国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

分布式數(shù)據(jù)庫(kù)發(fā)展綜述

2023-12-01 10:15蘇彥志蔣越維
數(shù)字通信世界 2023年10期
關(guān)鍵詞:分片數(shù)據(jù)庫(kù)系統(tǒng)集中式

蘇彥志,陳 廣,蔣越維

(中國(guó)移動(dòng)通信集團(tuán)河北有限公司,河北 石家莊 050000)

1 分布式數(shù)據(jù)庫(kù)概述

分布式數(shù)據(jù)庫(kù)的特點(diǎn)主要包括以下幾點(diǎn)。

(1)透明性:分布式數(shù)據(jù)庫(kù)的透明性包括分片透明、復(fù)制透明、位置透明和邏輯透明等,其中分片透明是透明性的最高層次,邏輯透明層次最低。具體來(lái)說(shuō),透明性是指用戶在使用過(guò)程中,不必關(guān)心數(shù)據(jù)在數(shù)據(jù)庫(kù)管理系統(tǒng)內(nèi)部是如何分片的,不必知道數(shù)據(jù)都分別存放在哪個(gè)節(jié)點(diǎn)以及各個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)是怎樣完成數(shù)據(jù)復(fù)制的,用戶只需在使用時(shí)完成自己的相關(guān)操作即可。

(2)高可靠性:分布式數(shù)據(jù)庫(kù)會(huì)對(duì)數(shù)據(jù)采取多次備份存儲(chǔ)形成多副本來(lái)提高數(shù)據(jù)的可靠性。當(dāng)某個(gè)節(jié)點(diǎn)出現(xiàn)故障時(shí),其他節(jié)點(diǎn)可快速替代故障節(jié)點(diǎn)繼續(xù)工作,避免出現(xiàn)數(shù)據(jù)丟失現(xiàn)象。

(3)易擴(kuò)展性:當(dāng)數(shù)據(jù)庫(kù)現(xiàn)有容量和性能告急時(shí),分布式數(shù)據(jù)庫(kù)可采取添加新節(jié)點(diǎn)和服務(wù)器的方法來(lái)實(shí)現(xiàn)擴(kuò)展,相比于集中式數(shù)據(jù)庫(kù)的難擴(kuò)展性可以更好地滿足用戶不斷增長(zhǎng)的需求。如圖1所示。

圖1 分布式數(shù)據(jù)庫(kù)[1]

2 分布式數(shù)據(jù)庫(kù)的發(fā)展歷程

21世紀(jì)以前,關(guān)系型商業(yè)數(shù)據(jù)庫(kù)可以滿足大部分用戶應(yīng)用場(chǎng)景,但隨著互聯(lián)網(wǎng)應(yīng)用的到來(lái),數(shù)據(jù)呈現(xiàn)大容量、多樣性、流動(dòng)性等特點(diǎn),采取集中式架構(gòu)的傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)逐漸無(wú)法實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)高并發(fā)的需求,于是分布式數(shù)據(jù)庫(kù)迎來(lái)了發(fā)展機(jī)遇。

2.1 第一代分布式數(shù)據(jù)庫(kù)——NoSQL

2009年初,NoSQL數(shù)據(jù)庫(kù)應(yīng)運(yùn)而生代表著第一代分布式數(shù)據(jù)庫(kù)的誕生。它專注于分布式場(chǎng)景下數(shù)據(jù)的存儲(chǔ)和查詢,不需要預(yù)先定義Schema,開(kāi)發(fā)人員可以頻繁在線更改Schema,更高效滿足業(yè)務(wù)需求。NoSQL數(shù)據(jù)庫(kù)打破以前傳統(tǒng)商業(yè)數(shù)據(jù)庫(kù)多節(jié)點(diǎn)部署難度大、造價(jià)高的困境,易于擴(kuò)展。但由于其是通過(guò)犧牲SQL和事務(wù)來(lái)實(shí)現(xiàn)可擴(kuò)展的,甚至缺乏ACID,因此數(shù)據(jù)一致性問(wèn)題難以解決,應(yīng)用場(chǎng)景十分局限,不利于完成整個(gè)應(yīng)用架構(gòu)的搭建。最流行的兩個(gè)NoSQL系統(tǒng)分別是Amazon Dynamo和Google Bigtable。Dynamo系統(tǒng)因犧牲一致性而失敗。Bigtable雖實(shí)現(xiàn)了強(qiáng)一致性,但只支持單行事務(wù),未達(dá)到高效的目的。如圖2所示。

圖2 第一代分布式數(shù)據(jù)庫(kù)

2.2 第二代分布式數(shù)據(jù)庫(kù)——NewSQL

第一代分布式數(shù)據(jù)庫(kù)友好性欠缺,且無(wú)法支持SQL,于是第二代分布式數(shù)據(jù)庫(kù)采用搭積木的方式,在NoSQL的基礎(chǔ)之上引入了SQL支持,以Google Spanner為代表。Spanner支持大部分SQL,但不兼容SQL標(biāo)準(zhǔn),通過(guò)Truetime實(shí)現(xiàn)全功能事務(wù),保證了強(qiáng)一致性,但單次事務(wù)提交時(shí)延、單機(jī)性能犧牲度較大,這意味著其不符合性價(jià)比的特性,難以廣泛應(yīng)用于傳統(tǒng)行業(yè)的業(yè)務(wù)場(chǎng)景。如圖3所示。

圖3 第二代分布式數(shù)據(jù)庫(kù)

2.3 第三代分布式數(shù)據(jù)庫(kù)——原生式

第三代是原生式分布式數(shù)據(jù)庫(kù),充分享受分布式高可用、可擴(kuò)展的技術(shù)紅利,在利用較低成本的前提下具備極致單機(jī)性能,是較為成熟的透明擴(kuò)展企業(yè)級(jí)數(shù)據(jù)庫(kù),如OceanBase。OceanBase的底層為可擴(kuò)展的分布式架構(gòu),在同一套數(shù)據(jù)庫(kù)引擎中支持HTAP混合負(fù)載,支持SQL和Paxos高可用性,在眾多分布式數(shù)據(jù)庫(kù)中脫穎而出。如圖4所示。

圖4 第三代分布式數(shù)據(jù)庫(kù)

3 分布式數(shù)據(jù)庫(kù)國(guó)內(nèi)外發(fā)展現(xiàn)狀

3.1 在技術(shù)方面

數(shù)據(jù)分片、分布式事務(wù)處理和數(shù)據(jù)同步都是分布式數(shù)據(jù)庫(kù)的核心技術(shù)。數(shù)據(jù)分片技術(shù)是實(shí)現(xiàn)可擴(kuò)展性和高可用性的核心技術(shù)。隨著數(shù)據(jù)量的增加,數(shù)據(jù)分片技術(shù)也在不斷發(fā)展,如基于哈希算法的分片、基于范圍的分片等;分布式事務(wù)處理技術(shù)的發(fā)展對(duì)保證事務(wù)的一致性和隔離性十分重要,常用的分布式事務(wù)處理技術(shù)[2]包括兩階段提交、三階段提交、Paxos算法等.數(shù)據(jù)同步技術(shù)是保證數(shù)據(jù)一致性和完整性的關(guān)鍵技術(shù),常用的數(shù)據(jù)同步技術(shù)包括主從復(fù)制、主主復(fù)制、基于日志的同步等。

3.2 在市場(chǎng)方面

隨著社會(huì)科學(xué)技術(shù)的快速發(fā)展,分布式數(shù)據(jù)庫(kù)系統(tǒng)的市場(chǎng)需求和市場(chǎng)競(jìng)爭(zhēng)都在日益增加。據(jù)統(tǒng)計(jì)數(shù)據(jù)顯示,2018年分布式數(shù)據(jù)庫(kù)系統(tǒng)市場(chǎng)規(guī)模僅為92億美元,到2022年已達(dá)161億美元,年復(fù)合增長(zhǎng)率達(dá)14.1%。市場(chǎng)需求的增長(zhǎng)吸引了國(guó)內(nèi)外眾多企業(yè)開(kāi)始參與到分布式數(shù)據(jù)庫(kù)系統(tǒng)市場(chǎng)的競(jìng)爭(zhēng)中,如阿里云、華為云等。另外,開(kāi)源分布式數(shù)據(jù)庫(kù)系統(tǒng)也在不斷涌現(xiàn),如Hadoop、MongoDB等,其以開(kāi)源和靈活性高等特點(diǎn)受到廣大企業(yè)和開(kāi)發(fā)者的關(guān)注并被采用。

3.3 在應(yīng)用方面

分布式數(shù)據(jù)庫(kù)系統(tǒng)在云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)等領(lǐng)域得到了廣泛應(yīng)用。分布式數(shù)據(jù)庫(kù)系統(tǒng)的高可用性、高擴(kuò)展性和高性能性可滿足企業(yè)在云環(huán)境下的數(shù)據(jù)存儲(chǔ)和處理需求。云計(jì)算領(lǐng)域主要應(yīng)用的分布式數(shù)據(jù)庫(kù)系統(tǒng)包括阿里云的AnalyticDB、亞馬遜的Aurora等。在大數(shù)據(jù)環(huán)境下,龐大的數(shù)據(jù)量需要分布式存儲(chǔ)和處理,該應(yīng)用環(huán)境中的主要分布式數(shù)據(jù)庫(kù)系統(tǒng)包括Apache HBase、Apache Cassandra等。物聯(lián)網(wǎng)中,設(shè)備和傳感器產(chǎn)生數(shù)據(jù)量巨大,需要實(shí)時(shí)分析和處理,分布式數(shù)據(jù)庫(kù)系統(tǒng)可滿足其需求,應(yīng)用的主要分布式數(shù)據(jù)庫(kù)系統(tǒng)包括InfluxDB、OpenTSDB等。

4 分布式數(shù)據(jù)庫(kù)發(fā)展面臨的問(wèn)題

本節(jié)主要討論針對(duì)CAP理論的應(yīng)用系統(tǒng)合理選擇問(wèn)題、遺留系統(tǒng)遷移改造問(wèn)題以及產(chǎn)品成熟度不足[3]的問(wèn)題。

4.1 應(yīng)用系統(tǒng)合理選擇問(wèn)題

CA P理論是一個(gè)經(jīng)典的分布式系統(tǒng)理論。已知一個(gè)分布式系統(tǒng)不可能同時(shí)滿足一致性(C:Consistency)、可用性(A:Availability)和分區(qū)容錯(cuò)性(P:Partition tolerance)這三個(gè)基本需求,最多只能同時(shí)滿足其中的兩個(gè)。而在現(xiàn)實(shí)的分布式系統(tǒng)中,不可靠的網(wǎng)絡(luò)和宕機(jī)概率是一定存在的,因此分區(qū)容錯(cuò)性是必選項(xiàng)而不是可選項(xiàng),這樣用戶就需要在一致性和可用性之間進(jìn)行取舍,這是困擾眾多開(kāi)發(fā)人員的問(wèn)題。在實(shí)際場(chǎng)景中,各企業(yè)結(jié)合自身不同的業(yè)務(wù)需求,做出的最終抉擇有所不同,但是做好一致性和可用性之間平衡是所有企業(yè)的共同訴求。如圖5所示。

圖5 CAP理論[4]

4.2 遺留系統(tǒng)遷移改造問(wèn)題

分布式數(shù)據(jù)庫(kù)與集中式數(shù)據(jù)庫(kù)工作機(jī)制的不同使得兩者的功能性也存在著一定差異,比如存儲(chǔ)過(guò)程、視圖、外鍵約束等功能,雖然分布式數(shù)據(jù)庫(kù)也具備上述功能,但執(zhí)行效率會(huì)比集中式數(shù)據(jù)庫(kù)低,這樣使得上層業(yè)務(wù)遷移改造時(shí)需特別注意數(shù)據(jù)模型和實(shí)現(xiàn)邏輯。另外,還要考慮硬件開(kāi)銷成本,分區(qū)計(jì),充分利用分布式數(shù)據(jù)庫(kù)的高并發(fā)性和水平擴(kuò)展特性[4]。

4.3 產(chǎn)品成熟度不足問(wèn)題

分布式數(shù)據(jù)庫(kù)作為新興的數(shù)據(jù)庫(kù)技術(shù),自身發(fā)展還處于初期,存在著技術(shù)體系、產(chǎn)品推廣和標(biāo)準(zhǔn)規(guī)范不成熟的情況。而傳統(tǒng)集中式數(shù)據(jù)庫(kù)經(jīng)過(guò)幾十年的發(fā)展,已具備較為完善成熟的產(chǎn)品,甚至不斷衍生出許多特殊用法,這導(dǎo)致在遷移過(guò)程中會(huì)出現(xiàn)較大的困難,阻礙了分布式數(shù)據(jù)庫(kù)大面積推廣使用。

5 分布式數(shù)據(jù)庫(kù)發(fā)展前景與展望

(1)大規(guī)模數(shù)據(jù)處理:隨著互聯(lián)網(wǎng)和物聯(lián)網(wǎng)等新技術(shù)不斷革新,數(shù)據(jù)量將會(huì)持續(xù)呈現(xiàn)爆炸式增長(zhǎng)。分布式數(shù)據(jù)庫(kù)依靠其良好的可擴(kuò)展性和高性能的特點(diǎn),能夠滿足大規(guī)模數(shù)據(jù)處理的需求,未來(lái)將會(huì)越來(lái)越受到關(guān)注。

(2)數(shù)據(jù)智能化:未來(lái)分布式數(shù)據(jù)庫(kù)將會(huì)越來(lái)越智能化,利用機(jī)器學(xué)習(xí)和人工智能等技術(shù)對(duì)海量數(shù)據(jù)進(jìn)行分析和挖掘,從而為企業(yè)提供更加有價(jià)值的業(yè)務(wù)洞察和預(yù)測(cè)結(jié)果。

(3)區(qū)塊鏈技術(shù):區(qū)塊鏈技術(shù)將會(huì)成為未來(lái)分布式數(shù)據(jù)庫(kù)的重要發(fā)展方向之一。區(qū)塊鏈技術(shù)依靠其去中心化、不可篡改、安全等特點(diǎn),能夠?yàn)槠髽I(yè)提供更加可信的數(shù)據(jù)存儲(chǔ)和訪問(wèn)方式,因此將會(huì)成為分布式數(shù)據(jù)庫(kù)發(fā)展的重要趨勢(shì)[5]。

(4)云原生數(shù)據(jù)庫(kù):云原生數(shù)據(jù)庫(kù)[6]將會(huì)成為未來(lái)分布式數(shù)據(jù)庫(kù)的趨勢(shì)。云原生數(shù)據(jù)庫(kù)采用微服務(wù)、容器化、自動(dòng)化管理等技術(shù),實(shí)現(xiàn)了高可用性、高可伸縮性和高安全性,能夠幫助企業(yè)更加高效地管理和維護(hù)數(shù)據(jù)。

總的來(lái)說(shuō),分布式數(shù)據(jù)庫(kù)未來(lái)的發(fā)展前景非常廣闊,同時(shí)也需要我們密切關(guān)注技術(shù)的發(fā)展趨勢(shì),不斷學(xué)習(xí)新的技術(shù)和知識(shí),從而為企業(yè)提供更加優(yōu)質(zhì)的服務(wù)?!?/p>

猜你喜歡
分片數(shù)據(jù)庫(kù)系統(tǒng)集中式
上下分片與詞的時(shí)空佈局
分片光滑邊值問(wèn)題的再生核方法
CDN存量MP4視頻播放優(yōu)化方法
基于模糊二分查找的幀分片算法設(shè)計(jì)與實(shí)現(xiàn)
數(shù)據(jù)庫(kù)系統(tǒng)shell腳本應(yīng)用
光伏:分布式新增裝機(jī)規(guī)模首次超越集中式
微細(xì)銑削工藝數(shù)據(jù)庫(kù)系統(tǒng)設(shè)計(jì)與開(kāi)發(fā)
組串式、集中式逆變器的評(píng)估選定淺析
實(shí)時(shí)數(shù)據(jù)庫(kù)系統(tǒng)數(shù)據(jù)安全采集方案
接觸網(wǎng)隔離開(kāi)關(guān)集中式控制方案研究
江西省| 镇江市| 石河子市| 富民县| 怀来县| 古蔺县| 萍乡市| 沙雅县| 余干县| 剑阁县| 武定县| 平泉县| 东海县| 平阳县| 长沙市| 乐业县| 积石山| 台湾省| 宣威市| 景洪市| 龙州县| 瑞安市| 莫力| 获嘉县| 盘锦市| 邛崃市| 宝山区| 建水县| 饶河县| 卓尼县| 海南省| 津南区| 政和县| 九寨沟县| 辽宁省| 聂拉木县| 保德县| 张家口市| 左权县| 临夏县| 广南县|