張振宇
(東北石油大學(xué),163318)
在我國(guó)現(xiàn)階段,大部分的企業(yè)都實(shí)現(xiàn)了建立自己的數(shù)據(jù)庫(kù)系統(tǒng),但是,如果單從數(shù)據(jù)的應(yīng)用方面來(lái)說(shuō),還只是單單停留在數(shù)據(jù)的保存上,更進(jìn)一步是對(duì)數(shù)據(jù)的查詢。這主要表現(xiàn)在兩個(gè)方面,從數(shù)據(jù)庫(kù)導(dǎo)出的大量信息并沒(méi)有得到很好的利用,造成了資源的極大浪費(fèi)。另一方面,現(xiàn)代的企業(yè)管理決策又需要此類(lèi)大量的數(shù)據(jù),這就造成了信息需求與信息提供方的信息極度不平等。企業(yè)面臨的商業(yè)競(jìng)爭(zhēng)是非常激烈的,當(dāng)企業(yè)的決策任務(wù)變得越來(lái)越重,那么,企業(yè)決策的頻率也會(huì)越來(lái)越高,這就表明,企業(yè)要重新開(kāi)始重視起信息的有效價(jià)值,對(duì)如何保存信息以及信息的導(dǎo)出會(huì)做出更加嚴(yán)格的要求,也將更加重視數(shù)據(jù)分析。同時(shí),隨著信息技術(shù)在企業(yè)得到廣泛應(yīng)用,企業(yè)將通過(guò)最傳統(tǒng)的文件傳輸方式以及數(shù)據(jù)庫(kù)信息存儲(chǔ)積累了大量的數(shù)據(jù),這些都為將后的數(shù)據(jù)分析和利用提供了非常重要的基礎(chǔ)。因此,目前現(xiàn)代企業(yè)不再只是簡(jiǎn)單的數(shù)據(jù)處理了,更多的是在分析和利用這些數(shù)據(jù),更加關(guān)注如何使用這些數(shù)據(jù),因此,數(shù)據(jù)庫(kù)技術(shù)就應(yīng)運(yùn)而生了。通過(guò)數(shù)據(jù)庫(kù)技術(shù)建立起數(shù)據(jù)倉(cāng)庫(kù),它是一個(gè)面向主題的、集成的、隨著時(shí)間變化而變化的數(shù)據(jù)集合體,主要目的是為了管理決策。通過(guò)數(shù)據(jù)庫(kù)技術(shù)建立起來(lái)的數(shù)據(jù)倉(cāng)主要是為了企業(yè)的管理決策。數(shù)據(jù)庫(kù)技術(shù)的最終目標(biāo)是把企業(yè)范圍內(nèi)的所有的數(shù)據(jù)都集成在一個(gè)巨大的數(shù)據(jù)存儲(chǔ)設(shè)備上,讓用戶更改進(jìn)行查詢、產(chǎn)生報(bào)告和進(jìn)行分析。
在50年代中期之前,計(jì)算機(jī)的軟件及硬件方面都還不夠成熟,還沒(méi)有達(dá)到一定的標(biāo)準(zhǔn)。對(duì)于數(shù)據(jù)儲(chǔ)存采用的都是人工記憶,比如說(shuō)以前使用的磁帶存儲(chǔ),卡片記憶以及紙帶記憶,因?yàn)樵谲浖矫嫖覀冞€沒(méi)有計(jì)算機(jī)操作系統(tǒng)。在當(dāng)時(shí),計(jì)算機(jī)的作用只是用作科學(xué)計(jì)算。因此,在那個(gè)時(shí)代,還沒(méi)有軟件系統(tǒng)能夠?qū)?shù)據(jù)進(jìn)行管理,程序員在程序中不僅僅要規(guī)定數(shù)據(jù)的邏輯結(jié)構(gòu),同時(shí)還要設(shè)計(jì)與其相關(guān)的物理結(jié)構(gòu),它主要包括存儲(chǔ)結(jié)構(gòu)、存取方法和輸入輸出方式等等。這類(lèi)儲(chǔ)存辦法是不能實(shí)現(xiàn)數(shù)據(jù)之間的傳輸?shù)摹?/p>
這一個(gè)階段的主要標(biāo)志是計(jì)算機(jī)中有了專(zhuān)門(mén)管理數(shù)據(jù)庫(kù)的軟件,那就是操作系統(tǒng)(文件管理)。上個(gè)世紀(jì)50年代中期到60年代中期,計(jì)算機(jī)大容量存儲(chǔ)設(shè)備的出現(xiàn)推動(dòng)了軟件技術(shù)的發(fā)展,這也標(biāo)志著數(shù)據(jù)管理進(jìn)入了一個(gè)新的階段。在文件系統(tǒng)階段,主要采用的是以文件為單位的存儲(chǔ)數(shù)據(jù),由操作系統(tǒng)統(tǒng)一管理。操作系統(tǒng)為用戶提供了一個(gè)很友好的界面。數(shù)據(jù)和程序之間是呈現(xiàn)分離狀態(tài)的,這就使得數(shù)據(jù)和程序之間不再有著那么強(qiáng)烈的依賴性,有著很的獨(dú)立性。用戶的程序和數(shù)據(jù)是分開(kāi)的,分開(kāi)存儲(chǔ)在外存儲(chǔ)器上,每一個(gè)應(yīng)用程序都有可以共享的數(shù)據(jù),這就實(shí)現(xiàn)了以文件為單位的數(shù)據(jù)共享。可是,由于數(shù)據(jù)的組織仍然是面向程序的,所以當(dāng)我們?cè)诖鎯?chǔ)數(shù)據(jù)的時(shí)候會(huì)發(fā)現(xiàn)存在著大量的數(shù)據(jù)多余的部分,很多數(shù)據(jù)是沒(méi)能存儲(chǔ)到數(shù)據(jù)當(dāng)中的。并且由于數(shù)據(jù)的邏輯結(jié)構(gòu)不能夠很方便地進(jìn)行修改和擴(kuò)充,數(shù)據(jù)邏輯結(jié)構(gòu)的沒(méi)一點(diǎn)微小的改變都有可能會(huì)影響到應(yīng)用程序。
數(shù)據(jù)庫(kù)技術(shù)也是作為現(xiàn)在的主流技術(shù),目前,我們所使用的計(jì)算機(jī)數(shù)據(jù)應(yīng)用系統(tǒng)存儲(chǔ)數(shù)據(jù)也是用的數(shù)據(jù)庫(kù)系統(tǒng),數(shù)據(jù)庫(kù)系統(tǒng)階段發(fā)展至今已有很長(zhǎng)一段時(shí)間。在平時(shí)的辦公中,企業(yè)運(yùn)用數(shù)據(jù)庫(kù)系統(tǒng)進(jìn)行對(duì)數(shù)據(jù)的存儲(chǔ)和查詢,并且利用信息為企業(yè)創(chuàng)造效益和價(jià)值。目前,用處最廣的是數(shù)據(jù)庫(kù)系統(tǒng)。
數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)都是來(lái)自許多不同的業(yè)務(wù)數(shù)據(jù)庫(kù)的,并且都是按照不同的主題進(jìn)行數(shù)據(jù)組織與歸類(lèi)的。數(shù)據(jù)庫(kù)技術(shù)有著非常強(qiáng)大的信息歸類(lèi)功用。數(shù)據(jù)庫(kù)技術(shù)會(huì)按照一定的程序?qū)?shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換和裝載等等,并最終按照預(yù)先設(shè)定好的數(shù)據(jù)庫(kù)模型,將數(shù)據(jù)加載到數(shù)據(jù)倉(cāng)庫(kù)中去。通過(guò)數(shù)據(jù)庫(kù)技術(shù)將信息歸類(lèi)處理,由于數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)幾乎是沒(méi)有更新操作的,因此數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)都會(huì)有著分層的綜合歸類(lèi),一般包括幾個(gè)方面,比如說(shuō)原始數(shù)據(jù)、初步綜合數(shù)據(jù)和中度綜合數(shù)據(jù)和高度綜合數(shù)據(jù)等等。
以前所使用的MIS 數(shù)據(jù)處理目的都是為了“業(yè)務(wù)處理”,而隨著科技的進(jìn)步與發(fā)展,數(shù)據(jù)庫(kù)技術(shù)改變了MIS 原來(lái)數(shù)據(jù)以“業(yè)務(wù)處理”為目的的狀況。將數(shù)據(jù)進(jìn)行分類(lèi),改變了原來(lái)數(shù)據(jù)庫(kù)存放著動(dòng)態(tài)變化的細(xì)節(jié)性數(shù)據(jù)的情況,也正是由于數(shù)據(jù)倉(cāng)庫(kù)可以將大量的歷史性的數(shù)據(jù)進(jìn)行合理的組織,使得系統(tǒng)能夠更加方便的利用數(shù)據(jù)和分析數(shù)據(jù),并且能夠在分析的基礎(chǔ)上建立模型,對(duì)于結(jié)構(gòu)化和半機(jī)構(gòu)化的決策問(wèn)題給出了結(jié)果。所以,數(shù)據(jù)庫(kù)技術(shù)為系統(tǒng)分析過(guò)程的堅(jiān)強(qiáng)后盾,這是系統(tǒng)分析的基礎(chǔ)。為系統(tǒng)分析過(guò)程提供了數(shù)據(jù)的同時(shí)也節(jié)約了系統(tǒng)分析的時(shí)間,大大提高的效率,同時(shí),這也節(jié)約了系統(tǒng)分析的成本。
在數(shù)據(jù)系統(tǒng)中,數(shù)據(jù)庫(kù)技術(shù)實(shí)現(xiàn)了存儲(chǔ)繁雜的信息、實(shí)現(xiàn)數(shù)據(jù)共享以及保障數(shù)據(jù)安全,并且還能夠高校地檢索數(shù)據(jù)和處理數(shù)據(jù)。數(shù)據(jù)庫(kù)技術(shù)在商業(yè)上的巨大成功刺激了其他領(lǐng)域?qū)τ跀?shù)據(jù)庫(kù)技術(shù)需求的迅速增長(zhǎng)。這些領(lǐng)域都開(kāi)辟了數(shù)據(jù)庫(kù)技術(shù)領(lǐng)域的新天地。并且在應(yīng)用中提出了有一些新的數(shù)據(jù)管理的需求,同時(shí)推動(dòng)了數(shù)據(jù)庫(kù)技術(shù)的研究和發(fā)展
現(xiàn)有的數(shù)據(jù)庫(kù)技術(shù)已經(jīng)無(wú)法滿足現(xiàn)在社會(huì)所需,也無(wú)法描述現(xiàn)實(shí)社會(huì)的實(shí)體了。而面向?qū)ο蟮臄?shù)據(jù)模型由于吸收了已經(jīng)成熟的面向?qū)ο蟪绦蛟O(shè)計(jì)方法學(xué)的核心概念和基本的思想,所以,它將是更加符合人們看待世界的眼光的,它更加符合人們觀看世界的眼光和看法,更加適合我們描述未來(lái)的現(xiàn)實(shí)世界。所以有人說(shuō),數(shù)據(jù)庫(kù)的未來(lái)將會(huì)是面向?qū)ο蟮臅r(shí)代。
關(guān)系數(shù)據(jù)庫(kù)作為當(dāng)前所用數(shù)據(jù)庫(kù)中的標(biāo)準(zhǔn),在未來(lái),面向的對(duì)象的關(guān)系數(shù)據(jù)庫(kù)技術(shù)庫(kù)能夠標(biāo)示復(fù)雜的數(shù)據(jù)模型,但是由于它并沒(méi)有統(tǒng)一的數(shù)據(jù)統(tǒng)計(jì)模型和形式化的理論,所以總的來(lái)說(shuō)還是缺少了嚴(yán)格的數(shù)據(jù)邏輯基礎(chǔ),因此它只能處理一些平面的數(shù)據(jù)模型。所以,未來(lái)的數(shù)據(jù)庫(kù) 發(fā)展方向是為了能夠結(jié)合平面的數(shù)據(jù)邏輯同時(shí)還要數(shù)據(jù)立體的數(shù)據(jù)邏輯。這將會(huì)成為未來(lái)數(shù)據(jù)庫(kù)發(fā)展的主流。
這種數(shù)據(jù)庫(kù)最大的優(yōu)點(diǎn)是突破了關(guān)系數(shù)據(jù)庫(kù)的結(jié)構(gòu)定義不易改變和數(shù)據(jù)定義的限制,支持了重復(fù)字段、子字段以及經(jīng)變長(zhǎng)字段,而且還實(shí)現(xiàn)了對(duì)變長(zhǎng)數(shù)九和重復(fù)字段進(jìn)行處理以及進(jìn)行數(shù)據(jù)項(xiàng)的變長(zhǎng)存儲(chǔ)存儲(chǔ)管理。并且在處理連續(xù)信息的時(shí)候,它有著傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)庫(kù)所無(wú)法比擬的優(yōu)勢(shì),這將會(huì)是未來(lái)數(shù)據(jù)庫(kù)發(fā)展的一個(gè)很重要的補(bǔ)充。
數(shù)據(jù)庫(kù)與學(xué)科技術(shù)的結(jié)合將會(huì)成為未來(lái)數(shù)據(jù)庫(kù)發(fā)展的必然趨勢(shì),也是硬性要求。數(shù)據(jù)庫(kù)技術(shù)以及在市場(chǎng)在向數(shù)據(jù)倉(cāng)庫(kù)和電子商務(wù)兩個(gè)方向有著強(qiáng)大的發(fā)展空間,所以,為了迎合未來(lái)商業(yè)需求,數(shù)據(jù)庫(kù)與學(xué)科技術(shù)的結(jié)合將是一個(gè)必然發(fā)展的過(guò)程。
在未來(lái),專(zhuān)業(yè)分工越來(lái)越明確,社會(huì)分工也越來(lái)越明確,許多實(shí)踐者也從研究現(xiàn)實(shí)的角度對(duì)數(shù)據(jù)庫(kù)技術(shù)進(jìn)行了研究,提出了適合應(yīng)用領(lǐng)域的數(shù)據(jù)庫(kù)技術(shù),比如說(shuō)工程數(shù)據(jù)庫(kù)和地理數(shù)據(jù)庫(kù)等等。所以,總的來(lái)是說(shuō),隨著研究工作的繼續(xù)深入,數(shù)據(jù)庫(kù)在實(shí)際工作中的運(yùn)用將會(huì)越來(lái)越趨向?qū)I(yè)化。每一個(gè)領(lǐng)域及行業(yè)都會(huì)有自己最適合的數(shù)據(jù)庫(kù)技術(shù)。隨著數(shù)據(jù)庫(kù)研究工作的繼續(xù)深入,數(shù)據(jù)庫(kù)技術(shù)在實(shí)踐工作中的應(yīng)用,數(shù)據(jù)庫(kù)技術(shù)將會(huì)更多的朝著專(zhuān)門(mén)應(yīng)用領(lǐng)域發(fā)展的趨向。
數(shù)據(jù)庫(kù)技術(shù)的廣泛使用為企業(yè)和組織收集并積累了大量的數(shù)據(jù)。數(shù)據(jù)豐富知識(shí)貧乏的現(xiàn)實(shí)直接導(dǎo)致了聯(lián)機(jī)分析處理(OLAP)、數(shù)據(jù)倉(cāng)庫(kù)(Data Warehousing)和數(shù)據(jù)挖掘(Data Mining)等技術(shù)的出現(xiàn),促使數(shù)據(jù)庫(kù)向智能化方向發(fā)展。同時(shí)企業(yè)應(yīng)用越來(lái)越復(fù)雜,會(huì)涉及到應(yīng)用服務(wù)器、Web 服務(wù)器、其它數(shù)據(jù)庫(kù)、舊系統(tǒng)中的應(yīng)用以及第三方軟件等,數(shù)據(jù)庫(kù)產(chǎn)品與這些軟件是否具有良好集成性往往關(guān)系到整個(gè)系統(tǒng)的性能。Oracle 公司的Oracle 9i 產(chǎn)品包括了OLAP、數(shù)據(jù)挖掘、ETL 工具等一套完整的BI(商業(yè)智能)支持平臺(tái),中間件產(chǎn)品與其核心數(shù)據(jù)庫(kù)具有緊密集成的特性,Oracle Application Server 增加的一項(xiàng)關(guān)鍵功能是高速緩存特性,該特性可以將數(shù)據(jù)從數(shù)據(jù)庫(kù)卸載到應(yīng)用服務(wù)器,加速Web 用戶對(duì)數(shù)據(jù)的訪問(wèn)速度。IBM公司也把BI 套件作為其數(shù)據(jù)庫(kù)的一個(gè)重點(diǎn)來(lái)發(fā)展。微軟認(rèn)為商務(wù)智能將是其下一代主要的利潤(rùn)點(diǎn)。
數(shù)據(jù)、計(jì)算機(jī)硬件和數(shù)據(jù)庫(kù)應(yīng)用,這三者推動(dòng)著數(shù)據(jù)庫(kù)技術(shù)與系統(tǒng)的發(fā)展。數(shù)據(jù)庫(kù)要管理的數(shù)據(jù)的復(fù)雜度和數(shù)據(jù)量都在迅速增長(zhǎng);計(jì)算機(jī)硬件平臺(tái)的發(fā)展仍然實(shí)踐著摩爾定律;數(shù)據(jù)庫(kù)應(yīng)用迅速向深度、廣度擴(kuò)展。尤其是互聯(lián)網(wǎng)的出現(xiàn),極大地改變了數(shù)據(jù)庫(kù)的應(yīng)用環(huán)境,向數(shù)據(jù)庫(kù)領(lǐng)域提出了前所未有的技術(shù)挑戰(zhàn)。這些因素的變化推動(dòng)著數(shù)據(jù)庫(kù)技術(shù)的進(jìn)步,出現(xiàn)了一批新的數(shù)據(jù)庫(kù)技術(shù),如Web數(shù)據(jù)庫(kù)技術(shù)、并行數(shù)據(jù)庫(kù)技術(shù)、數(shù)據(jù)倉(cāng)庫(kù)與聯(lián)機(jī)分析技術(shù)、數(shù)據(jù)挖掘與商務(wù)智能技術(shù)、內(nèi)容管理技術(shù)、海量數(shù)據(jù)管理技術(shù)等。限于篇幅,本文不可能逐一去展開(kāi)來(lái)闡述這些方面的變化,只是從這些變化中歸納出數(shù)據(jù)庫(kù)技術(shù)發(fā)展呈現(xiàn)出的突出特點(diǎn)。
[1]西爾伯沙茨(Silberschatz.A.).計(jì)算機(jī)科學(xué)叢書(shū):數(shù)據(jù)庫(kù)系統(tǒng)概念(原書(shū)第6 版).機(jī)械工業(yè)出版社,2012.3
[2]王珊、薩師煊.數(shù)據(jù)庫(kù)系統(tǒng)概論(第4 版).高等教育出版社,2006.5
[3]加 西 亞-莫 利 納(Hector Garcia-Molina)、Jeffrey D.Ullman、Jennifer Widom、楊冬青.數(shù)據(jù)庫(kù)系統(tǒng)實(shí)現(xiàn)(第2 版).機(jī)械工業(yè)出版社,2010.5