王偉 寧麗
摘 要 數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的內(nèi)涵即企業(yè)根據(jù)決策需求對(duì)外部數(shù)據(jù)進(jìn)行處理,對(duì)獲取數(shù)據(jù)作體系結(jié)構(gòu)化集成、裝載處理,以支持企業(yè)決策分析。信息加工理論將人類學(xué)習(xí)過(guò)程比擬為計(jì)算機(jī)對(duì)信息的加工過(guò)程,學(xué)習(xí)內(nèi)容(信息)進(jìn)入學(xué)習(xí)者大腦,經(jīng)大腦聯(lián)結(jié)、加工而實(shí)現(xiàn)知識(shí)的學(xué)習(xí)。就兩者在對(duì)象處理邏輯形式上表現(xiàn)出的鏡像邏輯關(guān)聯(lián)作相關(guān)論述。
關(guān)鍵詞 數(shù)據(jù)倉(cāng)庫(kù)技術(shù);信息加工理論;鏡像邏輯關(guān)聯(lián)性
中圖分類號(hào):G712 文獻(xiàn)標(biāo)識(shí)碼:B
文章編號(hào):1671-489X(2018)10-0032-03
1 前言
數(shù)據(jù)倉(cāng)庫(kù)(Data Warehouse,DW)技術(shù)對(duì)數(shù)據(jù)的處理過(guò)程,即在一定的體系結(jié)構(gòu)與物理環(huán)境下,通過(guò)數(shù)據(jù)集成、組織、架構(gòu)和更新,實(shí)現(xiàn)對(duì)異構(gòu)數(shù)據(jù)源的數(shù)據(jù)處理,并裝載入數(shù)據(jù)庫(kù),供決策者作決策使用[1]。美國(guó)教育心理學(xué)家羅伯特·加涅(R.M.Gagne)認(rèn)為,學(xué)習(xí)者大腦內(nèi)存在感受器、發(fā)生器以及反應(yīng)器等用于信息加工的結(jié)構(gòu)和系統(tǒng),在期望和執(zhí)行控制對(duì)信息流程的激活和調(diào)節(jié)下,這些大腦結(jié)構(gòu)和系統(tǒng)對(duì)源自外界的各種信息(刺激)進(jìn)行注意、登記、記憶和反應(yīng),最終實(shí)現(xiàn)信息的聯(lián)結(jié)、加工與反饋,學(xué)習(xí)就此產(chǎn)生。
宏觀層面,結(jié)合信息與數(shù)據(jù)間關(guān)系的概念,即信息是數(shù)據(jù)的內(nèi)涵,數(shù)據(jù)是信息的載體,故二者邏輯鏡像關(guān)聯(lián)從處理對(duì)象的一致性上得到體現(xiàn)。微觀層面,以下將從數(shù)據(jù)倉(cāng)庫(kù)技術(shù)與信息加工理論的定義和概念、實(shí)際對(duì)象(數(shù)據(jù)或信息)處理過(guò)程以及現(xiàn)實(shí)意義三個(gè)方面,論述其鏡像邏輯關(guān)聯(lián)性。
2 數(shù)據(jù)倉(cāng)庫(kù)技術(shù)與信息加工理論定義和概念的鏡像關(guān)聯(lián)性
著名數(shù)據(jù)庫(kù)專家W.H.Inmon在Building the Data Ware-house一書(shū)中提出的概念比較具有代表性:數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的、集成的、非易失的,且隨時(shí)間變化的數(shù)據(jù)集合,用以支持獲取企業(yè)管理決策[2]。按照該概念,可將數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的特性描述為以下幾個(gè)方面。
面向主題性 面向主題性,即數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)面向管理應(yīng)用與綜合分析的集成化和綜合性信息。換言之,數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是以面向主題的方式進(jìn)行組織的[3]。主題是一個(gè)抽象概念,用于表示某一宏觀分析領(lǐng)域所涉及的對(duì)象,以及與對(duì)象有關(guān)數(shù)據(jù)的集合。不同類型的企業(yè)或機(jī)構(gòu)有不同的主題集合。
集成性 集成性是數(shù)據(jù)倉(cāng)庫(kù)最為重要的特性,即基于傳統(tǒng)的面向業(yè)務(wù)的數(shù)據(jù)庫(kù)或外界數(shù)據(jù)庫(kù)作為數(shù)據(jù)源,經(jīng)過(guò)提煉、加工、匯總和歸一化整理,生成符合數(shù)據(jù)庫(kù)應(yīng)用語(yǔ)義規(guī)范要求的數(shù)據(jù)集合[3]。完成上述四項(xiàng)任務(wù)后,即按照目標(biāo)數(shù)據(jù)模型要求對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換,并清除錯(cuò)誤或無(wú)效數(shù)據(jù)后,將其裝載到目標(biāo)數(shù)據(jù)體系中。
隨時(shí)間變化特性 從歷史的角度描述系統(tǒng)結(jié)構(gòu)和狀態(tài)的變化,要求采用能夠反應(yīng)時(shí)間維度的數(shù)據(jù)[3],即數(shù)據(jù)倉(cāng)庫(kù)技術(shù)要求數(shù)據(jù)庫(kù)在運(yùn)行過(guò)程中必須不斷捕捉操作型環(huán)境中產(chǎn)生的新數(shù)據(jù),并將其歸納整理后追加到其中,保證決策支持系統(tǒng)(Decision Support System,DSS)能夠支持多種復(fù)雜的數(shù)據(jù)應(yīng)用和綜合性管理的決策分析。
20世紀(jì)70年代,心理學(xué)家加涅建立的信息加工理論揭示了課堂教學(xué)的一般規(guī)律,并把人腦設(shè)想為由不同功能的構(gòu)造體組成,把學(xué)習(xí)的過(guò)程比擬為信息的加工過(guò)程。信息加工理論提出的目的在于優(yōu)化學(xué)習(xí)效果,提高學(xué)習(xí)績(jī)效,加工過(guò)程即對(duì)信息(學(xué)習(xí)內(nèi)容)的處理,故該理論存在學(xué)習(xí)過(guò)程的一般特性。
學(xué)習(xí)內(nèi)容目的性 傳統(tǒng)學(xué)習(xí)四要素包括學(xué)習(xí)者、教師、學(xué)習(xí)內(nèi)容和學(xué)習(xí)環(huán)境。首先,學(xué)習(xí)內(nèi)容是學(xué)習(xí)過(guò)程產(chǎn)生的基礎(chǔ),是聯(lián)系學(xué)習(xí)者與教師的中介;其次,最佳的學(xué)習(xí)內(nèi)容是目的性與對(duì)象性的統(tǒng)一,學(xué)習(xí)內(nèi)容內(nèi)在地包含學(xué)習(xí)目標(biāo),學(xué)習(xí)目標(biāo)是學(xué)習(xí)內(nèi)容的出發(fā)點(diǎn)和歸宿,貫穿整個(gè)學(xué)習(xí)過(guò)程始末。由此可看出,信息加工理論在采集和輸入外界環(huán)境信息時(shí),主題性體現(xiàn)在對(duì)信息進(jìn)行有意注意或選擇性知覺(jué)的篩選,到實(shí)現(xiàn)輸入信息的處理和感覺(jué)登錄。這與上述數(shù)據(jù)倉(cāng)庫(kù)技術(shù)對(duì)采集的數(shù)據(jù)要求具有面向主題性是鏡像一致的。
學(xué)習(xí)過(guò)程漸進(jìn)性 信息加工理論認(rèn)為,對(duì)于輸入學(xué)習(xí)者大腦內(nèi)部的信息(刺激),除了具有上述滿足學(xué)習(xí)者學(xué)習(xí)水平和學(xué)習(xí)需要的目的性外,經(jīng)感受器進(jìn)行感覺(jué)登記后的信息,再將選擇性知覺(jué)轉(zhuǎn)換成可辨別的形式并輸入短時(shí)記憶;后經(jīng)語(yǔ)義編碼轉(zhuǎn)化成有意義的模式,形成可長(zhǎng)期保存的長(zhǎng)時(shí)記憶,學(xué)習(xí)過(guò)程完成。其中所涉及信息知覺(jué)、轉(zhuǎn)化、編碼和形成有意義信息聯(lián)結(jié)(知識(shí)),與前者集成性(數(shù)據(jù)提煉、匯總和集成)突顯出鏡像一致性。
學(xué)習(xí)定義三要素 根據(jù)學(xué)習(xí)心理學(xué),對(duì)教育情境中的學(xué)習(xí)進(jìn)行定義:學(xué)習(xí)是指學(xué)習(xí)者在教育目標(biāo)指引下,通過(guò)與其環(huán)境相互作用,所產(chǎn)生的比較持久的性能或傾向的變化[4]。歸納起來(lái),學(xué)習(xí)的產(chǎn)生具備三個(gè)要點(diǎn):主體產(chǎn)生變
化;變化保持相對(duì)持久;主體變化是由他與環(huán)境相互作用產(chǎn)生的。信息加工理論對(duì)學(xué)習(xí)過(guò)程進(jìn)行闡述的最終目的是促進(jìn)學(xué)習(xí)有效發(fā)生,因此,該理論中信息的加工處理過(guò)程同樣涉及與數(shù)據(jù)倉(cāng)庫(kù)技術(shù)類似的時(shí)間特性,兩者在數(shù)據(jù)(信息)的時(shí)間特性上表現(xiàn)出鏡像一致性。
3 數(shù)據(jù)倉(cāng)庫(kù)技術(shù)與信息加工理論在對(duì)象處理過(guò)程上的鏡像關(guān)聯(lián)
數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu) 決策支持系統(tǒng)的不斷發(fā)展和演變促進(jìn)了數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的產(chǎn)生。對(duì)于數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的數(shù)據(jù)處理過(guò)程,可以依據(jù)其數(shù)據(jù)體系結(jié)構(gòu)作相應(yīng)闡述。該體系結(jié)構(gòu)所包含的功能可分為數(shù)據(jù)處理、數(shù)據(jù)管理、數(shù)據(jù)提取與數(shù)據(jù)應(yīng)用四個(gè)層次(如圖1所示[2])。數(shù)據(jù)倉(cāng)庫(kù)技術(shù)將其體系結(jié)構(gòu)從下到上劃分為四個(gè)層次。
1)數(shù)據(jù)源,即在操作型系統(tǒng),如企業(yè)資源計(jì)劃(Enter-
prise Resource Plan,ERP)系統(tǒng)等的支持下,對(duì)外部數(shù)據(jù)、文檔資料和業(yè)務(wù)需要或產(chǎn)生的數(shù)據(jù)等進(jìn)行獲取和采集,生成操作型數(shù)據(jù)存儲(chǔ)。
2)數(shù)據(jù)存儲(chǔ)管理,即將操作型系統(tǒng)(如ERP)采集的數(shù)據(jù)正式向數(shù)據(jù)倉(cāng)庫(kù)裝載。在此過(guò)程中,涉及數(shù)據(jù)的抽取、轉(zhuǎn)換、集成和清理等數(shù)據(jù)處理流程,也是整個(gè)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的核心。即在操作型系統(tǒng)的基礎(chǔ)上,對(duì)數(shù)據(jù)進(jìn)行抽取、清理,并有效集成,按照主題進(jìn)行重新組織,加工存儲(chǔ)DW元數(shù)據(jù)(包括數(shù)據(jù)字典、記錄系統(tǒng)定義以及數(shù)據(jù)轉(zhuǎn)換規(guī)則等信息),并最終確定DW的物理存儲(chǔ)結(jié)構(gòu)[5]。
3)數(shù)據(jù)提?。浩髽I(yè)按照數(shù)據(jù)的覆蓋范圍,將加工處理后的數(shù)據(jù)分類提取,裝載到企業(yè)級(jí)DW和部門(mén)級(jí)DW(通常稱為“數(shù)據(jù)集市”),以支持用戶多角度、多層次分析,確定數(shù)據(jù)的趨勢(shì)。
4)數(shù)據(jù)服務(wù)與應(yīng)用:將數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)在前端工具(如OLAP服務(wù)器)、數(shù)據(jù)挖掘工具等配合下,實(shí)現(xiàn)數(shù)據(jù)面向主題、集成性使用,發(fā)揮DW在DSS中的決策支持作用。
此外,DW體系結(jié)構(gòu)中的元數(shù)據(jù)是其重要數(shù)據(jù),是關(guān)于數(shù)據(jù)的數(shù)據(jù),與信息加工理論中的“元方法”具有相似性。管理工具集中涵蓋了數(shù)據(jù)倉(cāng)庫(kù)技術(shù)對(duì)于數(shù)據(jù)監(jiān)控與管理的各類工具,如監(jiān)視器,用于翻譯和檢測(cè)數(shù)據(jù)源的變化,與信息加工理論中的“執(zhí)行控制”與“期望事項(xiàng)”具有一致性。
加涅的信息加工理論模型 信息加工理論是隨著信息論和現(xiàn)代通信技術(shù)特別是計(jì)算機(jī)技術(shù)的發(fā)展而發(fā)展起來(lái)的,著重運(yùn)用認(rèn)知心理學(xué)的理論觀點(diǎn)特別是信息加工模式來(lái)解釋人類學(xué)習(xí)活動(dòng)。該理論模型如圖2所示[6]。
信息加工理論把學(xué)習(xí)者大腦設(shè)想為由不同功能的構(gòu)造體組成,把學(xué)習(xí)過(guò)程比擬為信息的加工過(guò)程:外界環(huán)境中的信息經(jīng)由感受器注意并選擇后,在一個(gè)感受記錄器內(nèi)短暫停留,并由選擇性知覺(jué)轉(zhuǎn)換為可辨認(rèn)的形式輸入短時(shí)記憶;隨后轉(zhuǎn)換成有意義的模式,才能進(jìn)入長(zhǎng)時(shí)記憶;長(zhǎng)時(shí)記憶將信息重新提取到短時(shí)記憶,并和其他信息聯(lián)結(jié)形成新知識(shí),最終通過(guò)學(xué)習(xí)者肌肉等反應(yīng)器表現(xiàn)出來(lái)[6]。圖中“執(zhí)行控制”和“期望事項(xiàng)”兩個(gè)部分起著激活和調(diào)節(jié)學(xué)習(xí)中信息流程的作用。并將學(xué)習(xí)行動(dòng)分解成八個(gè)階段:動(dòng)機(jī)階段(期望)、領(lǐng)會(huì)階段(注意)、習(xí)得階段(編碼)、保持階段(記憶)、回憶階段(提?。⒏爬A段(遷移)、作業(yè)階段(反應(yīng))、反饋階段(強(qiáng)化)。括號(hào)內(nèi)的內(nèi)容為與階段相對(duì)應(yīng)的內(nèi)部心理加工過(guò)程[6]。如圖3所示,本文將上述八個(gè)階段概括為學(xué)習(xí)過(guò)程四個(gè)層次。
1)學(xué)習(xí)準(zhǔn)備層。學(xué)習(xí)動(dòng)機(jī)即學(xué)習(xí)動(dòng)力,為了促進(jìn)學(xué)習(xí),必須設(shè)法誘導(dǎo)學(xué)習(xí)者的學(xué)習(xí)動(dòng)機(jī),培養(yǎng)學(xué)習(xí)興趣。此外,根據(jù)學(xué)習(xí)心理學(xué)原理,該層上給予學(xué)習(xí)者足夠豐富的刺激(輸入信息)同樣重要,豐富刺激環(huán)境可為學(xué)習(xí)者提供更多學(xué)習(xí)準(zhǔn)備信息,賦予學(xué)習(xí)者更豐富的學(xué)習(xí)期望,促進(jìn)學(xué)習(xí)的發(fā)生。這與數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)源獲取階段具有一致性。
2)學(xué)習(xí)發(fā)生層。在學(xué)習(xí)動(dòng)機(jī)和期望的促使下,學(xué)習(xí)者將面向?qū)W習(xí)目標(biāo)、具有主題性架構(gòu)的學(xué)習(xí)內(nèi)容提供的信息進(jìn)行注意、選擇性知覺(jué)、編碼和形成穩(wěn)定性系統(tǒng)架構(gòu)。結(jié)合上述提及概念,即涵蓋了領(lǐng)會(huì)、習(xí)得和保持三個(gè)階段,體現(xiàn)出信息加工與數(shù)據(jù)倉(cāng)庫(kù)技術(shù)中數(shù)據(jù)處理階段對(duì)數(shù)據(jù)轉(zhuǎn)換和集成有鏡像相似性。
3)學(xué)習(xí)總結(jié)層。長(zhǎng)久保持的信息在一段時(shí)間后也會(huì)消退,因此,對(duì)信息不斷總結(jié)和反復(fù)是知識(shí)學(xué)習(xí)的基礎(chǔ)性、反復(fù)性環(huán)節(jié)。任何優(yōu)秀的學(xué)習(xí)者都需要對(duì)所學(xué)知識(shí)反復(fù)練習(xí)。信息的不斷總結(jié)過(guò)程類似于數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的數(shù)據(jù)提取,是信息在學(xué)習(xí)者大腦內(nèi)反復(fù)重現(xiàn)和在實(shí)踐中進(jìn)行信息反復(fù)運(yùn)用并促進(jìn)知識(shí)遷移。
4)學(xué)習(xí)反饋層。反饋原理是系統(tǒng)科學(xué)基本原理之一,如圖3所示,貫穿所有層次。任何系統(tǒng)都需要通過(guò)信息反饋,才能實(shí)現(xiàn)對(duì)系統(tǒng)的有效控制,從而達(dá)到整個(gè)系統(tǒng)想要實(shí)現(xiàn)的功能和目的。通過(guò)信息反饋,教師才能把控教學(xué)效果,進(jìn)而對(duì)學(xué)習(xí)進(jìn)一步強(qiáng)化和提升。數(shù)據(jù)倉(cāng)庫(kù)技術(shù)前端服務(wù)器對(duì)于數(shù)據(jù)庫(kù)內(nèi)數(shù)據(jù)的完整性、更新情況和傳輸效率等也具有逆向指引功能,即同樣存在反饋機(jī)制。
自此可以看出,數(shù)據(jù)倉(cāng)庫(kù)技術(shù)原理中四個(gè)層次間存在的從數(shù)據(jù)源到數(shù)據(jù)抽取、轉(zhuǎn)換、集成、清理、裝載、提取與運(yùn)用的關(guān)系。信息加工原理層次涉及信息的選擇性知覺(jué)、編碼和記憶,再到反饋與運(yùn)用;系統(tǒng)層次既相互獨(dú)立又相互滲透,前者的輸出作為后者的輸入,后者的輸入充當(dāng)前者的輸出,反饋與交換貫穿各個(gè)層次的系統(tǒng)間。兩者在對(duì)象處理過(guò)程邏輯上表現(xiàn)出鏡像一致性。
4 數(shù)據(jù)倉(cāng)庫(kù)技術(shù)與信息加工理論在現(xiàn)實(shí)意義上的鏡像關(guān)聯(lián)分析
綜合上述對(duì)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)特性、數(shù)據(jù)處理過(guò)程的闡述和對(duì)信息加工理論的概述,不難看出,兩者都是為了使數(shù)據(jù)或信息能更好地滿足實(shí)際對(duì)數(shù)據(jù)的需求,對(duì)其進(jìn)行架構(gòu)性和模式化處理、加工,實(shí)現(xiàn)原本錯(cuò)綜復(fù)雜的數(shù)據(jù)源和信息源形成結(jié)構(gòu)化、有意義的數(shù)據(jù)庫(kù)和系統(tǒng)認(rèn)知,使企業(yè)或主體能更加便捷有效地運(yùn)用數(shù)據(jù)和信息。這便是數(shù)據(jù)倉(cāng)庫(kù)技術(shù)和信息加工理論在面對(duì)現(xiàn)實(shí)需要時(shí)表現(xiàn)出的實(shí)際意義鏡像邏輯關(guān)聯(lián)性。
5 結(jié)語(yǔ)
計(jì)算機(jī)技術(shù)的出現(xiàn)和發(fā)展是人類認(rèn)知發(fā)展過(guò)程的必然階段,計(jì)算機(jī)理論的發(fā)展離不開(kāi)人類認(rèn)知基本理論的支撐,同樣,計(jì)算機(jī)技術(shù)的發(fā)展同樣推動(dòng)社會(huì)學(xué)、心理學(xué)等基礎(chǔ)學(xué)科的發(fā)展。本文通過(guò)對(duì)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)和信息加工理論基本概念和特性、實(shí)現(xiàn)過(guò)程模型和實(shí)際意義三方面的論述,闡述兩者在各個(gè)層面上表現(xiàn)出的鏡像一致性。筆者在論述中使用的“鏡像”一詞是一種嘗試性定義,不妥之處還請(qǐng)同行多多批評(píng),予以改善。
參考文獻(xiàn)
[1]Inmo W H.數(shù)據(jù)倉(cāng)庫(kù)[M].北京:機(jī)械工業(yè)出版社,2003:
25-28.
[2]何玉潔,劉乃嘉.數(shù)據(jù)庫(kù)技術(shù)[M].北京:高等教育出版社,2017:271-275.
[3]李敏強(qiáng),潘振江,等.基于數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的決策支持系統(tǒng)的研究與應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,1998(3):14-19.
[4]皮連生.教育心理學(xué)[M].上海:上海教育出版社,
2011:31-32.
[5]張寧,李強(qiáng)嬌.基于ERP的企業(yè)數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)[J].計(jì)算機(jī)工程與設(shè)計(jì),2005(2):351-353,374.
[6]何克抗,李文光.教育技術(shù)學(xué)[M].北京:北京師范大學(xué)出版社,2009:105-107.