劉海峰,徐麗麗,高 艷
(晉中信息學(xué)院,山西 晉中 030800)
人們運(yùn)用科學(xué)手段,對(duì)大量的信息進(jìn)行整理和分析,為人們做出正確的選擇提供了科學(xué)的基礎(chǔ)。大數(shù)據(jù)作為一種新型的數(shù)據(jù)資源,是隨著計(jì)算機(jī)技術(shù)的發(fā)展和互聯(lián)網(wǎng)的日益普及而產(chǎn)生的一種新型的數(shù)據(jù)資源。大數(shù)據(jù)時(shí)代的來(lái)臨,越來(lái)越多的人開(kāi)始重視數(shù)據(jù)的信息化和數(shù)據(jù)庫(kù)的構(gòu)建。
隨著計(jì)算機(jī)技術(shù)的迅速發(fā)展和普及,海量的信息資源可以被集中存儲(chǔ),網(wǎng)絡(luò)的出現(xiàn),使海量的數(shù)據(jù)和信息得以共享。數(shù)據(jù)雖然是一種虛擬的資源,但同時(shí)也是一種寶貴的資源,要想把它變成有用的資料,就必須要用到它,而在信息化的發(fā)展過(guò)程中,大量的數(shù)據(jù)平臺(tái)和軟件將會(huì)極大地提高數(shù)據(jù)的轉(zhuǎn)換效率和質(zhì)量,從而為社會(huì)、經(jīng)濟(jì)的發(fā)展提供一個(gè)很好的借鑒。隨著數(shù)據(jù)的不斷增長(zhǎng),數(shù)據(jù)的存儲(chǔ)、處理技術(shù)的不斷發(fā)展,各種數(shù)據(jù)量的收集越來(lái)越頻繁,如何從海量數(shù)據(jù)中快速地抽取數(shù)據(jù),成為數(shù)據(jù)處理領(lǐng)域的重點(diǎn)研究對(duì)象。目前,大數(shù)據(jù)云存儲(chǔ)、檢索、分析、計(jì)算等技術(shù)體系,都是隨著時(shí)間的推移而不斷更新的,且技術(shù)種類越來(lái)越多的,為大數(shù)據(jù)的整合提供了科技手段[1]。信息技術(shù)包括信息收集、整理、篩選、存儲(chǔ)、管理,既可以為社會(huì)服務(wù),也可以實(shí)現(xiàn)信息的增值。在對(duì)同類數(shù)據(jù)進(jìn)行綜合分析的基礎(chǔ)上,必須具有交叉分析的能力,確保數(shù)據(jù)的完整性,提高數(shù)據(jù)的可用性。大數(shù)據(jù)技術(shù)是對(duì)海量的數(shù)據(jù)進(jìn)行收集、存儲(chǔ)、處理和分析,而數(shù)據(jù)的存儲(chǔ)、共享和處理是實(shí)現(xiàn)大數(shù)據(jù)信息資源庫(kù)的關(guān)鍵。信息數(shù)據(jù)庫(kù)的建設(shè)能夠豐富信息資源,提高信息的質(zhì)量,同時(shí)也可以通過(guò)互聯(lián)網(wǎng)實(shí)現(xiàn)信息的交叉處理,解決信息重復(fù)收集、處理等問(wèn)題。數(shù)據(jù)庫(kù)的建立必須遵循數(shù)據(jù)采集的統(tǒng)一規(guī)范,確保數(shù)據(jù)的質(zhì)量,并利用科學(xué)的數(shù)據(jù)處理系統(tǒng)對(duì)數(shù)據(jù)進(jìn)行甄選、分類、整合、儲(chǔ)蓄,以便用戶進(jìn)行查詢和管理員的日常維護(hù),確保數(shù)據(jù)庫(kù)的正常運(yùn)行。
大數(shù)據(jù)資源庫(kù)整體技術(shù)體系結(jié)構(gòu)包括計(jì)算平臺(tái)資源、計(jì)算業(yè)務(wù)數(shù)據(jù)、計(jì)算管理系統(tǒng)和計(jì)算服務(wù)系統(tǒng)。首先,采用虛擬化、分布式存儲(chǔ)等計(jì)算技術(shù),利用計(jì)算資源池、存儲(chǔ)池、網(wǎng)絡(luò)資源池,實(shí)現(xiàn)服務(wù)器虛擬化、網(wǎng)絡(luò)虛擬化、存儲(chǔ)虛擬化。其次,對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行計(jì)算,以確保業(yè)務(wù)數(shù)據(jù)的安全存儲(chǔ),實(shí)現(xiàn)了虛擬機(jī)的動(dòng)態(tài)遷移、數(shù)據(jù)遷移、跨部門數(shù)據(jù)的分享和交換、業(yè)務(wù)應(yīng)用的接入。計(jì)算管理系統(tǒng)是一種基于計(jì)算機(jī)的自動(dòng)化控制系統(tǒng),它可以將計(jì)算中心的業(yè)務(wù)和服務(wù)結(jié)合起來(lái),從而提高其運(yùn)行的效率。另外,計(jì)算服務(wù)系統(tǒng)作為一個(gè)與公共的平臺(tái),它能夠?qū)崿F(xiàn)對(duì)外界的統(tǒng)一服務(wù),為用戶提供綜合的應(yīng)用和服務(wù)。支持平臺(tái)是一個(gè)面向外部客戶的統(tǒng)一的計(jì)算平臺(tái),基于物理分區(qū),建立支撐平臺(tái)。為確保整個(gè)計(jì)算中心的安全性,在計(jì)算中心內(nèi)應(yīng)設(shè)置一個(gè)專門的隔離區(qū)域(DMZ區(qū)域),用于對(duì)不同的業(yè)務(wù)系統(tǒng)進(jìn)行處理,并對(duì)其進(jìn)行接入。在此基礎(chǔ)上,先進(jìn)的實(shí)體計(jì)算機(jī)為數(shù)據(jù)庫(kù)的邏輯分割提供了支撐,而虛擬服務(wù)器和實(shí)體服務(wù)器支持了應(yīng)用系統(tǒng)的邏輯分區(qū)[2]。
首先是資源庫(kù)的數(shù)據(jù)基礎(chǔ),大數(shù)據(jù)信息資源具有數(shù)量大、種類多、價(jià)值密度低、處理速度快等四個(gè)特點(diǎn)。面對(duì)海量數(shù)據(jù),我們迫切需要一種技術(shù)來(lái)處理海量數(shù)據(jù)并將其轉(zhuǎn)化為有意義的數(shù)據(jù)。大數(shù)據(jù)的重要意義不在于掌握大量數(shù)據(jù),而在于它所包含的數(shù)據(jù)。在構(gòu)建專業(yè)信息資源庫(kù)時(shí),大數(shù)據(jù)技術(shù)可以從社會(huì)需求、交互協(xié)作等多方面進(jìn)行深度挖掘,以滿足不同用戶需求的專業(yè)資源資源庫(kù)。其次是對(duì)于數(shù)據(jù)的建模與分析整理,由于數(shù)據(jù)的數(shù)量大和多樣性,數(shù)據(jù)的存儲(chǔ)成本、存儲(chǔ)難度和分析的復(fù)雜性都決定了數(shù)據(jù)模型的設(shè)計(jì)。分析模型的構(gòu)建取決于數(shù)據(jù)模型的設(shè)計(jì),如果數(shù)據(jù)模型過(guò)于復(fù)雜,那么整個(gè)應(yīng)用程序就會(huì)變得十分復(fù)雜。對(duì)異構(gòu)化數(shù)據(jù)要進(jìn)行分類,要做到結(jié)構(gòu)化、異構(gòu)化,要合理地選擇不同的存儲(chǔ)結(jié)構(gòu)和存儲(chǔ)方式,合理地選擇異構(gòu)的數(shù)據(jù)采集技術(shù),最后把異構(gòu)化的數(shù)據(jù)轉(zhuǎn)化成結(jié)構(gòu)化的數(shù)據(jù)。在此基礎(chǔ)上,對(duì)實(shí)時(shí)數(shù)據(jù)和沉淀數(shù)據(jù)進(jìn)行嚴(yán)格的區(qū)分,并對(duì)數(shù)據(jù)庫(kù)的持久性進(jìn)行了合理的設(shè)計(jì),以減少對(duì)數(shù)據(jù)的大量存儲(chǔ)。在建立了數(shù)據(jù)的標(biāo)準(zhǔn)模型之后,挖掘數(shù)據(jù)的價(jià)值就需要借助智能的數(shù)據(jù)統(tǒng)計(jì)工具和分析工具來(lái)完成。這是技術(shù)的最重要之處,也是最困難的部分,因?yàn)楹芏鄷r(shí)候,沒(méi)有現(xiàn)成的工具,只能在現(xiàn)有的工具上進(jìn)行更新或者重新設(shè)計(jì)。
為了適應(yīng)市場(chǎng)環(huán)境的變化,促進(jìn)學(xué)生的全面發(fā)展,我國(guó)在實(shí)施現(xiàn)代教育理念的同時(shí),也要強(qiáng)化教育系統(tǒng)的數(shù)據(jù)庫(kù)建設(shè),優(yōu)化教育資源,使其更具科學(xué)性,學(xué)內(nèi)容更豐富、教學(xué)方式更靈活。隨著信息技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)資料庫(kù)已成為課堂教學(xué)的重要工具。在素質(zhì)教育理念的影響下,所有的教育工作必須以學(xué)生的綜合發(fā)展為中心,以優(yōu)質(zhì)的服務(wù)為中心。在進(jìn)行加工、推導(dǎo)等操作時(shí),要通過(guò)大數(shù)據(jù)技術(shù)對(duì)資源進(jìn)行分析與合理的使用,并對(duì)數(shù)據(jù)庫(kù)進(jìn)行有效管理。為用戶提供更完善的閱讀服務(wù),提高用戶的學(xué)習(xí)體驗(yàn)。
盡管教育資源庫(kù)為學(xué)習(xí)者和教師帶來(lái)了便利的服務(wù),但在其建設(shè)和使用過(guò)程中難免會(huì)碰到問(wèn)題,這就要求建設(shè)者與管理者進(jìn)一步對(duì)大數(shù)據(jù)技術(shù)進(jìn)行優(yōu)化。首先是關(guān)于資料的安全性。信息管理在給人們帶來(lái)方便的同時(shí),也存在著諸如信息泄露、病毒攻擊等問(wèn)題,若沒(méi)有健全的網(wǎng)絡(luò)安全維護(hù)系統(tǒng),或是因?yàn)楣芾砣藛T自身技術(shù)的欠缺,就會(huì)使得網(wǎng)絡(luò)管理與服務(wù)環(huán)境過(guò)于開(kāi)放,對(duì)學(xué)生的信息安全造成威脅。某些不法分子會(huì)通過(guò)網(wǎng)絡(luò)的安全漏洞進(jìn)行攻擊,造成重大的信息泄露,從而對(duì)用戶的個(gè)人信息和校園網(wǎng)的安全造成威脅。教育部門要想防止資料的安全漏洞,就必須加強(qiáng)資料的安全管理,比如,采用先進(jìn)的防火墻技術(shù)對(duì)數(shù)據(jù)進(jìn)行分類、整理、多重防護(hù),以及采用云端備份技術(shù),對(duì)各種數(shù)據(jù)進(jìn)行及時(shí)備份,避免數(shù)據(jù)丟失。加強(qiáng)相關(guān)管理人員的安全意識(shí),認(rèn)真對(duì)待工作,并對(duì)數(shù)據(jù)進(jìn)行有效的管理與維護(hù),以保證數(shù)據(jù)的安全。其次,是服務(wù)成本和網(wǎng)絡(luò)造價(jià)高,信息資源人才匱乏。教育部門要樹(shù)立信息資源一體化的理念,加強(qiáng)對(duì)基礎(chǔ)資源的利用,同時(shí)要建立各區(qū)域院校聯(lián)合開(kāi)發(fā)的大數(shù)據(jù)平臺(tái),以達(dá)到降低服務(wù)費(fèi)用、改善服務(wù)品質(zhì)、達(dá)到信息資源庫(kù)可持續(xù)發(fā)展的目的。
通過(guò)建立基于數(shù)據(jù)的旅游資源數(shù)據(jù)庫(kù),可以充分利用當(dāng)?shù)刭Y源的真實(shí)價(jià)值,建設(shè)現(xiàn)代化的數(shù)字化景區(qū),建設(shè)數(shù)字化資源數(shù)據(jù)庫(kù),為資源管理智能化發(fā)展、資源保護(hù)數(shù)字化發(fā)展、產(chǎn)業(yè)整合網(wǎng)絡(luò)化發(fā)展提供良好的推動(dòng)力。通過(guò)對(duì)大量數(shù)據(jù)的分析,可以為旅游企業(yè)的運(yùn)營(yíng)人員提供科學(xué)的信息,為旅游企業(yè)的運(yùn)營(yíng)管理人員提供科學(xué)的信息,從而為企業(yè)提供更好的決策依據(jù)?;跀?shù)據(jù)驅(qū)動(dòng)的旅游資源數(shù)據(jù)庫(kù),可以根據(jù)游客的需求,實(shí)時(shí)地生成適合于旅游者實(shí)際需要的線路和相關(guān)的旅游服務(wù)資源。要實(shí)現(xiàn)旅游文化的現(xiàn)代化,必須建立基于數(shù)據(jù)的數(shù)據(jù)庫(kù)。隨著旅游業(yè)的發(fā)展,旅游業(yè)的數(shù)字化和現(xiàn)代化程度的提高,使得旅游業(yè)的發(fā)展更加迅速。
大數(shù)據(jù)環(huán)境下所建造的旅游資源信息庫(kù)也有著類似于教育信息庫(kù)一樣的問(wèn)題,如安全問(wèn)題、管理造價(jià)問(wèn)題,另外,此類嬴利用數(shù)據(jù)庫(kù)也面臨著版權(quán)問(wèn)題、信息更新問(wèn)題、用戶隱私保護(hù)問(wèn)題等多重困境,使得信息資源庫(kù)的建立與維護(hù)難度更大。一是版權(quán)問(wèn)題,要區(qū)分各景區(qū)圖片的所有權(quán)問(wèn)題,不得隨意盜用個(gè)人用戶以及景區(qū)未經(jīng)許可的圖片。二是信息更新,在數(shù)據(jù)驅(qū)動(dòng)型旅游資源數(shù)據(jù)庫(kù)的構(gòu)建中,部分景區(qū)也會(huì)重建修改,必須保障資源庫(kù)中的信息隨著景區(qū)的改變而修改,確保信息的真實(shí)可靠。三是用戶隱私保護(hù)問(wèn)題,旅游業(yè)在利用數(shù)據(jù)庫(kù)進(jìn)行廣告投放時(shí)必定考慮到游客的偏好,這就難免導(dǎo)致個(gè)人信息的泄露,所以必須在信息檢索時(shí)保護(hù)好用戶的隱私。旅游企業(yè)只有這樣才能挖掘出數(shù)據(jù)資源庫(kù)的價(jià)值,才能通過(guò)對(duì)旅游數(shù)據(jù)庫(kù)的建設(shè)和使用進(jìn)行產(chǎn)品改版、效果評(píng)估、廣告投放以及調(diào)查問(wèn)卷等,為今后旅游企業(yè)的決策與發(fā)展助力[3]。
在企業(yè)發(fā)展戰(zhàn)略中,人才資源策略是關(guān)鍵。人才資源的戰(zhàn)略目標(biāo)是根據(jù)企業(yè)總體戰(zhàn)略來(lái)確定的,所以企業(yè)中的人才資源貫穿于企業(yè)的整個(gè)生命周期的不同階段。尤其是在大數(shù)據(jù)時(shí)代,各行業(yè)、各企業(yè)對(duì)于人才的需求與日俱增,對(duì)人才資源庫(kù)的需求也更為迫切。通過(guò)信息檢索、檔案收集、智能匹配,不僅企業(yè)可以以此來(lái)招聘合適的人才,招聘者也可以尋找自己心儀的崗位,基于大數(shù)據(jù)技術(shù)的人才資源庫(kù)建設(shè)有利于提高畢業(yè)生的就業(yè)率,使其更符合企業(yè)的發(fā)展需要,符合當(dāng)今社會(huì)發(fā)展的需要,其作為雙贏政策為工作雙方提供了有利的服務(wù)。
然而人才資源庫(kù)不僅有著大數(shù)據(jù)資源庫(kù)同樣的問(wèn)題,如用戶隱私易泄露,而且還包括了虛假信息魚龍混雜、信息檢索能力不足等現(xiàn)存問(wèn)題。必須加強(qiáng)對(duì)資源庫(kù)的安全保護(hù),合理投入資金加強(qiáng)基礎(chǔ)建設(shè),增添服務(wù)項(xiàng)目。要積極運(yùn)用現(xiàn)代科技,拓寬信息服務(wù)渠道與查詢方式,充實(shí)服務(wù)內(nèi)容,最大限度地滿足客戶的個(gè)性化需要。另外增強(qiáng)網(wǎng)絡(luò)監(jiān)管,當(dāng)發(fā)現(xiàn)虛假信息、詐騙招聘等問(wèn)題時(shí)應(yīng)當(dāng)及時(shí)處理,并且提高用戶的警惕性,避免用戶的利益受到侵害[4]。
綜上所述,在大數(shù)據(jù)技術(shù)的加持下,大量的信息可以被收集、存儲(chǔ)、整理、分析、轉(zhuǎn)化為信息資源。尤其是在當(dāng)今互聯(lián)網(wǎng)發(fā)達(dá)的時(shí)代,在知識(shí)經(jīng)濟(jì)的背景下,大數(shù)據(jù)是人類社會(huì)發(fā)展的一種重要科技手段,利用大數(shù)據(jù)進(jìn)行檢索,打破以往的被動(dòng),從數(shù)據(jù)中發(fā)掘有用的信息,使海量的數(shù)據(jù)資源被整合為具有重大價(jià)值的信息資源庫(kù),并且建立健全檢索機(jī)制與監(jiān)督機(jī)制以便用戶檢索使用,為我國(guó)的經(jīng)濟(jì)發(fā)展提供現(xiàn)代化支持。■