国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于大數(shù)據(jù)技術(shù)的檔案數(shù)據(jù)挖掘?qū)Σ哐芯?/h1>
2022-01-01 23:56賴(lài)
企業(yè)改革與管理 2021年9期
關(guān)鍵詞:數(shù)據(jù)挖掘數(shù)據(jù)庫(kù)檔案管理

賴(lài) 倩

(山東省青島第二中學(xué)分校,山東 青島 266071)

進(jìn)入新時(shí)期以來(lái),行業(yè)內(nèi)的競(jìng)爭(zhēng)加劇,為實(shí)現(xiàn)自身競(jìng)爭(zhēng)力的提升,很多企業(yè)開(kāi)始探索以大數(shù)據(jù)技術(shù)為基礎(chǔ)的檔案數(shù)據(jù)挖掘在檔案管理中的應(yīng)用,目的是解決現(xiàn)存的檔案數(shù)據(jù)挖掘問(wèn)題,進(jìn)一步提升企業(yè)的信息處理效率,實(shí)現(xiàn)企業(yè)競(jìng)爭(zhēng)力的提升。在企業(yè)檔案管理信息化發(fā)展的同時(shí),為保障檔案數(shù)據(jù)挖掘技術(shù)在企業(yè)檔案管理中的可持續(xù)發(fā)展,需以數(shù)據(jù)挖掘?yàn)楹诵臉?gòu)造企業(yè)管理系統(tǒng),采取以人為本的管理模式,為數(shù)據(jù)挖掘的安全長(zhǎng)遠(yuǎn)發(fā)展提供全面的保障。

一、大數(shù)據(jù)技術(shù)概述

大數(shù)據(jù)技術(shù)特征可從以下四個(gè)方面進(jìn)行簡(jiǎn)要概述:

1.信息龐大

信息龐大是大數(shù)據(jù)技術(shù)的主要特征,相關(guān)技術(shù)人員將龐大的數(shù)據(jù)信息進(jìn)行搜集與整理,并統(tǒng)一地存放于數(shù)據(jù)系統(tǒng)中。

2.信息多樣化

數(shù)據(jù)庫(kù)中存放著各種類(lèi)型的信息,例如,生態(tài)系統(tǒng)信息、國(guó)防安全信息與日常生活信息等,都會(huì)按照其具體類(lèi)型進(jìn)行保存。

3.高附加價(jià)值

各行各業(yè)中人們的生活信息與工作信息都會(huì)保存在數(shù)據(jù)庫(kù)中,這為相關(guān)有需要的人員進(jìn)行數(shù)據(jù)處理與數(shù)據(jù)采集提供了較大便利。

4.高效性

相關(guān)人員在數(shù)據(jù)庫(kù)中就相關(guān)信息進(jìn)行檢索時(shí)能夠快速地獲取所需信息,這能在一定程度上有效地提升相關(guān)人員的工作效率。

二、檔案數(shù)據(jù)挖掘技術(shù)

大數(shù)據(jù)背景下,檔案數(shù)據(jù)挖掘需要相關(guān)工作人員在檔案管理過(guò)程中進(jìn)行不斷探索。現(xiàn)階段的數(shù)據(jù)挖掘技術(shù)可從以下三個(gè)方面進(jìn)行簡(jiǎn)要論述:

1.分類(lèi)技術(shù)

分類(lèi)技術(shù)是數(shù)據(jù)挖掘中常用的技術(shù)手段,通過(guò)決策樹(shù)技術(shù),定義數(shù)據(jù)庫(kù)中所有記錄的輸出屬性與輸入屬性,選取數(shù)據(jù)庫(kù)中的部分?jǐn)?shù)據(jù)進(jìn)行訓(xùn)練,從而找出數(shù)據(jù)屬性之間的規(guī)則,通過(guò)規(guī)則實(shí)現(xiàn)新的數(shù)據(jù),并可記錄預(yù)測(cè)。企業(yè)在對(duì)供應(yīng)商管理以及銀行客戶管理中應(yīng)用決策樹(shù)技術(shù)較多,主要用來(lái)預(yù)測(cè)客戶行為,且準(zhǔn)確性很高。在檔案管理中應(yīng)用分類(lèi)技術(shù)可結(jié)合客戶資料與檔案信息的每年詳細(xì)數(shù)據(jù)進(jìn)行相關(guān)信息的及時(shí)修正[1]。

2.聚類(lèi)技術(shù)

聚類(lèi)技術(shù)對(duì)檔案數(shù)據(jù)庫(kù)中的所有數(shù)據(jù)進(jìn)行相似性分析,從而將屬性較為相似的數(shù)據(jù)歸為一類(lèi)實(shí)現(xiàn)分類(lèi)化與集中化管理。聚類(lèi)技術(shù)對(duì)數(shù)據(jù)沒(méi)有特別高的要求,因此,應(yīng)用較為廣泛。在檔案管理中應(yīng)用聚類(lèi)技術(shù)可實(shí)現(xiàn)不同渠道與不同部門(mén)之間數(shù)據(jù)的有效關(guān)聯(lián),實(shí)現(xiàn)數(shù)據(jù)間的深層次聯(lián)系,有效提升數(shù)據(jù)管理效率。

3.關(guān)聯(lián)技術(shù)

關(guān)聯(lián)技術(shù)主要用于描述數(shù)據(jù)項(xiàng)間的關(guān)系規(guī)則,通過(guò)一件事物中的事項(xiàng)導(dǎo)出其他事項(xiàng)的出現(xiàn),以此來(lái)挖掘數(shù)據(jù)之間隱藏的關(guān)聯(lián)性。檔案數(shù)據(jù)之間一般會(huì)存在方方面面的聯(lián)系,這些聯(lián)系體現(xiàn)事物之間的某些規(guī)律,通過(guò)對(duì)這部分?jǐn)?shù)據(jù)的挖掘,能夠促進(jìn)決策與預(yù)測(cè)的科學(xué)合理化發(fā)展,但是,這種技術(shù)的實(shí)現(xiàn)通常需要較為豐富的數(shù)據(jù)庫(kù)。

三、檔案數(shù)據(jù)挖掘現(xiàn)狀

檔案數(shù)據(jù)挖掘現(xiàn)狀可從以下兩個(gè)方面進(jìn)行簡(jiǎn)單論述:

1.檔案數(shù)據(jù)管理方式落后

當(dāng)前許多研究機(jī)構(gòu)、企業(yè)以及國(guó)家相關(guān)部門(mén)仍采用較為落后的檔案管理方式,不同部門(mén)之間獨(dú)立管理,不同類(lèi)型檔案文件缺乏關(guān)聯(lián),這使得在檔案管理中浪費(fèi)了大量的人力物力資源。隨著信息技術(shù)的快速發(fā)展,檔案管理開(kāi)始積極吸取各種先進(jìn)的管理經(jīng)驗(yàn),呈現(xiàn)多元化發(fā)展態(tài)勢(shì),這也從側(cè)面反映出檔案數(shù)據(jù)挖掘技術(shù)的重要性[2]。

2.檔案管理從業(yè)者管理意識(shí)陳舊

大數(shù)據(jù)背景下,信息技術(shù)在各行各業(yè)實(shí)現(xiàn)了快速發(fā)展,其檔案信息量不斷攀升,然而部門(mén)檔案管理工作人員缺乏足夠的先進(jìn)意識(shí),依然忙于各種數(shù)據(jù)儲(chǔ)存,不能實(shí)現(xiàn)數(shù)據(jù)之間的有效關(guān)聯(lián),從而無(wú)法發(fā)揮數(shù)據(jù)的最大功效,同時(shí)也不利于企業(yè)的快速發(fā)展。

四、大數(shù)據(jù)技術(shù)背景下的檔案數(shù)據(jù)挖掘

大數(shù)據(jù)技術(shù)背景下的檔案數(shù)據(jù)挖掘可從多方面進(jìn)行論述,在此不能完全涵蓋,僅從以下幾個(gè)方面進(jìn)行簡(jiǎn)單論述。通過(guò)大數(shù)據(jù)技術(shù)深度挖掘檔案數(shù)據(jù);通過(guò)大數(shù)據(jù)技術(shù)實(shí)現(xiàn)數(shù)據(jù)挖掘的精細(xì)化發(fā)展;綜合性對(duì)策實(shí)現(xiàn)檔案數(shù)據(jù)的深度挖掘。

1.通過(guò)大數(shù)據(jù)技術(shù)深度挖掘檔案數(shù)據(jù)

(1)數(shù)據(jù)采集層管理

數(shù)據(jù)采集是大數(shù)據(jù)技術(shù)中的基礎(chǔ)環(huán)節(jié),其質(zhì)量高低直接關(guān)系大數(shù)據(jù)技術(shù)的功效大小。只有完備化、高質(zhì)量的數(shù)據(jù)信息才能協(xié)助大數(shù)據(jù)技術(shù)提取出有用的隱含信息。由于大數(shù)據(jù)的動(dòng)態(tài)性與實(shí)時(shí)性特征,離線、近線、在線等數(shù)字資源皆在采集范圍之內(nèi)。為突出采集數(shù)據(jù)的有效性與代表性,應(yīng)選擇合理的數(shù)據(jù)信息采集方式,收集所需的數(shù)據(jù),為檔案數(shù)據(jù)挖掘打好基礎(chǔ)。

(2)數(shù)據(jù)管理層管理

各種方式與渠道挖掘的數(shù)據(jù)結(jié)構(gòu)多樣、種類(lèi)繁多,通過(guò)數(shù)據(jù)管理層的處理、集成與存儲(chǔ),可實(shí)現(xiàn)以下功能:

其一,將結(jié)構(gòu)復(fù)雜、難于管理的數(shù)據(jù)轉(zhuǎn)化為便于處理、結(jié)構(gòu)單一的數(shù)據(jù)?,F(xiàn)代互聯(lián)網(wǎng)環(huán)境下,非結(jié)構(gòu)化數(shù)據(jù)與半結(jié)構(gòu)化數(shù)據(jù)應(yīng)用幅度不斷增長(zhǎng),這些資源數(shù)據(jù)逐漸成為館藏重要來(lái)源;其二,對(duì)挖掘數(shù)據(jù)采取“清洗”與“去噪”處理,以此保障數(shù)據(jù)的可靠性與高質(zhì)量。由于剛采集數(shù)據(jù)有冗余數(shù)據(jù)以及噪聲數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行解析、清洗以及重構(gòu),能夠有效地提升挖掘數(shù)據(jù)質(zhì)量;其三,儲(chǔ)存數(shù)據(jù)。為不同的數(shù)據(jù)建立獨(dú)立的數(shù)據(jù)庫(kù)并進(jìn)行存放,縮短訪問(wèn)與查詢(xún)時(shí)間,提升數(shù)據(jù)獲取效率[3]。

(3)分析層管理

數(shù)據(jù)分析是大數(shù)據(jù)技術(shù)的核心部分,通過(guò)對(duì)檔案數(shù)據(jù)關(guān)聯(lián)性的分析,挖掘數(shù)據(jù)之間的密切聯(lián)系,提升數(shù)據(jù)挖掘的深度與廣度。相關(guān)性分析能夠?qū)崿F(xiàn)檔案資源功效的最大化,大數(shù)據(jù)技術(shù)的關(guān)鍵性作用即是發(fā)掘出檔案數(shù)據(jù)獨(dú)有的價(jià)值,不管是儲(chǔ)存的“冷數(shù)據(jù)”,還是基于網(wǎng)絡(luò)實(shí)時(shí)在線的“熱數(shù)據(jù)”,通過(guò)大數(shù)據(jù)技術(shù)對(duì)檔案數(shù)據(jù)的挖掘、整合、分析,激活檔案數(shù)據(jù)中潛在的資源,實(shí)現(xiàn)數(shù)據(jù)功效的同時(shí),創(chuàng)造出新價(jià)值與新知識(shí),有效破除信息孤島壁壘效應(yīng),實(shí)現(xiàn)孤立而互不聯(lián)通檔案數(shù)據(jù)庫(kù)間的信息共享。

2.通過(guò)大數(shù)據(jù)技術(shù)實(shí)現(xiàn)數(shù)據(jù)挖掘的精細(xì)化

(1)檔案資源挖掘

其一,通過(guò)大數(shù)據(jù)技術(shù)明確“大檔案”思路,在日常的數(shù)據(jù)挖掘中重視數(shù)據(jù)積累,不但需要完善檔案資源管理體系,還應(yīng)確立數(shù)據(jù)資源體系觀;其二,建立檔案數(shù)據(jù)資源共享庫(kù)。以省級(jí)為基本建設(shè)單位,建立共享的、規(guī)范的、集中的檔案數(shù)據(jù)庫(kù),實(shí)現(xiàn)各個(gè)檔案館藏的關(guān)聯(lián),形成資源豐富依托于網(wǎng)絡(luò)空間的檔案數(shù)據(jù)庫(kù);利用處理技術(shù)與云計(jì)算平臺(tái)構(gòu)建檔案數(shù)據(jù)網(wǎng),用于實(shí)時(shí)接收最新檔案數(shù)據(jù),并分類(lèi)處理非實(shí)時(shí)性數(shù)據(jù),為檔案用戶提供更加優(yōu)質(zhì)的服務(wù)平臺(tái)。

(2)數(shù)據(jù)挖掘

其一,用戶信息挖掘。挖掘用戶的需求,查看其訪問(wèn)服務(wù)器留下的日志,實(shí)現(xiàn)對(duì)用戶的在線跟蹤,根據(jù)用戶需求進(jìn)行個(gè)性化服務(wù);其二,發(fā)掘用戶瀏覽記錄與檢索記錄。通過(guò)統(tǒng)計(jì)分析,選取點(diǎn)擊率較高的檔案數(shù)據(jù)進(jìn)行數(shù)字化處理;歸納整理用戶常用搜索詞來(lái)充實(shí)檔案數(shù)據(jù)庫(kù)中的關(guān)鍵詞,降低搜索時(shí)間,提升查準(zhǔn)率[4]。

(3)關(guān)系洞察、趨勢(shì)分析

不論是用戶數(shù)據(jù)還是檔案資源,通過(guò)挖掘只能獲取單方面數(shù)據(jù),無(wú)法將獨(dú)立的數(shù)據(jù)匯集成完整的網(wǎng)絡(luò)。因此要實(shí)現(xiàn)數(shù)據(jù)的集中化管理,將其集成為完整的管理網(wǎng)絡(luò),需要對(duì)其進(jìn)行全面深入的分析。通過(guò)整合孤立數(shù)據(jù)點(diǎn),形成完整的檔案網(wǎng)絡(luò),有效促進(jìn)檔案的可持續(xù)發(fā)展。

3.綜合性對(duì)策實(shí)現(xiàn)檔案數(shù)據(jù)的深度挖掘

(1)實(shí)現(xiàn)“以人為本”的用戶關(guān)系管理

通過(guò)大數(shù)據(jù)技術(shù)可以實(shí)時(shí)掌握用戶此前行為與當(dāng)下行為,并預(yù)測(cè)分析用戶未來(lái)行為,深入挖掘檔案數(shù)據(jù)之間的內(nèi)在關(guān)聯(lián),促進(jìn)資源的集成化與創(chuàng)新化;利用大數(shù)據(jù)技術(shù)實(shí)現(xiàn)對(duì)用戶儲(chǔ)存行為、利用興趣、使用習(xí)慣、行為軌跡、搜索方式的分析,發(fā)掘用戶的隱性訴求。根據(jù)不同的用戶建立個(gè)性化數(shù)據(jù)庫(kù),并在其中放入數(shù)據(jù)挖掘結(jié)果以及用戶所需。

(2)合理應(yīng)用“智慧因子”

智慧城市在提出以后,其概念已經(jīng)輻射到各個(gè)領(lǐng)域,其中也包括智慧檔案館,將智慧因子植入大數(shù)據(jù)技術(shù),利用物聯(lián)網(wǎng)技術(shù)將用戶、數(shù)據(jù)、網(wǎng)絡(luò)、檔案、館舍統(tǒng)一在智能網(wǎng)絡(luò)中,達(dá)到深度挖掘與有效整合的目的。大數(shù)據(jù)技術(shù)不但能實(shí)現(xiàn)關(guān)系洞察、用戶數(shù)據(jù)、檔案資源、趨勢(shì)分析數(shù)據(jù)的融合,還能通過(guò)智慧服務(wù)理念實(shí)現(xiàn)個(gè)性化服務(wù),推動(dòng)檔案數(shù)據(jù)信息的知識(shí)空間構(gòu)建。

五、結(jié)語(yǔ)

綜上所述,現(xiàn)階段的檔案數(shù)據(jù)挖掘還存在著一些問(wèn)題亟待解決,這對(duì)于檔案管理工作的可持續(xù)發(fā)展有著一定的阻礙作用。基于這種狀況,很多企業(yè)相關(guān)從業(yè)者開(kāi)始探索基于大數(shù)據(jù)技術(shù)的檔案數(shù)據(jù)挖掘,目的是進(jìn)一步提升檔案管理信息化進(jìn)程,解決現(xiàn)有的檔案數(shù)據(jù)挖掘問(wèn)題,實(shí)現(xiàn)企業(yè)檔案管理的長(zhǎng)遠(yuǎn)發(fā)展。

猜你喜歡
數(shù)據(jù)挖掘數(shù)據(jù)庫(kù)檔案管理
改進(jìn)支持向量機(jī)在特征數(shù)據(jù)挖掘中的智能應(yīng)用
事業(yè)單位檔案管理的難點(diǎn)及對(duì)策實(shí)踐
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
如何規(guī)范檔案管理
基于事故數(shù)據(jù)挖掘的AEB路口測(cè)試場(chǎng)景
檔案管理與企業(yè)內(nèi)部控制關(guān)系的思考
數(shù)據(jù)庫(kù)
軟件工程領(lǐng)域中的異常數(shù)據(jù)挖掘算法
數(shù)據(jù)庫(kù)
數(shù)據(jù)庫(kù)

莎车县| 渑池县| 合肥市| 韩城市| 永康市| 郸城县| 郧西县| 铜山县| 肃南| 盐津县| 波密县| 瑞丽市| 竹山县| 云林县| 梅州市| 平顺县| 沙坪坝区| 龙州县| 元江| 鄱阳县| 靖边县| 咸丰县| 哈密市| 鄯善县| 台南县| 门源| 乌鲁木齐县| 锦州市| 永吉县| 明溪县| 青冈县| 南通市| 红桥区| 溆浦县| 辽阳县| 武强县| 康定县| 龙游县| 牡丹江市| 贵定县| 东海县|