徐 飛
(閩西職業(yè)技術(shù)學(xué)院 福建 龍巖 364030)
有別于傳統(tǒng)的數(shù)據(jù)處理方式,數(shù)據(jù)挖掘主要是一種以數(shù)據(jù)分析為基礎(chǔ)的數(shù)據(jù)處理技術(shù),能夠高效地完成信息分類、聚類、關(guān)聯(lián)挖掘等數(shù)據(jù)處理工作[1]。如今,各個(gè)領(lǐng)域應(yīng)用的數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則算法主要以Apriori算法為基礎(chǔ)。但由于Apriori算法其本身頻繁進(jìn)行數(shù)據(jù)庫(kù)掃描及大量候選集的缺點(diǎn),在應(yīng)用過(guò)程中通常會(huì)對(duì)Apriori算法進(jìn)行優(yōu)化和拓展,以更好地適用信息處理工作。本次研究以 Apriori 算法為基礎(chǔ),提出一種優(yōu)化的Apriori+算法,并將其引入至高校教務(wù)管理中進(jìn)行實(shí)驗(yàn),探討其應(yīng)用效果。
數(shù)據(jù)挖掘技術(shù)也被稱作“數(shù)據(jù)庫(kù)的知識(shí)發(fā)現(xiàn)”,其基本的運(yùn)行邏輯是在大量無(wú)規(guī)則、不完全、模糊且隨機(jī)的原始數(shù)據(jù)中,辨別并提取到在數(shù)據(jù)中所隱藏的,與之相關(guān)或有用的知識(shí)及信息[2]。
數(shù)據(jù)挖掘技術(shù)在應(yīng)用過(guò)程中有較為顯著的要素或特征,如可以對(duì)GB、TB或者更大規(guī)模的數(shù)據(jù)進(jìn)行處理;可以通過(guò)系統(tǒng)分析或通過(guò)模糊查詢獲取有用的信息;適用于數(shù)據(jù)更新快且反應(yīng)速度快的場(chǎng)合,有利于對(duì)相應(yīng)的決策提供支持;具有動(dòng)態(tài)增長(zhǎng)性,隨著數(shù)據(jù)規(guī)模的擴(kuò)展,數(shù)據(jù)挖掘系統(tǒng)可以發(fā)現(xiàn)新規(guī)則或?qū)υ?guī)則進(jìn)行更新。從以上特點(diǎn)亦可以看出,數(shù)據(jù)挖掘技術(shù)在高校教務(wù)系統(tǒng)中具有較高的應(yīng)用價(jià)值。
1.2.1 關(guān)聯(lián)規(guī)則分析功能
數(shù)據(jù)倉(cāng)庫(kù)作為相關(guān)信息內(nèi)容的集合,其中涵蓋事務(wù)數(shù)據(jù)庫(kù)、關(guān)系數(shù)據(jù)庫(kù)以及其他相關(guān)的各類數(shù)據(jù)信息。數(shù)據(jù)挖掘過(guò)程中主要是通過(guò)對(duì)數(shù)據(jù)倉(cāng)庫(kù)信息的掃描,運(yùn)用關(guān)聯(lián)規(guī)則中的最小支持度及最小置信度實(shí)現(xiàn)信息獲取,并通過(guò)相關(guān)關(guān)系和項(xiàng)集的確定對(duì)得到的信息進(jìn)行挖掘分析。
海洋油氣資源開發(fā)是服務(wù)海洋強(qiáng)國(guó)戰(zhàn)略和“一帶一路”倡議的具體體現(xiàn),對(duì)實(shí)現(xiàn)國(guó)家能源戰(zhàn)略、維護(hù)國(guó)家權(quán)益等具有重要意義。惠州海事局秉持提供專業(yè)優(yōu)質(zhì)高效的海事服務(wù)理念,積極采取多種有效措施,不斷提高海事監(jiān)管服務(wù)水平,與有關(guān)企業(yè)共同努力解決存在的安全隱患,大力助推海洋石油勘探事業(yè)的發(fā)展。
1.2.2 概念描述及聚類分析功能
2.3.3