国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于關(guān)聯(lián)分析的計(jì)算機(jī)軟件數(shù)據(jù)挖掘技術(shù)

2021-09-16 08:42:09龐霄波
今日自動(dòng)化 2021年7期
關(guān)鍵詞:關(guān)聯(lián)分析計(jì)算機(jī)軟件數(shù)據(jù)挖掘

龐霄波

[摘? ? 要]軟件數(shù)據(jù)挖掘技術(shù)就是在互聯(lián)網(wǎng)中無(wú)數(shù)條信息中尋找需要且有價(jià)值的消息,它是軟件工程中重要的研發(fā)領(lǐng)域,還能縮短軟件的研發(fā)周期。計(jì)算機(jī)的核心是硬盤,其好壞決定了軟件的使用質(zhì)量和實(shí)用程度。各類軟件的出現(xiàn)為現(xiàn)代信息搜索技術(shù)提供了便利條件,面對(duì)巨大的信息量,數(shù)據(jù)挖掘技術(shù)展現(xiàn)了其優(yōu)勢(shì),讓人們能夠充分利用這些數(shù)據(jù)為未來(lái)的計(jì)算機(jī)的發(fā)展提供幫助。文章探討基于關(guān)聯(lián)分析的計(jì)算機(jī)軟件數(shù)據(jù)挖掘技術(shù)。

[關(guān)鍵詞]關(guān)聯(lián)分析;計(jì)算機(jī)軟件;數(shù)據(jù)挖掘;應(yīng)用

[中圖分類號(hào)]TP311.13 [文獻(xiàn)標(biāo)志碼]A [文章編號(hào)]2095–6487(2021)07–00–03

Data Mining Technology of Computer Software Based on Association Analysis

Pang Xiao-bo

[Abstract]Software data mining technology is to find needed and valuable information from countless pieces of information on the Internet. It is an important research and development field in software engineering and can also shorten the software development cycle. The core of the computer is the hard disk, and its quality determines the quality and practicality of the software. The emergence of various types of software provides convenient conditions for modern information search technology. Faced with a huge amount of information, data mining technology has demonstrated its advantages, allowing people to make full use of these data to provide help for the future development of computers. The article will discuss in depth the computer software data mining technology based on association analysis.

[Keywords]association analysis; Computer software; Data mining; application

計(jì)算機(jī)軟件挖掘技術(shù)是信息收集、數(shù)據(jù)集成、數(shù)據(jù)規(guī)約的一種技術(shù),是一種仿生全局優(yōu)化方法數(shù)據(jù)挖掘。隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,信息量大大增加,所以對(duì)信息的整合就需要人們格外關(guān)注,數(shù)據(jù)挖掘技術(shù)很好地解決了這一問(wèn)題,這種算法提高了數(shù)據(jù)挖掘的效率和質(zhì)量,降低了傳統(tǒng)算法的復(fù)雜程度。由于它的算法復(fù)雜,因此經(jīng)過(guò)的步驟也比較多,不僅如此,它還是一個(gè)反復(fù)循環(huán)的過(guò)程,只要有一個(gè)步驟沒(méi)有達(dá)到標(biāo)準(zhǔn),就需要重新開(kāi)始,所以要想掌握這門技術(shù)就要有細(xì)心和耐心。

1 數(shù)據(jù)挖掘的基本技術(shù)流程

1.1 信息收集

信息收集是數(shù)據(jù)挖掘的第一步,是通過(guò)所給的數(shù)據(jù)進(jìn)行分析得出所需要數(shù)據(jù)的特征信息,并選擇合理的方法進(jìn)行信息收集,再將這些信息存入到數(shù)據(jù)庫(kù)中,最后對(duì)這些數(shù)據(jù)整合匯總到合適的數(shù)據(jù)庫(kù)中,便于查看以供參考。而面對(duì)海量的信息如何選擇一個(gè)合適的數(shù)據(jù)庫(kù)就尤為重要。

1.2 數(shù)據(jù)集成

數(shù)據(jù)集成就是把不同特點(diǎn)、方向、性質(zhì)的數(shù)據(jù)結(jié)合到一起,形成全面且安全的網(wǎng)絡(luò)環(huán)境,為人們提供各類信息滿足需求,同時(shí)進(jìn)行數(shù)據(jù)共享。

1.3 數(shù)據(jù)規(guī)約

在這個(gè)信息量巨大的網(wǎng)絡(luò)時(shí)代,信息鏈四通八達(dá),能鏈接到世界各地。由于大量的數(shù)據(jù)集中在一起,而數(shù)據(jù)挖掘技術(shù)本身算法就難以掌握,耗費(fèi)的時(shí)間較多,所以在進(jìn)行數(shù)據(jù)挖掘算法時(shí)更是要花費(fèi)很大的精力。但是如果運(yùn)用數(shù)據(jù)規(guī)約技術(shù)既能保證數(shù)據(jù)的完整性和計(jì)算結(jié)果的準(zhǔn)確性,又能節(jié)約時(shí)間提高效率,是一個(gè)一舉多得的好辦法。

1.4 數(shù)據(jù)清理

在這個(gè)網(wǎng)絡(luò)發(fā)達(dá)的時(shí)代,每分鐘會(huì)產(chǎn)生幾十萬(wàn)條信息,從而形成了龐大的數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù),面對(duì)這樣巨大的信息量總有一些是錯(cuò)誤的、不完整的、沒(méi)有價(jià)值的,而這些數(shù)據(jù)就需要清理。如果不能及時(shí)處理這些垃圾信息可能會(huì)造成不必要的麻煩,而且經(jīng)常清理不必要的數(shù)據(jù)才能節(jié)省空間將有價(jià)值的信息存入數(shù)據(jù)倉(cāng)庫(kù)中以供參考。

1.5 數(shù)據(jù)變換

這個(gè)步驟是通過(guò)一些專業(yè)的技術(shù)手段將原本的數(shù)據(jù)轉(zhuǎn)換成特殊的形式以供使用,而對(duì)一些實(shí)數(shù)型數(shù)據(jù),就需要運(yùn)用概念分層和數(shù)據(jù)的離散化來(lái)轉(zhuǎn)換數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)變換。

1.6 數(shù)據(jù)挖掘過(guò)程

根據(jù)數(shù)據(jù)庫(kù)中的信息,選擇合理的統(tǒng)計(jì)方法、分析模式、決策樹(shù)、規(guī)則推理和遺傳算法等方式處理這些數(shù)據(jù),分析得出有價(jià)值的信息,這就是數(shù)據(jù)挖掘的過(guò)程,也是這項(xiàng)工程的核心所在。

1.7 模式評(píng)估

由專業(yè)人員對(duì)挖掘所得數(shù)據(jù)的準(zhǔn)確性進(jìn)行評(píng)估,包括信息的實(shí)用性、可靠性和價(jià)值程度。從企業(yè)的角度來(lái)說(shuō),商人從商為利,那么這樣做可以達(dá)到最大化的商業(yè)利益;從社會(huì)的角度來(lái)說(shuō),所做的一切都是為了社會(huì)的進(jìn)步,而這樣做能給未來(lái)的數(shù)據(jù)挖掘技術(shù)帶來(lái)更好的發(fā)展,使我國(guó)的科技水平更上一層樓。

1.8 知識(shí)表示

將分析所得的數(shù)據(jù)整理,以表格或其他的方式呈現(xiàn)給用戶,讓其能清晰直觀地看到數(shù)據(jù)的變化情況,了解實(shí)時(shí)信息,同時(shí)將這些數(shù)據(jù)匯總到數(shù)據(jù)庫(kù)中進(jìn)行合理的分類,為其他應(yīng)用軟件提供參考資料。

2 遺傳算法的基本原理

遺傳算法是建立在生物學(xué)和遺傳學(xué)基礎(chǔ)之上的一種隨機(jī)搜索算法,這種算法具有良好的隱含并行性,能夠與其他模型結(jié)合使用,因此在數(shù)據(jù)挖掘技術(shù)中被廣泛使用。由于遺傳算法具有對(duì)于各種通用問(wèn)題都可以使用的特點(diǎn),所以被廣泛應(yīng)用于訓(xùn)練神經(jīng)網(wǎng)絡(luò),從網(wǎng)絡(luò)中提取復(fù)雜的計(jì)算規(guī)則。但是它也有缺點(diǎn),其算法比較復(fù)雜,操作困難,所以計(jì)算效率要比傳統(tǒng)的優(yōu)化方法低,因此應(yīng)用范圍就比較局限,而且其編碼存在表示的不準(zhǔn)確性。為了解決這些問(wèn)題,相關(guān)技術(shù)人員實(shí)施了很多優(yōu)化辦法,比如函數(shù)優(yōu)化、組合優(yōu)化等一些高效的技術(shù)手段。

3 計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的研發(fā)

隨著計(jì)算機(jī)的更新?lián)Q代,相關(guān)網(wǎng)絡(luò)技術(shù)也在不斷發(fā)展,一些數(shù)據(jù)處理的軟件技術(shù)層出不窮,數(shù)據(jù)挖掘技術(shù)就是其中之一。要想執(zhí)行這一技術(shù)就需要良好的網(wǎng)絡(luò)環(huán)境和技術(shù)條件。其中還包含很多細(xì)節(jié)性的內(nèi)容,比如可視化技術(shù),就是將一些隱藏的比較深的數(shù)據(jù)信息通過(guò)一些特殊的技術(shù)手段進(jìn)行深入的分析,最后得出想要的規(guī)律或答案。這種方法有效地提高了人們獲取和處理信息的效率,便于進(jìn)行各類數(shù)據(jù)的分析和整理。但是任何一種新型科技的研發(fā)都離不開(kāi)研究人員的管理,良好的管理模式才能創(chuàng)造出更理想的科研成果,這樣才能保證挖據(jù)所得數(shù)據(jù)的真實(shí)性和準(zhǔn)確性,為以后的網(wǎng)絡(luò)應(yīng)用提供有效的幫助。

4 計(jì)算機(jī)軟件數(shù)據(jù)挖掘技術(shù)的操作方法

數(shù)據(jù)挖掘的操作方法的種類數(shù)不勝數(shù),主要有決策樹(shù)方法、粗集方法、覆蓋正例排斥反例方法、統(tǒng)計(jì)分析方法和模糊集方法等。決策樹(shù)經(jīng)常被應(yīng)用于預(yù)測(cè)模型,它將大量的數(shù)據(jù)進(jìn)行分類,獲得重要的、有價(jià)值的信息,因?yàn)閷?duì)數(shù)據(jù)處理的速度快,所以很適合用于大規(guī)模的數(shù)據(jù)分類;粗集實(shí)際上是一種數(shù)學(xué)工具,通常用于研究不準(zhǔn)確的數(shù)學(xué)知識(shí),它不需要額外的信息就能獲得所需的數(shù)據(jù),而且算法簡(jiǎn)單,便于操作。它的處理對(duì)象大多是類似于二位的信息表,但不能處理連續(xù)的數(shù)據(jù),所以連續(xù)屬性的離散化是影響粗集方法實(shí)用化的重點(diǎn);覆蓋正例排斥反例方法就是在正例集合中任意選擇一個(gè)數(shù)據(jù),在到反例中逐個(gè)對(duì)比,與所選值相容的就舍棄,相反的就保留下來(lái),不斷循環(huán);在龐大的數(shù)據(jù)庫(kù)中,每個(gè)數(shù)據(jù)之間只存在兩種關(guān)系:函數(shù)關(guān)系和相關(guān)關(guān)系,而對(duì)這兩種關(guān)系的分析就需要用到統(tǒng)計(jì)分析方法,它可以找出數(shù)據(jù)中的最大值、最小值、求和、平均值等,還可以統(tǒng)計(jì)回歸分析、相關(guān)分析、差異分析所得出的數(shù)值差異來(lái)確定所有數(shù)據(jù)之間的不同;根據(jù)字面意思理解,模糊集是思維的基本形式之一,就是對(duì)事物進(jìn)行模糊判斷、模糊識(shí)別、模糊分析等。互聯(lián)網(wǎng)系統(tǒng)的應(yīng)用程度越繁瑣,模糊集的作用就越大,傳統(tǒng)的模糊集合還可以分為5個(gè)分支,它們之間并非是獨(dú)立的,而是相輔相成的,有著緊密的聯(lián)系。

5 計(jì)算機(jī)軟件數(shù)據(jù)挖掘技術(shù)的應(yīng)用

隨著時(shí)代的變遷,數(shù)據(jù)挖掘技術(shù)成為了一種前沿科技,對(duì)數(shù)據(jù)挖掘技術(shù)的研發(fā)變得非常重要,其占據(jù)了現(xiàn)如今網(wǎng)絡(luò)市場(chǎng)的主導(dǎo)地位。當(dāng)今社會(huì),人們對(duì)個(gè)人數(shù)據(jù)信息的保護(hù)越來(lái)越看重,而各種支付方式的出現(xiàn)就增加了信息泄露的風(fēng)險(xiǎn)。在這種情況下,數(shù)據(jù)挖掘技術(shù)就顯得十分重要,它既保護(hù)了信息的安全又提高了對(duì)有效數(shù)據(jù)獲取的效率。不僅如此,它在其他領(lǐng)域的應(yīng)用也非常廣泛,例如在檢測(cè)克隆技術(shù)的代碼中能有效地阻止錯(cuò)誤代碼的傳播。任何一種程序的研究都需要不斷地試錯(cuò),這樣才能提高應(yīng)用軟件的質(zhì)量,同時(shí)還能解決突發(fā)狀況的發(fā)生。對(duì)相關(guān)研究人員來(lái)說(shuō),要準(zhǔn)確地分析各個(gè)數(shù)據(jù)之間的關(guān)系,并及時(shí)對(duì)計(jì)算機(jī)內(nèi)的數(shù)據(jù)信息進(jìn)行清理和整合分析才能有效地降低數(shù)據(jù)泄露的風(fēng)險(xiǎn),保證用戶的網(wǎng)絡(luò)安全,提供良好的上網(wǎng)環(huán)境。在故障檢測(cè)方面需要研究人員的關(guān)注,因?yàn)閿?shù)據(jù)挖掘技術(shù)比較復(fù)雜,所以故障檢測(cè)技術(shù)需要不斷地進(jìn)行優(yōu)化,以便網(wǎng)絡(luò)系統(tǒng)的正常運(yùn)行。

6 數(shù)據(jù)挖掘技術(shù)的模式

計(jì)算機(jī)軟件數(shù)據(jù)挖掘技術(shù)的模式很多、種類豐富,但是大多采用表格的形式。對(duì)于企業(yè)來(lái)說(shuō),這種模式能讓商家更加直觀地了解消費(fèi)者的信息,并通過(guò)這種技術(shù)手段對(duì)獲得的數(shù)據(jù)進(jìn)行分析,讓商家清楚消費(fèi)者的喜好,以便于以后的營(yíng)銷。對(duì)于個(gè)人用戶來(lái)說(shuō),數(shù)據(jù)挖掘技術(shù)可以清理更深層的垃圾,例如有些應(yīng)用軟件看似被刪除了,但其實(shí)依舊存在,只是隱藏在電腦的深處,發(fā)現(xiàn)不了而已。而隨著這些無(wú)用的信息的堆積,就會(huì)降低電腦的運(yùn)行速度,減少內(nèi)存的使用量,對(duì)用戶造成不必要的麻煩。所以在計(jì)算機(jī)的使用過(guò)程中,運(yùn)用數(shù)據(jù)挖掘技術(shù)及時(shí)清理這些垃圾可以更好地保護(hù)電腦的使用壽命。對(duì)于研發(fā)者來(lái)說(shuō),不斷地完善這種技術(shù),提高用戶的使用效果才能提升自身的市場(chǎng)競(jìng)爭(zhēng)力,擁有更好的發(fā)展前景。

7 基于關(guān)聯(lián)分析的數(shù)據(jù)挖掘技術(shù)

7.1 關(guān)聯(lián)分析的方法

關(guān)聯(lián)分析是一種簡(jiǎn)單實(shí)用的分析技術(shù),就是發(fā)現(xiàn)數(shù)據(jù)信息之間的關(guān)系,并總結(jié)出一些規(guī)律。簡(jiǎn)單來(lái)說(shuō)就是發(fā)現(xiàn)交易數(shù)據(jù)庫(kù)中不同商品之間的聯(lián)系,從而對(duì)一些事物進(jìn)行分析得出某種規(guī)律。在關(guān)聯(lián)分析方法中Apriori算法是幾大重要算法之一。它運(yùn)用逐層搜索的方法有效地縮小了頻繁項(xiàng)集的搜索空間。但它也有不足之處,它的算法繁瑣復(fù)雜、準(zhǔn)確度不高,而這就需要科研人員不斷地完善并努力優(yōu)化這項(xiàng)技術(shù)??梢赃\(yùn)用劃分的方法,將數(shù)據(jù)庫(kù)分成幾個(gè)互不相交的塊;也可以通過(guò)哈希算法進(jìn)行改進(jìn),還有減少交易個(gè)數(shù)等方法,但主要目的就是改善它繁瑣的對(duì)象挖掘過(guò)程,降低計(jì)算難度,同時(shí)避免數(shù)據(jù)的重復(fù),減少數(shù)據(jù)存儲(chǔ)所占的空間。

7.2 關(guān)聯(lián)規(guī)則的生成

把頻繁項(xiàng)集劃分成前件和后件兩個(gè)部分,然后求前件到后件的置信度,如果大于最小置信度閾值,那么它就是一條強(qiáng)關(guān)聯(lián)規(guī)則。不同的算法有不一樣的關(guān)聯(lián)規(guī)則,也就會(huì)產(chǎn)生差異,比如有Apriori算法、GA-Apriori算法和文本算法等,專家們?cè)?jīng)測(cè)試過(guò),在用各種算法進(jìn)行數(shù)據(jù)挖掘的時(shí)候,在這幾種算法中文本算法在相同時(shí)間內(nèi)處理數(shù)據(jù)所消耗的時(shí)間最少,也就是說(shuō)它的效率與其他兩種算法相比是最高的,因?yàn)樗鼘?duì)計(jì)算機(jī)數(shù)據(jù)庫(kù)進(jìn)行了改進(jìn),減少了其他算法不重要的操作,而且也沒(méi)有Apriori算法那么復(fù)雜,能讓人們?cè)诙虝r(shí)間內(nèi)獲得強(qiáng)關(guān)聯(lián)規(guī)則的頻繁項(xiàng)集,

8 結(jié)束語(yǔ)

隨著計(jì)算機(jī)技術(shù)的發(fā)展,數(shù)據(jù)挖掘技術(shù)越來(lái)越被重視,不論是對(duì)企業(yè)還是個(gè)人,它都是一個(gè)值得關(guān)注和討論的話題,它在未來(lái)計(jì)算機(jī)領(lǐng)域?qū)?huì)有很大的發(fā)展前景。作為研發(fā)者,要保證開(kāi)發(fā)出來(lái)的技術(shù)真實(shí)可靠,所以就要對(duì)每個(gè)崗位的人員安排進(jìn)行嚴(yán)格的管理,以確保研發(fā)技術(shù)的質(zhì)量。作為營(yíng)銷者,不斷改進(jìn)營(yíng)銷模式,提高營(yíng)銷策略才能將這項(xiàng)技術(shù)推向大眾,讓更多消費(fèi)者體驗(yàn)到這一技術(shù)的優(yōu)勢(shì)。而為了保證計(jì)算機(jī)技術(shù)的高精準(zhǔn)度,高效性和方便性,技術(shù)人員要注重對(duì)它的完善和改進(jìn),降低計(jì)算過(guò)程中的復(fù)雜程度和計(jì)算量,提高對(duì)數(shù)字的計(jì)算速度,不斷優(yōu)化它的挖掘效果,提升用戶的體驗(yàn)感。

參考文獻(xiàn)

[1] 蘭園淞,劉雪萍,龐少紅,等.基于logistic回歸與Apriori數(shù)據(jù)挖掘技術(shù)的護(hù)理專業(yè)學(xué)生實(shí)習(xí)與就業(yè)關(guān)聯(lián)研究[J].廣西教育,2020(7):58-61,69.

[2] 張稼,陸興華.基于語(yǔ)義關(guān)聯(lián)特征的大型信息管理系統(tǒng)數(shù)據(jù)挖掘技術(shù)[J].電子測(cè)量技術(shù),2019,42(4):85-89.

[3] 王進(jìn)忠.基于數(shù)據(jù)挖掘和可視化技術(shù)的計(jì)算機(jī)應(yīng)用基礎(chǔ)教學(xué)評(píng)價(jià)[J].中外企業(yè)家,2020(17):206.

猜你喜歡
關(guān)聯(lián)分析計(jì)算機(jī)軟件數(shù)據(jù)挖掘
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
基于C語(yǔ)言的計(jì)算機(jī)軟件編程
電子制作(2018年16期)2018-09-26 03:27:08
淺談不同編程語(yǔ)言對(duì)計(jì)算機(jī)軟件開(kāi)發(fā)的影響
電子制作(2018年1期)2018-04-04 01:48:36
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
淺談基于C語(yǔ)言的計(jì)算機(jī)軟件程序設(shè)計(jì)
電子制作(2017年24期)2017-02-02 07:14:40
基于隨機(jī)函數(shù)Petri網(wǎng)的系統(tǒng)動(dòng)力學(xué)關(guān)聯(lián)分析模型
關(guān)聯(lián)分析技術(shù)在學(xué)生成績(jī)分析中的應(yīng)用
基于關(guān)聯(lián)分析的學(xué)生活動(dòng)參與度與高校社團(tuán)管理實(shí)證研究
科技視界(2016年15期)2016-06-30 12:43:00
不同的數(shù)據(jù)挖掘方法分類對(duì)比研究
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
宣城市| 桃园市| 揭西县| 张家川| 威宁| 嘉义市| 资阳市| 三门县| 温泉县| 建湖县| 宁南县| 体育| 哈尔滨市| 乐山市| 平潭县| 崇州市| 吴旗县| 惠安县| 正阳县| 綦江县| 磐安县| 平度市| 光山县| 休宁县| 昌图县| 托里县| 漾濞| 庆元县| 辽中县| 布尔津县| 吉首市| 奈曼旗| 鹤庆县| 濮阳市| 屏东县| 丹棱县| 泰来县| 孝昌县| 广汉市| 仪陇县| 海南省|