国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘技術(shù)在軟件工程的應用探索

2016-08-26 23:25:56孫潔
中國科技博覽 2016年17期
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù)軟件工程應用

孫潔

[摘 要]當前是信息化的大數(shù)據(jù)時代,人們每天都生活在大量的數(shù)據(jù)中,生活和工作中信息無處不在,但如何能夠在海量信息中定位自己的需求信息是現(xiàn)代人關(guān)注的焦。數(shù)據(jù)挖掘技術(shù)很好的解決了這個問題,不僅能夠?qū)崿F(xiàn)信息的定位還能在短時間內(nèi)完成,大大的縮短了處理數(shù)據(jù)的時間。本文就以數(shù)據(jù)挖掘技術(shù)為中心點,首先對其概念進行簡單的闡述,之后在此基礎上分析了軟件工程中的應用,以期能為相關(guān)專業(yè)的技術(shù)人員提供一定的技術(shù)參考。

[關(guān)鍵詞]數(shù)據(jù)挖掘技術(shù);軟件工程;應用

中圖分類號:TP311.5 文獻標識碼:A 文章編號:1009-914X(2016)17-0267-01

1.數(shù)據(jù)挖掘技術(shù)概述

所謂數(shù)據(jù)挖掘,主要指的是在大量的數(shù)據(jù)信息中利用科學、有效的算法第一時間獲取到有用信息的篩選過程。大量的信息存在于生產(chǎn)和生活領(lǐng)域,使得人們在處理事情是無從下手,這樣大大降低了人們的工作效率,也浪費了工作人員寶貴的時間。而這一問題通過數(shù)據(jù)挖掘技術(shù)的使用得到了很好的解決。

1.1 數(shù)據(jù)挖掘技術(shù)所采用的方法

在具體的操作中,數(shù)據(jù)挖掘技術(shù)會通過很多方法來使任務得以完成。具體的方法有如下幾種:

1.1.1 遺傳算法的使用

所謂遺傳算法,主要是指基于生物自然選擇與遺傳激勵的隨機搜索算法,也是數(shù)據(jù)挖掘技術(shù)常用的一種操作方法[1]。遺傳算法的有點就在于表面上看似無聯(lián)系的事物,卻能在事物模型間建立相關(guān)的練習,實現(xiàn)事物之間共同發(fā)展,現(xiàn)在生物界越來越重視的遺傳基因等的研究,所以這種方法很受人們的歡迎。

1.1.2 采用決策樹方法

這種方法主要用于對信息的分類和整合,在遇到大量的信息的時候,能夠在短時間內(nèi)找出關(guān)鍵的信息,能夠使信息分類的快速化和簡單化,并且保證了信息分類的準確度,但是此方法的不足之處就在于具有較差的抗噪性能,不能全面的來表述較為復雜的概念。

1.1.3 采用統(tǒng)計分析法

往往會利用回歸分析和主成分分析等方法來分析數(shù)據(jù)庫字段之間的關(guān)系。在字段之間的關(guān)系包括相關(guān)關(guān)系,函數(shù)關(guān)系也是其中的一種,不同的是函數(shù)關(guān)系可以用公式來表示,而相關(guān)關(guān)系則不能通過公示來表示關(guān)系,系統(tǒng)分析法的使用為這種關(guān)系的分析提供了便利。

1.1.4 采用可視化技術(shù)

可視化技術(shù)是采用一些圖表來對數(shù)據(jù)進行表現(xiàn),便于對數(shù)據(jù)的理解,比如,使用簡單圖形來展示存在于數(shù)據(jù)庫中的多個數(shù)據(jù),使研究者看起來一目了然,使單調(diào)的數(shù)據(jù)形象化,更容易掌握數(shù)據(jù)的相關(guān)信息。

1.1.5 采用神經(jīng)網(wǎng)絡方法

它模擬人腦神經(jīng)元結(jié)構(gòu),以 MP 模型和Hebb學習規(guī)則為基礎,用神經(jīng)網(wǎng)絡連接的權(quán)值表示知識,其學習體現(xiàn)在神經(jīng)網(wǎng)絡權(quán)值的逐步計算上。前饋式網(wǎng)絡、反饋式網(wǎng)絡和自組織網(wǎng)絡是常用的三種神經(jīng)網(wǎng)絡模型,分別用于預測、聯(lián)想記憶和聚類等。

2.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應用

2.1關(guān)于程序代碼及結(jié)構(gòu)方面的挖掘

①克隆代碼檢測的方法??寺〈a主要指的是根據(jù)軟件工程運行需求,對某一代碼段進行復制、粘貼,若有特殊需求,也可以對部分代碼進行適當更改,對于上述代碼的檢測主要是為了避免故障傳播,對系統(tǒng)進行簡要維護,以此來滿足軟件系統(tǒng)運行需求。目前,克隆代碼檢測的方法主要包括4種,即文本對比、標識符對比、度量和程序結(jié)構(gòu)[2]。每一種檢測方法都有其不同的檢測流程和判斷依據(jù),需要結(jié)合實際情況選取最佳的檢測方法。

②Aspect 挖掘。Aspect 挖掘就是我們常說的橫切關(guān)注點挖掘,在軟件工程系統(tǒng)中,Aspect 挖掘是系統(tǒng)改造成面向方面軟件所必須要處理好的重要問題。在此項問題的處理中,可供采用的方法有很多,最具針對性的就是度量分析法和形式概念分析法。上述兩種方法可以利用候選集的重構(gòu)將橫切點關(guān)注挖掘相關(guān)問題有效解決。實際上,數(shù)據(jù)挖掘技術(shù)還可以在很多方面產(chǎn)生不錯的影響。

③代碼檢索。在軟件開發(fā)方法學中提倡著復用這個重要的原則,近年來有一個軟件復用這方面領(lǐng)域里的很重重要的議題,也就是關(guān)于在本地或者是面向 WEB 這些代碼庫中檢索出符合現(xiàn)階段項目的代碼之類的議題,已經(jīng)出現(xiàn)了幾種比較有代代表性的方式,比如分類存儲并檢索、基于輸入-輸出映射的檢索、基于構(gòu)件形式化描述、基于代碼相似性等等方法,這些方式主要會涉及到有關(guān)于聚類、分類、語義分析等等幾種比較主要的技術(shù)。由于其Web的應用范圍不斷的擴大,也就不再單單只有文檔在其中,還有許多猶如 Google Cod 以及 Mica 等等類型的代碼搜索引擎也隨著那些 Web 中的可供參考的代碼而出現(xiàn)

2.2軟件項目管理中數(shù)據(jù)挖掘技術(shù)的應用

數(shù)據(jù)挖掘技術(shù)在項目管理中的應用主要體現(xiàn)在兩個方面,即對組織關(guān)系的挖掘和對版本控制信息的挖掘。由于軟件項目管理是一個全面而又系統(tǒng)的工程,因此,有關(guān)組織關(guān)系的挖掘包含了多個方面的內(nèi)容,最主要的就是對人力資源的有效協(xié)調(diào)和分配。另一方面是對版本控制信息的挖掘,版本信息控制的功能主要是為工作人員查看版本信息提供方便,數(shù)據(jù)挖掘技術(shù)在此方面的應用一方面可以自動對系統(tǒng)修復情況進行檢測,并在此基礎上為系統(tǒng)提供警示作用,另一方面則可以避開很多常見錯誤,確保系統(tǒng)正常運行,以此來提高軟件項目管理水平。

2.3故障檢測中數(shù)據(jù)挖掘技術(shù)的應用

在軟件工程系統(tǒng)不斷優(yōu)化與完善的今天,勢必要對故障檢測方法進行改進。數(shù)據(jù)挖掘技術(shù)的應用充分滿足了這一需求。數(shù)據(jù)挖掘技術(shù)對故障的檢測主要是從兩個方面展開,分別為程序說明和交互模式。對程序說明進行挖掘主要是為了對于系統(tǒng)運行相關(guān)的信息進行跟蹤檢測,便于發(fā)現(xiàn)系統(tǒng)運行問題,從而做到對系統(tǒng)的有效檢測和維護。就當前常用的挖掘方法來看,主要可分為基于規(guī)則和基于自動化兩種。兩種方法分別依據(jù)程序行為規(guī)則和API規(guī)則開展挖掘工作。

3.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應用方法

3.1關(guān)聯(lián)方法

挖掘技術(shù)應用與軟件工程中的關(guān)聯(lián)方法,其規(guī)則在于發(fā)現(xiàn)大量數(shù)據(jù)中所具有的相關(guān)聯(lián)系及有趣關(guān)聯(lián)。并且關(guān)聯(lián)規(guī)則具有兩個重要特征,其一為支持度,表示為 P(A ∪B),表明 A、 B 兩個子集在事物集中出現(xiàn)的概率是相同的;其二為置信度,可表示為 P(B|A),說明 A 在事物集中所具有的概率,同樣 B 也會出現(xiàn)[3]。

3.2聚類方法

聚類方式的應用,顧名思義,便是把對象數(shù)據(jù)分為多個簇或類,并且保證統(tǒng)一類或簇中的數(shù)據(jù)的相似度較高,同時不同類或簇中的對象具有明顯的差別。

3.3分類方法

分類方式的應用,主要是對離散值和分類標號進行操作,一般情況下,首先需建立起相應的模型,對其概念集和數(shù)據(jù)類集進行描述,之后應用模型完成分類

4.結(jié)語

綜上所述,數(shù)據(jù)挖掘技術(shù)是軟件工程向更加完善、優(yōu)化方向發(fā)展的必然之路,更是時代發(fā)展的要求。隨著社會信息化程度的不斷加深,數(shù)據(jù)挖掘技術(shù)的應用將會更加的廣泛。研究人員對此項技術(shù)也要引起重視,通過不斷的研究和探索,進一步的提升其自身的水平及其應用的價值,為人類的不斷發(fā)展,社會的進步體現(xiàn)更大的價值。

參考文獻:

[1]李明江,唐穎,周力軍. 數(shù)據(jù)挖掘技術(shù)及應用[J]. 中國新通信,2012,22:66-67+74.

[2]陳建樺. 數(shù)據(jù)挖掘技術(shù)在軟件工程中的應用研究[J]. 硅谷,2014,01:73+51.

[3]劉玉峰. 數(shù)據(jù)挖掘技術(shù)在軟件知識庫中的應用研究[D].廣西師范大學,2010.

猜你喜歡
數(shù)據(jù)挖掘技術(shù)軟件工程應用
基于Web的數(shù)據(jù)挖掘技術(shù)與相關(guān)研究
數(shù)據(jù)挖掘技術(shù)在生物信息學中的應用
數(shù)據(jù)挖掘技術(shù)在CRM中的應用
基于南京地鐵AFC系統(tǒng)的數(shù)據(jù)挖掘
依托工作室的軟件工程實踐教學研究
基于工程教育認證的《軟件工程》課程教學質(zhì)量建設研究 
軟件導刊(2016年9期)2016-11-07 22:31:23
關(guān)于提高軟件工程實踐教學質(zhì)量的幾點思考
關(guān)于如何創(chuàng)新和完善計算機軟件工程管理的探討
GM(1,1)白化微分優(yōu)化方程預測模型建模過程應用分析
科技視界(2016年20期)2016-09-29 12:03:12
煤礦井下坑道鉆機人機工程學應用分析
科技視界(2016年20期)2016-09-29 11:47:01
开平市| 西盟| 福海县| 香格里拉县| 肃南| 溆浦县| 山丹县| 佛山市| 平定县| 蕉岭县| 滦平县| 周宁县| 邛崃市| 富川| 手机| 大石桥市| 乡宁县| 讷河市| 阿克| 岳池县| 禹州市| 凭祥市| 吉安县| 滦南县| 敦煌市| 田阳县| 克东县| 阜城县| 佛冈县| 滦南县| 津市市| 中超| 浏阳市| 介休市| 团风县| 兰州市| 襄汾县| 磴口县| 本溪市| 手机| 泽普县|