童凌
【摘要】 就軟件工程項目當中數(shù)據(jù)挖掘技術應用的實際情況來看,信息規(guī)則挖掘技術已經逐漸被應用到了很多行業(yè)領域當中,成功地完成了對龐大數(shù)據(jù)的分析和整理,并且將提取到有用信息展現(xiàn)在人們面前,基于此,本文將針對軟件工程當中的數(shù)據(jù)挖掘技術的研究進展展開分析,研究數(shù)據(jù)挖掘技術之所以被得到廣泛應用的原因以及開發(fā)過程當中所面臨的挑戰(zhàn),旨在能夠進一步加深對該項技術的理解。
【關鍵詞】 軟件工程 數(shù)據(jù)挖掘 研究進展
前言:隨著計算機技術不斷發(fā)展,軟件工程項目當中的數(shù)據(jù)挖掘技術水平也不斷地得到提高,現(xiàn)代化的數(shù)據(jù)挖掘技術將繼續(xù)致力于智能技術以及自動化技術的開發(fā)中,不斷創(chuàng)新挖掘潛力,使之能夠處理更為龐大的數(shù)據(jù)系統(tǒng),并且不斷地完善技術分析工具,從而使得數(shù)據(jù)挖掘技術能夠更好地被應用到軟件工程的研究中。
一、數(shù)據(jù)挖掘的概念
數(shù)據(jù)挖掘這一概念主要與軟件工程以及計算機應用技術有密切的關系,它采用了一種新的計算方式在龐大的數(shù)據(jù)基礎中找到想要的數(shù)據(jù)信息,因此被稱之為數(shù)據(jù)挖掘,事實上,這是一種新型的數(shù)據(jù)分析方式,現(xiàn)代化軟件工程項目的研究任務非常龐大,軟件代碼量的急劇增長導致數(shù)據(jù)量的快速增加,傳統(tǒng)的數(shù)據(jù)計算方式已經無法滿足當代的數(shù)據(jù)分析要求,人們急切盼望能夠發(fā)展出一種新的數(shù)據(jù)分析模式,來實現(xiàn)對有效信息數(shù)據(jù)的整理工作。[1]
二、數(shù)據(jù)挖掘技術在軟件工程項目中的應用現(xiàn)狀
2.1數(shù)據(jù)挖掘技術得到廣泛應用的原因
數(shù)據(jù)挖掘技術得到廣泛應用,主要基于兩個原因。一方面,由于計算機存儲器容量的快速增長,網(wǎng)絡傳輸帶寬的增加,應用軟件能夠存儲大量可供分析的數(shù)據(jù)信息,;另一方面,由于現(xiàn)代化信息技術不斷發(fā)展,軟件開發(fā)水平也得到進步,大量數(shù)據(jù)挖掘算法得到徹底的研究,因此這些算法得以深入到前所未有的特定領域,挖掘出用戶的隱性需求。不僅如此,此種技術還有著儲存方便、簡單的優(yōu)點,具有應用成本低的優(yōu)勢。數(shù)據(jù)挖掘技術不需要依附于其他特定的技術平臺,僅需對現(xiàn)有的數(shù)據(jù)平臺進行詳細分析,減少了相關硬件成本。因此,數(shù)據(jù)挖掘技術在軟件項目開發(fā)中越來越受到人們的重視。
2.2面對的挑戰(zhàn)
一般工程項目本身的數(shù)據(jù)量非常龐大,因而這些數(shù)據(jù)具有一定的復雜度,在針對這些軟件工程中的數(shù)據(jù)進行分析時,還要同時解決一些代碼問題和注釋問題,這在無形之中增加了技術分析的復雜度。除此以外,在現(xiàn)代化的軟件工程項目當中,對于分析結果展示要求非常高,因此在數(shù)據(jù)挖掘技術的開發(fā)和應用過程中,還要綜合性地研究技術的使用功能,進而實現(xiàn)技術應用領域的開拓研究[2],即數(shù)據(jù)可視化技術。不過一部分技術分析的結果并不是非常徹底,對于數(shù)據(jù)挖掘分析的結果評價不是非常完善,而且也沒有統(tǒng)一出定量的評價方式,這就使得數(shù)據(jù)分析時所使用的方法不同,分析出的結果也不同,因此不能夠很好地對分析結果進行總結。
2.3開發(fā)出更高性能的數(shù)據(jù)挖掘技術
在創(chuàng)新數(shù)據(jù)挖掘技術開發(fā)的過程中,現(xiàn)代化的軟件工程項目更加注重關于重用分析規(guī)則的發(fā)現(xiàn)以及檢索項目。通過樹狀的網(wǎng)絡結構與靜態(tài)動態(tài)網(wǎng)絡規(guī)則的鏈表結構來進行規(guī)則研究,從規(guī)則的角度上來挖掘軟件工程內部當中的整體性,規(guī)則索引手段更得到了進一步的創(chuàng)新發(fā)展,使得檢索的規(guī)則形式變得更加地多樣化,提高了檢索的效率[3]。
另外,數(shù)據(jù)挖掘技術最終需要面向應用才能體現(xiàn)它的價值,而深入研究的各類數(shù)據(jù)挖掘算法擁有各自不同的特定應用領域。比如,在市場營銷中,可以使用Apriori算法,它不僅能夠基于現(xiàn)有的數(shù)據(jù)進行分析,還能夠做出準確度很高的相關預測。
傳統(tǒng)的缺陷定位技術并不能夠完全找到軟件工程的缺陷,而融合創(chuàng)新了數(shù)據(jù)挖掘技術以后,使得缺陷定位系統(tǒng)變得更加健全,而且擁有了更為強大的規(guī)則表達行為,將軟件工程構造成為一種模型,在模型當中,更好地表達出了序列以及樹的行為,并且實現(xiàn)了自動化的評價功能,同時也完成了一些關于反向研究工程以及文檔的自動生成項目,還加深了對一些惡意軟件檢索功能。運用更高性能的數(shù)據(jù)挖掘技術,能夠很快地就找到病毒所在,對病毒進行全方位的數(shù)據(jù)分析評估,進而可以有效地提高數(shù)據(jù)分析的可行性,提高了軟件工程開發(fā)的安全性能,將對軟件工程的研究轉變成為一種動態(tài)發(fā)展的過程。
三、結論
綜上所述,隨著軟件工程項目當中數(shù)據(jù)挖掘技術的不斷應用和發(fā)展,相信在不久的將來,一定會取得更為優(yōu)秀的成績,使得軟件工程項目的發(fā)展變得更加地智能化與自動化,根據(jù)研究進展的情況來看,軟件工程項目以及數(shù)據(jù)挖掘技術將有著更為廣闊的發(fā)展空間,今后的技術工具研究一定會更加完善,從而創(chuàng)造出更大的價值。
參 考 文 獻
[1]賀瑋.軟件工程數(shù)據(jù)挖掘技術的研究進展[J].科技風,2014,17:141+145.
[2]馬保平.關于對軟件工程中的數(shù)據(jù)挖掘技術的探討[J].電子技術與軟件工程,2015,19:196-197.
[3]黃世云.軟件工程數(shù)據(jù)挖掘研究進展概述[J].電子技術與軟件工程,2014,21:89.