国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析

2019-09-10 07:22張瑋
現(xiàn)代信息科技 2019年15期
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù)軟件工程

摘? 要:在信息化時(shí)代背景下,傳統(tǒng)的信息系統(tǒng)已經(jīng)無(wú)法滿足軟件工程對(duì)信息數(shù)據(jù)傳輸與存儲(chǔ)的高要求,人們應(yīng)用數(shù)據(jù)挖掘技術(shù)能夠解決這一問題,并保證信息數(shù)據(jù)的準(zhǔn)確性?;诖耍疚囊詳?shù)據(jù)挖掘技術(shù)作為研究對(duì)象,結(jié)合技術(shù)概述分析其應(yīng)用在軟件工程的重要性,從系統(tǒng)結(jié)構(gòu)、軟件開發(fā)與管理等方面闡述數(shù)據(jù)挖掘技術(shù)的實(shí)踐應(yīng)用。

關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);軟件工程;數(shù)據(jù)預(yù)處理

中圖分類號(hào):TP311.13? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2019)15-0017-02

Application Analysis of Data Mining Technology in Software Engineering

ZHANG Wei

(Guizhou Light Industry Technical College,Guiyang? 550025,China)

Abstract:Under the background of information age,traditional information systems can no longer meet the high requirements of software engineering for information data transmission and storage. People applying data mining technology can solve this problem and ensure the accuracy of information data. Based on this,this paper takes data mining technology as the research object,and analyzes the importance of its application in software engineering with the technical overview,and expounds the practical application of data mining technology from the aspects of system structure,software development and management.

Keywords:data mining technology;software engineering;data preprocessing

0? 引? 言

隨著我國(guó)信息技術(shù)的進(jìn)步,數(shù)據(jù)挖掘技術(shù)得到廣泛應(yīng)用,在軟件工程中需要對(duì)數(shù)據(jù)信息進(jìn)行搜集、分類與整理,通過數(shù)據(jù)挖掘技術(shù)的應(yīng)用可以有效提高工作效率,推動(dòng)軟件工程的有序發(fā)展。我國(guó)對(duì)數(shù)據(jù)挖掘技術(shù)的應(yīng)用與研究雖然處于初級(jí)階段,但通過不斷的經(jīng)驗(yàn)積累也能夠發(fā)揮技術(shù)的更多價(jià)值。

1? 數(shù)據(jù)挖掘技術(shù)概述

數(shù)據(jù)挖掘技術(shù)指的是在信息技術(shù)發(fā)展背景下,對(duì)信息數(shù)據(jù)展開處理的技術(shù)。與過去的信息處理技術(shù)相比,數(shù)據(jù)挖掘技術(shù)功能更加強(qiáng)大,可以應(yīng)用在各個(gè)領(lǐng)域,無(wú)論是數(shù)據(jù)處理、數(shù)據(jù)轉(zhuǎn)換還是數(shù)據(jù)分析,都能夠完成相互之間的聯(lián)系,并對(duì)數(shù)據(jù)進(jìn)行最終評(píng)估。將數(shù)據(jù)挖掘技術(shù)應(yīng)用在軟件工程中,能夠提高企業(yè)處理信息數(shù)據(jù)的效率,避免操作失誤,保護(hù)企業(yè)數(shù)據(jù)準(zhǔn)確[1]。

2? 數(shù)據(jù)挖掘技術(shù)在軟件工程中的重要性分析

2.1? 高效整合多樣化信息數(shù)據(jù)

由于數(shù)據(jù)挖掘技術(shù)的功能比較多,其中包含了傳統(tǒng)處理技術(shù)的功能,實(shí)現(xiàn)多樣化信息的收集與分類,并將數(shù)據(jù)按照類別存儲(chǔ)與整理。數(shù)據(jù)挖掘技術(shù)可以在多樣化數(shù)據(jù)中實(shí)現(xiàn)數(shù)據(jù)的系統(tǒng)化管理,為人們進(jìn)行數(shù)據(jù)查閱工作帶來方便。在軟件工程中應(yīng)用該技術(shù),方便信息數(shù)據(jù)的高效整合,幫助企業(yè)全方位了解信息與數(shù)據(jù)[2]。

2.2? 保證信息數(shù)據(jù)的準(zhǔn)確率

數(shù)據(jù)挖掘技術(shù)擁有強(qiáng)大數(shù)據(jù)運(yùn)算功能,以往的數(shù)據(jù)信息系統(tǒng)運(yùn)算數(shù)據(jù)時(shí)需要耗費(fèi)大量時(shí)間與成本。如果信息數(shù)據(jù)體系龐大,系統(tǒng)運(yùn)算時(shí)會(huì)面臨癱瘓問題。在軟件工程中,一旦系統(tǒng)發(fā)生癱瘓,系統(tǒng)將無(wú)法正常使用,數(shù)據(jù)也會(huì)受到破壞。應(yīng)用數(shù)據(jù)挖掘技術(shù)之后可以有效解決以上問題,實(shí)現(xiàn)系統(tǒng)的優(yōu)化,使系統(tǒng)可以在最短時(shí)間內(nèi)處理數(shù)據(jù),防止信息數(shù)據(jù)發(fā)生丟失現(xiàn)象,提高數(shù)據(jù)處理的時(shí)效性。面對(duì)大量的信息數(shù)據(jù),有的數(shù)據(jù)得不到利用,但長(zhǎng)期處于系統(tǒng)中會(huì)影響系統(tǒng)運(yùn)行效率,應(yīng)用數(shù)據(jù)挖掘技術(shù)可以將無(wú)價(jià)值的數(shù)據(jù)剔除,留下有用的信息數(shù)據(jù),保證系統(tǒng)的運(yùn)行效率和數(shù)據(jù)質(zhì)量。

2.3? 縮短信息數(shù)據(jù)處理時(shí)間

在軟件工程中應(yīng)用數(shù)據(jù)挖掘技術(shù)可以分類處理雜亂無(wú)章的數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)的轉(zhuǎn)換與調(diào)用。對(duì)數(shù)據(jù)進(jìn)行深入挖掘處理時(shí)也可以應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn)行數(shù)據(jù)的分類,并對(duì)模糊數(shù)據(jù)及時(shí)清理,提高系統(tǒng)內(nèi)現(xiàn)存數(shù)據(jù)的實(shí)用價(jià)值。人們獲取到的信息數(shù)據(jù)需要進(jìn)行反復(fù)核對(duì),以此保證數(shù)據(jù)真實(shí)性,通過數(shù)據(jù)挖掘技術(shù)的應(yīng)用減少時(shí)間浪費(fèi),提高數(shù)據(jù)核對(duì)效率。

3? 數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析

3.1? 系統(tǒng)結(jié)構(gòu)

數(shù)據(jù)挖掘技術(shù)應(yīng)用流程主要分為三個(gè)階段:數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、模式評(píng)估與知識(shí)表示。在數(shù)據(jù)預(yù)處理階段中,高效得到原始數(shù)據(jù)的根本原因在于確定任務(wù)處理對(duì)象,得到符合軟件工程需求的數(shù)據(jù)。通過數(shù)據(jù)清洗彌補(bǔ)原始數(shù)據(jù)存在的缺陷,確保數(shù)據(jù)的完整性。數(shù)據(jù)抽取需要從數(shù)據(jù)庫(kù)中選擇與軟件工程任務(wù)相符合的信息。數(shù)據(jù)轉(zhuǎn)換需要將數(shù)據(jù)格式加以轉(zhuǎn)化,實(shí)現(xiàn)數(shù)據(jù)的適用性。在數(shù)據(jù)挖掘中需要制定一定的挖掘任務(wù),通過對(duì)數(shù)據(jù)的分類與評(píng)價(jià)總結(jié),合理應(yīng)用運(yùn)算方法進(jìn)行數(shù)據(jù)推敲。在模式評(píng)估與知識(shí)表示中,其實(shí)際用途在于挖掘成功的表達(dá),將興趣度作為衡量標(biāo)準(zhǔn),提高數(shù)據(jù)表達(dá)的識(shí)別能力。

針對(duì)軟件工程中數(shù)據(jù)挖掘技術(shù)的優(yōu)化應(yīng)用,可以從系統(tǒng)結(jié)構(gòu)方面入手,具體如下:(1)檢測(cè)軟件工程中的克隆代碼。以軟件工程為標(biāo)準(zhǔn),將一部分代碼復(fù)制,結(jié)合實(shí)際情況更改一部分代碼,并對(duì)這些代碼進(jìn)行檢測(cè),代碼檢測(cè)與更改可以同時(shí)進(jìn)行,能有效提高檢測(cè)效率,實(shí)現(xiàn)系統(tǒng)的維護(hù)工作。當(dāng)前應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn)行克隆代碼檢測(cè)的方式一共有四種,具體為比較標(biāo)識(shí)符、對(duì)比文本、檢測(cè)系統(tǒng)程序結(jié)構(gòu)與度量圈。在實(shí)際操作中,要求人們結(jié)合實(shí)際情況選擇相應(yīng)的克隆代碼檢測(cè)方法。(2)數(shù)據(jù)信息挖掘法。這是以橫切關(guān)注點(diǎn)為主的挖掘方法,在軟件工程中應(yīng)用該方法可以改造系統(tǒng),對(duì)數(shù)據(jù)信息達(dá)到良好的處理效果[3]。

3.2? 軟件管理

為了讓數(shù)據(jù)挖掘技術(shù)更好地應(yīng)用在軟件工程中,需要從軟件管理角度入手,采用以下兩方面舉措。一方面,深入挖掘數(shù)據(jù)的組織關(guān)系,另一方面,挖掘版本控制信息。軟件工程系統(tǒng)比較繁瑣,挖掘組織關(guān)系時(shí)較為困難,人們需要合理調(diào)配各項(xiàng)信息,以此作為挖掘的依據(jù)。如果以軟件工程管理流程作為主題,對(duì)電子郵件與共享文件展開組織關(guān)系挖掘,可以有效避免系統(tǒng)流程發(fā)生混亂,保護(hù)軟件管理的秩序。當(dāng)信息數(shù)據(jù)發(fā)生變化時(shí),應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn)行軟件管理,將版本控制作為重要依據(jù),將數(shù)據(jù)挖掘技術(shù)與版本控制相聯(lián)系,降低系統(tǒng)運(yùn)行成本,并達(dá)到警示的效果,提高軟件工程的管理水平。

3.3? 軟件開發(fā)

在軟件工程初期階段,人們將數(shù)據(jù)挖掘技術(shù)看成數(shù)據(jù)庫(kù),隨著技術(shù)的發(fā)展,軟件工程發(fā)展到現(xiàn)實(shí)應(yīng)用,系統(tǒng)和現(xiàn)實(shí)共同發(fā)展。軟件工程將各項(xiàng)指標(biāo)與要求緊密結(jié)合,研發(fā)出最新產(chǎn)品,以往的軟件工程中軟件開發(fā)十分困難,而如今應(yīng)用數(shù)據(jù)挖掘技術(shù),可以將其與數(shù)據(jù)庫(kù)相融合,發(fā)揮數(shù)據(jù)庫(kù)內(nèi)信息的最大價(jià)值,有效推動(dòng)軟件開發(fā)的進(jìn)步。不僅如此,軟件工程可以對(duì)信息進(jìn)行更深層次的挖掘,充分發(fā)揮軟件工程的價(jià)值,利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)數(shù)據(jù)的更新,保證軟件開發(fā)質(zhì)量,優(yōu)化軟件操作流程。在技術(shù)的支持下,人們可以合理劃分軟件內(nèi)部,方便及時(shí)發(fā)現(xiàn)問題,并展開積極有效的問題處理。利用數(shù)據(jù)挖掘技術(shù)可以進(jìn)行網(wǎng)站設(shè)計(jì),對(duì)網(wǎng)站內(nèi)容進(jìn)行挖掘,特別是對(duì)文本內(nèi)容的挖掘,隨后整合網(wǎng)站信息,通過自動(dòng)歸類技術(shù)實(shí)現(xiàn)信息的層次性組織。在軟件或網(wǎng)站管理中,應(yīng)用數(shù)據(jù)挖掘技術(shù)可以根據(jù)用戶對(duì)網(wǎng)站的訪問記錄,進(jìn)行記錄信息挖掘,從中了解用戶對(duì)該網(wǎng)站內(nèi)容的興趣,進(jìn)而對(duì)用戶提供信息推送服務(wù)和定制服務(wù),以此吸引更多用戶訪問該網(wǎng)站。

在軟件開發(fā)階段,可以使用Data Analytics輕量級(jí)業(yè)務(wù)數(shù)據(jù)可視化分析平臺(tái),這是數(shù)據(jù)挖掘技術(shù)的一項(xiàng)成果。該平臺(tái)能夠?qū)崿F(xiàn)異構(gòu)數(shù)據(jù)源的高效整合,可以兼容各種數(shù)據(jù)源類型,支持海量數(shù)據(jù)??山尤隕xcel/CSV等數(shù)據(jù)文件、企業(yè)各種業(yè)務(wù)系統(tǒng)、第三方互聯(lián)網(wǎng)數(shù)據(jù)、公共數(shù)據(jù)服務(wù)平臺(tái)等來源,輕松整合所有相關(guān)業(yè)務(wù)數(shù)據(jù),幫助企業(yè)消滅數(shù)據(jù)孤島。企業(yè)利用該平臺(tái)可以完成數(shù)據(jù)的深度交互分析,Data Analytics基于探索式分析,支持智能推薦圖形與圖表,二者可以協(xié)同過濾,幫助用戶快速定位,通過數(shù)據(jù)挖掘找出問題,以拖拽式操作方法解決問題。

3.4? 聚類

在數(shù)據(jù)挖掘技術(shù)中聚類指的是對(duì)各個(gè)環(huán)節(jié)數(shù)據(jù)加以分析,結(jié)合軟件工程的具體要求實(shí)現(xiàn)數(shù)據(jù)細(xì)化,以類型細(xì)化作為基礎(chǔ),為原始數(shù)據(jù)類型做出保障。通過聚類可以讓同種類型數(shù)據(jù)具有相似性特點(diǎn),在存在相似性的同時(shí),也存在一定的差異,突出各自的特點(diǎn)。應(yīng)用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)聚類劃分時(shí),面對(duì)的對(duì)象無(wú)法預(yù)測(cè),與其他算法相比,聚類擁有更加廣泛的應(yīng)用范圍,進(jìn)行數(shù)據(jù)分析時(shí)更加獨(dú)特,挖掘信息數(shù)據(jù)時(shí)可以確保檢測(cè)結(jié)果的有效性與真實(shí)性。

4? 結(jié)? 論

總而言之,隨著信息技術(shù)的深入發(fā)展,人們已經(jīng)步入信息時(shí)代,數(shù)據(jù)挖掘技術(shù)也成為對(duì)信息數(shù)據(jù)展開處理和存儲(chǔ)的有效方式。在軟件工程中應(yīng)用數(shù)據(jù)挖掘技術(shù),有利于提高軟件開發(fā)效率,提升軟件管理質(zhì)量,加強(qiáng)數(shù)據(jù)挖掘力度,使數(shù)據(jù)挖掘技術(shù)發(fā)揮巨大效果,人們可以應(yīng)用數(shù)據(jù)挖掘技術(shù)完成數(shù)據(jù)的聚類和網(wǎng)站設(shè)計(jì),為人們的生活帶來便利。

參考文獻(xiàn):

[1] 張立鑒.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研究 [J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2019(6):47-48.

[2] 王祥順.數(shù)據(jù)挖掘技術(shù)在軟件工程中的實(shí)踐與探索 [J].電腦編程技巧與維護(hù),2019(4):82-83+100.

[3] 吳金玲.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用 [J].產(chǎn)業(yè)創(chuàng)新研究,2019(3):115-116.

作者簡(jiǎn)介:張瑋(1981.10-),女,土家族,貴州銅仁人,本科,講師,研究方向:計(jì)算機(jī)科學(xué)與技術(shù)。

猜你喜歡
數(shù)據(jù)挖掘技術(shù)軟件工程
數(shù)據(jù)挖掘在計(jì)算機(jī)網(wǎng)絡(luò)病毒防御中的應(yīng)用
數(shù)據(jù)挖掘技術(shù)及其在醫(yī)學(xué)信息領(lǐng)域的應(yīng)用
基于Web的數(shù)據(jù)挖掘技術(shù)與相關(guān)研究
依托工作室的軟件工程實(shí)踐教學(xué)研究
應(yīng)用瀑布模型的MOOC制作方法
融合APTECH體系的軟件產(chǎn)業(yè)人才培養(yǎng)探究
基于工程教育認(rèn)證的《軟件工程》課程教學(xué)質(zhì)量建設(shè)研究 
關(guān)于如何創(chuàng)新和完善計(jì)算機(jī)軟件工程管理的探討