国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘與人工智能決策

2017-08-21 11:30:09劉恒竹
魅力中國 2017年22期
關(guān)鍵詞:數(shù)據(jù)挖掘人工智能

摘要:科學(xué)技術(shù)的不斷前進(jìn)使人工智能受到了更多人的注重。作為一種高尖端技術(shù),其前期開展較為緩慢,可是就近幾年的開展?fàn)顩r來說,人工智能的理論研究與實(shí)踐使用已取得了長足前進(jìn)。而這一前進(jìn),雖不能完全歸功于信息技術(shù)與大數(shù)據(jù)技術(shù),可是這兩種技術(shù)為人工智能技術(shù)的開展起到了極大的推進(jìn)效果。因而,對數(shù)據(jù)發(fā)掘在人工智能上的使用進(jìn)行深入研究顯得尤為重要。

關(guān)鍵詞:數(shù)據(jù)挖掘;人工智能;決策

一、數(shù)據(jù)挖掘技術(shù)

(一)數(shù)據(jù)挖掘簡介

數(shù)據(jù)挖掘(Datamining),主要是指對數(shù)據(jù)庫中數(shù)據(jù)進(jìn)行探索的一個(gè)過程。一般而言,數(shù)據(jù)挖掘從概念而言,包含3個(gè)方面的內(nèi)容,即數(shù)據(jù)源數(shù)據(jù)的收集、對于數(shù)據(jù)源數(shù)據(jù)的處理以及最終的有效數(shù)據(jù)的表示。數(shù)據(jù)挖掘技術(shù)的應(yīng)用領(lǐng)域主要集中在數(shù)據(jù)分析、模式識(shí)別和情報(bào)檢索等方面,同時(shí)人工智能技術(shù)以及數(shù)據(jù)庫技術(shù)都與其有著緊密的聯(lián)系。隨著數(shù)據(jù)信息爆發(fā)式的發(fā)展,從海量的數(shù)據(jù)中挖掘分析出對于管理決策、生產(chǎn)控制有用的數(shù)據(jù)是非常必要的,數(shù)據(jù)挖掘正是基于這樣的需求日益被人們所重視。傳統(tǒng)的數(shù)據(jù)挖掘更加側(cè)重計(jì)算機(jī)技術(shù)的應(yīng)用而未來數(shù)據(jù)發(fā)掘必然是信息科學(xué)、電子科學(xué)、計(jì)算機(jī)技術(shù)、建模技術(shù)、統(tǒng)計(jì)技術(shù)的大融合,隨著大數(shù)據(jù)處理技術(shù)的應(yīng)用、云計(jì)算的飛速發(fā)展以及數(shù)據(jù)挖掘算法的不斷提升,數(shù)據(jù)挖掘必將邁向大有作為的舞臺(tái)。

(二)數(shù)據(jù)挖掘步驟

源數(shù)據(jù)的收集階段、數(shù)據(jù)預(yù)處理階段、數(shù)據(jù)挖掘階段、數(shù)據(jù)評估以及知識(shí)表示階段。

(三)數(shù)據(jù)挖掘常見的方法

數(shù)據(jù)挖掘中大部分方法都不是專為解決某個(gè)問題而特制的,方法之間也不互相排斥。數(shù)據(jù)挖掘的方法主要有:關(guān)聯(lián)分析、聚類分析、預(yù)測、時(shí)序模式分析和偏差分析等。常見和應(yīng)用最廣泛的算法和模型有:

1.傳統(tǒng)統(tǒng)計(jì)方法:抽樣技術(shù)、多元統(tǒng)計(jì)分析和統(tǒng)計(jì)預(yù)測方法等。

2.可視化技術(shù):用圖表等方式把數(shù)據(jù)特征直觀地表述出來。

3.決策樹:利用一系列規(guī)則劃分,建立樹狀圖,用樹形結(jié)構(gòu)來表示決策集合,可用于分類和預(yù)測,常用的算法有CART,CHAID,ID3,C4.5,C5.0等。

4.人工神經(jīng)網(wǎng)絡(luò):模擬人的神經(jīng)元功能,從結(jié)構(gòu)上模仿生物神經(jīng)網(wǎng)絡(luò),經(jīng)過輸入層、隱藏層、輸出層等,對數(shù)據(jù)進(jìn)行調(diào)整、計(jì)算,最后得到結(jié)果,是一種通過訓(xùn)練來學(xué)習(xí)的非線性預(yù)測模型,可以完成分類、聚類、特征挖掘、回歸分析等多種數(shù)據(jù)挖掘任務(wù)。

5.遺傳算法:基于自然進(jìn)化理論,在生物進(jìn)化的概念基礎(chǔ)上設(shè)計(jì)的一種優(yōu)化技術(shù),它包括基因組合、交叉、變異和自然選擇等一系列過程,通過這些過程以達(dá)到優(yōu)化的目的,模擬基因聯(lián)合、突變、選擇等過程的一種優(yōu)化技術(shù)。

6.關(guān)聯(lián)規(guī)則挖掘算法:關(guān)聯(lián)規(guī)則是描述數(shù)據(jù)之間存在關(guān)系的規(guī)則,形式為“A1∧A2∧…∧An→B1∧B2∧…∧Bn”。一般分為兩個(gè)步驟:第一步,求出頻繁數(shù)據(jù)項(xiàng)集;第二步,用頻繁數(shù)據(jù)項(xiàng)集產(chǎn)生關(guān)聯(lián)規(guī)則。

7.最近鄰技術(shù):這種技術(shù)通過已辨別歷史記錄的組合來辨別新的記錄,它可以用來做聚類和偏差分析。每一種數(shù)據(jù)挖掘技術(shù)都有其自身的優(yōu)勢和不足,在進(jìn)行具體技術(shù)選擇的時(shí)候應(yīng)根據(jù)數(shù)據(jù)特點(diǎn)以及用戶需求進(jìn)行合理的選擇。

二、人工智能的發(fā)展情況

人工智能技術(shù)研究的主要方向是計(jì)算與知識(shí),其將會(huì)通過研究計(jì)算與知識(shí)之間的關(guān)系,從而生產(chǎn)與發(fā)明一些適應(yīng)人們生活的“科技物品”。那么我們就可以簡單將人工智能技術(shù)的基本實(shí)質(zhì)概括為以下這一觀點(diǎn):人工智能技術(shù)的實(shí)質(zhì)是通過智能系統(tǒng)與智能機(jī)器,將人類的一些基本功能進(jìn)行延伸、模擬、發(fā)展。人工智能技術(shù)是在多種學(xué)科理論的支持下所形成的新技術(shù)。我們可以將人工智能技術(shù)看作是信息化時(shí)代的必然產(chǎn)物,也可以將其看作是信息化社會(huì)的必然需求。例如,人工智能技術(shù)在互聯(lián)網(wǎng)、信息化教育、信息化高速公路等方面,都將會(huì)發(fā)揮很大的作用。

人工智能理念最早是由McCarthyJ等正式提出的,在隨后的幾年時(shí)間里,人工智能受到了廣泛關(guān)注,并且人工智能技術(shù)的快速發(fā)展,已經(jīng)取得了很多引人注目的成就。例如在1956年出現(xiàn)的跳棋程序,這一人工智能程序在隨后的六年時(shí)間里,戰(zhàn)勝了一個(gè)州的跳棋玩家。在1958年,美籍華人王浩在IBM2704計(jì)算機(jī)上用3~5分鐘,佐證了技術(shù)內(nèi)部有關(guān)命題演算所涉及的全部定理。1959年,人工智能模式識(shí)別程序誕生。1977年,F(xiàn)eigenbaumEA在國際人工智能聯(lián)合會(huì)議中,首次提出了“知識(shí)工程”概念,應(yīng)用知識(shí)為人工智能的研究與體系構(gòu)建起到了重要作用。1997年,IBM和公司所制作的“深藍(lán)”計(jì)算機(jī)人工智能系統(tǒng)戰(zhàn)勝了國際象棋大師卡斯帕羅夫等人。

就人工智能技術(shù)的發(fā)展來說,其早期涉及領(lǐng)域主要有專家系統(tǒng)、自動(dòng)定理系統(tǒng)、機(jī)器人學(xué)、博弈、人工神經(jīng)網(wǎng)絡(luò)等。而為了應(yīng)對日益復(fù)雜的社會(huì)環(huán)境,現(xiàn)階段的人工智能研究領(lǐng)域還涉及數(shù)據(jù)挖掘、職能決策等。其中數(shù)據(jù)挖掘?qū)τ谌斯ぶ悄芗夹g(shù)的發(fā)展來說,具有鮮明的現(xiàn)實(shí)意義。主要原因在于20世紀(jì)80年代初期,美國、歐洲、日本的人工智能技術(shù)研究都面臨著很大程度的數(shù)據(jù)問題,而這些問題一方面是交叉問題,另一方面則是擴(kuò)展問題。

三、數(shù)據(jù)挖掘與人工智能之間聯(lián)系以及技術(shù)展望

數(shù)據(jù)挖掘與人工智能技術(shù)有著密切聯(lián)系,甚至許多關(guān)鍵的技術(shù)都彼此一致,尤其在數(shù)據(jù)推理和數(shù)據(jù)搜索方面具有高度的一致,無論是傳統(tǒng)的與或非邏輯推理、歸納推理過程,還是模態(tài)、多值推理過程基本原理都是一致的,其推理的正確性對于數(shù)據(jù)挖掘有效性以及人工智能數(shù)據(jù)處理都有著重要的意義。而搜索應(yīng)用方面在數(shù)據(jù)挖掘過程中得到了充分的體現(xiàn),都是根據(jù)用戶需求不斷探尋可利用路徑,構(gòu)造花費(fèi)較少的推理計(jì)算過程,數(shù)據(jù)搜索的效率直接決定著數(shù)據(jù)挖掘的快慢。例如,在屬性約簡中,如果我們發(fā)現(xiàn)某一列屬性的取值完全一樣或區(qū)分能力不大,則可以提前刪去。另外,在挖掘關(guān)聯(lián)規(guī)則時(shí),如果發(fā)現(xiàn)頻繁K項(xiàng)集的任一(K21)項(xiàng)候選集不存在,則終止搜索剩余的(K21)項(xiàng)候選集,就可以判斷“頻繁K項(xiàng)集是不存在的”;等等。搜索機(jī)制提高了數(shù)據(jù)挖掘的效率,這對解決人工智能中的NP難問題是一個(gè)積極的探索。由此可見,數(shù)據(jù)挖掘技術(shù)與人工智能技術(shù)有著諸多的聯(lián)系,具體表現(xiàn)為技術(shù)的交叉性。

對于數(shù)據(jù)挖掘以及人工智能技術(shù)分析,可以看出其未來發(fā)展都朝著集成化、網(wǎng)絡(luò)化以及復(fù)雜化方向發(fā)展,集成化主要是指多種技術(shù)手段的不斷融合,跨學(xué)科、跨領(lǐng)域現(xiàn)象明顯,網(wǎng)絡(luò)化則是充分發(fā)揮網(wǎng)絡(luò)的關(guān)鍵作用,可以將終端設(shè)備處理能力無限拓展,形成強(qiáng)有力的管理控制能力,復(fù)雜度主要指各種技術(shù)解決難題不僅僅局限于計(jì)算機(jī)領(lǐng)域,在商業(yè)模式、工業(yè)控制、金融決策等都可能得到有效應(yīng)用。

結(jié)語

就人工智能技術(shù)本身來說,其發(fā)展還應(yīng)結(jié)合人們的生活實(shí)際,然后不斷提升現(xiàn)有的技術(shù)。數(shù)據(jù)挖掘技術(shù)作為大數(shù)據(jù)技術(shù)的一種,雖然其自身具有一定的局限性,但是仍然可以為當(dāng)下的人工智能發(fā)展提供必要的動(dòng)力。

參考文獻(xiàn)

[1]尹云飛,張師超,徐章艷.一種實(shí)用的軟件數(shù)據(jù)挖掘模型[J].計(jì)算機(jī)應(yīng)用.2016(06).

[2]尹云飛,鐘智.一種聚類挖掘軟件數(shù)據(jù)的方法[J].河南科技大學(xué)學(xué)報(bào)(自然科學(xué)版).2016(02).

[3]凌志泉.搜索引擎中的網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)[J].計(jì)算機(jī)工程與設(shè)計(jì).2016(09).

作者簡介:劉恒竹,女,(1996-),山東人, 本科學(xué)歷。

猜你喜歡
數(shù)據(jù)挖掘人工智能
我校新增“人工智能”本科專業(yè)
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業(yè)
數(shù)讀人工智能
小康(2017年16期)2017-06-07 09:00:59
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
下一幕,人工智能!
下一幕,人工智能!
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
平和县| 高阳县| 天等县| 富宁县| 丽水市| 石柱| 西宁市| 博爱县| 凌源市| 石棉县| 洪洞县| 淮安市| 丰都县| 宁蒗| 唐山市| 孝义市| 常山县| 汝城县| 千阳县| 遵义县| 盈江县| 新竹市| 金平| 清水县| 保定市| 敦煌市| 惠州市| 芜湖县| 顺平县| 凤冈县| 丰城市| 博乐市| 胶南市| 布尔津县| 吴川市| 延庆县| 罗甸县| 安西县| 景东| 车致| 万全县|