国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

機(jī)器學(xué)習(xí)的發(fā)展史及應(yīng)用前景

2018-11-15 23:48:40詹騏源
科技傳播 2018年21期
關(guān)鍵詞:發(fā)展史機(jī)器學(xué)習(xí)應(yīng)用

詹騏源

摘 要 隨著“人工智能”技術(shù)的發(fā)展,人們開始越來越多地研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,來獲取知識或技能。機(jī)器學(xué)習(xí)作為實(shí)現(xiàn)“人工智能”的一種方法,文章對其從淺層學(xué)習(xí)到深度學(xué)習(xí)的發(fā)展歷程進(jìn)行了總結(jié)與梳理,簡要分析了三類機(jī)器學(xué)習(xí)模式和決策樹算法、K最近鄰算法、樸素貝葉斯算法等機(jī)器學(xué)習(xí)的算法理論與應(yīng)用,并提出了展望。

關(guān)鍵詞 機(jī)器學(xué)習(xí);發(fā)展史;應(yīng)用

中圖分類號 TP2 文獻(xiàn)標(biāo)識碼 A 文章編號 1674-6708(2018)222-0138-02

自阿爾法狗擊敗世界圍棋冠軍柯杰后,“人工智能”一詞在社會(huì)和生活中的熱度不斷升高。隨著人工智能概念的普及,人們不止一次聽說過“機(jī)器學(xué)習(xí)”這個(gè)詞,而實(shí)際上,“機(jī)器學(xué)習(xí)”和人工智能仍有本質(zhì)差別[ 1 ]。從嚴(yán)格意義上講,阿爾法狗的誕生更多是歸功于機(jī)器學(xué)習(xí)這一領(lǐng)域。

那么,機(jī)器學(xué)習(xí)究竟是指什么呢?它在生活中被應(yīng)用的實(shí)例又有哪些呢?其實(shí),“機(jī)器學(xué)習(xí)”是一種方法,不同于人工智能,它的目標(biāo)并不是讓機(jī)器獲得和人類一樣的思考能力,而是使計(jì)算機(jī)擁有在沒有被明確編程情況下學(xué)習(xí)的能力[2]。通俗地講也就是通過算法使得機(jī)器從大量數(shù)據(jù)中學(xué)習(xí)規(guī)律,從而擁有對新樣本分析和研究的能力。而我們?nèi)粘I钪薪佑|的Siri、面部識別等功能都是機(jī)器學(xué)習(xí)進(jìn)步的結(jié)果。

1 機(jī)器學(xué)習(xí)的發(fā)展史

“機(jī)器學(xué)習(xí)”的發(fā)展并不是一帆風(fēng)順的,它的起源可以追溯到1949年赫布理論的誕生[ 3 ]。它在20世紀(jì)70年代曾陷入了瓶頸期,而后大數(shù)據(jù)時(shí)代開始,機(jī)器學(xué)習(xí)也在大數(shù)據(jù)的支持下復(fù)興。因此我們可以大致將它的理念和運(yùn)作模式從大數(shù)據(jù)時(shí)代前后分為淺層學(xué)習(xí)和深度學(xué)習(xí)。

1)小數(shù)據(jù)時(shí)代(淺層學(xué)習(xí))。1949年,Donald Hebb 提出的赫布理論[4]解釋了學(xué)習(xí)過程中大腦神經(jīng)元所發(fā)生的變化。赫布理論的誕生標(biāo)志著機(jī)器學(xué)習(xí)領(lǐng)域邁出了第一步。1952年被譽(yù)為“機(jī)器學(xué)習(xí)之父”的Arthur Samuel設(shè)計(jì)了一款西洋跳棋程序。這個(gè)程序幫助機(jī)器觀察棋子的走位并構(gòu)建新的模型以提高自己的下棋技巧。同時(shí),IBM首次定義并解釋了“機(jī)器學(xué)習(xí)”,將其非正式定義為“在不直接針對問題進(jìn)行編程的情況下,賦予計(jì)算機(jī)學(xué)習(xí)能力的一個(gè)研究領(lǐng)域”。1957年Rosenblatt發(fā)明了感知器模型[5],這種模型被認(rèn)為是機(jī)器學(xué)習(xí)人工神經(jīng)網(wǎng)絡(luò)中較為典型的算法。而3年后Widrow提出了 Delta學(xué)習(xí)規(guī)則,也就是差量學(xué)習(xí)規(guī)則,即如今的最小二乘問題。這種學(xué)習(xí)規(guī)則隨即被應(yīng)用到了感知器模型中,創(chuàng)建出了更精確的線性分類器。隨后“機(jī)器學(xué)習(xí)”的發(fā)展出現(xiàn)了瓶頸。在1969年,Minsky提出了異域問題,指出了感知器的本質(zhì)缺陷——面對線性不可分問題時(shí)的無力,即當(dāng)空間內(nèi)的點(diǎn)無法被直線分類時(shí),感知器便會(huì)束手無措。盡管1970年Linnainmaa首次提出了著名的BP算法以解決此問題,可當(dāng)時(shí)并沒有引起重視。直到80年代末此算法才開始被接納使用,并給機(jī)器學(xué)習(xí)帶來了希望。人們發(fā)現(xiàn),BP算法可以幫助機(jī)器通過大量數(shù)據(jù)統(tǒng)計(jì)整理規(guī)律從而對未知的事件作出推測。這時(shí)候的感知機(jī)只是種含有一層隱層節(jié)點(diǎn)的淺層模型,這個(gè)時(shí)代的機(jī)器學(xué)習(xí)也因而得名——淺層學(xué)習(xí)。到了90年代,淺層學(xué)習(xí)進(jìn)入了黃金時(shí)代,各種各樣的淺層學(xué)習(xí)模型被相繼提出,這些模型大多數(shù)在實(shí)際運(yùn)用中都取得了巨大的成功。

2)大數(shù)據(jù)時(shí)代(深度學(xué)習(xí))。隨著人類對數(shù)據(jù)信息的收集和應(yīng)用逐漸嫻熟,對數(shù)據(jù)的掌控力逐漸提升,“機(jī)器學(xué)習(xí)”在海量數(shù)據(jù)的支持下攀上了新的高峰,即深度學(xué)習(xí)。深度學(xué)習(xí)的實(shí)質(zhì)便是通過海量的數(shù)據(jù)進(jìn)行更有效的訓(xùn)練從而獲得更精確的分類或預(yù)測。深度學(xué)習(xí)的理念在2006年由Geoffrey Hinton和他的學(xué)生提出,并在當(dāng)時(shí)引起了轟動(dòng),在學(xué)術(shù)界和工業(yè)界掀起了深度學(xué)習(xí)的浪潮。

2 機(jī)器學(xué)習(xí)的分類

如今,機(jī)器學(xué)習(xí)被廣泛分為3個(gè)大類,有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)以及半監(jiān)督學(xué)習(xí)。這些學(xué)習(xí)模式各具特點(diǎn),因而被用于處理和應(yīng)對不同的問題和場景。

1)有監(jiān)督學(xué)習(xí)。有監(jiān)督學(xué)習(xí)為每組數(shù)據(jù)編寫特定的標(biāo)識,讓機(jī)器在已知規(guī)則的約束下對數(shù)據(jù)進(jìn)行分類。而計(jì)算機(jī)會(huì)根據(jù)分類的準(zhǔn)確性不斷自我優(yōu)化,直到預(yù)測的準(zhǔn)確性達(dá)到自身的預(yù)期。

2)無監(jiān)督學(xué)習(xí)。有監(jiān)督學(xué)習(xí)是指機(jī)器在已有的規(guī)則下進(jìn)行學(xué)習(xí),無監(jiān)督學(xué)習(xí)則是指在沒有任何標(biāo)識的情況下進(jìn)行分類。對于未分類的事物,機(jī)器會(huì)根據(jù)自己的判斷將物品根據(jù)一定的特征歸類。如果把機(jī)器人當(dāng)做一個(gè)孩子,有監(jiān)督學(xué)習(xí)是讓他在已知規(guī)則下對物品進(jìn)行分類得出較為精確的結(jié)果;而無監(jiān)督學(xué)習(xí)則是放手讓這個(gè)孩子根據(jù)自己的喜好用自己希望的方式對物品進(jìn)行分類,從而推斷出數(shù)據(jù)的內(nèi)部結(jié)構(gòu)。當(dāng)我們面對沒有標(biāo)簽的數(shù)據(jù)時(shí),我們也可以先應(yīng)用無監(jiān)督學(xué)習(xí)讓機(jī)器對物品的內(nèi)在結(jié)構(gòu)進(jìn)行估測,再在已有估計(jì)的基礎(chǔ)上為數(shù)據(jù)添加標(biāo)簽從而應(yīng)用有監(jiān)督學(xué)習(xí)得出較為精確的分類結(jié)果。

3)半監(jiān)督學(xué)習(xí)。有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)分別對應(yīng)了兩種特定的數(shù)據(jù)。那么,當(dāng)我們同時(shí)面對標(biāo)簽和未標(biāo)簽的數(shù)據(jù)時(shí),我們該如何處理呢?近期專家提出了一種新的學(xué)習(xí)模式,那就是半監(jiān)督學(xué)習(xí)。半監(jiān)督學(xué)習(xí)在面對兩類數(shù)據(jù)時(shí)同時(shí)具有有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的優(yōu)勢。它可以對已標(biāo)簽數(shù)據(jù)精確分析并估算預(yù)測未標(biāo)簽數(shù)據(jù),從而處理多類數(shù)據(jù)共存的問題。

3 機(jī)器學(xué)習(xí)的算法

我們已經(jīng)了解了機(jī)器學(xué)習(xí)的大分類,在有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)的分類標(biāo)準(zhǔn)下,每個(gè)分類都會(huì)對應(yīng)一些算法。當(dāng)然,并不一定是一一對應(yīng)。算法是一種工具,它幫助我們在輸入數(shù)據(jù)后預(yù)測出結(jié)果。下文將會(huì)介紹幾個(gè)常用的算法。

1)決策樹算法。決策樹算法是機(jī)器學(xué)習(xí)中較為簡單也較為典型的算法。首先我們需要明確,算法的作用是幫助我們預(yù)測數(shù)據(jù)對應(yīng)的結(jié)果,算法所應(yīng)用的對象是包含許多數(shù)據(jù)的個(gè)體。而面對不同的問題,我們?nèi)孕枰?xùn)練算法這一過程。決策樹算法是通過已經(jīng)提取的特征對數(shù)據(jù)進(jìn)行分類的,它先將已經(jīng)提取的信息進(jìn)行信息熵的計(jì)算以確定其包含信息量的多少。這一過程我們通常使用ID3算法或C4.5算法。在CART決策樹中我們用基尼指數(shù)來劃分屬性。之后通常狀況下會(huì)按照從包含數(shù)據(jù)多到包含數(shù)據(jù)少進(jìn)行排列。然后開始以此順序?qū)€(gè)體進(jìn)行分類。當(dāng)整個(gè)分類完成后,決策樹模型的構(gòu)建也就完成了。此時(shí)若我們要預(yù)測一個(gè)新個(gè)體的數(shù)據(jù),只需要把他的信息輸入決策樹,就可以對應(yīng)出預(yù)測的結(jié)果。

2)K最近鄰算法。相比于決策樹算法,K最近鄰算法會(huì)更容易理解。在訓(xùn)練K近鄰算法的過程中,我們首先把提取的數(shù)據(jù)向量化,讓它們在空間中排列成點(diǎn)集。K取值正整數(shù),含義為和某點(diǎn)距離最近的K個(gè)點(diǎn),通過對點(diǎn)的分類來實(shí)現(xiàn)對數(shù)據(jù)的分類。它主要用于討論數(shù)據(jù)的相關(guān)性。在使用這種算法時(shí),我們可能會(huì)用到歐式幾何或者非歐幾何中不同的距離度量來討論空間中點(diǎn)與點(diǎn)之間的距離。如我們生活中最常見的歐氏距離或是把平面看做棋盤用步數(shù)描述距離的切比雪夫距離。

3)樸素貝葉斯算法。當(dāng)我首次看到這個(gè)算法時(shí),我便聯(lián)想到了曾學(xué)習(xí)過的條件概率。在樸素貝葉斯算法中,給定目標(biāo)值的屬性都被假設(shè)為相互獨(dú)立的條件概率。和決策樹模型不同,樸素貝葉斯分類器更簡單,也更依賴它的數(shù)學(xué)基礎(chǔ),以及穩(wěn)定的分類效率。同時(shí)它的參數(shù)很少,因而對缺失的數(shù)據(jù)不敏感。同時(shí),由于該算法模型建立在假設(shè)所有數(shù)據(jù)都相互獨(dú)立的基礎(chǔ)上,而現(xiàn)實(shí)中數(shù)據(jù)與數(shù)據(jù)之間難免存在聯(lián)系,所以這個(gè)算法在實(shí)際生活中的運(yùn)用往往是不精確的。

4 機(jī)器學(xué)習(xí)在生活中的應(yīng)用

機(jī)器學(xué)習(xí)中各式各樣的算法和它們所針對的諸多方面注定了機(jī)器學(xué)習(xí)在生活中的不同方面會(huì)被廣泛應(yīng)用。例如當(dāng)我們要預(yù)測某個(gè)產(chǎn)品的受眾面時(shí),我們就可以使用決策樹算法。我們首先選擇一定數(shù)量的個(gè)體,提取他們的信息,按照訓(xùn)練決策樹模型的流程進(jìn)行操作。這樣構(gòu)建好的決策樹模型就可以在我們給予新個(gè)體時(shí)按照新個(gè)體的信息預(yù)測出他是否為該產(chǎn)品的受眾人群。

同時(shí),機(jī)器學(xué)習(xí)還可以被用于風(fēng)險(xiǎn)評估、滿意度預(yù)測、垃圾信息的過濾乃至人臉識別等方面。

5 結(jié)論

人類的學(xué)習(xí)能力無疑是勝過機(jī)器的,但對于人腦來說,反復(fù)地處理數(shù)據(jù)是枯燥乏味的,同時(shí)人類也難以進(jìn)行龐大信息的分析處理。這便是機(jī)器學(xué)習(xí)的優(yōu)勢和作用,“不會(huì)厭倦,不知疲憊”。

曾經(jīng)業(yè)界有一種說法,描述機(jī)器學(xué)習(xí)可以動(dòng)搖人類的“自由意志”,因?yàn)榇髷?shù)據(jù)時(shí)代龐大的信息量可以支持機(jī)器做到非常精確的分析。當(dāng)學(xué)習(xí)模型構(gòu)建得足夠精準(zhǔn)時(shí),機(jī)器就可以預(yù)測任何個(gè)體的行為。機(jī)器的預(yù)測決定了人的行為,自由意志便不復(fù)存在了。這當(dāng)然是對機(jī)器學(xué)習(xí)“威力”較為夸張的展望。但筆者認(rèn)為機(jī)器學(xué)習(xí)縱然達(dá)不到預(yù)知未來,也將在未來對人類的生活產(chǎn)生巨大的影響。

未來的某一天,機(jī)器學(xué)習(xí)可以幫助人類進(jìn)行預(yù)知地震、海嘯等,預(yù)知現(xiàn)在難以避免的風(fēng)險(xiǎn)。機(jī)器學(xué)習(xí)也會(huì)在人類的逐步研究中成為人類的左膀右臂,幫助我們繼續(xù)進(jìn)步,渡過難關(guān)。

參考文獻(xiàn)

[1]曹栩森.機(jī)器學(xué)習(xí)的發(fā)展與應(yīng)用[J].消費(fèi)導(dǎo)刊,2017(28).

[2]李凡長.機(jī)器學(xué)習(xí)理論及應(yīng)用[M].北京:中國科學(xué)技術(shù)大學(xué)出版社,2009.

[3]余殷博.基于人工智能下的機(jī)器學(xué)習(xí)歷史及展望[J].電子技術(shù)與軟件工程,2017(4):129.

[4]甄盼好.淺談機(jī)器學(xué)習(xí)方法[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2014(1):176-177.

[5]王永慶,劉華.機(jī)器學(xué)習(xí)方法進(jìn)展研究[J].無線互聯(lián)科技,2013(7):138.

猜你喜歡
發(fā)展史機(jī)器學(xué)習(xí)應(yīng)用
我國農(nóng)業(yè)機(jī)械的發(fā)展歷史及未來方向
基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
淺談我國會(huì)計(jì)發(fā)展史
人間(2016年24期)2016-11-23 19:16:50
前綴字母為特征在維吾爾語文本情感分類中的研究
淺談低音提琴在演奏中的技巧問題
新型智能手機(jī)保護(hù)殼設(shè)計(jì)
科技視界(2016年21期)2016-10-17 20:17:04
基于支持向量機(jī)的金融數(shù)據(jù)分析研究
GM(1,1)白化微分優(yōu)化方程預(yù)測模型建模過程應(yīng)用分析
科技視界(2016年20期)2016-09-29 12:03:12
煤礦井下坑道鉆機(jī)人機(jī)工程學(xué)應(yīng)用分析
科技視界(2016年20期)2016-09-29 11:47:01
武乡县| 怀柔区| 天长市| 蒙山县| 中江县| 分宜县| 社会| 英德市| 顺义区| 巴东县| 金昌市| 龙游县| 吉隆县| 南皮县| 康平县| 普格县| 吴忠市| 依安县| 南汇区| 锡林郭勒盟| 合江县| 仁布县| 嵩明县| 通江县| 红河县| 万山特区| 宜宾市| 汪清县| 探索| 清丰县| 道真| 泌阳县| 朝阳县| 普定县| 永嘉县| 桂平市| 托里县| 邵武市| 怀远县| 永康市| 白城市|