機(jī)器學(xué)習(xí)發(fā)展現(xiàn)狀及應(yīng)用的研究

2018-06-01 10:14:38劉崧淏

中國(guó)科技博覽 2018年24期

關(guān)鍵詞：強(qiáng)化學(xué)習(xí)機(jī)器學(xué)習(xí)無(wú)人駕駛

劉崧淏

[摘要]本文首先介紹了近幾年有關(guān)機(jī)器學(xué)習(xí)的一些熱門事件，例如大為火熱的AlphaGo以及2017年首次舉行的中國(guó)人工智能大會(huì)（CCAI）。接下來(lái)將文章分為3個(gè)部分來(lái)闡述機(jī)器學(xué)習(xí)：第一部分詳細(xì)介紹機(jī)器學(xué)習(xí)的發(fā)展歷程，包括萌芽-發(fā)展-繁榮三個(gè)階段；第二部分著重分析了機(jī)器學(xué)習(xí)的常見(jiàn)方法，有監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)以及強(qiáng)化學(xué)習(xí)；最后介紹了機(jī)器學(xué)習(xí)在各行各業(yè)中的一些具體應(yīng)用。

[關(guān)鍵詞]人工智能；機(jī)器學(xué)習(xí)；強(qiáng)化學(xué)習(xí)；無(wú)人駕駛

中圖分類號(hào)：S265 文獻(xiàn)標(biāo)識(shí)碼：A 文章編號(hào)：1009-914X（2018）24-0227-02

1.引言

2016年年初，AlphaGo以4：1戰(zhàn)勝了世界圍棋冠軍李世石，這一大事件瞬間引起了全球?qū)θ斯ぶ悄艿呐d趣。一時(shí)間，人們茶余飯后都在圍繞著人工智能這一領(lǐng)域展開。2017年07月22-23號(hào)在杭州舉行了中國(guó)國(guó)內(nèi)級(jí)別最高，規(guī)模最大的人工智能大會(huì)—中國(guó)人工智能大會(huì)（CCAI）。大會(huì)上匯聚了全球人工智能領(lǐng)域的頂級(jí)專家、學(xué)者和產(chǎn)業(yè)界優(yōu)秀人才，圍繞當(dāng)前人工智能熱點(diǎn)話題、核心技術(shù)以及廣泛關(guān)注的科學(xué)問(wèn)題進(jìn)行深入交流和探討，再一次將人工智能推向了熱潮。

人工智能的主要三大驅(qū)動(dòng)力：大數(shù)據(jù)，機(jī)器學(xué)習(xí)以及硬件GPU。本文主要從人工智能的算法——機(jī)器學(xué)習(xí)方面來(lái)展開論述。機(jī)器學(xué)習(xí)（MachineLearning）的本質(zhì)是基于互聯(lián)網(wǎng)的海量數(shù)據(jù)以及系統(tǒng)強(qiáng)大的并行運(yùn)算能力，讓機(jī)器自主模擬人類學(xué)習(xí)的過(guò)程，通過(guò)不斷“學(xué)習(xí)”數(shù)據(jù)來(lái)做出智能決策行為。

2.機(jī)器學(xué)習(xí)的發(fā)展歷程與相關(guān)要素

2.1 機(jī)器學(xué)習(xí)的發(fā)展歷程

機(jī)器學(xué)習(xí)屬于人工智能中一個(gè)較為年輕的分支，可以大致分為以下三個(gè)發(fā)展歷程：

第一階段：20世紀(jì)50年代中期—60年代中期，這一時(shí)期處于萌芽時(shí)期。人們?cè)噲D通過(guò)軟件編程來(lái)操控計(jì)算機(jī)完成一系列的邏輯推理功能，進(jìn)而使計(jì)算機(jī)具有一定程度上類似人類一樣的智能思考能力。然而這時(shí)期計(jì)算機(jī)所推理的結(jié)果遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到人們對(duì)機(jī)器學(xué)習(xí)的期望。通過(guò)進(jìn)一步研究發(fā)現(xiàn)，只具有邏輯推理能力并不能使得機(jī)器智能。研究者們認(rèn)為，使得機(jī)器擁有人工智能的前提還必須是擁有大量的先驗(yàn)知識(shí)[1]。

第二階段：20世紀(jì)60年代中期—80年代中期，這一時(shí)期處于發(fā)展時(shí)期。人們?cè)噲D利用自身思維提取出來(lái)的規(guī)則來(lái)教會(huì)計(jì)算機(jī)執(zhí)行決策行為，主流之力便是各式各樣的“專家系統(tǒng)”，然而這些系統(tǒng)總會(huì)面臨“知識(shí)稀疏”的問(wèn)題，即面對(duì)無(wú)窮無(wú)盡的知識(shí)與信息，人們無(wú)法總結(jié)出萬(wàn)無(wú)一失的規(guī)律。因此，讓機(jī)器自主學(xué)習(xí)的設(shè)想自然地浮出水面。基于20世紀(jì)50年代對(duì)于神經(jīng)網(wǎng)絡(luò)的研究，人們開始研究如何讓機(jī)器自主學(xué)習(xí)。

第三階段：20世紀(jì)80年代—至今，機(jī)器學(xué)習(xí)達(dá)到了一個(gè)繁榮時(shí)期。由于這一時(shí)期互聯(lián)網(wǎng)大數(shù)據(jù)以及硬件GPU的出現(xiàn)，使得機(jī)器學(xué)習(xí)脫離了瓶頸期。機(jī)器學(xué)習(xí)開始爆炸式發(fā)展，開始成為了一門獨(dú)立熱門學(xué)科并且被應(yīng)用到各個(gè)領(lǐng)域。各種機(jī)器學(xué)習(xí)算法不斷涌現(xiàn)，而利用深層次神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)也得到進(jìn)一步發(fā)展。同時(shí)，機(jī)器學(xué)習(xí)的蓬勃發(fā)展還促進(jìn)了其他分支的出現(xiàn)，例如模式識(shí)別，數(shù)據(jù)挖掘，生物信息學(xué)和自動(dòng)駕駛等等。

2.2 機(jī)器學(xué)習(xí)的常見(jiàn)方法

機(jī)器學(xué)習(xí)發(fā)展至今，常用的主要有以下三大類：監(jiān)督學(xué)習(xí)，無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)（圖1）。

2.2.1 監(jiān)督學(xué)習(xí)

監(jiān)督學(xué)習(xí)表示機(jī)器學(xué)習(xí)的數(shù)據(jù)是帶標(biāo)記的，這些標(biāo)記可以包括數(shù)據(jù)類別，數(shù)據(jù)屬性以及特征點(diǎn)位置等等。這些標(biāo)記作為預(yù)期效果，不斷來(lái)修正機(jī)器的預(yù)測(cè)結(jié)果。具體首先過(guò)程是：通過(guò)大量帶有標(biāo)記的數(shù)據(jù)來(lái)訓(xùn)練機(jī)器，機(jī)器將預(yù)測(cè)結(jié)果與期望結(jié)果進(jìn)行比對(duì)；之后根據(jù)比對(duì)結(jié)果來(lái)修改模型中的參數(shù)，再一次輸出預(yù)測(cè)結(jié)果；再將預(yù)測(cè)結(jié)果與期望結(jié)果進(jìn)行比對(duì)……重復(fù)多次直至收斂，最終生成具有一定魯棒性的模型來(lái)達(dá)到智能決策的能力。

常見(jiàn)的監(jiān)督學(xué)習(xí)有分類，回歸。分類（classification）是將一些實(shí)例數(shù)據(jù)分到合適的類別中，它的預(yù)測(cè)結(jié)果是離散的?；貧w（regression）是將數(shù)據(jù)歸到一條“線”上，即為離散數(shù)據(jù)生產(chǎn)擬合曲線，因此其預(yù)測(cè)結(jié)果是連續(xù)的。

2.2.2 無(wú)監(jiān)督學(xué)習(xí)

無(wú)監(jiān)督學(xué)習(xí)表示機(jī)器學(xué)習(xí)的數(shù)據(jù)是沒(méi)有標(biāo)記的。機(jī)器從無(wú)標(biāo)記的數(shù)據(jù)中探索并推斷出潛在的聯(lián)系。常見(jiàn)的無(wú)監(jiān)督學(xué)習(xí)有聚類，降維。

在聚類（clustering）工作中，由于事先不知道數(shù)據(jù)類別，因此只能通過(guò)分析數(shù)據(jù)樣本在特征空間中的分布，例如基于密度或是基于統(tǒng)計(jì)學(xué)概率模型等等，從而將不同數(shù)據(jù)分開，把相似數(shù)據(jù)聚為一類。

降維（dimensionality reduction）是將數(shù)據(jù)的維度降低。例如描述一個(gè)西瓜，若只考慮外皮色澤，根蒂，敲聲，紋理，密度以及含糖率這6個(gè)屬性，這6個(gè)屬性代表了西瓜數(shù)據(jù)的維度為6。進(jìn)一步考慮降維的工作，由于數(shù)據(jù)本身具有龐大的數(shù)量和各種屬性特征，若對(duì)全部數(shù)據(jù)信息進(jìn)行分析，將會(huì)增加訓(xùn)練的負(fù)擔(dān)和存儲(chǔ)空間。因此可以通過(guò)主成分分析等其他方法，考慮主要影響因素，舍棄次要因素，來(lái)平衡準(zhǔn)確度與效率。

2.2.3 強(qiáng)化學(xué)習(xí)

強(qiáng)化學(xué)習(xí)是帶激勵(lì)的，具體來(lái)說(shuō)就是，如果機(jī)器行動(dòng)正確，將施與一定的“正激勵(lì)”；如果行動(dòng)錯(cuò)誤，也同樣會(huì)給出一個(gè)懲罰（也可稱為“負(fù)激勵(lì)”）。因此在這種情況下，機(jī)器將會(huì)考慮如何在一個(gè)環(huán)境中行動(dòng)才能達(dá)到激勵(lì)的最大化，具有一定的動(dòng)態(tài)規(guī)劃思想[2]。例如在貪吃蛇游戲中，貪吃蛇需要不斷吃到“食物”來(lái)加分。為了不斷提高分?jǐn)?shù)，貪吃蛇需要考慮在自身位置上如何轉(zhuǎn)向才能吃到“食物”，這種學(xué)習(xí)過(guò)程便可理解為是一種強(qiáng)化學(xué)習(xí)。

強(qiáng)化學(xué)習(xí)最為火熱的一個(gè)應(yīng)用便是谷歌AlphaGo的升級(jí)品—AlphaGo Zero。相較于AlphaGo，AlphaGo Zero舍棄了先驗(yàn)知識(shí)。不再需要人為設(shè)計(jì)特征，直接將棋盤上黑白棋子的擺放情況作為原始數(shù)據(jù)輸入到模型中，機(jī)器使用強(qiáng)化學(xué)習(xí)來(lái)自我博弈，不斷提升自己最終出色完成下棋。AlphaGo Zero的成功證明了在沒(méi)有人類的經(jīng)驗(yàn)和指導(dǎo)下，深度強(qiáng)化學(xué)習(xí)依然能夠出色完成指定任務(wù)。

3.機(jī)器學(xué)習(xí)的應(yīng)用

由于近20年科技的迅速發(fā)展，機(jī)器學(xué)習(xí)已經(jīng)成為了一門活躍并且充滿生命力的學(xué)科。機(jī)器學(xué)習(xí)具備了一定的解決實(shí)際生活問(wèn)題的能力，通過(guò)把機(jī)器學(xué)習(xí)當(dāng)作是一種基礎(chǔ)與服務(wù)技術(shù)，和不同領(lǐng)域進(jìn)行結(jié)合碰撞出火花[3]。而在各行各業(yè)里都少不了機(jī)器學(xué)習(xí)的應(yīng)用。

（1）醫(yī)療行業(yè)

機(jī)器學(xué)習(xí)算法被應(yīng)用到提供醫(yī)療輔助、癌癥檢測(cè)和新藥物研制等。廣泛推進(jìn)醫(yī)療智能化，對(duì)全球醫(yī)療事業(yè)的發(fā)展有著非常重要的意義[4]。其中最為著名的也是當(dāng)屬IBM的智能機(jī)器人沃森。IBM技術(shù)團(tuán)隊(duì)首先將龐大的數(shù)據(jù)信息輸入到沃森中，這個(gè)龐大的數(shù)據(jù)庫(kù)包括了醫(yī)療論文與報(bào)道，臨床指南，藥物使用報(bào)告以及上千上萬(wàn)本患者病歷等。之后利用AI算法進(jìn)行分析處理，從而為醫(yī)生提供醫(yī)療輔助，更高效精準(zhǔn)地進(jìn)行醫(yī)療診斷。

（2）傳媒行業(yè)

通過(guò)內(nèi)容傳播機(jī)器人以及品牌傳播機(jī)器人，一鍵生成用戶想要的內(nèi)容，一分鐘內(nèi)可出一萬(wàn)篇文章，并且進(jìn)行有效的傳播。基于機(jī)器學(xué)習(xí)搭建的智能媒體平臺(tái)，可以通過(guò)研究媒體的投遞和發(fā)送規(guī)則，結(jié)合當(dāng)前熱點(diǎn)事件、輿論和公關(guān)營(yíng)銷內(nèi)容，自動(dòng)生成用戶想要閱讀的內(nèi)容。并且可以智能地對(duì)接主流媒體平臺(tái)，自動(dòng)同步發(fā)送，實(shí)現(xiàn)了高效傳播。

（3）汽車行業(yè)

汽車行業(yè)，以自動(dòng)駕駛為例，谷歌（如圖2）、百度、特斯拉等傳統(tǒng)巨頭紛紛加入其中。自動(dòng)駕駛是汽車行業(yè)與人工智能、物聯(lián)網(wǎng)等新一代信息技術(shù)深度融合的產(chǎn)物，是當(dāng)前全球交通出行智能化和網(wǎng)聯(lián)化的重要方向。自動(dòng)駕駛利用傳感器和激光雷達(dá)等感知器采集路況和行人信息，結(jié)合先進(jìn)機(jī)器學(xué)習(xí)算法，不斷優(yōu)化并最終規(guī)劃出最優(yōu)路線以及操控方案。

4.總結(jié)

機(jī)器學(xué)習(xí)作為最近三十年新興起的科研學(xué)科之一，已經(jīng)在現(xiàn)代信息生活各個(gè)領(lǐng)域上都有了較為廣泛的應(yīng)用。并且發(fā)展至今，機(jī)器學(xué)習(xí)已經(jīng)衍生出了眾多分支，如數(shù)據(jù)挖掘、深度學(xué)習(xí)、模式識(shí)別、機(jī)器人的智能控制、遙感信息安全等。因此，機(jī)器學(xué)習(xí)與各行各業(yè)的結(jié)合，必將引起一番改革大浪潮。

參考文獻(xiàn)

[1] 吳康寧.基于人工智能下的機(jī)器學(xué)習(xí)歷史及展望研究[J].科技尚品.2017（6）：187.

[2] 高陽(yáng)，陳世福，陸鑫.強(qiáng)化學(xué)習(xí)研究綜述[J].自動(dòng)化學(xué)報(bào).2004，30（1）：86-100.

[3] 陳春霞.淺析機(jī)器學(xué)習(xí)的發(fā)展與應(yīng)用[J].信息系統(tǒng)工程.2017（8）：99-100.

[4] 孔祥溢與王任直，人工智能及在醫(yī)療領(lǐng)域的應(yīng)用.醫(yī)學(xué)信息學(xué)雜志，2016.37（11）：第1-5頁(yè).

[5] 劉忠寶.機(jī)器學(xué)習(xí)方法在個(gè)性化推薦系統(tǒng)中的應(yīng)用[J].情報(bào)探索.2016（4）：80-82.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

機(jī)器學(xué)習(xí)發(fā)展現(xiàn)狀及應(yīng)用的研究