国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

生成式對抗網絡GAN的研究現狀與應用

2019-07-29 00:41于夢珂
無線互聯科技 2019年9期
關鍵詞:深度學習神經網絡人工智能

于夢珂

摘? ?要:21世紀以來,在大數據、云計算和物聯網等新興技術不斷成熟的大背景下,人工智能得到了第3次井噴式發(fā)展。其中,以深度學習為基礎的圖像處理、語音識別等技術的發(fā)展尤為迅猛。而生成式對抗網絡是如今深度學習領域中最為前沿也是最令人著迷的領域之一,它自2014年10月被Ian Goodfellow等提出以后,就一直受到人們的廣泛關注與追捧。文章從生成式對抗網絡的基本原理出發(fā),分析了生成式對抗網絡的研究現狀及其主要的應用領域,并對生成式對抗網絡進行了總結與展望。

關鍵詞:生成式對抗網絡;深度學習;神經網絡;人工智能

自1956年McCarthy提出“人工智能”一詞以來,人工智能的發(fā)展幾經波折。而最近幾年,得益于數據量指數級的增長以及計算機運算力的大幅度提升,人工智能的發(fā)展又一次達到了巔峰階段。雖然人工智能最近幾年得到了快速發(fā)展,但人們仍然普遍認為,機器離真正的智能還有很大的距離,機器永遠不可能替代人類。而自從Ian Goodfellow在2014年10月提出了生成式對抗網絡(Generative adversarial networks,GAN)之后,人們的思想就發(fā)生了很大的變化。生成式對抗網絡GAN主要采用無監(jiān)督的學習方式,自動從源數據中進行學習,在不需要人工對數據集進行標注的情況下就可以產生令人驚嘆的效果,從而使機器真正實現了所謂的“智能”。

首先,本文介紹生成式對抗網絡GAN的原理;其次,介紹生成式對抗網絡的一系列衍生模型,主要包括條件生成對抗網絡CGAN以及基于Wasserstein距離的生成對抗網絡WGAN;再次,介紹生成式對抗網絡GAN以及其衍生模型的應用。最后,對生成式對抗網絡進行了總結與展望。

1? ? 生成式對抗網絡原理

生成式對抗網絡GAN的根本思想來源于博弈論中的二人零和博弈,其結構包含一個生成器和一個判別器,通過生成器和判別器的相互對抗實現學習。生成器會盡自己最大的努力去生成和源數據分布相同的數據,使得判別器無法區(qū)分哪些數據是真實的,哪些數據是生成器生成的。而判別器,會盡可能地準確判斷輸入的數據中哪些是真實的數據,哪些是生成器生成的數據。為了在這樣的二人零和博弈中勝出,生成器會努力提高自己的生成能力,判別器則努力提高自己的判別能力,最終目標就是達到生成器和判別器之間的納什均衡。生成式對抗網絡GAN模型的目標函數如公式(1)所示。

(1)

在公式(1)中,pdata表示真實數據的分布情況,pz表示由生成器生成的數據的分布情況。當訓練生成器時,我們希望損失函數V(D,G)越小越好,當訓練判別器時,我們希望損失函數V(D,G)越大越好。所以,從根源上來講,生成式對抗網絡就是一個極大、極小問題。

生成式對抗網絡的網絡結構如圖1所示。隨機生成的符合某一分布的噪聲數據z輸入到生成器G中,由生成器生成和真實數據分布一致的數據。然后,把真實的數據x和生成器生成的數據G(z)一并輸入到判別器D中,隨后,判別器D會盡自己最大的努力判斷輸入的數據到底是真實的數據,還是生成器生成的數據。最后,根據判別的結果來相應地調整生成器和判別器,直到判別器無法正確判斷輸入的數據是真實的數據還是生成器生成的數據,模型訓練成功,生成器和判別器此時達到納什均衡。

2? ? 生成式對抗網絡的衍生模型

隨著人們對生成式對抗網絡的研究進入白熱化時期,原始GAN的一些問題也越來越受到關注,比如模型崩塌、模型過于自由不可控、模型不收斂等。為了解決這些問題,人們提出了GAN的許多衍生模型。截至目前,GAN的衍生模型已經達到幾百種,并且衍生模型的數量仍以很快的速度在不斷增長。在此,列舉一些常見的GAN衍生模型。

2.1? CGAN

首先,在原始的GAN模型中,生成器的輸入是符合某種分布的隨機噪聲數據,模型的輸出是和真實數據分布一致的隨機數據,這兩個過程都是隨機的,生成的過程太過自由,沒有辦法控制數據的生成過程,這樣就不容易得到想要的結果。其次,雖然監(jiān)督的神經網絡在很多領域取得了成功,但是如果預測輸出的類別太多,這些模型還是會存在一些問題。最后,截至目前,大部分工作都集中在學習從輸入到輸出的一對一映射,但現實中有很多問題是一對多的映射。比如在對圖像進行標記的時候,一張圖片可以有不同的標簽,比如一種圖片同時有白色的、貓、有尾巴這樣不同的標簽。那這個就是一對多的映射關系。原始的GAN模型無法解決一對多映射的問題。

基于以上原始GAN模型存在的問題,Mirza[1]在2014年提出了條件生成對抗網絡CGAN。在CGAN模型中,作者給生成器和判別器都加了限制條件,這個限制條件可以是標簽,也可以是不同模態(tài)的數據,然后通過給模型輸入數據和標簽來構建條件生成對抗網絡,這樣就能夠使CGAN模型快速地達到收斂條件。

2.2? WGAN

在原始的GAN模型中,首先,需要最小化生成數據的分布與真實數據的分布之間的JS散度。但JS距離很多情況下都是常數,梯度下降時,會產生梯度消失。其次,生成樣本缺乏多樣性。在原始GAN的最優(yōu)判別器下,會導致出現梯度不穩(wěn)定現象,而KL散度具有不對稱性,會出現模式崩塌現象。

基于以上原始的GAN存在的問題,Arjovsky[2]提出了原始GAN的改進版本WGAN,把Wasserstein距離引入到了生成式對抗網絡模型中。在WGAN模型中,作者把原始GAN中的散度用Wasserstein距離來代替,把Wasserstein距離作為優(yōu)化目標,從根本上解決了原始生成式對抗網絡中經常會出現的梯度消失問題。

3? ? 生成式對抗網絡的應用

生成式對抗網絡最根本的應用就是生成和原始數據分布一致的數據?;谶@一本質,近年來,生成式對抗網絡在很多領域都取得了良好的應用,尤其是在圖像、語音和語言等領域,都達到了很高的準確度。

3.1? 圖像

生成式對抗網絡應用最廣泛的領域就是圖像領域。圖像領域一經應用,就因其強大的生成能力得到了人們的廣泛關注。首先,生成式對抗網絡可以由低分辨率圖像生成高分辨率圖像。Wu等[3]提出的SRPGAN模型,對原始的低分辨率圖像進行縮放之后,由生成器進行編碼和解碼,最終生成高分辨率圖像[4]。其次,生成式對抗網絡還可以用在機器學習中經常見到的圖像分類任務中。原始的GAN是無監(jiān)督模型,對其判別器進行改進,即可用于分類任務,Improved GANs是典型的用GAN來做圖像分類的例子。最后,生成式對抗網絡可以用于圖像風格的轉換。利用CycleGAN不需要其他額外的信息就可以將一張圖像從源領域映射到目標領域,可以把馬變成斑馬等。

3.2? 語音和語言

原始的GAN模型主要用在處理連續(xù)的數據中,而在離散數據上的應用效果并不好。隨著研究的深入,人們提出了許多改進的生成式對抗網絡模型,使其在處理離散型數據問題時也能得到較好的結果。比較著名的就是SeqGAN模型[5],SeqGAN模型中的生成器采用遞歸神經網絡RNN的改進模型LSTM,在文本生成中取得了較好的效果,該模型在其他的離散型數據生成中同樣表現良好。

3.3? 其他

生成式對抗網絡與其他常用的機器學習算法相結合,可以得到意想不到的結果。在SeqGAN模型中,利用強化學習與生成式對抗網絡相結合,解決了非連續(xù)性序列生成的問題,可用于序列數據的生成。實驗表明,SeqGAN在文本、詩詞和音樂的生成上都取得了很好的結果。此外,生成式對抗網絡與模仿學習相結合、與Actor-critic方法相結合都取得了良好的應用效果[6]。

4? ? 結語

LeCun在Quora上寫道:“生成式對抗網絡及其相關的變化,是我認為的機器學習領域近10年最有趣的想法?!弊尵W絡來監(jiān)督網絡,采用二人零和博弈的對抗思想來解決問題,是深度學習在人工智能方向上的一大進步。雖然現在的生成式對抗網絡及其衍生模型還存在很多問題,仍處于發(fā)展的初期階段,但隨著人們對其研究的深入,生成式對抗網絡的應用領域會越來越寬廣,會給人類帶來越來越高的應用價值。

[參考文獻]

[1]MIRZA M,OSINDERO S.Conditional generative adversarial nets[EB/OL].(2014-11-04)[2019-05-10].https://arxiv.org/abs//1411.1784.

[2]ARJOVSKY M,CHINTALA S,BOTTOU L.Wasserstein generative adversarial networks[C].Sydney:International Conference on Machine Learning,2017.

[3]WU B,DUAN H,LIU Z,et al.Srpgan:perceptual generative adversarial network for single image super resolution[EB/OL].(2017-12-05)[2019-05-10].https://arxiv.org/abs//1712.05927,2017.

[4]趙增順,高寒旭,孫騫,等.生成對抗網絡理論框架、衍生模型與應用最新進展[J].小型微型計算機系統(tǒng),2018(12):2602-2606.

[5]LANTAO Y,WEINAN Z,JUN W,et al.SeqGAN:sequence generative adversarial nets with policy gradient[EB/OL].(2016-09-15)[2019-05-10].https://arxiv.org/abs/1609.05473.

[6]王坤峰,茍超,段艷杰.生成式對抗網絡GAN的研究進展與展望[J].自動化學報,2017(3):321-332.

Abstract:Since of 21 century, artificial intelligence has been developed for the third time under the background of big data, cloud computing and Internet of things and other emerging technologies have been matured. Among them, the development of image processing and speech recognition technology based on deep learning is particularly rapid. Generative antagonistic network is one of the most advanced and fascinating areas in the field of deep learning. Since it was put forward by Ian Goodfellow et al in October 2014, it has been widely concerned and sought after. Based on the basic principle of generative countermeasures network, this paper analyzes the characteristics of generative countermeasures networks. The research status and main application fields are studied, and the generated countermeasures network is summarized and prospected.

Key words:generated antagonistic network; deep learning; neural network; artificial intelligence

猜你喜歡
深度學習神經網絡人工智能
神經網絡抑制無線通信干擾探究
人工智能與就業(yè)
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
基于神經網絡的拉矯機控制模型建立
復數神經網絡在基于WiFi的室內LBS應用
基于支持向量機回歸和RBF神經網絡的PID整定