国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度學(xué)習(xí)的圖像風(fēng)格轉(zhuǎn)換淺論

2018-04-13 03:47欒五洋
數(shù)字通信世界 2018年2期
關(guān)鍵詞:池化權(quán)值神經(jīng)元

欒五洋

(南陽市第二中學(xué),南陽 473000)

1 引言

首先基于實用主義對人工智能下一個定義:人工智能是對計算機系統(tǒng)如何能夠履行那些只有依靠人類智慧才能完成任務(wù)的理論研究,比如說ALPHA GO下圍棋,圍棋是憑借人類智慧才可以完成的,是人類特有的技能,然而在李世石1比4被完敗,已經(jīng)證明了在圍棋上機器已經(jīng)超過了人類,于是人們將目光轉(zhuǎn)向一個人類特有的領(lǐng)域——藝術(shù),繪畫的風(fēng)格一直被認為是不可能被機器模仿的,被認為是人類的一種天分,繪畫的風(fēng)格是很抽象的概念,不同畫家的繪畫風(fēng)格我們?nèi)庋酆苋菀拙涂梢员鎰e,但是在計算機看來就是一堆像素的疊加,于是需要計算機找到除了像素外更加潛在的可以量化的特點。而在2015年德國有三位科學(xué)家提出算法使計算機可以模仿知名畫家創(chuàng)作繪畫,他們的算法主要是通過多層的卷積神經(jīng)網(wǎng)絡(luò)將畫家的畫作進行特征提取,再通過矩陣將風(fēng)格量化,再將風(fēng)格轉(zhuǎn)化為畫作的特有紋理并疊加在任意的畫作上,就形成了對畫家風(fēng)格的模仿。

2 卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)

2.1 卷積神經(jīng)網(wǎng)絡(luò)概述

卷積神經(jīng)網(wǎng)絡(luò)是當(dāng)前人工神經(jīng)網(wǎng)絡(luò)方面最重要的內(nèi)容,這種人工神經(jīng)網(wǎng)絡(luò)區(qū)別于其他的神經(jīng)網(wǎng)絡(luò)的最大特點是卷積神經(jīng)網(wǎng)絡(luò)采用了權(quán)值共享,與生物神經(jīng)網(wǎng)絡(luò)具有很強的相似性,并且它的網(wǎng)絡(luò)復(fù)雜程度大幅度降低,使得可以被廣泛的運用。

從本質(zhì)上來看,卷積神經(jīng)網(wǎng)絡(luò)可以看成一種映射,這種網(wǎng)絡(luò)可以通過學(xué)習(xí)大量的輸入到輸出的結(jié)果,不需要這種輸入到輸出過程的精確的映射關(guān)系,只要通過一定的模式對其進行訓(xùn)練,就可以使得網(wǎng)絡(luò)具有輸入到輸出的能力。一般來說,卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練可以分為兩個階段,在訓(xùn)練前,先用隨機數(shù)對其網(wǎng)絡(luò)的權(quán)值進行初始化,之后進入到向前傳播訓(xùn)練階段,首先從樣本集中抽取一個樣本(X,Ym),將X傳遞到卷積神經(jīng)網(wǎng)絡(luò)的輸入層,之后經(jīng)過逐級的傳遞傳送到輸出層,計算實際的輸出Gm,之后進入向后傳播訓(xùn)練階段,計算實際輸出與理想輸出的誤差并根據(jù)誤差最小的原理來調(diào)整神經(jīng)網(wǎng)絡(luò)的權(quán)值。

2.2 卷積神經(jīng)網(wǎng)絡(luò)特點

2.2.1 稀疏連接

相對與傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)來說,卷積神經(jīng)網(wǎng)絡(luò)采用了稀疏連接的方式,不再是層與層間每個神經(jīng)元都相互連接,每個神經(jīng)元節(jié)點只與其相近的上層神經(jīng)元相連接。

圖1

M-1層為輸入層,如果是傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)的話,那么就是M-1層的每個神經(jīng)元都與M層上所有神經(jīng)元連接,而卷積神經(jīng)網(wǎng)絡(luò)的M-1層只與其相近的三個上級神經(jīng)元相連接,這樣大大減小了整個網(wǎng)絡(luò)的數(shù)據(jù)復(fù)雜度。

2.2.2 權(quán)值共享

在傳統(tǒng)的全連接網(wǎng)絡(luò)中,對于一個圖像來說,輸入層的每個神經(jīng)元要連接所有的像素,在第一層就會產(chǎn)生幾百萬的權(quán)值,導(dǎo)致運算進行的十分緩慢,而在卷積神經(jīng)網(wǎng)絡(luò)中,一個卷積核卷積處理整個圖像而其內(nèi)在的權(quán)值并不發(fā)生變化,一個卷積核提取一種特征,通過增加卷積核的個數(shù)來提取圖像的多個特征,通過這樣的方法使得再對圖像進行特征提取時不用考慮圖像的局部特征,并且使得整個網(wǎng)絡(luò)的矩陣運算更加簡單。

2.2.3 最大池化

最大池化是一種非線性采樣方法,經(jīng)過卷積層的操作后,獲取了圖像的特征并對其進行分類,但是這個過程會產(chǎn)生一個數(shù)百萬維的特征向量,而池化過程就是對卷積特征矩陣進行降維操作,主要是將卷積特征分為N*N個不相交的區(qū)域,取這些區(qū)域的最大值來表示降維后的卷積特征,除此之外還有平均池化,即取這些區(qū)域的平均值來表示降維后的卷積特征。一般來說,池化可以使得特征減少,極大的降低了來自上層運算的復(fù)雜度,除此之外,池化還可以保持圖像的旋轉(zhuǎn)平移等的不變性,平均池化可以保持圖像的背景信息,而最大池化可以最大的保留圖像的紋理信息。

2.3 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)

卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)主要包括卷積層、激活函數(shù)、池化層和全連接層。

2.3.1 卷積層

卷積層是卷積神經(jīng)網(wǎng)絡(luò)的最重要的一部分,主要是對圖像的特征進行提取,整個卷積層由大量的卷積核或者叫濾波器構(gòu)成,用來提取圖像的特征,這些卷積核的大小一致,但是深度必須和輸入數(shù)據(jù)的深度一致,通過一個卷積核對圖像進行二維卷積運算,得到圖像的特征。在每一個卷積層后都必須要有一個非線性的激活函數(shù),常見的如Tanh函數(shù)。

圖2

由于卷積神經(jīng)網(wǎng)絡(luò)的線性能力比較差,通過加入非線性的激活函數(shù),增加整個網(wǎng)絡(luò)的非線性,使整個網(wǎng)絡(luò)更加穩(wěn)定。

2.3.2 池化層

池化層一般是固定嵌在卷積層之后的,主要是對卷積層運算后得到的圖像特征進行降維,這樣就減少了卷積神經(jīng)網(wǎng)絡(luò)中學(xué)習(xí)的參數(shù)數(shù)量,使得運算的速度大大提升,提高網(wǎng)絡(luò)的運行效率,并且保持圖像的特征不變。

圖3

2.3.3 全連接層

全連接層一般在池化層后,整個網(wǎng)絡(luò)的末端,在這一層中,神經(jīng)元對于上一層的神經(jīng)元是全部連接的,它的主要作用是將學(xué)習(xí)到的分布的特征將其映射到樣本空間中,可以對整個圖像的特征做一個分類。

2.3.4 優(yōu)化算法

上文提到在卷積層中卷積核的初始值是隨機數(shù),在前向傳播訓(xùn)練過程中不可避免的產(chǎn)生損失函數(shù),而卷積神經(jīng)網(wǎng)絡(luò)就是通過損失函數(shù)的計算來推動分類特征的,而在反向傳播訓(xùn)練過程中通過優(yōu)化濾波器的參數(shù)來達到最優(yōu)相應(yīng),而優(yōu)化算法就是通過反向傳播來更新濾波器參數(shù)的,常見的有梯度下降算法,自適應(yīng)矩估算算法和牛頓法。

3 圖像的風(fēng)格轉(zhuǎn)化

首先對于圖像風(fēng)格轉(zhuǎn)化做一個定義,圖像風(fēng)格轉(zhuǎn)換是指給出一張圖像A和一張風(fēng)格圖像B,求一張圖像C,使得圖像C和圖像A內(nèi)容一致而風(fēng)格又與圖像B相近。

3.1 基于迭代優(yōu)化的圖像風(fēng)格轉(zhuǎn)換

我們知道卷積層后的輸出是圖像的提取特征,那么我們只要提取出圖像A的內(nèi)容和圖像B的風(fēng)格后再合成即可得到一個與圖像A內(nèi)容一致,與圖像B風(fēng)格一致的圖像C,即完成了圖像B的風(fēng)格遷移到圖像A上。

首先,一個圖像經(jīng)過卷積層后是一個三維的數(shù)組,一張圖像經(jīng)過卷積層后,得到若干個三維數(shù)組Ki,這些數(shù)組就代表了圖像的內(nèi)容,這些數(shù)組又組成了一個多維數(shù)組,這個多維數(shù)組就代表了這個圖像的內(nèi)容,而對這個多維數(shù)組求格拉姆矩陣,就可以得到該圖像的紋理,在這里,我們將紋理看成圖像風(fēng)格的具體表現(xiàn)。

提取好圖像的內(nèi)容和風(fēng)格后,進行內(nèi)容誤差和風(fēng)格誤差的計算,則C與A的內(nèi)容誤差為Tc,圖像C與圖像B的風(fēng)格誤差為Ts,則其總體誤差為T=α*Tc+β*Ts,α和β是指內(nèi)容和風(fēng)格在圖像中的比重。那么整個迭代優(yōu)化的過程可以分為以下幾步,首先對圖像C進行初始化,求出整體誤差T,根據(jù)梯度下降算法調(diào)整圖像C的像素參數(shù),判斷誤差T是否收斂或者小于閾值,若是,則停止,若不是,則繼續(xù)計算整體誤差并調(diào)整像素。

這種方法可以很好的獲取風(fēng)格圖像的紋理并達到讓人滿意的效果,但是由于不斷的迭代優(yōu)化,使得運行時間太長,效率太低。

圖4

3.2 基于轉(zhuǎn)換網(wǎng)絡(luò)的圖像風(fēng)格轉(zhuǎn)換

相比較于迭代優(yōu)化方法,這種方法運行的速度有了極大的提升。這種網(wǎng)絡(luò)是一種全卷積層的網(wǎng)絡(luò),不包括任何的池化和全連接層,結(jié)構(gòu)為一個下采樣部分,其中包含三個卷積層,一個殘差網(wǎng)絡(luò),由若干個殘差塊組成,主要是解決一定層數(shù)后梯度變淺后的效果變差問題,還有一個上采樣部分,包含兩個采樣層和一個卷積層,這三個部分構(gòu)成圖像的生成網(wǎng)絡(luò),在訓(xùn)練階段,給定風(fēng)格圖像,將圖片輸入網(wǎng)絡(luò),生成網(wǎng)絡(luò)會輸出一張圖像,由損失網(wǎng)絡(luò)來計算風(fēng)格誤差和內(nèi)容誤差,并通過誤差的值來調(diào)整生成網(wǎng)絡(luò)的參數(shù),達到最小的損失。

4 結(jié)束語

本文首先介紹了圖像風(fēng)格轉(zhuǎn)化的背景,藝術(shù)被認為是人類獨有的領(lǐng)域,而人工神經(jīng)網(wǎng)絡(luò)正在企圖打破這一獨有的領(lǐng)域,其后首先介紹了卷積神經(jīng)網(wǎng)絡(luò)的基本概念,特點和組要組成,為下面的圖像風(fēng)格轉(zhuǎn)化做了鋪墊,最后介紹了兩種風(fēng)格轉(zhuǎn)換的方法,一種是基于迭代優(yōu)化的方法,不斷地調(diào)整像素,這種方法效果顯著,但是效率太低,第二種是基于轉(zhuǎn)換網(wǎng)絡(luò)的方法,這種方法相比之下運行的速度會更快一些。卷積神經(jīng)網(wǎng)絡(luò)是目前深度學(xué)習(xí)方面最重要的部分,從仿生學(xué)上看,卷積神經(jīng)網(wǎng)絡(luò)是最接近人大腦神經(jīng)的人工神經(jīng)模型,并且在社會的各個領(lǐng)域都有著舉足輕重的作用,是未來科技的核心,而對于卷積神經(jīng)網(wǎng)絡(luò)不同環(huán)境的架構(gòu)仍然需要人們?nèi)ゲ粩嗟拈_發(fā)和探索。

[1] Simon Haykin.神經(jīng)網(wǎng)絡(luò)基礎(chǔ)[M].北京:機械工業(yè)出版社,2012:145-162.

[2] 岡薩雷斯.數(shù)字圖像處理[M].北京:電子工業(yè)出版社,2007:43-56.

[3] 楊楠.基于caffe深度學(xué)習(xí)框架的卷積神經(jīng)網(wǎng)絡(luò)研究[D].河北師范大學(xué),2014:1-7.

猜你喜歡
池化權(quán)值神經(jīng)元
基于Sobel算子的池化算法設(shè)計
基于高斯函數(shù)的池化算法
一種融合時間權(quán)值和用戶行為序列的電影推薦模型
卷積神經(jīng)網(wǎng)絡(luò)中的自適應(yīng)加權(quán)池化
CONTENTS
基于卷積神經(jīng)網(wǎng)絡(luò)和池化算法的表情識別研究
躍動的神經(jīng)元——波蘭Brain Embassy聯(lián)合辦公
基于權(quán)值動量的RBM加速學(xué)習(xí)算法研究
基于多維度特征權(quán)值動態(tài)更新的用戶推薦模型研究
ERK1/2介導(dǎo)姜黃素抑制STS誘導(dǎo)神經(jīng)元毒性損傷的作用