王藝賢
(上海視覺藝術(shù)學(xué)院,上海 201620)
本文運用具體的案例,分析將人工智能中的深度學(xué)習(xí)算法運用到玻璃與陶瓷造型設(shè)計中的可行性。通過具體的模型建設(shè),分析出作品的缺陷所在,使學(xué)生在沒有老師、專家等人的指導(dǎo)下亦能通過人工智能方法開發(fā)出能識別作品優(yōu)劣的程序,并能精確定位到作品待改善的地方,使設(shè)計師提高設(shè)計的效率,不再為造型的好壞花費較長的時間。與此同時,傳統(tǒng)造型設(shè)計的鑒賞通過專家識別,依靠的是專家經(jīng)年累月的見識與洞察力,其經(jīng)驗難以復(fù)制,但如果將已鑒定的作品交給深度學(xué)習(xí)模型進行訓(xùn)練,也可使得模型具有分辨作品優(yōu)劣真?zhèn)蔚裙δ?,以實現(xiàn)對新的作品進行識別分類的目的。將人的經(jīng)驗傳給人工智能模型,使其具備專家在某個領(lǐng)域的能力,繼而用人工智能取代人為判斷,大幅度提高效率。
造型設(shè)計是所有設(shè)計中重要的環(huán)節(jié),沒有造型設(shè)計便缺少了靈魂。優(yōu)秀的設(shè)計中可以捕捉到優(yōu)秀的造型設(shè)計,如何正確地認識自然,深入生活,反映和創(chuàng)作出適合社會主義物質(zhì)生活和人民大眾審美要求的新造型是當(dāng)今設(shè)計師所要考慮的重點之一 。因此,設(shè)計是復(fù)雜的,而如何在復(fù)雜化的設(shè)計流程中產(chǎn)生更快的效率呢?讓我們不得不針對當(dāng)下的時代模式進行思考。
處于信息時代下的設(shè)計師們,大量信息的涌入使得大家擁有了豐富的大數(shù)據(jù)資源。人工智能技術(shù)能夠自動地篩選數(shù)據(jù)信息,構(gòu)建密集型的信息網(wǎng)格。將人工智能技術(shù)應(yīng)用于造型設(shè)計領(lǐng)域,能夠為設(shè)計創(chuàng)作提供更加高效便捷的信息載體。人工智能技術(shù)可自動分析海量的數(shù)據(jù),運算速度快、精度高,這是人腦所不能比擬的。因此,可以利用人工智能技術(shù)來處理各種有著復(fù)雜構(gòu)造的玻璃、陶瓷造型藝術(shù)產(chǎn)品,并對其進行分析識別、局部改進,從而創(chuàng)作出辨識度更高、藝術(shù)性更強的造型作品,提高設(shè)計效率,這成了智能時代下一個新的思考方向。
通過分析與調(diào)研,在眾多的人工智能技術(shù)領(lǐng)域中,研究并選擇適合造型視覺設(shè)計的卷積神經(jīng)網(wǎng)絡(luò)模型建立并運用于玻璃、陶瓷造型設(shè)計中。
藝術(shù)領(lǐng)域使用人工智能方法已不是首創(chuàng),AI 已經(jīng)可以完成人類手繪藝術(shù)的一部分,但是如何在繪畫成品中進行快速的評判和修改還要進一步的研究。因此,需要研究更為精準(zhǔn)的算法去分類。卷積神經(jīng)網(wǎng)絡(luò)等方法已應(yīng)用到醫(yī)療上的疾病識別,商場的無人售貨機,工業(yè)上的自動分揀等多個領(lǐng)域,在藝術(shù)的領(lǐng)域中的挖掘更為深入。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡稱CNN)是深度學(xué)習(xí)當(dāng)中一個非常重要的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。它更多用在圖像處理、視頻處理、音頻處理以及自然語言處理等。早在20 世紀80 年代,卷積神經(jīng)網(wǎng)絡(luò)的概念就已經(jīng)被提出來了。但其真正的崛起卻是在21 世紀之后,隨著深度學(xué)習(xí)理論的不斷完善,同時,由于硬件性能的爆炸式提升,算力的不斷增長等因素的促進,給卷積神經(jīng)網(wǎng)絡(luò)這種算法提供了大放異彩的空間。Yann LeCun[1]等在1998 年提出LeNet 卷積神經(jīng)網(wǎng)路模型,設(shè)計之初只是用于手寫數(shù)字的識別,到如今已成為卷積神經(jīng)網(wǎng)絡(luò)的 HelloWorld。受限于計算機的算力不足,加之支持向量機 (核學(xué)習(xí)方法) 的興起,CNN 方法并未成為當(dāng)時學(xué)術(shù)界認可的主流方法。
如果說LeNet 奠定了卷積神經(jīng)網(wǎng)絡(luò)的一個基礎(chǔ),那么Krizhevsky Alex[2]等在2012年提出的AlexNet 就是飛躍了一大步。現(xiàn)在神經(jīng)網(wǎng)絡(luò)當(dāng)中應(yīng)用的許多技術(shù),在AlexNet當(dāng)中都有所體現(xiàn),比如說:使用了ReLU 函數(shù),避免梯度的消失問題;正則化(如Batch Norm)在AlexNet 當(dāng)中大量使用,加快了運算效率,引入Dropout 技術(shù),極大地避免的過擬合,從結(jié)構(gòu)上看,AlexNet 也有獨有的特點:我們知道,綜合來看,GPU的運行速度要遠快于CPU,于是AlexNet 當(dāng)中采用了雙CPU 運行;卷積層、池化層的交替使用,全連接層的應(yīng)用被完美地繼承了下來。Simonyan,Karen 與Zisserman,Andrew[3]在2014 年提出VGG Net 模型,這個神經(jīng)網(wǎng)絡(luò)探索了卷積神經(jīng)網(wǎng)絡(luò)的深度和其性能之間的關(guān)系,通過反復(fù)堆疊33 的小型卷積核和22 的采用了Max Pooling 的池化層,成功地構(gòu)建了16~19 層深的卷積神經(jīng)網(wǎng)絡(luò)。由于它的間接性和實用性,馬上成為了當(dāng)時最流行的神經(jīng)網(wǎng)絡(luò)模型。它在圖像分類和目標(biāo)檢測任務(wù)中都表現(xiàn)出非常好的效果。He,Kaiming 等在2015 年使用ResNet 模型獲得了當(dāng)年ImageNet 競賽中分類、目標(biāo)檢測等多個項目的第一名,該模型具有超深的網(wǎng)絡(luò)結(jié)構(gòu)(突破1000 層)、提出了殘差模塊,使用Batch Normalization(一種標(biāo)準(zhǔn)化處理)加速訓(xùn)練(丟棄Dropout)。
1.根據(jù)玻璃、陶瓷造型設(shè)計,建立模型需要解決的問題
1)學(xué)生的造型設(shè)計,不能及時得到老師的反饋,老師或?qū)<覠o法在短時間內(nèi)對作品進行分析,所以教學(xué)效果不能以最高效的方式反饋給學(xué)生,導(dǎo)致學(xué)生設(shè)計的效率低下,用算法介入進行數(shù)據(jù)分析與提煉。
2)設(shè)計師通?;ㄙM較長的時間去反復(fù)斟酌線條的比例以及與制作工藝結(jié)合中的合理性,導(dǎo)致效率低下,生產(chǎn)率低。用數(shù)據(jù)模型介入快捷的輸出所要的結(jié)果。
2.卷積神經(jīng)網(wǎng)絡(luò)模型更新?lián)Q代的過程
卷積神經(jīng)網(wǎng)絡(luò)(CNN,Convolutional Neural Network)在圖像領(lǐng)域的應(yīng)用非常廣泛,一般一個CNN 網(wǎng)絡(luò)主要包含卷積層,池化層(pooling),全連接層,損失層等。
1)神經(jīng)元
神經(jīng)網(wǎng)絡(luò)由大量的神經(jīng)元相互連接而成。每個神經(jīng)元接受線性組合的輸入后,最開始只是簡單的線性加權(quán),后來給每個神經(jīng)元加上了非線性的激活函數(shù),從而進行非線性變換后輸出。每兩個神經(jīng)元之間的連接代表加權(quán)值,稱之為權(quán)重(weight)。不同的權(quán)重和激活函數(shù),則會導(dǎo)致神經(jīng)網(wǎng)絡(luò)不同的輸出。
2)神經(jīng)網(wǎng)絡(luò)
圖1 的單個神經(jīng)元模型智能解決極簡單的分類問題,但隨著問題變得復(fù)雜,決定物體類別的特征變得很多的時候,簡單模型便不能準(zhǔn)備識別物體類型。因此,將多個神經(jīng)元組織在一起,且加上一個或多個隱藏層,就形成了神經(jīng)網(wǎng)絡(luò),如圖2。
大海子水庫新建涵洞、閘井工程總投資284.92萬元,其中建筑工程、臨時工程、獨立費用所占比重較大。經(jīng)過經(jīng)濟評價,本工程在經(jīng)濟上合理可行,且項目投入使用后各受益方需要分攤費用,農(nóng)業(yè)灌溉作為最大的受益方完全可以承受新水價,因此該項目實施有較好的社會和經(jīng)濟效益。
圖2 神經(jīng)網(wǎng)絡(luò)
常用的非線性激活函數(shù)有sigmoid、tanh、relu 等等,前兩者sigmoid/tanh 比較常見于全連接層,后者relu 常見于卷積層。
3)研究出適用于玻璃、陶瓷造型設(shè)計的卷積神經(jīng)網(wǎng)絡(luò)
圖2 神經(jīng)網(wǎng)絡(luò)屬于全連接的結(jié)構(gòu),但因?qū)嶋H問題復(fù)雜,圖像作為輸入層的特征量大,需要較多的隱藏層等特性,全連接的神經(jīng)網(wǎng)絡(luò)模型會過于復(fù)雜,計算量過大,且有過擬合的風(fēng)險,因此本文采用具有局部感知機制的CNN 算法。
根據(jù)陶瓷、造型研究出適用的卷積神經(jīng)網(wǎng)絡(luò),卷積流程示意圖如圖3,輸入的二維圖像,先經(jīng)過三次卷積層、池化層和Batchnorm,再經(jīng)過全連接層,最后使用softmax 分類作為輸出層。
圖3 CNN 流程圖
如圖3,輸入32×32 的圖像,3 通道RGB 彩色圖像。卷積函數(shù)的卷積核shape為5×5×3,depth 表示卷積核的個數(shù),取值為2,stride 表示移動步長,取值為1。激活函數(shù)使用Relu,保證輸出結(jié)果不小于0,池化函數(shù)采用最大池化。對結(jié)果進行softmax 處理。
確立了適用的卷積神經(jīng)網(wǎng)絡(luò)的架構(gòu)后,開始從以下步驟建立模型。
1.Step1:準(zhǔn)備數(shù)據(jù)
2.Step2:模型設(shè)計
使用百度旗下的paddle框架,定義一個卷積神經(jīng)網(wǎng)絡(luò)函數(shù),內(nèi)含經(jīng)過3層卷積過程,函數(shù)的輸入?yún)?shù)為一張圖片,第一層的卷積結(jié)果作為第二層卷積的輸入,第二層卷積的結(jié)果作為第三層的卷積輸入,最后以softmax 為激活函數(shù)的全連接作為輸出層。(表1)
表1 參數(shù)設(shè)定表
然后,使用交叉商損失函數(shù)、Adam 優(yōu)化方法,同時指定學(xué)習(xí)率為0.001,對模型機型驗證和優(yōu)化。
3.Step3:根據(jù)研究出的算法進行模型訓(xùn)練
利用paddle 框架的fluid 模塊創(chuàng)建用于模型訓(xùn)練的Executor,并設(shè)定它的運算場所為CPU 或GPU [place=fluid.CUDAPlace(0) if use_cuda else fluid.CPUPlace()],然后對Executor 應(yīng)用fluid.default_startup_program()進行初始化,最后進行訓(xùn)練過程,訓(xùn)練過程需要3 個參數(shù)分別是program、feed、fetch_list。Program 選用fluid提供的default_main_program(),feed 即用600 張圖片的數(shù)據(jù)集,fetch_list 取損失函數(shù)avg_cost 和準(zhǔn)確度acc,提供好參數(shù)后,將Executor run 起來,即得到了訓(xùn)練模型。訓(xùn)練過程中,隨迭代的次數(shù),模型的損失值cost 和準(zhǔn)確率acc 如圖4 所示。隨著迭代次數(shù)的增加,準(zhǔn)確率逐步提升,當(dāng)?shù)螖?shù)趨近于1000000 次時,準(zhǔn)確率收斂于100%。
圖4 zcost 和acc
4.Step4:模型預(yù)測中進行玻璃、陶瓷造型線條的識別
通過算法模型的建立,直接可以用視覺圖片的方式輸入,通過模型運算直接輸出想要的結(jié)果,直接可得到造型的具體描述,通過造型的具體描述,設(shè)計師可以在設(shè)計過程中選擇采用以及不采用該造型。
根據(jù)算法模型,如圖5 所示的陶瓷作品在53.28%的概率上被認為是high level 造型設(shè)計作品,46.72%的概率上被認為是norma 造型設(shè)計作品。設(shè)計師或者學(xué)生在創(chuàng)作中可以根據(jù)作品的描述自行修改造型。該算法的研究只適用于對玻璃、陶瓷造型的線條以及比例關(guān)系進行分類,但是在具體數(shù)據(jù)參數(shù)的輸出中還需要進一步研究和完善。在算法模型的建立研究中,后期還需根據(jù)大量的數(shù)據(jù),增加算法模型對造型數(shù)據(jù)的具體描述,例如直接輸出:比例關(guān)系、線條尺度等多方面的細節(jié),方便設(shè)計師以及學(xué)生對造型細節(jié)的再次修改與完善,得出最優(yōu)解。
圖5 陶瓷造型的線條識別
通過算法模型的研究發(fā)現(xiàn),選擇人工智能中的卷積神經(jīng)網(wǎng)絡(luò)運用到玻璃與陶瓷造型設(shè)計中,運用具體模型的建立,再到用具體的玻璃、陶瓷造型案例進行測試,得出此算法運用在玻璃陶瓷造型設(shè)計中的可行性。此算法,在幫助設(shè)計師以及學(xué)生減輕設(shè)計工作壓力的同時,解決相當(dāng)大的時間浪費的問題,有效縮短時間,將其運用到工藝美術(shù)以及多維度的造型設(shè)計的教學(xué)中,對藝術(shù)教育的發(fā)展起到了一定的推動作用,通過人工智能技術(shù),有效地幫助學(xué)生更好更高效地進行造型設(shè)計。在往后的研究與模型調(diào)試中,還可進一步對算法模型進行深入的調(diào)整,使其數(shù)據(jù)更加具體化,更加細化。
但在人工智能應(yīng)用于藝術(shù)設(shè)計中,人工智能目前只能夠輔助人們完成部分設(shè)計工作,沒辦法與人類的思想以及審美達成一定的共鳴,設(shè)計中人類的思想和審美境界無法被人工智能所取代,這也是人類在設(shè)計工作中的重要價值。人工智能算法雖然能夠高效率地完成大量的數(shù)據(jù)分析,但是人類的思想情感共鳴在機器中并不能夠很好地體現(xiàn)出來,機器無法識別人類的精神思想。人工機器以及智能算法,在造型設(shè)計以及藝術(shù)設(shè)計運用中都是有一定程度的程序化、智能化和公式化,無法像人腦一樣,有一定審美意識的產(chǎn)生藝術(shù)靈感,并根據(jù)靈感進行一系列的創(chuàng)作。所以藝術(shù)設(shè)計的未來發(fā)展中,在運用人工智能導(dǎo)入的同時,需要研發(fā)人工智能感性的思維領(lǐng)域,加入審美思維的算法研究,在思想領(lǐng)域共通互融、形成藝術(shù)智能發(fā)展的有機整體,這也是未來人類在人工智能領(lǐng)域中需要思考和發(fā)展的。