摘? ? 要:在當(dāng)今數(shù)字背景下,人工智能技術(shù)與數(shù)字媒體之間關(guān)系愈發(fā)緊密,從語音、圖像識別,到藝術(shù)創(chuàng)作的其它方面都印證了兩者的聯(lián)系。人工智能與數(shù)字媒體藝術(shù)的商業(yè)化浪潮暗流涌動,在多領(lǐng)域中,逐漸孕育成為主流之勢。
關(guān) 鍵 詞:數(shù)字媒體藝術(shù)實踐;人工智能;技術(shù)革命
一、基于人工智能的數(shù)字媒體藝術(shù)實踐進(jìn)入全面超越時代
(一)圖像識別
時光追溯回2009年,就曾有學(xué)者發(fā)表過論文,其中提出針對計算機視覺研究者需要建立首個超大型圖像數(shù)據(jù)庫。2010年首次舉辦了ILSVRC 2010。該大型圖像識別競賽是以Imase Net為基礎(chǔ),最初競賽的訓(xùn)練樣本包括120萬個圖像。從種類上看,這些圖像涉及1000多個類別,且都具有手工標(biāo)志。程序通過培訓(xùn)后,經(jīng)過5萬多測試圖像評估,判斷是否能夠分類圖像。
在2012年度開展的Image Net競賽中,在30個團(tuán)體中取得了第一名測試成績。而位居第二的日本代表隊,模型出錯率為26.2%。由此說明,在圖像識別領(lǐng)域神經(jīng)網(wǎng)絡(luò)遠(yuǎn)遠(yuǎn)領(lǐng)先于其他技術(shù),有望成為突破人工智能的轉(zhuǎn)折點。
之后微軟亞洲研究院(即MSRA)衛(wèi)冕2015年度的Image Net競賽的桂冠,提高了網(wǎng)絡(luò)深度,反而降低了學(xué)習(xí)效率。為了解決在層層傳遞中信息有效性的衰減問題,MSRA團(tuán)隊試著導(dǎo)入了“ 深度殘余學(xué)習(xí)”的算法。由此得到了包含152層神經(jīng)網(wǎng)絡(luò)的MSRA深度殘余學(xué)習(xí)模型,在前五個類別的測試中,刷新了以往的記錄,出錯率僅為3.57%,相較于正常人5%左右的出錯率還要低。
(二)語音識別
2012年10月,來自于微軟,IBM,谷歌,多倫多大學(xué)的鄧力、Geoffrey Hinton等人共同發(fā)表了一篇名為《深度神經(jīng)網(wǎng)絡(luò)在語音識別的聲學(xué)模型中的應(yīng)用:四個研究小組的共同觀點》的文章。他們對神經(jīng)網(wǎng)絡(luò)實施了從Hinton中導(dǎo)入的“限制波爾茲曼機”的“預(yù)培訓(xùn)”。運用深度神經(jīng)網(wǎng)絡(luò)模型對文字識別的幾率進(jìn)行估算。在測試中,谷歌的語音輸入,最低的單詞錯誤率為12.3%。
2013年3月,在Alex Graves(多倫多大學(xué))為主導(dǎo)發(fā)表的一篇名為《深度循環(huán)神經(jīng)網(wǎng)絡(luò)用于語音識別》論文中,導(dǎo)入了RNN/LSTM 技術(shù),形成了有三個隱層構(gòu)成的網(wǎng)絡(luò),其中包含自由參數(shù)430萬個,由此進(jìn)行的TIMIT基準(zhǔn)測試,得出了只有17.7%的“音位錯誤率”,領(lǐng)先于同期所有技術(shù)的效果。
2015年5月,谷歌公開表示在RNN/LSTM等技術(shù)的支撐下,谷歌語音已經(jīng)將單詞出錯率壓縮到了8%(一般正常人為4%左右)。
2015年12月,Dario Amodei代表百度AI實驗室發(fā)表了一篇名為《英語和漢語的端對端的語音識別》的著作。運用了基于lstm得到的簡化模型——封閉循環(huán)單元,在長達(dá)12000個小時(16個GPU約3-5天)的語音訓(xùn)練下,百度英文語音識別系統(tǒng)在接受WSJEval'92的一個基準(zhǔn)測試中,創(chuàng)造了3.1%的單詞出錯率,這一水平已經(jīng)比5%的正常人水平還要低。同時在小型漢語的一個測試中,得出的出錯率結(jié)果為3.7%,而另外的一個由五人構(gòu)成的團(tuán)隊測試中集體出錯率為4%。
從本質(zhì)上來看,循環(huán)神經(jīng)網(wǎng)絡(luò)能夠?qū)σ粋€序列的長度變化的輸入/出(多對多)進(jìn)行處理。就廣義而言,前饋神經(jīng)網(wǎng)絡(luò)所優(yōu)化的對象如果是一個函數(shù)(如,識別圖像),就可以認(rèn)為循環(huán)神經(jīng)網(wǎng)絡(luò)所優(yōu)化的對象是一個程序,有著更加寬闊的應(yīng)用空間。
(三)藝術(shù)創(chuàng)作
長時間以來,在人類的意識中,機器一直被賦予了理解人類思維及邏輯的能力,而對于豐富的人類情感和美學(xué)價值,卻認(rèn)為機器是無法理解的,所以也不可能形成有美學(xué)價值的作品。然而以往的實踐歷歷在目,在與李世石對局中阿爾法狗下出了讓我們震撼的一步,面對阿爾法狗的高超下法,就連聶衛(wèi)平先生都脫帽致敬,由此證明,深度學(xué)習(xí)算法具備了美學(xué)價值的自發(fā)創(chuàng)造能力。實際上,人工神經(jīng)網(wǎng)絡(luò)在視覺藝術(shù)領(lǐng)域,已經(jīng)能夠區(qū)分出一副作品的風(fēng)格及內(nèi)容,同時能夠掌握多種藝術(shù)風(fēng)格,并隨意地運用到其他作品中,可以在同樣的內(nèi)容上,嘗試多種藝術(shù)風(fēng)格來渲染。
(四)其它方面
谷歌AI實驗室于2016年5月的一篇報道中表示,對機器開展英文言情小說的培訓(xùn),讓機器從2865部小說中學(xué)習(xí)敘事方式與用詞風(fēng)格。通過觀察程序的演化進(jìn)程來看,單詞的空格結(jié)構(gòu),最先被機器模型所領(lǐng)悟,隨后有短到長識別了更多單詞,并逐步掌握了標(biāo)點符號的運用,一些相關(guān)性較高的語句結(jié)構(gòu)也被重新慢慢掌握。
2016年5月,谷歌的Deep Mind團(tuán)隊對其開發(fā)的“神經(jīng)編程解釋器”做了相關(guān)報道,該神經(jīng)網(wǎng)絡(luò)不僅具備自主學(xué)習(xí)程序的能力,且能夠完成一些簡單的程序編輯,具備了初級程序員的能力。
二、基于人工智能的數(shù)字媒體藝術(shù)實踐的商業(yè)化浪潮
2015年,谷歌推出了TensorFlow開源機器學(xué)習(xí)平臺,臉書定制打造的FBLeamer Flow平臺,顯著的提升了員工效率;特斯拉也在同年的5月,創(chuàng)設(shè)Open AI升源人工智能系統(tǒng)。一時間人工智能領(lǐng)域熱鬧異常,大量工業(yè)巨頭攜帶巨資蜂擁而入,加速了人工智能的前進(jìn)步伐,代表性的如百度大腦計劃、IBM的沃森系統(tǒng)、微軟的同聲翻譯等。
2016年,在IBM的帶領(lǐng)下,全球人工智能開啟了首輪核心業(yè)務(wù)轉(zhuǎn)型,并驅(qū)動人工智能的商業(yè)化浪潮?,F(xiàn)階段,深度學(xué)習(xí)的焦點如同疾風(fēng)一樣向以深度卷積神經(jīng)網(wǎng)絡(luò)為依托的物體檢測和定位,分割蔓延,一旦突破將會引領(lǐng)人工智能加快轉(zhuǎn)化,實現(xiàn)產(chǎn)業(yè)化發(fā)展?;谌斯ぶ悄芘c大數(shù)據(jù)、機器人、云平臺、移動互聯(lián)等融合的持續(xù)深化,人工智能開始轉(zhuǎn)向基礎(chǔ)性、前沿性、關(guān)鍵性的重要角色。以大數(shù)據(jù)為基礎(chǔ)建立的商業(yè)直覺、業(yè)務(wù)流程智能化、產(chǎn)品服務(wù)差異化,驅(qū)動人工智能向醫(yī)療、新聞、律師、保險、金融、數(shù)字個人主體等新領(lǐng)域進(jìn)軍且占據(jù)了核心地位,全面地滲透于日常生活。
人工智能雖然實現(xiàn)了突破性的成長,但還只是一顆幼苗。雖然聯(lián)結(jié)主義的方法無堅不摧、戰(zhàn)無不勝,然而在理論層面卻缺乏堅實的基礎(chǔ)。立足于仿生學(xué)與經(jīng)驗實現(xiàn)的突破,并未實現(xiàn)透徹的理解與預(yù)測。小樣本的學(xué)習(xí)如何開展,尤其是自主的對周圍環(huán)境進(jìn)行學(xué)習(xí),提高學(xué)習(xí)的泛化性,均是亟待剖析的熱點。
就當(dāng)前而言,在圖像識別、文本處理、語音識別、藝術(shù)美學(xué)、藝術(shù)博弈、軟件開發(fā)等領(lǐng)域,人工智能已經(jīng)全面超越人類。在醫(yī)療、新聞、律師、保險、金融、數(shù)字個人主體等領(lǐng)域,人工智能顯然是勢不可擋的主流,由其引發(fā)的新一輪技術(shù)革命正在孕育,人工智能暗流涌動,或即將面臨全面爆發(fā)!
參考文獻(xiàn):
[1]張登峰.《人工智能藝術(shù)的美學(xué)限度及其可能的未來》[J].江漢學(xué)術(shù)2019,(01):86-92.
[2]徐放鳴.《審美文化新視野》[M].北京:中國社會科學(xué)出版社,2008.303
作者簡介:蔡念,女,生于1994年,江蘇揚州人,南京藝術(shù)學(xué)院2017級研究生,研究方向:數(shù)字媒體。
基金項目:此文章為2018年江蘇省研究生科研實踐創(chuàng)新項目 項目編號:SJCX18_0548。