編譯 韓真
先進算法使用機器學習來自主創(chuàng)造藝術作品。
這些畫作都是機器學習算法AICAN創(chuàng)作的,出現在2018年12月由SCOPE國際藝術博覽會和邁阿密巴塞爾藝術展舉辦的聯合展出上
隨著人工智能(AI)走進我們的日常生活,如寫作、駕駛等方面,藝術家們開始實驗用AI方法進行創(chuàng)作也是很自然的一件事。
事實上,克里斯蒂(Christie,一位AI)最近就以432 500美元的價格拍賣了一幅自己的作品,是一張模糊的臉,命名為《愛德蒙·貝拉米肖像》(Portrait of Edmond Belamy)。
這幅作品是一波新的AI藝術浪潮的一部分。巴黎藝術家雨果·卡塞勒斯-杜普雷(Hugo Caselles-Dupré)、皮埃爾·福特雷爾(Pierre Fautrel)和戈捷·韋尼耶(Gauthier Vernier)用了數千幅肖像畫來訓練算法,把肖像畫過往形成的美學特質“教給”AI,而AI就創(chuàng)作了《愛德蒙·貝拉米肖像》。
這幅畫“不是人類心靈的產物”,克里斯蒂在畫作前言中說:“這是用人工智能,用代數方程定義的算法創(chuàng)造的?!?/p>
所以,如果一個AI可以創(chuàng)造畫作,那么最終成品可以被認為是一種藝術嗎?有沒有一個分界線來判斷一個藝術家對于AI創(chuàng)造的最終成品的影響有多大?
作為羅格斯大學藝術與人工智能實驗室的主任,我一直在思考這些問題,尤其是要考慮,到了何種程度,使用AI創(chuàng)作的藝術家應該把成品歸功于機器的創(chuàng)作,而不是自己?
在過去的50年里,好幾個藝術家已經靠寫程序來創(chuàng)造藝術了——我稱之為“算法藝術”。這種藝術的創(chuàng)作過程需要藝術家預先把創(chuàng)作視覺效果想好,然后把創(chuàng)造過程詳細寫進代碼中去。
最早的此類算法藝術從業(yè)者之一,哈羅德·科恩(Harold Cohen),在1973年創(chuàng)作了阿倫(AARON)程序。該程序用作者創(chuàng)造的一組規(guī)則來產生繪畫??贫髟谌松薪酉聛淼娜兆永镆恢遍_發(fā)和改進AARON程序,但該程序的核心設計一直以來都是來執(zhí)行藝術家給予的任務。與之相比,最新的藝術創(chuàng)造使用了AI技術和機器學習技術,來讓機器更自主地創(chuàng)作繪畫。
在這種創(chuàng)作方法中,藝術家不是寫算法來服從一組規(guī)則來產生繪畫,而是要從數千幅圖像中做分析,“學習”到一種美學特質。然后,算法會遵從它學到的美學特質,嘗試生成新的圖像。
創(chuàng)作的開始,藝術家會選擇一組圖像來喂給算法,這個過程我稱之為“前策展”。最近幾年出現的AI藝術作品都采用了一類叫作“生成對抗網絡”(GAN)的算法。GAN最初由伊恩·古德費洛(Ian Goodfellow)于2014年創(chuàng)造,叫作“對抗”是因為該算法有對抗的兩方:一方生成隨機的圖像;另一方則通過輸入圖像來學習如何評價這些生成的隨機圖像,要使得它們和輸入圖像最一致。
這組肖像是生成對抗網絡算法產生的。算法將過去500年藝術史上不同風格的肖像畫用于訓練。畫面上扭曲的臉是因為算法嘗試要模擬這些不同的風格的肖像而不得導致的
比如說,藝術家可以把過去500年的肖像畫都喂給一個生成性的算法,然后算法會嘗試模仿這些輸入圖像,并且輸出一系列的圖像。然后藝術家要在這些輸出圖像里面篩選、品味、找出他或她想要用的繪畫。這個過程我稱之為“后策展”。
在整個創(chuàng)作過程中,藝術家一直積極掌控:深度參與前策展和后策展過程,甚至去調節(jié)算法,來獲得最想要的輸出圖像。
生成性算法生成的圖像甚至會讓主持創(chuàng)作過程的藝術家吃驚。比如說,喂了肖像畫的GAN可能會輸出一系列扭曲變形的人臉出來。我們該怎么看待這件事情呢?
心理學家丹尼爾·伯萊因(Daniel E. Berlyne)研究美學的心理學過程已有數十年的歷史。他發(fā)現在藝術作品中,如下幾點是最強有力的促進因素:新穎(novelty),驚奇(surprise),復雜(complexity),模糊(ambiguity)和古怪(eccentricity)。
那么GAN生成的這些扭曲的人臉肖像畫,自然是新穎的,驚奇的,古怪的,它們讓人想起了英國肖像畫家弗朗西斯·培根的著名變形畫作,比如《三幅肖像畫習作》(Three Studies for a Portrait of Henrietta Moraes),但是在這些機器創(chuàng)作的變形的人臉中,還是缺乏了一些東西,就是“動機”(Intent)。
要創(chuàng)造一些變形的人臉,培根是有他自己的動機的,但是AI藝術作品中的變形人臉創(chuàng)造出來卻并不是因為藝術家或機器有這樣的動機。我們看到的,其實是機器沒能成功模擬人的臉,然后吐出來了一些讓人驚奇的畸形臉而已。
而這種畸形臉就是前文中AI克里斯蒂拍賣的藝術作品。
我則要提出,這種變形的人臉并不表示缺乏動機,即使它在最終圖像中沒有體現出來,但動機仍然存在于AI作畫的創(chuàng)作過程中。
比如,藝術家安娜·里德勒(Anna Ridler)為了創(chuàng)造她的藝術作品《厄舍府的倒塌》(The Fall of the House of Usher),從埃德加·愛倫·坡短篇小說1929的年同名電影中取了很多劇照,把它們做成墨水描圖,然后喂給GAN,機器就生成了一組新的圖像。她把這些新圖像組織成了又一個短片。
又比如藝術家馬里奧·克林吉門(Mario Klingemann)的作品《屠夫之子》(The Butcher’s Son)就是一副裸體的人像,是把很多色情作品的簡筆畫和圖像喂給算法之后生成的。
我用以上兩個例子來說明藝術家是如何使用AI工具,采用多種操作方法來創(chuàng)作的。即使最終畫作讓藝術家們吃驚,它們也不是無中生有的。它們是有一個創(chuàng)作過程的,過程中當然是有動機的。
然而,很多人都對AI藝術持懷疑態(tài)度。普利策獎獲獎者、藝術批評家杰瑞·薩爾茨(Jerry Saltz)說過,他認為AI藝術家的作品很無聊,無趣,就包括《屠夫之子》在內。
可能批評家們在有些情況下是對的。比如說在變形的肖像畫中,你可以說最終結果確實不怎么有意思,它們只是對于先前策劃的輸入圖像的模仿而已,中間加了些調節(jié)步驟。
但問題本身不在于最終成品畫作,而是在于創(chuàng)作過程上,這一過程需要藝術家和機器合作完成,創(chuàng)造革命性的新的視覺形式。
因此,我毫無疑義地把AI創(chuàng)作的作品視為一種概念藝術,這種形式其實從20世紀60年代就開始了。在概念藝術中,創(chuàng)作背后的想法和創(chuàng)作的過程比創(chuàng)作結果更重要。
說到薩爾茨認為無聊的《屠夫之子》作品,它剛剛獲得了流明獎,一個獎勵用科技創(chuàng)造藝術的大獎。
一直以來,當AI被用來創(chuàng)造藝術作品時,人類藝術家總是擁有很大的參與權。但是如果一個機器能夠編程創(chuàng)造出完全是自己的藝術作品,只有很少或沒有人類介入如何呢?我們實驗室就開發(fā)了人工智能創(chuàng)造對抗網絡(AICAN),一種可以視為幾乎完全自主的機器藝術家。它從已有的藝術風格和美學特質學習,然后創(chuàng)造它自己的作品。
觀眾真心喜歡AICAN的作品,而且沒法把這些和人類藝術家的作品區(qū)分開來。AICAN的作品在全世界展覽,最近有一副剛剛拍賣出了16 000美元的價格。
AICAN設計原則設計AICAN時,我們遵從了心理學家科林·馬丁代爾(Colin Martindale)提出的一個理論設想,他認為許多藝術家創(chuàng)作時讓作品更吸引人的辦法是,背離已有的大眾已經熟知的藝術形式,主題或風格。他認為,藝術家憑直覺就知道,要搞點新的東西,才更容易吸引觀眾,俘獲注意力。
換句話說,新穎度支配一切。
鏈 接
對創(chuàng)造性進行評估
在之前的工作中,我的同事們和我開發(fā)了一種評估任意畫作的創(chuàng)造性的算法,這種評估算法把作品在藝術史上的創(chuàng)作環(huán)境納入了考量。我們采用了最普遍的定義創(chuàng)造性的方法,即強調作品的原創(chuàng)性,以及它的后續(xù)的影響力。
使用計算機視覺技術,我們建造了一個從15世紀到20世紀的畫作的網絡。通過一系列的數學變換,我們展示了定量分析創(chuàng)造性這個問題可以被歸結為網絡中心度問題算法的一種變體。網絡中心度算法廣泛應用在社會交往分析、流行病學分析以及搜索引擎中。比如說,當你搜索網頁時,谷歌采用這種算法在海量的網頁中找到那些和你的搜索最相關的結果。
一個算法的輸出總是由輸入和參數設定決定的。在我們的算法中,輸入是算法在畫作中所看到的東西:顏色、紋理、視角的采用以及畫作主題。我們的參數設定則是對于創(chuàng)造性的定義:原創(chuàng)性和后續(xù)影響力。
這個算法對創(chuàng)造性做出評估,是嚴格按照對于作品的視覺分析,以及考慮到創(chuàng)作日期這兩部分信息完成的,完全沒有編碼進去任何關于藝術風格或藝術史的信息。
所以當我們用這個算法跑了一組1 700幅畫作的數據集作為輸入時,有好幾個值得提及的發(fā)現。比如說,算法對愛德華·蒙克的《吶喊》作品評分,遠遠高于其他的19世紀晚期的同類作品。又比如說,算法給畢加索的《亞威農少女》的創(chuàng)造性的評分,是在1904到1911年的作品之間最高的。這些見地與藝術史學家們的考慮是一致的。
當然,算法也并不總是和藝術史學家的共識一致。所以我們怎么知道這個算法是有用的呢?我們做了一個測試,做一種“時間機器實驗”來把一個作品的日期前移或者后移,然后重新計算它的創(chuàng)新度分值。
我們發(fā)現,來自于印象主義、后印象主義、表現主義、立體主義運動的畫作,如果前移到1600年左右,會得到很高的創(chuàng)新分數。而作為對比,新古典主義的作品如果前移到1600年左右,則不會獲得很多的創(chuàng)新度分值的提升。這也是可以理解的,因為新古典主義風格是對于文藝復興風格的一次復興。
與此同時,文藝復興和巴洛克風格的畫作如果后移到1900年左右,則會損失創(chuàng)新度分值。
所有這些結果表明,人類不再是創(chuàng)造性的唯一評判者。計算機也可以做相同的工作,甚至做得更加客觀。
在編寫AICAN時,我們利用了一種叫作“創(chuàng)造性對抗網絡”的算法,讓AICAN在兩種對立的力量當中斗爭。一方面,AICAN要學習已有作品的美學特征;另一方面,如果它創(chuàng)作的作品與已有的風格太接近,則會被懲罰。
與此同時,AICAN遵從了馬丁代爾所說的“最小努力”原則。他說太多創(chuàng)新會讓觀眾轉過臉去,不看了。AICAN很小心地綜合了以上幾種原則,然后生成的藝術作品不會特別離經叛道。理想情況下,它會在已有風格的基礎上創(chuàng)造一種新的發(fā)展。
AICAN的潛力我們在這件事情當中,并沒有選擇特定的圖像來“教會”AICAN一種特定的藝術風格或類型,像很多藝術家創(chuàng)作AI藝術作品時做的那樣。相反,我們給算法喂了8萬幅圖像,它們代表了西方藝術過去五個世紀的經典之作。這就像一個藝術生參加了一個藝術史調研的學習課程,而并沒有學習某種特定的藝術風格或類型。
只要點擊一下鼠標,機器就會創(chuàng)造出一個可以打印出來的圖像。這些作品經常會讓我們驚訝于它們的類型之寬廣,構思之深刻,風格之多變。
在我們之前的工作中,我的同事們和我開發(fā)了一種評估一個畫作的創(chuàng)造性的算法,這種評估算法把作品在歷史上的創(chuàng)作環(huán)境納入了考量。AICAN可以用這種評估算法來判斷自己的每一幅畫作的創(chuàng)造性。
AICAN還學習了歷史上藝術家和藝術史學家們給作品起的名字,它甚至還可以給自己創(chuàng)造的作品命名。有一幅作品命名為《放蕩》(Orgy),另一幅命名為《普維爾海灘》(The Beach at Pourville)。
AICAN創(chuàng)造的作品中,抽象的比寫實的多。我們對于機器如何理解藝術史的進化歷程的一項研究,可以對此做出闡釋。因為AICAN是要創(chuàng)作新東西的,所以AICAN傾向于從藝術史中較新的趨勢出發(fā),比如20年代開始流行的抽象藝術,來進行創(chuàng)作。
一幅由機器學習算法創(chuàng)造的畫作,由該算法獨立起名為《圣喬治殺龍》(St. George Killing the Dragon),最近拍賣了16 000美元
還是有人們對于AICAN的作品的反應的問題。為了測試這一點,我們在Art Basel,一個年度新銳當代藝術展上做了一個實驗,把AICAN的作品和人類藝術家創(chuàng)造的作品混合起來給大家看。然后,對于每個作品,問觀眾:這個作品是AI的作品還是人類藝術家的?
我們的結果是,人們其實看不出來兩者的區(qū)別。75%的情況下,人們認為AICAN生成的圖像是人類藝術家的作品。
觀眾們其實做出以上的區(qū)分也并沒有犯什么難。他們真心地喜歡計算機創(chuàng)造的藝術,觀展時他們使用了“很有視覺結構”“有啟發(fā)性”“有交流性”等詞來描述AICAN的作品。
從2017年10月開始,我們在法蘭克福、洛杉磯、紐約城、舊金山等地的藝術展展出AICAN的作品,每次都是展出不同的一組畫作。
在展覽中,我們總是一次又一次地聽到同一個問題:“誰是創(chuàng)造這些畫作的藝術家?”
作為一個科學家,我創(chuàng)造了AICAN算法,但是我對于機器要生成什么畫作,其實沒有掌控權。機器自己選擇了風格、主題、構圖、顏色和紋理。沒錯我是設了一個框架,但是算法在選擇創(chuàng)作元素和創(chuàng)作原則上完全自主。
因此,在所有這些展出中,我都是把每一幅畫作的作者單獨標為AICAN。在2018年12月的邁阿密的Art Basel展上,就展出了8幅作者標為AICAN的作品。
第一幅拿出來拍賣的AICAN創(chuàng)造的畫作是由該算法獨立起名為《圣喬治殺龍》的作品,在2017年11月份于紐約拍賣出了16 000美元(大部分拍賣獲利都用于資助羅格斯大學和法國高等科學研究所的研究)。
在AICAN的藝術創(chuàng)造過程中,還是有一件事情缺失了:算法可能確實能夠創(chuàng)造引人入勝的畫作,但是卻是在一種孤立的、脫離了社會背景的創(chuàng)作空間里面完成的。而與之對比,人類藝術家,總是被人物、地點、政治所激發(fā),然后進行創(chuàng)作,他們創(chuàng)作是為了說出一個故事,是為了對世界提出一種理解,說出一個所以然。
不過,AICAN倒也是可以創(chuàng)造出一些作品,由人類藝術家來發(fā)現它們的社會意義,把它們根植于我們的社會和周遭之中。這個事情我們把它叫作“另類事實:非真實的多重面貌”,這個說法也是我們給AICAN創(chuàng)造的一組非常與時俱進(與當下的事情合拍)的肖像畫所取的名字,這組畫作確實讓我們震驚良久。
當然,即使機器看起來幾乎可以完全創(chuàng)作藝術了,這也不表示它們會取代藝術家們。而是說,藝術家獲得了一種額外的創(chuàng)新工具,可以用來進行創(chuàng)作,甚至可以與機器合作來創(chuàng)作。
我總是把AI創(chuàng)造藝術這件事兒比作攝影學。當19世紀早期攝影技術被發(fā)明的時候,攝影不被看作是一門藝術,因為大家認為攝影中機器做了大部分的工作。時髦的鑒賞家們抵抗這個,但是最終也投降了:一個世紀以后,攝影本身成了一門成熟的藝術類型,在博物館中展出,并拍賣出天文數字的價格。
我毫無疑義地認為:AI創(chuàng)造藝術會延續(xù)與攝影當年相同的發(fā)展軌跡。
鏈 接
機器的藝術史
我們和查爾斯頓學院合作,來研究機器學習算法中的內部表征是如何用以完成對于藝術風格分類的,還試圖發(fā)現這種機器的內部表征和藝術史上用以描述風格的方法論是如何關聯在一起的。
為了獲得這樣的認知,我們采用了藝術史上關于藝術風格模式和風格發(fā)展的一個關鍵范式,也就是海因里希·沃爾夫林的理論。沃爾夫林把對于藝術形式的分析和對于畫作主題、表現的討論分開處理。他著眼于對作品“視覺模式”的分析,來探究“視覺的世界如何以特定的形式在人眼中結晶下來”。沃爾夫林在使用他的方法把文藝復興風格從巴洛克風格區(qū)分開來時,采用了以下五對關鍵視覺原則:線性VS涂繪,平面VS縱深,封閉VS開放,多樣性VS統(tǒng)一性,絕對清晰VS相對清晰。我們選擇沃爾夫林的理論,是因為這個系統(tǒng)強調了畫面形式上的有區(qū)分度的一些特征,使用了比較的邏輯。這就和機器學習的理論很相容。我們使用了接近80 000幅電子版畫作來訓練、驗證、測試我們的模型。
我們這項研究的主要發(fā)現之一是,機器將整個藝術史編碼成一個非常平滑的時序關系。訓練的目的是預測作品的藝術風格,而輸入則是有噪聲的風格標簽數據。訓練集沒有任何信息提到每個作品的創(chuàng)作時間,每個藝術風格的產生年代,哪個藝術家創(chuàng)作了哪個作品,或是風格之間是如何關聯在一起的。盡管沒有提到任何這些,學習出來的表征仍然非常明顯地在時間上平滑,展現了與時間極高的相關性。
還有一個有趣的發(fā)現,說明了我們剛剛看到的閉環(huán)是如何產生的,即學習出來的表征可以用一系列因素來說明。最左邊的兩個變化模式和沃爾夫林提出的線性VS涂繪,平面VS縱深的概念是一致的。這就定量地說明了藝術史上大多數的風格變化。將整個數據向著這兩個最主要的變化模式,即線性VS涂繪,平面VS縱深兩個模式投影之后,就可以發(fā)現數據表征和時間的放射狀關聯性。
將不同的數據表征可視化后,可以發(fā)現有些特定的藝術家總是被機器選為其所在藝術風格的獨特代表,因為他們的數據點是相關藝術類型所在的維度的極值點。
機器學習到的表征也說明了有意思的連接關系。最值得提及的是,如圖中所示,塞尚的作品在印象主義一端,是立體主義及抽象主義另一端之間的橋梁。藝術史學家們認為塞尚是20世紀藝術中轉向立體主義和抽象主義的關鍵人物。所以塞尚的表征數據的這個橋梁,就特別有意思,它已經是定量地展現了數據間的連接關系,而不僅僅是一個形而上的說法而已。我們可以看到在后印象主義分支處,塞尚的作品非常明顯地與后印象主義的其他繪畫區(qū)分開了,更加傾向于上面的表現主義。這個分支繼續(xù)演進,直到連上了早期立體主義的畢加索和布拉克的作品以及康定斯基的抽象主義的作品。
這個研究表明了數據科學和機器學習可以在藝術史研究領域發(fā)揮的潛在價值。算法可以把藝術史的演化變成一門可預測和計量的科學,來發(fā)現藝術史里面一些基礎的構型,而這些構型在一個個體的人類眼里,并不一定是顯而易見的。
資料來源 American Scientist