文字_林新遠(yuǎn)
隨著科技的不斷發(fā)展,計(jì)算機(jī)與音樂(lè)的結(jié)合日益深入。當(dāng)下,我們的生活中不斷充斥著一個(gè)名詞“人工智能”(Artificial Intelligence,簡(jiǎn)稱(chēng)AI),它深刻影響著我們的工作與生活,現(xiàn)在在醫(yī)療、購(gòu)物領(lǐng)域幾乎隨處可見(jiàn),在音樂(lè)創(chuàng)作方面亦然。如今我們也能聽(tīng)到許多由AI“創(chuàng)造”的音樂(lè)作品。其實(shí),計(jì)算機(jī)音樂(lè)、人工智能音樂(lè)早已不是一個(gè)新名詞了,可追溯至二十世紀(jì)五十年代,《伊利亞克組曲》()就是一部由計(jì)算機(jī)創(chuàng)作的音樂(lè)作品。提及計(jì)算機(jī)對(duì)音樂(lè)創(chuàng)作的影響,我們不可繞開(kāi)的一個(gè)概念便是“算法作曲”。
算法作曲,又稱(chēng)“自動(dòng)作曲”,是指創(chuàng)作者使用某種形式化過(guò)程(如編程)來(lái)生成音樂(lè)。由于創(chuàng)作過(guò)程的不同,算法作曲可被分為計(jì)算機(jī)輔助創(chuàng)作、計(jì)算機(jī)獨(dú)立完成兩種方式,后者則是AI作曲的雛形。為何將計(jì)算機(jī)獨(dú)立完成音樂(lè)創(chuàng)作的方式稱(chēng)為AI作曲的雛形呢?這是由于當(dāng)下我們對(duì)AI作曲的認(rèn)識(shí)不僅停留在“獨(dú)立”完成上,還寄希望于AI能擁有人一般的“大腦”與“情感”。雖然計(jì)算機(jī)輔助創(chuàng)作與AI作曲之間有著密不可分的關(guān)系,但兩者又有所區(qū)別,AI作曲更像是計(jì)算機(jī)輔助作曲遺傳變異的結(jié)果。這類(lèi)創(chuàng)作形式,計(jì)算機(jī)的自動(dòng)化程度較低,大多需要人為干涉操作。通常情況下,計(jì)算機(jī)輔助創(chuàng)作有多種運(yùn)用方式,如對(duì)聲音進(jìn)行處理、利用一些數(shù)據(jù)來(lái)設(shè)計(jì)算法、使其生成音高與節(jié)奏等。
在對(duì)聲音進(jìn)行處理時(shí),計(jì)算機(jī)需要參與的內(nèi)容較為簡(jiǎn)單,包括對(duì)聲音素材進(jìn)行變形,改變音高、速度、切片等。
在使用實(shí)時(shí)方式時(shí),我們可以通過(guò)計(jì)算機(jī)編程,借助Kyma、MAX/MSP等輔助算法作曲系統(tǒng)(CAAC)來(lái)實(shí)現(xiàn)。例如,作曲家可以提前將需要使用的數(shù)字信號(hào)處理器以插件的形式搭載在輔助算法作曲系統(tǒng)上,或者直接使用輔助算法作曲系統(tǒng)在預(yù)先設(shè)計(jì)好算法后,搭建起所需要的數(shù)字信號(hào)處理器模塊。當(dāng)音樂(lè)演奏進(jìn)行到指定位置時(shí),作曲家可通過(guò)人為控制數(shù)字信號(hào)處理器模塊或者動(dòng)態(tài)變化音量,來(lái)實(shí)時(shí)觸發(fā)與關(guān)閉數(shù)字信號(hào)處理器模塊。
無(wú)論選擇以上哪種形式,計(jì)算機(jī)此時(shí)需要做的工作就是對(duì)聲音進(jìn)行改變,通過(guò)算法創(chuàng)造“新聲音”的方式,正是計(jì)算機(jī)協(xié)助作曲的魅力所在。
關(guān)于計(jì)算機(jī)輔助作曲的早期實(shí)驗(yàn),大多基于當(dāng)代音樂(lè)強(qiáng)調(diào)“不確定”性的創(chuàng)作觀(guān)念。作曲家開(kāi)始使用計(jì)算機(jī)進(jìn)行輔助創(chuàng)作,就等于擁有了一個(gè)很快做出隨機(jī)決定的工具?!兑晾麃喛私M曲》的第四樂(lè)章主要通過(guò)運(yùn)用馬爾科夫鏈和表格進(jìn)行創(chuàng)作,其使用了概率表來(lái)控制四把提琴聲部中的間隔分布,固定音型被設(shè)置為八分音符,計(jì)算機(jī)只用來(lái)決定八分音符的音高。整個(gè)樂(lè)章隨旋律間隔分布的概率表每秒鐘改變一次,第一個(gè)表將重復(fù)音高的概率設(shè)置為100%,將任何其他旋律間隔設(shè)置為0%。如果計(jì)算機(jī)將相同的音高分配給兩個(gè)連續(xù)的八分音符,它們會(huì)自動(dòng)含糊不清,構(gòu)成一個(gè)較長(zhǎng)的音符值。因此,樂(lè)曲開(kāi)篇的前兩小節(jié)正是如此,在持續(xù)性的音高中展開(kāi)全曲。
利用算法生成音高節(jié)奏的方式,并不局限于傳統(tǒng)作曲觀(guān)念中的“音高”與“節(jié)奏”等維度,同樣作用于音頻素材與MIDI素材當(dāng)中,我們以Somax-2為例。
Somax是一個(gè)可以在MAX/MSP系統(tǒng)中使用的實(shí)時(shí)人機(jī)即興創(chuàng)作的模塊。該模塊可以通過(guò)在一個(gè)音頻或是MIDI的素材庫(kù)中,采用重組其頻率、切片、循環(huán)的方式實(shí)時(shí)生成新的即興音樂(lè)片段,同時(shí)也可以接收和轉(zhuǎn)化音頻、MIDI信號(hào),并提取其中的切片內(nèi)容。
此外,“自適應(yīng)模型”為多層樹(shù)狀結(jié)構(gòu),每層可實(shí)時(shí)捕獲特定參數(shù),并且每層可進(jìn)行參數(shù)的匹配,從而進(jìn)行合并和縮放。它基于OMax(另一套人機(jī)即興模塊)之上,添加了反應(yīng)性這一概念,使得系統(tǒng)不僅能從輸入端接收信號(hào),還可以對(duì)音樂(lè)家的演奏進(jìn)行實(shí)時(shí)的反饋,從而營(yíng)造一種共同即興的效果。
無(wú)論是《伊利亞克組曲》還是Somax模塊,他們都需要大量的人為參與。前者需要對(duì)參數(shù)不斷進(jìn)行設(shè)定與修改,從而使馬爾可夫決策過(guò)程得到一個(gè)較好的反饋結(jié)果;后者則需要演奏員對(duì)其音頻或是MIDI信號(hào)輸入,使其擁有更多可供處理的信息。
因此,計(jì)算機(jī)輔助作曲的手段,或者說(shuō)傳統(tǒng)意義上的算法作曲,并不能與當(dāng)下AI作曲相提并論,AI作曲可以被視作算法作曲的一種進(jìn)化與蛻變。
推動(dòng)機(jī)械化高效生產(chǎn)。采用綜合技術(shù)和現(xiàn)代設(shè)備相結(jié)合的方式,積極采購(gòu)竹材、竹筍等采伐(掘)專(zhuān)業(yè)設(shè)備,對(duì)環(huán)境友好的竹產(chǎn)品、竹制加工品等的相關(guān)生產(chǎn)流程給予經(jīng)濟(jì)補(bǔ)助。
大量的音樂(lè)理論家曾深度剖析莫扎特、貝多芬、肖邦等知名作曲家的音樂(lè)作品,對(duì)其中的旋律、和聲布局、音樂(lè)結(jié)構(gòu)、配器方式等一系列技法問(wèn)題進(jìn)行深入的研究,并提煉出系統(tǒng)化的分析方法。算法作曲正是將不斷變化發(fā)展的音樂(lè)創(chuàng)作技法,轉(zhuǎn)變?yōu)槿斯ぶ悄苤械膮?shù),即對(duì)傳統(tǒng)作曲技術(shù)手段的數(shù)字化運(yùn)用。當(dāng)下,人工智能在各個(gè)領(lǐng)域逐漸成為熱門(mén)話(huà)題,提及人工智能作曲,我們不得不提及機(jī)器學(xué)習(xí)。
機(jī)器學(xué)習(xí)實(shí)際上就是科學(xué)家希望機(jī)器能夠像人類(lèi)大腦一樣進(jìn)行思考。我們提供給計(jì)算機(jī)一個(gè)數(shù)據(jù)庫(kù),讓它對(duì)其進(jìn)行學(xué)習(xí),然后通過(guò)對(duì)數(shù)據(jù)的分析處理形成新的結(jié)果預(yù)測(cè)與預(yù)判。將機(jī)器學(xué)習(xí)映射至作曲技法上,我們可以得出“監(jiān)督學(xué)習(xí)”“無(wú)監(jiān)督學(xué)習(xí)”“半監(jiān)督學(xué)習(xí)”“強(qiáng)化學(xué)習(xí)”等結(jié)果。
所謂“監(jiān)督學(xué)習(xí)”,就是讓機(jī)器在有“答案”的條件下提取數(shù)據(jù),并得到一個(gè)函數(shù),根據(jù)這個(gè)函數(shù)去進(jìn)行結(jié)果預(yù)測(cè)。例如,我們可以將其運(yùn)用于和聲習(xí)題的批改上,在古典和聲體系中,因受限于具體時(shí)期的音樂(lè)風(fēng)格,故而產(chǎn)生了許多條條框框的“規(guī)則”。在“監(jiān)督學(xué)習(xí)”的過(guò)程中,我們可以將這一系列不符合風(fēng)格時(shí)期的和聲進(jìn)行,提前在機(jī)器中設(shè)定為錯(cuò)誤的和聲進(jìn)行方式,機(jī)器便能夠以此為依據(jù),參照這一標(biāo)準(zhǔn),逐步完成和聲習(xí)題的批改。
“無(wú)監(jiān)督學(xué)習(xí)”則是對(duì)數(shù)據(jù)庫(kù)進(jìn)行分析,但無(wú)需對(duì)其中的某項(xiàng)結(jié)果負(fù)責(zé),僅分析潛在的規(guī)律。例如,我們可以將其運(yùn)用在分析莫扎特作品的橫向旋律的音高走向、縱向和聲的音高構(gòu)成,以及音樂(lè)的節(jié)奏、速度、力度等方面,機(jī)器可以根據(jù)其通過(guò)分析所得出的結(jié)果,有效建立一個(gè)模仿莫扎特風(fēng)格的寫(xiě)作模型。當(dāng)然,“無(wú)監(jiān)督學(xué)習(xí)”并不單單局限于對(duì)單一的某個(gè)特征數(shù)據(jù)進(jìn)行分析,我們希望能夠通過(guò)一系列的數(shù)據(jù)分析幫助我們建立其復(fù)雜的分析應(yīng)用系統(tǒng)。
實(shí)際上,我們還可以將“監(jiān)督學(xué)習(xí)”與“無(wú)監(jiān)督學(xué)習(xí)”兩種學(xué)習(xí)方式結(jié)合到一起,一部分?jǐn)?shù)據(jù)能產(chǎn)生“答案”,另一部分則能為我們總結(jié)“規(guī)律”。例如,我們可以運(yùn)用“無(wú)監(jiān)督學(xué)習(xí)”分析莫扎特作品中的一系列數(shù)據(jù),然后將“規(guī)律”建立為相應(yīng)的模型,運(yùn)用“監(jiān)督學(xué)習(xí)”的手段對(duì)其進(jìn)行訓(xùn)練和預(yù)測(cè)。這樣系統(tǒng)的數(shù)據(jù)分析方式,更有利于我們后期建立多維度、綜合性的分析應(yīng)用模型。
“強(qiáng)化學(xué)習(xí)”則是根據(jù)周?chē)h(huán)境的反饋?zhàn)龀鲎兓?。例如,我們?cè)诮⒛7履仫L(fēng)格寫(xiě)作的算法模型時(shí),該模型會(huì)自主生成一系列結(jié)果,我們?cè)谟?xùn)練的過(guò)程中對(duì)結(jié)果進(jìn)行干預(yù),這一過(guò)程猶如我們教小朋友區(qū)分“對(duì)”與“錯(cuò)”一樣。在我們對(duì)結(jié)果進(jìn)行干預(yù)之后,算法模型就會(huì)收到反饋,通常我們會(huì)使用獎(jiǎng)懲機(jī)制來(lái)進(jìn)行反饋。當(dāng)算法收到反饋后,它就會(huì)相應(yīng)地改進(jìn)自己的行為模式,以此不斷地反復(fù)循環(huán)。這樣,我們的算法模型就可以通過(guò)一次又一次循環(huán),強(qiáng)化算法模型的“智能”性。這個(gè)過(guò)程已經(jīng)非常接近人類(lèi)的真實(shí)生活狀態(tài)了:不斷優(yōu)化結(jié)果,改正自己的錯(cuò)誤行為。
不難發(fā)現(xiàn),上述四種機(jī)器學(xué)習(xí)的方式都是基于一種“見(jiàn)招拆招”的模式之下,只能適用于較為單一的運(yùn)用,很難用于處理更復(fù)雜的情況。人工智能作為一門(mén)跨學(xué)科的領(lǐng)域,基于腦科學(xué)的發(fā)展,通過(guò)人類(lèi)對(duì)大腦已知的工作原理,使得機(jī)器模擬出人腦的結(jié)構(gòu)——人工神經(jīng)網(wǎng)絡(luò)。(見(jiàn)下頁(yè)示意圖)
對(duì)上述模型的訓(xùn)練,需要巨大的資料庫(kù)。先以正向傳播的方式輸入該模型與現(xiàn)有的“答案”,隨后進(jìn)行比較,算出兩者之間的差值,接下來(lái)再通過(guò)反向傳播的方式,以減少差值為目的,調(diào)整每一個(gè)感應(yīng)器。從理論上來(lái)講,只要學(xué)習(xí)的資料足夠龐大,在計(jì)算機(jī)計(jì)算能力足夠的情況下,該模型可以通過(guò)不斷反復(fù)學(xué)習(xí),成為一個(gè)系統(tǒng)性的模型。
示意圖
通過(guò)深度學(xué)習(xí)的方式,我們可以看到當(dāng)下已經(jīng)有許多人工智能作曲的產(chǎn)物。例如,索尼計(jì)算機(jī)科學(xué)實(shí)驗(yàn)室的研究人員蓋坦·哈杰里斯(Gaetan Hadjeres)與弗朗索瓦·帕切特(Francois Pachet)開(kāi)發(fā)出了一種名為“深度巴赫”(Deep Bach)的神經(jīng)網(wǎng)絡(luò),它可以學(xué)習(xí)如何創(chuàng)作巴赫風(fēng)格的復(fù)調(diào)圣歌。研究員使該設(shè)備學(xué)習(xí)了巴赫的三百五十二首眾贊歌,進(jìn)而用它創(chuàng)作出了近似巴赫眾贊歌風(fēng)格的音樂(lè);在人工智能的幫助下,來(lái)自洛杉磯的作曲家盧卡斯·康托爾(Lucas Cantor)用手機(jī)續(xù)寫(xiě)了舒伯特的《未完成交響曲》;人工智能“作曲家”AIVA通過(guò)機(jī)器學(xué)習(xí)的方式創(chuàng)作了大量音樂(lè),其范圍涉及流行歌曲、古典音樂(lè)、影視配樂(lè);清華大學(xué)生物醫(yī)學(xué)工程專(zhuān)業(yè)博士生,運(yùn)用人工智能寫(xiě)歌,參加選秀節(jié)目。上述均是AI作曲的優(yōu)秀成果。
人工智能的發(fā)展,使得計(jì)算機(jī)不再是輔助作曲的形式,而是逐步在向擁有“人”一般“獨(dú)立思考”能力的方向發(fā)展。
盡管人工智能的發(fā)展十分迅速,但當(dāng)下在AI作曲方面仍然存在著許多問(wèn)題,有待我們解決。只有解決好這些問(wèn)題,我們的AI作曲技術(shù)才能進(jìn)一步提高。
有不少愛(ài)樂(lè)者提出,作曲家通過(guò)人工智能進(jìn)行作曲是否會(huì)失去音樂(lè)創(chuàng)作的初衷呢?當(dāng)下人工智能的智能化程度相對(duì)而言還是比較低的,并沒(méi)有完全達(dá)到人們對(duì)它的預(yù)期。我們對(duì)一部音樂(lè)作品的期待值,并不單單取決于音樂(lè)本身,而有相當(dāng)一部分是基于情感的宣泄。目前的AI作曲更傾向于是一個(gè)完全沒(méi)有感情的“人”,它通過(guò)對(duì)成千上萬(wàn)首歌曲、音樂(lè)進(jìn)行技術(shù)分析,從而機(jī)械式地將一個(gè)一個(gè)音符計(jì)算出來(lái)。AI如果無(wú)法真正意義上擁有“人”一般的感知能力,即使對(duì)成千上萬(wàn)部經(jīng)典作品進(jìn)行學(xué)習(xí),也無(wú)法創(chuàng)作出“優(yōu)秀”的作品來(lái)。
音樂(lè)學(xué)界的專(zhuān)家、學(xué)者也曾提出“AI作曲是否存在同質(zhì)性”的質(zhì)疑,由于AI作曲是基于大量的樂(lè)曲學(xué)習(xí),通過(guò)算法邏輯推斷生成的結(jié)果,很容易與所提供的素材庫(kù)有雷同。我們知道,人類(lèi)作曲家是很謹(jǐn)慎地使用音符的,更會(huì)注意避免“雷同”問(wèn)題的發(fā)生。因此,AI創(chuàng)作的音樂(lè)同質(zhì)性的特征,極容易產(chǎn)生“抄襲”的現(xiàn)象。
AI作曲在很大程度上是基于對(duì)過(guò)往作曲手段的深度“學(xué)習(xí)”,在音樂(lè)風(fēng)格上也會(huì)存在著一定的滯后性。目前的AI作曲仍處于一個(gè)通過(guò)規(guī)律選擇邏輯推斷的階段,尚未形成自主創(chuàng)新力。雖然有一定量的學(xué)習(xí)內(nèi)容,但是卻沒(méi)有學(xué)習(xí)后擁有的舉一反三的能力。正如普通畫(huà)師不可能靠著一輩子臨摹大師的作品成為畫(huà)壇巨匠一樣,AI真正缺乏的是自主的創(chuàng)新力。
音樂(lè)創(chuàng)作是一種腦力負(fù)荷極大的活動(dòng),作曲家必須具有個(gè)性化的音樂(lè)語(yǔ)言、多樣化的風(fēng)格類(lèi)型以及飽含哲思性的人文理念,創(chuàng)作的難度不斷加深。不得不說(shuō),人工智能的發(fā)展能夠更好地服務(wù)于作曲家的音樂(lè)創(chuàng)作活動(dòng)。AI已經(jīng)從提煉與運(yùn)用過(guò)往的作曲手法,逐步發(fā)展為通過(guò)分析數(shù)據(jù),以期能夠創(chuàng)作出具有“情感溫度”的音樂(lè)作品。至少?gòu)哪壳皝?lái)說(shuō),AI作曲還是能夠生成一些優(yōu)秀音樂(lè)作品的,例如流行歌曲、氛圍音樂(lè)等。未來(lái),AI作曲將不僅局限于音樂(lè)創(chuàng)作方面,還會(huì)延伸至聲音設(shè)計(jì)領(lǐng)域。
AI作曲可以有效地幫助我們省掉許多機(jī)械化、重復(fù)性高的工作。例如,我們可以通過(guò)人工智能加強(qiáng)總結(jié)我國(guó)民族化創(chuàng)作道路上的那些成功作品的特征,這些“規(guī)律”可以幫助當(dāng)代作曲家實(shí)驗(yàn)更多新的音響與創(chuàng)作思路,關(guān)注如何通過(guò)算法增加不確定性,幫助他們?cè)谖磥?lái)創(chuàng)作出更具時(shí)代意義的作品。AI作曲的發(fā)展之路,將不再局限于生成一些有規(guī)律的音高組織片段,而是擴(kuò)大對(duì)音樂(lè)要素的數(shù)據(jù)分析,在不斷總結(jié)原有音樂(lè)“規(guī)律”的基礎(chǔ)上,涵蓋更多日常生活中的聲音,甚至未來(lái)一系列存在于我們生活中的聲音,都會(huì)成為音樂(lè)的一部分。AI作曲的輻射面將越來(lái)越寬,這將促進(jìn)作曲技術(shù)手段的發(fā)展,促進(jìn)音樂(lè)分析理論研究。
此外,AI 作曲對(duì)聲音的設(shè)計(jì)也可以緩解人類(lèi)的精神壓力,尤其是生活在城市中的高負(fù)荷工作人群。我們知道,當(dāng)精神高度集中時(shí),為了排除自身其他想法對(duì)該工作的影響,無(wú)聲的環(huán)境并不是最佳的選擇,甚至身處完全靜音化的世界會(huì)使得大家的情緒過(guò)于緊張。未來(lái)AI的聲音設(shè)計(jì)系統(tǒng),可以通過(guò)釋放具有療愈功能的新聲音,適度地刺激人們緊張的神經(jīng),舒緩情緒,提升工作的效率。目前,日本東京藝術(shù)大學(xué)人工智能實(shí)驗(yàn)室致力于研發(fā)一項(xiàng)聲音/音樂(lè)自動(dòng)生成系統(tǒng)“SoundDroid”,該系統(tǒng)把提升工作效率作為目標(biāo)。如果該系統(tǒng)能夠成熟運(yùn)用,其原理同樣可以運(yùn)用于人們生活的其他方面,例如在放松、睡眠、情緒誘導(dǎo)、背景音樂(lè)(BGM)、音樂(lè)治療、餐廳和酒店等氣氛營(yíng)造中。
人腦的認(rèn)知活動(dòng)從未停止,同樣對(duì)AI的理解也會(huì)隨著人類(lèi)各學(xué)科的發(fā)展與認(rèn)識(shí)得到提升。隨著計(jì)算機(jī)音樂(lè)的發(fā)展,從計(jì)算機(jī)輔助作曲到人工智能作曲,再到未來(lái)的“強(qiáng)”人工智能,將會(huì)是一個(gè)必然的發(fā)展趨勢(shì)。