由于AI音樂的產生是根據(jù)算法模型,讓計算機在大量現(xiàn)成作品中尋求“規(guī)律”,按照這些規(guī)律提取資料中特定的樂章片段,依據(jù)計算得出的概率重新進行排列組合,故AI作曲必然涉及資料庫中大量現(xiàn)成作品的版權問題。
AI如何判斷研究人員提供的曲庫中哪些作品收到版權保護?AI作曲成果是否侵犯學習對象的版權?如AIVA最初以古典音樂為學習對象,它所使用的莫扎特、貝多芬等人的作品歷史久遠,版權時效已過,故沒有此類問題。AIVA研發(fā)人員特意選擇古典音樂為其學習對象,主要就是為了避免版權問題。但像Travis Bott所用的Travis Scott人物及作品相關資料皆需取得授權,而Travis Bott在此基礎上創(chuàng)作的作品算不算對Travis Scott的抄襲?音樂作品抄襲的議題屢見不鮮,相關討論仍然不時出現(xiàn),至今依然沒有統(tǒng)一、明確的判斷標準。從版權問題可見,現(xiàn)在的AI作曲技術依托于算法,受限于曲庫的音樂“規(guī)則”,還無法產生突破既有規(guī)律的作曲創(chuàng)意,此為AI作曲面臨的另一個技術難題。
即便AI作曲技術經過不斷優(yōu)化,最終得以生產出純原創(chuàng)、不涉及任何侵權的作品,此作品又將面臨版權認證的問題。隨著AI創(chuàng)作相關技術的成熟與普及,一些國家開始在法律上明確界定AI作品的版權歸屬。
1988年,英國正式頒布了《版權、設計和專利法案》(Copyright,Designs and Patents Act 1988),其中,對于計算機創(chuàng)作的內容進行了明確的規(guī)定:“為計算機所生成之作品進行必要程序者,視為該計算機生成之作品的作者,其保護期限是自作品完成創(chuàng)作之年的最后一日起50年后屆滿”。規(guī)定AI作品的版權屬于“進行必要程序者”,同時也明確界定了對計算機生成作品“進行必要程序者”,即包括程序員、使用者,也可能是AI系統(tǒng)或設備的投資者。
2017年,世界知識產權組織(WIPO)雜志提道:如果一部作品的創(chuàng)作過程中“人類的參與有限,或根本沒有人類參與”,著作權法可以有兩種潛在的生效方式—著作權法可以“拒絕”對計算機生成的作品進行版權保護,也可以將此類作品的作者歸屬于程序的創(chuàng)建者?,F(xiàn)在國內解決此類問題也基本沿襲這個思路。
2018年,上海一家公司未經過授權,將騰訊開發(fā)的自動化編寫程序Dream writer生成的財務報告復制到該公司網(wǎng)站。深圳市南山區(qū)法院裁定,該公司因侵犯騰訊的版權而需承擔民事責任,向騰訊公司賠償1 500元人民幣。目前,我國《中華人民共和國著作權法》尚未明確界定AI作品的版權歸屬,這一裁定可能是AI創(chuàng)作領域的重要里程碑。
《中華人民共和國著作權法》規(guī)定:“著作權是著作權法賦予民事主體對作品及相關客體所享有的權利?!逼渲校袷轮黧w指公民、法人或非法人組織?!吨腥A人民共和國著作權法》保護的對象是作為民事主體的獨創(chuàng)性思想表達,并非民事主體的AI無法單獨享有著作權,但只要在作者名錄加上人類作曲家或研發(fā)者的名字就能解決此問題。AI雖無法成為受法律保護的主體,但對其作品版權的保護也開始受到法律認可。
AI作曲技術的日漸成熟,在音樂行業(yè)掀起一股不小的浪潮。盡管AI已經實現(xiàn)通過讀取、記憶大量樂曲獲取規(guī)律,計算音符節(jié)奏的出現(xiàn)概率并排列組合來“創(chuàng)造”音樂。但音樂的核心并非音樂本身而是“人”,音樂源于人類情感流動?!抖Y記·樂記》對音樂起源的解釋非常貼切:“凡音之起,由人心生也。人心之動,物使之然也。感于物而動,故形于聲;聲相應,故生變;變成方,謂之音?!弊髑液脱葑嗾咄高^旋律、節(jié)奏表達的情緒與觀眾聆聽音樂引起的共鳴,這種借由音符實現(xiàn)的,跨越時間、空間與種族的情感交流才是音樂存在的意義,也是莫扎特和貝多芬等音樂家流芳百世的根本原因。
從某種角度來說,由于音樂是人類抒發(fā)心情的一種方式,讓沒有感情的AI作曲或許可以說是一個偽命題。AI不具備情感,不了解音符、節(jié)奏等音樂表層結構和基于情緒表達的音樂深層邏輯之對應關系,其制作的音樂只是基于概率所排列的音符。無論算法作曲技術發(fā)展得多么成熟,音樂作為人類情感交流的藝術形式之一,AI所作的樂曲必然無法完全取代人類音樂作品在社會中的功能和角色,AI也無法替代行業(yè)內頂尖的音樂創(chuàng)作者及表演者。不僅是音樂,在美術和文學等藝術創(chuàng)作中皆是如此。
現(xiàn)在較為成熟的A I音樂公司除了G oogle、Sony、AIVA外,還有英國的AI Musical、德國的Melodrive、美國的Humtap、Popgun、Snafu Records及諸多硅谷大亨聯(lián)合建立的AI非營利組織OpenAI、字節(jié)跳動旗下的Jukedeck等。百度、騰訊、阿里巴巴和網(wǎng)易云等音樂平臺都在不同程度上對AI音樂有布局。即便AI暫時無法掌握樂曲中細膩的情感變化及流動,但基于計算機具備對大量作品進行數(shù)據(jù)處理、運算分析及排列組合的強大能力,使得AI編曲效率遠遠高于人類。在一些注重成本且審美要求不高的應用場景中,AI作曲占有明顯的優(yōu)勢。因此,一批專業(yè)度不足的音樂從業(yè)者可能面臨被淘汰的命運。
目前,AI作曲技術逐漸往商業(yè)應用與輔助創(chuàng)作的方向發(fā)展,筆者看到,其應用場景主要為視頻配樂、游戲配樂、電視預告片、商業(yè)廣告、發(fā)布會和電影等方面。
以非藝術場景的商用音樂為主要市場,打破了固有音樂市場關于成本及創(chuàng)作時間的限制。如上文提及的AIVA已開始為電影、視頻、電視劇制作音樂。微軟(亞洲)互聯(lián)網(wǎng)工程院開發(fā)的小冰樂隊能自動生成旋律和編曲框架,已為“2020世界AI大會”創(chuàng)作了主題曲《智聯(lián)家園》。由西電灃東AI與類腦感知產業(yè)技術研究院研發(fā)的MusesAI作曲系統(tǒng),基于GAN和LSTM的智能譜曲算法和視頻多元素提取算法,實現(xiàn)了視頻自助譜曲、智能仿曲和譜曲輔助智能等功能。通過對視頻進行內容物體識別、色彩分析和畫面節(jié)奏分析,生成合適的背景音樂;也可透過用戶輸入的仿曲或關鍵詞、語句啟發(fā)音符,產生類似風格的音樂。另有一款專門制作視頻配樂的AI Ecrett Music,通過識別不同的視頻主題、時間及情緒,對視頻配樂進行個性化編輯,為視頻制作者持續(xù)產生不同的音律。為創(chuàng)意要求較低、對價格較敏感的部分商業(yè)音樂創(chuàng)作提供了全新解決方案。
除此之外,AI作曲技術對音樂愛好者進行創(chuàng)作也起到了輔助作用。
2019年上線的“哼趣”APP就是一款基于AI的音樂創(chuàng)作工具,只需簡單哼唱,AI就會根據(jù)哼唱內容、音調、旋律生成一段完整的、悅耳的曲子,此外,還可對生成的曲子進行個性化編輯,一鍵選擇變換不同樂器、風格與時長。“哼趣”的核心原理是通過大量的樂曲訓練來形成一套完善的LSTM神經網(wǎng)絡的方式。同時,算法團隊解決了MP3與MIDI格式的相互轉換和降噪問題,將人聲與機器可識別的MIDI語言進行轉化,再利用帶有音頻判定的神經網(wǎng)絡進行樂曲生成。使用這類軟件或APP,不僅使得音樂創(chuàng)作更加便利快捷,也大大降低了普羅大眾創(chuàng)作音樂的門檻。對專業(yè)音樂人而言,比起原先需要通過MIDI鍵盤輸入旋律的創(chuàng)作形式,在很大程度上提升了工作效率,減少重復勞動,并降低了與制作方的溝通成本。AI作曲隨機生成的旋律也能在創(chuàng)作陷入瓶頸時,為使用者提供靈感,編曲工具的發(fā)展將使專業(yè)作曲家的創(chuàng)造力得到進一步釋放。