趙興元,王晶瑩
(1.天水師范學(xué)院音樂(lè)舞蹈學(xué)院,甘肅 天水 741000;2.北京師范大學(xué)教育學(xué)部,北京 100873)
隨著人工智能的基礎(chǔ)——大數(shù)據(jù)、算法、算力——“三位一體”地整體性發(fā)展,算法研究獲得突飛猛進(jìn)的進(jìn)展,并且在各個(gè)領(lǐng)域都展現(xiàn)了舉世矚目的成就[1]。其中,算法對(duì)音樂(lè)特征的研究也更加廣泛和深入,我國(guó)也越來(lái)越重視音樂(lè)領(lǐng)域算法研究對(duì)智能音樂(lè)學(xué)的影響。自1992年王緝志以探討“線(xiàn)性算法合成音色”拉開(kāi)了國(guó)內(nèi)音樂(lè)領(lǐng)域算法研究的帷幕以來(lái)[2],時(shí)至今日,研究者們已深入該領(lǐng)域,在算法作曲[3-5]、音樂(lè)特征識(shí)別[6][7]、信息檢索[8][9]、音樂(lè)風(fēng)格分析[10][11]等方面形成大量的研究成果。本文將利用CiteSpace軟件分析技術(shù),對(duì)相關(guān)文獻(xiàn)進(jìn)行計(jì)量研究,希望為同行進(jìn)一步開(kāi)展音樂(lè)領(lǐng)域算法研究提供鏡鑒。
在中國(guó)知網(wǎng)(CNKI)中,對(duì)有關(guān)該領(lǐng)域的核心期刊、CSSCI文獻(xiàn)分別進(jìn)行兩次檢索。第一次檢索式為:SU=(‘音樂(lè)’+‘算法’),獲得文獻(xiàn)結(jié)果383條;二次檢索式為:SU=(‘音樂(lè)’+‘人工智能’),獲得文獻(xiàn)結(jié)果100條,共獲得483條檢索條目。為了提高樣本數(shù)據(jù)分析準(zhǔn)確率,在CNKI檢索結(jié)果界面通過(guò)閱讀題目、內(nèi)容摘要等方式,剔除與研究主題無(wú)關(guān)的征稿通知、新聞報(bào)道等相關(guān)度低的非研究類(lèi)文獻(xiàn),并將兩次檢索結(jié)果導(dǎo)入Endnote,進(jìn)行刪重,最后將Endnote中篩選的文獻(xiàn)與CNKI檢索結(jié)果比對(duì)整合,檢查樣本數(shù)據(jù)的完整性與準(zhǔn)確度。最終確定的樣本數(shù)據(jù)為393篇,儲(chǔ)存題錄信息的同時(shí)獲取全文內(nèi)容。
本文采用基礎(chǔ)統(tǒng)計(jì)分析、機(jī)構(gòu)共現(xiàn)分析、關(guān)鍵詞聚類(lèi)分析等量化方法,結(jié)合文獻(xiàn)樣本歸納分析,試圖梳理國(guó)內(nèi)音樂(lè)領(lǐng)域的算法研究現(xiàn)狀與熱點(diǎn),預(yù)測(cè)未來(lái)發(fā)展趨勢(shì)。研究工具是文獻(xiàn)計(jì)量分析專(zhuān)業(yè)工具CiteSpace。
對(duì)特定領(lǐng)域特定學(xué)科文獻(xiàn)年度分布情況分析能在一定程度上反映出該領(lǐng)域研究的趨勢(shì)和變化[12]。由圖1可以看出,近30年來(lái)國(guó)內(nèi)音樂(lè)領(lǐng)域算法研究有393篇文章,年均發(fā)文量14.04篇。1997年的音樂(lè)文獻(xiàn)中首次出現(xiàn)“算法”這一概念[13],此后相關(guān)學(xué)者一直關(guān)注這一新興領(lǐng)域,但研究文獻(xiàn)數(shù)量相對(duì)較少。直到2018年陳根方在其著作《智能音樂(lè)學(xué)與中國(guó)音樂(lè)數(shù)字媒體論》中將人工智能引入音樂(lè)學(xué)領(lǐng)域,并提出了智能音樂(lè)學(xué)的概念,才由此引發(fā)了我國(guó)的大討論。相關(guān)研究激增,文獻(xiàn)數(shù)量不斷涌現(xiàn),該領(lǐng)域也正成為一個(gè)迅速發(fā)展的熱點(diǎn)領(lǐng)域。
1.機(jī)構(gòu)分布特征
通過(guò)1992-2020年的樣本數(shù)據(jù),使用CiteSpace軟件生成相關(guān)機(jī)構(gòu)分布表1。在發(fā)文機(jī)構(gòu)統(tǒng)計(jì)過(guò)程中,以二級(jí)單位名稱(chēng)為標(biāo)準(zhǔn)進(jìn)行統(tǒng)計(jì),同一機(jī)構(gòu)的二級(jí)單位不進(jìn)行合并。經(jīng)統(tǒng)計(jì),得到二級(jí)單位發(fā)文機(jī)構(gòu)344個(gè),“發(fā)文量≥4”的機(jī)構(gòu)有14個(gè)(見(jiàn)表1)。從前40名機(jī)構(gòu)論文數(shù)量排名看,92.5%的論文來(lái)自北京師范大學(xué)信息科學(xué)與技術(shù)學(xué)院、復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院、華東理工大學(xué)信息科學(xué)與工程學(xué)院、中國(guó)人民大學(xué)信息學(xué)院等高校,音樂(lè)專(zhuān)業(yè)類(lèi)院校(上海音樂(lè)學(xué)院音樂(lè)工程系、武漢音樂(lè)學(xué)院作曲系、中央音樂(lè)學(xué)院)僅占7.5%。這說(shuō)明國(guó)內(nèi)音樂(lè)領(lǐng)域的算法研究發(fā)文方面集中于中國(guó)高等院校理工科院系。其中北京師范大學(xué)信息科學(xué)與技術(shù)學(xué)院對(duì)音樂(lè)特征的算法研究發(fā)文量最多,共有8篇,其研究對(duì)整個(gè)領(lǐng)域的發(fā)展起著重要的推動(dòng)作用;其次是復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,發(fā)文7篇。
表1 相關(guān)研究機(jī)構(gòu)發(fā)文量排名(≥4)
2.機(jī)構(gòu)合作關(guān)系分析
借助機(jī)構(gòu)間合作關(guān)系頻次原始數(shù)據(jù),利用CiteSpace軟件生成機(jī)構(gòu)合作關(guān)系可視化圖像,如圖2??梢钥闯?,高等院校信息科學(xué)院、計(jì)算機(jī)科學(xué)學(xué)院是國(guó)內(nèi)音樂(lè)領(lǐng)域的算法研究的主要力量。圖2中的線(xiàn)條表示研究機(jī)構(gòu)是否與外界有合作關(guān)系,連接線(xiàn)條的粗細(xì)和密集程度表示合作關(guān)系的強(qiáng)弱??梢钥闯?,除北京師范大學(xué)與中國(guó)人民大學(xué)、廈門(mén)大學(xué)合作關(guān)系密切外,其它機(jī)構(gòu)之間合作頻次較低,各高??蒲袡C(jī)構(gòu)之間的合作網(wǎng)絡(luò)尚未完全建立,連接強(qiáng)度和密集程度都呈現(xiàn)出弱化的態(tài)勢(shì)。遺憾的是,經(jīng)過(guò)調(diào)查分析,我國(guó)綜合高校與專(zhuān)業(yè)音樂(lè)院校之間缺乏合作,不利于跨學(xué)科的研究發(fā)展。
圖2 國(guó)內(nèi)音樂(lè)領(lǐng)域算法研究機(jī)構(gòu)網(wǎng)絡(luò)圖譜
3.相關(guān)發(fā)文作者與合作網(wǎng)絡(luò)分析
(1)發(fā)文作者分析
經(jīng)統(tǒng)計(jì)分析發(fā)現(xiàn),有458位作者共同承擔(dān)了相關(guān)的音樂(lè)特征的算法研究,排名靠前的作者分布見(jiàn)圖3。
圖3 國(guó)內(nèi)音樂(lè)領(lǐng)域算法研究作者網(wǎng)絡(luò)圖譜
依據(jù)普賴(lài)斯定律,如果核心作者的發(fā)文數(shù)量閾值m≥3.30,發(fā)文量大于等于4篇的作者則為該領(lǐng)域的核心作者[14]。目前,本研究領(lǐng)域共有5人(見(jiàn)表2),分別是李偉(復(fù)旦大學(xué))、周明全(北京師范大學(xué))、李鵬(陜西師范大學(xué))、關(guān)欣(天津大學(xué))、王向陽(yáng)(遼寧師范大學(xué))。5位核心作者共發(fā)表文章29篇,占總數(shù)(393篇)的7.38%。其中,復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院李偉(8篇)和北京師范大學(xué)虛擬現(xiàn)實(shí)與可視化研究所周明全(8篇)是該領(lǐng)域的領(lǐng)軍人物。李偉研究的重點(diǎn)在于音樂(lè)科技、音樂(lè)人工智能(Music AI)、語(yǔ)音信息處理等,周明全研究的重點(diǎn)在于MIDI旋律特征提取、哼唱音樂(lè)檢索與旋律匹配模型等。
表2 基于普賴(lài)斯定律的核心作者
(2)發(fā)文作者合作網(wǎng)絡(luò)分析
作者合作方面,在20世紀(jì)末本領(lǐng)域開(kāi)始出現(xiàn)作者合作現(xiàn)象,常見(jiàn)國(guó)內(nèi)高校內(nèi)部或高校之間交流,少有和國(guó)外互動(dòng)。1999年周斌與張鳳池[15]合作探討“計(jì)算機(jī)配樂(lè)與人工智能”的應(yīng)用,2000年顧健與周敬利、余勝生[16]合作探討“音樂(lè)聲道”等問(wèn)題。此后圍繞音樂(lè)特征的算法研究作者之間的合作進(jìn)一步拓展,出現(xiàn)了一些較有影響力的研究團(tuán)體。利用CiteSpace繪制的圖4是作為一張作者網(wǎng)絡(luò)圖譜,其中的節(jié)點(diǎn)表示作者,作者之間的連線(xiàn)粗細(xì)表示作者之間的合作關(guān)系??梢园l(fā)現(xiàn),國(guó)內(nèi)比較有影響力的團(tuán)隊(duì)有:復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院的李偉、馮瑞等;陜西師范大學(xué)計(jì)算機(jī)科學(xué)學(xué)院的李鵬與北京師范大學(xué)信息科學(xué)與技術(shù)學(xué)院的周明全等;遼寧師范大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院的王向陽(yáng)、楊紅穎與中國(guó)科學(xué)院軟件研究所信息安全國(guó)家重點(diǎn)實(shí)驗(yàn)室的趙紅;華中科技大學(xué)電信系的孫銳、孫洪與武漢大學(xué)通信工程系的姚天任;清華大學(xué)電子工程系微波與數(shù)字通信技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室的李曄、崔慧娟、唐昆。究其原因,這些團(tuán)隊(duì)研究問(wèn)題比較聚焦,大多與該校學(xué)科方向或國(guó)家項(xiàng)目有關(guān)。一方面,上述團(tuán)隊(duì)所在院校凝聚專(zhuān)家學(xué)者團(tuán)體力量開(kāi)設(shè)了人工智能學(xué)科方向;另一方面,他們都承擔(dān)相關(guān)的國(guó)家自然基金項(xiàng)目,如陜西師范大學(xué)的李鵬在2019年主持國(guó)家自然科學(xué)基金面上項(xiàng)目“基于移動(dòng)社會(huì)網(wǎng)絡(luò)的校園協(xié)作學(xué)習(xí)交互與微視頻擴(kuò)散關(guān)鍵技術(shù)研究”等。值得注意的是,國(guó)內(nèi)音樂(lè)領(lǐng)域的算法研究作者合作關(guān)系與其他領(lǐng)域比較而言仍較少,研究視角主要從個(gè)人視角來(lái)研究問(wèn)題,研究力量也顯得較為分散,尤其與音樂(lè)專(zhuān)業(yè)類(lèi)院校合作還處于空白階段,主要原因在于音樂(lè)與人工智能的學(xué)科屬性不同,作為一門(mén)交叉學(xué)科起步較晚,還未形成穩(wěn)定的合作網(wǎng)絡(luò)和研究團(tuán)體。
關(guān)鍵詞共現(xiàn)分析是對(duì)樣本數(shù)據(jù)集中提供的關(guān)鍵詞的分析[18],是針對(duì)兩個(gè)或兩個(gè)以上的關(guān)鍵詞在論文之間共同出現(xiàn)的頻次來(lái)說(shuō)的。利用關(guān)鍵詞的頻次和中心度,可以清楚認(rèn)識(shí)到國(guó)內(nèi)音樂(lè)領(lǐng)域算法研究的熱點(diǎn),如圖4和表3所示。從圖4看出,“人工智能”面積最大,這與本研究宏觀主題一致。其余圓形較大的關(guān)鍵詞依次有“語(yǔ)音增強(qiáng)”“音樂(lè)噪聲”“音樂(lè)檢索”“譜減法”“算法作曲”“哼唱檢索”“先驗(yàn)信噪比”等,說(shuō)明以上關(guān)鍵詞在樣本文獻(xiàn)中出現(xiàn)的次數(shù)較多、頻數(shù)較高,是目前該領(lǐng)域研究的熱點(diǎn)。對(duì)音樂(lè)領(lǐng)域算法研究關(guān)鍵詞詞頻降序排名表(表3)進(jìn)一步證實(shí)了這點(diǎn)。從表中可以發(fā)現(xiàn),關(guān)鍵詞詞頻以降序排名,詞頻越高說(shuō)明該關(guān)鍵詞的文獻(xiàn)越多,其中“人工智能”的最高,這與圖4一致。綜上可以得出,當(dāng)前國(guó)內(nèi)音樂(lè)領(lǐng)域算法研究主要偏向于智能音聲識(shí)別、智能推薦、智能創(chuàng)作、智能分析等方面。
表3 國(guó)內(nèi)音樂(lè)領(lǐng)域算法研究關(guān)鍵詞詞頻降序排名表(≥4)
圖4 國(guó)內(nèi)音樂(lè)領(lǐng)域算法研究關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜
關(guān)鍵詞突變是指一定時(shí)間內(nèi)關(guān)鍵詞增長(zhǎng)速度的突然加快或使用頻率的突然提高,利用突變?cè)~的動(dòng)態(tài)變化性,能確切了解該領(lǐng)域的研究前沿[18]。CiteSpace根據(jù)突變率權(quán)值和年代,排列出了國(guó)內(nèi)音樂(lè)領(lǐng)域算法研究中十八個(gè)突變率較高的關(guān)鍵詞突變圖譜(如圖5)。根據(jù)關(guān)鍵詞突變出現(xiàn)的年份和突變率,可將該領(lǐng)域的研究分為四個(gè)組別。
圖5 國(guó)內(nèi)音樂(lè)領(lǐng)域算法研究高突變率關(guān)鍵詞圖譜
第一組是“數(shù)字水印”“音樂(lè)”與“音頻水印”,其中“音頻水印”突變率最高,達(dá)到2.9521,“數(shù)字水印”突變率次之,突變時(shí)間段分別處于2008-2009年和2002-2006年,說(shuō)明數(shù)字水印主題在此期間頻次變化較顯著。在這段時(shí)間內(nèi),我國(guó)如何利用算法對(duì)數(shù)字音樂(lè)知識(shí)產(chǎn)權(quán)保障的研究不斷深入,包括對(duì)MP3壓縮攻擊特點(diǎn)與音樂(lè)聽(tīng)覺(jué)掩蔽特性的探索,隨之帶動(dòng)相關(guān)音頻水印主題的研究文獻(xiàn)數(shù)量增加,成為當(dāng)時(shí)的研究熱點(diǎn)與趨勢(shì)。
第二組是“譜減法”“聽(tīng)覺(jué)掩蔽特性”“先驗(yàn)信噪比”“音樂(lè)噪聲”“語(yǔ)音增強(qiáng)”與“壓縮域”,其中,“語(yǔ)音增強(qiáng)”突變率最高,達(dá)到7.171,“音樂(lè)噪聲”也突變明顯,成為近幾年的研究熱點(diǎn)。國(guó)內(nèi)音樂(lè)領(lǐng)域算法研究視角逐漸深入微觀視角,說(shuō)明如何去除數(shù)字音樂(lè)中的雜質(zhì)和噪聲、提高音樂(lè)音質(zhì)的清晰度和可懂度成為該領(lǐng)域的又一研究熱點(diǎn);音樂(lè)質(zhì)量方面的研究不再滿(mǎn)足于傳統(tǒng)的譜減法、最大似然估計(jì)等來(lái)改善音樂(lè)音質(zhì),而是基于RS理論的壓縮域算法提高音樂(lè)圖像處理技術(shù),通過(guò)語(yǔ)音增強(qiáng)算法改善數(shù)字音樂(lè)語(yǔ)音處理系統(tǒng)等維度進(jìn)行分析,逐漸趨向多元化。
第三組是“音樂(lè)檢索”“音樂(lè)信息檢索”“協(xié)同過(guò)濾”與“音樂(lè)推薦”,其中“協(xié)同過(guò)濾”突變率最高,是2.7408。針對(duì)音樂(lè)用戶(hù)需求領(lǐng)域,運(yùn)用協(xié)同過(guò)濾、音樂(lè)推薦等研究手段進(jìn)行研究的方法已被業(yè)界廣泛使用,2010年起便涌現(xiàn)了大量的相關(guān)文獻(xiàn)。受千萬(wàn)用戶(hù)喜歡的網(wǎng)易云音樂(lè),就是通過(guò)協(xié)同過(guò)濾推薦算法這一應(yīng)用最廣泛的個(gè)性化推薦算法,將海量音樂(lè)按照其風(fēng)格特征的聚類(lèi)快速推送到用戶(hù)面前,實(shí)現(xiàn)了智能化的音樂(lè)聽(tīng)覺(jué)需求。正如圖5所示,音樂(lè)推薦這一主題在2016-2020年的出現(xiàn)頻次明顯突變,說(shuō)明國(guó)內(nèi)音樂(lè)領(lǐng)域算法研究順勢(shì)發(fā)展,音樂(lè)推薦、協(xié)同過(guò)濾等研究熱點(diǎn)將成為未來(lái)發(fā)展趨勢(shì)。
第四組是“支持向量機(jī)”“獨(dú)創(chuàng)性”“深度學(xué)習(xí)”與“人工智能”,其中,“人工智能”突變率最高,多達(dá)11.7716,突變發(fā)生時(shí)間段為2018-2020年,說(shuō)明人工智能在當(dāng)下國(guó)內(nèi)音樂(lè)領(lǐng)域算法研究中熱度非常高。這一階段的研究已經(jīng)深入到了智能推薦、智能視覺(jué)、智能語(yǔ)音、智能創(chuàng)作以及機(jī)器學(xué)習(xí)等專(zhuān)業(yè)和前沿的技術(shù)領(lǐng)域[19],并已經(jīng)成為中國(guó)智能音樂(lè)學(xué)研究的熱點(diǎn)和前沿。
圖6 國(guó)內(nèi)音樂(lè)領(lǐng)域的算法研究關(guān)鍵詞聚類(lèi)網(wǎng)絡(luò)圖譜
為了聚焦研究主題,更加清楚地展示關(guān)鍵詞之間內(nèi)在的邏輯關(guān)系,借助CiteSpace軟件生成國(guó)內(nèi)音樂(lè)領(lǐng)域的算法研究關(guān)鍵詞聚類(lèi)網(wǎng)絡(luò)圖譜(圖7)。一般來(lái)說(shuō),圖中代表關(guān)鍵詞的數(shù)字越小,說(shuō)明其聚類(lèi)中包含的關(guān)鍵詞越多[19]。從圖7得知,網(wǎng)絡(luò)圖譜Q值是0.9325,S值是0.5436,說(shuō)明聚類(lèi)效果明顯,聚類(lèi)結(jié)果有效。目前,國(guó)內(nèi)音樂(lè)領(lǐng)域的算法研究聚焦于人工智能、算法作曲、語(yǔ)音增強(qiáng)、音樂(lè)推薦、輔助信息、鄰接權(quán)、人類(lèi)聽(tīng)覺(jué)系統(tǒng)、音樂(lè)、音樂(lè)流派分類(lèi)、哼唱檢索。從圖7來(lái)看,涉及多個(gè)聚類(lèi)重疊的核心關(guān)鍵詞為“算法作曲”。因此,基于此量化聚類(lèi)分析結(jié)果,綜合考察關(guān)鍵詞網(wǎng)絡(luò)圖譜,對(duì)文獻(xiàn)內(nèi)容進(jìn)行二次梳理后歸納分析,將國(guó)內(nèi)音樂(lè)領(lǐng)域的算法研究的熱點(diǎn)主題歸納為人工智能作曲、智能音樂(lè)識(shí)別、智能音樂(lè)檢索、智能音樂(lè)推薦四個(gè)維度。
1.人工智能作曲
人工智能作曲是借助特定的算法和深度學(xué)習(xí),利用從音樂(lè)作曲理論或某個(gè)音樂(lè)家的作品、某種音樂(lè)流派、某種音樂(lè)風(fēng)格等中提煉出的形式化生成規(guī)則,通過(guò)參數(shù)創(chuàng)作出音樂(lè)動(dòng)機(jī)、音樂(lè)伴奏、音樂(lè)作品等音樂(lè)信息的過(guò)程[20]。關(guān)于人工智能作曲概念界定,劉健提出了“分層結(jié)構(gòu)控制”的概念,認(rèn)為音樂(lè)是通過(guò)某種邏輯過(guò)程來(lái)生成的。劉弘認(rèn)為遺傳算法作曲系統(tǒng)應(yīng)包括交互的、基于實(shí)例的、基于規(guī)則的與自發(fā)式的四種系統(tǒng)。
關(guān)于人工智能作曲算法,學(xué)界認(rèn)為主要有遺傳算法[21]、人工神經(jīng)網(wǎng)絡(luò)與馬爾可夫鏈[22]等方面。遺傳算法方面,崔嘉、曹西征等學(xué)者認(rèn)為遺傳算法是人工智能作曲的一種主要手段,蘇慶堂認(rèn)為遺傳算法是作曲的知識(shí)符號(hào)表示,張英俐認(rèn)為遺傳算法在旋律生成樂(lè)曲的過(guò)程中使用人與作曲系統(tǒng)間建立的交互式系統(tǒng),生成的樂(lè)曲比較符合人們的欣賞習(xí)慣。人工神經(jīng)網(wǎng)絡(luò)方面,苗北辰等提出基于循環(huán)神經(jīng)網(wǎng)絡(luò)的多聲部音樂(lè)生成算法,李雄飛等提出以音樂(lè)音頻為處理對(duì)象的基于長(zhǎng)短時(shí)記憶遞歸神經(jīng)網(wǎng)絡(luò)的音樂(lè)自動(dòng)合成算法,這兩種算法比較方便實(shí)現(xiàn)自動(dòng)作曲,以此得到的模型可以生成旋律與和弦匹配度較好的多聲部音樂(lè)數(shù)據(jù);張曉娜等提出基于粒子群算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的電子音樂(lè)分類(lèi)模型,獲得精準(zhǔn)度較高的樂(lè)曲分類(lèi);黃璟提出基于群智優(yōu)化神經(jīng)網(wǎng)絡(luò)構(gòu)建音樂(lè)風(fēng)格分類(lèi)模型,幫助用戶(hù)更快地獲取偏好的音樂(lè)風(fēng)格。馬爾可夫鏈方面,鄭曉妹等提出基于旋律馬爾可夫鏈的中國(guó)民歌自動(dòng)作曲模式,該模式可以生成具有中國(guó)民族音樂(lè)特征的樂(lè)曲。
關(guān)于人工智能作曲系統(tǒng),常見(jiàn)的有EMI系統(tǒng)、交互式即興演奏系統(tǒng)GenJam、旋律創(chuàng)作系統(tǒng)ERNN等。研究者普遍采取的做法是將樂(lè)譜轉(zhuǎn)換成編碼,采用遺傳算法中的選擇、交叉和變異算子產(chǎn)生新的樂(lè)曲,或利用FM技術(shù)結(jié)合Max/MSP算法作曲平臺(tái)進(jìn)行特性模擬、程序構(gòu)建,實(shí)時(shí)控制音響并實(shí)現(xiàn)樂(lè)曲創(chuàng)作[23]。
2.智能音樂(lè)識(shí)別
名詞的意動(dòng)用法,指的是主語(yǔ)將結(jié)構(gòu)中賓語(yǔ)指的人或者物當(dāng)作結(jié)構(gòu)中的名詞所指代的人或物,可以按照“以為賓語(yǔ)是謂語(yǔ)”的格式進(jìn)行解釋。如:“草菅人命”這個(gè)成語(yǔ)指的是將性命看作雜草,意味著肆意踐踏性命。
音樂(lè)領(lǐng)域中的智能識(shí)別,是以提取音樂(lè)樣本數(shù)據(jù)的音高、旋律、節(jié)奏及節(jié)拍等音頻特征為主,設(shè)置不同分類(lèi)器進(jìn)行分類(lèi),從而達(dá)到識(shí)別音樂(lè)低層特征、存儲(chǔ)音樂(lè)基礎(chǔ)元素的目的。在探討如何識(shí)別音高問(wèn)題時(shí),翟景瞳等提出了一種基于自相關(guān)處理和快速傅里葉變換(FFT)的改進(jìn)的單音音高識(shí)別算法,該算法比傳統(tǒng)的時(shí)域處理法具有更高的識(shí)別精度;楊岱錦等提出以相對(duì)振幅為依據(jù)快速提取基頻的方法,設(shè)計(jì)出一種可變區(qū)域的傅里葉變換迭代算法,以更加精確地識(shí)別哼唱曲調(diào)。在探討旋律特征如何提取時(shí),黃志剛等提出一種應(yīng)用隨機(jī)森林的方法自動(dòng)抽取MIDI文件中主旋律所在的音軌,從而有效規(guī)避了從MIDI文件中抓取主旋律信息的難度與誤差。在對(duì)音樂(lè)的情感識(shí)別系統(tǒng)分析時(shí),陳曉鷗等指出音樂(lè)情感識(shí)別系統(tǒng)一般是采用機(jī)器學(xué)習(xí)的方法來(lái)建立計(jì)算模型,可采用音樂(lè)表達(dá)情感離散類(lèi)別模型、通用連續(xù)維度模型、音樂(lè)喚起情感離散類(lèi)別模型等模型;蔣旻雋等提出一種基于PAD(pleasure arousal dominance)模型以及基因表達(dá)式編程(GEP)算法的音樂(lè)情感自動(dòng)識(shí)別方法,該系統(tǒng)能降低識(shí)別誤差,達(dá)到一個(gè)比較理想的識(shí)別效果。
3.智能音樂(lè)檢索
智能音樂(lè)檢索是通過(guò)一定的算法,利用有限的音樂(lè)信息獲取更多相關(guān)音樂(lè)信息的過(guò)程。陳根方認(rèn)為常見(jiàn)的智能音樂(lè)檢索方法有基于文本關(guān)鍵詞檢索、基于內(nèi)容的音樂(lè)檢索(可分為基于音樂(lè)情感分類(lèi)檢索與基于哼唱的音樂(lè)檢索)等。目前,類(lèi)似于百度MP3、谷歌音樂(lè)搜索為主的文本關(guān)鍵詞檢索應(yīng)用較窄,已無(wú)法滿(mǎn)足用戶(hù)的個(gè)性化需求,學(xué)界對(duì)此也關(guān)注較少,基于內(nèi)容的音樂(lè)檢索技術(shù)是該領(lǐng)域的研究熱點(diǎn)。王培培等通過(guò)使用BDTW算法對(duì)音樂(lè)數(shù)據(jù)庫(kù)和用戶(hù)提供的哼唱片段進(jìn)行音高相似性計(jì)算,提出一種新的基于語(yǔ)句特征的音樂(lè)哼唱快速檢索技術(shù),實(shí)現(xiàn)哼唱音樂(lè)的快速檢索。李鵬等在對(duì)音樂(lè)旋律的定義及表達(dá)方式的基礎(chǔ)上,根據(jù)旋律輪廓的幾何相似性實(shí)現(xiàn)音樂(lè)的相似度計(jì)算,提出影響檢索算法準(zhǔn)確度的若干因素,并通過(guò)實(shí)驗(yàn)的方法確定相應(yīng)的閾值,實(shí)現(xiàn)檢索系統(tǒng)的單機(jī)版開(kāi)發(fā)和Web版發(fā)布。溫贊揚(yáng)采用Skyline主旋律提取算法提取音樂(lè)數(shù)據(jù)特征,構(gòu)建BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),采用果蠅群智優(yōu)化算法對(duì)BP神經(jīng)網(wǎng)絡(luò)的初始化權(quán)值參數(shù)進(jìn)行優(yōu)化,以便實(shí)現(xiàn)音樂(lè)風(fēng)格自動(dòng)分類(lèi)。
4.智能音樂(lè)推薦
智能音樂(lè)推薦是指根據(jù)用戶(hù)的歷史瀏覽數(shù)據(jù),從候選庫(kù)中推薦給用戶(hù)可能喜歡的音樂(lè)的一種新型網(wǎng)絡(luò)服務(wù)。目前學(xué)界多根據(jù)智能音樂(lè)推薦引擎數(shù)據(jù)源分類(lèi)進(jìn)行研究,分為基于音樂(lè)用戶(hù)的推薦、基于內(nèi)容過(guò)濾的推薦以及基于協(xié)同過(guò)濾的推薦等維度。(1)音樂(lè)用戶(hù)推薦方面,多基于人口統(tǒng)計(jì)學(xué)、人類(lèi)行為學(xué)角度進(jìn)行分析,以用戶(hù)年齡或性別相同的相似用戶(hù)為研究對(duì)象。潘洋等通過(guò)提取用戶(hù)行為數(shù)據(jù)構(gòu)建行為特征模型,用以分析用戶(hù)行為與興趣的關(guān)聯(lián)性,并采用因子分解機(jī)(factorization machine,FM)預(yù)測(cè)用戶(hù)行為類(lèi)型,作為音樂(lè)推薦的依據(jù)。李瑞敏等通過(guò)分析用戶(hù)對(duì)不同音樂(lè)基因特征的偏好情況及用戶(hù)興趣的相似情況,提出個(gè)性化移動(dòng)音樂(lè)推薦系統(tǒng)。(2)內(nèi)容過(guò)濾推薦方面,多基于聲學(xué)元數(shù)據(jù)進(jìn)行分析。牛濱等采用MFCC技術(shù)提取歌曲的語(yǔ)音特征,提出一種基于高斯混合模型(GMM)與Mel頻率倒譜系數(shù)(MFCC)的個(gè)性音樂(lè)推薦模型的構(gòu)建方法。張燕等應(yīng)用分形理論,從構(gòu)建的音樂(lè)數(shù)據(jù)庫(kù)中獲取音樂(lè)風(fēng)格特征向量,定義出一種新的距離度量方法,完成音頻歸類(lèi)和個(gè)性化的網(wǎng)絡(luò)推薦。(3)在協(xié)同過(guò)濾推薦方面,以發(fā)現(xiàn)相同音樂(lè)內(nèi)容或音樂(lè)用戶(hù)的相關(guān)性推薦為研究對(duì)象。吳海金等提出一種融合分類(lèi)與協(xié)同過(guò)濾的情境感知音樂(lè)推薦算法,該算法不僅有效地降低了推薦過(guò)程的復(fù)雜度,還使傳統(tǒng)的協(xié)同過(guò)濾推薦算法具備了情境感知的能力。李博等根據(jù)已有的基于音頻信息的音樂(lè)推薦以及協(xié)同過(guò)濾方法,分析用戶(hù)的音樂(lè)試聽(tīng)數(shù)據(jù)以及下載數(shù)據(jù),并結(jié)合Latent Dirichlet分配(LDA)主題挖掘模型提出的音樂(lè)推薦算法,可以更加高效地向用戶(hù)推薦感興趣的音樂(lè)。
遺傳算法、交互式遺傳算法、卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、深度神經(jīng)網(wǎng)絡(luò)、馬爾科夫鏈等多樣化的主流算法共同構(gòu)建起宏大的人工智能作曲平臺(tái)。未來(lái),算法作曲系統(tǒng)將得益于多種算法融合的“混合一體型”系統(tǒng),更加人性化與智慧化,主要圍繞兩個(gè)方面:第一,人工智能樂(lè)曲生成的自動(dòng)化能力不斷加強(qiáng)。一方面,人工智能將不斷深入人工作曲系統(tǒng),對(duì)其做出建議、補(bǔ)充與配合,并逐漸獨(dú)立于人工作曲系統(tǒng)之外;另一方面,機(jī)器學(xué)習(xí)將基于深度學(xué)習(xí)技術(shù)讀取成千上萬(wàn)的曲子進(jìn)行學(xué)習(xí),從大數(shù)據(jù)、海量計(jì)算中發(fā)現(xiàn)更多的音樂(lè)風(fēng)格和有趣的旋律,依靠強(qiáng)大的硬件計(jì)算能力實(shí)現(xiàn)音樂(lè)的全自動(dòng)生成。第二,人工智能樂(lè)曲的運(yùn)用領(lǐng)域不斷增大。將機(jī)器學(xué)習(xí)、音樂(lè)作曲和音頻制作相融合,創(chuàng)作出用戶(hù)需求的各種主題與情景的音樂(lè),將是人工智能作曲的未來(lái)發(fā)展趨勢(shì)之一,人工智能樂(lè)曲在視頻游戲、電視預(yù)告片、商業(yè)廣告、短視頻、發(fā)布會(huì)與電影插曲等多個(gè)領(lǐng)域中的應(yīng)用也將更加普及和廣泛。
音樂(lè)特征以專(zhuān)業(yè)性強(qiáng)、曲式范式復(fù)雜、旋律模塊多變等特點(diǎn),對(duì)其人工智能識(shí)別提出更高的要求和新的挑戰(zhàn),未來(lái)研究從以下兩個(gè)方面展開(kāi):第一,開(kāi)展基于完整音樂(lè)作品的識(shí)別。設(shè)計(jì)音樂(lè)信號(hào)采集模塊與音樂(lè)信號(hào)處理模塊,通過(guò)海量數(shù)據(jù)樣本采集與算法設(shè)計(jì),識(shí)別并提取音樂(lè)特征,結(jié)合音樂(lè)理論自身提供的基礎(chǔ)知識(shí)構(gòu)建音樂(lè)標(biāo)簽化管理系統(tǒng),實(shí)現(xiàn)音樂(lè)作品的整體識(shí)別模型體系。第二,開(kāi)展微觀音樂(lè)特征識(shí)別。著眼于識(shí)別比較微觀的音樂(lè)元素,如細(xì)化樂(lè)譜、節(jié)奏、節(jié)拍、音高、音色、調(diào)式、旋律、和聲、情感、歌手、樂(lè)器等音樂(lè)特征,基于智能模擬理論、建構(gòu)主義理論,構(gòu)建多樣化的音樂(lè)特征動(dòng)態(tài)識(shí)別,提高復(fù)雜情況下的音樂(lè)特征識(shí)別率。
隨著娛樂(lè)等領(lǐng)域?qū)σ魳?lè)信息檢索需求的不斷增加,其關(guān)鍵技術(shù)也從早期的文本檢索向哼唱檢索、聽(tīng)歌檢索、風(fēng)格檢索等方向發(fā)展,并成為數(shù)字音樂(lè)智能檢索研究的未來(lái)趨勢(shì)。其中:第一,基于內(nèi)容的音樂(lè)信息檢索(MIR)技術(shù)成為數(shù)字音樂(lè)內(nèi)容分析理解的關(guān)鍵技術(shù)。相對(duì)于傳統(tǒng)基于文本的音樂(lè)搜索,基于音樂(lè)內(nèi)容的搜索和發(fā)現(xiàn)則更受人們歡迎。音頻內(nèi)容檢索通過(guò)分析音高、旋律、調(diào)式、和弦、節(jié)奏等音頻本身,實(shí)現(xiàn)音樂(lè)旋律的識(shí)別和索引。第二,人工智能技術(shù)應(yīng)用檢索技術(shù)系統(tǒng)化。人工智能時(shí)代,音樂(lè)檢索技術(shù)將在優(yōu)化資源組織與檢索需求匹配度的基礎(chǔ)上,運(yùn)用MIR技術(shù)、SLB技術(shù)、CNN技術(shù)等,構(gòu)建音樂(lè)資源綜合檢索等平臺(tái),從而更易發(fā)現(xiàn)音樂(lè)信息。
在大數(shù)據(jù)時(shí)代,算法推薦是用戶(hù)獲取音樂(lè)信息的重要渠道,推薦質(zhì)量關(guān)乎用戶(hù)的體驗(yàn)態(tài)度。目前,單一的推薦模式不能適應(yīng)當(dāng)前社會(huì)服務(wù)領(lǐng)域的個(gè)性化需求,多算法機(jī)制構(gòu)建系統(tǒng)化推薦模式成為目前研究的趨向之一。未來(lái),要遵循個(gè)體訴求與群體環(huán)境相協(xié)調(diào)的原則,在構(gòu)建基于音樂(lè)內(nèi)容的、基于用戶(hù)對(duì)音樂(lè)評(píng)價(jià)的、基于用戶(hù)與用戶(hù)之間相似度的推薦系統(tǒng)的基礎(chǔ)上,打造基于專(zhuān)家的推薦、基于內(nèi)容過(guò)濾的推薦、基于協(xié)同過(guò)濾的推薦、基于語(yǔ)境的推薦、基于圖模型的推薦以及混合型推薦的音樂(lè)綜合型推薦模式體系,從而實(shí)現(xiàn)個(gè)體用戶(hù)推薦與群組用戶(hù)推薦相統(tǒng)一,實(shí)現(xiàn)實(shí)時(shí)推薦和偏好推薦相統(tǒng)一,實(shí)現(xiàn)音樂(lè)風(fēng)格與情感推薦相統(tǒng)一。通過(guò)多種算法機(jī)制構(gòu)建音樂(lè)主題推薦模型,提升音樂(lè)主題分類(lèi)精度,使數(shù)字音樂(lè)消費(fèi)服務(wù)領(lǐng)域更加人性化和普及化。
根據(jù)以上的分析,結(jié)合三十年來(lái)國(guó)內(nèi)音樂(lè)領(lǐng)域算法研究的積累,可以作如下總結(jié):第一,隨著對(duì)音樂(lè)領(lǐng)域算法研究的不斷深入,國(guó)內(nèi)相關(guān)研究在數(shù)量、質(zhì)量上不斷提升,發(fā)文量在未來(lái)幾年內(nèi)將持續(xù)上升,具有主題聯(lián)系緊密并交叉等特征,但存在研究力量分散等問(wèn)題;第二,相關(guān)研究集中在音樂(lè)版權(quán)保護(hù)、音樂(lè)智能去噪、算法作曲、音樂(lè)檢索、音樂(lè)推薦等領(lǐng)域,其中算法作曲是最早開(kāi)始關(guān)注本領(lǐng)域研究問(wèn)題的,并成為促進(jìn)音樂(lè)領(lǐng)域算法研究的主力軍;第三,人工智能作曲、智能音樂(lè)識(shí)別、智能音樂(lè)檢索、智能音樂(lè)推薦作為近年來(lái)該領(lǐng)域的研究熱點(diǎn),未來(lái)仍有持續(xù)探討的空間??梢灶A(yù)見(jiàn),多學(xué)科共同體是促進(jìn)國(guó)內(nèi)音樂(lè)領(lǐng)域算法研究體系的重要屏障,智能音樂(lè)學(xué)、音樂(lè)科技學(xué)等相關(guān)學(xué)科研究將進(jìn)一步深入,機(jī)器學(xué)習(xí)等技術(shù)的應(yīng)用將促進(jìn)國(guó)際智能音樂(lè)教育的發(fā)展,相關(guān)研究也更注重當(dāng)代社會(huì)對(duì)音樂(lè)科技人才的實(shí)際需求。