蔣盛益,陽 垚,廖靜欣
1.廣東外語外貿大學 信息學院,廣州 510006
2.淘寶(中國)軟件有限公司,杭州 310099
中文音樂情感詞典構建及情感分類方法研究
蔣盛益1,陽 垚2,廖靜欣1
1.廣東外語外貿大學 信息學院,廣州 510006
2.淘寶(中國)軟件有限公司,杭州 310099
作為2012年中國互聯(lián)網(wǎng)網(wǎng)民使用率僅次于即時通信和搜索引擎的第三大應用,網(wǎng)絡音樂的用戶規(guī)模達到43 586萬,與2011年同比增長率為13.0%[1],網(wǎng)絡音樂及其應用技術已經(jīng)成為互聯(lián)網(wǎng)的一個研究熱點。音樂是情感的載體,情感是音樂的本質特征和內涵,同時也是音樂最重要的語義信息。正因如此,音樂的情感分析廣泛應用于音樂檢索和推薦系統(tǒng)、不同場景的音樂配放(如動漫制作)、個人音樂欣賞(如音樂下載服務)等領域,是人機情感交互技術研究中重要的組成部分[2],受到業(yè)界學者的高度重視。
傳統(tǒng)的音樂情感分析大都是基于音頻的,且此方面的研究已有近20年的歷史,然而至今難以獲得準確反映情感的音頻特征,情感分析未能達到滿意的水平[3]。因此研究者開始向音樂情感的另一本體——歌詞展開研究,基于歌詞的情感分析逐漸成為熱門的研究方向。歌詞,本質上屬于文本的范疇。因此,從歌詞分析的角度來看,音樂的情感由歌詞中所有詞語的情感序列組合而成,最小的語義構成單位是詞語,詞語的情感判別是歌詞情感分析的基礎。構建一部合理的情感詞典,實現(xiàn)詞匯的情感分析是高效、精確的歌詞情感分析的前提和基礎。
借助于HowNet[4]、《同義詞詞林》[5]等系統(tǒng),目前國內構建中文情感詞典的研究工作已獲得了一定的成果。Subasic和Huettner手工建立了一個基于情感類別相關的詞典,詞典中標明了詞的強度(表達情感的力度)和向心度(與類別的相關程度)[6]。Liu等人提出了使用Open Mind Commonsense數(shù)據(jù)庫為選擇的語言特征賦予情感值,并將其歸納為六個基本類別(高興、悲傷、憤怒、恐懼、厭惡和驚奇)[7]。徐琳宏等標注了近4萬句,100萬字的情感語料庫,給出了其情感分布和情感遷移規(guī)律等統(tǒng)計數(shù)據(jù)[8]。佘莉等參照《同義詞詞林》的結構利用聚類技術進行了詞匯擴展,構建了一個包含近6 000個詞匯的情感詞庫[9]。國內情感詞典構建起步較晚,目前國內仍沒有一部完善的大規(guī)模的中文情感詞典被廣泛認可,而面向音樂情感分類的情感詞典幾乎處于空白狀態(tài)。
通過相關學者近幾年的努力,目前國內對歌詞的數(shù)據(jù)挖掘也取得了一些成果。陳若涵等采用基于詞匯的向量空間模型和層次分類方法研究歌詞的情感[10]。鄭亞斌等通過實驗表明歌詞語料庫的分布基本符合齊夫定律,利用向量空間模型找到了比較相似的歌詞集合,提出了用LRC歌詞中的時間標注信息提取歌曲的重復片段、節(jié)奏劃分等[11]。丁效等通過領域事件詞聚類的方法自動發(fā)現(xiàn)音樂領域具有代表性的事件,采用基于關鍵詞與觸發(fā)詞相結合的過濾方法簡化了事件類型的識別過程,并用最大熵模型解決了事件元素識別問題[12]。
本文以改進后的Hevner情感環(huán)模型為情感分類基準,從歌詞文本語料庫方面著手,利用HowNet中語義相似度計算的思想,構建音樂領域的中文情感詞典,然后在此中文情感詞典的基礎上,借助KNN分類算法的思想,并利用LRC歌詞攜帶的語速信息,提出了一種基于情感向量空間模型的歌詞情感分類方法。
本文實驗的整體過程如圖1所示。
圖1 基于歌詞文本的音樂情感分類流程
2.1 選擇音樂情感模型
不同類型的音樂必定與不同的情感類別相聯(lián)系,如“快樂”、“悲傷”等。本文選擇歌詞文本為情感分類的載體,因此,必須設置一個針對文本分析的文本關鍵字模型作為情感分類的依據(jù)。作為文本關鍵字模型的代表——Hevner情感環(huán)模型,具有非常好的研究基礎。然而,Hevner并不完全適用于中文情感的分析。因此,本文所選取的情感模型是由劉濤等根據(jù)漢語文化背景對原始Hevner情感環(huán)模型進行優(yōu)化的情感模型[13],如表1所列。列1為情感類別,即本文用于情感分類的標簽,共8類;而列2~列7為對應每一個類別的情感詞匯,即理解為如情感類別“快樂”包括了“欣喜”、“明亮”兩種情感。
2.2 構建音樂情感詞典
由2.1節(jié)可知,改進后的Hevner模型分為兩層,本文分別將其稱呼為一級情感詞匯和二級情感詞匯。一級情感詞匯為表1中的列1,共8個詞,二級情感詞匯為表1所有列(二級情感詞匯包含一級情感詞匯),共47個詞。由于以上47個詞語都是經(jīng)過提煉而成的情感類別標簽,并不一定適用于歌詞文本的分析。正因如此,利用HowNet相似度計算及歌詞語料庫,本文對原始的47個情感詞匯進行了擴展,構造了第三級情感詞匯,使其適用于歌詞文本分析。實現(xiàn)過程如圖2所示。最終,情感詞典將情感詞匯分為三個級別,情感詞匯由詞語和情感傾向權值兩個特征組成,情感傾向權值為對應的第三級情感詞與所屬第二級情感詞的相似度值。如表2所列的存儲結構將情感詞匯存儲在txt文檔中。
表1 改進后的Hevner情感模型
圖2 情感詞典構建流程
表2 情感詞典的存儲結構
圖3 標準的LRC歌詞文檔
其中,歌詞語料庫采用了從搜狗音樂網(wǎng)站中爬取的59 403篇LRC歌詞(LRC歌詞格式如圖3所示),經(jīng)過如圖2所示的歌詞處理及詞匯提取后得到歌詞詞匯語料庫,用作擴展三級情感詞匯的基礎數(shù)據(jù)。之后利用HowNet相似度計算方法計算歌詞詞匯語料庫中每個詞語與47個二級情感詞匯的相似度值,相似度值范圍為[0,1],即每個詞語得到一個47維的向量。設置初始相似度閾值threshold,從0.1開始,提取出向量中相似度值大于threshold的對應的詞語,用作“實驗用三級情感詞匯”,在多個小規(guī)模樣本集中進行分類實驗(分類實驗方法將在2.3節(jié)闡述),分析實驗結果并調整threshold,每次增加0.05,至threshold為1。最后,經(jīng)過以上的多次實驗,可以從結果分析得到本實驗中最佳的threshold為0.3。至此面向音樂領域的中文情感詞典構建完成,該詞典共包含情感詞匯2 417個,其中8大情感類別的詞匯量的分布情況如表3所列。
表3 情感詞典中8大情感子類的詞匯量分布情況
2.3 構建基于歌詞文本的情感向量
本文采用改進后的Hevner情感環(huán)模型的8維情感類別“神圣”、“悲傷”、“向往”、“抒情”、“輕盈”、“快樂”、“熱情”和“生機”以及歌詞的語速信息作為音樂的情感特征向量,共9個維度。該情感特征向量表現(xiàn)為音樂與每類情感的語義(前8維)和節(jié)奏強度(第9維)的相似關系。
根據(jù)公式(1)計算每一篇歌詞的情感特征向量:
其中,Ek表示情感特征向量中第k維的值;Wi表示一篇歌詞經(jīng)過分詞處理后的第i個詞語;BWk,j表示情感詞典中第k維情感子類中的第 j個詞匯;bool(Wi,BWk,j)為判斷Wi與BWk,j是否同一詞匯的函數(shù),是則取值為1,否則取值為0;Qk,j表示BWk,j所對應的情感傾向權重值,即2.2節(jié)中構建的情感詞典中的情感傾向權值;M表示情感詞典中第k維情感子類的詞匯數(shù)目;S表示該篇歌詞經(jīng)過分詞后得到的詞語總數(shù);StartTimei表示LRC歌詞文檔中的第i句歌詞的時間標簽;WordNumi表示第i句歌詞所包含的字數(shù);N表示該篇LRC歌詞文檔在經(jīng)過時間標簽排序后的句子總數(shù)。
通過考慮情感詞典的結構信息,給出了公式(1)用于計算歌詞的情感特征向量。該方法不是純粹使用模糊數(shù)學上的and,or,not將多個詞連接,而是將歌詞中所有屬于情感詞典中每個情感子類中所有三級情感詞匯的權重值進行累加,除以詞匯的總數(shù)得到的均值即為特征向量前8維的取值,再通過計算LRC歌詞文檔的語速信息值,并賦值于特征向量的第9維。這樣綜合考慮了歌詞情感表達的語義信息和節(jié)奏強度信息,增加了隸屬該情感類別的可靠性,使得利用情感向量空間模型能夠取得更好的分類性能。
2.4 歌詞情感分類
本文采用KNN分類算法用于歌詞情感分類,每篇歌詞的情感特征表示成一個9維的情感特征向量。首先對歌詞的情感特征向量進行歸一化處理,然后利用KNN分類的思想,對每個測試樣例,計算它與所有訓練樣例之間的情感特征向量的歐幾里德距離,以確定其最近鄰列表。最后使用多數(shù)表決的方法,分別對測試樣例進行單標記分類和多標記分類。單標記分類將最近鄰中出現(xiàn)次數(shù)最多一個類別作為測試樣例的類別,多標記分類將最近鄰中出現(xiàn)次數(shù)最多的前三個類別作為測試樣例的三個類別。針對不同規(guī)模的樣本集進行多次實驗。注意,本文進行了兩次實驗,在2.2節(jié)中提到需要進行多次小規(guī)模實驗,目的是得到最佳的閾值threshold。而最終的歌詞情感分類是在情感詞典已經(jīng)構建的條件下進行,即2.2節(jié)中在threshold為0.3的條件下構建的情感詞典。
在多次不同規(guī)模的實驗中,以下是實驗結果最優(yōu)的實驗。
(1)數(shù)據(jù)集為從歌詞文本語料庫中抽取了情感類別鮮明的LRC歌詞文檔共169篇,每個情感類別約20篇。
(2)將數(shù)據(jù)集按1∶1的比例分為訓練集和測試集,按照上述歌詞的情感分類方法進行單標記分類和多標記分類實驗。在以下實驗中,當k取值為9時分類效果最佳。實驗結果如表4,表5所列。
表4 歌詞情感分類——單標記分類測試結果
表5 歌詞情感分類——多標記分類測試結果
從測試結果中的分類效果度量值可以看出,本文提出的歌詞情感單標記分類器的平均準確率為0.705,查全率為0.705,F(xiàn)1值為0.697;多標記分類器的平均準確率為0.817,查全率為0.825,F(xiàn)1值為0.812。其中多標記分類比單標記的評估參數(shù)值提高了11%左右,且抒情、快樂和熱情等類別的分類效果較好,在一定程度上實現(xiàn)了以文字為基礎的情感分類要求,進一步驗證了本文中所構建的音樂領域的中文情感詞典在歌詞的情感分類上具有較好的性能,能夠比較準確地反映音樂領域內各情感子類的情感特征。
同時亦容易發(fā)現(xiàn),神圣、悲傷、輕盈等類別的歌詞的情感分類效果不佳,經(jīng)認真分析整個過程,認為問題在于以下方面:
(1)情感模型。本文構建情感詞典所采用的情感模型是改進后的Hevner模型,是將原Hevner模型中的英文詞匯翻譯成中文的基礎上,再針對中國民族音樂進行改進的,而本文的研究內容主要是華語流行音樂,故在歌詞的用詞特點方面可能存在差異。
(2)情感詞典。經(jīng)過查看情感詞典中各類情感詞的數(shù)量分布,即表3所列,發(fā)現(xiàn)詞匯的分布出現(xiàn)異常,如“生機”,情感詞匯為868,顯然高于其他各類的情感詞匯數(shù)量,直接影響了基于歌詞文本的情感向量的構建結果。
(3)基于歌詞文本的情感向量。構造過程中暫未考慮詞頻的影響。
(4)分類方法。本文采用KNN算法作為分類方法,單一的分類器對分類效果存在影響。
本文針對歌詞領域,提出了一種中文音樂情感詞典構建方法及情感分類方法,其中借助了情感模型、歌詞語料庫、HowNet相似度計算方法,初步實驗取得了較好的結果,在一定程度上證明了該構建方法及分類方法的可行性與實用性。該方法可為音樂情感分析研究者提供一種思路,幫助其進行相關的情感分析工作。在以后的研究中將從以下幾個方面進行改進。
(1)針對情感模型進行進一步的改進或修改,嘗試使用社會標簽作為情感分類類別,即普遍認可及廣泛使用的一些音樂情感,而非“神圣”、“生機”等過于書面化的詞語表達。
(2)針對情感詞典的構建,采用人工檢查方式去除情感詞典中的異常詞匯及無意義詞匯,研究各個分類的詞語特點,優(yōu)化情感詞典。
(3)針對基于歌詞文本的情感向量的構建,嘗試增加詞頻及實詞詞性的影響作用及優(yōu)化整體構建方法,如針對部分區(qū)分度不高的情感詞匯,可以理解為該詞在多個類別所屬的情感詞匯中都存在,增加參數(shù)用于降低這部分詞語的權重,同時提高高區(qū)分度詞語的權重。
(4)針對分類方法,嘗試使用除KNN算法外的其他分類算法,對比不同分類方法的效果。
(5)結合基于音頻的情感分析方法,以提高情感分類的準確率。
[1]第31次中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告[R].中國互聯(lián)網(wǎng)網(wǎng)絡信息中心,2013.
[2]蔣盛益,李霞,王連喜.音樂情感分析綜述[J].計算機工程與設計,2010,31(18):4112-4115.
[3]夏云慶,楊瑩,張鵬洲.基于情感向量空間模型的歌詞情感分析[J].中文信息學報,2010,24(1):99-104.
[4]董振東,董強.知網(wǎng)和漢語研究[J].當代語言學,2001,3(1):33-44.
[5]梅家駒,竺一鳴,高蘊琦,等.同義詞詞林[M].上海:上海辭書出版社,1983.
[6]Subasic P,Huettner A.Affect analysis of text using fuzzy semantic typing[J].IEEE Trans on Fuzzy Systems,2001,9(4):483-496.
[7]Liu H,Lieberman H,Selker T.A model of textual affect sensing using real-world knowledge[C]//Proc of the 11th Int Conf on Intelligent User Interface,2003:125-132.
[8]徐琳宏,林鴻飛,趙晶.情感語料庫的構建和分析[J].中文信息學報,2008,22(1):116-122.
[9]佘莉,夏虎,傅彥.音樂評論的情感挖掘研究[J].計算機科學,2009,36(5):172-176.
[10]陳若涵,許肇凌,張智星,等.以音樂內容為基礎的情緒分析與辨識[C]//第二屆電腦音樂與音訊技術研討會,中國,臺灣,臺北,2006.
[11]鄭亞斌,劉知遠,孫茂松.中文歌詞的統(tǒng)計特征及其檢索應用[J].中文信息學報,2007,21(5):61-67.
[12]丁效,宋凡,秦兵,等.音樂領域典型事件抽取方法研究[J].中文信息學報,2011,25(2):15-20.
[13]劉濤.音樂情感認知模型與交互技術研究[D].杭州:浙江大學計算機科學與技術學院,2006.
JIANG Shengyi1,YANG Yao2,LIAO Jingxin1
1.School of Informatics,Guangdong University of Foreign Studies,Guangzhou 510006,China
2.Taobao(China)Software Co.Ltd,Hangzhou 310099,China
Among all the applications for China Internet users,instant message has first-largest users,search engine has the second-largest users and the web music has the third-largest users.Web music and its application technology have been popular with academics.Music plays an important role as a communication media in human communication which carries abundant information of emotion.As a result,musical emotion analysis has been paid more attention.During the process of musical emotion analysis which is based on lyric texts,a reasonable musical semantic lexicon will provide a more accurate result.This paper is about how to build a Chinese musical emotional lexicon which is based on the improved model of Hevner emotional ring model and the semantic knowledge resources provided by HowNet and a text corpus of lyrics. Also it realizes a method of lyric emotional classification with the help of emotional VSM,emotional lexicon and lyrics speed.The experiments show that the Chinese emotional lexicon built here is more suitable in the area of music than the lexicon built by manual.
Chinese emotional lexicon;musical emotion analysis;Hevner emotional ring model;HowNet
作為僅次于及時通信和搜索引擎的中國互聯(lián)網(wǎng)網(wǎng)民第三大應用,網(wǎng)絡音樂及其應用技術受到業(yè)界學者的青睞。音樂作為人類最重要的交流媒介,攜帶著豐富的情感信息,計算機音樂情感分析更是得到人機情感交互技術領域的高度重視。在基于歌詞文本的音樂情感分析過程中,一部合理的音樂領域情感詞典,將提供更加細致、更加準確的分析結果。以改進后的Hevner情感環(huán)模型為基礎,借助HowNet所提供的語義資源和從網(wǎng)絡爬取的歌詞文本語料庫,構建了一部樹形層次結構的音樂領域中文情感詞典,并利用LRC歌詞攜帶的時間標簽獲取歌曲的語速信息,實現(xiàn)了基于情感向量空間模型和情感詞典的歌詞情感分類。實驗表明與人工構建的情感詞典相比,所構建的情感詞典更適用于音樂領域。
中文情感詞典;音樂情感分析;Hevner情感環(huán)模型;知網(wǎng)
A
TP311
10.3778/j.issn.1002-8331.1305-0147
JIANG Shengyi,YANG Yao,LIAO Jingxin.Research of building Chinese musical emotional lexicon and emotional classification.Computer Engineering and Applications,2014,50(24):118-121.
國家自然科學基金(No.61070061);教育部人文社會科學青年基金項目(No.12YJCZH281);廣州市越秀區(qū)科技計劃項目(No.2012-TP-005)。
蔣盛益(1963—),男,博士,教授,主要研究方向:數(shù)據(jù)挖掘、自然語言處理;陽垚(1991—),女,本科,主要研究方向:數(shù)據(jù)挖掘;廖靜欣(1990—),女,碩士研究生,主要研究方向:數(shù)據(jù)挖掘。E-mail:jiangshengyi@163.com
2013-05-14
2013-06-29
1002-8331(2014)24-0118-04
CNKI網(wǎng)絡優(yōu)先出版:2013-09-04,http∶//www.cnki.net/kcms/detail/11.2127.TP.20130904.1344.015.html