国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向中文歌曲的音樂推薦服務型本體研究

2017-05-02 15:27:20康趙楠潘善亮
移動通信 2017年6期
關鍵詞:構建方法

康趙楠+潘善亮

【摘 要】為了構建一個適用中文歌曲及聽眾的音樂推薦服務型本體(CHMO)來對音樂知識進行自動化處理。首先,設計一個細粒度的音樂本體模型;然后,提出合理的構建原則和方法,并利用Protégé和OWL建立本體;接著,詳細闡述本體中的組成內容,并采用Jena進行推理優(yōu)化模型;最后,完善本體,包括算法檢測以及本體實現(xiàn)中的支持性問題。

【關鍵詞】音樂本體建模 構建方法 推理規(guī)則

1 引言

基于個性化的音樂推薦已經(jīng)成為推薦系統(tǒng)的研究熱點[1]。音樂作為一門憑借聲波振動而存在、在時間中展現(xiàn)、通過人類的聽覺器官而引起各種情緒反應和情感體驗的藝術存在[2],本體(Ontology)是客觀現(xiàn)實的抽象本質[3]。

在關于音樂本體的研究中,主要以基礎理論研究為主導,其次是對其用途進行研究[5-7]。Yves Raimond等[8]開發(fā)了音樂本體Music Ontology。Han等[9]通過本體推理機分類情境實例來推理出用戶的心情和音樂偏好。Rho等[10]提出了基于情境的音樂推薦本體Context-Based Music Recommendation Ontology。由于中西方審美的差異[11-12],針對西方音樂和受眾的音樂本體在處理中文歌曲方面并不適用[13]。張冰冰結合現(xiàn)有已成熟的其他本體詞匯表得到了涵蓋影視音樂、歷史事件、地點文化等的相關本體的本體知識庫[14]。薛云在構建好的民樂領域本體基礎之上完成語義推理[15]。

本文將詳細介紹構建一個互聯(lián)網(wǎng)下涵蓋數(shù)字音樂領域知識及情境信息的可以共享的基于中文歌曲的音樂推薦本體,并對該音樂本體進行屬性約束及其一致性的檢測與分析。

2 音樂本體的構建

2.1 音樂對象的確定

在構建本體之前,要明確該領域本體的各項構成要素,它包括了目的、范圍、表示方法和用途等等,以此使得目標本體的主要輪廓變得清晰。本階段可以得到關于本體的開發(fā)目的和詳細的說明書。一旦確定了領域本體的范圍,接著盡最大可能地羅列出該領域本體的有關術語或概念。音樂作為一個獨立的領域,它所包含的對象是十分豐富的。

針對互聯(lián)網(wǎng),借鑒已有的音樂概念,增加符合基于中文歌曲和華人收聽習慣的術語描述。

音樂對象包括音樂人、專輯、歌詞、圖片、語種、風格、場景、情感、節(jié)日、主題等多個方面。為了使用戶更加容易理解以及后續(xù)工作的使用,在音樂本體中增加標簽來統(tǒng)一管理部分知識(能夠代表一首音樂內在性質的關鍵詞)。

2.2 音樂本體的構成要素

本文所設計的數(shù)字音樂領域本體主要通過分類歌曲信息以進一步細化出用戶的興趣偏好。它所包含的概念或者術語間存在著上下位的關系,其本質上是一個概念層次樹,且只含有父類和子類。父類概念是子類概念的一種泛化,而子類概念是父類概念的一種分類,它可以從不同角度對上級概念進行一個深層次的細化,同時分類的層次越深,相應的用戶興趣劃分的力度就會越大,對用戶偏好的分析也就可以越細致。

本文在Protégé[16]平臺上使用一個七元組的形式自上而下地來描述和完善音樂本體(CHMO)模型:

CHMO={C, P, RC, HC, I, A, R} (1)

其具體描述如下:

(1)C(Class或Concept)表示本體覆蓋的類(概念、術語)的集合。當個體具有相似的性質,可以將之抽象成相應的類,而這里的個體就是類的實例。

(2)P(Property)表示屬性集合。屬性是對類的表征和描述,包括兩種,即對象屬性和數(shù)據(jù)屬性。

(3)RC(Relation)為關系的集合。形式上可以定義為一組n維笛卡爾積的子集R:C1×C2×...×Cn概念之間有四種基本關系,如表1所示。

(4)HC(Hierarchy)表示音樂本體概念的層次結構。形式上可以定義為:H(C1,C2)表示概念C1是概念C2的子概念。

(5)I(Instance)表示實例集合。它是本體類包含的基本元素。

(6)A(Axiom)表示公理的集合。在音樂本體中,每個元素都有特定的意義,元素之間也存在著連接或約束,公理表示一些永真式,用來解釋元素和它們之間的相關性和約束關系。

(7)R(Ratiocination)表示推理規(guī)則。用來模仿推理能力。

依據(jù)以上描述可以看到本文所設計的音樂本體的知識結構包括類、屬性、關系、層次、實例、公理和推理規(guī)則。這種結構通過“類-屬性-實例”,三位一體式描述音樂并擴展其相關知識,確定其關系和層次結構,最后使用公理和推理規(guī)則約束知識,完成音樂知識網(wǎng)絡體系結構。

2.3 音樂本體的構建原則

參照Gruber于1995年[17]所提出的比較權威的五條標準,進一步闡釋音樂本體構建原則,包括以下方面:

(1)明確性和客觀性:即本體的術語應該具有明確的自然語言的形式以及客觀的定義。

(2)完全性和完整性:即要對音樂本體中術語的意義提供完整、準確定義和詳細說明。

(3)一致性:即本體是前后一致的。

(4)最大單調可擴展性:即添加一個新項,不需要調整原本體。

(5)編碼偏好程度最?。杭匆魳繁倔w位于知識水平的表達,不限于編碼語言。

(6)與層次概念保持最小的語義距離。

(7)最小本體承諾:即建模對象的約束盡量少,只要能滿足當前需求的特定的知識共享。

(8)盡可能使用標準化的術語名稱。

(9)使用多樣的概念層次結構實現(xiàn)多繼承機制。

2.4 音樂本體的構建方法

上文提到,音樂本體包含音樂人、專輯、圖片、語種、風格、場景、情感、節(jié)日、主題、音樂獎項、專輯、時間等子本體。根據(jù)音樂本體的組織結構和構建原則,參照已有的TOVE法[18]和七步法[19],設計本文音樂本體的構建方法,采用OWL DL描述語言和Protégé 4.3,主要步驟如下:

(1)音樂對象的收集和分析。對音樂知識獲取、分析和記錄,初始化管理和保護音樂對象。

(2)音樂本體內容和范圍的合理界定,確定名詞術語的來源。一般而言,領域本體是覆蓋整個領域的本體,但具體的討論往往不是那么簡單。本文從網(wǎng)絡出發(fā),給出數(shù)字音樂本體的定義,所以沒有完全覆蓋音樂學科的基本內容,但參照了《音樂百科詞典》和《2015-2016中國手機音樂客戶端市場研究報告》,增加專輯和標簽等知識,細化分類,形成一個數(shù)字音樂庫。

(3)刻畫音樂本體的術語表,對名詞術語進行規(guī)范。構建本體之前,列出所有術語表的詞匯項。

(4)確定音樂本體的類和實例。

(5)區(qū)別音樂本體結構和類之間的關系。具體方法是自上而下、從下到上、綜合方法這三種。自上而下是先確定一般的類,不斷找到一個新的子類,最終實現(xiàn)最特別的類;從下到上先確保本體中特殊的類,不斷歸納類,最后達到本體中最一般類;綜合方法是它們的組合。本文基于綜合方法,結構如圖1所示。

(6)借鑒和復用現(xiàn)有本體。CHMO中復用人、時間、語種等公共信息本體以及DBpedia中的部分術語,同時參考已有的The Music Ontology[20]對術語進行標準化。

(7)定義音樂本體中類的屬性。根據(jù)最常用的原則和符合用戶欣賞的特點,設置屬性,從不同的側面對音樂本體的類進行描繪。

(8)添加標簽。鑒于國內主流音樂平臺的使用情況,為基于中文歌曲的音樂推薦本體添加標簽這一概念,它包含了情感、節(jié)日、語種、場景、風格、主題子本體以及它們所各自包含的子本體,為了便于用戶理解本體的概念和使用,從而進一步完善音樂本體。

(9)描述類中的實例。基于實例的描述來確定最終的實例與類關系,完成一個概念體系的構建。

(10)建立公理庫和推理規(guī)則。利用OWL描述公理和規(guī)則,進行音樂本體的一致性分析。

(11)形成音樂本體的文檔。通過持續(xù)改進使本體逐步接近人類對客觀世界的認知,形成文檔管理的過程。

(12)檢查異常。在Protégé中,可以使用推理機對本體自身的不一致和置入本體的實例集不一致進行檢測。

3 音樂本體的描述

3.1 類間的層次體系

本體中的類包含兩種作用:(1)對自身及其所包含的知識含義的描述。類中包含知識,知識可以是類本身,也可以是類實例的共同點。(2)限定對類的子類和實例的描述。通過分析,最終確定了“音樂人”、“時間”、“圖片”、“標簽”、“歌詞”、“音樂獎項”、“專輯”為核心詞匯,滿足非二義性、互不相交的要求。各個頂級概念之下再擴展具體的類。部分音樂本體的類術語表如表2所示,層次概念如圖2。

3.2 屬性及關系

音樂本體的屬性包括發(fā)行時間、風格、主題、專輯詳情、歌詞、時長等等,分為對象屬性和數(shù)據(jù)屬性。對象屬性指兩個類的實例之間的關系,定義域是類,值域是實例;數(shù)據(jù)屬性規(guī)定類的實例、文字及數(shù)據(jù)類型間的關系,定義域是某個類的實例,值域可以是int、string、float等,該屬性不能為傳遞的、對稱的和反函數(shù)的。音樂本體的屬性術語部分如表3所示,屬性關系如圖3和圖4所示。

3.3 添加標簽

添加標簽類目,用來代表一首音樂內在內容的一種性質,可以簡單理解為關鍵詞描述。它除了包括基本的分類信息:語種、主題、風格等,還額外添加歌曲所涉及的情感和場景這兩個情境信息子類。在這兩個子類中又進一步劃分數(shù)個類,從而達到一個細粒度的本體建模,能夠更適合互聯(lián)網(wǎng)下基于本體的音樂個性化推薦研究。

3.4 生成實例

在Protégé中的Individuals面板中可直接添加類的實例(個體),在這個實例中對每個屬性進行賦值,這樣就可以構建音樂本體了。為了直觀地描述音樂本體類和實例,給出應用的例子,其中歌曲類和歌曲實例《山丘》的部分框架表示如圖5所示。

3.5 基于本體和自定義規(guī)則的推理

(1)公理和推理規(guī)則的表示

依據(jù)音樂本體屬性和關系,再結合領域本體的公理集,采用謂詞邏輯系統(tǒng)來設計本文的音樂本體公理。主要包括了函數(shù)屬性、反函數(shù)屬性、傳遞屬性、對稱屬性、自反屬性等,其中所謂函數(shù)性是指同一個參數(shù)的函數(shù)值是唯一確定的,反函數(shù)性則與之相反。如果一個屬性是傳遞性的,那么它的逆屬性也是具有傳遞性的。傳遞性和函數(shù)性不兼容,如果一個對象屬性具有傳遞性就不可能有函數(shù)性等等,這些公理將作為推理機制中的約束。比如其中函數(shù)屬性形式化表示如下:

推理規(guī)則是一個重要的基礎,主要分為兩點:

1)完善音樂知識,獲取隱含的信息;

2)檢測和維護音樂知識,確保本體的一致性和完整性。本文音樂本體部分自定義推理規(guī)則可以寫成如下的形式:

如果歌曲的封面是某一位歌手的照片,那么這位歌手即是其音樂人。

自定義的規(guī)則大多來自既定事實的表述。其中規(guī)則(5)和規(guī)則(6)體現(xiàn)了標簽子類情感-幸福-快樂三者上下層關系的一個遞進。利用謂詞邏輯描述信息,然后通過自定義的規(guī)則產(chǎn)生新的、隱含的上層知識。

(2)推理工具

本文采用Jena作為推理工具,它的軟件包能夠同時支持本體推理和自定義規(guī)則的推理。

Jena[21]是支持語義網(wǎng)應用的一個Java應用程序接口,它包含以下模塊:RDF的API、解析器、內存存儲與永久性存儲、推理機子系統(tǒng)、本體子系統(tǒng)和查詢模型。其中推理機子系統(tǒng)具有兩大功能:

1)支持使用RDFS和OWL語言,能夠加入一系列推理引擎或推理機來獲取額外的信息;

2)包括一個可以用于許多RDF處理或轉換任務的一般的規(guī)則引擎。

(3)推理流程

步驟1:獲取歌曲信息并描述。

步驟2:將信息持久性保存到知識庫中。

步驟3:觸發(fā)推理行為,利用推理機對信息進行推理得到上層或者新的隱含的信息。

步驟4:對比知識庫,檢測新信息的一致性和正確性。

步驟5:如果上一步產(chǎn)生沖突,則進行沖突處理。沒有沖突,則推理結束,更新知識庫。

推理流程如圖6所示:

(4)推理規(guī)則有效性驗證

將自定義規(guī)則寫入規(guī)則庫后,使用SPARQL和Jena進行當前歌曲信息的查詢與推理本體模型,系統(tǒng)會自動校驗規(guī)則前后的狀態(tài),判斷其是否有效。通過所構建的合理的本體推理機制,能夠對隱含的知識進行有效地推理,節(jié)省存儲空間的同時還能夠提高讀取效率,還能優(yōu)化知識的梳理。

4 音樂本體的完善

上述步驟后已經(jīng)初步建立了一個基本的音樂本體,接下來將進一步闡釋驗證本體過程中的一些關鍵內容。

本體的一致性是指本體中各概念沒有矛盾。一致性檢測就是根據(jù)本體中的公理和約束來判斷整個結構是否存在矛盾,如果存在矛盾和不一致的地方需要及時進行修正。

4.1 類間關系的一致性檢測

首先,定義音樂本體的類間關系。

4.2 基于音樂公理的知識一致性分析

公理作為本體的一個重要組成部分,它的功能有兩個:第一,公理即知識;第二,公理保證本體中低水平的知識是一致的。這里所提的知識一致性指的是公理約束下的知識和公理沒有矛盾。獲取的知識的過程并不總是正確、沒有矛盾的。知識獲取的過程中知識來源的不準確,人為的過失等原因,都可能導致知識是不一致的。當一首歌曲是契合婚禮的這一特定情形的音樂,那么它所表達的情感一定是幸福、開心的。如果出現(xiàn)情感是悲傷的,則報告本體出現(xiàn)錯誤。

本體的一致性分析是一項非常復雜的任務。它涵蓋了本體中的類、屬性和實例等諸多方面,需要不斷地更新知識,逐步完善本體。

4.3 音樂本體實現(xiàn)中的問題及解決

目前,Protégé的中文支持性很差,而本文所構建的互聯(lián)網(wǎng)下基于中文歌曲的音樂本體模型中所涉及的多處概念,比如標簽、主題都是基于中文或者中文環(huán)境的。為了解決這個問題,本文通過mapping.properties文件實現(xiàn)中文到相應英文或者拼音的映射操作。部分mapping.properties文件映射片段如圖7所示。

5 結束語

本文根據(jù)現(xiàn)代互聯(lián)網(wǎng)下數(shù)字音樂領域的形勢,針對中文歌曲及聽眾,通過擴展構建新的音樂本體模型,設計音樂本體的構建方法及構建流程,闡明了對音樂領域知識構建本體的必要性和可行性。構建方覆蓋本體建設和維護的生命周期,與現(xiàn)有的本體建設方法相比更加細粒度且全面。本文所建立的面向中文歌曲及聽眾的音樂本體模型既先進也實用,對下一代網(wǎng)絡平臺下數(shù)字音樂服務的推廣具有重要意義,同時也將會進一步應用在后續(xù)的音樂個性化推薦研究中。隨著信息地不斷擴充,該本體模型的完善工作將持續(xù)進行。

參考文獻:

[1] 譚學清,何珊. 音樂個性化推薦系統(tǒng)研究綜述[J]. 現(xiàn)代圖書情報技術, 2014,30(9): 22-32.

[2] 繆天瑞. 音樂百科詞典[M]. 北京: 人民音樂出版社, 1998.

[3] Gruber T R. A translation approach to portable ontology specifications[J]. Knowledge Acquisition, 1993(5): 199-220.

[4] LU R. Knowledge engineering and knowledge science at the turn of the century[M]. Beijing: Tsinghua University Press, 2001.

[5] Seheon Song, Minkoo Kim, Seungmin Rho, et al. Music Ontology for Mood and Situation Reasoning to Support Music Retrieval and Recommendation[A]. Third International Conference on Digital Society[C]. 2009: 304-309.

[6] Sefki Kolozali, Mathieu Barthet, Gy?rgy Fazekas, et al. Knowledge Representation Issues in Musical Instrument Ontology Design[A]. 12th International Society for Music Information Retrieval Conference[C]. 2011: 465-470.

[7] Marius Kaminskas, Ignacio Fernandeztobias, Ivan Cantador, et al. Ontology-Based Identification of Music for Places[Z]. 2013.

[8] Yves Raimond, Samer A, Abdallah, et al. The Music Ontology[A]. International Society for Music Information Retrieval Conference[C]. 2007: 417-422.

[9] Han B J, Rho S, Jun S, et al. Music Emotion Classification and Context-Based Music Recommendation[J]. Multimedia Tools and Applications, 2010,47(3): 433-460.

[10] Rho S, Song S, Hwang E, et al. COMUS: Ontological and Rule-Based Reasoning for Music Recommendation System[A]. Advances in Knowledge Discovery and Data Mining[C]. Springer Berlin Heidelberg, 2009: 859-866.

[11] 李姝. 中西音樂美學的比較研究[D]. 成都: 四川大學, 2007.

[12] 劉正維. 中西音樂結構的審美異同散論[J]. 音樂研究, 2003(3): 3-16.

[13] Mi Tian, Gy?rgy Fazekas, Dawn A, et al. Towards the representation of Chinese traditional music: a state of the art review of music metadata standards[A]. Dublin Core Conference[C]. 2013: 71-81.

[14] 張冰冰. 基于領域本體的景點影視音樂推薦[D]. 杭州: 浙江大學, 2014.

[15] 薛云. 基于民樂領域本體的語義推理研究[J]. 情報探索, 2009(4): 104-106.

[16] Protégé. Stanford Center for Biomedical Informatics Research[EB/OL]. (2016-02-09)[2017-01-10]. http://protege.stanford.edu/.

[17] Gruber T R. Towards principles for the design of ontologies used for knowledge sharing[J]. International Journal of Human-Computer Studies, 1995(43): 907-912.

[18] University of Toronto. Faculty of Applied Science and Engineering TOVE ontologies[EB/OL]. (2013-09-18)[2017-01-10]. http://www.ie.utoronto.ca/EIL/tove/toveont.html.

[19] NOY N F, McGUINNESS D L. Ontology development 101: a guide to creating your first ontology: knowledge systems laboratory, SMI-2001-0880[R]. Stanford University, 2001.

[20] Rory Pickering. The Music Ontology[EB/OL]. (2015-11-30)[2017-01-10]. http://musicontology.co/.

[21] Apache Jena. A free and open source Java framework for building Semantic Web and Linked Data applications[EB/OL]. (2016-02-09)[2017-01-10]. http://jena.apache.org/.

猜你喜歡
構建方法
淺析初中物理教學中物理模型的構建策略
未來英才(2016年2期)2016-12-26 15:19:00
簡論中學體育課堂學習共同體的構建
新環(huán)境下學習型企業(yè)管理模式的優(yōu)質分析
英語翻譯實踐中文化欠缺及其建構的具體方法分析
考試周刊(2016年21期)2016-12-16 10:35:56
高中數(shù)學生成性課堂的構建策略探討
新形勢下高職生誠信檔案的有效構建方法
求知導刊(2016年30期)2016-12-03 09:22:36
構建符合學生心理的數(shù)學課堂
淺論高中地理“雙動兩案”的教學模式構建
考試周刊(2016年86期)2016-11-11 09:00:41
如何構建高效的小學語文課堂
考試周刊(2016年76期)2016-10-09 08:48:33
淺談陽光語文課堂的構建
考試周刊(2016年74期)2016-10-08 13:54:07
绥滨县| 临桂县| 丰顺县| 宜昌市| 安丘市| 安达市| 巴塘县| 齐齐哈尔市| 朝阳区| 龙川县| 凤庆县| 镇坪县| 威宁| 休宁县| 社旗县| 榕江县| 灵武市| 金山区| 克什克腾旗| 桐庐县| 富阳市| 高邑县| 忻城县| 建宁县| 浮山县| 萨迦县| 莱芜市| 古交市| 舞阳县| 临洮县| 永川市| 唐山市| 汤阴县| 融水| 德惠市| 武宣县| 隆德县| 东乡族自治县| 洞头县| 扎鲁特旗| 辛集市|