国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度學(xué)習(xí)的個性化音樂推薦算法研究

2020-11-13 03:38余莉娟
微型電腦應(yīng)用 2020年10期
關(guān)鍵詞:推薦系統(tǒng)深度學(xué)習(xí)個性化

余莉娟

摘要:互聯(lián)網(wǎng)技術(shù)和電子信息技術(shù)的迅速發(fā)展為整個時代提供了巨大的計算能力,個性化推薦系統(tǒng)成為時代產(chǎn)物的縮影。結(jié)合常用的推薦系統(tǒng)核心算法,設(shè)計了一種針對個性化音樂的Apriori改進(jìn)算法,此算法通過用戶信息進(jìn)行深度學(xué)習(xí),利用候選矩陣壓縮的方法進(jìn)行推薦優(yōu)化,采用準(zhǔn)確性、召回率等參數(shù)作為評價標(biāo)準(zhǔn)。以Last.fm音樂網(wǎng)站的部分?jǐn)?shù)據(jù)作為分析樣本,對選定音樂按個性化音樂推薦方式進(jìn)行試驗,Apriori改進(jìn)算法在準(zhǔn)確率和召回率方面均得到優(yōu)化,推薦效果更優(yōu)。在考慮推薦數(shù)量的前提下,Apriori改進(jìn)算法的準(zhǔn)確率和召回率均高于Plaucount算法,而相似度方面低于Plaucount算法。

關(guān)鍵詞:深度學(xué)習(xí);推薦系統(tǒng);個性化;音樂

中圖分類號:G643

文獻(xiàn)標(biāo)志碼:A

ResearchonPersonalizedMusicRecommendationAlgorithmBasedonDeepLearning

YULijuan

(CollegeofArt,ShangluoCollege,Shangluo726000,China)

Abstract:RapiddevelopmentoftheInternettechnologyandelectronicinformationtechnologyhasprovidedhugecomputingpowerforthewholeera,andpersonalizedrecommendationsystemhasbecometheepitomeoftheproductoftheera.Combinedwiththecommoncorealgorithmofrecommendationsystem,thispaperprovidesanimprovedApriorialgorithmforpersonalizedmusic.Thisalgorithmappliesuserinformationforindepthlearning,candidatematrixcompressionforrecommendationoptimization,accuracy,recallrateandotherparametersasevaluationcriteria.TakingpartofthedataofLast.fmmusicWebsiteastheanalysissample,theselectedmusicistestedaccordingtothepersonalizedmusicrecommendationmode.TheAprioriimprovedalgorithmisoptimizedinaccuracyandrecallrate,andtherecommendationeffectisbetter.Onthepremiseofconsideringthenumberofrecommendations,theaccuracyandrecallrateofAprioriimprovedalgorithmarehigherthanthatofPlaucountalgorithm,andthesimilarityislowerthanPlaucountalgorithm.

Keywords:deeplearning;recommendationsystem;personalization;music

0引言

伴隨著互聯(lián)網(wǎng)技術(shù)和電子信息技術(shù)的迅速崛起,大數(shù)據(jù)技術(shù)、云計算技術(shù)、機(jī)器人技術(shù)、人工智能技術(shù)、深度學(xué)習(xí)技術(shù)[1]等方面的發(fā)展尤為突出,對整個信息時代的進(jìn)步與發(fā)展提供了巨大的計算能力。在如此海量的信息中,快速準(zhǔn)確地找到所需信息變得越來越重要,而且有價值。由此而誕生的推薦系統(tǒng)[23]成為了用戶需求與內(nèi)容之間的橋梁,既可以滿足用戶找到感興趣的潛在內(nèi)容,也能夠更好地展示冷門內(nèi)容,發(fā)掘潛在用戶。

當(dāng)今社會已擁有更為強(qiáng)大的包容性,不同領(lǐng)域也均呈現(xiàn)出獨有的個性化和多元化,個性化推薦系統(tǒng)則能夠滿足不同用戶的需求,精準(zhǔn)地為用戶提供更好地體驗,由此產(chǎn)生了巨大的商業(yè)價值,成為互聯(lián)網(wǎng)企業(yè)爭相搶奪的“蛋糕”。

目前,個性化推薦系統(tǒng)早已得到廣泛認(rèn)可,并悄然融入到我們的生活中。音樂作為一種古老的藝術(shù)形式,能夠為人們帶來愉悅,但從海量的音樂作品中精準(zhǔn)地找到滿足用戶需求的音樂,則需要個性化音樂推薦系統(tǒng)根據(jù)用戶行為篩選適合用戶的個性化音樂,滿足用戶在當(dāng)時情景的需求,從而達(dá)到“眾口可調(diào)”的目的。

1推薦系統(tǒng)及核心算法

電子商務(wù)領(lǐng)域的推薦系統(tǒng)應(yīng)用最為廣泛,隨著互聯(lián)網(wǎng)在各領(lǐng)域的不斷滲透發(fā)展,音樂推薦系統(tǒng)也映入眼簾,根據(jù)用戶偏好、音樂描述信息等內(nèi)容構(gòu)建推薦模型,將滿足用戶需求的音樂內(nèi)容推送出來。目前,常用的推薦方法主要分為基于內(nèi)容的推薦方法、協(xié)同過濾推薦方法和混合推薦方法三種類型[4]。

(1)基于內(nèi)容的推薦算法[5]

該方法為一類傳統(tǒng)的推薦方法,其基本思路就是根據(jù)用戶的歷史信息,對用戶的偏好行為進(jìn)行特征分析,得到用戶偏好集合,將這些集合與代推薦內(nèi)容進(jìn)行信息匹配,從而實現(xiàn)推薦。常用的音樂推薦算法有基于標(biāo)注內(nèi)容的推薦算法和基于音樂特征的音樂算法[6]。

以基于音樂標(biāo)注內(nèi)容的推薦算法為例,用戶A和用戶B對音樂的偏好類型分別為歐美、電音和華語、民謠,其中歐美、電音、華語、民謠均代表歌曲的風(fēng)格和類型,當(dāng)新歌曲c出現(xiàn)時,華語和民謠就成為該歌曲的標(biāo)注內(nèi)容,屬于特征信息,推薦系統(tǒng)則會根據(jù)這些特征信息優(yōu)先向用戶B推薦,從而實現(xiàn)精準(zhǔn)推薦,如圖1所示。

(2)協(xié)同過濾推薦算法

鑒于協(xié)同過濾算法具有普遍適應(yīng)性的特點,該算法被廣泛應(yīng)用于眾多領(lǐng)域。利用用戶偏好的相同性或相似性進(jìn)行內(nèi)容推薦是該算法的核心思想。協(xié)同過濾推薦算法主要包含基于用戶的協(xié)同過濾推薦算法、基于物品的協(xié)同過濾推薦

算法和基于模型的協(xié)同過濾推薦算法3種類型[7]。

以基于用戶的協(xié)同過濾推薦算法為例,用戶A、C在歌曲偏好的相似程度更高,如圖2所示。

推薦系統(tǒng)首先了解到兩位用戶對歌曲偏好的歷史數(shù)據(jù),再利用數(shù)據(jù)挖掘或深度學(xué)習(xí)的方式建立預(yù)測模型,雖然用戶A沒有關(guān)注歌曲d,但推薦系統(tǒng)仍可將歌曲d向用戶A實行預(yù)測推薦。

(3)混合推薦算法

單一的推薦算法在使用過程中都存在不足和局限性,很難滿足準(zhǔn)確推薦的要求。隨著用戶個性化要求的日益嚴(yán)苛和數(shù)據(jù)量的激增,需結(jié)合多種推薦算法發(fā)掘用戶信息和需求信息之間的相關(guān)性。目前混合推薦算法的發(fā)展方向主要有加權(quán)的混合、切換的混合、融入其他因素的混合和分層混合四種[68]。

1)加權(quán)的混合如式(1)。

fu,i=α1s1u,i+α2s2u,i+…+αnsnu,i

(1)

式中:u——任一用戶;

i——任一物品;

αn——不同的權(quán)重系數(shù);

sn——不同的推薦算法。

2)切換的混合如式(2)。

fu,i=β1u,is1u,i+β2u,is2u,i+…+

βnu,isnu,i

(2)

式中:β1u,i——用戶u推薦物品i時,snu,i所占的比重。

3)融入其他因素的混合如式(3)。

fu,i=∑nj=1λjsju,i,e1,e2,…,ek

(3)

式中:ek——需要特別考慮的因素。

4)分層的混合如式(4)。

fu,i=g∑nj=1λjsju,i

(4)

式中:g()——外層嵌套推薦算法;

∑nj=1λjsju,i——內(nèi)層推薦算法,加權(quán)、切換或融入其它因素的混合。

2個性化音樂推薦方法

2.1改進(jìn)的Apriori算法原理

關(guān)聯(lián)規(guī)則主要應(yīng)用于數(shù)據(jù)挖掘中發(fā)掘用戶行為,最早由Srikan提處[8],已在教育、保險等眾多領(lǐng)域內(nèi)得到廣泛應(yīng)用。Apriori算法是關(guān)聯(lián)規(guī)則挖掘算法中的基本類型之一,屬于一類頻集理論遞推的方法,主要依靠“頻繁項集的所有非空子集必定是頻繁的”[9]這一性質(zhì)得以實現(xiàn)。

Apriori算法通常是在首次循環(huán)實現(xiàn)對數(shù)據(jù)庫的掃描后得到1階大項集;在后續(xù)的第k次循環(huán)中對k-1階大項集Lk-1(第k-1次循環(huán)時產(chǎn)生)進(jìn)行Apriori_gen運(yùn)算,從而得到Ck,即k階候選項集;繼續(xù)對數(shù)據(jù)庫進(jìn)行掃面后得到Ck的支持?jǐn)?shù),進(jìn)一步會得到不小于最小支持?jǐn)?shù)的k階大項集;對上述步驟進(jìn)行重復(fù),當(dāng)出現(xiàn)某一階的大項集為空時,算法則會停止。

Apriori算法的詳細(xì)過程如下:

L1=large1-itemsets;

fork=2;Lk-1≠φ;k=k+1do

Ck=Apriori_genLk-1;//構(gòu)造候選項集

Foralltransactionst∈Ddo

Ct=subsetCk,t;//搜索事物t中包含的候選項集

ForallC∈CtdoC.sup=C.sup+1;Endfor//計算支持?jǐn)?shù)

Endfor

Lk=C∈CkC.sup≥minsup;//得到k階大項集

Endfor

L=∪kLk

Apriori算法同其他算法一樣,也具有自身的優(yōu)缺點。優(yōu)點在于當(dāng)支持度較高時,數(shù)據(jù)庫的掃描次數(shù)會較少且空間復(fù)雜程度低,缺點就是在數(shù)據(jù)庫掃描過程中會產(chǎn)生海量的候選集,存在重復(fù)掃面的現(xiàn)象出現(xiàn)。由于Apriori算法存在耗時長、效率低的劣勢,本文通過候選矩陣壓縮的方法進(jìn)行了優(yōu)化,在準(zhǔn)確性和效率方面均有所提升。具體步驟如下:

1)掃描整個音樂數(shù)據(jù)庫得到事務(wù)矩陣D;

2)對矩陣中的事務(wù)信息進(jìn)行編碼、排序處理,記錄為一行,對于小于閾值的項進(jìn)行刪除,得到只含0和1的d1,d2,d3,…,dn;

3)將矩陣H分解并升序排列為H1,H2,H3,…,Hm;

4)掃描列向量Dm,并對dnm進(jìn)行判斷;

5)若dnm=1,則取前m項(含dnm在內(nèi))形成子矩陣Hm,如式(5)。

M1M2M3M4M5M6

H=110001011000110100101011010011110011000011T1T2T3T4T5T6T7

(5)

假設(shè)支持度閾值為2,則得到的個性化音樂事務(wù)如表1所示。

與權(quán)重相結(jié)合,得到子集Ti的支持度如式(6)。

SupportTi=1l∑j∈tiwj×SupportTi

(6)

其中,l表示Ti的長度。

計算得到列向量和行向量分別為4,5,2,1,4,5T和3,2,3,4,3,4,2,經(jīng)降序排列得到矩陣H′,如式(7)。

M2M6M1M5M3M4

554421

H′=1100010110001101001010110100111100110000114433322

(7)

將行列和不滿足支持度閾值2的項處理后,得到矩陣H″,如式(8)。

M2M6M1M5

5544

H″=111101011110101011010101

(8)

矩陣H″經(jīng)分解處理后可知,M2、M6和矩陣H″經(jīng)分解處理后可知,M2、M6和M2、M1具有很強(qiáng)的關(guān)聯(lián)性。實際情況下,如果M2屬于用戶的關(guān)注音樂作品,即使M6、M1與M2缺乏內(nèi)容上的相似性,也會因強(qiáng)關(guān)聯(lián)性而被推薦給用戶。

2.2個性化音樂推薦方法

個性化音樂推薦的第一步計算用戶的興趣度。為了方便計算,需先對音樂庫中樂曲進(jìn)行分類編號,則用戶在第i類歌曲中第j首歌曲的欣賞時間占音樂欣賞的總時間比如式(9)。

ρij=tij-αijβij-αij

(9)

式中:βij為收聽時間最大值,αij為收聽時間最小值,tij的取值如式(10)。

tij=αij,t′ij≤αij

t′ij,αij≤t′ij≤βij

βij,t′ij≥βij

ρij,t′ij∈R,收藏歌曲

(10)

根據(jù)公式(9)中用戶對不同音樂收聽時間比例,則可計算用戶對i類音樂的興趣度,其計算如式(11)。

Inti=∑mj=1tij∑ni=1∑mj=1tij

(11)

獲取用戶興趣度后,利用音樂本身標(biāo)簽等音樂信息和基于用戶興趣的音樂標(biāo)簽之間的對應(yīng)關(guān)系,通過音樂信息預(yù)測和用戶興趣度計算的方式,從音樂庫中將強(qiáng)關(guān)聯(lián)性的音樂向用戶進(jìn)行推薦,滿足用戶的個性化需求,總體推薦流程,如圖3所示。

3試驗結(jié)果評估分析

(1)樣本數(shù)據(jù)集及試驗環(huán)境

為了減小數(shù)據(jù)采集對試驗結(jié)果造成的誤差,必須選用一個含有足夠數(shù)據(jù)量的數(shù)據(jù)庫,且各類算法的數(shù)據(jù)采集均出自于相同數(shù)據(jù)庫。因此本文選用了公開的Last.fm音樂網(wǎng)站數(shù)據(jù),目前該數(shù)據(jù)庫已包含近40萬條用戶記錄,且該數(shù)據(jù)庫

能夠支持用戶進(jìn)行自定義標(biāo)簽,方便對數(shù)據(jù)進(jìn)行標(biāo)定。本次試驗隨機(jī)選取4281條用戶記錄,其中包含音樂信息245314條和音樂標(biāo)簽14263個,利用數(shù)據(jù)處理軟件TRIFACTA軟件對數(shù)據(jù)庫進(jìn)行信息統(tǒng)計分析后得到標(biāo)簽分布情況如圖4所示。

由于本次試驗是對不同推薦系統(tǒng)推薦效率的橫向?qū)Ρ?,因此對比試驗的外部環(huán)境應(yīng)該是相同的,試驗的外部環(huán)境,如表2所示。

(2)試驗結(jié)果評價標(biāo)準(zhǔn)

本文是從評價的準(zhǔn)確性作為結(jié)果評價的首要標(biāo)準(zhǔn),在準(zhǔn)確性相同時引入結(jié)果多樣性指標(biāo)作為評價的輔助標(biāo)準(zhǔn)。根據(jù)相關(guān)研究[10],推薦系統(tǒng)的準(zhǔn)確度評價標(biāo)準(zhǔn)分類較多,各種分類標(biāo)準(zhǔn)間各有優(yōu)勢和不足,而本文的準(zhǔn)確度評價采用了目前較為普遍的準(zhǔn)確率和召回率兩個定量指標(biāo),如式(12)、式(13)。

準(zhǔn)確率=∑u∈URu∩Tu∑u∈URu

(12)

召回率=∑u∈URu∩Tu∑u∈UTu

(13)

式中:Ru——系統(tǒng)向用戶u推薦音樂集;

Tu——用戶u感興趣的原有音樂集;

U——用戶集。

在某些算法中,這兩個定量指標(biāo)在面對特定的數(shù)據(jù)集時的計算結(jié)果十分相近,難以對計算準(zhǔn)確度進(jìn)行客觀評價,因此本文參考相關(guān)文獻(xiàn)[1012],在計算準(zhǔn)確度基礎(chǔ)上引入結(jié)果多樣性指標(biāo),如式(14)。

Simu,r=∑ti∈M(r)Mti1+countr∈Mti

(14)

式中:ti——音樂標(biāo)簽;

Mti——采用音樂標(biāo)簽ti標(biāo)注的音樂集;

1+countr∈Mti——采用音樂標(biāo)簽ti的總數(shù)。

(3)試驗結(jié)果分析

通過調(diào)查分析,目前較為受歡迎的軟件大多采用Plaucount算法,因此本文采用Plaucount算法與改進(jìn)的Apriori算法進(jìn)行推薦對比分析,并以準(zhǔn)確率及召回率為判斷標(biāo)準(zhǔn),得到的試驗結(jié)果如圖5、圖6所示。

從圖5可以看出,當(dāng)音樂推薦次數(shù)不超過18次時,Plaucount算法和改進(jìn)的Apriori算法在準(zhǔn)確率方面相差不大;當(dāng)音樂推薦次數(shù)超過18次時,改進(jìn)的Apriori算法在準(zhǔn)確率方面則會顯著優(yōu)于Plaucount算法;對比結(jié)果表明,當(dāng)音樂推薦次數(shù)相同且達(dá)到一定數(shù)量時,改進(jìn)的Apriori算法的推薦效果明顯優(yōu)于Plaucount算法,更容易滿足用戶的個性化要求。

從圖6可以看出,改進(jìn)的Apriori算法在召回率方面優(yōu)于Plaucount算法,表明改進(jìn)的Apriori算法推薦的音樂在數(shù)量方面也高于Plaucount算法,更容易成為用戶感興趣的音樂。

在音樂推薦系統(tǒng)中,過多或過少的音樂推薦均得不到理想的效果。推薦結(jié)果過多,則需用戶在推薦音樂中進(jìn)行二次篩選,系統(tǒng)推薦得不到認(rèn)可,用戶滿意度會降低;推薦結(jié)果過少,則會出現(xiàn)篩選遺漏的現(xiàn)象,將用戶感興趣的內(nèi)容直接過濾掉,造成內(nèi)容缺少,達(dá)不到理想的推薦效果,如圖7所示。

從圖7可以看出,改進(jìn)的Apriori算法在相似度方面低于Plaucount算法,表明改進(jìn)的Apriori算法在推薦音樂時充分考慮了用戶興趣的相似性,在音樂相似性的冗余度方面做了考慮,實現(xiàn)了音樂推薦的多樣化,避免出現(xiàn)篩選遺漏現(xiàn)象,相比于Plaucount算法,推薦結(jié)果的同質(zhì)化相對較弱。

4總結(jié)

本文在概括介紹推薦系統(tǒng)常用的核心算法的基礎(chǔ)上,結(jié)合個性化音樂推薦提供了Apriori算法的改進(jìn)應(yīng)用,并給出了基于深度學(xué)習(xí)的個性化音樂推薦的具體流程。通過選取Last.fm上的部分?jǐn)?shù)據(jù)作為樣本,經(jīng)對比分析后得到如下結(jié)論:

(1)以推薦準(zhǔn)確度為計算標(biāo)準(zhǔn),采用候選矩陣壓縮的方法對Apriori的計算原理進(jìn)行了分析,在此基礎(chǔ)上設(shè)計了個性化音樂推薦的流程。

(2)考慮到推薦數(shù)量對推薦效果的影響,將改進(jìn)的Apriori算法與Plaucount算法對比可知,在準(zhǔn)確率和召回率方面,改進(jìn)的Apriori算法均優(yōu)于Plaucount算法,表明改進(jìn)的Apriori算法推薦的音樂能容易滿足用戶需求;在相似度方面,改進(jìn)的Apriori算法則低于Plaucount算法,表明改進(jìn)的Apriori算法的推薦在考慮了用戶興趣的基礎(chǔ)上實現(xiàn)音樂推薦的多樣化。

參考文獻(xiàn)

[1]徐正巧,趙德偉.深度學(xué)習(xí)理論視角下的移動學(xué)習(xí)推薦系統(tǒng)的設(shè)計和研究[J].智能計算機(jī)與應(yīng)用,2014,4(2):5758.

[2]GoldbergD.Usingcollaborativefilteringtoweaveaninformationtapestry[J].CommunicationsoftheACM,1992,35(12):6170.

[3]EpplerMJ,MengisJ.Theconceptofinformationoverload:Areviewofliteraturefromorganizationscience,accounting,marketing,MIS,andrelateddisciplines[J].TheInformationSociety,2004,20(5):325344.

[4]鄧騰飛.個性化音樂推薦系統(tǒng)的研究[D].廣州:華南理工大學(xué),2018.

[5]朱志慧,田婧,林捷.大數(shù)據(jù)環(huán)境下基于用戶位置的個性化音樂推薦系統(tǒng)設(shè)計[J].無線互聯(lián)科技,2019,16(2):7980.

[6]艾筆.個性化音樂推薦系統(tǒng)的設(shè)計與實現(xiàn)[D].成都:電子科技大學(xué),2018.

[7]楊凱,王利,周志平,等.基于內(nèi)容和協(xié)同過濾的科技文獻(xiàn)個性化推薦[J].信息技術(shù),2019,43(12):1114.

[8]黃立威,江碧濤,呂守業(yè),等.基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J].計算機(jī)學(xué)報,2018,41(7):16191647.

[9]陳波.基于Apriori算法及其改進(jìn)算法綜述[C].中國通信學(xué)會第五屆學(xué)術(shù)年會論文集.江蘇南京:中國通信學(xué)會,2008(2):176181.

[10]李臻.應(yīng)用于音樂節(jié)目分類的Apriori挖掘算法設(shè)計[J].現(xiàn)代電子技術(shù),2019,42(19):9094.

[11]王彩強(qiáng),趙憲中,劉涌,等.大數(shù)據(jù)環(huán)境下改進(jìn)的Apriori算法研究[J].科技通報,2019,35(7):182185.

[12]AgrawalR,ImielińskiT,SwamiA.Miningassociationrulesbetweensetsofitemsinlargedatabases[J].ACMSIGMODRecord,1993,22(2):207216.

(收稿日期:2020.02.25)

猜你喜歡
推薦系統(tǒng)深度學(xué)習(xí)個性化
為小學(xué)英語個性化合作學(xué)習(xí)單做加法
基于用戶偏好的信任網(wǎng)絡(luò)隨機(jī)游走推薦模型
基于個性化的協(xié)同過濾圖書推薦算法研究
個性化推薦系統(tǒng)關(guān)鍵算法探討
MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場域建構(gòu)
大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
淺談Mahout在個性化推薦系統(tǒng)中的應(yīng)用
深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實現(xiàn)
同桌寶貝
彩票| 嘉祥县| 永川市| 龙岩市| 抚宁县| 正阳县| 博客| 太湖县| 阳东县| 锦屏县| 大厂| 铁岭县| 象山县| 徐州市| 沁水县| 平山县| 西丰县| 轮台县| 周至县| 重庆市| 若尔盖县| 都江堰市| 阳江市| 高邮市| 专栏| 娄底市| 绥滨县| 邯郸县| 巨野县| 黄骅市| 石门县| 五峰| 徐州市| 合山市| 阜康市| 开化县| 汨罗市| 孟津县| 兴城市| 类乌齐县| 军事|