趙立新 三門(mén)峽職業(yè)技術(shù)學(xué)院信息傳媒學(xué)院
伴隨著互聯(lián)網(wǎng)發(fā)展,web信息增長(zhǎng)態(tài)勢(shì)呈現(xiàn)出顯著的指數(shù)增長(zhǎng)特點(diǎn),極易導(dǎo)致信息超載。在信息超載的情況下,用戶(hù)難以有效獲取所需信息,使信息使用效率呈現(xiàn)出大幅度降低?;谒阉骷夹g(shù),用戶(hù)可采用關(guān)鍵字對(duì)所需信息進(jìn)行搜索,但該技術(shù)缺乏對(duì)個(gè)性化的用戶(hù)需求的滿(mǎn)足。推薦算法可立足于用戶(hù)喜好,為用戶(hù)進(jìn)行信息推薦,能實(shí)現(xiàn)對(duì)信息過(guò)載的有效解決。
網(wǎng)絡(luò)理論工具能實(shí)現(xiàn)對(duì)復(fù)雜系統(tǒng)的深入理解和有效分析?;诰W(wǎng)絡(luò)和標(biāo)簽的混合推薦算法,具有更高的推薦精度以及個(gè)性化程度。
推薦算法,是指基于用戶(hù)行為,通過(guò)相關(guān)數(shù)學(xué)算法對(duì)用戶(hù)喜好事物進(jìn)行推測(cè)。單一的推薦算法各自具有本身的缺陷,因此,在實(shí)際中,大多采用混合推薦算法?;旌贤扑]算法,是指通過(guò)加權(quán)、串聯(lián)以及并聯(lián)等方式對(duì)單一推薦算法進(jìn)行融合?;旌贤扑]算法能實(shí)現(xiàn)對(duì)單一推薦算法技術(shù)弱點(diǎn)的有效避免,并融合其技術(shù)優(yōu)勢(shì)。相對(duì)于獨(dú)立的推薦算法,混合推薦算法的準(zhǔn)確率更高[1]。
基于內(nèi)容的推薦算法,通常采用TF—IDF法對(duì)用戶(hù)模型進(jìn)行構(gòu)建。TF—IDF統(tǒng)計(jì)法可評(píng)估字詞在文件中呈現(xiàn)出的重要性。TF代表文檔d中詞條的出現(xiàn)頻率,IDF代表反文檔頻率,將文件的總數(shù)目和含有詞語(yǔ)的文件數(shù)目相除,并對(duì)商取對(duì)數(shù)[3]。
基于內(nèi)容的推薦算法,以用戶(hù)所選擇的具體項(xiàng)目為依據(jù),在項(xiàng)目中對(duì)關(guān)鍵詞進(jìn)行提取,通過(guò)關(guān)鍵詞相應(yīng)的TF—IDF值對(duì)向量進(jìn)行構(gòu)成,以對(duì)用戶(hù)配置文件進(jìn)行表示,以同樣的方式對(duì)候選項(xiàng)目進(jìn)行表示。通過(guò)夾角余弦等相關(guān)數(shù)學(xué)算法對(duì)用戶(hù)與項(xiàng)目存在的相似度進(jìn)行計(jì)算,并將具備最高相似度的項(xiàng)目向用戶(hù)進(jìn)行推薦。此方法在對(duì)具備多內(nèi)容特征文件進(jìn)行用戶(hù)推薦時(shí)應(yīng)用較多[4]。
在實(shí)質(zhì)上,本文論述的混合推薦算法主要是基于網(wǎng)絡(luò)的推薦算法,并輔之以?xún)深?lèi)用戶(hù)偏好值,即將附加評(píng)分對(duì)基于網(wǎng)絡(luò)的推薦評(píng)分進(jìn)行增加。
第一步,對(duì)基于標(biāo)簽的用戶(hù)偏好模型進(jìn)行構(gòu)建
輸出:將用戶(hù)偏好配置的相應(yīng)文件以及用戶(hù)標(biāo)簽支持度等進(jìn)行輸出
第二步,對(duì)項(xiàng)目資源相應(yīng)的分配矩陣進(jìn)行計(jì)算
輸入:將用戶(hù)集合
第三步,對(duì)用戶(hù)尚未選擇項(xiàng)目實(shí)施預(yù)測(cè)評(píng)分的計(jì)算
綜上所述,NBI算法以用戶(hù)—項(xiàng)目相應(yīng)的二分圖結(jié)構(gòu)為依據(jù),對(duì)項(xiàng)目呈現(xiàn)出的推薦程度進(jìn)行計(jì)算,以用戶(hù)所選擇的具體項(xiàng)目為依據(jù)對(duì)用戶(hù)尚未選擇的其他項(xiàng)目的相應(yīng)推薦程度進(jìn)行計(jì)算,并對(duì)具體的推薦列表進(jìn)行獲取,其核心思想是對(duì)項(xiàng)目與項(xiàng)目存在的關(guān)系進(jìn)行了利用。本文論述的混合推薦算法以NBI算法作為基礎(chǔ),以用戶(hù)所選擇具體項(xiàng)目體現(xiàn)的標(biāo)簽信息為依據(jù),分別對(duì)TF—IDF法和標(biāo)簽支持度法進(jìn)行運(yùn)用,實(shí)現(xiàn)對(duì)用戶(hù)偏好模型的科學(xué)構(gòu)建,在此基礎(chǔ)上,以待預(yù)測(cè)的具體項(xiàng)目相應(yīng)的標(biāo)簽為依據(jù)對(duì)用戶(hù)對(duì)此類(lèi)項(xiàng)目呈現(xiàn)的偏好程度進(jìn)行計(jì)算,并與NBI推薦模型實(shí)施線(xiàn)性組合,對(duì)用戶(hù)推薦相關(guān)信息。相關(guān)實(shí)踐證明,基于網(wǎng)絡(luò)和標(biāo)簽的混合算法,相對(duì)于獨(dú)立的推薦算法,具有更高的推薦精度,能更好滿(mǎn)足用戶(hù)的個(gè)性化需求。
[1]張新猛,蔣盛益,李霞,等.基于網(wǎng)絡(luò)和標(biāo)簽的混合推薦算法[J].計(jì)算機(jī)工程與應(yīng)用,2015,51(1):119-124.
[2]宋瑞平.混合推薦算法的研究[D].蘭州大學(xué),2014.
[3]劉傳寶.基于網(wǎng)絡(luò)關(guān)系特征的混合推薦算法研究[D].吉林大學(xué),2016.
[4]曹春萍,徐幫兵.一種帶隱私保護(hù)的基于標(biāo)簽的推薦算法研究[J].計(jì)算機(jī)科學(xué),2017,44(8):134-139.